CN110609859A - 一种基于词组库的智能精准检索方法 - Google Patents

一种基于词组库的智能精准检索方法 Download PDF

Info

Publication number
CN110609859A
CN110609859A CN201910888919.1A CN201910888919A CN110609859A CN 110609859 A CN110609859 A CN 110609859A CN 201910888919 A CN201910888919 A CN 201910888919A CN 110609859 A CN110609859 A CN 110609859A
Authority
CN
China
Prior art keywords
information
module
word
retrieval
input method
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201910888919.1A
Other languages
English (en)
Inventor
彭文强
黄东辉
黄辉
丘向艳
彭婧茹
黄炜
黄镇文
温书勋
文思聪
梁涛
郭佰祥
彭程远
许德华
田浩良
赖昊
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Huizhou Central People's Hospital
Original Assignee
Huizhou Central People's Hospital
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Huizhou Central People's Hospital filed Critical Huizhou Central People's Hospital
Priority to CN201910888919.1A priority Critical patent/CN110609859A/zh
Publication of CN110609859A publication Critical patent/CN110609859A/zh
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/24Querying
    • G06F16/245Query processing
    • G06F16/2458Special types of queries, e.g. statistical queries, fuzzy queries or distributed queries
    • G06F16/2468Fuzzy queries
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/24Querying
    • G06F16/248Presentation of query results

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Databases & Information Systems (AREA)
  • General Engineering & Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Computational Linguistics (AREA)
  • Fuzzy Systems (AREA)
  • Mathematical Physics (AREA)
  • Software Systems (AREA)
  • Automation & Control Theory (AREA)
  • Probability & Statistics with Applications (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明属于数据库检索领域,针对现有技术中,用户输入错误搜索词时,检索不到用户所需要的信息情况,提出一种基于词组库的智能精准检索方法,包括以下步骤:选择合适的输入法;利用输入模块输入原来检词信息;查找模块根据原检词信息从数据库中检索出原目标信息;模糊模块根据输入法和原检词信息,得到疑检词信息;排序模块根据疑检词信息和词组库,按照检索次数从高到低的方式,对疑检词信息进行排序,并筛选出预设量的疑检词信息,作为备用检词信息;查找模块根据备用检词信息,从数据库中检索出备用目标信息,显示模块将备用目标信息显示出来。模拟用户输入的当前词条,预估出可能的正确词条,并通过查找模块,对数据库中词条进行搜索。

Description

一种基于词组库的智能精准检索方法
技术领域
本发明属于数据库检索领域,具体涉及一种基于词组库的智能精准检索方法。
背景技术
目前,信息检索(Information Retrieval)是用户进行信息查询和获取信息的主要方式。用户可以根据需要,输入一定的搜索词,借助检索工具,从信息集合中找出与所述搜索词对应的搜索结果。例如,在企业搜索领域中,用户根据需要,输入想要搜索的企业的全部或者部分名称,借助企业搜索引擎,获取该企业的详细信息。
然而,现有技术中,经常会出现用户输入错误的搜索词的情况,例如用户想要搜索“北京摩拜”,但是用户输入的是“北京膜拜”,根据“北京膜拜”进行搜索,得不到用户想要的搜索结果,此时用户只能删除搜索词,重新输入正确的搜索词,获取搜索结果,降低了搜索效率,影响用户的搜索体验。
发明内容
本发明提供一种基于词组库的智能精准检索方法,以解决上述问题。
本发明的基础方案为:一种基于词组库的智能精准检索方法,包括以下步骤:
S1,通过输入法选择模块选择合适的输入法,执行S2;
S2,利用输入法向输入模块输入原检词信息,执行S3和S5;
S3,查找模块根据原检词信息从数据库中检索出原目标信息,并执行S4;
S4,显示模块将原目标信息显示出来;
S5,模糊模块根据输入法和原检词信息,得到疑检词信息;
S6,排序模块根据疑检词信息和词组库,按照检索次数从高到低的方式,对疑检词信息进行排序,并筛选出预设量的疑检词信息,作为备用检词信息;词组库中存储有检索词和检索次数;执行S7;
S7,显示模块对排序好的备用检词信息进行显示,并执行S8;
S8,查找模块根据备用检词信息,从数据库中检索出备用目标信息,并执行S9;
S9,显示模块将备用目标信息显示出来。
基础方案的有益效果为:本方案中在直接搜索数据库的内容,并将相关内容检索之后,还会对数据库进行模糊搜索,模糊模块模拟用户输入法的错别词条,预估出可能的正确词条,并通过查找模块,对数据库中词条进行搜索。因此本方案中显示模块会显示两种结果,分别是按照用户输入的精准检索结果和模糊输入的检索结果。
进一步,S7中,还包括选择模块选择合适的备用检词信息,执行S9。
本方案中,选择模块对备用检词信息进行筛选,减少后续查找模块的工作量;用户在意识到自己发生笔误的情况下,自行筛选备用检词信息中的正确词条,提高***运行效率。
进一步,S5中,输入模块还用于输入是否进行模糊检索,若输入值为“是”,则模糊模块根据输入法和原检词信息,得到疑检词信息。
进一步,所述输入法选择模块中供选择的输入法包括拼音输入法和笔画输入法。
进一步,当输入法选择模块所选输入法为拼音输入法时,疑检词信息为原检词信息的同音字;当输入法选择模块所选输入法为笔画输入法时,疑检词信息为与原检词信息的图形相像的字。
进一步,还包括S10,采纳模块用于将用户满意的检索结果所对应的原检词信息或备用检词信息发送给更新模块;更新模块对词组库进行更新,将对应检索词的检索次数增加单位次数信息,并更新。
附图说明
图1为本发明一种基于词组库的智能精准检索方法实施例的模块示意图;
图2为本发明一种基于词组库的智能精准检索方法实施例的流程图。
具体实施方式
下面通过具体实施方式进一步详细的说明:
实施例基本如附图1和附图2所示:
本方案中一种词组库的智能精准检索方法是通过词组库的智能精准检索***来完成的。词组库的智能精准检索***如图1所示,包括输入法选择模块、输入模块、查找模块、显示模块、采纳模块、选择模块、更新模块、词组库、数据库和模糊模块。
输入法选择模块用于选择输入法,输入法包括拼音输入法和笔画输入法。
输入模块用于输入原检词信息,输入模块还用于输入是否进行模糊检索,输入值为“是”或者“否”。
模糊模块在输入模块的输入值为“是”时,根据输入法和原检词信息,得到疑检词信息。具体为:当输入法选择模块所选输入法为拼音输入法时,疑检词信息为原检词信息的同音字;当输入法选择模块所选输入法为笔画输入法时,疑检词信息为与原检词信息的图形相像的字。
词组库用于存储有检索词和检索次数,检索词和检索次数一一对应。
排序模块用于根据疑检词信息和词组库,按照检索次数从高到低的方式,对疑检词信息进行排序,并筛选出预设量的疑检词信息,作为备用检词信息;预设值为后台设定,如预设值为10,那么备用检词信息就是检索次数前10的疑检词信息。
显示模块用于将原目标信息、备用目标信息和备用检词信息显示出来。
选择模块用于在用户通过显示模块查看备用检词信息后,选择自己中意的备用检词信息
查找模块用于根据原检词信息和备用检词信息,在数据库中,检索相关文献资料,得到对应的原目标信息和备用目标信息。
采纳模块用于将用户满意的检索结果所对应的原检词信息或备用检词信息发送给更新模块。
更新模块根据采纳模块发送的检索结果对词组库进行更新,将对应检索词的检索次数增加单位次数信息,并更新。如,用户最后的满意的检索结果为“新东方厨师”和对应“新东方厨师”备用目标信息,词库组中“新东方厨师”的检索次数为“20”,那么更新后“新东方厨师”的检索次数为“21”。
一种基于词组库的智能精准检索方法,包括以下步骤:
S1,通过输入法选择模块选择合适的输入法,执行S2;
S2,利用输入法向输入模块输入原检词信息,执行S3和S5;
S3,查找模块根据原检词信息从数据库中检索出原目标信息,并执行S4;
S4,显示模块将原目标信息显示出来;
S5,模糊模块根据输入法和原检词信息,得到疑检词信息;
S6,排序模块根据疑检词信息和词组库,按照检索次数从高到低的方式,对疑检词信息进行排序,并筛选出预设量的疑检词信息,作为备用检词信息;词组库中存储有检索词和检索次数;执行S7;
S7,显示模块对排序好的备用检词信息进行显示,并执行S8;还包括选择模块选择合适的备用检词信息,执行S9。
S8,查找模块根据备用检词信息,从数据库中检索出备用目标信息,并执行S9;
S9,显示模块将备用目标信息显示出来。
S10,采纳模块用于将用户满意的检索结果所对应的原检词信息或备用检词信息发送给更新模块;更新模块对词组库进行更新,将对应检索词的检索次数增加单位次数信息,并更新。
本方案的优点如下:
(1)在直接搜索数据库的内容,并将相关内容检索之后,还会对数据库进行模糊搜索,模糊模块模拟用户输入的当前词条,预估出可能的正确词条,并通过查找模块,对数据库中词条进行搜索。因此本方案中显示模块会显示两种结果,分别是按照用户输入的精准检索结果和模糊输入的检索结果。
(2)用户可以自行选择按照自己原检词信息进行检索,还是采用模糊模块进行模糊检索;提高与用户的互动性,两种检索方式并存的情况下,用户可以根据自己的选择和需要,选择只使用一种检索还是两种检索方式均采用。
(3)词组库根据用户满意的检索词进行实时更新,保证了词组库的准确性。
(4)通过选择模块对备用检词信息进行筛选,减少后续查找模块的工作量;用户在意识到自己发生笔误的情况下,自行筛选备用检词信息中的正确词条,提高***运行效率。若选择模块不对备用检词信息进行筛选,则所有的备用检词信息均会通过查找模块在数据库中进行检索。
以上所述的仅是本发明的实施例,方案中公知的具体结构及特性等常识在此未作过多描述,所属领域普通技术人员知晓申请日或者优先权日之前发明所属技术领域所有的普通技术知识,能够获知该领域中所有的现有技术,并且具有应用该日期之前常规实验手段的能力,所属领域普通技术人员可以在本申请给出的启示下,结合自身能力完善并实施本方案,一些典型的公知结构或者公知方法不应当成为所属领域普通技术人员实施本申请的障碍。应当指出,对于本领域的技术人员来说,在不脱离本发明结构的前提下,还可以作出若干变形和改进,这些也应该视为本发明的保护范围,这些都不会影响本发明实施的效果和专利的实用性。本申请要求的保护范围应当以其权利要求的内容为准,说明书中的具体实施方式等记载可以用于解释权利要求的内容。

Claims (6)

1.一种基于词组库的智能精准检索方法,其特征在于:包括以下步骤:
S1,通过输入法选择模块选择合适的输入法,执行S2;
S2,利用输入法向输入模块输入原检词信息,执行S3和S5;
S3,查找模块根据原检词信息从数据库中检索出原目标信息,并执行S4;
S4,显示模块将原目标信息显示出来;
S5,模糊模块根据输入法和原检词信息,得到疑检词信息;
S6,排序模块根据疑检词信息和词组库,按照检索次数从高到低的方式,对疑检词信息进行排序,并筛选出预设量的疑检词信息,作为备用检词信息;词组库中存储有检索词和检索次数;执行S7;
S7,显示模块对排序好的备用检词信息进行显示,并执行S8;
S8,查找模块根据备用检词信息,从数据库中检索出备用目标信息,并执行S9;
S9,显示模块将备用目标信息显示出来。
2.根据权利要求1所述的一种基于词组库的智能精准检索方法,其特征在于:还包括选择模块选择合适的备用检词信息,执行S9。
3.根据权利要求1所述的一种基于词组库的智能精准检索方法,其特征在于:输入模块还用于输入是否进行模糊检索,若输入值为“是”,则模糊模块根据输入法和原检词信息,得到疑检词信息。
4.根据权利要求1所述的一种基于词组库的智能精准检索方法,其特征在于:所述输入法选择模块中供选择的输入法包括拼音输入法和笔画输入法。
5.根据权利要求4所述的一种基于词组库的智能精准检索方法,其特征在于:当输入法选择模块所选输入法为拼音输入法时,疑检词信息为原检词信息的同音字;当输入法选择模块所选输入法为笔画输入法时,疑检词信息为与原检词信息的图形相像的字。
6.根据权利要求5所述的一种基于词组库的智能精准检索方法,其特征在于:还包括S10,采纳模块用于将用户满意的检索结果所对应的原检词信息或备用检词信息发送给更新模块;更新模块对词组库进行更新,将对应检索词的检索次数增加单位次数信息,并更新。
CN201910888919.1A 2019-09-19 2019-09-19 一种基于词组库的智能精准检索方法 Pending CN110609859A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201910888919.1A CN110609859A (zh) 2019-09-19 2019-09-19 一种基于词组库的智能精准检索方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201910888919.1A CN110609859A (zh) 2019-09-19 2019-09-19 一种基于词组库的智能精准检索方法

Publications (1)

Publication Number Publication Date
CN110609859A true CN110609859A (zh) 2019-12-24

Family

ID=68892907

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201910888919.1A Pending CN110609859A (zh) 2019-09-19 2019-09-19 一种基于词组库的智能精准检索方法

Country Status (1)

Country Link
CN (1) CN110609859A (zh)

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1755671A (zh) * 2004-09-30 2006-04-05 北京大学 搜索引擎中的查询词自动纠错方法
CN102163234A (zh) * 2011-04-19 2011-08-24 北京百度网讯科技有限公司 一种基于纠错相关度对查询序列进行纠错的设备和方法
WO2015139497A1 (zh) * 2014-03-19 2015-09-24 北京奇虎科技有限公司 一种在搜索引擎中确定形近字的方法和装置
WO2016034052A1 (zh) * 2014-09-03 2016-03-10 乐视网信息技术(北京)股份有限公司 一种数据搜索中的纠错装置及其方法
CN109002521A (zh) * 2018-07-12 2018-12-14 北京猫眼文化传媒有限公司 搜索关键词的纠错方法、装置和存储介质

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1755671A (zh) * 2004-09-30 2006-04-05 北京大学 搜索引擎中的查询词自动纠错方法
CN102163234A (zh) * 2011-04-19 2011-08-24 北京百度网讯科技有限公司 一种基于纠错相关度对查询序列进行纠错的设备和方法
WO2015139497A1 (zh) * 2014-03-19 2015-09-24 北京奇虎科技有限公司 一种在搜索引擎中确定形近字的方法和装置
WO2016034052A1 (zh) * 2014-09-03 2016-03-10 乐视网信息技术(北京)股份有限公司 一种数据搜索中的纠错装置及其方法
CN109002521A (zh) * 2018-07-12 2018-12-14 北京猫眼文化传媒有限公司 搜索关键词的纠错方法、装置和存储介质

Similar Documents

Publication Publication Date Title
US5701469A (en) Method and system for generating accurate search results using a content-index
US8126888B2 (en) Methods for enhancing digital search results based on task-oriented user activity
US20050060290A1 (en) Automatic query routing and rank configuration for search queries in an information retrieval system
US20030135725A1 (en) Search refinement graphical user interface
JPH11203294A (ja) 情報検索システム、装置、方法及び記録媒体
US20040068497A1 (en) Method and apparatus for matching customer symptoms with a database of content solutions
WO2017215242A1 (zh) 简历搜索方法及装置
CN104102704B (zh) ***控件展示方法和装置
CN102567365B (zh) 一种针对于关键词进行标注的输入方法及***
JP2000200281A (ja) 情報検索装置および情報検索方法ならびに情報検索プログラムを記録した記録媒体
CN111026787A (zh) 网点检索方法、装置及***
JP4935243B2 (ja) 検索プログラム、情報検索装置及び情報検索方法
JPH06314296A (ja) 情報検索システム
US11797551B2 (en) Document retrieval apparatus, document retrieval system, document retrieval program, and document retrieval method
JPH0773197A (ja) 異表記語辞書作成支援装置
CN110609859A (zh) 一种基于词组库的智能精准检索方法
CN108536819B (zh) 整型列与字符串比较的方法、装置、服务器及存储介质
US6963865B2 (en) Method system and program product for data searching
JP2009093581A (ja) 類義語検索管理システム
JPH07325834A (ja) 検索装置
US20040054677A1 (en) Method for processing text in a computer and a computer
US20150046437A1 (en) Search Method
US20080228725A1 (en) Problem/function-oriented searching method for a patent database system
JPH11110395A (ja) 類似文書検索装置および類似文書検索方法
JP3666066B2 (ja) 多言語文書登録検索装置

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication

Application publication date: 20191224

RJ01 Rejection of invention patent application after publication