CN110543484A - 提示词的推荐方法及装置、存储介质和处理器 - Google Patents

提示词的推荐方法及装置、存储介质和处理器 Download PDF

Info

Publication number
CN110543484A
CN110543484A CN201910828830.6A CN201910828830A CN110543484A CN 110543484 A CN110543484 A CN 110543484A CN 201910828830 A CN201910828830 A CN 201910828830A CN 110543484 A CN110543484 A CN 110543484A
Authority
CN
China
Prior art keywords
keyword
search
index
database
index information
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201910828830.6A
Other languages
English (en)
Inventor
胡启明
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Guangzhou Shiyuan Electronics Thecnology Co Ltd
Original Assignee
Guangzhou Shiyuan Electronics Thecnology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Guangzhou Shiyuan Electronics Thecnology Co Ltd filed Critical Guangzhou Shiyuan Electronics Thecnology Co Ltd
Priority to CN201910828830.6A priority Critical patent/CN110543484A/zh
Publication of CN110543484A publication Critical patent/CN110543484A/zh
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/22Indexing; Data structures therefor; Storage structures
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/24Querying
    • G06F16/245Query processing
    • G06F16/2455Query execution
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/28Databases characterised by their database models, e.g. relational or object models
    • G06F16/284Relational databases

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Databases & Information Systems (AREA)
  • Data Mining & Analysis (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Computational Linguistics (AREA)
  • Software Systems (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本申请公开了一种提示词的推荐方法及装置、存储介质和处理器。其中,该方法包括:检测输入的关键词;从索引库中查找与所述关键词对应的索引信息,其中,该索引信息为基于搜索引擎对应的源数据库中的源数据确定的;基于所述索引信息从所述源数据库中搜索与所述关键词关联的搜索提示信息;展示所述搜索提示信息。本申请解决了相关技术中存在的提示词准确度较低且灵活性不高的技术问题。

Description

提示词的推荐方法及装置、存储介质和处理器
技术领域
本申请涉及搜索领域,具体而言,涉及一种提示词的推荐方法及装置、存储介质和处理器。
背景技术
在目前的搜索引擎领域,以满足用户在输入个别关键词的时候,能够自动联想提示,这样可以避免用户的冗余输入并提供一定的推荐,从而实现更好的交互效果和内容推广效果。相关技术中,在进行搜索提示时,往往从搜索引擎维护的某一个词典中直接查询与输入的关键词对应的查询提示词,由于词典中的词汇一般是依据经验人工配置的,其准确性较低;并且,由于其只能从一个特定的词典中查询,因此,配置相关提示词汇的工作量比较大,无法适应大规模数据的智能提示,从而导致灵活性不高。
针对上述的问题,目前尚未提出有效的解决方案。
发明内容
本申请实施例提供了一种提示词的推荐方法及装置、存储介质和处理器,以至少解决相关技术中存在的提示词准确度较低且灵活性不高的技术问题。
根据本申请实施例的一个方面,提供了一种提示词的推荐方法,包括:检测输入的关键词;从索引库中查找与所述关键词对应的索引信息;基于所述索引信息从所述源数据库中搜索与所述关键词关联的搜索提示信息;展示所述搜索提示信息。
可选地,基于所述索引信息从所述源数据库中搜索与所述关键词关联的搜索提示信息之前,所述方法还包括:获取搜索引擎的源数据;从源数据库的源数据中提取与业务场景相关的至少一个字段,将提取的至少一个字段作为查询字段;依据所述查询字段确定索引信息,得到索引库;建立所述索引库和所述源数据库之间的关联。
可选地,检测输入的关键词,包括:检测在输入框中的关键词是否发生变化;在发生变化时,将变化后的关键词作为目标关键词;从索引库中查找与所述关键词对应的索引信息,包括:从所述索引库中查找与所述目标关键词对应的索引信息。
可选地,将变化后的关键词作为目标关键词之前,所述方法还包括:检测在输入所述关键词后输入的指定关键词;将所述指定关键词和所述关键词进行组合,得到组合词;对所述组合词的语义完整性进行验证,其中,在验证通过时,将所述组合词作为所述目标关键词。
可选地,基于所述索引信息从所述源数据库中搜索与所述关键词关联的搜索提示信息,包括:从所述源数据库中查询与所述索引信息对应的搜索提示信息;确定所述搜索提示信息与所述关键词的相似度;将所述搜索提示信息按照相似度大小进行排序,并将排序靠前的预设数量个搜索提示信息作为最终的搜索提示信息。
可选地,从索引库中查找与所述关键词对应的索引信息,包括:确定所述关键词的语义所对应的业务场景;基于所述业务场景和所述语义确定所述索引信息。
可选地,所述数据库包括多个数据库。
根据本申请实施例的另一个方面,提供了一种提示词的显示方法,包括:展示搜索引擎的输入框;展示在所述输入框内输入的关键词;展示基于索引信息从所述源数据库中搜索的与所述关键词关联的搜索提示信息,其中,所述索引信息为从索引库中查找的与所述关键词对应的索引信息。
根据本申请实施例的又一个方面,提供了一种提示词的推荐装置,包括:检测模块,用于检测输入的关键词;第一查询模块,用于从索引库中查找与所述关键词对应的索引信息,其中,该索引信息为基于搜索引擎对应的源数据库中的源数据确定的;第二查询模块,用于基于所述索引信息从所述源数据库中搜索与所述关键词关联的搜索提示信息;展示模块,用于展示所述搜索提示信息。
可选地,所述装置还包括:获取模块,用于获取搜索引擎的源数据;提取模块,用于从源数据库的源数据中提取与业务场景相关的至少一个字段,将提取的至少一个字段作为查询字段;确定模块,用于依据所述查询字段确定索引信息,得到索引库;建立模块,用于建立所述索引库和所述源数据库之间的关联。
根据本申请实施例的再一个方面,提供了一种非易失性存储介质,该存储介质包括存储的程序,其中,在所述程序运行时控制所述存储介质所在设备执行以上所述的提示词的推荐方法。
根据本申请实施例的再一个方面,提供了一种处理器,所述处理器用于运行程序,其中,所述程序运行时执行以上所述的提示词的推荐方法。
在本申请实施例中,采用在检测到关键词时,依据关键词对应的索引信息查询相应的搜索提示信息的方式,由于可以基于关键词对应的索引去搜索相应的搜索提示信息(例如提示词等),而不必直接查询与关键词对应的搜索提示信息,因此,可以基于搜索引擎对应的源数据库中查询相应的搜索提示信息,该搜索提示信息的获取并不限于某一个特定的词典,因此,可以提高提示信息的推荐准确性,并且,由于扩展了搜索提示信息的搜索范围,因此,可以适应大规模数据的智能提示,提升了提示词推荐的灵活性,进而解决了相关技术中存在的提示词准确度较低且灵活性不高的技术问题。
附图说明
此处所说明的附图用来提供对本申请的进一步理解,构成本申请的一部分,本申请的示意性实施例及其说明用于解释本申请,并不构成对本申请的不当限定。在附图中:
图1是根据本申请实施例的一种提示词的推荐方法的流程示意图;
图2是根据本申请实施例的一种可选的提示词的推荐方法的流程示意图;
图3是根据本申请实施例的一种构建提示(suggest)库的流程示意图;
图4是根据本申请实施例的一种提示词的推荐装置的结构框图;
图5是根据本申请实施例的另一种提示词的显示方法的流程示意图。
具体实施方式
为了使本技术领域的人员更好地理解本申请方案,下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本申请一部分的实施例,而不是全部的实施例。基于本申请中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都应当属于本申请保护的范围。
需要说明的是,本申请的说明书和权利要求书及上述附图中的术语“第一”、“第二”等是用于区别类似的对象,而不必用于描述特定的顺序或先后次序。应该理解这样使用的数据在适当情况下可以互换,以便这里描述的本申请的实施例能够以除了在这里图示或描述的那些以外的顺序实施。此外,术语“包括”和“具有”以及他们的任何变形,意图在于覆盖不排他的包含,例如,包含了一系列步骤或单元的过程、方法、***、产品或设备不必限于清楚地列出的那些步骤或单元,而是可包括没有清楚地列出的或对于这些过程、方法、产品或设备固有的其它步骤或单元。
另外需要说明的是,本申请实施例中所提及的Solr是一个独立的企业级搜索应用服务器,而且它是一个高性能、采用JAVA5开发的基于Lucene的全文搜索服务器。同时对其进行了扩展,提供了比Lucene更为丰富的查询语言,也实现了可配置、可扩展并对查询性能进行了优化,并且提供了一个完善的功能管理界面,它对外提供类似于Web-service的API接口,用户可以通过http请求,向搜索引擎服务器提交一定格式的XML文件,生成索引;也可以通过HTTP get操作提出查找请求,并得到XML格式的返回结果。
在相关技术中,一些搜索引擎具备智能联想提示的功能,例如,Solr搜索引擎中便已经封装了这样的功能,而且只需要简单的配置就可以完成,主要步骤如下:
1,配置suggest功能点,打开配置文件(solr-config.xml),查找到拼写校验(spellcheck)节点,按照相关配置信息配置拼写校验器(spellchecker),该spellchecker可以用于修改最大智能提示词汇量。2,定位提示组件(solr.SuggestComponent),修改源定位(sourceLocation)参数,该参数用于配置提示词典路径,即搜索引擎拉取的智能提示的文件在当前提示路径下的suggest文件夹中的词典(dict.txt)文件中。3,添加智能联想词汇表,如上述说明,需要在solr-config.xml同级目录创建suggest文件夹,并在其下面创建dict.txt文件,该dict.txt文件用于保存上述智能联想词汇表。4,最终接口改为suggest来测试智能提示词。
但是,上述方案存在以下问题:1,灵活性低:当搜索引擎用于某个场景领域时,拥有的相关词汇也是该垂直领域的词汇,并且当数据量上升到百万以上,在单单一个词典里配置相关词汇工作量会非常的大,灵活性太低,无法自适应匹配百万级别以上数据的智能提示。2,准确度低:基于solr的suggest智能提示的词汇是在dict.txt手动配置的,所以需要技术人员对整个搜索引擎的业务场景非常了解,并且熟悉场景下所有数据的相关词汇再来配置搜索提示推荐词典(dict.txt),但此种方式既耗时又无法将所有业务数据进行配置,会影响最终搜索提示词的准确度。
为了解决上述技术问题,本申请实施例在检测到关键词时,依据关键词对应的索引信息查询相应的搜索提示信息,而不是直接查询与关键词对应的搜索提示信息,因此,可以基于搜索引擎对应的源数据库(或所有历史记录)中查询相应的搜索提示信息,由于该搜索提示信息的获取并不限于某一个特定的词典,因此,可以提高提示信息的推荐准确性,并且,由于扩展了搜索提示信息的搜索范围,因此,可以适应大规模数据的智能提示,提升了提示词推荐的灵活性。以下详细说明。
根据本申请实施例,提供了一种提示词的推荐方法的方法实施例,需要说明的是,在附图的流程图示出的步骤可以在诸如一组计算机可执行指令的计算机***中执行,并且,虽然在流程图中示出了逻辑顺序,但是在某些情况下,可以以不同于此处的顺序执行所示出或描述的步骤。
图1是根据本申请实施例的提示词的推荐方法,如图1所示,该方法包括步骤S102至S108,其中:
步骤S102,检测输入的关键词;
在本申请的一些实施例中,关键词的检测过程可以表现为以下处理过程:检测在输入框中的关键词是否发生变化;在发生变化时,将变化后的关键词作为目标关键词。
具体地,检测用户输入关键词的变化可以是预先对现有关键词是否被取代进行检测,也可以是对现有值为null的搜索框进行有无输入文本的检测,例如,用户之前搜索的关键词为“电脑游戏”,但随着用户需求的变化,用户将关键词改为“电脑配置”,那么搜索引擎将关键词的变化作为触发索引匹配功能的条件,进行后续的步骤;又例如,可以输入框中的字数发生变化,例如,新增或减少了某些字符等。
步骤S104,从索引库中查找与关键词对应的索引信息,其中,该索引信息为基于搜索引擎对应的源数据库中的源数据确定的;
相关技术中,在执行某个业务场景的搜索操作时,需要手动配置一个提示词词典(dict.txt),并且需要技术人员自定义相关提示词典中的内容,不断的丰富词典中的相关提示词的关联关系,工作繁琐并且不一定准确,这也使得相关技术中的提示词推荐方案很难满足用户需求,导致整体搜索体验不佳。本申请实施例中则采用索引信息查找相应的提示词的方式,由于该索引库中的索引关联的是基于与搜索引擎对应的源数据库,因此,可以基于全库进行提示词的搜索,从而使得搜索提示词的获取并不限于某一个特定的词典,因此,可以提高提示信息的推荐准确性,同时,减少了人工维护成本。并且,由于搜索引擎在文本匹配以及效率上比较高,整个搜索提示词推荐结果可以快速返回,实时性以及关联性都得到了很好的保障,既增加了用户体验也增加了用户粘性。
在本申请的一些实施例中,上述索引信息包括但不限于:上述关键词的部分字段数据,例如,上述关键词为电脑游戏,则索引信息可以为“游戏”,或者“电游”等。在另一些可选的实施例中,上述索引信息也可以采用数字或字母标识的方式确定。索引信息的建立可以是基于MySQL数据库,利用建立的例如第二范式型关键词数据库与相应的索引,来调用本申请实施例所需要的信息。
在查找数据库的索引信息时,可以是实时检测(即不关注变化后的指定关键词或关键词的语义是否完整,均以在输入框中当前检测到的所有关键词),也可以是在指定关键词通过语义完整性验证时再查找相应的索引(例如,在检测到“电脑游”时,由于语义不完整,因此,认为是无效关键词,此时不必查找相应的索引)。
在本申请的一些可选的实施例中,为节省运行资源,同时提高搜索效率,可以在确定搜索提示词之前,先对前后输入的文字的语义完整性进行验证,以减少不必要提示词的推荐,具体地:在将变化后的关键词作为目标关键词之前,检测在输入关键词后输入的指定关键词;将指定关键词和关键词进行组合,得到组合词;对组合词的语义完整性进行验证,其中,在验证通过时,将组合词作为目标关键词。例如,用户输入“我着书包去上学”,但实际用户想输入的内容为“我背着书包去上学”,那么,在进行确定提示词之前,本实施例将上述用户所输入的语句进行完整性验证,即可检测出“着”由于其不完整性,不是待提示的关键词,因此,这样的过程也减少了不必要的提示词推荐,提高了搜索的效率。
需要说明的是,语义完整性验证可以是通过对语句或词语的结构进行分解分析,根据语句结构中不同类型(例如主语、谓语)的不同特征,判断语义整体是否完整,另外,语义完整性验证可以通过语义建模的方式,规定常用的语义模型规则,实现准确判断语义完整与否的目的。
又例如,该步骤S104可以表现为以下实现过程:确定关键词的语义所对应的业务场景;基于业务场景和语义确定索引信息。例如,MySQL数据库索引包含了涉及“电脑”的索引信息100条,涉及“宠物”的索引信息50条,那么当用户所输入的关键词为“电脑..”时,则可以确定用户需要搜索的领域为电脑,之后再根据涉及电脑的具体语义做进一步的索引范围划定和确定。
另外,需要说明的是,业务场景和语义是进行索引信息划分的两个层次,业务场景可以是关键词所涉猎的领域,例如:电脑领域、宠物领域、法律领域等。而语义则是在确定了具体领域之后,用户最想达到的目的的描述,例如在电脑领域中,语义可以是电脑游戏、电脑配件、电脑维修或电脑销售。那么可以说结合了业务常见和具体语义之后,对于用户所输入的关键词的索引范围确定,起到了增加其准确度和搜索效率的技术效果。例如,预先定义业务场景对应的索引数据库;然后,在输入关键词进行查询操作前,确定目标业务场景对应的索引数据库,并建立上述索引数据库与搜索引擎的关联;最后,基于输入的关键词从索引数据库中查找相应的索引,进而基于索引查找相应的提示词。
步骤S106,基于索引信息从源数据库中搜索与关键词关联的搜索提示信息;
可选地,该步骤S106可以通过以下方式实现,例如:从源数据库中查询与索引信息对应的搜索提示信息;确定搜索提示信息与关键词的相似度;将搜索提示信息按照相似度大小进行排序,并将排序靠前的预设数量个搜索提示信息作为最终的搜索提示信息。
具体地,索引信息可以是MySQL数据库中的主键或外键,其所对应的数据是涉及某领域某场景的搜索提示词,例如,当索引信息定位到主键是“电脑”的位置时,则搜索提示词的范围为数据库中主键值是“电脑”的所有数据,然后并根据主键值是“电脑”的数据与用户输入的关键词或指定关键词的相似度进行排序,相似度大的词语可以排在队列最前端。其中,指定关键词可以是在用户输入关键词之后再次输入的新的关键词,其内容可以是与前述关键词内容相关联或是新的内容。
需要说明的是,相似度是综合评定两个事物之间相近程度的一种度量。两个事物越接近,他们的相似性程度越大,而两个事物越疏远,他们的相似性程度越小。本申请的相似度计算可以是相关系数计算法、欧几里得距离计算法、余弦相关度计算法等,外在表现为数据库中词语与关键词或指定关键词的重复程度的大小,例如,用户输入的关键词是“电脑配件购买”,通过索引信息对应的数据库数据调取操作,获得的搜索提示词为:电脑配置、电脑配件获取、电脑配件买卖。那么根据搜索提示词与关键词的重叠程度可以判断最接近关键词的搜索提示词是“电脑配件买卖”,其次是“电脑配件获取”,最后是“电脑配置”,基于上述相似度的判断过程,得到搜索提示信息大小排序为1.“电脑配件买卖”,2.“电脑配件获取”,3.“电脑配置”,并将排序靠前的预设数量个搜索提示信息作为最终的搜索提示信息。其中预设数量可以是2个,设置上述预设数量搜索提示信息是为了达到将最接近的搜索提示信息展示给用户,同时筛除掉多余无用的信息,例如,搜索提示信息大小排序为1.“电脑配件买卖”,2.“电脑配件获取”,3.“电脑配置”,那么根据预设数量为2的设置,本申请确定的最终的搜索提示信息则为:1.“电脑配件买卖”,2.“电脑配件获取”。
步骤S108,展示搜索提示信息。
具体地,由于一般用于展示搜索提示信息的界面大小是有限的,因此,在步骤S108中,可以仅展示搜索到的部分提示信息,例如:从源数据库中查询与索引信息对应的搜索提示信息;确定搜索提示信息与关键词的相似度;将搜索提示信息按照相似度大小进行排序,并将排序靠前的预设数量个搜索提示信息作为最终的搜索提示信息,最后将最终的搜索提示信息通过显示设备展示给用户。例如,最终的搜索提示信息为1.“电脑配件买卖”,2.“电脑配件获取”,则在用户输入框下方可以以下拉表单的方式进行搜索提示信息展示,以便用户选择,相对于现有的相关技术,本申请增加了用户的体验。
采用本申请实施例提供的上述方案,由于可以基于关键词对应的索引去搜索相应的搜索提示信息(例如提示词等),而不必直接查询与关键词对应的搜索提示信息,因此,可以基于搜索引擎对应的所有数据库中查询相应的搜索提示信息,该搜索提示信息的获取并不限于某一个特定的词典,因此,可以提高提示信息的推荐准确性,并且,由于扩展了搜索提示信息的搜索范围,因此,可以适应大规模数据的智能提示,提升了提示词推荐的灵活性,进而解决了相关技术中存在的提示词准确度较低且灵活性不高的技术问题。
在本申请的一些实施例中,在检测输入的关键词时,可以表现为检测搜索引擎的输入框中的关键词是否发生变化;在发生变化时,将变化后的关键词作为目标关键词;确定目标关键词后,在索引库中查找与目标关键词对应的索引信息。例如,将目标关键词发送至搜索引擎的后台,由后台查找与目标关键词对应的索引信息。例如,对于实时检测,以“电脑游戏”为例,在输入框中输入“电脑”后,搜索引擎会查找与电脑对应的索引,并基于该索引从搜索引擎对应的所有记录中查找与电脑相关的搜索提示信息,例如:电脑游戏、电脑配件等;在输入电脑后,接收用户输入的“游”,由于该“游”与“电脑”组合后的“电脑游”的语义不是很完整,因此,并不会去查询相应的索引信息,进而查询搜索提示信息。而在检测到“电脑游戏”后,由于当前的关键词的语义是完整的,因此,可以基于“电脑游戏”查找相应的索引,进而查找到相应的搜索提示信息。
在本申请的一些实施例中,上述索引信息可以对应搜索引擎的所有历史记录,或者,搜索引擎的多个数据库,其中,该多个数据库可以包括但不限于:搜索引擎对应的所有数据库中的部分或全部。上述多个数据库可以是不同业务场景对应的数据库或者不同数据来源的数据库,但不限于此。
在本申请的一些实施例中,上述索引信息可以为从索引库中搜索到的索引信息,其中,上述索引库中的索引信息可以通过提取源数据中的字段确定,例如:在基于索引信息从所述源数据库中搜索与关键词关联的搜索提示信息之前,获取搜索引擎的源数据;从源数据库的源数据中提取与业务场景相关的至少一个字段,将提取的至少一个字段作为查询字段;依据查询字段确定索引信息,得到索引库;建立索引库和源数据库之间的关联。
为了进一步提高搜索提示信息的推荐准确性,可以依据业务场景确定相应的索引信息,具体地:确定关键词的语义所对应的业务场景;基于业务场景和语义确定索引信息。
以solr搜索引擎为例,如图2、图3所示,本申请实施例中的方案是将原数据按照指定的相关字段抽到solr搜索引擎的suggest库中,用户在查询过程中,前端会调用搜索引擎的查询接口查询suggest库中的内容,进而得到一个符合用户预期的搜索智能提示词的返回结果。下面对整个步骤进行详细的描述,首先,创建suggest库的流程如图3所示:
步骤302,获取搜索引擎业务场景下的源数据(oracle,mysql,Hbase等),以此源数据来构造搜索引擎的suggest库。
步骤304,从源数据中指定一个字段或者某几个字段来作为智能推荐的查询字段(即索引),由技术人员同业务人员商讨并且根据实际业务场景中的数据分析来判断,主要是满足业务要求以及能达到搜索提示词的用户体验。
步骤306,在solr搜索引擎中首先创建suggest索引库,此索引库的主要目的是为了用来专门作搜索提示词推荐,索引数据并非全字段数据,只需要步骤304中技术人员指定的一个字段或者多个字段的数据进行推荐发送,这也使得资源不被浪费,具体创建suggest索引库请执行以下命令:
http://ip:port/solr/admin/collections?action=CREATE&name=suggest&numShards=4&replicationFactor=1&collection.configName=suggest。
相关技术中,在确定提示词时,会在在solr-config.xml同级目录创建suggest文件夹,并在其下面创建dict.txt文件,dict.txt保存的就是智能联想词汇表,即提示词列表,根据提示词列表推荐相应的提示词;而本申请实施例中的方案,则是直接利用搜索引擎的源数据中的部分字段构成索引(即查询字段),将索引作为搜索引擎的查询词,基于查询词从搜索引擎对应的源数据库中查询相应的提示词。
步骤308,将源数据的库与suggest索引库进行实体关联,配置solr的dataconfig.xml文件,定义表实的相关查询字段体以及增量抽取语句等工作。
步骤310,基于suggest索引库,根据步骤304中指定的一个或多个字段,在solr的schemal.xml文件中添加相关字段的定义以及最终查询字段的映射,配置如下:
相关搜索推荐字段定义:
<field name="name"type="text_ik"indexed="true"stored="true"/>
<field name="title"type="text_ik"indexed="true"stored="true"/>
<field name="suggestField"type="text_ik"indexed="true"stored="false"multiValued="true"/>
映射字段定义:
<copyField source="name"dest="suggestField"/>
<copyField source="title"dest="suggestField"/>
步骤312,在搜索引擎中将以上配置完毕后,可直接执行抽取工作,将源数据中的数据导入到搜索引擎中形成正排以及倒排索引,加大查询的效率。以上步骤看似繁琐,但可复用,在一个搜索引擎中,多个索引库可共享一套配置。
步骤314,最终搜索引擎后台会将以上的配置进行封装,封装成可调用的API服务,主要指定搜索查询的索引库(suggest),查询字段(name、title-->suggestFiled),由此,我们的搜索智能提示词推荐模型就已配置完。
其次,solr引擎执行的流程如图2所示:
步骤202,当用户输入一个关键词时,搜索框每发生一次变化,前端就会将变化后的关键词传给后台来实时获取到用户输入的关键词的搜索提示词。
步骤204,搜索后台接收到请求后,会将关键词发到搜索引擎中进行关键词匹配
步骤206,搜索引擎中根据布尔模型进行筛选符合要求的文档,并将其发送到空间向量模型中通过余弦相似度进行文本相似度匹配,进而计算每条结果的评分。
步骤208,搜索后台获取到前N条最符合要求的搜索提示词,按照由高到低的分数返回给前端并展现给用户,以此方法来实现搜索智能提示词,增加用户体验以及提升了匹配的准确度。
基于上述实施例可以看出,上述实施例采用搜索作为推荐来实现智能提示,技术人员不需要单独配置某个词典,只需指定某个字段或者多个字段来作为查询,并且搜索的内容为整个搜索引擎中所有的记录;此实施例中技术人员不需要单独配置某个词典,只需在建立搜索提示的过程中指定某个字段或者多个字段来作为查询字段,并且在写接口时需指定suggest索引库来提供搜索智能提示,提升了整个搜索引擎的智能提示词推荐的灵活性;此方法中采用搜索作为推荐来实现智能提示,主要做法是用户在输入字符过程中,当输入框发生变化,即会调用一次智能提示接口来实现智能提示,查询的内容为整个搜索引擎中所有的记录,大大提升了搜索引擎在业务场景下的适应性,也大大提高了最终的提示效果,也使得用户体验得到了提升。
采用本申请实施例提供的方案.有以下几个特点:1,用全库的搜索内容来作提示词内容:以往的搜索引擎智能提示需要技术人员自定义相关提示词典,并且不断的丰富词典中的相关提示词的关联关系,工作繁琐并且不一定准确,这也使得现有的技术架构下很难满足用户需求,导致整体搜索体验不是很好。此方法中基于全库的数据来作为提示词内容,减少了人工维护成本,也大大提高了相关召回率。2.用搜索代替提示词推荐:Solr搜索引擎是基于布尔模型以及VSM空间向量模型为基础实现搜索的,此搜索在文本匹配以及效率上都是非常的高,整个搜索提示词推荐结果在毫秒级返回,作为提示词推荐再合适不过,实时性以及关联性都得到了很好的保障,既增加了用户体验也增加了用户粘性。3.适应力强,适用于多场景下的搜索。当搜索引擎用于多场景下,多场景意味着相关词汇的关联关系较为复杂,词汇量以及词典内容也会比较充实,以往的词典配置方式会比较困难。此方法只需在配置文件中配置相关多场景的实体,最终将各个实体需要作为搜索提示词的字段映射到suggest即可实现多场景下的搜索,适应力很高。
需要说明的是,本申请实施例中的关键词可以表现为在搜索引擎的输入框中输入的一段文字或作为查询条件的关键词。
本申请实施例还提供了一种提示词的推荐装置,如图4所示,该装置包括:检测模块40,用于检测输入的关键词;第一查询模块42,用于从索引库中查找与所述关键词对应的索引信息;第二查询模块44,用于基于所述索引信息从所述源数据库中搜索与所述关键词关联的搜索提示信息;展示模块46,用于展示所述搜索提示信息。
可选地,上述装置还包括:获取模块,用于获取搜索引擎的源数据;提取模块,用于从源数据库的源数据中提取与业务场景相关的至少一个字段,将提取的至少一个字段作为查询字段;确定模块,用于依据所述查询字段确定索引信息,得到索引库;建立模块,用于建立所述索引库和所述源数据库之间的关联。
具体地,检测模块检测关键词可以采用对用户的输入操作生成的文本进行实时检测的方法,也可以是根据输入设备(例如键盘、手写板等)的输入信号进行用户输入内容的采集,从而获取本申请技术方案所需的关键词。上述实施例中索引信息的建立可以是基于MySQL数据库,利用建立的例如第二范式型关键词数据库与相应的索引,来调用本申请所需要的信息。
可选地,将变化后的关键词作为目标关键词之前,该方法还包括:检测在输入所述关键词后输入的指定关键词;将所述指定关键词和所述关键词进行组合,得到组合词;对所述组合词的语义完整性进行验证,其中,在验证通过时,将组合词作为目标关键词。
具体地,在查找数据库的索引信息时,可以是实时检测(即不关注变化后的指定关键词或关键词的语义是否完整,均以在输入框中当前检测到的所有关键词),也可以是在指定关键词通过语义完整性验证时再查找相应的索引。其中,对于后者,可以表现为以下实现过程:当检测到用户输入了关键词后用户又输入了指定关键词,那么将用户所输入的指定关键词作为优先级最高的数据替换用户输入的关键词,作为索引信息搜索的依据;对于指定关键词通过语义完整性验证时再查找相应的索引,还可以表现为以下实现过程:检测在输入所述关键词后输入的指定关键词;将所述指定关键词和所述关键词进行组合,得到组合词;对所述组合词的语义完整性进行验证,其中,在验证通过时,将所述组合词作为所述目标关键词,通过上述实施例,可以节省运行资源,并且,可以进一步提高查询的效率。
根据本申请的一些实施例,第一查询模块42用于从索引库中查找与关键词对应的索引信息;从索引库中查找与所述关键词对应的索引信息,包括:确定所述关键词的语义所对应的业务场景;基于所述业务场景和所述语义确定所述索引信息。其中,数据库可以是基于MySQL的数据库及索引,通过对若干索引信息的搜索,确定关键词所涉及的索引信息范围,并通过这些索引信息索引到数据库相关位置。例如,MySQL数据库索引包含了涉及“电脑”的索引信息100条,涉及“宠物”的索引信息50条,那么当用户所输入的关键词为“电脑..”时,则可以确定其场景为电脑,之后再根据涉及电脑的具体语义做进一步的索引范围划定和确定。
需要说明的是,业务场景和语义是进行索引信息划分的两个层次,业务场景可以是关键词所涉猎的领域,例如:电脑领域、宠物领域、法律领域等。而语义则是在确定了具体领域之后,用户最想达到的目的的描述,例如在电脑领域中,语义可以是电脑游戏、电脑配件、电脑维修或电脑销售。那么可以说结合了业务常见和具体语义之后,对于用户所输入的关键词的索引范围确定,起到了大大增加其准确度和搜索效率的技术效果。
第二查询模块44用于基于索引信息从所述源数据库中搜索与关键词关联的搜索提示信息;
可选地,基于索引信息从所述源数据库中搜索与关键词关联的搜索提示信息,包括:从源数据库中查询与索引信息对应的搜索提示信息;确定搜索提示信息与关键词的相似度;将搜索提示信息按照相似度大小进行排序,并将排序靠前的预设数量个搜索提示信息作为最终的搜索提示信息。
具体地,索引信息可以是MySQL数据库中的主键或外键,其所对应的数据是涉及某领域某场景的搜索提示词,例如,当索引信息定位到主键是“电脑”的位置时,则搜索提示词的范围为数据库中主键值是“电脑”的所有数据,然后并根据主键值是“电脑”的数据与用户输入的关键词或指定关键词的相似度进行排序,相似度大的词语可以排在队列最前端。
需要说明的是,相似度可以是数据库中词语与关键词或指定关键词的重复程度,例如,用户输入的关键词是“电脑配件购买”,通过索引信息对应的数据库数据调取操作,获得的搜索提示词为:电脑配置、电脑配件获取、电脑配件买卖。那么根据搜索提示词与关键词的重叠程度可以判断最接近关键词的搜索提示词是“电脑配件买卖”,其次是“电脑配件获取”,最后是“电脑配置”,基于上述相似度的判断过程,得到搜索提示信息大小排序为1.“电脑配件买卖”,2.“电脑配件获取”,3.“电脑配置”,并将排序靠前的预设数量个搜索提示信息作为最终的搜索提示信息。其中预设数量可以是2个,设置上述预设数量搜索提示信息是为了达到将最接近的搜索提示信息展示给用户,同时筛除掉多余无用的信息,例如,搜索提示信息大小排序为1.“电脑配件买卖”,2.“电脑配件获取”,3.“电脑配置”,那么根据预设数量为2的设置,本申请确定的最终的搜索提示信息则为:1.“电脑配件买卖”,2.“电脑配件获取”。
展示模块46,用于展示搜索提示信息。
具体地,由于一般用于展示搜索提示信息的界面大小是有限的,因此,在步骤S108中,可以仅展示搜索到的部分提示信息,例如:从源数据库中查询与索引信息对应的搜索提示信息;确定搜索提示信息与关键词的相似度;将搜索提示信息按照相似度大小进行排序,并将排序靠前的预设数量个搜索提示信息作为最终的搜索提示信息,最后将最终的搜索提示信息通过显示设备展示给用户。例如,最终的搜索提示信息为1.“电脑配件买卖”,2.“电脑配件获取”,则在用户输入框下方可以以下拉表单的方式进行搜索提示信息展示,以便用户选择,相对于现有的相关技术,本申请增加了用户的体验。
本申请实施例还提供了一种提示词的显示方法,如图5所示,包括:
步骤S502,展示搜索引擎的输入框;
步骤S504,展示在所述输入框内输入的关键词;
步骤S506,展示基于索引信息从所述源数据库中搜索的与所述关键词关联的搜索提示信息,其中,所述索引信息为从索引库中查找的与所述关键词对应的索引信息。
可选地,该步骤S506可以通过以下方式实现,例如:从源数据库中查询与索引信息对应的搜索提示信息;确定搜索提示信息与关键词的相似度;将搜索提示信息按照相似度大小进行排序,并将排序靠前的预设数量个搜索提示信息作为最终的搜索提示信息。
具体地,索引信息可以是MySQL数据库中的主键或外键,其所对应的数据是涉及某领域某场景的搜索提示词,例如,当索引信息定位到主键是“电脑”的位置时,则搜索提示词的范围为数据库中主键值是“电脑”的所有数据,然后并根据主键值是“电脑”的数据与用户输入的关键词或指定关键词的相似度进行排序,相似度大的词语可以排在队列最前端。
需要说明的是,相似度是综合评定两个事物之间相近程度的一种度量。两个事物越接近,他们的相似性程度越大,而两个事物越疏远,他们的相似性程度越小。本申请的相似度计算可以是相关系数计算法、欧几里得距离计算法、余弦相关度计算法等,外在表现为数据库中词语与关键词或指定关键词的重复程度的大小,例如,用户输入的关键词是“电脑配件购买”,通过索引信息对应的数据库数据调取操作,获得的搜索提示词为:电脑配置、电脑配件获取、电脑配件买卖。那么根据搜索提示词与关键词的重叠程度可以判断最接近关键词的搜索提示词是“电脑配件买卖”,其次是“电脑配件获取”,最后是“电脑配置”,基于上述相似度的判断过程,得到搜索提示信息大小排序为1.“电脑配件买卖”,2.“电脑配件获取”,3.“电脑配置”,并将排序靠前的预设数量个搜索提示信息作为最终的搜索提示信息。其中预设数量可以是2个,设置上述预设数量搜索提示信息是为了达到将最接近的搜索提示信息展示给用户,同时筛除掉多余无用的信息,例如,搜索提示信息大小排序为1.“电脑配件买卖”,2.“电脑配件获取”,3.“电脑配置”,那么根据预设数量为2的设置,本申请确定的最终的搜索提示信息则为:1.“电脑配件买卖”,2.“电脑配件获取”。
在本申请的一些实施例中,搜索框可以是设置于用户输入光标的下方,例如,当用户输入关键词或指定关键词时,光标位于搜索框内的(x,y)位置,那么基于上述坐标,本申请的搜索框展示可以在(x,y-1)至(x+10,y-11)的范围内进行搜索提示信息以及关键词的内容展示。由于一般用于展示搜索提示信息的界面大小是有限的,因此,在步骤S502至S504中,可以仅展示搜索到的部分提示信息,例如:从源数据库中查询与索引信息对应的搜索提示信息;确定搜索提示信息与关键词的相似度;将搜索提示信息按照相似度大小进行排序,并将排序靠前的预设数量个搜索提示信息作为最终的搜索提示信息,最后将最终的搜索提示信息通过显示设备展示给用户。例如,最终的搜索提示信息为1.“电脑配件买卖”,2.“电脑配件获取”,则在用户输入框下方可以以下拉表单的方式进行搜索提示信息展示,以便用户选择,相对于现有的相关技术,本申请实施例增加了用户的体验。
本申请实施例提供了一种存储介质,该存储介质包括存储的程序,其中,在所述程序运行时控制所述存储介质所在设备执行以上所述的提示词的推荐方法,例如,该方法包括:检测输入的关键词;从索引库中查找与所述关键词对应的索引信息,其中,该索引信息为基于搜索引擎对应的源数据库中的源数据确定的;基于所述索引信息从所述源数据库中搜索与所述关键词关联的搜索提示信息;展示所述搜索提示信息。
本申请实施例还提供了一种处理器,所述处理器用于运行程序,其中,所述程序运行时执行以上所述的提示词的推荐方法。例如,该方法包括:检测输入的关键词;从索引库中查找与所述关键词对应的索引信息,其中,该索引信息为基于搜索引擎对应的源数据库中的源数据确定的;基于所述索引信息从所述源数据库中搜索与所述关键词关联的搜索提示信息;展示所述搜索提示信息。
上述本申请实施例序号仅仅为了描述,不代表实施例的优劣。
在本申请的上述实施例中,对各个实施例的描述都各有侧重,某个实施例中没有详述的部分,可以参见其他实施例的相关描述。
在本申请所提供的几个实施例中,应该理解到,所揭露的技术内容,可通过其它的方式实现。其中,以上所描述的装置实施例仅仅是示意性的,例如所述单元的划分,可以为一种逻辑功能划分,实际实现时可以有另外的划分方式,例如多个单元或组件可以结合或者可以集成到另一个***,或一些特征可以忽略,或不执行。另一点,所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些接口,单元或模块的间接耦合或通信连接,可以是电性或其它的形式。
所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。
另外,在本申请各个实施例中的各功能单元可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中。上述集成的单元既可以采用硬件的形式实现,也可以采用软件功能单元的形式实现。
所述集成的单元如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本申请的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的全部或部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可为个人计算机、服务器或者网络设备等)执行本申请各个实施例所述方法的全部或部分步骤。而前述的存储介质包括:U盘、只读存储器(ROM,Read-Only Memory)、随机存取存储器(RAM,Random Access Memory)、移动硬盘、磁碟或者光盘等各种可以存储程序代码的介质。
以上所述仅是本申请的优选实施方式,应当指出,对于本技术领域的普通技术人员来说,在不脱离本申请原理的前提下,还可以做出若干改进和润饰,这些改进和润饰也应视为本申请的保护范围。

Claims (11)

1.一种提示词的推荐方法,其特征在于,包括:
检测输入的关键词;
从索引库中查找与所述关键词对应的索引信息,其中,该索引信息为基于搜索引擎对应的源数据库中的源数据确定的;
基于所述索引信息从所述源数据库中搜索与所述关键词关联的搜索提示信息;
展示所述搜索提示信息。
2.根据权利要求1所述的方法,其特征在于,基于所述索引信息从所述源数据库中搜索与所述关键词关联的搜索提示信息之前,所述方法还包括:
获取所述搜索引擎的源数据;
从所述源数据中提取与业务场景相关的至少一个字段,将提取的至少一个字段作为查询字段;
依据所述查询字段确定索引信息,得到索引库;
建立所述索引库和所述源数据库之间的关联。
3.根据权利要求1所述的方法,其特征在于,
检测输入的关键词,包括:检测在输入框中的关键词是否发生变化;在发生变化时,将变化后的关键词作为目标关键词;
从索引库中查找与所述关键词对应的索引信息,包括:从所述索引库中查找与所述目标关键词对应的索引信息。
4.根据权利要求3所述的方法,其特征在于,将变化后的关键词作为目标关键词之前,所述方法还包括:
检测在输入所述关键词后输入的指定关键词;
将所述指定关键词和所述关键词进行组合,得到组合词;
对所述组合词的语义完整性进行验证,其中,在验证通过时,将所述组合词作为所述目标关键词。
5.根据权利要求1所述的方法,其特征在于,基于所述索引信息从所述源数据库中搜索与所述关键词关联的搜索提示信息,包括:
从所述源数据库中查询与所述索引信息对应的搜索提示信息;
确定所述搜索提示信息与所述关键词的相似度;
将所述搜索提示信息按照相似度大小进行排序,并将排序靠前的预设数量个搜索提示信息作为最终的搜索提示信息。
6.根据权利要求1所述的方法,其特征在于,从索引库中查找与所述关键词对应的索引信息,包括:
确定所述关键词的语义所对应的业务场景;
基于所述业务场景和所述语义确定所述索引信息。
7.一种提示词的显示方法,其特征在于,包括:
展示搜索引擎的输入框;
展示在所述输入框内输入的关键词;
展示基于索引信息从搜索引擎的源数据库中搜索与所述关键词关联的搜索提示信息,其中,所述索引信息为从索引库中查找的与所述关键词对应的索引信息,该索引信息为基于所述搜索引擎对应的源数据库中的源数据确定的。
8.一种提示词的推荐装置,其特征在于,包括:
检测模块,用于检测输入的关键词;
第一查询模块,用于从索引库中查找与所述关键词对应的索引信息,其中,该索引信息为基于搜索引擎对应的源数据库中的源数据确定的;
第二查询模块,用于基于所述索引信息从所述源数据库中搜索与所述关键词关联的搜索提示信息;
展示模块,用于展示所述搜索提示信息。
9.根据权利要求8所述的装置,其特征在于,所述装置还包括:
获取模块,用于获取所述搜索引擎的源数据;
提取模块,用于从所述源数据中提取与业务场景相关的至少一个字段,将提取的至少一个字段作为查询字段;
确定模块,用于依据所述查询字段确定索引信息,得到索引库;
建立模块,用于建立所述索引库和所述源数据库之间的关联。
10.一种非易失性存储介质,其特征在于,所述存储介质包括存储的程序,其中,在所述程序运行时控制所述存储介质所在设备执行权利要求1至6中任意一项所述的提示词的推荐方法。
11.一种处理器,其特征在于,所述处理器用于运行程序,其中,所述程序运行时执行权利要求1至6中任意一项所述的提示词的推荐方法。
CN201910828830.6A 2019-09-03 2019-09-03 提示词的推荐方法及装置、存储介质和处理器 Pending CN110543484A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201910828830.6A CN110543484A (zh) 2019-09-03 2019-09-03 提示词的推荐方法及装置、存储介质和处理器

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201910828830.6A CN110543484A (zh) 2019-09-03 2019-09-03 提示词的推荐方法及装置、存储介质和处理器

Publications (1)

Publication Number Publication Date
CN110543484A true CN110543484A (zh) 2019-12-06

Family

ID=68712408

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201910828830.6A Pending CN110543484A (zh) 2019-09-03 2019-09-03 提示词的推荐方法及装置、存储介质和处理器

Country Status (1)

Country Link
CN (1) CN110543484A (zh)

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111653328A (zh) * 2020-06-04 2020-09-11 医渡云(北京)技术有限公司 病历信息推送方法、装置、存储介质及电子设备
CN112749328A (zh) * 2020-04-21 2021-05-04 腾讯科技(深圳)有限公司 搜索方法、装置和计算机设备
CN112749318A (zh) * 2020-02-24 2021-05-04 云天弈(广州)智能科技有限公司 一种智能写作***及方法
CN113254808A (zh) * 2021-06-02 2021-08-13 江苏豪杰测绘科技有限公司 一种gis数据筛选方法及***

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103257969A (zh) * 2012-02-17 2013-08-21 盛乐信息技术(上海)有限公司 基于检索词对的相关搜索提示方法及***
CN103544267A (zh) * 2013-10-16 2014-01-29 北京奇虎科技有限公司 一种基于搜索建议词进行搜索的方法以及装置
CN103593371A (zh) * 2012-08-16 2014-02-19 腾讯科技(深圳)有限公司 推荐搜索关键词的方法和装置
CN104077392A (zh) * 2014-06-30 2014-10-01 百度在线网络技术(北京)有限公司 一种搜索建议提示方法及装置

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103257969A (zh) * 2012-02-17 2013-08-21 盛乐信息技术(上海)有限公司 基于检索词对的相关搜索提示方法及***
CN103593371A (zh) * 2012-08-16 2014-02-19 腾讯科技(深圳)有限公司 推荐搜索关键词的方法和装置
CN103544267A (zh) * 2013-10-16 2014-01-29 北京奇虎科技有限公司 一种基于搜索建议词进行搜索的方法以及装置
CN104077392A (zh) * 2014-06-30 2014-10-01 百度在线网络技术(北京)有限公司 一种搜索建议提示方法及装置

Cited By (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112749318A (zh) * 2020-02-24 2021-05-04 云天弈(广州)智能科技有限公司 一种智能写作***及方法
CN112749318B (zh) * 2020-02-24 2024-03-26 云天弈(广州)智能科技有限公司 一种智能写作***及方法
CN112749328A (zh) * 2020-04-21 2021-05-04 腾讯科技(深圳)有限公司 搜索方法、装置和计算机设备
CN112749328B (zh) * 2020-04-21 2024-01-05 腾讯科技(深圳)有限公司 搜索方法、装置和计算机设备
CN111653328A (zh) * 2020-06-04 2020-09-11 医渡云(北京)技术有限公司 病历信息推送方法、装置、存储介质及电子设备
CN111653328B (zh) * 2020-06-04 2023-03-21 医渡云(北京)技术有限公司 病历信息推送方法、装置、存储介质及电子设备
CN113254808A (zh) * 2021-06-02 2021-08-13 江苏豪杰测绘科技有限公司 一种gis数据筛选方法及***

Similar Documents

Publication Publication Date Title
US10268766B2 (en) Systems and methods for computation of a semantic representation
US9846748B2 (en) Searching for information based on generic attributes of the query
US9489401B1 (en) Methods and systems for object recognition
CN110543484A (zh) 提示词的推荐方法及装置、存储介质和处理器
US9535911B2 (en) Processing a content item with regard to an event
CN104239340B (zh) 搜索结果筛选方法与装置
KR102055899B1 (ko) 맥락을 이용하여 문서를 검색하는 시스템 및 방법
CN112667794A (zh) 一种基于孪生网络bert模型的智能问答匹配方法及***
JP2019507417A (ja) 多変数検索のためのユーザインターフェース
CN106557558B (zh) 一种数据分析方法及装置
WO2012142553A2 (en) Identifying query formulation suggestions for low-match queries
US10482169B2 (en) Recommending form fragments
CN108304444A (zh) 信息查询方法及装置
KR20160107187A (ko) 검색 결과에서의 논리적인 질문 응답 기법
US10467265B2 (en) Method for extracting entries from a database
US8606780B2 (en) Image re-rank based on image annotations
US20160283564A1 (en) Predictive visual search enginge
US20230222136A1 (en) Information providing device
CN113039539A (zh) 使用ai模型推荐来扩展搜索引擎能力
US10901992B2 (en) System and method for efficiently handling queries
JP2023066404A (ja) 電子商取引プラットフォームで商品マッチングを実行するための方法およびシステム
CN108733848B (zh) 一种搜索知识的方法及***
CN109934740B (zh) 一种专利监控方法及装置
JP2006139484A (ja) 情報検索方法及びそのシステム並びにコンピュータプログラム
JP2011018152A (ja) 情報提示装置、情報提示方法およびプログラム

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication
RJ01 Rejection of invention patent application after publication

Application publication date: 20191206