CN109522465A - 基于知识图谱的语义搜索方法及装置 - Google Patents

基于知识图谱的语义搜索方法及装置 Download PDF

Info

Publication number
CN109522465A
CN109522465A CN201811231211.0A CN201811231211A CN109522465A CN 109522465 A CN109522465 A CN 109522465A CN 201811231211 A CN201811231211 A CN 201811231211A CN 109522465 A CN109522465 A CN 109522465A
Authority
CN
China
Prior art keywords
user
search
semantic
search information
based map
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201811231211.0A
Other languages
English (en)
Inventor
周晶
罗鹏
张宾
孙喜民
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
State Grid Agel Ecommerce Ltd
State Grid Corp of China SGCC
Original Assignee
State Grid Agel Ecommerce Ltd
State Grid Corp of China SGCC
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by State Grid Agel Ecommerce Ltd, State Grid Corp of China SGCC filed Critical State Grid Agel Ecommerce Ltd
Priority to CN201811231211.0A priority Critical patent/CN109522465A/zh
Publication of CN109522465A publication Critical patent/CN109522465A/zh
Pending legal-status Critical Current

Links

Abstract

本申请公开了一种基于知识图谱的语义搜索方法及装置,涉及搜索引擎领域,用于满足用户语义层面的搜索需求,从而为用户提供准确、高效的搜索体验。该方法包括:获取搜索信息;根据所述知识图谱对所述搜索信息进行语义识别,以得到用户意图;根据所述用户意图对所述第一实体集合进行推理及查询,以得到第二实体集合,其中,所述第二实体集合为所述第一实体集合中与所述用户意图相关性高的实体集合;将所述第二实体集合作为搜索结果通知用户。本申请实施例应用于基于知识图谱的语义搜索。

Description

基于知识图谱的语义搜索方法及装置
技术领域
本发明涉及搜索引擎领域,尤其涉及一种基于知识图谱的语义搜索方法及装置
背景技术
随着互联网数据量的积累,人们不再满足于仅仅得到搜索网页集合,即仅仅得到与用户查询相关的若干文档链接,而是希望获得更加具体化的答案式的搜索结果。尤其在电商行业,用户搜索的准确性直接关乎商业体验。
现有的搜索技术尽管取得了巨大的成功,但是当用户进行信息搜索时,现有搜索技术无法对用户的搜索意图进行精确的语义化理解,尤其在电商行业,用户搜索的准确性直接关乎商业体验。
在电商平台在运营过程中,最关键的部分就是理解用户搜索意图以展示对应商品列表,其中也包括自动导购、智能客服等介入以实现自动化销售。现有的搜索技术具有无法对用户语义进行分析、无法识别歧义商品名等缺点。
发明内容
本申请的实施例提供一种基于知识图谱的语义搜索方法及装置,用于满足用户语义层面的搜索需求,从而为用户提供准确、高效的搜索体验。
为达到上述目的,本申请的实施例采用如下技术方案:
第一方面,提供了一种基于知识图谱的语义搜索方法,所述知识图谱包括第一实体集合以及所述第一实体集合中的多个实体之间的连接关系该方法包括:
获取搜索信息;
根据所述关联关系对所述搜索信息进行语义识别,以得到用户意图;
根据所述用户意图对所述第一实体集合进行推理及查询,以得到第二实体集合,其中,所述第二实体集合为所述第一实体集合中与所述用户意图相关性高的实体集合;
将所述第二实体集合作为搜索结果通知用户。
第二方面,提供了一种装置,该装置包括:
获取单元,用于获取搜索信息;
识别单元,用于根据所述知识图谱的多个第一实体集合中的多个实体之间的关联关系对所述搜索信息进行语义识别,以得到用户意图;
搜索单元,用于根据所述用户意图对所述知识图谱的第一实体集合进行推理及查询,以得到第二实体集合,其中,所述第二实体集合为所述第一实体集合中与所述用户意图相关性高的实体集合;
通知单元,用于将所述第二实体集合作为搜索结果通知用户。
第三方面,提供了一种存储一个或多个程序的计算机可读存储介质,所述一个或多个程序包括指令,所述指令当被计算机执行时使所述计算机执行如第一方面所述的方法。
第四方面,提供了一种包含指令的计算机程序产品,当所述指令在计算机上运行时,使得计算机执行如第一方面所述的语义搜索方法。
第五方面,提供一种语义搜索装置,包括:处理器和存储器,存储器用于存储程序,处理器调用存储器存储的程序,以执行上述第一方面所述的语义搜索方法。
本申请的实施例提供的基于知识图谱的语义搜索方法,通过电商知识图谱对用户输入进行语义分析,得到用户精准意图,进而将用户意图与知识图谱中的实体进行搜索,返回其最关联搜索结果,提高用户的搜索体验。通过语义搜索,用户可以表达更复杂完整的搜索需求,而搜索结果也更加的贴近用户需求的答案,同时也可以提高意图理解和搜索结果的效率和准确率。
附图说明
图1为本申请的实施例提供的一种基于知识图谱的语义搜索***结构示意图;
图2为本申请的实施例提供的一种基于知识图谱的语义搜索方法示意图一;
图3为本申请的实施例提供的一种基于知识图谱的语义搜索方法示意图二;
图4为本申请的实施例提供的一种基于知识图谱的语义搜索方法示意图三;
图5为本申请的实施例提供的一种基于知识图谱的语义搜索方法示意图四;
图6为本申请的实施例提供的一种基于知识图谱的语义搜索装置结构示意图一;
图7为本申请的实施例提供的一种基于知识图谱的语义搜索装置结构示意图二;
图8为本申请的实施例提供的一种基于知识图谱的语义搜索装置结构示意图三。
具体实施方式
本申请实施例提供的语义搜索方法,可以应用于基于知识图谱的搜索***,参照图1所示,该搜索***可以包括接口层101、搜索层102、储存层103以及数据层104;
接口层101,即对外提供的所有搜索相关的接口,主要包括主搜索接口、智能提示接口和相关搜索接口等。其中,主搜索接口为基于知识图谱的智能搜索主入口;智能提示接口用于搜索联想词(搜索词联想、纠错、排序等)和热词数据的调用;相关搜索接口用于用户搜索词相关联的用户搜索内容,即关联搜索词;
搜索层102,包括搜索配置、搜索核心模型和搜索分析,其中搜索配置主要包括分词策略配置、同义词设置、索引字段配置、排序策略配置、白名单配置、违禁词配置、过滤词配置等基础搜索配置项;搜索核心模型包括自然语言处理(natural languageprocessing,NLP)模型、基于知识图谱的意图识别模型和排序模型,其中,NLP模型用于:词重要性分析、句法结构、词位置分析;排序模型包括:最佳匹配25排序算法(best match25,BM25)、学习排序算法(learning to rank,LTR)及搜索引擎结果排序算法(Hilltop);搜索分析主要提供针对搜索内容、搜索结果的基础分析功能,包括:搜索来源分析、热搜词分析、坏案例(BadCase)分析以及新词发现;
其中,增加行业相关词库可以为用户推荐更多的搜索词候选,提高***搜索准确性。行业词库从用户搜索和索引数据中挖掘,经过筛选之后加入到***中。行业词的挖掘属于新词发现范畴。挖掘算法遍历索引数据,通过计算字与字之间的凝固度以及词片段的左右自由度,从数据中挖掘出行业词。
可选的,该发掘算法可以为:将搜索数据片段切分成词碎片;通过二元语法(2-gram)前后次拼接将词碎片拼接成新词,并储存左右拼接词及邻接字;进行词频统计,如果词频小于阈值,则计算字与字的自由度和凝聚度的计算;否则进程结束;进行字与字的自由度和凝聚度计算后,通过过滤词典和人工判断,得到行业信息。可选的,当将词碎片后还可以通过迭代计算字与字的自由度和凝聚度。
存储层103,主要包括索引数据存储和知识图谱数据存储,其中:索引数据存储使用实时分布式搜索分析引擎(Elastic Search)存储架构,支持亿级内容吞吐,索引更新达到秒级;知识图谱存储集成了图数据模型、关系数据模型、文档数据模型和关键字取值(Key-Value)数据模型四种形式的数据模型,适用于存储多种数据形式的复杂数据场景,底层可采用不同的基础存储库,目前已经集成了关系型数据库管理***(microsoftstructure quest language,MySQL)、基于分布式文件存储的数据库(MongoDB)、分布式的面向列的开源数据库(Hadoop Database,HBase)和计算引擎(Spark)等后台的存储,适用不同用户的应用需求。
数据层104。即原始数据层,包含各类用户数据、日志数据、访问信息等,主要分为结构化数据、半结构化数据和非结构化数据等;
可选的,该知识图谱可以为电商知识图谱。
本申请实施例提供的基于知识图谱的语义搜索方法主要运行环境为上述搜索***的搜索层。
本申请实施例提供的基于知识图谱的语义搜索方法及装置,其中,知识图谱包括第一实体集合和第一实体集合中的多个实体的关联关系。获取搜索信息,根据知识图谱对搜索信息进行语义识别,以得到用户意图;根据用户意图对第一实体集合进行推理及查询,以得到与用户意图相关性高的第二实体集合;将第二实体集合作为搜索结果通知用户。
实施例1、
本申请实施例提供了一种基于知识图谱的语义搜索方法,该知识图谱可以包括第一实体集合和第一实体集合中多个实体的关联关系,参照图2中所示,该方法包括S101-S104:
S101、获取搜索信息。
当用户通过基于知识图谱的搜索***的接口层输入信息时,该信息可以为实体名称,也可以是用户问题。
可选的,参照图3中所示,S101可以包括S201-S202:
S201、如果搜索信息为拼音时,则根据拼音库将搜索信息转换为汉字。
其中,拼音库包括行业词库的拼音标注。
当用户输入的信息出现文字错输为拼音时,搜索***可以自动转换成汉字,并可以识别多音字情况。拼音转汉字依赖于拼音库,拼音库来源于行业词库的拼音标注。行业词库可以为电商行业的词库。
S202、如果搜索信息为错误汉字时,则根据编辑距离算法并结合行业词库查找相似度高的汉字。
当用户输入的信息出现单词拼写错误、同音字时,搜索***可以自动识别纠错。汉字的纠错使用编辑距离算法实现,首先在行业词库中查找词相似度以及拼音相似度较高的词作为候选词,以缩小编辑距离计算范围,之后计算各个候选词与需要纠错词的编辑距离,取编辑距离最小的候选词,如果编辑距离值超过设置的纠错阀值,则作为结果返回。
S102、根据知识图谱中第一实体集合中的多个实体的关联关系对搜索信息进行语义识别,以得到用户意图。
知识图谱的构建源自海量数据的整合处理,在知识图谱的基础上,通过各种逻辑算法分析处理自然语言,并进行语义识别,找到最符合搜索信息的关键匹配知识图谱,从而确定用户意图。
基于知识图谱构建起来的搜索服务,与基于关键词匹配的传统网络搜索引擎相比,能够支持更自然、复杂的查询输入,理解查询信息的语义,并针对查询直接给出答案;与基于简单字符串匹配传统搜索引擎相比,让搜索结果与查询内容更加紧实,可以避免跨领域问题查询偏差。
可选的,参照图4中所示,S102可以包括S301-S302:
S301、根据知识图谱将搜索信息划分为多个分词;
将知识图谱作为分词算法词库,构建基于知识图谱的领域分词模型,将用户的搜索信息基于知识图谱的分词,即按照概念、实体、属性及操作符等将搜索信息分成多个词语,通过分词模型对用户问题进行分词理解,可以最大程度上的划分和理解用户的问题。
S302、对多个分词进行语义消歧、语义理解及翻译,以得到用户意图。
对分词之后的用户问题进行命名实体识别,主要识别知识图谱中的实体、概念、属性、操作符等,并利用知识图谱对用户问题中的分词实体进行语义消歧,并对用户问题的语义理解和翻译,得到用户精准的意图。
可选的,可以通过子图理解和问题解析模块,实现对用户问题的语义理解和翻译,该模块可以分为三个单元:问答对解析单元、图谱问答解析单元和业务问答解析单元;
问答对解析单元:问答对解析一方面为了集成企业内部现有标准问答数据,更加精准的回答用户的提问;另一方面随着问答***数据的积累,可以从用户问题中提炼或抽象标准问答信息,反馈到问答***中,让问答***越问越智能;
图谱问答解析单元,图谱问答解析主要为了实现将用户问题映射到知识图谱的子图上,从而理解和翻译用户的查询意图,从图谱中查找相应问答答案返回用户;
业务问答解析单元,业务问答解析主要实现将映射到知识图谱子图的用户问题结合商业智能(business intelligence,BI)业务规则,转换为业务BI查询。
可选的,该方法还可以包括:
查询转换:将语义理解和解析之后的用户问题转化为图查询语言或者计算引擎结构化查询语言(spark structured query language,Spark SQL)查询逻辑;结果排序和返回:从知识图谱中查询获得的数据进行整理和排序,使用适合的可视化组件返回给用户。
可选的,参照图5中所示,该方法还可以包括S401-S403:
S401、如果识别到用户意图,则对搜索信息进行语义及属性扩展并返回搜索结果。
意图识别中,智能搜索模块已经知道用户的意图。此时,对搜索词进行语义相似词的扩展,这里的语义包含同义词和语义词。接着,通过知识图谱,查询搜索目标的概念属性。一方面做搜索属性域的扩展,另一方面生成过滤筛选项。搜索属性域扩展后,根据每个域的权重,选择部分属性域加入搜索。然后,对生成查询条件集合的条件权重进行动态计算。最后,执行搜索,并生成用户搜索的建议
S402、如果无法识别到用户意图并且搜索有结果,则对搜索信息进行同义扩展并且提供同义词。
意图识别没命中、首次搜索有结果,意图识别未命中,退化成同义扩展后的关键词搜索,其中,同义扩展的目标提升搜索的召回率;同义扩展后,对扩展词集合进行权重动态计算。最后,并按搜索的结果属性聚合生成过滤筛选项,最后返回结果。
S403、如果无法识别到用户意图且搜索没有结果,则对搜索信息进行纠错,并重新搜索。
意图识别没命中、首次搜索无结果,可能是搜索词本身错误,可以使用关键词纠错重搜,其中,纠错的主要方式为将搜索词转化成拼音,然后寻找拼音匹配下概率最大的词;,也可以根据词的曼哈顿距离进行相似计算,根据得分和阈值来确定是否进行纠错;如果有数据返回,并告诉用户建议纠错的搜索关键词;如果没有数据,提示没有搜索到数据。
S103、根据用户意图对第一实体集合进行推理及查询,以得到第二实体集合。
其中,第二实体集合为第一实体集合中与用户意图相关性高的实体集合。
需要说明的,第一实体集合中可以包括多个实体以及多个实体之间的关联关系,因此可以根据用户意图在知识图谱的第一实体集合中筛选更加符合用户需求的第二实体集合。
S104、将第二实体集合作为搜索结果通知用户。
可选的,在得到跟用户意图相关性高的的第二实体集合后,可以通过排序算法将第二实体集合中的多个实体按照一定顺序排列,便于用户查看搜索结果。其中,排序算法可以包括:最佳匹配25(best match25,BM25)排序算法和LTR排序算法;用户也可以自定义修改排序算法的参数,达到个性化的搜索应用。
本申请实施例提供的语义搜索方法及装置,在构建完成的知识图谱基础上,通过知识图谱对用户输入的搜索信息进行语义分析,得到用户精准意图,进而将用户意图与知识图谱中的实体或者其他活动实体进行推理及查询,返回与用户意图最关联的实体列表或者搜索结果,提高用户电商活动体验。通过语义搜索,用户可以表达更复杂完整的搜索需求,而搜索结果也更加的贴近用户需求的答案,使用语义搜索可以提高意图理解和搜索结果的效率和准确率。
实施例2、
本申请实施例提供了一种基于知识图谱的语义搜索装置,参照图6中所示,该语义搜索装置100可以包括:
获取单元110,用于获取搜索信息;
识别单元120,用于根据知识图谱中第一实体集合的多个实体的关联关系对搜索信息进行语义识别,以得到用户意图;
搜索单元130,用于根据用户意图对知识图谱的第一实体集合进行推理及查询,以得到第二实体集合,其中,第二实体集合为所述第一实体集合中与用户意图相关性高的实体集合;
通知单元140,用于将第二实体集合作为搜索结果通知用户。
可选的,识别单元120具体用于:根据知识图谱将搜索信息划分为多个分词;对多个分词进行语义消歧、语义理解及翻译,以得到用户意图。
可选的,参照图7中所示,该语义搜索装置100还可以包括转换单元210,用于:如果搜索信息为拼音时,则根据拼音库将搜索信息转换为汉字,其中,拼音库包括行业词库的拼音标注;如果搜索信息为错误汉字时,则根据编辑距离算法并结合行业词库查找相似度高的汉字。
可选的,参照图8中所示,该语义搜索装置还可以包括判断单元310,用于:如果识别到用户意图,则对搜索信息进行语义及属性扩展并返回搜索结果;如果无法识别到用户意图并且搜索有结果,则对搜索信息进行同义扩展并且提供同义词;如果无法识别到用户意图且搜索没有结果,则对搜索信息进行纠错,并重新搜索。
本申请实施例提供一种存储一个或多个程序的计算机可读存储介质,所述一个或多个程序包括指令,所述指令当被计算机执行时使所述计算机执行如图2-图5中所述的方法。
本申请的实施例提供一种包含指令的计算机程序产品,当指令在计算机上运行时,使得计算机执行如图2-图5中所述的语义搜索方法。
本申请的实施例提供一种基于知识图谱的语义搜索装置,包括:处理器和存储器,存储器用于存储程序,处理器调用存储器存储的程序,以执行如图2-图5中所述的语义搜索方法。
由于本申请的实施例中的基于知识图谱的语义搜索装置、计算机可读存储介质、计算机程序产品可以应用于上述方法,因此,其所能获得的技术效果也可参考上述方法实施例,本发明实施例在此不再赘述。
需要说明的是,上述各单元可以为单独设立的处理器,也可以集成在控制器的某一个处理器中实现,此外,也可以以程序代码的形式存储于控制器的存储器中,由控制器的某一个处理器调用并执行以上各单元的功能。这里所述的处理器可以是一个中央处理器(Central Processing Unit,CPU),或者是特定集成电路(Application SpecificIntegrated Circuit,ASIC),或者是被配置成实施本申请实施例的一个或多个集成电路。
应理解,在本申请的各种实施例中,上述各过程的序号的大小并不意味着执行顺序的先后,各过程的执行顺序应以其功能和内在逻辑确定,而不应对本申请实施例的实施过程构成任何限定。
本领域普通技术人员可以意识到,结合本文中所公开的实施例描述的各示例的单元及算法步骤,能够以电子硬件、或者计算机软件和电子硬件的结合来实现。这些功能究竟以硬件还是软件方式来执行,取决于技术方案的特定应用和设计约束条件。专业技术人员可以对每个特定的应用来使用不同方法来实现所描述的功能,但是这种实现不应认为超出本申请的范围。
所属领域的技术人员可以清楚地了解到,为描述的方便和简洁,上述描述的***、装置和单元的具体工作过程,可以参考前述方法实施例中的对应过程,在此不再赘述。
在本申请所提供的几个实施例中,应该理解到,所揭露的***、设备和方法,可以通过其它的方式实现。例如,以上所描述的设备实施例仅仅是示意性的,例如,所述单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,例如多个单元或组件可以结合或者可以集成到另一个***,或一些特征可以忽略,或不执行。另一点,所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些接口,设备或单元的间接耦合或通信连接,可以是电性,机械或其它的形式。
所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。
另外,在本申请各个实施例中的各功能单元可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中。
在上述实施例中,可以全部或部分地通过软件、硬件、固件或者其任意组合来实现。当使用软件程序实现时,可以全部或部分地以计算机程序产品的形式来实现。该计算机程序产品包括一个或多个计算机指令。在计算机上加载和执行计算机程序指令时,全部或部分地产生按照本申请实施例所述的流程或功能。所述计算机可以是通用计算机、专用计算机、计算机网络、或者其他可编程装置。所述计算机指令可以存储在计算机可读存储介质中,或者从一个计算机可读存储介质向另一个计算机可读存储介质传输,例如,所述计算机指令可以从一个网站站点、计算机、服务器或者数据中心通过有线(例如同轴电缆、光纤、数字用户线(Digital Subscriber Line,DSL))或无线(例如红外、无线、微波等)方式向另一个网站站点、计算机、服务器或数据中心进行传输。所述计算机可读存储介质可以是计算机能够存取的任何可用介质或者是包含一个或多个可以用介质集成的服务器、数据中心等数据存储设备。所述可用介质可以是磁性介质(例如,软盘、硬盘、磁带),光介质(例如,DVD)、或者半导体介质(例如固态硬盘(Solid State Disk,SSD))等。
以上所述,仅为本申请的具体实施方式,但本申请的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本申请揭露的技术范围内,可轻易想到变化或替换,都应涵盖在本申请的保护范围之内。因此,本申请的保护范围应以所述权利要求的保护范围为准。

Claims (11)

1.一种基于知识图谱的语义搜索方法,其特征在于,所述知识图谱包括第一实体集合以及所述第一实体集合中的多个实体之间的关联关系,所述语义搜索方法包括:
获取搜索信息;
根据所述关联关系对所述搜索信息进行语义识别,以得到用户意图;
根据所述用户意图对所述第一实体集合进行推理及查询,以得到第二实体集合,其中,所述第二实体集合为所述第一实体集合中与所述用户意图相关性高的实体集合;
将所述第二实体集合作为搜索结果通知用户。
2.根据权利要求1所述的基于知识图谱的语义搜索方法,其特征在于,所述获取搜索信息之后,所述语义搜索方法包括:
如果所述搜索信息为拼音时,则根据拼音库将所述搜索信息转换为汉字,其中,所述拼音库包括行业词库的拼音标注;
如果所述搜索信息为错误汉字时,则根据编辑距离算法并结合所述行业词库查找相似度高的汉字。
3.根据权利要求1所述的基于知识图谱的语义搜索方法,其特征在于,所述根据所述知识图谱对所述搜索信息进行语义识别,以得到用户意图,包括:
根据所述知识图谱将所述搜索信息划分为多个分词;
对所述多个分词进行语义消歧、语义理解及翻译,以得到所述用户意图。
4.根据权利要求1所述的知识图谱的语义搜索方法,其特征在于,所述方法还包括:
如果识别到用户意图,则对所述搜索信息进行语义及属性扩展并返回搜索结果;
如果无法识别到所述用户意图并且搜索有结果,则对所述搜索信息进行同义扩展并提供同义词;
如果无法识别到所述用户意图并且搜索没有结果,则对所述搜索信息进行纠错,并重新搜索。
5.一种基于知识图谱的语义搜索装置,其特征在于,包括:
获取单元,用于获取搜索信息;
识别单元,用于根据所述知识图谱的多个第一实体集合中的多个实体之间的关联关系对所述搜索信息进行语义识别,以得到用户意图;
搜索单元,用于根据所述用户意图对所述知识图谱的第一实体集合进行推理及查询,以得到第二实体集合,其中,所述第二实体集合为所述第一实体集合中与所述用户意图相关性高的实体集合;
通知单元,用于将所述第二实体集合作为搜索结果通知用户。
6.根据权利要求5所述的基于知识图谱的语义搜索装置,其特征在于,所述语义搜索装置还包括转换单元,用于:
如果所述搜索信息为拼音时,则根据拼音库将所述搜索信息转换为汉字,其中,所述拼音库包括行业词库的拼音标注;
如果所述搜索信息为错误汉字时,则根据编辑距离算法并结合所述行业词库查找相似度高的汉字。
7.根据权利要求5所述的基于知识图谱的语义搜索装置,其特征在于,所述识别单元具体用于:
根据所述知识图谱将所述搜索信息划分为多个分词;
对所述多个分词进行语义消歧、语义理解及翻译,以得到所述用户意图。
8.根据权利要求5所述的基于知识图谱的语义搜索装置,其特征在于,所述语义搜索装置还包括判断单元,用于:
如果识别到用户意图,则对所述搜索信息进行语义及属性扩展并返回搜索结果;
如果无法识别到所述用户意图并且搜索有结果,则对所述搜索信息进行同义扩展并提供同义词;
如果无法识别到所述用户意图且搜索没有结果,则对所述搜索信息进行纠错,并重新搜索。
9.一种存储一个或多个程序的计算机可读存储介质,其特征在于,所述一个或多个程序包括指令,所述指令当被计算机执行时使所述计算机执行如权利要求1-4任一项所述的基于知识图谱的语义搜索方法。
10.一种包含指令的计算机程序产品,其特征在于,当所述指令在计算机上运行时,使得所述计算机执行如权利要求1-4任一项所述的基于知识图谱的语义搜索方法。
11.一种基于知识图谱的基于知识图谱的语义搜索装置,其特征在于,包括:处理器和存储器,存储器用于存储程序,处理器调用存储器存储的程序,以执行如权利要求1-4任一项所述的基于知识图谱的语义搜索方法。
CN201811231211.0A 2018-10-22 2018-10-22 基于知识图谱的语义搜索方法及装置 Pending CN109522465A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201811231211.0A CN109522465A (zh) 2018-10-22 2018-10-22 基于知识图谱的语义搜索方法及装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201811231211.0A CN109522465A (zh) 2018-10-22 2018-10-22 基于知识图谱的语义搜索方法及装置

Publications (1)

Publication Number Publication Date
CN109522465A true CN109522465A (zh) 2019-03-26

Family

ID=65772433

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201811231211.0A Pending CN109522465A (zh) 2018-10-22 2018-10-22 基于知识图谱的语义搜索方法及装置

Country Status (1)

Country Link
CN (1) CN109522465A (zh)

Cited By (40)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109977294A (zh) * 2019-04-03 2019-07-05 三角兽(北京)科技有限公司 信息/查询处理装置、查询处理/文本查询方法、存储介质
CN110019687A (zh) * 2019-04-11 2019-07-16 宁波深擎信息科技有限公司 一种基于知识图谱的多意图识别***、方法、设备及介质
CN110134796A (zh) * 2019-04-19 2019-08-16 平安科技(深圳)有限公司 基于知识图谱的临床试验检索方法、装置、计算机设备及存储介质
CN110147437A (zh) * 2019-05-23 2019-08-20 北京金山数字娱乐科技有限公司 一种基于知识图谱的搜索方法及装置
CN110232920A (zh) * 2019-06-21 2019-09-13 百度在线网络技术(北京)有限公司 语音处理方法和装置
CN110245240A (zh) * 2019-05-31 2019-09-17 国网电子商务有限公司 一种问题数据答案的确定方法及装置
CN110246496A (zh) * 2019-07-01 2019-09-17 珠海格力电器股份有限公司 语音识别方法、***、计算机设备及储存介质
CN110264994A (zh) * 2019-07-02 2019-09-20 珠海格力电器股份有限公司 一种语音合成方法、电子设备及智能家居***
CN110502613A (zh) * 2019-08-12 2019-11-26 腾讯科技(深圳)有限公司 一种模型训练方法、智能检索方法、装置和存储介质
CN110659366A (zh) * 2019-09-24 2020-01-07 Oppo广东移动通信有限公司 语义解析方法、装置、电子设备以及存储介质
CN110704743A (zh) * 2019-09-30 2020-01-17 北京科技大学 一种基于知识图谱的语义搜索方法及装置
CN110795417A (zh) * 2019-10-30 2020-02-14 北京明略软件***有限公司 一种知识图谱的存储***及方法
CN111160564A (zh) * 2019-12-17 2020-05-15 电子科技大学 一种基于特征张量的中文知识图谱表示学习方法
CN111274332A (zh) * 2020-01-19 2020-06-12 中国科学院计算技术研究所 一种基于知识图谱的专利智能检索方法及***
CN111309944A (zh) * 2020-01-20 2020-06-19 同方知网(北京)技术有限公司 一种基于图数据库的数字人文搜索算法
CN111353017A (zh) * 2020-02-20 2020-06-30 上海智臻智能网络科技股份有限公司 智能交互方法和装置
CN111475623A (zh) * 2020-04-09 2020-07-31 北京北大软件工程股份有限公司 基于知识图谱的案件信息语义检索方法及装置
CN111475722A (zh) * 2020-03-31 2020-07-31 百度在线网络技术(北京)有限公司 用于发送信息的方法和装置
CN111552821A (zh) * 2020-05-14 2020-08-18 北京华宇元典信息服务有限公司 法律意图搜索方法、法律意图搜索装置和电子设备
CN111708943A (zh) * 2020-06-12 2020-09-25 北京搜狗科技发展有限公司 一种搜索结果展示方法、装置和用于搜索结果展示的装置
CN111737499A (zh) * 2020-07-27 2020-10-02 平安国际智慧城市科技股份有限公司 基于自然语言处理的数据搜索方法及相关设备
CN111782942A (zh) * 2020-06-24 2020-10-16 支付宝(杭州)信息技术有限公司 基于品牌保护的搜索方法及装置
CN111859974A (zh) * 2019-04-22 2020-10-30 广东小天才科技有限公司 一种结合知识图谱的语义消歧方法和装置、智能学习设备
CN111930913A (zh) * 2020-08-14 2020-11-13 上海茂声智能科技有限公司 一种基于知识图谱的问答方法、***、装置、设备及介质
CN111930891A (zh) * 2020-07-31 2020-11-13 中国平安人寿保险股份有限公司 基于知识图谱的检索文本扩展方法及相关装置
CN112069808A (zh) * 2020-09-28 2020-12-11 深圳壹账通智能科技有限公司 融资风控方法、装置、计算机设备及存储介质
CN112131461A (zh) * 2020-09-09 2020-12-25 重庆易宠科技有限公司 一种商品搜索方法、***、终端及计算机可读存储介质
CN112231445A (zh) * 2020-03-27 2021-01-15 北京来也网络科技有限公司 结合rpa与ai的搜索方法、装置、设备及存储介质
CN112380352A (zh) * 2020-10-28 2021-02-19 中国商用飞机有限责任公司北京民用飞机技术研究中心 一种交互式检索方法、装置、计算机设备及存储介质
CN112507123A (zh) * 2020-12-04 2021-03-16 北京搜狗科技发展有限公司 一种数据处理方法及装置
CN112632225A (zh) * 2020-12-29 2021-04-09 天津汇智星源信息技术有限公司 基于案事件知识图谱的语义搜索方法、装置和电子设备
CN112685452A (zh) * 2020-12-31 2021-04-20 特赞(上海)信息科技有限公司 企业案例检索方法、装置、设备和存储介质
CN112749246A (zh) * 2019-10-30 2021-05-04 腾讯科技(深圳)有限公司 搜索短语的评估方法、装置、服务器及存储介质
CN112765447A (zh) * 2021-01-27 2021-05-07 维沃移动通信有限公司 数据搜索方法、装置和电子设备
CN112784058A (zh) * 2021-01-11 2021-05-11 北京欧拉认知智能科技有限公司 一种基于动态图谱的实体相关性获取方法
CN113139387A (zh) * 2020-01-17 2021-07-20 华为技术有限公司 语义纠错方法、电子设备及存储介质
CN113221578A (zh) * 2021-04-30 2021-08-06 平安科技(深圳)有限公司 疾病实体检索方法、装置、设备及介质
CN113434696A (zh) * 2021-06-28 2021-09-24 平安科技(深圳)有限公司 基于知识图谱的搜索结果更新方法、装置和计算机设备
CN114003735A (zh) * 2021-12-24 2022-02-01 北京道达天际科技有限公司 基于情报文档面向知识图谱问答的实体消歧方法
CN114186075A (zh) * 2021-12-14 2022-03-15 武汉数文科技有限公司 一种面向文化领域知识图谱的语义搜索方法

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105095195A (zh) * 2015-07-03 2015-11-25 北京京东尚科信息技术有限公司 基于知识图谱的人机问答方法和***
CN105550190A (zh) * 2015-06-26 2016-05-04 许昌学院 面向知识图谱的跨媒体检索***
CN106874261A (zh) * 2017-03-17 2017-06-20 中国科学院软件研究所 一种基于语义三角的领域知识图谱及查询方法

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105550190A (zh) * 2015-06-26 2016-05-04 许昌学院 面向知识图谱的跨媒体检索***
CN105095195A (zh) * 2015-07-03 2015-11-25 北京京东尚科信息技术有限公司 基于知识图谱的人机问答方法和***
CN106874261A (zh) * 2017-03-17 2017-06-20 中国科学院软件研究所 一种基于语义三角的领域知识图谱及查询方法

Cited By (57)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109977294A (zh) * 2019-04-03 2019-07-05 三角兽(北京)科技有限公司 信息/查询处理装置、查询处理/文本查询方法、存储介质
CN110019687A (zh) * 2019-04-11 2019-07-16 宁波深擎信息科技有限公司 一种基于知识图谱的多意图识别***、方法、设备及介质
CN110019687B (zh) * 2019-04-11 2021-03-23 宁波深擎信息科技有限公司 一种基于知识图谱的多意图识别***、方法、设备及介质
CN110134796A (zh) * 2019-04-19 2019-08-16 平安科技(深圳)有限公司 基于知识图谱的临床试验检索方法、装置、计算机设备及存储介质
CN110134796B (zh) * 2019-04-19 2023-06-02 平安科技(深圳)有限公司 基于知识图谱的临床试验检索方法、装置、计算机设备及存储介质
CN111859974A (zh) * 2019-04-22 2020-10-30 广东小天才科技有限公司 一种结合知识图谱的语义消歧方法和装置、智能学习设备
CN110147437A (zh) * 2019-05-23 2019-08-20 北京金山数字娱乐科技有限公司 一种基于知识图谱的搜索方法及装置
CN110245240A (zh) * 2019-05-31 2019-09-17 国网电子商务有限公司 一种问题数据答案的确定方法及装置
CN110232920A (zh) * 2019-06-21 2019-09-13 百度在线网络技术(北京)有限公司 语音处理方法和装置
CN110246496A (zh) * 2019-07-01 2019-09-17 珠海格力电器股份有限公司 语音识别方法、***、计算机设备及储存介质
CN110264994A (zh) * 2019-07-02 2019-09-20 珠海格力电器股份有限公司 一种语音合成方法、电子设备及智能家居***
CN110502613A (zh) * 2019-08-12 2019-11-26 腾讯科技(深圳)有限公司 一种模型训练方法、智能检索方法、装置和存储介质
CN110502613B (zh) * 2019-08-12 2022-03-08 腾讯科技(深圳)有限公司 一种模型训练方法、智能检索方法、装置和存储介质
CN110659366A (zh) * 2019-09-24 2020-01-07 Oppo广东移动通信有限公司 语义解析方法、装置、电子设备以及存储介质
CN110704743A (zh) * 2019-09-30 2020-01-17 北京科技大学 一种基于知识图谱的语义搜索方法及装置
CN110704743B (zh) * 2019-09-30 2022-02-18 北京科技大学 一种基于知识图谱的语义搜索方法及装置
CN112749246B (zh) * 2019-10-30 2023-11-28 腾讯科技(深圳)有限公司 搜索短语的评估方法、装置、服务器及存储介质
CN112749246A (zh) * 2019-10-30 2021-05-04 腾讯科技(深圳)有限公司 搜索短语的评估方法、装置、服务器及存储介质
CN110795417A (zh) * 2019-10-30 2020-02-14 北京明略软件***有限公司 一种知识图谱的存储***及方法
CN111160564A (zh) * 2019-12-17 2020-05-15 电子科技大学 一种基于特征张量的中文知识图谱表示学习方法
CN113139387A (zh) * 2020-01-17 2021-07-20 华为技术有限公司 语义纠错方法、电子设备及存储介质
CN111274332A (zh) * 2020-01-19 2020-06-12 中国科学院计算技术研究所 一种基于知识图谱的专利智能检索方法及***
CN111309944A (zh) * 2020-01-20 2020-06-19 同方知网(北京)技术有限公司 一种基于图数据库的数字人文搜索算法
CN111309944B (zh) * 2020-01-20 2023-07-14 同方知网数字出版技术股份有限公司 一种基于图数据库的数字人文搜索方法
CN111353017A (zh) * 2020-02-20 2020-06-30 上海智臻智能网络科技股份有限公司 智能交互方法和装置
CN112231445A (zh) * 2020-03-27 2021-01-15 北京来也网络科技有限公司 结合rpa与ai的搜索方法、装置、设备及存储介质
CN111475722A (zh) * 2020-03-31 2020-07-31 百度在线网络技术(北京)有限公司 用于发送信息的方法和装置
CN111475623A (zh) * 2020-04-09 2020-07-31 北京北大软件工程股份有限公司 基于知识图谱的案件信息语义检索方法及装置
CN111475623B (zh) * 2020-04-09 2023-08-22 北京北大软件工程股份有限公司 基于知识图谱的案件信息语义检索方法及装置
CN111552821A (zh) * 2020-05-14 2020-08-18 北京华宇元典信息服务有限公司 法律意图搜索方法、法律意图搜索装置和电子设备
CN111708943B (zh) * 2020-06-12 2024-03-01 北京搜狗科技发展有限公司 一种搜索结果展示方法、装置和用于搜索结果展示的装置
CN111708943A (zh) * 2020-06-12 2020-09-25 北京搜狗科技发展有限公司 一种搜索结果展示方法、装置和用于搜索结果展示的装置
CN111782942A (zh) * 2020-06-24 2020-10-16 支付宝(杭州)信息技术有限公司 基于品牌保护的搜索方法及装置
CN111782942B (zh) * 2020-06-24 2024-04-19 支付宝(杭州)信息技术有限公司 基于品牌保护的搜索方法及装置
CN111737499A (zh) * 2020-07-27 2020-10-02 平安国际智慧城市科技股份有限公司 基于自然语言处理的数据搜索方法及相关设备
CN111930891B (zh) * 2020-07-31 2024-02-02 中国平安人寿保险股份有限公司 基于知识图谱的检索文本扩展方法及相关装置
CN111930891A (zh) * 2020-07-31 2020-11-13 中国平安人寿保险股份有限公司 基于知识图谱的检索文本扩展方法及相关装置
CN111930913A (zh) * 2020-08-14 2020-11-13 上海茂声智能科技有限公司 一种基于知识图谱的问答方法、***、装置、设备及介质
CN112131461A (zh) * 2020-09-09 2020-12-25 重庆易宠科技有限公司 一种商品搜索方法、***、终端及计算机可读存储介质
CN112069808A (zh) * 2020-09-28 2020-12-11 深圳壹账通智能科技有限公司 融资风控方法、装置、计算机设备及存储介质
WO2022088409A1 (zh) * 2020-10-28 2022-05-05 中国商用飞机有限责任公司北京民用飞机技术研究中心 一种交互式检索方法、装置、计算机设备及存储介质
CN112380352A (zh) * 2020-10-28 2021-02-19 中国商用飞机有限责任公司北京民用飞机技术研究中心 一种交互式检索方法、装置、计算机设备及存储介质
CN112507123A (zh) * 2020-12-04 2021-03-16 北京搜狗科技发展有限公司 一种数据处理方法及装置
WO2022116527A1 (zh) * 2020-12-04 2022-06-09 北京搜狗科技发展有限公司 一种数据处理方法及装置
CN112632225B (zh) * 2020-12-29 2022-08-30 天津汇智星源信息技术有限公司 基于案事件知识图谱的语义搜索方法、装置和电子设备
CN112632225A (zh) * 2020-12-29 2021-04-09 天津汇智星源信息技术有限公司 基于案事件知识图谱的语义搜索方法、装置和电子设备
CN112685452B (zh) * 2020-12-31 2021-08-10 特赞(上海)信息科技有限公司 企业案例检索方法、装置、设备和存储介质
CN112685452A (zh) * 2020-12-31 2021-04-20 特赞(上海)信息科技有限公司 企业案例检索方法、装置、设备和存储介质
CN112784058A (zh) * 2021-01-11 2021-05-11 北京欧拉认知智能科技有限公司 一种基于动态图谱的实体相关性获取方法
CN112765447A (zh) * 2021-01-27 2021-05-07 维沃移动通信有限公司 数据搜索方法、装置和电子设备
CN113221578B (zh) * 2021-04-30 2022-11-25 平安科技(深圳)有限公司 疾病实体检索方法、装置、设备及介质
CN113221578A (zh) * 2021-04-30 2021-08-06 平安科技(深圳)有限公司 疾病实体检索方法、装置、设备及介质
CN113434696A (zh) * 2021-06-28 2021-09-24 平安科技(深圳)有限公司 基于知识图谱的搜索结果更新方法、装置和计算机设备
CN114186075A (zh) * 2021-12-14 2022-03-15 武汉数文科技有限公司 一种面向文化领域知识图谱的语义搜索方法
CN114186075B (zh) * 2021-12-14 2024-04-26 武汉数文科技有限公司 一种面向文化领域知识图谱的语义搜索方法
CN114003735B (zh) * 2021-12-24 2022-03-18 北京道达天际科技有限公司 基于情报文档面向知识图谱问答的实体消歧方法
CN114003735A (zh) * 2021-12-24 2022-02-01 北京道达天际科技有限公司 基于情报文档面向知识图谱问答的实体消歧方法

Similar Documents

Publication Publication Date Title
CN109522465A (zh) 基于知识图谱的语义搜索方法及装置
Fensel et al. Knowledge graphs
CN112437917B (zh) 使用自主代理和词库的数据库的自然语言接口
CN110609902B (zh) 一种基于融合知识图谱的文本处理方法及装置
US8965872B2 (en) Identifying query formulation suggestions for low-match queries
US9183511B2 (en) System and method for universal translating from natural language questions to structured queries
US9652799B2 (en) Product recommendation with product review analysis
US10303798B2 (en) Question answering from structured and unstructured data sources
US9846901B2 (en) Product recommendation with ontology-linked product review
US10025819B2 (en) Generating a query statement based on unstructured input
US10783159B2 (en) Question answering with entailment analysis
KR101793222B1 (ko) 어플리케이션 검색들을 가능하게 하기 위해 사용되는 검색 인덱스의 업데이트
CN109240901B (zh) 性能分析方法、性能分析装置、存储介质和电子设备
US9280535B2 (en) Natural language querying with cascaded conditional random fields
US20180232443A1 (en) Intelligent matching system with ontology-aided relation extraction
CN111417940B (zh) 用于生成问题答案的方法、***和介质
US8880512B2 (en) Method, apparatus and system, for rewriting search queries
US20170371923A1 (en) Template-driven structured query generation
CN104915413A (zh) 一种健康检测方法及***
JP2013543172A (ja) 質問に対する解答を自動的に生成するための方法、システム、およびコンピュータ・プログラム
KR100980579B1 (ko) 온톨로지에 대한 자연어 질의 검색 방법 및 시스템
JP2009151760A (ja) オブジェクト間競合指標計算方法およびシステム
CN105808590A (zh) 搜索引擎实现方法、搜索方法以及装置
KR20100075454A (ko) 간접 화법 내에서의 시맨틱 관계의 식별
US20200065395A1 (en) Efficient leaf invalidation for query execution

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication
RJ01 Rejection of invention patent application after publication

Application publication date: 20190326