CN111061750A - 一种查询处理方法、装置及计算机可读存储介质 - Google Patents

一种查询处理方法、装置及计算机可读存储介质 Download PDF

Info

Publication number
CN111061750A
CN111061750A CN201911299566.8A CN201911299566A CN111061750A CN 111061750 A CN111061750 A CN 111061750A CN 201911299566 A CN201911299566 A CN 201911299566A CN 111061750 A CN111061750 A CN 111061750A
Authority
CN
China
Prior art keywords
query
entity
entities
information
knowledge
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201911299566.8A
Other languages
English (en)
Inventor
黄颖彪
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Guangdong Oppo Mobile Telecommunications Corp Ltd
Original Assignee
Guangdong Oppo Mobile Telecommunications Corp Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Guangdong Oppo Mobile Telecommunications Corp Ltd filed Critical Guangdong Oppo Mobile Telecommunications Corp Ltd
Priority to CN201911299566.8A priority Critical patent/CN111061750A/zh
Publication of CN111061750A publication Critical patent/CN111061750A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/23Updating
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/28Databases characterised by their database models, e.g. relational or object models
    • G06F16/284Relational databases
    • G06F16/288Entity relationship models
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/33Querying
    • G06F16/3331Query processing
    • G06F16/3332Query translation
    • G06F16/3334Selection or weighting of terms from queries, including natural language queries
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/36Creation of semantic tools, e.g. ontology or thesauri
    • G06F16/367Ontology

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Databases & Information Systems (AREA)
  • Data Mining & Analysis (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Computational Linguistics (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Animal Behavior & Ethology (AREA)
  • Artificial Intelligence (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本申请提供了一种查询处理方法、装置及计算机可读存储介质,获取外部在信息查询界面输入的查询实体;根据包括多个实体以及多个实体之间的关联关系的知识图谱,查询与查询实体相关联的目标信息实体;基于目标信息实体在信息查询界面在信息查询界面输出查询结果;在检测到知识图谱更新事件时,对知识图谱中的关联关系进行更新。通过本申请方案的实施,采用知识图谱来全面、准确地推理出与所输入的查询数据直接关联或潜在关联的信息结果,有效增强了信息查询能力,并提高了信息查询结果的有效性;而且根据知识图谱更新事件进行知识图谱中关联关系的更新,进一步提升了信息查询的准确性。

Description

一种查询处理方法、装置及计算机可读存储介质
技术领域
本申请涉及电子技术领域,尤其涉及一种查询处理方法、装置及计算机可读存储介质。
背景技术
终端用户通常通过在信息查询界面输入查询数据,来获取以期的查询结果,例如应用、主题、游戏、歌曲等。目前,通常采用基于关键字段进行信息查询的方案,也即通过用户输入的查询数据中的关键字段进行全库查找,来将与关键字段相匹配的结果返回给用户。然而,在实际应用中,采用这种信息查询方式要求用户所输入的查询数据应较为准确,否则将较为容易超出可查询范围,导致不能输出查询结果或所输出的查询结果并非用户所期望的结果,从而信息查询的能力较为局限,并且信息查询结果的有效性较差。
发明内容
本申请实施例提供了一种查询处理方法、装置及计算机可读存储介质,至少能够解决相关技术中基于查询数据中的关键字段进行信息查询,所导致的信息查询的能力较为局限、信息查询结果的有效性较差的问题。
本申请实施例第一方面提供了一种查询处理方法,包括:
获取在信息查询界面输入的查询实体;
根据知识图谱查询与所述查询实体相关联的目标信息实体;其中,所述知识图谱包括多个实体以及所述多个实体之间的关联关系;
基于所述目标信息实体在所述信息查询界面输出查询结果;
在检测到知识图谱更新事件时,对所述知识图谱中的所述关联关系进行更新。
本申请实施例第二方面提供了一种查询处理。装置,包括:
获取模块,用于获取在信息查询界面输入的查询实体;
查询模块,用于根据知识图谱查询与所述查询实体相关联的目标信息实体;其中,所述知识图谱包括多个实体以及所述多个实体之间的关联关系;
输出模块,用于基于所述目标信息实体在所述信息查询界面输出查询结果;
更新模块,用于在检测到知识图谱更新事件时,对所述知识图谱中的所述关联关系进行更新。
本申请实施例第三方面提供了一种电子装置,包括:存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,处理器执行计算机程序时,实现上述本申请实施例第一方面提供的查询处理方法中的各步骤。
本申请实施例第四方面提供了一种计算机可读存储介质,其上存储有计算机程序,计算机程序被处理器执行时,实现上述本申请实施例第一方面提供的查询处理方法中的各步骤。
由上可见,根据本申请方案所提供的查询处理方法、装置及计算机可读存储介质,获取外部在信息查询界面输入的查询实体;根据包括多个实体以及多个实体之间的关联关系的知识图谱,查询与查询实体相关联的目标信息实体;基于目标信息实体在信息查询界面输出查询结果;在检测到知识图谱更新事件时,对知识图谱中的关联关系进行更新。通过本申请方案的实施,采用知识图谱来全面、准确地推理出与所输入的查询数据直接关联或潜在关联的信息结果,有效增强了信息查询能力,并提高了信息查询结果的有效性;而且根据知识图谱更新事件进行知识图谱中关联关系的更新,进一步提升了信息查询的准确性。
附图说明
图1为本申请第一实施例提供的查询处理方法的基本流程示意图;
图2为本申请第一实施例提供的知识图谱生成方法的流程示意图;
图3为本申请第一实施例提供的知识图谱示意图;
图4为本申请第一实施例提供的一种信息实体查询方法的流程示意图;
图5为本申请第一实施例提供的另一种信息实体查询方法的流程示意图;
图6为本申请第二实施例提供的查询处理方法的细化流程示意图;
图7为本申请第三实施例提供的一种查询处理装置的程序模块示意图;
图8为本申请第三实施例提供的另一种查询处理装置的程序模块示意图;
图9为本申请第四实施例提供的电子装置的结构示意图。
具体实施方式
为使得本申请的发明目的、特征、优点能够更加的明显和易懂,下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本申请一部分实施例,而非全部实施例。基于本申请中的实施例,本领域技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本申请保护的范围。
为了解决相关技术中基于查询数据中的关键字段进行信息查询,所导致的信息查询的能力较为局限、信息查询结果的有效性较差的技术问题,本申请第一实施例提供了一种查询处理方法,如图1为本实施例提供的查询处理方法的基本流程图,该查询处理方法包括以下的步骤:
步骤101、获取在信息查询界面输入的查询实体。
具体的,在本实施例中,这里的信息查询界面可以为应用商店、主题商店、游戏商店或淘宝等终端上的信息查询应用的信息查询界面,而查询实体则为外部在信息查询界面手动输入或语音输入的查询数据。在实际应用中,查询实体可以是与信息查询结果的名称直接或潜在关联的字段,关联于用户的搜索意愿。
在本实施例一种可选的实施方式中,在获取在信息查询界面输入的查询实体之前,还可以包括:获取信息查询界面所归属的信息查询应用的应用属性信息,基于所获取的应用属性信息判断是否满足查询处理触发条件;若是,则执行获取在信息查询界面输入的查询实体的步骤。
具体的,在实际应用中,为了提升终端执行本实施例的查询处理流程的合理性,在当前的信息查询应用的应用属性信息满足特定触发条件时,才触发该查询处理流程。应当说明的是,应用属性信息可以包括应用类型、应用管制状态等。
步骤102、根据知识图谱查询与查询实体相关联的目标信息实体。
具体的,本实施例的知识图谱为包括多个实体以及多个实体之间的关联关系的知识体系。知识图谱的构建源自海量数据的整合处理,基于知识图谱构建起来的查询服务,与基于关键字段匹配的传统查询引擎相比,能够支持更自然、复杂的查询输入,可以更为全面、深入的理解查询信息的语义。应当理解的是,本实施例的目标信息实体可以是应用软件、游戏、主题等。
应当说明的是,在本实施例中,可以从数据库中抓取不同的知识数据,然后对这些知识数据进行语义处理,例如实体抽取、清洗、映射和消歧等,以保证数据质量。实体抽取是指从分布的、异构的文本中提取出特定的事实信息,将其中隐含的语义提取出来并以更为结构化、更为清晰的形式表示;语义清洗是对不符合要求的数据进行过滤,例如对重复数据、错误数据、残缺数据等进行过滤;语义映射是指将词映射到一个语义空间得到向量;语义消歧则可以看做一个分类问题,一个词W有K个含义,对W消歧就是确定W在特定句子中究竟使用了哪一个含义,即把W分到K类中的一个,分类的依据可以是和W邻近的词,即W的上下文C。在对外部的知识数据进行语义处理之后,再按照特定业务逻辑对实体进行分类和语义关联,形成意义明确的知识实体关系,如此,构建完成知识图谱。
还应当理解的是,知识图谱可以以“实体-关系-实体”三元组的知识表现形式存在,在实际应用中,还可以通过知识推理及进一步挖掘隐含的知识,对知识图谱进行进化更新,从而丰富、扩展知识图谱。
在本实施例一种可选的实施方式中,在根据知识图谱查询与查询实体相关联的目标信息实体之前,还包括:对查询实体进行语义分析;根据语义分析结果判断查询实体是否处于信息查询界面的查询感知范围;在不处于查询感知范围时,执行根据知识图谱查询与查询实体相关联的目标信息实体的步骤。
具体的,在本实施例中,查询感知范围包括所有语义与信息实体的语义处于同一层级(或领域)的查询实体,例如包含查询结果的名称的查询实体处于一个层级、包含查询结果的功能属性的查询实体则处于另一层级,对于处于查询感知范围的查询实体,可以与信息实体完全相同,或是信息实体中的部分关键字段。本实施例基于查询实体的语义分析结果,确定当前查询实体所处层级,然后基于所确定的层级判断信息查询应用是否能以传统方式来对查询实体进行感知,当判定为否时触发基于知识图谱查询目标信息实体的步骤,以此,可以避免在非必要情况下盲目执行知识图谱查询所带来的终端处理性能浪费和信息查询整体效率的降低。
在本实施例的一些实施方式中,为了进一步提升信息查询能力和信息查询结果的全面性和准确性,在获取在信息查询界面输入的查询实体之后,还可以对查询实体进行拆分,得到多个分词,然后根据预设的字段组合规则,将多个分词进行重组,得到多个不同的查询实体,相对应的,再根据知识图谱查询与多个不同的查询实体分别相关联的目标信息实体。
步骤103、基于目标信息实体在信息查询界面输出查询结果。
具体的,采用知识图谱来全面、准确地推理出与查询请求直接关联或潜在关联的查询结果,有效增强了信息查询应用的信息查询能力,并提高了信息查询结果的有效性。本实施例以应用查询为例,例如:美剧“权力的游戏”在腾讯视频播放,当前,在软件商店搜索“权力的游戏”,由于该领域的查询数据不属于一般软件商店的查询感知范围,所以,如果用户搜索“权力的游戏”,不一定在搜索结果中看到腾讯视频。但通过引入知识图谱,而且通过实时推理功能,通过发掘用户输入与应用软件的潜在关系,能够找出“权力的游戏”与腾讯视频的关系。而且,采用这个方法,还可以找出更深层次的推荐关系,例如“权力的游戏”中有一个热门人物叫“龙母”,如果用户输入查询数据“龙母”,通过知识推理关系,也可以找出腾讯视频跟本query相关,为用户提供惊喜。
步骤104、在检测到知识图谱更新事件时,对知识图谱中的关联关系进行更新。
具体的,在实际应用中,知识图谱中的实体之间的关联关系并非长期保持稳定,从而目前通常是采用人工的方式来对知识图谱进行实体之间关联关系进行监控,并根据人工监控结果来进行知识图谱更新,然而采用人工监控的方式的效率和准确性均较为有限。基于此,本实施例自动对知识图谱更新事件进行检测,并根据知识图谱更新事件及时进行知识图谱中关联关系的更新,保证了知识图谱更新的效率和准确性,进一步提升了信息查询的准确性。应当说明的是,本实施例中对知识图谱进行更新可以包括知识图谱中关联关系的新建和解除。其中,关联关系的新建是指针对知识图谱中已存在的实体新建关联关系,这里新建关联关系可以是新建已存在的多个实体之间的关联关系,也可以是新建已存在的一个实体与新增实体之间的关联关系;而关联关系的解除则是指对知识图谱中已存在的实体之间的关联关系进行解除。
在本实施例一种可选的实施方式中,在检测到知识图谱更新事件时,对知识图谱中的关联关系进行更新包括:实时获取知识图谱中所有查询实体的时效信息;检测在知识图谱中的累积存在时长超过时效信息所指示的效用发挥时长的查询实体;在检测到累积存在时长超过效用发挥时长的查询实体时,解除所检测到的查询实体与对应关联的目标信息实体之间的关联关系。
具体的,本实施例中,实时获取查询实体的效用发挥时长,并在监控到查询实体效用发挥时长到达时,将其与原先关联的信息实体之间的关联关系进行解除。应当理解的是,本实施例的效用发挥时长可以是查询实体的具体有效时长或保持特定活跃度/热度的时长,在查询实体失效或丧失特定活跃度/热度时,继续对该查询实体进行信息实体关联将导致错误关联或无意义关联,从而在这种情况下对该查询实体与目标信息实体的关联关系进行解除,一方面避免无用或错误的查询结果输出,另一方面还可以精简知识图谱的数据量。例如,以影视作品“在远方”作为查询实体为例,在该影视作品即将上映时,将具备该影视作品版权的影视类APP“腾讯视频”、“优酷视频”以及“爱奇艺”作为目标信息实体,并建立查询实体与目标信息实体的关联关系,然而该影视作品的所有剧集可能在一段时间内被影视类APP放映完毕,从而影视类APP将对该影视作品进行下架,从而本实施例将该影视作品的整个放映周期作为其时效信息,在检测到该影视作品在知识图谱中所存在的时长到达该放映周期时,在知识图谱上对该影视作品与对应影视类APP之间的关联关系进行解除。
应当说明的是,在实际应用中,当目标信息实体同时有多个时,查询结果的显示方式可以有多种,其中一种情况下,可以获取各目标信息实体的用户体验评级,然后根据用户体验评级对所有目标信息实体进行从高到低排序,然后根据排序结果在信息查询界面上对所有目标信息实体进行顺序展示。
在另一种情况下,在目标信息实体有多个时,基于目标信息实体在信息查询界面输出查询结果包括:分别获取对应于各目标信息实体的使用限制等级,以及外部的权限验证等级;筛选使用限制等级与权限验证等级相匹配的目标信息实体;将所筛选出的目标信息实体作为查询结果在信息查询界面进行展示。
具体的,在实际应用中,不同用户群体对不同信息的接受程度有所不同,以应用程序为例,场面较为血腥的游戏应用由于会对老人或小孩等心理承受能力较差的群体造成不适,或开放式社交应用由于会使得分辨能力、自控能力较差的用户群体遭受蒙骗或沉迷其中等。基于此,本实施例在查询到所有目标信息实体之后,并非直接将所有目标信息实体均进行展示,而是对用户进行权限验证,将所获取的权限验证等级与各目标信息实体的使用限制等级进行匹配,将与用户权限相匹配的目标信息实体进行结果输出,而滤除不适宜于用户的目标信息实体。从而本实施例通过差异化结果展示方式,可以针对不同权限等级的用户对应进行结果展示,提升了交互友好性,避免了潜在的查询结果对用户造成负面影响的风险。
如图2所示为本实施例提供的一种知识图谱生成方法的流程示意图,在本实施例一种可选的实施方式中,在根据知识图谱查询与查询实体相关联的目标信息实体之前,还具体包括以下步骤:
步骤201、将多个实体分别归纳至不同层级的实体集合;
步骤202、对相邻层级的实体集合内的实体进行直接关联,得到子知识图谱;
步骤203、基于子知识图谱之间所包括的共同实体,对不同的子知识图谱内间隔一个层级的实体进行间接关联,生成知识图谱。
具体的,在本实施例中,不同领域的实体归于不同的层级,例如包含查询结果的名称的所有实体为同一层级,包含查询结果的功能属性的所有实体为同一层级,其中相邻层级的实体之间可直接关联,而间隔一个层级的实体则可间接关联,例如实体A与实体B直接关联、实体B与实体C直接关联,那么实体A与实体C通过实体B间接关联,从而,实体A与实体B、实体B与实体C是相邻层级的实体,而实体A与实体C则为间隔一个层级的实体。本实施例将不同实体之间通过直接关联和间接关联,而形成所有实体的整体关联,得到知识图谱。
本实施例下面以一个具体的例子对上述知识图谱的生成过程进行描述,这里的信息查询应用为应用商店。首先,获取影视类APP与影视作品的关系,建立影视类APP与影视作品的子知识图谱A;然后获取影视作品与作品中人物角色的关系,建立影视作品和人物角色的子知识图谱B;再以影视作品作为连接点,将影视类APP与影视作品的子知识图谱A和影视作品和人物角色的子知识图谱B两者进行关联,制作出包含影视作品,影视类APP和人物角色的知识图谱C。如图3所示为本实施例提供的一种知识图谱示意图,图中对影视作品、影视类APP和人物角色三种不同层级的实体进行了关联,针对任何查询实体,按照知识图谱中的关联关系即可找到对应的影视类APP进行应用推荐。请继续参阅图3,例如用户搜索“龙母”,通过知识推理关系,可知其为影视作品“权利的游戏”中的人物角色,然后再进一步通过知识推理关系关联得到具有该影视作品版权的影视类APP“腾讯视频”。
在本实施例一种可选的实施方式中,根据知识图谱查询与查询实体相关联的目标信息实体包括:根据知识图谱对查询实体进行查询;在未查询到结果时,对查询实体进行转化处理;根据知识图谱查询与经过转化处理后的查询实体相关联的目标信息实体。
具体的,在实际应用中,外部输入的查询实体可能有误而导致未能查询成功,从而本实施例基于预设转化规则对查询实体进行转化,以期进行有效查询。在本实施例中,对查询实体进行转化处理包括但不限于以下几种方式:对查询实体进行同义扩展处理、对查询实体进行文字纠错处理、对查询实体进行语言翻译处理。其中,同义扩展处理是指基于原始查询实体来获取可等同替代的同义查询实体,而文字纠错处理是对原始查询实体中的错误字段进行更正,而语言翻译处理时将原始查询实体由一种语言翻译成另一种语言。
在本实施例一种可选的实施方式中,根据知识图谱查询与查询实体相关联的目标信息实体包括:将查询实体进行关键词划分,得到多个子查询实体;基于多个子查询实体,在知识图谱上查询与查询实体相关联的目标信息实体。
具体的,用户所输入的查询实体的复杂度有所不同,在实际应用中,会存在查询实体由多个关键词组成,本实施例为了保证信息查询的准确性,将查询实体进行关键词划分,并基于划分的子查询实体在知识图谱上查询目标信息实体。
如图4所示为本实施例提供的一种信息实体查询方法的流程示意图,进一步地,在本实施例一种可选的实施方式中,基于多个子查询实体,在知识图谱上查询与查询实体相关联的目标信息实体具体包括以下步骤:
步骤401、对多个子查询实体进行查询优先级排序;
步骤402、在知识图谱上查询与查询优先级排序最高的子查询实体相关联的信息实体;
步骤403、将根据优先级排序最高的子查询实体查询得到的信息实体,确定为与查询实体相关联的目标信息实体。
具体的,在本实施例中,查询实体中不同关键词所提供的信息有效程度有所不同,本实施例基于信息有效程度来对各子查询实体进行查询优先级排序,信息有效程度越高的子查询实体的查询优先级越高,然后仅针对查询优先级最高的子查询实体在知识图谱上进行信息实体查询,以期提高信息实体查询的准确性以及避免向用户推荐无关信息。
如图5所示为本实施例提供的另一种信息实体查询方法的流程示意图,进一步地,在本实施例另一种可选的实施方式中,基于多个子查询实体,在知识图谱上查询与查询实体相关联的目标信息实体具体包括以下步骤:
步骤501、在知识图谱上分别查询与多个子查询实体相关联的信息实体;
步骤502、对查询得到的所有信息实体进行推荐优先级排序;
步骤503、将推荐优先级排序最高的信息实体,确定为与查询实体相关联的目标信息实体。
具体的,在本实施例中,还可以分别对所划分出的多个子查询实体分别在知识图谱上进行信息实体查询,从而可以查询得到多个信息实体。然而,不同信息实体与用户实际需求的契合度有所不同,从而本实施例对信息实体进行推荐优先级排序,并基于排序结果选择信息实体确定为与查询实体相关联的目标信息实体,在实际应用中,优选的可以将推荐优先级最高的信息实体确定为目标信息实体。
基于上述本申请实施例的技术方案,获取外部在信息查询界面输入的查询实体;根据包括多个实体以及多个实体之间的关联关系的知识图谱,查询与查询实体相关联的目标信息实体;基于目标信息实体在信息查询界面输出查询结果;在检测到知识图谱更新事件时,对知识图谱中的关联关系进行更新。通过本申请方案的实施,采用知识图谱来全面、准确地推理出与查询数据直接关联或潜在关联的信息结果,有效增强了信息查询能力,并提高了信息查询结果的有效性;而且根据知识图谱更新事件进行知识图谱中关联关系的更新,进一步提升了信息查询的准确性。
图6中的方法为本申请第二实施例提供的一种细化的查询处理方法,该查询处理方法包括:
步骤601、获取外部在应用查询界面输入的查询实体。
在本实施例中,外部输入的查询信息对应为一个查询实体,可以是与应用名称直接关联或潜在关联的字段。
步骤602、对查询实体进行语义分析,根据语义分析结果检测查询实体是否处于应用查询界面的查询感知范围。
在本实施例中,查询感知范围包括所有语义与应用实体的语义处于同一层级的查询实体,处于查询感知范围的查询实体,其本身可以与应用实体完全相同,或是应用实体中的部分关键字段。
步骤603、在不处于查询感知范围时,将查询实体进行关键词划分,得到多个子查询实体。
具体的,在实际应用中,会存在查询实体由多个关键词组成,本实施例为了保证应用查询的准确性,将查询实体进行关键词划分,并基于划分的子查询实体在知识图谱上查询目标应用实体。
步骤604、对多个子查询实体进行查询优先级排序,确定查询优先级排序最高的子查询实体。
步骤605、在知识图谱上查询与查询优先级排序最高的子查询实体相关联的应用实体。
本实施例在对从外部获取的知识数据进行语义处理之后,再按照特定业务逻辑对实体进行分类和语义关联,形成意义明确的知识实体关系,如此,构建完成知识图谱,知识图谱包括多个实体以及多个实体之间的关联关系。
步骤606、将根据优先级排序最高的子查询实体查询得到的应用实体,确定为与查询实体相关联的目标应用实体。
在本实施例中,查询实体中不同关键词所提供的信息有效程度有所不同,本实施例基于信息有效程度来对各子查询实体进行查询优先级排序,信息有效程度越高的子查询实体的查询优先级越高,然后仅针对查询优先级最高的子查询实体在知识图谱上进行应用实体查询,以期提高应用实体查询的准确性以及避免向用户推荐无关应用。
步骤607、基于目标应用实体在应用查询界面进行应用展示。
在本实施例中,采用知识图谱推理方式,能够找到用户输入的query与APP难以觉察潜在的关联关系,然后将所推理出的应用在应用商店的应用查询界面进行展示而推荐给用户,既然满足用户的搜索需求,又为用户带来惊喜,提升使用体验,并且,吸引用户在应用商店中搜索更多APP领域外的实体,方便提供更多搜索竞价商业化场景。
应当理解的是,本实施例中各步骤的序号的大小并不意味着步骤执行顺序的先后,各步骤的执行顺序应以其功能和内在逻辑确定,而不应对本申请实施例的实施过程构成唯一限定。
根据本申请实施例公开的查询处理方法,获取外部在应用商店的应用查询界面输入的查询实体;在查询实体不处于应用商店的查询感知范围时,将查询实体进行关键词划分,得到多个子查询实体;对多个子查询实体进行查询优先级排序,并根据包括多个实体以及多个实体之间的关联关系的知识图谱,查询与查询优先级排序最高的子查询实体相关联的应用实体;将根据优先级排序最高的子查询实体查询得到的应用实体,确定为与查询实体相关联的目标应用实体;基于目标应用实体在应用查询界面进行应用展示。通过本申请方案的实施,采用知识图谱来全面、准确地推理出与查询信息直接关联或潜在关联的应用,有效增强了应用商店的应用查询能力,并提高了应用查询结果的有效性;并仅针对查询优先级最高的子查询实体在知识图谱上进行应用实体查询,以期提高应用实体查询的准确性以及避免向用户推荐无关应用。
图7为本申请第三实施例提供的一种查询处理装置。该查询处理装置可用于实现前述实施例中的查询处理方法。如图7所示,该查询处理装置主要包括:
获取模块701,用于获取在信息查询界面输入的查询实体;
查询模块702,用于根据知识图谱查询与查询实体相关联的目标信息实体;其中,知识图谱包括多个实体以及多个实体之间的关联关系;
输出模块703,用于基于目标信息实体在信息查询界面输出查询结果;
更新模块704,用于在检测到知识图谱更新事件时,对知识图谱中的关联关系进行更新。
如图8所示为本实施例提供的另一种查询处理装置,在本实施例一种可选的实施方式中,查询处理装置还包括:判断模块705,用于在根据知识图谱查询与查询实体相关联的目标信息实体之前,对查询实体进行语义分析;根据语义分析结果判断查询实体是否处于信息查询界面的查询感知范围,其中,查询感知范围包括所有语义与信息实体的语义处于同一层级的查询实体。相对应的,在不处于查询感知范围时,查询模块702执行根据知识图谱查询与查询实体相关联的目标信息实体的功能。
请继续参阅图8,在本实施例一种可选的实施方式中,查询处理装置还包括:生成模块706,用于在根据知识图谱查询与查询实体相关联的目标信息实体之前,将多个实体分别归纳至不同层级的实体集合;对相邻层级的实体集合内的实体进行直接关联,得到子知识图谱;基于子知识图谱之间所包括的共同实体,对不同的子知识图谱内间隔一个层级的实体进行间接关联,生成知识图谱。
在本实施例一种可选的实施方式中,查询模块702具体用于:根据知识图谱对查询实体进行查询;在未查询到结果时,对查询实体进行转化处理;根据知识图谱查询与经过转化处理后的查询实体相关联的目标信息实体。
进一步地,在本实施例一种可选的实施方式中,查询模块702在对查询实体进行转化处理时,具体用于:对查询实体进行同义扩展处理;或,对查询实体进行文字纠错处理;或,对查询实体进行语言翻译处理。
在本实施例一种可选的实施方式中,查询模块702具体用于:将查询实体进行关键词划分,得到多个子查询实体;基于多个子查询实体,在知识图谱上查询与查询实体相关联的目标信息实体。
进一步地,在本实施例一种可选的实施方式中,查询模块702在基于多个子查询实体,在知识图谱上查询与查询实体相关联的目标信息实体时,具体用于:对多个子查询实体进行查询优先级排序;在知识图谱上查询与查询优先级排序最高的子查询实体相关联的信息实体;将根据优先级排序最高的子查询实体查询得到的信息实体,确定为与查询实体相关联的目标信息实体;或,在知识图谱上分别查询与多个子查询实体相关联的信息实体;对查询得到的所有信息实体进行推荐优先级排序;将推荐优先级排序最高的信息实体,确定为与查询实体相关联的目标信息实体。
在本实施例一种可选的实施方式中,更新模块704具体用于:实时获取知识图谱中所有查询实体的时效信息;检测在知识图谱中的累积存在时长超过时效信息所指示的效用发挥时长的查询实体;在检测到累积存在时长超过效用发挥时长的查询实体时,解除所检测到的查询实体与对应关联的目标信息实体之间的关联关系。
在本实施例一种可选的实施方式中,在目标信息实体有多个时,输出模块703具体用于:分别获取对应于各目标信息实体的使用限制等级,以及外部的权限验证等级;筛选使用限制等级与权限验证等级相匹配的目标信息实体;将所筛选出的目标信息实体作为查询结果在信息查询界面进行展示。
应当说明的是,第一、二实施例中的查询处理方法均可基于本实施例提供的查询处理装置实现,所属领域的普通技术人员可以清楚的了解到,为描述的方便和简洁,本实施例中所描述的查询处理装置的具体工作过程,可以参考前述方法实施例中的对应过程,在此不再赘述。
根据本实施例所提供的查询处理装置,获取外部在信息查询界面输入的查询实体;根据包括多个实体以及多个实体之间的关联关系的知识图谱,查询与查询实体相关联的目标信息实体;基于目标信息实体在信息查询界面输出查询结果;在检测到知识图谱更新事件时,对知识图谱中的关联关系进行更新。通过本申请方案的实施,采用知识图谱来全面、准确地推理出与查询数据直接关联或潜在关联的信息结果,有效增强了信息查询能力,并提高了信息查询结果的有效性;而且根据知识图谱更新事件进行知识图谱中关联关系的更新,进一步提升了信息查询的准确性。
请参阅图9,图9为本申请第四实施例提供的一种电子装置。该电子装置可用于实现前述实施例中的查询处理方法。如图9所示,该电子装置主要包括:
存储器901、处理器902、总线903及存储在存储器901上并可在处理器902上运行的计算机程序,存储器901和处理器902通过总线903连接。处理器902执行该计算机程序时,实现前述实施例中的查询处理方法。其中,处理器的数量可以是一个或多个。
存储器901可以是高速随机存取记忆体(RAM,Random Access Memory)存储器,也可为非不稳定的存储器(non-volatile memory),例如磁盘存储器。存储器901用于存储可执行程序代码,处理器902与存储器901耦合。
进一步的,本申请实施例还提供了一种计算机可读存储介质,该计算机可读存储介质可以是设置于上述各实施例中的电子装置中,该计算机可读存储介质可以是前述图9所示实施例中的存储器。
该计算机可读存储介质上存储有计算机程序,该程序被处理器执行时实现前述实施例中的查询处理方法。进一步的,该计算机可存储介质还可以是U盘、移动硬盘、只读存储器(ROM,Read-Only Memory)、RAM、磁碟或者光盘等各种可以存储程序代码的介质。
在本申请所提供的几个实施例中,应该理解到,所揭露的装置和方法,可以通过其它的方式实现。例如,以上所描述的装置实施例仅仅是示意性的,例如,模块的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,例如多个模块或组件可以结合或者可以集成到另一个***,或一些特征可以忽略,或不执行。另一点,所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些接口,装置或模块的间接耦合或通信连接,可以是电性,机械或其它的形式。
作为分离部件说明的模块可以是或者也可以不是物理上分开的,作为模块显示的部件可以是或者也可以不是物理模块,即可以位于一个地方,或者也可以分布到多个网络模块上。可以根据实际的需要选择其中的部分或者全部模块来实现本实施例方案的目的。
另外,在本申请各个实施例中的各功能模块可以集成在一个处理模块中,也可以是各个模块单独物理存在,也可以两个或两个以上模块集成在一个模块中。上述集成的模块既可以采用硬件的形式实现,也可以采用软件功能模块的形式实现。
集成的模块如果以软件功能模块的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本申请的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的全部或部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个可读存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本申请各个实施例方法的全部或部分步骤。而前述的可读存储介质包括:U盘、移动硬盘、ROM、RAM、磁碟或者光盘等各种可以存储程序代码的介质。
需要说明的是,对于前述的各方法实施例,为了简便描述,故将其都表述为一系列的动作组合,但是本领域技术人员应该知悉,本申请并不受所描述的动作顺序的限制,因为依据本申请,某些步骤可以采用其它顺序或者同时进行。其次,本领域技术人员也应该知悉,说明书中所描述的实施例均属于优选实施例,所涉及的动作和模块并不一定都是本申请所必须的。
在上述实施例中,对各个实施例的描述都各有侧重,某个实施例中没有详述的部分,可以参见其它实施例的相关描述。
以上为对本申请所提供的查询处理方法、装置及计算机可读存储介质的描述,对于本领域的技术人员,依据本申请实施例的思想,在具体实施方式及应用范围上均会有改变之处,综上,本说明书内容不应理解为对本申请的限制。

Claims (10)

1.一种查询处理方法,其特征在于,包括:
获取在信息查询界面输入的查询实体;
根据知识图谱查询与所述查询实体相关联的目标信息实体;其中,所述知识图谱包括多个实体以及所述多个实体之间的关联关系;
基于所述目标信息实体在所述信息查询界面输出查询结果;
在检测到知识图谱更新事件时,对所述知识图谱中的所述关联关系进行更新。
2.根据权利要求1所述的查询处理方法,其特征在于,所述根据知识图谱查询与所述查询实体相关联的目标信息实体之前,还包括:
对所述查询实体进行语义分析;
根据语义分析结果判断所述查询实体是否处于所述信息查询界面的查询感知范围;其中,所述查询感知范围包括所有语义与信息实体的语义处于同一层级的查询实体;
在不处于所述查询感知范围时,执行所述根据知识图谱查询与所述查询实体相关联的目标信息实体的步骤。
3.根据权利要求1所述的查询处理方法,其特征在于,所述根据知识图谱查询与所述查询实体相关联的目标信息实体之前,还包括:
将所述多个实体分别归纳至不同层级的实体集合;
对相邻层级的实体集合内的实体进行直接关联,得到子知识图谱;
基于所述子知识图谱之间所包括的共同实体,对不同的所述子知识图谱内间隔一个层级的实体进行间接关联,生成所述知识图谱。
4.根据权利要求1所述的查询处理方法,其特征在于,所述在检测到知识图谱更新事件时,对所述知识图谱中的所述关联关系进行更新包括:
实时获取所述知识图谱中所有查询实体的时效信息;
检测在所述知识图谱中的累积存在时长超过所述时效信息所指示的效用发挥时长的查询实体;
在检测到所述累积存在时长超过所述效用发挥时长的查询实体时,解除所检测到的查询实体与对应关联的目标信息实体之间的关联关系。
5.根据权利要求1至4中任意一项所述的查询处理方法,其特征在于,所述根据知识图谱查询与所述查询实体相关联的目标信息实体包括:
将所述查询实体进行关键词划分,得到多个子查询实体;
基于所述多个子查询实体,在知识图谱上查询与所述查询实体相关联的目标信息实体。
6.根据权利要求5所述的查询处理方法,其特征在于,所述基于所述多个子查询实体,在知识图谱上查询与所述查询实体相关联的目标信息实体包括:
对所述多个子查询实体进行查询优先级排序;
在知识图谱上查询与所述查询优先级排序最高的子查询实体相关联的信息实体;
将根据所述优先级排序最高的子查询实体查询得到的信息实体,确定为与所述查询实体相关联的目标信息实体;
或,在知识图谱上分别查询与所述多个子查询实体相关联的信息实体;
对查询得到的所有信息实体进行推荐优先级排序;
将所述推荐优先级排序最高的信息实体,确定为与所述查询实体相关联的目标信息实体。
7.根据权利要求1至4中任意一项所述的查询处理方法,其特征在于,在所述目标信息实体有多个时,所述基于所述目标信息实体在所述信息查询界面输出查询结果包括:
分别获取对应于各所述目标信息实体的使用限制等级,以及外部的权限验证等级;
筛选使用限制等级与所述权限验证等级相匹配的目标信息实体;
将所筛选出的所述目标信息实体作为查询结果在所述信息查询界面进行展示。
8.一种查询处理装置,其特征在于,包括:
获取模块,用于获取在信息查询界面输入的查询实体;
查询模块,用于根据知识图谱查询与所述查询实体相关联的目标信息实体;其中,所述知识图谱包括多个实体以及所述多个实体之间的关联关系;
输出模块,用于基于所述目标信息实体在所述信息查询界面输出查询结果;
更新模块,用于在检测到知识图谱更新事件时,对所述知识图谱中的所述关联关系进行更新。
9.一种电子装置,包括:存储器、处理器及总线,其特征在于,所述总线用于实现所述存储器、处理器之间的连接通信;所述处理器用于执行存储在所述存储器上的计算机程序,所述处理器执行所述计算机程序时,实现权利要求1至7中任意一项所述方法中的步骤。
10.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,所述计算机程序被处理器执行时,实现权利要求1至7中的任意一项所述方法中的步骤。
CN201911299566.8A 2019-12-17 2019-12-17 一种查询处理方法、装置及计算机可读存储介质 Pending CN111061750A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201911299566.8A CN111061750A (zh) 2019-12-17 2019-12-17 一种查询处理方法、装置及计算机可读存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201911299566.8A CN111061750A (zh) 2019-12-17 2019-12-17 一种查询处理方法、装置及计算机可读存储介质

Publications (1)

Publication Number Publication Date
CN111061750A true CN111061750A (zh) 2020-04-24

Family

ID=70301054

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201911299566.8A Pending CN111061750A (zh) 2019-12-17 2019-12-17 一种查询处理方法、装置及计算机可读存储介质

Country Status (1)

Country Link
CN (1) CN111061750A (zh)

Cited By (14)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111552880A (zh) * 2020-04-30 2020-08-18 杭州网易再顾科技有限公司 基于知识图谱的数据处理方法、装置、介质及电子设备
CN111782824A (zh) * 2020-08-14 2020-10-16 中国工商银行股份有限公司 信息查询方法、装置、***和介质
CN111782820A (zh) * 2020-06-30 2020-10-16 京东数字科技控股有限公司 知识图谱创建方法及装置、可读存储介质及电子设备
CN112015918A (zh) * 2020-09-14 2020-12-01 支付宝(杭州)信息技术有限公司 数据处理方法及装置
CN112069326A (zh) * 2020-09-03 2020-12-11 Oppo广东移动通信有限公司 知识图谱的构建方法、装置、电子设备及存储介质
CN112231488A (zh) * 2020-09-22 2021-01-15 京东城市(北京)数字科技有限公司 数据处理的方法、装置、设备及计算机可读存储介质
CN112948547A (zh) * 2021-01-26 2021-06-11 中国石油大学(北京) 测井知识图谱构建查询方法、装置、设备及存储介质
CN113157934A (zh) * 2021-03-05 2021-07-23 中国互联网络信息中心 知识图谱起源处理方法和***、电子设备和存储介质
CN113345430A (zh) * 2021-06-25 2021-09-03 上海适享文化传播有限公司 基于语音固定条件下多字段的查询方法
CN113360949A (zh) * 2021-07-27 2021-09-07 中国银行股份有限公司 一种查询风险识别方法及装置
CN113569030A (zh) * 2021-07-29 2021-10-29 北京三快在线科技有限公司 信息查询方法、装置、设备及存储介质
CN114064930A (zh) * 2021-11-29 2022-02-18 北京字节跳动网络技术有限公司 一种数据展示方法、装置、计算机设备以及存储介质
WO2022088731A1 (zh) * 2020-11-02 2022-05-05 北京搜狗科技发展有限公司 一种数据处理方法及装置
CN116028597A (zh) * 2023-03-27 2023-04-28 南京燧坤智能科技有限公司 对象检索方法、装置、非易失性存储介质及计算机设备

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108829858A (zh) * 2018-06-22 2018-11-16 北京京东金融科技控股有限公司 数据查询方法、装置及计算机可读存储介质
CN109670049A (zh) * 2018-11-19 2019-04-23 平安科技(深圳)有限公司 图谱路径查询方法、装置、计算机设备和存储介质

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108829858A (zh) * 2018-06-22 2018-11-16 北京京东金融科技控股有限公司 数据查询方法、装置及计算机可读存储介质
CN109670049A (zh) * 2018-11-19 2019-04-23 平安科技(深圳)有限公司 图谱路径查询方法、装置、计算机设备和存储介质

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
陈晓晖 等: "《网络科学与计算》", 世界图书上海出版公司, pages: 239 - 240 *

Cited By (21)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111552880A (zh) * 2020-04-30 2020-08-18 杭州网易再顾科技有限公司 基于知识图谱的数据处理方法、装置、介质及电子设备
CN111552880B (zh) * 2020-04-30 2023-06-30 杭州网易再顾科技有限公司 基于知识图谱的数据处理方法、装置、介质及电子设备
CN111782820A (zh) * 2020-06-30 2020-10-16 京东数字科技控股有限公司 知识图谱创建方法及装置、可读存储介质及电子设备
CN111782820B (zh) * 2020-06-30 2024-05-17 京东科技控股股份有限公司 知识图谱创建方法及装置、可读存储介质及电子设备
CN111782824A (zh) * 2020-08-14 2020-10-16 中国工商银行股份有限公司 信息查询方法、装置、***和介质
CN111782824B (zh) * 2020-08-14 2024-04-19 中国工商银行股份有限公司 信息查询方法、装置、***和介质
CN112069326A (zh) * 2020-09-03 2020-12-11 Oppo广东移动通信有限公司 知识图谱的构建方法、装置、电子设备及存储介质
CN112015918A (zh) * 2020-09-14 2020-12-01 支付宝(杭州)信息技术有限公司 数据处理方法及装置
CN112231488A (zh) * 2020-09-22 2021-01-15 京东城市(北京)数字科技有限公司 数据处理的方法、装置、设备及计算机可读存储介质
WO2022088731A1 (zh) * 2020-11-02 2022-05-05 北京搜狗科技发展有限公司 一种数据处理方法及装置
CN112948547A (zh) * 2021-01-26 2021-06-11 中国石油大学(北京) 测井知识图谱构建查询方法、装置、设备及存储介质
CN112948547B (zh) * 2021-01-26 2024-04-09 中国石油大学(北京) 测井知识图谱构建查询方法、装置、设备及存储介质
CN113157934A (zh) * 2021-03-05 2021-07-23 中国互联网络信息中心 知识图谱起源处理方法和***、电子设备和存储介质
CN113345430A (zh) * 2021-06-25 2021-09-03 上海适享文化传播有限公司 基于语音固定条件下多字段的查询方法
CN113345430B (zh) * 2021-06-25 2024-05-10 上海适享文化传播有限公司 基于语音固定条件下多字段的查询方法
CN113360949A (zh) * 2021-07-27 2021-09-07 中国银行股份有限公司 一种查询风险识别方法及装置
CN113360949B (zh) * 2021-07-27 2024-07-02 中国银行股份有限公司 一种查询风险识别方法及装置
CN113569030A (zh) * 2021-07-29 2021-10-29 北京三快在线科技有限公司 信息查询方法、装置、设备及存储介质
CN114064930A (zh) * 2021-11-29 2022-02-18 北京字节跳动网络技术有限公司 一种数据展示方法、装置、计算机设备以及存储介质
CN116028597B (zh) * 2023-03-27 2023-07-21 南京燧坤智能科技有限公司 对象检索方法、装置、非易失性存储介质及计算机设备
CN116028597A (zh) * 2023-03-27 2023-04-28 南京燧坤智能科技有限公司 对象检索方法、装置、非易失性存储介质及计算机设备

Similar Documents

Publication Publication Date Title
CN111061750A (zh) 一种查询处理方法、装置及计算机可读存储介质
JP5540079B2 (ja) 知識ベース構築の方法および装置
US10180967B2 (en) Performing application searches
US9406020B2 (en) System and method for natural language querying
CN108304444B (zh) 信息查询方法及装置
JP4953468B2 (ja) オントロジーデータのインポート/エクスポートのための方法および装置
US20150213042A1 (en) Search term obtaining method and server, and search term recommendation system
EP3117345A1 (en) Natural language question answering method and apparatus
EP2545462A1 (en) System and method for matching entities and synonym group organizer used therein
CN110362593B (zh) 一种数据查询方法、装置、设备及存储介质
CA2809021C (en) Systems and methods for lexicon generation
KR101369931B1 (ko) 하이브리드 시맨틱 검색 시스템 및 방법
CN111611471B (zh) 一种搜索方法、装置及电子设备
CN112131288B (zh) 数据源接入处理方法和装置
CN109101595B (zh) 一种信息查询方法、装置、设备及计算机可读存储介质
US9984684B1 (en) Inducing command inputs from high precision and high recall data
US20220292127A1 (en) Information management system
CN111078727A (zh) 一种简要描述生成方法、装置及计算机可读存储介质
CN107220249B (zh) 基于分类的全文搜索
CN115705320A (zh) 索引生成方法、装置、计算机设备和计算机可读存储介质
TWI477996B (zh) 自動分析個人化輸入之方法
TW201913414A (zh) 多文檔交集的獲取方法及文檔伺服器
US20220292126A1 (en) Information management system
CN110717011B (zh) 会话消息处理方法和装置
Yang et al. On-line text mining and recommendation based on ontology and implied sentiment inclination

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination