CN106649878A - 基于人工智能的物联网实体搜索方法及*** - Google Patents

基于人工智能的物联网实体搜索方法及*** Download PDF

Info

Publication number
CN106649878A
CN106649878A CN201710011671.1A CN201710011671A CN106649878A CN 106649878 A CN106649878 A CN 106649878A CN 201710011671 A CN201710011671 A CN 201710011671A CN 106649878 A CN106649878 A CN 106649878A
Authority
CN
China
Prior art keywords
entity
query
node
knowledge mapping
sentence
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201710011671.1A
Other languages
English (en)
Inventor
陈翔宇
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Individual
Original Assignee
Individual
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Individual filed Critical Individual
Priority to CN201710011671.1A priority Critical patent/CN106649878A/zh
Publication of CN106649878A publication Critical patent/CN106649878A/zh
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/24Querying
    • G06F16/242Query formulation
    • G06F16/243Natural language query formulation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/24Querying
    • G06F16/245Query processing
    • G06F16/2458Special types of queries, e.g. statistical queries, fuzzy queries or distributed queries
    • G06F16/2471Distributed queries
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/30Semantic analysis

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Mathematical Physics (AREA)
  • Computational Linguistics (AREA)
  • General Engineering & Computer Science (AREA)
  • Artificial Intelligence (AREA)
  • Data Mining & Analysis (AREA)
  • Databases & Information Systems (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Health & Medical Sciences (AREA)
  • General Health & Medical Sciences (AREA)
  • Fuzzy Systems (AREA)
  • Probability & Statistics with Applications (AREA)
  • Software Systems (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明公开一种用于对物联网中实体进行搜索的方法及***。所述方法包括:对用户的查询语句处理并生成没有歧义的中间语言;通过知识图谱将上述中间语言解析为***内查询语句;通过自学习或人工训练的方式构建知识树的方法;通过服务器和传感网对***内查询语句进行分布式查询的方法与协议。所述***包括:对用户查询进行解析和结果反馈的搜索服务***;维护知识图谱并提供解析的人工智能***;根据***内查询语句对实体进行检索的服务器集群和传感网***。通过上述方法和***可以实现用户使用自然语言搜索物联网中的实体;知识图谱的抽象性与发散性使得搜索目标可以是任何可描述的客观实体或者虚拟对象;本***所描述的传感网***和协议将搜索任务逐级拆分并委派,使之具有高并发和强兼容性的特点。

Description

基于人工智能的物联网实体搜索方法及***
技术领域
本发明涉及信息技术和人工智能领域,更具体地说,本发明涉及基于人工智能的物联网实体搜索方法及***。
背景技术
物联网是在互联网基础上的延伸和扩展的网络,是新一代信息技术的重要组成部分。物联网的核心和基础仍然是互联网,但是通过传感器网络将用户端延伸和扩展到了任何物品与物品之间,进行信息交换和通信。这使得物联网通过智能感知、识别技术与通用计算等通信感知技术,广泛应用于网络的融合中。当大量生活中的实体,如家电、公共设施等在接入物联网后,将会产生海量的实体信息。传统的搜索技术,即基于关键词的搜索技术很难做到对实体的精确高效搜索,因此,基于物联网的实体搜索技术应运而生。
实体搜索的技术组成主要包括实体属性的提取和消歧、实体信息分类、实体关系挖掘。这些技术的基础就是需要前期花大量的时间和精力来建立的实体信息数据库。即便是建立后,随着***的复杂化,实体信息数据库也需要不断更新。随着物联网规模的扩大,搜索引擎***的负荷也会越来越大。传统搜索引擎中所使用的倒排表、网页快照等技术依赖对已知网页的不断抓取与分析,很难对网络上的变化做出实时响应,然而物联网中的信息几乎是一直变化的,因此更需要高并发的实时查询技术。以上两点是目前物联网实体搜索技术面临的主要难题。
发明内容
有鉴于此,本发明提供了一种物联网实体搜索方法及***,使用知识图谱与自学习等人工智能技术解决了实体信息数据库建立与维护难题,并且通过一种新的传感网***解决了高并发实时查询难题。
为实现上述目的,本发明提供如下技术方案。
一种物联网实体搜索方法,包括:
处理用户的查询语句并与知识图谱中的概念进行映射的方法;
通过知识图谱对查询语句进行语义分析并生成***内查询语句的方法;
构造、拓展、更新知识图谱的方法;
对传感网***进行分布式查询的方法与协议。
通过知识图谱对查询语句进行语义分析并生成***内查询语句的过程包括:
分词:即将语言划分为独立的词汇;
成分分析:确定词汇在语句中的成分,如主语、谓语或者宾语;
成分补全:将语句中省略的成分填充完整;
代词替换:将语句中的代词替换成对应的实体;
语序重排:将倒装句、问句、从句等句式进行排序和拆分;
消歧:通过概率分析等手段,将有歧义的词汇转换为无歧义词汇或者限定其表达的含义;
迭代:重复以上步骤,直到解析结果达到预期精度;
以上过程的顺序并不固定,且并非每步都必须执行,根据用户输入的语句有选择地进行,其中使用到的一些逻辑规则存储于知识图谱中。
通过知识图谱对查询语句进行语义分析并生成***内查询语句的过程包括:
实体映射,将语句中的词语映射为实体;
非实体映射,将语句中的词语映射为非实体;
关系映射,分析实体与非实体之间的关系;
语境分析,根据语句中词语的组合、顺序等特征判断语句所描述内容的环境;
语义分析,解析语句想要表达的意思,即希望***完成什么操作;
以上过程的顺序并不固定,且并非每步都必须执行,根据中间语言有选择地进行。
构造、拓展、更新知识图谱的方法包括:
通过向导对人工智能***进行样本训练;
直接向知识图谱添加内容;
通过对互联网、物联网等媒体上的信息进行聚类分析;
通过对知识图谱中已有的内容进行逻辑推导获得新的内容或者挖掘出潜在的内容。
知识图谱包括:
实体的定义:实体包含名称等属性,对属性的约束,可以对实体进行的动作,实体可以发出的动作等;
关系:包括关系描述,关系建立的条件和断开的条件,判断实体间是否存在关系的方法等,这种关系可以是多个实体间和非实体间的;
非实体的定义:非实体指一些不具有实体特性的概念,非实体可以包含描述信息,适用范围,应用方法等。
分布式查询的过程包括:
传感网网关将***内查询语句转发给传感网***的顶层实体节点;
顶层实体节点生成子查询语句并发放给下一层实体节点;
各层实体节点检查自身是否符合查询条件;
非底层实体节点将子节点返回的结果进行归并和排序;
各层实体节点将结果返回给上一层实体节点。
分布式查询协议包括:
头文件:查询任务的状态代码(正常,错误),报文类型(请求、响应、控制),发起人,协议版本号,正文的格式(如JSON或XML)、编码(如GBK或UTF8),是否加密、压缩等;
正文:请求报文包括查询语句,对查询的非功能性需求;响应报文正文包括查询结果集,包括结果数量,查询时间,完成时间,符合条件的实体列表等信息;控制报文正文包括对查询连接的控制命令(如建立、断开、挂起或流量控制)和连接状态信息;
查询协议不规定查询的具体实现方式。
一种物联网实体搜索***,该***分为三层,包括:
搜索应用层:响应用户的搜索请求,调用知识图谱解析查询语句并可视化呈现查询结果;
逻辑处理层:用于存储维护知识图谱和对知识图谱进行更新;
实体搜索层:用于执行具体查询任务,并对结果进行归并、筛选、排序和分页操作。
搜索应用层包括:
生成没有歧义的中间语言的实体映射模块;
将上述中间语言解析为***内查询语句的语义分析模块;
将查询任务分配给服务器集群并将查询结果显示的结果显示模块。
逻辑处理层包括:
用于存储维护知识图谱的知识图谱***和用于对知识图谱进行构造、拓展、更新的人工智能***。
实体搜索层包括:
对结果进行处理的服务器集群和执行查询任务的传感网***。
服务器集群的功能包括:
服务器集群负责将用户输入的查询语句转化为***内查询任务并发送给传感网***,然后对传感网***返回的查询结果进行归并、筛选、排序和分页,最后返回给应用层的结果显示模块。
传感网***的结构包括:
传感网***由两大类节点组成,实体节点和传感器节点,实体节点用于表示一个实体,所有对此实体的操作都是基于该节点,传感器节点用于获取实体的属性信息并保存下来。传感网***采用树形拓扑结构,纯传感器节点必须是叶子节点,实体节点可以读取其下的传感器节点的属性信息,并且可以把查询语句下发给子实体。传感网络并不明确规定各节点的功能实现方式,只要提供能够执行查询语句并返回结果的接口即可。查询任务实质上被节点分摊。
经由上述技术方案可知,本***采用基于知识图谱的人工智能***实现查询语句的语义化分析,并通过传感网节点实现了分布式查询,实现了语义化的高拓展性、高并发物联网实体搜索。
附图说明
在说明书的结尾部分中具体指出并明确要求保护了被视为本发明的主体。当结合附图阅读时,通过参考以下详细描述,可以最佳地理解本发明的组织和操作方法以及本发明的目的、特性和优点,这些附图是:
图 1 是根据本发明的实施例公开的一种实体搜索***架构示意图;
图 2 是根据本发明的实施例公开的处理用户的查询语句并生成没有歧义的中间语言的方法的流程图;
图 3 是根据本发明的实施例公开的通过知识图谱将上述中间语言解析为***内查询语句的方法的流程图;
图 4是具体应用本发明的实施例公开的一种物联网实体搜索***搜索界面示意图;
图 5是根据本发明的实施例公开的一种知识图谱的结构图;
图 6是根据本发明的实施例公开的构造、拓展、更新知识图谱的方法的示意图;
图 7是根据本发明的实施例公开的一种服务器和传感网***的结构图;
图 8是根据本发明的实施例公开的一种节点通讯协议示意图;
图 9 是根据本发明的实施例公开的一种分布式传感网***实体搜索方法的流程图。
为使例示简单和清晰,附图中示出的元素不一定按比例绘制。例如,为了清晰起见,某些元素的大小可能相对于其它元素而有所增大。此外,如果适当,标号可以在附图之间重复以指示对应或类似的特性。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而非全部实施例。然而,本领域的技术人员可以在没有这些特定的细节的情况下理解并实现本发明,因此本领域普通技术人员基于本发明或其实施例所做出的非创造性劳动所获得的所有实施例都属于本发明保护范围。
由技术背景可知,现有的实体搜索***大多需要前期花大量的时间和精力来建立的实体信息数据库,即便是建立数据库之后,仍需要对已有信息进行不断地更新、拓展;因此,其应用范围也都局限于互联网。而物联网的信息量是传统互联网所无法比拟的,其信息更新速度也更快,对查询结果的时效性要求更高,因此建立并维护实体信息数据库需要极高的成本,倒排表和全文索引等技术也很难提高查询效率。
针对以上问题,本发明公开的一种基于人工智能的物联网实体搜索方法及***,使用知识图谱与自学习等人工智能技术解决了实体信息数据库建立与维护难题,并且通过一种新的传感网***解决了高并发实时查询难题。具体过程通过以下实施例详细说明:
实施例一
附图1为本发明实施例所公开的一种物联网实体搜索***架构示意图,主要包括:
1、搜索应用层:包括生成没有歧义的中间语言的模块、将上述中间语言解析为***内查询语句的模块和将查询任务分配给服务器集群并将查询结果显示的模块。
搜索应用层实现了响应用户的搜索请求,调用知识图谱解析查询语句,和可视化呈现查询结果三个主要功能。其设计目标是提供用户与物联网的交互服务,将用户输入的自然语言转换为计算机中可执行的指令,然后将指令执行的结果以直观的形式输出,保证人机交互的良好体验。下面做进一步说明:
1.1生成没有歧义的中间语言的模块:该模块的主要作用是消除用户输入的自然语言的多义性,生成计算机可理解的字符串然后进行语句成分分析。这些操作是计算机实现语义理解的基础,是生成查询语句的必要前提。
附图2是上述模块生成没有歧义的中间语言的方法的流程图,主要过程包括以下步骤:
分词:即将语言划分为独立的词汇。首先使用基于字符串匹配的分词方法,通过从知识图谱中匹配已有的词汇来进行初步分解,然后使用基于概率统计的方式进行分,词修正,根据人工智能***学习所得的某些字同时出现的概率来判断是否为词组。例如,用户输入“中国中医科学院”,利用正向和反向最大匹配算法可得结果“中国/中医科/学院”和“中国/中医/科学院”,再利用人工智能***比较“中医科”+“学院”和“中医”+“科学院”两种组合出现的频率,得出最有可能的结果;
成分分析:确定词汇在语句中的成分,如主语、谓语或者宾语。知识图谱会保存每个词汇在语句中可能的成分,首先列出语句的所有可能的成分组合,然后根据人工智能***的学习结果估算出概率最高的组合作为成分分析结果。例如,“咬死了/猎人/的狗”中既有可能是谓语(咬死了) + 定语(猎人) + 宾语(的狗),也可能是定语(咬死了猎人)+宾语(的狗)。人工智能***根据以往两种组合的概率得出最有可能的结果;
成分补全:将语句中省略的成分填充完整。首先通过比较完整语句成分组合与成分分析结果判定省略的成分,然后根据上下文猜测省略的内容并补全。例如,用户输入“5班的班长”,***首先查询知识图谱中对“班”的定义,“班”的含义有很多,但是因为同时出现了“班长这个词,所以确定这里表示学校班级。同时说明,语句中缺少班级所在学校的名称。本***默认查询用户为查询语句的主语,即动作的主体,因此***认为用户所在学校为语句中所指学校,通过IP地址、GPS定位或其他手段获取用户地理位置,并搜索最近的学校,并将该学校5班作为查询对象进行实体搜索;
代词替换:将语句中的代词替换成对应的实体。根据上下文,将代词替换为所指实体。例如,用户输入“你几岁了”,代词“你”默认指代实体搜索***本身,替换后的结果为“实体搜索***几岁了”;
语序重排:将倒装句、问句、从句等句式进行排序和拆分。例如,主从复合句“去年考了第一名的学生今年只考了第三名”会被拆分成“学生去年考了第一名,并且今年考了第三名”;
消歧:通过概率分析等手段,将有歧义的词汇转换为无歧义词汇或者限定其表达的含义。例如,“张三是否在办公室看材料”,看”读kān 时,表示“看守”,读kàn 时,表示“阅览”。此时,***会分析主语所表示实体的具体身份,获取其相关信息,如果发现张三的职业是秘书,那么表示后者的概率更大,如果张三是保安,那么前者的概率更大。
1.2将上述中间语言解析为***内查询语句的模块:将自然语言转换为中间语言只是形式上的转换,而本模块的作用则是使得计算机真正“理解”语言的含义,根据字符串构建出逻辑对象,然后根据逻辑对象生成查询命令。
附图3是上述模块将中间语言解析为***内查询语句的方法的流程图,主要过程包括以下步骤:
实体映射:将语句中的词语映射为实体。例如,“苹果\不如\果酱\好吃”,“苹果”和“果酱”就是两个实体,在计算机程序中对应某个类的实例。该模块通过将语句中的词组与存储在知识图谱中实体的名称进行匹配来识别实体;
非实体映射:将语句中的词语映射为非实体。例如,“苹果\不如\果酱\好吃”,“好吃”就是一个非实体,用来修饰“果酱”这个实体。大部分非实体用来限定、修饰实体,以及表达、强调实体的固有属性或者情感;
关系映射:分析实体与非实体之间的关系。例如,“苹果\不如\果酱\好吃”中“不如”即表示一种关系,通过查询知识图谱,可以获知“不如”是用于表示两者间比较关系并且前者弱于后者,被比较的属性一般紧跟在被比较实体的后面;
语境分析:根据语句中词语的组合、顺序等特征判断语句所描述内容的环境。例如“今天天气怎么样”,***会为该语句创建一个环境对象,该对象包含时间、空间等描述环境的信息,其时间为今天,空间为用户所在地理位置。在比较复杂的语句中,会出现环境对象嵌套的情况,例如主句所处环境是从句环境的子对象。语境分析所生成的环境对象是生成查询语句不可或缺的条件;
语义分析:解析语句想要表达的含义,即希望***完成什么操作。一共分为四类类操作:实体匹配、抽象实体匹配、逻辑运算操作、主体交流。实体匹配即查询物联网中符合用户描述的实体,例如“附近的餐厅”。抽象实体匹配即查询知识图谱中某类符合用户描述的实体,例如“世界上最大的哺乳动物”。逻辑运算操作指在以上操作的基础上进行逻辑运算并返回运算结果的搜索,例如“先有鸡还是先有蛋”。主体交流指本***以“我”的角色与用户进行对话,其中包含记忆和情感状态等内容的模拟。
中间语言在经过以上步骤的处理后,会转换成***内查询语句,该语句使用的是类似于SQL语法结构的解释型语言,是实体搜索层可以识别和处理的字符串。
1.3将查询任务分配给服务器集群并将查询结果显示的模块,处理查询任务主要过程包括以下步骤:
WEB应用服务器接收用户查询请求,发送给最近的服务器集群网关;
服务器集群网关获取用户的基本信息,如身份信息、地理位置、IP地址等,然后将以上信息封装,根据人工智能集群的负载情况发送给合适的人工智能节点;
人工智能集群在完成语义解析后,将生成的查询任务通过人工智能集群网关返回给合适的传感网网关;
服务器分析查询任务以及传感网***的负载情况,确定如何拆分查询任务以及将子查询任务分发给哪些传感网;
传感网获取子查询任务并在执行完成后返回查询结果至传感网网关;
传感网网关对上述结果进行归并、筛选、排序和分页,并将处理后的结果提交给WEB应用服务器;
WEB应用服务器对查询结果进行渲染并反馈给用户。
附图4是本实施例中的物联网实体搜索***搜索界面示意图。
2、逻辑处理层:负责对搜索应用层提供语义分析等自然语言处理服务。包括存储实体和非实体信息的知识图谱***和用于对知识图谱进行构造、拓展、更新的人工智能***。
2.1知识图谱***:该***用于存储人工智能***经过学习后生成的对实体、非实体及其关系的数据,对查询语句进行语义分析并生成***内查询语句和作为人工智能***的运行逻辑;在***初始阶段即具有理解、表达自然语言的能力,以及将人工智能***所获取信息转换为知识图谱中实体、非实体和关系的深度学习能力。
附图5是上述***使用的一种知识图谱的结构图,主要内容包括以下结构:
实体(Entity):是指客观存在并可相互区别的事物、物联网或其他虚拟空间中的对象或概念都可以映射为知识图谱中的实体。实体之间可以是组合、包含和重叠关系。知识图谱中实体由属性和行为组成,属性描述实体的固有性质和实时状态,行为则描述实体可以进行的动作。例如,“人”可以包含属性:“年龄”、“性别”和“体重”;可以包含行为:“吃饭”,“睡觉”和“行走”;
非实体:是指所有可以映射到知识图谱中的除实体以外的抽象概念。非实体是对实体属性及方法的抽象,这些属性和方法最终被抽象为二进制流和基本逻辑运算并以非实体的形式存储在知识图谱中。例如,使用非实体“老年人”作为对实体“人”的抽象,是指“年龄”属性大于阈值的一类“人”;
关系:是指实体、非实体、关系三者中自身或多元之间的相互约束。关系约束使得知识图谱形成网络结构,实体和非实体作为节点,以关系相连接。例如,通过修饰关系连接非实体“高”和“人”,从而表示身高较高的人。
2.2人工智能***:该***以知识图谱中的数据为运行逻辑;同时驱动知识图谱进行构造、拓展、更新。
附图6是上述***构造、拓展、更新知识图谱的方法的示意图,主要内容包括:
通过WEB服务器中的向导提交训练样本,人工智能***使用知识图谱中的逻辑进行深度学习。例如,用自然语言定义一个实体,同时提交该实体的3D模型进行样本训练;
向服务器集群发送操作指令,规避知识图谱中的逻辑约束,从计算机***层次修改知识图谱中的数据;
网络爬虫抓取互联网、物联网等媒体上的信息进行聚类分析,如果知识图谱中存在同类的信息则进行更新,否则进行知识图谱的拓展;
通过对知识图谱中已有的内容进行逻辑推导获得新的内容或者挖掘出潜在的内容。例如,两种实体在知识图谱中非常相似,同类实体间往往存在某种关系,那么知识图谱会尝试创建连接两种实体的关系。
3、实体搜索层:用于承载搜索应用层和逻辑处理层,执行具体查询任务,并对结果进行归并、筛选、排序和分页操作。包括服务器集群和传感网***。
附图7是实体搜索层使用的一种服务器和传感网***的结构图,主要包括以下结构:
3.1服务器集群:作为承载搜索应用层和逻辑处理层的硬件平台。主要包括以下结构:
WEB应用服务器:用于承载搜索应用层,与用户进行图形化交互;
服务器集群网关:作为WEB应用服务器接入人工智能集群的入口,也负责数据封装和实现服务器集群的负载均衡;
人工智能集群:用于承载逻辑处理层,其中每台计算机称为一个节点。节点类型包括:普通节点、关键节点和人工智能节点。知识图谱分布于关键节点和普通节点上,相邻节点所的知识图谱具有相关性,而控制这些的参数会随查询与解析结果而自行优化。关键节点将拥有相似知识图谱的普通节点连接起来,并与需要协同工作的其它关键节点相连,关键节点可以转发任务给下层节点。每个人工智能节点都拥有人工智能***的完整功能,但只存储知识图谱中一部分相互连通的节点的拓扑关系图,并对这些节点上的知识图谱进行构造、拓展、更新。除此之外,人工智能节点还负责响应服务器集群网关发送的查询请求,并生成对应的解析任务委派给相连的关键节点,在解析任务完成后将生成的***内查询语句转发到传感网网关。默认地,当一个节点无法完成任务时人工智能节点会将任务转发给其它人工智能节点,如果转发次数达到一定值后仍没有解决,则触发知识图谱的构造、拓展、更新,如果节点完成了委派的任务,则基于用进废退原则对知识图谱进行更新;
传感网网关:用于将***内查询语句发送到顶层实体节点,并对顶层实体节点返回的查询结果进行归并、筛选、排序和分页,并将最终结果提交给WEB应用服务器。此外还会对传感网的状态进行快照。
3.2传感网***:执行具体查询任务,并对结果进行归并、排序操作。
附图8是实体搜索层传感网使用的一种节点通讯协议示意图,主要内容包括:
头文件:查询任务的状态代码(正常,错误),报文类型(请求、响应、控制),发起人,协议版本号,正文的格式(如JSON或XML)、编码(如GBK或UTF8),是否加密、压缩等;
正文:请求报文包括查询语句,对查询的非功能性需求;响应报文正文包括查询结果集,包括结果数量、查询时间、完成时间、符合条件的实体列表等信息;控制报文正文包括对查询连接的控制命令(如建立、断开、挂起或流量控制)和连接状态信息。
附图9为本发明实施例所公开的一种分布式传感网***实体搜索方法的流程图,主要内容包括以下步骤:
传感网网关将***内查询语句转发给传感网***的顶层实体节点;
顶层实体节点生成子查询语句并发放给下一层实体节点;
各层实体节点检查自身是否符合查询条件;
非底层实体节点将子节点返回的结果进行归并和排序;
各层实体节点将结果返回给上一层实体节点。
需要说明的是,在本文中,诸如“第”和“第二”之类的关系术语仅仅用来将一个实体或操作与另一个实体或操作区分开来,而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且,属于“包括”、“包含”或者任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者还是包括为这种方法、物品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括所属要素的过程、方法、物品或者设备中还存在另外的相同要素。
本领域普通技术人员可以理解实现上述方法实时方式中的全部或部分步骤是可以通过程序指令相关硬件来完成,所述的程序可以存储于计算机可读取存储介质中,这里所称得的存储介质,如:ROM、RAM、磁碟、光盘等。
以上所述仅为本发明的原理及实施方式进行了阐述,以上实施例的说明只是用于帮助理解本发明的方法及其核心思想;同时,对于本领域的一半技术人员,根据本发明的思想,在具体实施方式及应用范围上均会有改变之处。综上所述,本说明书内容不应该理解为对本发明的限制。凡在本发明的精神和原则之内所做的任何修改、等同替换、改进等,均包含在本发明的保护范围内。

Claims (12)

1.一种用于物联网实体搜索的方法,其内容包括:
处理用户的查询语句并与知识图谱中的概念进行映射的方法;
通过知识图谱对查询语句进行语义分析并生成***内查询语句的方法;
构造、拓展、更新知识图谱的方法;
对传感网***进行分布式查询的方法与协议。
2.如权利要求 1 中所述的方法,其特征在于,处理用户的查询语句并与知识图谱中的概念进行映射的方法,包括:
分词:即将语言划分为独立的词汇;
成分分析:确定词汇在语句中的成分,如主语、谓语或者宾语;
成分补全:将语句中省略的成分填充完整;
代词替换:将语句中的代词替换成对应的实体;
语序重排:将倒装句、问句、从句等句式进行排序和拆分;
消歧:通过概率分析等手段,将有歧义的词汇转换为无歧义词汇或者限定其表达的含义;
迭代:重复以上步骤,直到解析结果达到预期精度;
以上过程的顺序并不固定,且并非每步都必须执行,根据用户输入的语句有选择地进行,其中使用到的一些逻辑规则存储于知识图谱中。
3.如权利要求 1 中所述的方法,其特征在于,方法生成的中间语言和用户所要表达的含义之间是对应的关系,即每句中间语言只能表达一种含义。
4.如权利要求 1 中所述的方法,其特征在于,知识图谱,包括:
实体的定义:实体包含名称等属性,对属性的约束,可以对实体进行的动作,实体可以发出的动作等;
关系:包括关系描述,关系建立的条件和断开的条件,判断实体间是否存在关系的方法等,这种关系可以是多个实体间和非实体间的;
非实体的定义:非实体指一些不具有实体特性的概念,非实体可以包含描述信息,适用范围,应用方法等。
5.如权利要求 1 中所述的方法,其特征在于,通过知识图谱对查询语句进行语义分析并生成***内查询语句的方法,包括:
实体映射,将语句中的词语映射为实体;
非实体映射,将语句中的词语映射为非实体;
关系映射,分析实体与非实体之间的关系;
语境分析,根据语句中词语的组合、顺序等特征判断语句所描述内容的环境;
语义分析,解析语句想要表达的意思,即希望***完成什么操作;
以上过程的顺序并不固定,且并非每步都必须执行,根据中间语言有选择地进行。
6.如权利要求 1 中所述的方法,其特征在于,构造、拓展、更新知识图谱的方法,包括:
通过向导对人工智能***进行样本训练;
直接向知识图谱添加内容;
通过对互联网、物联网等媒体上的信息进行聚类分析;
通过对知识图谱中已有的内容进行逻辑推导获得新的内容或者挖掘出潜在的内容。
7.如权利要求 1 中所述的方法,其特征在于,分布式查询方法,包括:
传感网网关将***内查询语句转发给传感网***的顶层实体节点;
顶层实体节点生成子查询语句并发放给下一层实体节点;
各层实体节点检查自身是否符合查询条件;
非底层实体节点将子节点返回的结果进行归并和排序;
各层实体节点将结果返回给上一层实体节点。
8.如权利要求 1 中所述的方法,其特征在于,分布式查询协议,包括:
头文件:查询任务的状态代码(正常,错误),报文类型(请求、响应、控制),发起人,协议版本号,正文的格式(如JSON或XML)、编码(如GBK或UTF8),是否加密、压缩等;
正文:请求报文包括查询语句,对查询的非功能性需求;响应报文正文包括查询结果集,包括结果数量,查询时间,完成时间,符合条件的实体列表等信息;控制报文正文包括对查询连接的控制命令(如建立、断开、挂起或流量控制)和连接状态信息;
查询协议不规定查询的具体实现方式。
9.一种用于物联网实体搜索的***,该***分为三层,其内容包括:
搜索应用层:响应用户的搜索请求,调用知识图谱解析查询语句并可视化呈现查询结果;
逻辑处理层:用于存储维护知识图谱和对知识图谱进行更新;
实体搜索层:用于承载搜索应用层和逻辑处理层,执行具体查询任务,并对结果进行归并、筛选、排序和分页操作。
10.如权利要求 9 中所述的***,其特征在于,搜索应用层,包括:
生成没有歧义的中间语言的实体映射模块;
将上述中间语言解析为***内查询语句的语义分析模块;
将查询任务分配给服务器集群并将查询结果显示的结果显示模块。
11.如权利要求 9 中所述的***,其特征在于,逻辑处理层,包括:
用于存储维护知识图谱的知识图谱***和用于对知识图谱进行构造、拓展、更新的人工智能***。
12.如权利要求 9 中所述的***,其特征在于,实体搜索层,包括:
服务器集群:作为承载搜索应用层和逻辑处理层的硬件平台;
服务器集群负责将用户输入的查询语句转化为***内查询任务并发送给传感网***,然后对传感网***返回的查询结果进行归并、筛选、排序和分页,最后返回给应用层的结果显示模块;
传感网***:由实体节点和传感器节点组成,在满足分布式搜索协议的条件下,传感网也可以是异构的或者虚拟的;
传感网***使用树状拓扑结构,其顶层节点必须是实体节点,传感器节点必须是叶节点;
实体节点的子节点既可以是实体节点也可以是传感器节点;
实体节点用于识别并标记一个实体,并对查询语句做出响应;
传感器节点用于采集所属实体的属性信息,除了实时信息,传感器还会保存节点的历史状态信息;
对于近期的历史信息,采用等时间间隔的方式保存,长时期历史信息时间越早间隔越大。
CN201710011671.1A 2017-01-07 2017-01-07 基于人工智能的物联网实体搜索方法及*** Pending CN106649878A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201710011671.1A CN106649878A (zh) 2017-01-07 2017-01-07 基于人工智能的物联网实体搜索方法及***

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201710011671.1A CN106649878A (zh) 2017-01-07 2017-01-07 基于人工智能的物联网实体搜索方法及***

Publications (1)

Publication Number Publication Date
CN106649878A true CN106649878A (zh) 2017-05-10

Family

ID=58842723

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201710011671.1A Pending CN106649878A (zh) 2017-01-07 2017-01-07 基于人工智能的物联网实体搜索方法及***

Country Status (1)

Country Link
CN (1) CN106649878A (zh)

Cited By (31)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108156260A (zh) * 2018-02-09 2018-06-12 北京物联港科技发展有限公司 一种物联港跨厂商设备通讯平台
CN108345647A (zh) * 2018-01-18 2018-07-31 北京邮电大学 基于Web的领域知识图谱构建***及方法
CN108461151A (zh) * 2017-12-15 2018-08-28 北京大学深圳研究生院 一种知识图谱的逻辑增强方法及装置
CN108848192A (zh) * 2018-08-01 2018-11-20 佛山市甜慕链客科技有限公司 一种物联网设备集群进行分布式处理的方法
CN108874907A (zh) * 2018-05-25 2018-11-23 北京明略软件***有限公司 一种数据查询方法和装置、计算机可读存储介质
CN109086316A (zh) * 2018-06-27 2018-12-25 南京邮电大学 面向工业物联网资源的知识图谱自主构建***
CN109165296A (zh) * 2018-06-27 2019-01-08 南京邮电大学 工业物联网资源知识图谱构建方法、可读存储介质和终端
CN109189946A (zh) * 2018-11-06 2019-01-11 湖南云智迅联科技发展有限公司 一种将设备故障语句描述转换为知识图谱表达的方法
CN109344238A (zh) * 2018-09-18 2019-02-15 阿里巴巴集团控股有限公司 用户问句的补词方法和装置
CN109657067A (zh) * 2018-11-19 2019-04-19 平安科技(深圳)有限公司 知识图谱的展示方法、装置、计算机设备和存储介质
CN109844743A (zh) * 2017-06-26 2019-06-04 微软技术许可有限责任公司 在自动聊天中生成响应
WO2019144587A1 (zh) * 2018-01-24 2019-08-01 平安医疗健康管理股份有限公司 融合医学知识及应用病例的动态知识图谱更新方法
CN110222127A (zh) * 2019-06-06 2019-09-10 中国电子科技集团公司第二十八研究所 基于知识图谱的信息汇聚方法、装置和设备
CN110263180A (zh) * 2019-06-13 2019-09-20 北京百度网讯科技有限公司 意图知识图谱生成方法、意图识别方法及装置
CN110275898A (zh) * 2018-03-16 2019-09-24 埃森哲环球解决方案有限公司 使用基于知识图的解释性设备管理的集成监控与通信***
CN110334939A (zh) * 2019-07-01 2019-10-15 济南大学 门窗定制物料信息快速配置方法、***、设备及介质
CN110379520A (zh) * 2019-06-18 2019-10-25 北京百度网讯科技有限公司 医疗知识图谱的挖掘方法及装置、计算机设备及可读介质
CN110727806A (zh) * 2019-12-17 2020-01-24 北京百度网讯科技有限公司 基于自然语言和知识图谱的文本处理方法及装置
CN111353049A (zh) * 2020-02-24 2020-06-30 京东方科技集团股份有限公司 数据更新方法、装置、电子设备及计算机可读存储介质
CN111431962A (zh) * 2020-02-20 2020-07-17 北京邮电大学 基于情景感知计算的跨域资源接入物联网服务发现方法
CN111581237A (zh) * 2019-02-15 2020-08-25 阿里巴巴集团控股有限公司 数据查询方法、装置、***及电子设备
CN111611448A (zh) * 2019-02-22 2020-09-01 通用电气公司 知识驱动的联合大数据查询和分析平台
CN111611304A (zh) * 2019-02-22 2020-09-01 通用电气公司 知识驱动的联合大数据查询和分析平台
CN111723214A (zh) * 2020-06-09 2020-09-29 云南大学 一种面向模式的非功能需求知识精化方法
CN111738296A (zh) * 2020-05-22 2020-10-02 广东科学技术职业学院 基于数据融合的一站式服务平台
CN111886601A (zh) * 2019-03-01 2020-11-03 卡德乐人工智能私人有限公司 用于自适应问答的***和方法
CN112115276A (zh) * 2020-09-18 2020-12-22 平安科技(深圳)有限公司 基于知识图谱的智能客服方法、装置、设备及存储介质
CN112507123A (zh) * 2020-12-04 2021-03-16 北京搜狗科技发展有限公司 一种数据处理方法及装置
CN113919360A (zh) * 2020-07-09 2022-01-11 阿里巴巴集团控股有限公司 语义理解方法、语音交互方法、装置、设备及存储介质
CN117422002A (zh) * 2023-12-19 2024-01-19 利尔达科技集团股份有限公司 一种基于aigc的嵌入式产品生成方法、***及存储介质
US12019990B2 (en) 2019-12-17 2024-06-25 Beijing Baidu Netcom Science Technology Co., Ltd. Representation learning method and device based on natural language and knowledge graph

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101510221A (zh) * 2009-02-17 2009-08-19 北京大学 一种用于信息检索的查询语句分析方法与***
CN104598623A (zh) * 2015-02-03 2015-05-06 东南大学 综合传感网分层数据管理***
CN104866593A (zh) * 2015-05-29 2015-08-26 中国电子科技集团公司第二十八研究所 一种基于知识图谱的数据库搜索方法
US20160041986A1 (en) * 2014-08-08 2016-02-11 Cuong Duc Nguyen Smart Search Engine
CN105824802A (zh) * 2016-03-31 2016-08-03 清华大学 一种获取知识图谱向量化表示的方法以及装置
CN105868313A (zh) * 2016-03-25 2016-08-17 浙江大学 一种基于模板匹配技术的知识图谱问答***及方法

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101510221A (zh) * 2009-02-17 2009-08-19 北京大学 一种用于信息检索的查询语句分析方法与***
US20160041986A1 (en) * 2014-08-08 2016-02-11 Cuong Duc Nguyen Smart Search Engine
CN104598623A (zh) * 2015-02-03 2015-05-06 东南大学 综合传感网分层数据管理***
CN104866593A (zh) * 2015-05-29 2015-08-26 中国电子科技集团公司第二十八研究所 一种基于知识图谱的数据库搜索方法
CN105868313A (zh) * 2016-03-25 2016-08-17 浙江大学 一种基于模板匹配技术的知识图谱问答***及方法
CN105824802A (zh) * 2016-03-31 2016-08-03 清华大学 一种获取知识图谱向量化表示的方法以及装置

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
刘峤等: "知识图谱构建技术综述" *

Cited By (47)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109844743A (zh) * 2017-06-26 2019-06-04 微软技术许可有限责任公司 在自动聊天中生成响应
CN109844743B (zh) * 2017-06-26 2023-10-17 微软技术许可有限责任公司 在自动聊天中生成响应
CN108461151A (zh) * 2017-12-15 2018-08-28 北京大学深圳研究生院 一种知识图谱的逻辑增强方法及装置
CN108461151B (zh) * 2017-12-15 2021-06-15 北京大学深圳研究生院 一种知识图谱的逻辑增强方法及装置
CN108345647A (zh) * 2018-01-18 2018-07-31 北京邮电大学 基于Web的领域知识图谱构建***及方法
CN108345647B (zh) * 2018-01-18 2021-12-03 北京邮电大学 基于Web的领域知识图谱构建***及方法
WO2019144587A1 (zh) * 2018-01-24 2019-08-01 平安医疗健康管理股份有限公司 融合医学知识及应用病例的动态知识图谱更新方法
CN108156260A (zh) * 2018-02-09 2018-06-12 北京物联港科技发展有限公司 一种物联港跨厂商设备通讯平台
CN110275898B (zh) * 2018-03-16 2023-07-21 埃森哲环球解决方案有限公司 使用基于知识图的解释性设备管理的集成监控与通信***
CN110275898A (zh) * 2018-03-16 2019-09-24 埃森哲环球解决方案有限公司 使用基于知识图的解释性设备管理的集成监控与通信***
CN108874907A (zh) * 2018-05-25 2018-11-23 北京明略软件***有限公司 一种数据查询方法和装置、计算机可读存储介质
CN109086316B (zh) * 2018-06-27 2021-09-14 南京邮电大学 面向工业物联网资源的知识图谱自主构建***
CN109165296B (zh) * 2018-06-27 2021-05-18 南京邮电大学 工业物联网资源知识图谱构建方法、可读存储介质和终端
CN109165296A (zh) * 2018-06-27 2019-01-08 南京邮电大学 工业物联网资源知识图谱构建方法、可读存储介质和终端
CN109086316A (zh) * 2018-06-27 2018-12-25 南京邮电大学 面向工业物联网资源的知识图谱自主构建***
CN108848192A (zh) * 2018-08-01 2018-11-20 佛山市甜慕链客科技有限公司 一种物联网设备集群进行分布式处理的方法
CN109344238A (zh) * 2018-09-18 2019-02-15 阿里巴巴集团控股有限公司 用户问句的补词方法和装置
CN109189946A (zh) * 2018-11-06 2019-01-11 湖南云智迅联科技发展有限公司 一种将设备故障语句描述转换为知识图谱表达的方法
CN109657067A (zh) * 2018-11-19 2019-04-19 平安科技(深圳)有限公司 知识图谱的展示方法、装置、计算机设备和存储介质
CN111581237A (zh) * 2019-02-15 2020-08-25 阿里巴巴集团控股有限公司 数据查询方法、装置、***及电子设备
CN111581237B (zh) * 2019-02-15 2023-06-09 阿里巴巴集团控股有限公司 数据查询方法、装置、***及电子设备
CN111611448A (zh) * 2019-02-22 2020-09-01 通用电气公司 知识驱动的联合大数据查询和分析平台
CN111611304A (zh) * 2019-02-22 2020-09-01 通用电气公司 知识驱动的联合大数据查询和分析平台
CN111886601B (zh) * 2019-03-01 2024-03-01 卡德乐人工智能私人有限公司 用于自适应问答的***和方法
CN111886601A (zh) * 2019-03-01 2020-11-03 卡德乐人工智能私人有限公司 用于自适应问答的***和方法
CN110222127A (zh) * 2019-06-06 2019-09-10 中国电子科技集团公司第二十八研究所 基于知识图谱的信息汇聚方法、装置和设备
CN110263180A (zh) * 2019-06-13 2019-09-20 北京百度网讯科技有限公司 意图知识图谱生成方法、意图识别方法及装置
CN110379520A (zh) * 2019-06-18 2019-10-25 北京百度网讯科技有限公司 医疗知识图谱的挖掘方法及装置、计算机设备及可读介质
CN110334939B (zh) * 2019-07-01 2022-03-15 济南大学 门窗定制物料信息快速配置方法、***、设备及介质
CN110334939A (zh) * 2019-07-01 2019-10-15 济南大学 门窗定制物料信息快速配置方法、***、设备及介质
CN110727806A (zh) * 2019-12-17 2020-01-24 北京百度网讯科技有限公司 基于自然语言和知识图谱的文本处理方法及装置
CN110727806B (zh) * 2019-12-17 2020-08-11 北京百度网讯科技有限公司 基于自然语言和知识图谱的文本处理方法及装置
US12019990B2 (en) 2019-12-17 2024-06-25 Beijing Baidu Netcom Science Technology Co., Ltd. Representation learning method and device based on natural language and knowledge graph
CN111431962B (zh) * 2020-02-20 2021-10-01 北京邮电大学 基于情景感知计算的跨域资源接入物联网服务发现方法
CN111431962A (zh) * 2020-02-20 2020-07-17 北京邮电大学 基于情景感知计算的跨域资源接入物联网服务发现方法
CN111353049A (zh) * 2020-02-24 2020-06-30 京东方科技集团股份有限公司 数据更新方法、装置、电子设备及计算机可读存储介质
CN111738296B (zh) * 2020-05-22 2023-10-10 广东科学技术职业学院 基于数据融合的一站式服务平台
CN111738296A (zh) * 2020-05-22 2020-10-02 广东科学技术职业学院 基于数据融合的一站式服务平台
CN111723214A (zh) * 2020-06-09 2020-09-29 云南大学 一种面向模式的非功能需求知识精化方法
CN111723214B (zh) * 2020-06-09 2024-05-17 云南大学 一种面向模式的非功能需求知识精化方法
CN113919360A (zh) * 2020-07-09 2022-01-11 阿里巴巴集团控股有限公司 语义理解方法、语音交互方法、装置、设备及存储介质
CN112115276B (zh) * 2020-09-18 2024-05-24 平安科技(深圳)有限公司 基于知识图谱的智能客服方法、装置、设备及存储介质
CN112115276A (zh) * 2020-09-18 2020-12-22 平安科技(深圳)有限公司 基于知识图谱的智能客服方法、装置、设备及存储介质
WO2022116527A1 (zh) * 2020-12-04 2022-06-09 北京搜狗科技发展有限公司 一种数据处理方法及装置
CN112507123A (zh) * 2020-12-04 2021-03-16 北京搜狗科技发展有限公司 一种数据处理方法及装置
CN117422002A (zh) * 2023-12-19 2024-01-19 利尔达科技集团股份有限公司 一种基于aigc的嵌入式产品生成方法、***及存储介质
CN117422002B (zh) * 2023-12-19 2024-04-19 利尔达科技集团股份有限公司 一种基于aigc的嵌入式产品生成方法、***及存储介质

Similar Documents

Publication Publication Date Title
CN106649878A (zh) 基于人工智能的物联网实体搜索方法及***
CN109710701B (zh) 一种用于公共安全领域大数据知识图谱的自动化构建方法
US10725836B2 (en) Intent-based organisation of APIs
CN104346377B (zh) 一种基于唯一标识的数据集成和交换方法
JP5904559B2 (ja) シナリオ生成装置、及びそのためのコンピュータプログラム
CN111428054A (zh) 一种网络空间安全领域知识图谱的构建与存储方法
CN103631596B (zh) 业务对象数据录入及更新规则的配置装置和配置方法
CN107341215A (zh) 一种基于分布式计算平台的多源垂直知识图谱分类集成查询方法
Jabbar et al. A methodology of real-time data fusion for localized big data analytics
Delgado et al. An evaluation of ontology matching techniques on geospatial ontologies
WO2015093540A1 (ja) フレーズペア収集装置、及びそのためのコンピュータプログラム
CN106202514A (zh) 基于Agent的突发事件跨媒体信息的检索方法及***
CN105518658A (zh) 用于将数据记录分组的设备、***以及方法
CN110309289A (zh) 一种句子生成方法、句子生成装置及智能设备
JP5907393B2 (ja) 複雑述語テンプレート収集装置、及びそのためのコンピュータプログラム
CN110390352A (zh) 一种基于相似性哈希的图像暗数据价值评估方法
KR102125455B1 (ko) Bim 기반 항만 유지 관리를 위한 데이터 구축 시스템 및 그 방법
CN102968431B (zh) 一种基于依存树的中文实体关系挖掘的控制装置
CN109299340A (zh) 一种基于图数据库的微博用户转发关系导入及可视化方法
CN101770473A (zh) 层次化语义脉络文档查询方法
CN113377739A (zh) 知识图谱应用方法、平台、电子设备及存储介质
CN113392212A (zh) 一种服务知识图谱构建方法、装置、电子设备及存储介质
Wang et al. Design and Implementation of Event Knowledge Graph Construction Platform Based on Neo4j
Deng et al. Social Web Meets Sensor Web: From User-Generated Content to Linked Crowdsourced Observation Data
CN113807102A (zh) 建立语义表示模型的方法、装置、设备和计算机存储介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
WD01 Invention patent application deemed withdrawn after publication

Application publication date: 20170510

WD01 Invention patent application deemed withdrawn after publication