CN111339246A - 查询语句模板的生成方法、装置、设备及介质 - Google Patents

查询语句模板的生成方法、装置、设备及介质 Download PDF

Info

Publication number
CN111339246A
CN111339246A CN202010085006.9A CN202010085006A CN111339246A CN 111339246 A CN111339246 A CN 111339246A CN 202010085006 A CN202010085006 A CN 202010085006A CN 111339246 A CN111339246 A CN 111339246A
Authority
CN
China
Prior art keywords
query
question
statement
query statement
template
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202010085006.9A
Other languages
English (en)
Other versions
CN111339246B (zh
Inventor
熊俊宇
魏琪康
周煜
钟黎
刘黎春
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Tencent Cloud Computing Beijing Co Ltd
Original Assignee
Tencent Cloud Computing Beijing Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Tencent Cloud Computing Beijing Co Ltd filed Critical Tencent Cloud Computing Beijing Co Ltd
Priority to CN202010085006.9A priority Critical patent/CN111339246B/zh
Publication of CN111339246A publication Critical patent/CN111339246A/zh
Application granted granted Critical
Publication of CN111339246B publication Critical patent/CN111339246B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/33Querying
    • G06F16/3331Query processing
    • G06F16/334Query execution
    • G06F16/3344Query execution using natural language analysis
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/36Creation of semantic tools, e.g. ontology or thesauri
    • G06F16/367Ontology

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Computational Linguistics (AREA)
  • Data Mining & Analysis (AREA)
  • Databases & Information Systems (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Animal Behavior & Ethology (AREA)
  • Artificial Intelligence (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本申请公开了一种查询语句模板的生成方法、装置、设备及介质,涉及知识图谱领域。所述方法包括:获取配置文件,所述配置文件包括实体类型和提问模式,所述提问模式是采用人类可读的查询描述语言描述的;根据所述实体类型和所述查询描述语言生成查询语句模板;存储所述查询语句模板。通过获取到的配置文件生成查询语句模板,从而可根据输入语句确定对应的查询语句模板,进一步可确定查询语句,并从知识图谱数据库中获取问题对应的答案,因此,只需要用户提供对应的配置文件,即可在不同的应用场景下自动生成查询语句模板并实现问答交互,无需用户理解数据库查询语言或编写查询语句模板。

Description

查询语句模板的生成方法、装置、设备及介质
技术领域
本申请涉及知识图谱领域,特别涉及一种查询语句模板的生成方法、装置、设备及介质。
背景技术
在垂直领域的知识图谱中,需要根据不同领域对应的查询语句模板确定查询语句对应的答案。
相关技术中,在垂直领域的知识图谱问答***中设置有该领域的查询语句模板。当用户输入一个自然语言形式的问题后,根据查询语句模板将该问题确定为机器语言形式的查询语句,从而该垂直领域的知识图谱问答***能够从该领域的知识图谱中获取该问题对应的答案。在不同的垂直领域迁移时,需要更改查询语句模板。比如,在金融领域中,上述垂直领域的知识图谱问答***中存在查询语句模板a;当该垂直领域的知识图谱问答***应用于音乐领域时,需要该垂直领域的知识图谱问答***的管理人员将查询语句模板a更改为音乐领域对应的查询语句模板b。
基于上述情况,针对不同垂直领域的问答事件,需要该垂直领域的知识图谱问答***的管理人员对查询语句模板进行修改或重新编写,甚至对代码进行修改,才能得到合适的查询语句模板,更改过程较为麻烦。
发明内容
本申请实施例提供了一种查询语句模板的生成方法、装置、设备及介质,在针对不同领域的问答事件中,无需管理人员对查询语句模板进行修改或重新编写,不涉及管理人员的代码修改,简化了对查询语句模板进行更改的过程,所述技术方案如下:
根据本申请的一个方面,提供了一种查询语句模板的生成方法,所述方法包括:
获取配置文件,所述配置文件包括实体类型和提问模式,所述提问模式是采用人类可读的查询描述语言描述的;
根据所述实体类型和所述查询描述语言生成查询语句模板;
存储所述查询语句模板。
根据本申请的另一方面,提供了一种查询语句模板的生成装置,所述装置包括:
获取模块,用于获取配置文件,所述配置文件包括实体类型和提问模式,所述提问模式是采用人类可读的查询描述语言描述的;
生成模块,用于根据所述实体类型和所述查询描述语言生成查询语句模板;
存储模块,用于存储所述查询语句模板。
根据本申请的另一方面,提供了一种计算机设备,所述计算机设备包括处理器和存储器,所述存储器中存储有至少一条指令、至少一段程序、代码集或指令集,所述至少一条指令、至少一段程序、代码集或指令集由所述处理器加载并执行以实现如上方面所述的查询语句模板的生成方法。
根据本申请的另一方面,提供了一种计算机可读存储介质,所述存储介质中存储有至少一条指令、至少一段程序、代码集或指令集,所述至少一条指令、所述至少一段程序、所述代码集或指令集由处理器加载并执行,以实现上方面所述的查询语句模板的生成方法。
本申请实施例提供的技术方案带来的有益效果至少包括:
通过获取到的配置文件生成查询语句模板,从而可根据输入语句确定对应的查询语句模板,进一步可确定查询语句,并从知识图谱数据库中获取对应的应答信息,因此,只需要用户提供不同应用场景下对应的配置文件,即可在不同的应用场景下自动生成查询语句模板并实现问答交互,无需用户理解数据库查询语言或编写查询语句模板,也无需用户熟悉代码语言。
附图说明
为了更清楚地说明本申请实施例中的技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本申请的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1是本申请一个示例性实施例提供垂直领域的知识图谱问答***的结构框图;
图2是本申请一个示例性实施例提供的计算机***的结构示意图;
图3是本申请一个示例性实施例提供的查询语句模板的生成方法的流程图;
图4是本申请另一个示例性实施例提供的查询语句模板的生成方法的流程图;
图5是本申请一个示例性实施例提供的配置文件的示意图;
图6是本申请一个示例性实施例提供的目标查询语句模板的确定方法的流程图;
图7是本申请一个示例性实施例提供的垂直领域的知识图谱问答***的界面示意图;
图8是本申请一个示例性实施例提供的垂直领域的知识图谱问答***进行初始化工作的方法的流程图;
图9是本申请另一个示例性实施例提供的垂直领域的知识图谱问答***的结构框图;
图10是本申请一个示例性实施例提供的垂直领域的知识图谱问答***在计算机上的界面示意图;
图11是本申请一个示例性实施例提供的垂直领域的知识图谱问答***在智能手机上的界面示意图;
图12是本申请一个示例性实施例提供的查询语句模板的生成装置的结构框图;
图13是本申请一个示例性实施例提供的服务器的结构框图;
图14是本申请一个示例性实施例提供的计算机设备的结构示意图。
具体实施方式
为使本申请的目的、技术方案和优点更加清楚,下面将结合附图对本申请实施方式作进一步地详细描述。
首先,对本申请实施例涉及的名词进行介绍:
知识图谱(Knowledge Graph):是以实体、实体关系为基本单元所组成的图结构。基于该图结构的知识,通过分析用户的自然语言,在已构建的结构化知识图谱中通过检索、匹配或推理等手段,获取正确答案。知识图谱用于描述真实世界中存在的各种实体和概念,以及它们之间的关系,比如,一个人是一个实体,这个人具有年龄、身高、体重等属性(也即实体属性),这个人与其他人是朋友或同事的关系(也即实体之间的关系)。
图数据库:是指用图来存储数据,属于一种存储数据的数据结构方式。如,Neo4j是一个图形数据库,在属性图中,图是由顶点(Vertex)、边(Edge)和属性(Property)组成的,顶点又被命名为节点,边又被命名为关系,每个节点和关系对应一个或多个属性。本申请实施例中的图数据库是基于知识图谱构建的数据库。
正则表达式(Regulation Expression):又被命名为规则表达式,用于检索符合规则的文本。正则表达式能够将字符及字符的组合,组成一个规则字符串,该规则字符串用于表达字符串的一种过滤逻辑。
自然语言处理(Natural Language Processing,NLP):是指计算机接收用户以自然语言形式的输入,并在内部通过用户所定义的算法进行加工、计算等系列操作,以模拟用户对自然语言的理解,并返回用户所期望的结果。
查询描述语言:是指一种非正式的,类似于英语结构的,用于描述结构图的语言。本申请实施例中采用以人类可读的查询描述语言,对配置文件中的提问模式进行描述,比如,查询描述语言是:p发布时间,p表示提问相关实体的实体属性。
实体(Entity):是指现实世界中客观存在可与其他事物相互区别的事物,实体可以是具体的对象,如人、地名、公司、电话、动物、天气、工具、终端等,也可以是时间,如一场篮球赛对应的时间也是实体。具有共同要素的实体的集合是实体类型,如歌曲A、歌曲B和歌曲C对应的实体类型的是音乐。
实体属性(attribute):是指实体的多个特性,每一个特性称为属性,每个属性有一个值域,其类型可以是整数型、字符型、字符串型,如,学生(是实体)对应有学号、年龄、性别等属性,对应的值域为字符型、整数型、字符串型中的任意一种。
知识图谱一般分为通用领域的知识图谱和垂直领域的知识图谱,二者对应的知识图谱问答***分别是通用领域的知识图谱问答***和垂直领域的知识图谱问答***。相关技术中通过通用领域的知识图谱问答***在海量开放领域的公开数据集上进行问答任务,如在数据链数据集问答***(Question Answering over Linked Data,QALD)或基于知识图谱问答***的标准数据集(WebQuestions)上进行问答任务等,但目前上述方式只支持一些较为简单的问答模式,或在进行复杂查询的情况下,查询的结果准确率较低且速度较慢,无法达到实际需求。另外,上述两种类型的知识图谱问答***都是生成Sqarql语句,在实际问答事件中,需要使用各种图数据库,需要生成如Neoj4图数据库的Cypher查询语句等。在示例性的应用过程中,知识图谱问答***还需具备多轮对话能力,即在查询语句的语义不明的情况下,进行意图澄清,从而确定查询语句对应的应答信息。相关技术中通过大量定制化的查询语句模板来解决上述问题,而在垂直领域的知识图谱问答***中,由于各个垂直领域涉及的专业知识跨度较大,在知识图谱问答***中需要针对不同的垂直领域或不同的应用场景定制查询语句模板才能解决上述问题。
本申请实施例提供了一种查询语句模板的生成方法,该方法只需要用户针对不同的垂直领域或不同的应用场景提供对应的配置文件,即可构建垂直领域的知识图谱问答***(以下简称知识图谱问答***),该知识图谱问答***会根据配置文件自动生成适用于该垂直领域的知识图谱对应的查询语句模板。同时,该知识图谱问答***可与用户进行多轮对话,具备对上下文语境的理解能力,无需用户更改查询语句模板或更改代码。
图1示出了本申请一个示例性实施例提供的垂直领域的知识图谱问答***100,该知识图谱问答***100包括:查询语句模板生成模块101、语句预处理分析模块102、答案初获取模块103、多轮对话管理模块104和返回结果处理模块105。
查询语句模板生成模块101读取用户提供的配置文件,根据该配置文件生成提问模式与查询语句模板之间的映射关系。可选地,用户可以是该知识图谱问答***100的管理人员,或图数据库的管理人员,或具有相关专业知识的代码编写人员,或普通用户。该配置文件至少包括一组实体类型和提问模式,该提问模式是采用人类可读的查询描述语言描述的,查询描述语言是一种非正式的,类似英语结构的,用于描述对结构图进行的查询操作的语言。每组实体类型和提问模式用于生成一个查询语句模板。
语句预处理分析模块102获取输入语句,并对输入语句进行分析,将分析结果发送给答案初获取模块103,分析结果包括:输入语句中包括的实体类型和提问模式,其中,提问模式包括如下方式中的至少一种:对实体属性进行提问和对至少两个实体之间的关系进行提问。
答案初获取模块103根据分析结果,从查询语句模板生成模块101处获取查询语句模板,根据查询语句模板将输入语句转化为机器语言形式的查询语句,并将查询语句发送至返回结果处理模块105,返回结果处理模块105根据查询语句,从知识图谱数据库中查询到对应的答案,并将该答案反馈给用户。
若用户输入的语句信息不完整,如,缺少实体类型,答案初获取模块103无法从查询语句模板生成模块101处获取到查询语句模板,则将分析结果发送至多轮对话管理模块104。多轮对话管理模块104对上述分析结果进行多轮对话模式的判断,如子图记忆模式、子图跳转模式、多轮反问模式、内容补充模式等。多轮对话管理模块104可通过多轮对话模式并结合输入语句的上下文后获取对应的查询语句模板,将获取到的查询语句模板发送至答案初获取模块103中。答案初获取模块103根据获取到的查询语句模板和分析结果生成查询语句,并将查询语句发送至返回结果处理模块105,返回结果处理模块105根据查询语句,从知识图谱数据库中查询到对应的答案,并将该答案反馈给用户。
针对不同的应用场景或不同的垂直领域,用户只需要向该知识图谱问答***100提交对应的配置文件,该知识图谱问答***100即可根据配置文件进行语句分析,知识图谱问答***100中的多轮对话管理模块104对多轮对话的输入语句具有理解能力,可结合输入语句的上下文分析出当前语句的含义,确定对应的查询语句模板,从而使得该知识图谱问答***100适用于多种应用场景下的问答交互方式,无需用户针对不同应用场景反复修改查询语句模板。
图2示出了本申请一个示例性实施例提供的计算机***的结构示意图。该计算机***110包括:终端120和服务器140。
终端120安装和运行有支持知识图谱问答***的平台客户端,该平台客户端可以是对应的应用程序、小程序、网页、信息交互平台(如公众号)中的任意一种,终端120是用户使用的终端,用户在终端120上的知识图谱问答***的平台客户端中进行至少一轮的问答事件,一轮问答事件是指用户和该平台客户端进行一轮交互,以用户提出一次问题开始,该平台客户端给出该问题的答案为结束对应的过程计为一轮。示意性的,用户提出的问题是“昆明有哪些好吃的?”,该平台客户端给出的答案是“过桥米线、鲜花饼、烧饵块”,则一轮问答事件结束。用户可通过向该平台客户端输入文字、语音、图片、视频等方式提出问题,平台客户端也可通过文字、语音、图片、视频等方式提供问题的答案。
终端120通过无线网络或有线网络与服务器140相连。
服务器140包括一台服务器、多台服务器、云计算平台和虚拟化中心中的至少一种。示意性的,服务器140包括处理器144和存储器142,存储器142又包括获取模块1421、分析模块1422和预处理模块1423。服务器140用于为支持知识图谱问答***的平台客户端提供后台服务,如历史查询语句的存储服务、输入语句的预处理服务、查询语句模板的生成服务等。可选地,服务器140承担主要计算工作,终端120承担次要计算工作;或者,服务器140承担次要计算工作,终端120承担主要计算工作;或者,服务器140和终端120采用分布式计算架构进行协同计算。
可选地,终端120泛指多个终端中的一个,终端120上支持知识图谱问答***的平台客户端可以是一个或多个,本实施例以终端120来举例说明,终端120的设备类型包括:智能手机、平板电脑、电子书阅读器、MP3播放器、MP4播放器、膝上型便携计算机和台式计算机中的至少一种。以下实施例以终端包括智能手机来举例说明。
本领域技术人员可以知晓,上述终端的数量可以更多。比如上述终端为几十个或几百个,或者更多数量。本申请实施例对终端的数量和设备类型不加以限定。
图3示出了本申请一个示例性实施例提供的查询语句模板的生成方法,该方法应用于如图2所示的计算机***100中的服务器140中或其他计算机***中,该方法包括如下步骤:
步骤301,获取配置文件,配置文件包括实体类型和提问模式,提问模式是采用人类可读的查询描述语言描述的。
知识图谱问答***获取配置文件,配置文件是构建知识图谱问答***的相关人员提供的,如管理人员、维护人员,或是普通用户提供的,或是知识图谱***中默认配置的。
可选地,配置文件的提供方式包括:用户向知识图谱问答***对应的平台客户端上传对应的电子文档,或用户在该平台客户端输入配置文件中的相关内容,或用户提供配置文件的指示信息(如二维码),计算机设备通过识别该指示信息获取配置文件(如扫描二维码)。该平台客户端可以是应用程序,或依赖于宿主程序运行的小程序,或信息交互平台(如公众号),或网页。
实体类型是输入语句中可能出现的实体的集合,如输入语句是“上海市的天气如何?”,“上海”是输入语句中的实体,上海是一个地名,则地名是上海对应的实体类型。
可选地,用户可在平台客户端的提示下向平台客户端提供配置文件,配置文件是电子文档,电子文档包括电子表格和电子文本中的至少一种。示意性的,电子文档包括电子表格和电子文本,电子表格用于使用人类可读的查询描述语言编写实体类型和提问模式,电子文本用于列出输入语句中可能存在的实体或实体类型。
可选地,提问模式包括属性提问模式和关系提问模式中的至少一种:属性提问模式包括用于询问实体属性的提问方式,关系提问模式包括用于询问至少两个实体之间的关系。
实体属性是指实体对应的多个特性中的一个,对同一实体属性的提问语句可相同或不同,比如,“小明的年龄是几岁”或者“小明的出生年份是多少”是对小明的年龄进行提问,“小明的性别是什么”或者“小明是女孩子吗”是对小明的性别进行提问。
关系是表征不同实体之间的联系,比如,小A与小B属于同事关系,小明和大明属于父子关系,昆明市是云南省的省会。
在一个示例中,提问模式包括属性提问模式,如,对音乐(实体类型)的发布时间(实体属性)进行提问,配置文件可写为“p属于发布时间”。将变量p与查询操作结合,其中,“p”表示查询的实体类型,“发布时间”表示查询发布时间的操作。
在另一个示例中,提问模式包括关系提问模式,如,对歌手A(实体类型)在音乐排行榜上的排名(多个实体之间的关系)进行提问,配置文件可写为:Limit名次排序。将变量Limit与查询操作结合,其中,“Limit”表示查询的是至少两个实体之间的关系,“名次排序”表示查询名次排序的操作。
可以理解的是,提问模式可由提供配置文件的用户自行定义,用户可采用任意人类可读的语言来表示提问模式。如上述对歌手A在音乐排行榜上的排名进行提问,配置文件还可写为:Limit歌手&p名次排序。“Limit歌手”表示查询至少两个歌手之间的关系,“p名次排序”表示对名次排序进行查询。
步骤302,将实体类型和查询描述语言生成查询语句模板。
可选地,查询语句模板通常是人类不可读的机器语言格式,比如,查询语句模板是数据库查询语言格式,是以非人类可读模式的语言来表示的。
在一个示例中,知识图谱问答***根据实体类型1和提问模式1(对实体属性进行提问)生成查询语句模板1;在另一个示例中,知识图谱问答***根据实体类型2和提问模式2(对实体类型1和实体类型2之间的关系进行提问)生成查询语句模板2。
步骤303,存储查询语句模板。
知识图谱问答***以实体类型关联查询语句模板的方式存储查询语句模板,或以提问模式关联查询语句模板的方式存储查询语句模板,或以实体类型和提问模式的方式关联查询语句模板。在一个示例中,查询语句模板是地名对应的天气,该查询语句模板是以关联提问模式的方式存储的。当用户的输入语句中对应有关于天气的提问模式时,知识图谱问答***调用该查询语句模板。
综上所述,本实施例提供的方法,通过获取到的配置文件生成查询语句模板,从而可根据输入语句确定对应的查询语句模板,因此,只需要用户提供不同场景下对应的配置文件,即可在不同的应用场景下自动生成查询语句模板并实现问答交互,无需要用户理解数据库查询语言或编写查询语句模板,也无需用户熟悉代码语言。
图4示出了本申请另一个示例性实施例提供的查询语句模板的生成方法的流程图,该方法应用于如图2所示的计算机***中的服务器140中或其他计算机***中,该方法包括如下步骤:
该方法包括两个阶段:知识图谱问答***生成查询语句模板的阶段和获取查询语句模板的阶段。下面分别对两个阶段进行说明。
第一,知识图谱问答***生成查询语句模板的阶段。
步骤401,获取配置文件,配置文件包括实体类型和提问模式,提问模式是采用人类可读的查询描述语言描述的。
示意性的,以配置文件是针对音乐领域设置的文件为例进行说明,结合图5的(a)对配置文件进行说明。示意性的,该配置文件包括四个字段,每个字段对应一列。
第一字段是输入语句中对应的实体类型,如音乐(歌曲名称)、歌手。可选地,第一字段包括一个或多个实体类型,以分隔符号“|||”划分多个实体类型,如音乐|||排名、歌手|||排名|||类型(指歌手所属的类型,如摇滚、流行等类型)。
第二字段是输入语句中对应的提问模式,提问模式是指对输入语句中的实体类型进行提问的方式,本实施例中的提问模式是采用人类可读的查询描述语言描述的。提问模式包括属性提问模式和实体提问模式中的至少一种,属性提问模式用于对实体属性进行提问,关系提问模式用于对至少两个实体之间的关系进行提问。示意性的,属性提问模式是对歌曲(实体类型)的发布时间(实体属性)进行提问,关系提问模式是对歌手A(实体类型)在排行榜上的排名(多个实体之间的关系)进行提问。
其中,用分隔符号“|”划分用户输入的语句和提问模式,分隔符号左侧对应用户的输入语句中含有的短语或关键词,分隔符号右侧对应提问模式,且提问模式以人类可读的查询描述语言进行描述的。
可选地,在第二字段中,分隔符号“|”左侧的内容可列在第三字段中。
在上述提问模式中,包括如下形式的提问模式:
以p开头代表提问模式是对实体类型的实体属性进行提问,如,p发布时间表示对音乐(实体类型)的发布时间(属性)进行提问的属性提问模式。
以tran开头代表指定了中间跳转的实体类型(该实体类型位于符号“##”后面),辅助生成复杂的查询语句,如,“tranMusic##Singer”表示对歌手(实体类型)演唱了哪些歌曲(多个实体关系,歌手与多个歌曲之间的关系)进行提问,需要指定中间跳转至歌手(实体类型)。
以count开头代表对查询语句中的实体类型的数量进行提问,如“CountMusic”表示对歌手演唱的歌曲(实体类型)的数量(实体属性)进行提问。可选地,对歌手演唱的歌曲的数量进行提问时,配置文件还可写成“tranCountMusic##Singer”表示对歌曲的数量(实体类型)进行查询,需要指定中间跳转至歌手(实体类型)。
以limit开头代表按照实体类型的某个实体属性进行排序,输入语句中对应的实体类型在该排序下的名次,如“limitMusic&&p热度&level”表示按照音乐的热度排序,对音乐位于热度排序中的名次(多个实体之间的关系)进行提问。
以rank开头代表按照实体类型的某个实体属性进行排序,在该排序下的前N名的实体(N为正整数),如“rankMusic&&p热度&sort”表示按照音乐的热度排序,在热度排序下,对热度是前10名的音乐类型(多个实体之间的关系)进行提问。
以select开头代表按照实体类型的某个实体属性进行排序,从该排序中的第N个实体类型开始(N为正整数),连续取M个实体类型(M为正整数),如“selectMusic&&p热度&Level”表示按照音乐的热度排序,在热度排序下,对热度排在第5名至第10名的音乐(多个实体之间的关系)进行提问。
以extract开头代表按照实体类型的某个实体属性进行排序,在该排序下取实体类型所在的某个排序区间,如“extractMusic&&p热度&Level”表示按照音乐的热度排序,在热度排序下,对热度值在100至200的区间(实体之间的关系)内的音乐(如歌曲名称)进行提问。
第三字段是可选的字段,第三字段用于表示为输入语句匹配提问模式的匹配方式。可选地。匹配方式包括关键词、正则表达式、提问模式识别模型中的至少一种。
在一个示例中,图5中的第三列表格示出了用正则表达式匹配提问模式,比如,正则表达式是:(性别|是男|是女),当输入语句的提问模式符合该正则表达式时,该输入语句对应的提问模式是对人(实体类型)的性别(实体属性)进行提问。在另一个示例中,提问模式还可通过关键词进行匹配,比如,输入语句中包括与天气有关的关键词,该输入语句的提问模式是对地名(实体类型)的天气(属性)进行提问。在另一个示例中,还可通过提问模式识别模型识别输入语句中的提问模式,如,提问模式识别模型将输入语句识别为第一类型(属性提问模式),则该输入语句对应的提问模式是对实体属性进行提问。提问模式识别模型是具有识别提问模式能力的机器学习模型,提问模式识别模型可通过包含属性提问模式和关系提问模式的输入语句进行训练后得到。可选地,通过一个或多个提问模式识别模型对输入语句进行识别,从而确定输入语句的提问模式。
上述匹配方式中,以关键词进行匹配的方式可写入配置文件的第二列(第二字段)中。
第四字段是可选的字段,第四字段表示封装话术,用于对查询到的答案进行包装。如,用户查询一首歌曲的原唱歌手,知识图谱问答***查询到的答案是“小明”,在答案未经过第四字段对应封装话术处理前,知识图谱问答***输出“小明”。通过封装话术对该答案进行包装,得到包装后的结果,如“您好,该歌曲的原唱歌手是小明”,此外,用户可自定义一些话术,使得反馈给用户的查询结果质量更高。
上述配置文件还可简化为如图5的(b)所示,配置文件包括三列,分别对应三个字段。第一列对应的第一字段是实体类型。第二列对应的第二字段是提问模式,提问模式采用人类可读的查询描述语言描述的,如变量p与查询操作结合。第三列对应的第三字段是匹配模式,匹配模式可采用关键词进行匹配,如关键词包括“性别”、“男”、“女”中的至少一种,匹配提问模式是对性别(实体属性)进行提问。
可以理解的是,上述字段中每一行是一个查询语句模板,上述字段中也可使用其他符号作为分隔符号,如“\”、括号等符号,本申请实施例对分隔符号的具体形式不加以限定。上述字段的语言可以是除了中文、英文之外的其他语言,本申请实施例对字段使用的语言类型不加以限定。
步骤402,根据实体类型确定查询目标,以及根据查询描述语言确定查询操作。
输入语句中包括实体类型和提问模式,实体类型用于确定查询语句模板具体要查询的目标(查询目标),提问模式用于确定查询语句模板对实体类型(查询目标)要查询的内容(查询操作)。
在一个示例中,输入语句是“歌手的性别是什么?”,该输入语句中实体类型是“歌手”,查询描述语言是:“p性别类别”。知识图谱的问答***确定该输入语句中的查询目标是歌手,查询操作是对性别进行查询。
步骤403,将查询目标和查询操作转换为机器语言形式的查询语句模板。
根据上述示例,知识图谱问答***将配置文件中的实体类型转换为查询目标,将提问模式转换为查询操作,将查询目标和查询操作转化为机器语言形式的查询语句模板。如,知识图谱问答***将实体类型1和提问模式1转换为查询语句模板1。
步骤404,存储查询语句模板。
查询目标和查询操作转换为机器语言形式的查询语句模板与实体类型、提问模式进行关联存储。比如,查询语句模板是音乐对应的排名,该查询语句模板是以关联实体类型(音乐)和提问模式(排名,实体关系)的方式进行存储的。当用户输入的语句中对应有关于音乐和排名的信息时,则知识图谱问答***调用该查询语句模板。
第二,知识图谱问答***获取查询语句模板的阶段。
知识图谱问答***获取查询语句模板包括直接获取和间接获取两种方式,下面对直接获取的方式进行说明,直接获取的方式中输入语句对应的第一语句特征包括具有第一实体和第一提问模式。
步骤405,生成输入语句的语句特征、提问模式和查询语句模板之间的映射关系,映射关系用于在问答过程中确定输入语句所属的提问模式。
知识图谱问答***根据配置文件生成查询语句模板和映射关系。该映射关系是输入语句的语句特征、提问模式和查询语句模板之间的映射关系。
其中,语句特征包括如下方式中的至少一种:含有实体类型、含有提问模式的关键词、符合提问模式对应的正则表达式和被提问模式对应的机器识别模型识别为第一类型。
下面结合表一对语句特征、提问模式和查询语句模板之间的映射关系进行说明。
表一
Figure BDA0002381726180000131
Figure BDA0002381726180000141
在一个示例中,输入语句是“昆明市属于哪个省份?”,该输入语句含有关键词“昆明”,确定提问模式是对地名(实体类型)对应的位置(实体属性)进行提问,则查询语句模板是地名所在的省份。在另一个示例中,输入语句“歌曲A的演唱者是谁?”,通过正则表达式确定提问模式是对歌曲(实体类型)的演唱者(实体属性)进行提问,则查询语句模板是歌曲对应的原唱歌手。在另一个示例中,输入语句是“三楼都卖什么?”,通过提问模式识别模型识别该输入语句的提问模式属于第二类型(对实体关系进行提问),则查询语句模板是楼层对应的商品类型。
对于知识图谱问答***可根据输入语句直接获取查询语句模板的情况下,步骤405还包括如下子步骤:
步骤4051,对接收到的输入语句进行处理,得到输入语句对应的第一语句特征。
对输入语句的处理是指对输入的自然语言进行标准化处理,即将人类的语言符号(如文字、语言)转换为计算机能理解的语言。首先以词法分析、句法分析和语义分析中的至少一种分析方式对该输入语句进行分析,如提取输入语句中的实体类型,包括字母、数字、日期等名词,或语句中存在指代关系,需要对指代关系进行分析。然后抽取输入语句中涉及实体关系,或输入语句中存在计算数值,需要对计算数值进行提取,从而得到输入语句对应的第一语句特征。
步骤4052,根据映射关系从至少两个查询语句模板中,确定与第一语句特征对应的目标查询语句模板。
当第一语句特征包括实体类型和提问模式时,可根据实体类型直接提取出输入语句中包括的实体,确定输入语句的提问模式分为如下三种情况:
1、输入语句中含有对应的关键词时,如,输入语句是“上海下雨了吗?”,输入语句中包括关键词“下雨”,根据该关键词确定提问模式是对天气(实体属性)进行提问,知识图谱问答***从输入语句中提取出“上海”(地名,实体类型),根据实体类型和提问模式确定目标查询语句模板是地名对应的天气。
2、输入语句符合正则表达式时,如,输入语句是“上海下雨了吗?”,输入语句符合正则表达式:(地名|城市|天气|雨|雪|晴|霜|阴|气温),根据正则表达式确定提问模式是对天气(实体属性)进行提问,知识图谱问答***从输入语句中提取出“上海”(地名,实体类型),根据实体类型和提问模式确定目标查询语句模板是地名对应的天气。
3、输入语句被提问模式对应的机器识别模型识别为第一类型时,如,输入语句是“上海下雨了吗?”,提问模式识别模型对该输入语句进行识别,得到输出结果是该输入语句的提问模式属于第一类型(对天气(实体属性)进行提问),知识图谱问答***从输入语句中提取出“上海”(地名,实体类型),根据实体类型和提问模式确定目标查询语句模板是地名对应的天气。
可选地,查询语句模板采用机器语言的形式描述,如数据库语言形式,或计算机能够读取的代码。
步骤4053,根据输入语句和目标查询语句模板生成查询语句。
将输入语句中的第一实体代入至目标查询语句模板中,得到查询语句。目标查询语句模板中对应有实体类型的位置和提问模式的位置,将输入语句中的实体类型填入目标查询语句模板中实体类型的位置,将输入域语句中的提问模式填入目标查询语句模板中提问模式的位置,从而得到输入语句对应查询语句。
综上所述,本实施例提供的方法,通过配置文件将输入查询目标和查询操作转换为机器语言形式的查询语句模板,并且生成输入语句的语句特征、提问模式和查询语句模板之间的关系,对输入语句进行处理后得到第一语句特征,当第一语句特征包括实体类型和提问模式时,可直接获取目标查询语句模板,从而获得查询语句模板对应的查询语句,进一步从知识图谱数据库中获取问题对应的答案,只需要用户提供对应的配置文件,即可在不同的应用场景下自动生成查询语句模板并实现问答交互,无需用户理解数据库查询语言或编写查询语句模板,也无需用户熟悉代码语言。
下面对间接获取查询语句模板的方式进行说明。该方式包括三种情况:
1、输入语句中的第一语句特征包括具有第一实体但不包括第一提问模式;
2、输入语句中的第一语句特征包括第一提问模式但不包括具有第一实体;
3、输入语句中的第一语句特征不包括具有第一实体也不包括第一提问模式。
图6是本申请一个示例性实施例提供的目标查询语句模板的确定方法的流程图,该方法应用于如图2所示的计算机***中的服务器140中或其他计算机***中,该方法包括如下步骤:
步骤601,对接收到的输入语句进行处理,得到输入语句对应的第一语句特征。
该步骤与步骤4051一致,此处不再赘述。
步骤602,响应于根据映射关系无法确定与第一语句特征对应的目标查询语句模板,获取历史输入语句中的历史查询语句模板。
当知识图谱问答***无法根据映射关系确定与第一语句特对应的目标查询语句模板,知识图谱问答***会确定用户本轮问答事件中输入的语句的对应的历史输入语句,并获取历史输入语句对应的历史查询语句模板。
知识图谱问答***获取至少一句历史输入语句,历史输入语句是本轮问答事件的上一轮问答事件中用户输入的语句,或历史输入语句是本轮问答事件中用户最后输入的语句。在一个示例中,用户可分两次向知识图谱问答***先输入“昆明有什么好吃的?”、然后输入“大理呢?”,或者,同时输入“昆明有什么好吃的?”和“大理呢?”,且“昆明有什么好吃的?”的输入顺序要先于“大理呢?”。根据用户输入的“大理呢?”(第一语句特征不完整,只有实体类型),知识图谱问答***无法确定目标查询语句模板,因此需要获取历史查询语句模板。
步骤603,将根据第一语句特征和历史查询语句模板,得到与第一语句特征对应的替补查询语句模板。
若输入语句的第一语句特征与历史查询语句模板中的实体类型或提问模式对应,则知识图谱问答***可根据历史查询语句模板得到第一语句特征对应的替补查询语句模板。
当输入语句对应的第一语句特征不完整时,获取替补查询语句模板对应有三种情况,下面对第一种情况进行说明。
第一种情况是:输入语句中的第一语句特征包括具有第一实体但不包括第一提问 模式。
在该情况下,步骤603还包括如下子步骤:
步骤6031a,响应于第一语句特征中包括具有第一实体但不包括第一提问模式时,将含有第一实体类型的历史查询语句模板确定为替补查询语句模板,第一实体类型是第一实体具有的实体类型。
在一个示例中,用户输入的语句是“昆明有什么好吃的?大理呢?”,“昆明有什么好吃的?”是“大理呢?”对应的历史输入语句,“昆明有什么好吃的?”中的第二语句特征包括第二实体(地名)和第二提问模式(有什么美食),知识图谱问答***根据第一语句特征和映射关系确定“昆明有什么好吃的?”对应的查询语句模板是地名对应的美食。
可选地,匹配第二提问模式的方式包括:关键词、正则表达式和提问模式识别模型识别中的至少一种。
1)通过关键词匹配。如,输入语句“昆明有什么好吃的?”中包含有关键词“好吃的”,根据该关键词确定提问模式是对美食(实体属性)进行提问的,可匹配含有提问模式是对美食提问的查询语句模板。
2)正则表达式。如,输入语句“昆明有什么好吃的?”符合正则表达式:(地名|美食|特色小吃|好吃的),根据正则表达式确定提问模式是对美食(实体属性)进行提问的,可匹配含有提问模式是对美食提问的查询语句模板。
3)提问模式识别模型进行识别。提问模式识别模型对输入语句“昆明有什么好吃的?”进行识别,得到输出结果是该输入语句的提问模式属于第一类型(对美食(实体属性)进行提问),可匹配含有提问模式是对美食提问的查询语句模板。
“大理呢?”中的第一语句特征包括实体但不包括提问模式,知识图谱问答***无法根据第一语句特征和映射关系确定该输入语句对应的查询语句模板,因此获取历史输入语句“昆明有什么好吃的?”对应的历史查询语句模板,根据第一语句特征(实体,地名)符合该历史查询语句模板的提问模式,从而将含有第一实体类型的历史查询语句模板确定为替补查询语句模板,也即确定“大理呢?”对应的替补查询语句模板也是地名对应的美食。
下面对第二种情况进行说明。
第二种情况是:输入语句中的第一语句特征包括第一提问模式但不包括具有第一 实体。
在该情况下,步骤603还包括如下子步骤:
步骤6031b,响应于第一语句特征中包括第一提问模式但不包括第一实体时,获取历史输入语句的第二实体类型。
在一个示例中,输入语句是“昆明有哪些特色小吃?”,和“这里的5A级景区有哪些?”,前者的顺序先于后者,前者是后者的历史输入语句。“这里的5A级景区有哪些?”中“这里”指代的地点不明,因此无法直接获取该输入语句对应的目标查询语句模板。知识图谱问答***获取历史输入语句中的第二实体类型,也即获取“昆明”(第二实体类型)。
可选地,匹配第一提问模式和第二提问模式的方式包括:关键词、正则表达式和提问模式识别模型识别中的至少一种。
1)通过关键词匹配。输入语句“昆明有哪些特色小吃?”中包含有关键词“特色小吃”,根据该关键词确定第二提问模式是对美食(实体属性)进行提问,可匹配含有提问模式是对美食提问的查询语句模板;“这里的5A级景区有哪些?”中包含有关键词“5A级景区”,根据该关键词可确定第一提问模式是对景区(实体属性)进行提问,可匹配含有提问模式是对景区提问的查询语句模板。
2)正则表达式。输入语句“昆明有哪些特色小吃?”符合正则表达式:(地名|美食|特色小吃|好吃的),根据正则表达式确定第二提问模式是对美食(实体属性)进行提问,可匹配含有提问模式是对美食提问的查询语句模板;输入语句“这里的5A级景区有哪些?”符合正则表达式:(地名|城市|省份|国家|景区|景区等级|风景),根据正则表达式确定第一提问模式是对风景(实体属性)进行提问,可匹配提问模式是含有对景区提问的查询语句模板。
3)提问模式识别模型进行识别。提问模式识别模型对输入语句“昆明有哪些特色小吃?”进行识别,得到输出结果是该输入语句的第二提问模式属于第一类型(对美食(实体属性)进行提问),可匹配提问模式是含有对美食提问的查询语句模板;提问模式识别模型对输入语句“这里的5A级景区”进行识别,得到输出结果是该输入语句的第一提问模式属于第一类型(对景区(实体属性)进行提问),可匹配提问模式是含有对风景提问的查询语句模板。
步骤6032b,根据映射关系从至少两个查询语句模板中,确定与第一提问模式和第二实体类型对应的第二查询语句模板。
知识图谱问答***还获取历史输入语句对应的历史查询语句模板,知识图谱问答***根据“昆明(实体类型)有哪些特色小吃(提问模式)?”含有的第二语句特征(第二实体类型和第二提问模式)确定其对应的历史查询语句模板是地名对应的美食。“这里的5A级景区有哪些(提问模式)?”缺少实体类型,具有第一提问模式。因此根据第一提问模式和第二实体类型确定对应的第二查询语句模板,该第二查询语句模板是地名对应的景区。
步骤6033b,将第二查询语句模板确定为替补查询语句模板。
第二查询语句模板是保留了第二实体类型,修改了第一提问模式(将对美食提问修改为对景区提问),将修改后的第二查询语句模板确定为替补查询语句模板。
下面对第三种情况进行说明。
第三种情况是:输入语句中的第一语句特征不包括具有第一实体也不包括第一提 问模式。
步骤6031c,对接收到的输入语句进行处理,得到输入语句对应的第一语句特征。
该步骤与步骤4051一致,此处不再赘述。
步骤6032c,响应于根据映射关系无法确定与第一语句特征对应的目标查询语句模板,根据第一语句特征输出询问语句,获取询问语句对应的补充答案。
结合图7对第三种情况进行说明,以终端上运行有支持知识图谱问答***的应用程序为例,在界面70上显示有用户701输入的语句和小助手702输出的语句。用户701先输入“三号馆1楼”,由于该输入语句中第一语句特征只包括实体,因此知识图谱问答***对该输入语句进行意图澄清,也即获取输入语句对应的提问模式,需要向用户输出询问语句,将与第一语句特征相关的提问模式反馈给用户,如小助手702输出的询问语句是:为用户701找到可了解的方面包括“经营种类”、“商家列表”、“商家数量”、“类别数量”。
用户701根据询问语句继续输入“经营种类有啥(提问模式)”,从而知识图谱问答***获取到了询问语句对应的补充答案。
步骤6033c,提取补充答案中的第三语句特征。
小助手701从“经营种类有啥”中提取到的第三语句特征包括提问模式。
步骤6034c,根据映射关系从至少两个查询语句模板中,确定与第一语句特征和第三语句特征对应的第三查询语句模板。
知识图谱问答***将“三号馆1楼”与“经营种类有啥”结合起来,根据查询语句模板与语句特征之间的映射关系从至少两个查询语句模板中,确定与上述两个输入语句对应的第三查询语句模板是地点对应的经营种类。从而根据第三查询语句模板确定查询语句,并将查询语句对应的答案反馈给用户701,如小助手702为用户701找到三号馆1楼对应的经营类别包括“女装”、“生活百货”、“特色小吃”等。
上述三种方式可单独实施,也可组合实施,需要结合用户输入的语句进行实施。
步骤604,将输入语句中的第一实体代入至目标查询语句模板中,得到查询语句。
示意性的,输入语句是“大理有哪些美食?”,目标查询语句模板是地名对应的美食,将“大理”代入至目标查询语句模板中实体类型对应的位置,得到询问“大理美食”的查询语句。
综上所述,本实施例提供的方法,在输入语句中缺少必要的语句特征时,通过获取历史输入语句,并替换或修改历史输入语句对应查询语句模板中的部分内容,确定替补查询语句模板;或者,在输入语句的语义不明时,通过将与输入语句相关的提问模式以反问的形式输出给用户,在用户补充输入语句后,结合上下文确定替补查询语句模板。从而根据替补查询语句模板确定查询语句,并从知识图谱数据库中获取问题对应的答案,只需要用户提供对应的配置文件,即可在不同的应用场景下获取查询语句模板并实现问答交互,无需用户理解数据库查询语言或编写查询语句模板,或熟悉代码语言。
下面结合知识图谱问答***的结构图对知识图谱问答***的初始化的工作流程和问答过程进行说明。
图8示出了本申请一个示例性实施例提供的垂直领域的知识图谱问答***进行初始化工作的流程图。该方法应用于如图2所示的计算机***中的服务器140中或其他计算机***中,该方法包括如下步骤:
步骤1,读取配置文件。
可选地,该配置文件是用户提供的配置文件,或知识图谱问答***中针对不同领域默认设置有配置文件。可选地,知识图谱问答***可为用户提供制作配置文件的模板或提示信息,用户只需要在对应的模板中填写或修改信息即可完成配置文件的制作,或者用户根据显示在计算机上的提示信息逐步完成配置文件。
可选地,一个领域的配置文件可以是一个或多个。可选地,知识图谱问答***接收输入的电子文档,电子文档包括电子表格和文本中的至少一种,并根据电子文档获取配置文件。
可选地,该配置文件还包括模板表述文字,知识图谱问答***根据模板表述文字,生成提问模式对应的答案文字模板。在一个示例中,配置文件包括的模板表述文字是:唱片公司,生成提问模式对应的答案文字模板是:唱片公司。
相关技术中,知识图谱问答***在旅游行业或商业地产行业等,无需大量的查询语句模板(不超过30),就能够满足问答需求,而且多数都是较为简单的问答过程,在常见问题解答(Frequently Asked Questions,FAQ)***中回答这些问题,一般需要人工配置上万个问题答案对,而且每个问题答案对,都需要准备10个或10个以上的相似的问题,使得知识图谱问答***的构建方式较为复杂。
本申请实施例提供了一种查询语句模板的生成方法,只需要针对不同的领域更换对应的配置文件,无需配置问题答案对和相似问题,即可实现生成不同领域的查询语句模板并实现与用户的问答交互。
知识图谱问答***在初始化的时,根据配置文件中的字段,设定生成查询语句模板。无需用户了解数据库查询语言或熟悉代码语言,即可制作配置文件。
步骤2,根据配置文件生成查询语句模板、提问模式与语句特征之间的映射关系。
知识图谱问答***读取配置文件后,自动生成查询语句模板,并生成查询语句模板与输入语句的语句特征、提问模式之间的映射关系。以语句特征中包含的实体、提取输入语句的字面值作为关键字(key),建立关键词与查询语句模板之间的映射关系。在多轮对话模式中,知识图谱问答***也会根据该映射关系在各个问答模式(如,一问一答模式、反问澄清模式)之间跳转来获取对应的查询语句模板。
步骤3,若无实体识别模型,读取专有词典。
一般知识图谱问答***需要对输入语句(也即自然语言)中的实体进行识别,通常使用大量的数据训练实体识别模型,利用该模型对语句中的实体进行识别。在无实体识别模型的情况下,一些领域对应有该领域的专有词典,如金融领域、旅游领域、地产领域等,可以将输入语句中的实体与专有词典中的词语进行匹配,以达到对实体进行识别的目的。
步骤4,若无提问模式对应的机器识别模型,读取其他匹配模式。
一般知识图谱问答***需要对输入语句中的字面值进行识别,通常使用大量的数据训练提问模式识别模型,利用提问模式识别模型对输入语句进行评分或分类,根据分值决定是否提取该字面值,或者是否进行相关的话术澄清反问模式(知识图谱问答***向用户输出询问语句,确定用户输入语句想要提问的问题);根据识别的输入语句中的提问模式属于哪一类型,确定输入语句对应的提问模式。在无提问模式识别模型的情况下,可根据相关的正则表达式或关键词对输入语句对应的提问模式进行匹配,如根据正则表达式提取输入语句中的字面值,或者,是否进行话术澄清反问模式。
步骤5,初始化一些全局记忆集合后开始问答服务。
知识图谱问答***中设置有通用的算法,根据不同的配置文件,即可生成对应的查询语句模板。且该知识图谱问答***具有上下文关联能力多轮对话***,可通过数据结构来存储历史对话和语句解析信息。上述知识图谱问答***初始化后,可进行问答服务。
下面结合知识图谱问答***的结构对知识图谱问答***进行问答服务的过程进行说明,如图9所示。
知识图谱问答***初始化语境变量,其中包括:复杂推理及查询元语句映射、优先级列表、实体类型映射、反问澄清映射、历史实体类别记忆、抽象实体记忆、实体值列表、输出控制状态、多轮对话控制状态和图谱数据中的至少一种。查询元语句通过初始化语境变量可自定义复杂推理和查询,可选地,查询语句模板生成模块90可通过配置文件生成查询元语句,查询元语句是指描述查询语句的语言构成的语句。
查询语句模板生成模块90读取配置文件,生成查询语句模板、语句特征与查询语句模板之间的映射关系。
此时用户向该问答***中输入语句,语句预处理模块91(也即自然语言分析模块)对接收到的语句进行预处理,可得到输入语句的分析结果,该分析结果包括:输入语句中对应的实体、实体关系、提问模式(对实体属性进行提问,对至少两个实体之间的关系进行提问)、由该实体可得到的其他信息(推理节点)、问答模式提取(如一问一答模式、反问澄清模式等)。可选地,语句预处理模块91可构建实体关系列表,根据实体关系列表确定语句中实体与实体关系。
语句预处理模块91将该分析结果发送至答案初获取模块92,答案初获取模块92根据分析结果从查询语句模板生成模块90中获取目标查询语句模板。
当答案初获取模块92成功获取目标查询语句模板时,将目标查询语句模板发送至查询语句构建模块921,查询语句构建模块921根据目标查询语句模板构建查询语句,并将查询语句发送至返回结果处理模块94,返回结果处理模块94从图数据库95中查询对应的答案,并向用户输出应答信息。可选地,图数据库是Neo4j。可选地,返回结果处理模块94在输出应答信息之前,对查询到的答案进行封装话术处理,比如,查询到的答案是“米线和鲜花饼”,经过封装话术处理后,得到应答信息是“您好,云南的特色小吃是米线和鲜花饼”。
当答案初获取模块92未成功获取目标查询语句模板时,答案初获取模块92将分析结果发送至多轮对话判断模块922,多轮对话判断模块922根据历史记忆(历史输入语句和对应的历史查询语句模板)和本轮问答事件中输入的语句判断是否进入多轮对话模式,多轮对话模式包括子图记忆模式、子图跳转模式、多轮反问模式和内容补充模式。其中,多轮反问模式和内容补充模式协同运行。在进入上述任一模式时,多轮对话判断模块922将历史记忆和本轮问答事件中输入的语句发送至多轮对话管理模块923。
子图记忆模式是指目标查询语句模板与上一轮问答事件的查询语句模板相同,将上一轮问答事件的查询语句模板中的实体替换为本轮问答事件中输入的语句中的实体。
在一个示例中,用户当前的输入的语句是“大理呢?”由于该语句的语义不够明确,多轮对话判管理块93根据上一轮问答事件的查询语句判断该语句属于子图记忆模式。上一轮问答事件中输入的语句是“昆明有什么好吃的?”,其对应的查询语句模板是地名对应的美食,因此多轮对话管理模块923将该查询语句模板中对应的实体替换为本轮问答事件中输入的语句中的实体,也即将“昆明”替换为“大理”。因此本轮输入语句对应的问题是“大理有什么好吃的?”,查询语句模板是地名对应的美食。
子图跳转模式是指将上一轮问答事件的查询语句模板根据本轮问答事件中输入的语句进行删减、增添构成目标查询语句模板。
在一个示例中,用户本轮问答事件中输入的语句是“这里的5A级景区有哪些?”,由于该输入语句中“这里”指代的地点不明,多轮对话判断模块922根据上一轮问答事件的查询语句判断该语句属于子图记忆模式。上一轮问答事件中输入的语句是“昆明有哪些特色小吃?”,其对应的查询语句模板是地名对应的美食,因此多轮对话管理模块93根据本轮问答事件中输入的语句判断“这里”指代的地点是“昆明”,将该查询语句模板修改为地名对应的景区,因此本轮的输入语句对应的问题是“昆明的5A级景区有哪些?”。
多轮反问模式是指输入的语句不满足子图记忆模式和子图跳转模式,符合反问条件,对描述不清的语句进行反问,通过反问语句来澄清该输入语句的意图。内容补充模式是指上一轮问答事件符合多轮反问模式,则将本轮的输入语句作为补充答案,与多轮反问模式协同工作,生成目标查询语句模板。
在一个示例中,用户输入的语句是“昆明”(实体),该输入语句的查询意图并不明确,多轮对话判断模块922判断该语句属于多轮反问模式,多轮对话管理模块93把与该实体相关的询问语句反问给用户,用户将接收到反问语句“对您询问的内容,小助手为您找到以下几个可以了解的内容“天气”,“美食”,“风景”,“交通”,“购物”,请您选择”,在用户输入新的语句时,如“美食”,多轮对话判断模块922判断该输入语句属于补充答案模式,多轮对话管理模块93将“美食”作为提问模式进行补充,与之前的输入语句结合,构成目标查询语句模板是地名对应的天气,因此用户输入的语句对应的问题是“昆明的天气如何?”。
在通过上述模式获取到目标查询语句模板后,多轮对话管理模块93将目标查询语句模板发送至查询语句构建模块921,查询语句构建模块921根据目标查询语句模板生成查询语句,之后的过程与答案初获取模块92直接获取到目标查询语句模板一致,此处不再赘述。
可选地,在知识图谱问答***中,多轮对话管理模块93也可从语句映射关系中获取对应的查询语句,多轮对话管理模块93也可从反问澄清映射关系中获取对应的查询语句,反问澄清映射关系的表现形式可为反问澄清映射关系列表。
可选地,答案初获取模块92可从语句映射关系中获取查询元语句,该语句映射关系的表现形式可为语句映射关系列表。
综上所述,本实施例提供的知识图谱问答***降低了知识图谱问答***的接入门槛,并使得知识图谱问答***具备了一定上下文关联的多轮问答能力。针对不同的用户,无需对图数据库具有较深的理解、知识图谱问答、语义解析等相关知识,只需要按照相关的格式去设置配置文件,就能够实现上述知识图谱问答***。
图10和图11分别示出了垂直领域的知识图谱问答***在不同平台客户端上的界面示意图。
以该问答***应用于旅游行业,图中“请输入”对应的是用户输入的问题,问题以倾斜字体表示。可选地,还可以以不同颜色区别问题与答案,本申请对区别问题与答案的形式不加以限定。可选地,用户输入的问题是用户通过键盘或鼠标等外部接入设备输入至计算机中的,或者,用户的问题是计算机通过麦克风等语音采集设备获得的,计算机将语音转化为文字或语音显示在如图10所示的界面上。示意性的,图10的(a)中,用户输入“昆明有哪些好吃的?”,对应的答案是“该城市推荐的美食有:过桥米线、鲜花饼、烧饵块”。图10的(b)中,用户输入“昆明有几个好玩的景区呀”,该问题对应的答案是“昆明市的景区总共有:33个”;用户之后又输入“是哪些呢”,根据上下文理解,用户的输入语句对应的问题是“昆明市的33个景区是哪些呢”,该问题对应的答案是昆明对应的景区具体有哪些。
图11示出了本申请一个示例性实施例提供的知识图谱问答***在智能手机上的界面示意图。
以该问答***应用于商业地产为例,图11的(a)中,在界面80上显示有用户801和小助手802之间的问答对话,用户801输入“女装有什么呢”。小助手802为用户801查找女装经营种类的商家,用户801又输入“三号馆2楼”,小助手802自动关联为用户801想查询的是“三号馆2号楼的女装有什么”,并为用户801查找对应的答案。同理,图11的(b)中,在界面81上显示有用户811和小助手812之间的问答对话,图11的(c)中,在界面82上显示有用户821和小助手822之间的问答对话。图11表征知识图谱问答***具备上下文理解的能力,能够关联历史输入语句并确定问题对应的答案。
图12示出了本申请一个示例性实施例提供的查询语句模板的生成装置的框图。该生成装置包括:
获取模块1210,用于获取配置文件,配置文件包括实体类型和提问模式,提问模式是采用人类可读的查询描述语言描述的;
生成模块1220,用于根据实体类型和查询描述语言生成查询语句模板;
存储模块1230,用于存储查询语句模板。
在一个可选的实施例中,处理模块1240,用于根据实体类型确定查询目标,以及根据查询描述语言确定查询操作;将查询目标和查询操作,转换为机器语言形式的查询语句模板。
在一个可选的实施例中,提问模式包括:属性提问模式和关系提问模式中的至少一种;属性提问模式用于询问实体属性的提问方式;关系提问模式用于询问至少两个实体之间的关系。
在一个可选的实施例中,所述生成模块1220,用于生成输入语句的语句特征、提问模式和查询语句模板之间的映射关系,映射关系用于在问答过程中确定输入语句所属的提问模式的关系;其中,语句特征包括含有实体类型的实体、含有提问模式的关键词、符合提问模式对应的正则表达式和被提问模式对应的机器识别模型识别为第一类型中的至少一种。
在一个可选的实施例中,查询语句模板为至少两个;该装置包括接收模块1250;
所述接收模块1250,用于对接收到的输入语句进行处理,得到输入语句对应的第一语句特征;
所述处理模块1240,用于根据映射关系从至少两个查询语句模板中,确定与第一语句特征对应的目标查询语句模板;
所述生成模块1220,用于根据输入语句和目标查询语句模板生成查询语句。
在一个可选的实施例中,查询语句模板为至少两个;
所述接收模块1250,用于对接收到的输入语句进行处理,得到输入语句对应的第一语句特征;
所述获取模块1210,用于响应于根据映射关系无法确定与第一语句特征对应的目标查询语句模板,获取历史输入语句中的历史查询语句模板;
所述处理模块1240,用于将根据第一语句特征和历史查询语句模板,得到与第一语句特征对应的替补查询语句模板。
在一个可选的实施例中,所述处理模块1240,用于响应于第一语句特征中包括具有第一实体但不包括第一提问模式时,将含有第一实体类型的历史查询语句模板确定为替补查询语句模板,第一实体类型是第一实体具有的实体类型。
在一个可选的实施例中,所述生成模块1220,用于将输入语句中的第一实体代入至目标查询语句模板中,得到查询语句。
在一个可选的实施例中,所述获取模块1210,用于响应于第一语句特征中包括第一提问模式但不包括第一实体时,获取历史输入语句的第二实体类型;
所述处理模块1240,用于根据映射关系从至少两个查询语句模板中,确定与第一提问模式和第二实体类型对应的第二查询语句模板;将第二语句查询模板确定为替补查询语句模板。
在一个可选的实施例中,所述接收模块1250,用于对接收到的输入语句进行处理,得到输入语句对应的第一语句特征;
所述获取模块1210,用于响应于根据映射关系无法确定与第一语句特征对应的目标查询语句模板,根据第一语句特征输出询问语句,获取询问语句对应的补充答案;
所述处理模块1240,用于提取补充答案中的第三语句特征;根据映射关系从至少两个查询语句模板中,确定与第一语句特征和第三语句特征对应的第三查询语句模板。
在一个可选的实施例中,配置文件中还包括:模板表述文字;生成模块1220,用于根据模板表达文字,生成提问模式对应的答案文字模板。
图13示出了本申请一个示例性实施例提供的服务器的结构示意图。该服务器可以是后台服务器集群140中的服务器。具体来讲:
服务器1300包括中央处理单元(CPU,Central Processing Unit)1301、包括随机存取存储器(RAM,Random Access Memory)1302和只读存储器(ROM,Read Only Memory)1303的***存储器1304,以及连接***存储器1304和中央处理单元1301的***总线1305。服务器1300还包括帮助计算机内的各个器件之间传输信息的基本输入/输出***(I/O***,Input Output System)1306,和用于存储操作***1303、应用程序1314和其他程序模块1315的大容量存储设备1307。
基本输入/输出***1306包括有用于显示信息的显示器1308和用于用户输入信息的诸如鼠标、键盘之类的输入设备1309。其中显示器1308和输入设备1309都通过连接到***总线1305的输入输出控制器1310连接到中央处理单元1301。基本输入/输出***1306还可以包括输入输出控制器1310以用于接收和处理来自键盘、鼠标、或电子触控笔等多个其他设备的输入。类似地,输入输出控制器1310还提供输出到显示屏、打印机或其他类型的输出设备。
大容量存储设备1307通过连接到***总线1305的大容量存储控制器(未示出)连接到中央处理单元1301。大容量存储设备1307及其相关联的计算机可读介质为服务器1300提供非易失性存储。也就是说,大容量存储设备1307可以包括诸如硬盘或者紧凑型光盘只读存储器(CD-ROM,Compact Disc Read Only Memory)驱动器之类的计算机可读介质(未示出)。
计算机可读介质可以包括计算机存储介质和通信介质。计算机存储介质包括以用于存储诸如计算机可读指令、数据结构、程序模块或其他数据等信息的任何方法或技术实现的易失性和非易失性、可移动和不可移动介质。计算机存储介质包括RAM、ROM、可擦除可编程只读存储器(EPROM,Erasable Programmable Read Only Memory)、带电可擦可编程只读存储器(EEPROM,Electrically Erasable Programmable Read Only Memory)、闪存或其他固态存储其技术,CD-ROM、数字通用光盘(DVD,Digital Versatile Disc)或固态硬盘(SSD,Solid State Drives)、其他光学存储、磁带盒、磁带、磁盘存储或其他磁性存储设备。其中,随机存取记忆体可以包括电阻式随机存取记忆体(ReRAM,Resistance RandomAccess Memory)和动态随机存取存储器(DRAM,Dynamic Random Access Memory)。当然,本领域技术人员可知计算机存储介质不局限于上述几种。上述的***存储器1304和大容量存储设备1307可以统称为存储器。
根据本申请的各种实施例,服务器1300还可以通过诸如因特网等网络连接到网络上的远程计算机运行。也即服务器1300可以通过连接在***总线1305上的网络接口单元1311连接到网络1312,或者说,也可以使用网络接口单元1311来连接到其他类型的网络或远程计算机***(未示出)。
上述存储器还包括一个或者一个以上的程序,一个或者一个以上程序存储于存储器中,被配置由CPU执行。
在一个可选的实施例中,提供了一种计算机设备,该计算机设备包括处理器和存储器,存储器中存储有至少一条指令、至少一段程序、代码集或指令集,至少一条指令、至少一段程序、代码集或指令集由处理器加载并执行以实现如上所述的查询语句模板的生成方法。
在一个可选的实施例中,提供了一种计算机可读存储介质,该存储介质中存储有至少一条指令、至少一段程序、代码集或指令集,至少一条指令、至少一段程序、代码集或指令集由处理器加载并执行以实现如上所述的查询语句模板的生成方法。
请参考图14,其示出了本申请一个示例性实施例提供的计算机设备1400的结构框图。该计算机设备1400可以是便携式移动终端,比如:智能手机、平板电脑、MP3播放器(Moving Picture Experts Group Audio Layer III,动态影像专家压缩标准音频层面3)、MP4(Moving Picture Experts Group Audio Layer IV,动态影像专家压缩标准音频层面4)播放器。计算机设备1400还可能被称为用户设备、便携式终端等其他名称。
通常,计算机设备1400包括有:处理器1401和存储器1402。
处理器1401可以包括一个或多个处理核心,比如4核心处理器、8核心处理器等。处理器1401可以采用DSP(Digital Signal Processing,数字信号处理)、FPGA(Field-Programmable Gate Array,现场可编程门阵列)、PLA(Programmable Logic Array,可编程逻辑阵列)中的至少一种硬件形式来实现。处理器1401也可以包括主处理器和协处理器,主处理器是用于对在唤醒状态下的数据进行处理的处理器,也称CPU(Central ProcessingUnit,中央处理器);协处理器是用于对在待机状态下的数据进行处理的低功耗处理器。在一些实施例中,处理器1401可以在集成有GPU(Graphics Processing Unit,图像处理器),GPU用于负责显示屏所需要显示的内容的渲染和绘制。一些实施例中,处理器1401还可以包括AI(Artificial Intelligence,人工智能)处理器,该AI处理器用于处理有关机器学习的计算操作。
存储器1402可以包括一个或多个计算机可读存储介质,该计算机可读存储介质可以是有形的和非暂态的。存储器1402还可包括高速随机存取存储器,以及非易失性存储器,比如一个或多个磁盘存储设备、闪存存储设备。在一些实施例中,存储器1402中的非暂态的计算机可读存储介质用于存储至少一个指令,该至少一个指令用于被处理器1401所执行以实现本申请中提供的查询语句模板的生成方法。
在一些实施例中,计算机设备1400还可选包括有:***设备接口1403和至少一个***设备。具体地,***设备包括:射频电路1404、触摸显示屏1405、摄像头1406、音频电路1407、定位组件1408和电源1409中的至少一种。
***设备接口1403可被用于将I/O(Input/Output,输入/输出)相关的至少一个***设备连接到处理器1401和存储器1402。在一些实施例中,处理器1401、存储器1402和***设备接口1403被集成在同一芯片或电路板上;在一些其他实施例中,处理器1401、存储器1402和***设备接口1403中的任意一个或两个可以在单独的芯片或电路板上实现,本实施例对此不加以限定。
射频电路1404用于接收和发射RF(Radio Frequency,射频)信号,也称电磁信号。射频电路1404通过电磁信号与通信网络以及其他通信设备进行通信。射频电路1404将电信号转换为电磁信号进行发送,或者,将接收到的电磁信号转换为电信号。可选地,射频电路1404包括:天线***、RF收发器、一个或多个放大器、调谐器、振荡器、数字信号处理器、编解码芯片组、用户身份模块卡等等。射频电路1404可以通过至少一种无线通信协议来与其它终端进行通信。该无线通信协议包括但不限于:万维网、城域网、内联网、各代移动通信网络(2G、3G、4G及5G)、无线局域网和/或WiFi(Wireless Fidelity,无线保真)网络。在一些实施例中,射频电路1404还可以包括NFC(Near Field Communication,近距离无线通信)有关的电路,本申请对此不加以限定。
触摸显示屏1405用于显示UI(User Interface,用户界面)。该UI可以包括图形、文本、图标、视频及其它们的任意组合。触摸显示屏1405还具有采集在触摸显示屏1405的表面或表面上方的触摸信号的能力。该触摸信号可以作为控制信号输入至处理器1401进行处理。触摸显示屏1405用于提供虚拟按钮和/或虚拟键盘,也称软按钮和/或软键盘。在一些实施例中,触摸显示屏1405可以为一个,设置计算机设备1400的前面板;在另一些实施例中,触摸显示屏1405可以为至少两个,分别设置在计算机设备1400的不同表面或呈折叠设计;在再一些实施例中,触摸显示屏1405可以是柔性显示屏,设置在计算机设备1400的弯曲表面上或折叠面上。甚至,触摸显示屏1405还可以设置成非矩形的不规则图形,也即异形屏。触摸显示屏1405可以采用LCD(Liquid Crystal Display,液晶显示器)、OLED(OrganicLight-Emitting Diode,有机发光二极管)等材质制备。
摄像头组件1406用于采集图像或视频。可选地,摄像头组件1406包括前置摄像头和后置摄像头。通常,前置摄像头用于实现视频通话或自拍,后置摄像头用于实现照片或视频的拍摄。在一些实施例中,后置摄像头为至少两个,分别为主摄像头、景深摄像头、广角摄像头中的任意一种,以实现主摄像头和景深摄像头融合实现背景虚化功能,主摄像头和广角摄像头融合实现全景拍摄以及VR(Virtual Reality,虚拟现实)拍摄功能。在一些实施例中,摄像头组件1406还可以包括闪光灯。闪光灯可以是单色温闪光灯,也可以是双色温闪光灯。双色温闪光灯是指暖光闪光灯和冷光闪光灯的组合,可以用于不同色温下的光线补偿。
音频电路1407用于提供用户和计算机设备1400之间的音频接口。音频电路1407可以包括麦克风和扬声器。麦克风用于采集用户及环境的声波,并将声波转换为电信号输入至处理器1401进行处理,或者输入至射频电路1404以实现语音通信。出于立体声采集或降噪的目的,麦克风可以为多个,分别设置在计算机设备1400的不同部位。麦克风还可以是阵列麦克风或全向采集型麦克风。扬声器则用于将来自处理器1401或射频电路1404的电信号转换为声波。扬声器可以是传统的薄膜扬声器,也可以是压电陶瓷扬声器。当扬声器是压电陶瓷扬声器时,不仅可以将电信号转换为人类可听见的声波,也可以将电信号转换为人类听不见的声波以进行测距等用途。在一些实施例中,音频电路1407还可以包括耳机插孔。
定位组件1408用于定位计算机设备1400的当前地理位置,以实现导航或LBS(Location Based Service,基于位置的服务)。定位组件1408可以是基于美国的GPS(Global Positioning System,全球定位***)、中国的北斗***或俄罗斯的伽利略***的定位组件。
电源1409用于为计算机设备1400中的各个组件进行供电。电源1409可以是交流电、直流电、一次性电池或可充电电池。当电源1409包括可充电电池时,该可充电电池可以是有线充电电池或无线充电电池。有线充电电池是通过有线线路充电的电池,无线充电电池是通过无线线圈充电的电池。该可充电电池还可以用于支持快充技术。
在一些实施例中,计算机设备1400还包括有一个或多个传感器1410。该一个或多个传感器1410包括但不限于:加速度传感器1411陀螺仪传感器1412、压力传感器1413、指纹传感器1414、光学传感器1415以及接近传感器1416。
加速度传感器1411以检测以计算机设备1400建立的坐标系的三个坐标轴上的加速度大小。比如,加速度传感器1411以用于检测重力加速度在三个坐标轴上的分量。处理器1401可以根据加速度传感器1411集的重力加速度信号,控制触摸显示屏1405以横向视图或纵向视图进行用户界面的显示。加速度传感器1411可以用于游戏或者用户的运动数据的采集。
陀螺仪传感器1412可以检测计算机设备1400的机体方向及转动角度,陀螺仪传感器1412可以与加速度传感器1411同采集用户对计算机设备1400的3D动作。处理器1401根据陀螺仪传感器1412采集的数据,可以实现如下功能:动作感应(比如根据用户的倾斜操作来改变UI)、拍摄时的图像稳定、游戏控制以及惯性导航。
压力传感器1413可以设置在计算机设备1400的侧边框和/或触摸显示屏1405的下层。当压力传感器1413设置在计算机设备1400的侧边框时,可以检测用户对计算机设备1400的握持信号,根据该握持信号进行左右手识别或快捷操作。当压力传感器1413设置在触摸显示屏1405的下层时,可以根据用户对触摸显示屏1405的压力操作,实现对UI界面上的可操作性控件进行控制。可操作性控件包括按钮控件、滚动条控件、图标控件、菜单控件中的至少一种。
指纹传感器1414用于采集用户的指纹,以根据采集到的指纹识别用户的身份。在识别出用户的身份为可信身份时,由处理器1401授权该用户执行相关的敏感操作,该敏感操作包括解锁屏幕、查看加密信息、下载软件、支付及更改设置等。指纹传感器1414可以被设置计算机设备1400的正面、背面或侧面。当计算机设备1400上设置有物理按键或厂商Logo时,指纹传感器1414可以与物理按键或厂商Logo集成在一起。
光学传感器1415用于采集环境光强度。在一个实施例中,处理器1401可以根据光学传感器1415采集的环境光强度,控制触摸显示屏1405的显示亮度。具体地,当环境光强度较高时,调高触摸显示屏1405的显示亮度;当环境光强度较低时,调低触摸显示屏1405的显示亮度。在另一个实施例中,处理器1401还可以根据光学传感器1415采集的环境光强度,动态调整摄像头组件1406的拍摄参数。
接近传感器1416,也称距离传感器,通常设置在计算机设备1400的正面。接近传感器1416用于采集用户与计算机设备1400的正面之间的距离。在一个实施例中,当接近传感器1416检测到用户与计算机设备1400的正面之间的距离逐渐变小时,由处理器1401控制触摸显示屏1405从亮屏状态切换为息屏状态;当接近传感器1416检测到用户与计算机设备1400的正面之间的距离逐渐变大时,由处理器1401控制触摸显示屏1405从息屏状态切换为亮屏状态。
本领域技术人员可以理解,图14中示出的结构并不构成对计算机设备1400的限定,可以包括比图示更多或更少的组件,或者组合某些组件,或者采用不同的组件布置。
本领域普通技术人员可以理解实现上述实施例的全部或部分步骤可以通过硬件来完成,也可以通过程序来指令相关的硬件完成,所述的程序可以存储于一种计算机可读存储介质中,上述提到的存储介质可以是只读存储器,磁盘或光盘等。
以上所述仅为本申请的可选实施例,并不用以限制本申请,凡在本申请的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本申请的保护范围之内。

Claims (15)

1.一种查询语句模板的生成方法,其特征在于,所述方法包括:
获取配置文件,所述配置文件包括实体类型和提问模式,所述提问模式是采用人类可读的查询描述语言描述的;
根据所述实体类型和所述查询描述语言生成查询语句模板;
存储所述查询语句模板。
2.根据权利要求1所述的方法,其特征在于,所述根据所述实体类型和所述查询描述语言生成查询语句模板,包括:
根据所述实体类型确定查询目标,以及根据所述查询描述语言确定查询操作;
将所述查询目标和所述查询操作,转换为机器语言形式的查询语句模板。
3.根据权利要求1所述的方法,其特征在于,所述提问模式包括:属性提问模式和关系提问模式中的至少一种;
所述属性提问模式包括用于询问实体属性的提问方式;
所述关系提问模式包括用于询问至少两个实体之间的关系。
4.根据权利要求1至3任一所述的方法,其特征在于,所述方法还包括:
生成所述输入语句的语句特征、所述提问模式和所述查询语句模板之间的映射关系,所述映射关系用于在问答过程中确定输入语句所属的提问模式;
其中,所述语句特征包括含有所述实体类型的实体、含有所述提问模式的关键词、符合所述提问模式对应的正则表达式和被所述提问模式对应的机器识别模型识别为第一类型中的至少一种。
5.根据权利要求4所述的方法,其特征在于,所述查询语句模板为至少两个;所述方法还包括:
对接收到的所述输入语句进行处理,得到所述输入语句对应的第一语句特征;
根据所述映射关系从所述至少两个查询语句模板中,确定与所述第一语句特征对应的目标查询语句模板;
根据所述输入语句和所述目标查询语句模板生成查询语句。
6.根据权利要求4所述的方法,其特征在于,所述查询语句模板为至少两个;所述方法还包括:
对接收到的所述输入语句进行处理,得到所述输入语句对应的第一语句特征;
响应于根据所述映射关系无法确定与所述第一语句特征对应的目标查询语句模板,获取历史输入语句中的历史查询语句模板;
将根据所述第一语句特征和所述历史查询语句模板,得到与所述第一语句特征对应的替补查询语句模板。
7.根据权利要求6所述的方法,其特征在于,所述将根据所述第一语句特征和所述历史查询语句模板,得到与所述第一语句特征对应的替补查询语句模板,包括:
响应于所述第一语句特征中包括具有第一实体但不包括第一提问模式时,将含有第一实体类型的历史查询语句模板确定为所述替补查询语句模板,所述第一实体类型是所述第一实体具有的实体类型。
8.根据权利要求5所述的方法,其特征在于,所述根据所述输入语句和所述目标查询语句模板生成查询语句,包括:
将所述输入语句中的所述第一实体代入至所述目标查询语句模板中,得到所述查询语句。
9.根据权利要求6所述的方法,其特征在于,所述将根据所述第一语句特征和所述历史查询语句模板,得到与所述第一语句特征对应的替补查询语句模板,包括:
响应于所述第一语句特征中包括第一提问模式但不包括具有第一实体时,获取所述历史输入语句的第二实体类型;
根据所述映射关系从所述至少两个查询语句模板中,确定与所述第一提问模式和所述第二实体类型对应的第二查询语句模板;
将所述第二查询语句模板确定为所述替补查询语句模板。
10.根据权利要求4所述的方法,其特征在于,所述查询语句模板为至少两个;所述方法还包括:
对接收到的所述输入语句进行处理,得到所述输入语句对应的第一语句特征;
响应于根据所述映射关系无法确定与所述第一语句特征对应的目标查询语句模板,根据所述第一语句特征输出询问语句,获取所述询问语句对应的补充答案;
提取所述补充答案中的第三语句特征;
根据所述映射关系从所述至少两个查询语句模板中,确定与所述第一语句特征和所述第三语句特征对应的第三查询语句模板。
11.根据权利要求1至3任一所述的方法,其特征在于,所述配置文件中还包括:模板表述文字,所述方法还包括:
根据所述模板表述文字,生成所述提问模式对应的答案文字模板。
12.根据权利要求1至3任一所述的方法,其特征在于,所述获取配置文件,包括:
接收输入的电子文档,所述电子文档包括电子表格和电子文本中的至少一种;
根据所述电子文档获取所述配置文件。
13.一种查询语句模板的生成装置,其特征在于,所述装置包括:
获取模块,用于获取配置文件,所述配置文件包括实体类型和提问模式,所述提问模式是采用人类可读的查询描述语言描述的;
生成模块,用于根据所述实体类型和所述查询描述语言生成查询语句模板;
存储模块,用于存储所述查询语句模板。
14.一种计算机设备,其特征在于,所述计算机设备包括处理器和存储器,所述存储器中存储有至少一条指令、至少一段程序、代码集或指令集,所述至少一条指令、至少一段程序、代码集或指令集由所述处理器加载并执行以实现如权利要求1至12任一所述的查询语句模板的生成方法。
15.一种计算机可读存储介质,其特征在于,所述存储介质中存储有至少一条指令、至少一段程序、代码集或指令集,所述至少一条指令、所述至少一段程序、所述代码集或指令集由处理器加载并执行,以实现如权利要求1至12任一所述的查询语句模板的生成方法。
CN202010085006.9A 2020-02-10 2020-02-10 查询语句模板的生成方法、装置、设备及介质 Active CN111339246B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202010085006.9A CN111339246B (zh) 2020-02-10 2020-02-10 查询语句模板的生成方法、装置、设备及介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202010085006.9A CN111339246B (zh) 2020-02-10 2020-02-10 查询语句模板的生成方法、装置、设备及介质

Publications (2)

Publication Number Publication Date
CN111339246A true CN111339246A (zh) 2020-06-26
CN111339246B CN111339246B (zh) 2023-03-21

Family

ID=71181529

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202010085006.9A Active CN111339246B (zh) 2020-02-10 2020-02-10 查询语句模板的生成方法、装置、设备及介质

Country Status (1)

Country Link
CN (1) CN111339246B (zh)

Cited By (18)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111767381A (zh) * 2020-06-30 2020-10-13 北京百度网讯科技有限公司 自动问答方法和装置
CN111897840A (zh) * 2020-08-14 2020-11-06 北京字节跳动网络技术有限公司 一种数据搜索方法、装置、电子设备及存储介质
CN111931091A (zh) * 2020-07-06 2020-11-13 广东技术师范大学 页面内容展示方法、装置、计算机设备及存储介质
CN111949782A (zh) * 2020-08-07 2020-11-17 海信视像科技股份有限公司 一种信息推荐方法和服务设备
CN112052395A (zh) * 2020-09-16 2020-12-08 北京搜狗科技发展有限公司 一种数据处理方法及装置
CN112256853A (zh) * 2020-10-30 2021-01-22 深圳壹账通智能科技有限公司 问题生成方法、装置、设备及计算机可读存储介质
CN112269864A (zh) * 2020-10-15 2021-01-26 北京百度网讯科技有限公司 生成播报语音的方法、装置、设备和计算机存储介质
CN112380343A (zh) * 2020-11-19 2021-02-19 平安科技(深圳)有限公司 问题解析方法、装置、电子设备及存储介质
CN112581955A (zh) * 2020-11-30 2021-03-30 广州橙行智动汽车科技有限公司 语音控制方法、服务器、语音控制***和可读存储介质
CN113127617A (zh) * 2021-04-09 2021-07-16 厦门渊亭信息科技有限公司 通用领域知识图谱的知识问答方法、终端设备及存储介质
CN113239009A (zh) * 2021-04-08 2021-08-10 大唐软件技术股份有限公司 一种数据库操作方法、装置、设备及存储介质
CN113486151A (zh) * 2021-07-13 2021-10-08 盛景智能科技(嘉兴)有限公司 故障维修知识点查询方法、装置、电子设备和存储介质
CN113641805A (zh) * 2021-07-19 2021-11-12 北京百度网讯科技有限公司 结构化问答模型的获取方法、问答方法及对应装置
CN114281841A (zh) * 2021-12-07 2022-04-05 四川新网银行股份有限公司 一种基于业务需求生成配置sql语句的方法
TWI800124B (zh) * 2021-11-26 2023-04-21 輔仁大學學校財團法人輔仁大學 應用虛擬實境模擬兒童日常生活訓練的虛擬實境互動式系統
CN117251473A (zh) * 2023-11-20 2023-12-19 摩斯智联科技有限公司 车辆数据查询分析方法、***、装置和存储介质
CN117708304A (zh) * 2024-02-01 2024-03-15 浙江大华技术股份有限公司 数据库问答方法、设备及存储介质
US12039268B2 (en) 2021-10-29 2024-07-16 Industrial Technology Research Institute Graph-based natural language optimization method and electronic apparatus

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107918634A (zh) * 2017-06-27 2018-04-17 上海壹账通金融科技有限公司 智能问答方法、装置及计算机可读存储介质
CN109492077A (zh) * 2018-09-29 2019-03-19 北明智通(北京)科技有限公司 基于知识图谱的石化领域问答方法及***
CN109684448A (zh) * 2018-12-17 2019-04-26 北京北大软件工程股份有限公司 一种智能问答方法
CN110349463A (zh) * 2019-07-10 2019-10-18 南京硅基智能科技有限公司 一种逆向教学***及方法
CN110659366A (zh) * 2019-09-24 2020-01-07 Oppo广东移动通信有限公司 语义解析方法、装置、电子设备以及存储介质

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107918634A (zh) * 2017-06-27 2018-04-17 上海壹账通金融科技有限公司 智能问答方法、装置及计算机可读存储介质
CN109492077A (zh) * 2018-09-29 2019-03-19 北明智通(北京)科技有限公司 基于知识图谱的石化领域问答方法及***
CN109684448A (zh) * 2018-12-17 2019-04-26 北京北大软件工程股份有限公司 一种智能问答方法
CN110349463A (zh) * 2019-07-10 2019-10-18 南京硅基智能科技有限公司 一种逆向教学***及方法
CN110659366A (zh) * 2019-09-24 2020-01-07 Oppo广东移动通信有限公司 语义解析方法、装置、电子设备以及存储介质

Non-Patent Citations (3)

* Cited by examiner, † Cited by third party
Title
康海燕 等: "基于问句表征的web智能问答***" *
曾帅 等: "面向知识自动化的自动问答研究进展" *
谭刚 等: "融合领域特征知识图谱的电网客服问答***" *

Cited By (25)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111767381A (zh) * 2020-06-30 2020-10-13 北京百度网讯科技有限公司 自动问答方法和装置
CN111931091A (zh) * 2020-07-06 2020-11-13 广东技术师范大学 页面内容展示方法、装置、计算机设备及存储介质
CN111949782A (zh) * 2020-08-07 2020-11-17 海信视像科技股份有限公司 一种信息推荐方法和服务设备
CN111897840A (zh) * 2020-08-14 2020-11-06 北京字节跳动网络技术有限公司 一种数据搜索方法、装置、电子设备及存储介质
CN112052395A (zh) * 2020-09-16 2020-12-08 北京搜狗科技发展有限公司 一种数据处理方法及装置
CN112052395B (zh) * 2020-09-16 2024-03-22 北京搜狗科技发展有限公司 一种数据处理方法及装置
CN112269864B (zh) * 2020-10-15 2023-06-23 北京百度网讯科技有限公司 生成播报语音的方法、装置、设备和计算机存储介质
CN112269864A (zh) * 2020-10-15 2021-01-26 北京百度网讯科技有限公司 生成播报语音的方法、装置、设备和计算机存储介质
CN112256853A (zh) * 2020-10-30 2021-01-22 深圳壹账通智能科技有限公司 问题生成方法、装置、设备及计算机可读存储介质
CN112380343A (zh) * 2020-11-19 2021-02-19 平安科技(深圳)有限公司 问题解析方法、装置、电子设备及存储介质
CN112581955B (zh) * 2020-11-30 2024-03-08 广州橙行智动汽车科技有限公司 语音控制方法、服务器、语音控制***和可读存储介质
CN112581955A (zh) * 2020-11-30 2021-03-30 广州橙行智动汽车科技有限公司 语音控制方法、服务器、语音控制***和可读存储介质
CN113239009A (zh) * 2021-04-08 2021-08-10 大唐软件技术股份有限公司 一种数据库操作方法、装置、设备及存储介质
CN113127617B (zh) * 2021-04-09 2022-09-23 厦门渊亭信息科技有限公司 通用领域知识图谱的知识问答方法、终端设备及存储介质
CN113127617A (zh) * 2021-04-09 2021-07-16 厦门渊亭信息科技有限公司 通用领域知识图谱的知识问答方法、终端设备及存储介质
CN113486151A (zh) * 2021-07-13 2021-10-08 盛景智能科技(嘉兴)有限公司 故障维修知识点查询方法、装置、电子设备和存储介质
CN113641805A (zh) * 2021-07-19 2021-11-12 北京百度网讯科技有限公司 结构化问答模型的获取方法、问答方法及对应装置
CN113641805B (zh) * 2021-07-19 2024-05-24 北京百度网讯科技有限公司 结构化问答模型的获取方法、问答方法及对应装置
US12039268B2 (en) 2021-10-29 2024-07-16 Industrial Technology Research Institute Graph-based natural language optimization method and electronic apparatus
TWI800124B (zh) * 2021-11-26 2023-04-21 輔仁大學學校財團法人輔仁大學 應用虛擬實境模擬兒童日常生活訓練的虛擬實境互動式系統
CN114281841A (zh) * 2021-12-07 2022-04-05 四川新网银行股份有限公司 一种基于业务需求生成配置sql语句的方法
CN117251473A (zh) * 2023-11-20 2023-12-19 摩斯智联科技有限公司 车辆数据查询分析方法、***、装置和存储介质
CN117251473B (zh) * 2023-11-20 2024-03-15 摩斯智联科技有限公司 车辆数据查询分析方法、***、装置和存储介质
CN117708304A (zh) * 2024-02-01 2024-03-15 浙江大华技术股份有限公司 数据库问答方法、设备及存储介质
CN117708304B (zh) * 2024-02-01 2024-05-28 浙江大华技术股份有限公司 数据库问答方法、设备及存储介质

Also Published As

Publication number Publication date
CN111339246B (zh) 2023-03-21

Similar Documents

Publication Publication Date Title
CN111339246B (zh) 查询语句模板的生成方法、装置、设备及介质
CN111652678B (zh) 物品信息显示方法、装置、终端、服务器及可读存储介质
CN111277706B (zh) 一种应用推荐方法、装置、存储介质及电子设备
CN109189879B (zh) 电子书籍显示方法及装置
CN110852100B (zh) 关键词提取方法、装置、电子设备及介质
US20140250120A1 (en) Interactive Multi-Modal Image Search
CN111985240A (zh) 命名实体识别模型的训练方法、命名实体识别方法及装置
CN110162604B (zh) 语句生成方法、装置、设备及存储介质
US10719791B2 (en) Topic-based place of interest discovery feed
KR102596841B1 (ko) 사용자의 발화에 응답하여 하나 이상의 아이템을 제공하기 위한 전자 장치 및 방법
CN113515942A (zh) 文本处理方法、装置、计算机设备及存储介质
CN111339737B (zh) 实体链接方法、装置、设备及存储介质
CN111428522B (zh) 翻译语料生成方法、装置、计算机设备及存储介质
CN111897996A (zh) 话题标签推荐方法、装置、设备及存储介质
KR20180109499A (ko) 사용자의 음성 입력에 대한 답변을 제공하는 방법 및 장치
CN110555102A (zh) 媒体标题识别方法、装置及存储介质
CN114281956A (zh) 文本处理方法、装置、计算机设备及存储介质
WO2023197648A1 (zh) 截图处理方法及装置、电子设备和计算机可读介质
CN111553163A (zh) 文本相关度的确定方法、装置、存储介质及电子设备
CN113763931B (zh) 波形特征提取方法、装置、计算机设备及存储介质
WO2021147421A1 (zh) 用于人机交互的自动问答方法、装置和智能设备
CN113205569A (zh) 图像绘制方法及装置、计算机可读介质和电子设备
CN112165627A (zh) 信息处理方法、装置、存储介质、终端及***
CN116580707A (zh) 基于语音生成动作视频的方法和装置
CN113486260B (zh) 互动信息的生成方法、装置、计算机设备及存储介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
REG Reference to a national code

Ref country code: HK

Ref legal event code: DE

Ref document number: 40024422

Country of ref document: HK

GR01 Patent grant
GR01 Patent grant