CN113807148B

CN113807148B - 文本识别匹配方法和装置、终端设备

Info

Publication number: CN113807148B
Application number: CN202010546116.0A
Authority: CN
Inventors: 周康
Original assignee: Alibaba Group Holding Ltd
Current assignee: Alibaba Group Holding Ltd
Priority date: 2020-06-16
Filing date: 2020-06-16
Publication date: 2024-07-02
Anticipated expiration: 2040-06-16
Also published as: CN113807148A

Abstract

本申请提供了一种文本识别匹配方法和装置、终端设备，其中，该方法包括：获取请求文本；对所述请求文本进行实体意图匹配；在未成功识别匹配到实体意图后，对所述请求文本进行问答意图匹配，以得到问答结果。通过上述方案解决了现有的算法模式所存在的匹配准确性低的问题，达到了有效提升匹配准确度的技术效果。

Description

文本识别匹配方法和装置、终端设备

技术领域

本申请属于计算机技术领域，尤其涉及一种文本识别匹配方法和装置、终端设备。

背景技术

在现实生活中，有些繁琐、重复的工作消耗了很多人力。例如：某个APP的客户咨询、银行等公共服务部门的咨询工作等，这些工作都需要耗费人力资源，为此引入了机器人问答，所谓的机器人问答指的是基于自然语言处理的问答机器人，可以对用户输入的问题做出回答。

目前机器人问答所采用的算法主要有两种：一是通过对文本的结构特征提取、构建模板、结构树、知识库等，进而对用户的问题进行模板匹配。另一种是依赖自然语言深度模型做特征向量转换，然后，计算特征向量的相似度来匹配意图。

然而，上述这两种算法模式都只停留在文本的匹配上，算法比较单一，应用的场景也较为局限。

针对上述问题，目前尚未提出有效的解决方案。

发明内容

本申请目的在于提供一种文本识别匹配方法和装置、终端设备，可以实现准确高效的对话匹配需求。

本申请提供一种文本识别匹配方法和装置、终端设备是这样实现的：

一种文本识别匹配方法，所述方法包括：

获取请求文本；

对所述请求文本进行实体意图匹配；

在未成功识别匹配到实体意图后，对所述请求文本进行问答意图匹配，以得到问答结果。

一种文本识别匹配装置，包括：

获取模块，用于获取请求文本；

第一匹配模块，用于对所述请求文本进行实体意图匹配；

第二匹配模块，用于在未成功识别匹配到实体意图后，对所述请求文本进行问答意图匹配，以得到问答结果。

一种终端设备，包括：

语音接收器，用于接收请求文本；

处理器，用于对所述请求文本进行实体意图匹配；在未成功识别匹配到实体意图后，对所述请求文本进行问答意图匹配，以得到问答结果；

播放器，用于播放所述问答结果。

一种终端设备，包括处理器以及用于存储处理器可执行指令的存储器，所述处理器执行所述指令时实现如下方法的步骤：

获取请求文本；

对所述请求文本进行实体意图匹配；

一种对话机器人，包括处理器以及用于存储处理器可执行指令的存储器，所述处理器执行所述指令时实现如下方法的步骤：

获取请求文本；

对所述请求文本进行实体意图匹配；

一种对话机器人定制方法，包括：

显示对话机器人配置界面；

接收用户在配置界面中配置的问题、问题对应的意图、意图对应的应答；

基于所述配置的问题、问题对应的意图、意图对应的应答，生成通过上述文本识别匹配方法进行问答匹配的对话机器人。

一种计算机可读存储介质，其上存储有计算机指令，所述指令被执行时实现如下方法的步骤：

获取请求文本；

对所述请求文本进行实体意图匹配；

本申请提供的文本识别匹配方法和装置、终端设备，先对请求文本进行实体意图匹配，如果未匹配到实体意图，再对请求文本进行问答意图匹配，以得到问答结果。即，集合了实体意图识别和问答意图匹配进行问答处理，从而解决了现有的算法模式所存在的匹配准确性低的问题，达到了有效提升匹配准确度的技术效果。

附图说明

为了更清楚地说明本申请实施例或现有技术中的技术方案，下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍，显而易见地，下面描述中的附图仅仅是本申请中记载的一些实施例，对于本领域普通技术人员来讲，在不付出创造性劳动性的前提下，还可以根据这些附图获得其他的附图。

图1是本申请提供的Q&A算法框架示意图；

图2是本申请提供的实体意图匹配算法框架示意图；

图3是本申请提供的意图匹配算法示意图；

图4是本申请提供的TF_IDF_DOCS算法示意图；

图5是本申请提供的文本识别匹配方法的方法流程图；

图6是本申请提供的计算机终端的架构图；

图7是本申请提供的文本识别匹配装置的结构框图。

具体实施方式

为了使本技术领域的人员更好地理解本申请中的技术方案，下面将结合本申请实施例中的附图，对本申请实施例中的技术方案进行清楚、完整地描述，显然，所描述的实施例仅仅是本申请一部分实施例，而不是全部的实施例。基于本申请中的实施例，本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例，都应当属于本申请保护的范围。

针对问答机器人所使用的问答匹配算法，目前主要有两种：一种是通过对文本的结构特征提取、构建模板、结构树、知识库等，进而对用户的问题进行模板匹配。另一种是依赖自然语言深度模型做特征向量转换，然后计算特征向量的相似度来匹配用户意图。

然而，这两种算法都只停留在文本的匹配上面，算法比较单一，应用的场景也较为局限，其次，如果仅通过文本相似度来进行对话模型的设定，显然效果是不好的，需要对用户的对话意图进行匹配，进行意图分类、意图相似匹配等，才可以得到更准确的问答结果。

其中，上述机器人问答指的基于自然语言处理的问答机器人，可以对用户输入的问题做出回答；意图指的是描述人类会话的抽象问答模式；实体指的是一类事物的抽象，可由枚举(如星期)或正则表达式(如日期)来定义；意图匹配指的是根据用户输入选择最合适的意图。构建指的是用户新建、修改、保存机器人时触发，将意图信息转换为特征信息，并为机器人学习意图匹配模型。

具体的，基于文本结构特征的知识库，结构树匹配主要适用在强相关的意图匹配中，即问题与意图结构相差较小。这类算法很大程度上取决于模板集合的大小和完善程度，在小范围的场景应用使用效果较好，但是遇到大范围的场景召回率很低。

基于自然语言处理的深度学习模型和文本分类模型，在规范通俗的文本意图匹配中表现较好，例如：用户自定义的意图集合都是通俗常用的文本对话内容，然而，在某些具体的场景比如包含较多专业领域的专业词汇，含有较多中英文，字符数据等混合文本的意图匹配场景则表现较差。在短文本匹配中，基于深度模型的意图匹配计算的相似度则都过高，不能很好的区分。

对于上述两种方式度无法解决大量重复类型的意图匹配，没有通过类似实体、槽位的方案解决这类问题，这也就使得用户的使用门槛和使用复杂度较高，且无对离线训练模型和在线预测过程进行隔离，导致意图的增删改较为复杂，问答机器人的灵活性较差。

为此，在本例中，提供了一种问答机器人构建方法，以在意图匹配流程、意图特征提取、意图匹配算法融合的方便进行改进。

具体的，在本例中不是简单地采用文本语句的相似来进行意图分类，而是通过计算意图的相似度，进行意图匹配。其中，一个意图中可以包含一条或多条文本，还有实体等其他特征信息，在进行意图特征提取的时候可以通过多种算法对意图提取特征，计算相似，并融合强化多种算法从而得到意图之间的相似性，进而进行意图匹配。

如图1所示为Q&A意图匹配算法框架，如图2所示为实体意图匹配算法框架。具体的，如图1所示，Q&A意图匹配算法分为构建过程(BUILD)和实时预测匹配过程(PREDICT)，其中，构建过程包括：获取Q&A意图集，初始化分词模型和初始化算法模型，然后进行专有词提取、分词和词性标注，然后，基于分词和词性标注结果提取特征向量、提取中文特征并构建Aiml树(Aiml用于描述一类称为Aiml的对象，同时部分描述了计算机程序处理这些对象时的表现，AIML是可扩展标记语言的衍生)；实时预测匹配过程包括：在接收到用户输入后，加载模型，然后通过加载的模型进行专有词提取、分词和词性标注，进而再匹配Aiml树，提取特征，然后再进行相似计算，从而得到基于Q&A的意图匹配结果。

如图2所示，实体意图匹配算法可以分为构建过程(BUILD)和实时预测匹配过程(PREDICT)，其中，构建过程包括：获取实体意图集，然后注册分词模型、注册算法模型，再进行专有词提取、分词、词性标注、实体映射关系、意图枚举等，然后提取特征向量、训练最大熵分类模型、训练CRF模型、构建Aiml树；实时预测匹配过程包括：在接收到用户输入后，加载模型，然后通过加载的模型进行专有词提取、分词和词性标注，进而再匹配Aiml树、提取特征，然后进行意图分类和实体类型识别，从而得到基于实体意图的意图匹配结果。在实现的时候，上述的构建过程和实时预测匹配过程可以是异步的，即，可以进行异步的构建和在线实时匹配。

如图3所示，为整个问答机器人的意图匹配算法框架，从上到下依次为：用户意图配置、意图文本预处理、离线的特征提取、模型训练和在线的实时预测匹配。从左到右依次为：完全匹配(即，特征结构树匹配)、Q&A意图匹配和实体意图匹配。即，在算法层面区分了完全匹配、Q&A意图匹配和实体意图匹配，针对不同的匹配问题，有针对地选择适合的匹配算法进行匹配。对于完全匹配算法而言，只需要提取分词特征，对于实体意图匹配算法而言，需要提取分词的词性、实体类型和前后置信息等。

对于Q&A意图匹配算法，在本例中进行了调整和优化，在意图匹配的时候，针对Q&A意图匹配提取了多种算法，例如：基于向量(vectors)的算法、基于字符串相似(levenshtein)的算法和的TF_IDF_DOCS意图相似度算法，每个算法会得到一个相似度分数(score1、score2和score3)，然而，再进行意图相似度融合，在进行意图相似度融合的时候，可以但不限于通过boosting、全局均衡化、融合决策和K近邻等策略进行意图相似度融合强化，从而得到Q&A意图匹配结果，以进行更准确的意图相似度匹配。

具体的，在本例中，通过TF-IDF_DOCS SIML(词频逆文本频率算法)意图相似度算法来解决短文本的匹配，可以解决例如：专业领域的特殊文本，多种类型文本组成的字符、英文、数字等意图的意图匹配问题，即，可以解决不具备通俗文本的语言信息的匹配。因为TF-IDF可以将一个意图理解为一个文档，所有意图归纳为一个文档集合，提取每个意图的关键词，并得到一个权重。同时，结合机器人工厂应用场景下，每个意图配置多个Q，相当于每个文档下包含多个自文档。如图4所示，可以计算到该关键词的文档权重，同时通过K占比和K共占比的计算方式，计算出每个关键词在每个意图中的信息量，并结合匹配到关键词的数量计算到请求文本和意图之间的相似度，而不仅仅是文本的相似度。由于TF_IDF_DOCS是以词维度进行的特征提取，因此所有的分词结果都可以很好地利用，不需要做语义层面的理解。其中：

K占比(KRatio)

K共占比(KTRatio)

即，TF_IDF_DOCS SIML意图相似度算法在机器人工厂的意图配置中，一个意图可以配置多个Q，一个机器人又有多个意图。因此，可以通过该算法计算每个关键词的信息量，进而得到该关键词的K占比和K共占比，然后结合匹配到关键词的数量，进行约束惩罚，最后可以估算用户请求(query)与配置意图之间的相似度。通过该算法可以在包含短文本、稀有专业词、特殊字符数字等场景下可以达到精准匹配意图的目的。

在上例中，将意图匹配分为QA意图匹配和实体意图匹配，QA意图匹配和实体意图匹配分别应用在不同的应用场景。

举例而言：

Q(即，Query)为：查询从北京到济南的机票。

针对该Q：

识别到的实体类型为：CityFrom：北京、CityArrive：济南；

识别到的实体为：City：北京、济南、杭州、上海。

通过上述的识别方式，进行实体意图匹配也可以匹配到例如：“从上海到济南的机票”、“从北京到杭州的机票”等。这样就大大降低了配置意图的工作量，从而可以高效地解决这一类型的所有意图的匹配问题。进一步的，可以重新定义特征提取函数，且可以扩展词序(例如：购买机票的触发点一般在从后面)、词性(例如：出发点多为名词地名)等，从而使得训练得到的意图分类器和实体类型分类器可以得到很好的分类结果。

因为构建过程和在线实时匹配预测是异步的，因此，可以满足用户的机器人自定义需求，因为异步构建算法和实时匹配算法是分开的，使得用户可以离线操作，通过增删改等操作来配置意图，然后重新构建模型，实时算法将通过解析新的构建对象进行在线匹配。

由图3可以看出，在整个机器人工厂算法的框架下，不止采用一种算法，有基于深度网络的特征向量提取算法，还有传统的机器学习方法和自然语言处理算法。通过融合这些算法，可以降低单个算法出现误差的影响，增强整个算法的稳定性。例如：如果某些算法机器的相似度都较高，那么在均衡化时就可以降低这个算法的权重；如果某个算法出现问题，计算出的相似度为0或很低，那么可以将该算法的权重均衡到其他算法中。通过K近邻估分重算策略可以适用于具有多个文本Q的意图，将计算文本(多个)的相似度升级为意图相似度。

例如：某个意图I1下有多个文本Q：I1Q1、I1Q2、I1Q3，另外一个意图I2下有多个文本Q：I2Q1、I2Q2、I2Q3。通过前面的多个算法，可以如表1所示计算得到5个最相似的文本：

表1

Q	Score
		I2Q1	0.67
I1Q1	0.6
		I1Q2	0.6
I1Q3	0.5
		I2Q3	0.3

如果是原始的意图匹配选择方案，那么肯定是选择最相似的，即，选择I2作为确定的意图，这种选择方式在很多场景下是正确的，但是如果出现了误差，导致最相似的意图(I2)并不是所需要的，发现意图I1的所有文本都在前5中，而意图I2只有两个前5中，通过K近邻算法重新确定相似度，分别分配给第N位的文本一定权重，就可以得到一个新的意图相似度，进而选择出了最想要的意图。

在构建问答机器人的时候，比如有些问题是泛化的，提供槽位的，例如：咨询某服务部门明天、后天或者某个日期的服务时间段，对于应用方而言，显然不希望对每个日期都设置一个意图，在这种情况下就需要解析时间，同时匹配意图。与时间类似，地名、区域等都可以被定义为实体。

应用方可以快速地创建自己的机器人，并配置意图，快速地发布应用，并通过接口快速的融合到自己的服务中，可以有效降低应用方的人力成本，提高回应效率。在实现的时候，可以为应用方提供web服务，应用方通过登录web服务，可以快速定制专属的问答机器人，同时可以满足高准确率、高效、多场景的支持的需求，同时可以实现实体泛化的意图的快速回答的需求。

应用方在配置问答机器人的时候，可以登陆到配置网站或者是打开配置应用，在里面输入问答信息，例如，用户配置问题(Q)为：今天天气如何？那么答案(A)可以配置为：直接的答复内容，例如：晴天，也可以配置为调用服务(如，可以为调用天气预报平台)。通过这种配置方式可以完成多个意图问答的配置，从而形成一个完整的问答机器人。

图5是本申请一种文本识别匹配方法一个实施例的方法流程图。虽然本申请提供了如下述实施例或附图所示的方法操作步骤或装置结构，但基于常规或者无需创造性的劳动在所述方法或装置中可以包括更多或者更少的操作步骤或模块单元。在逻辑性上不存在必要因果关系的步骤或结构中，这些步骤的执行顺序或装置的模块结构不限于本申请实施例描述及附图所示的执行顺序或模块结构。所述的方法或模块结构的在实际中的装置或终端产品应用时，可以按照实施例或者附图所示的方法或模块结构连接进行顺序执行或者并行执行(例如并行处理器或者多线程处理的环境，甚至分布式处理环境)。

具体的，如图5所示，本申请一种实施例提供的文本识别匹配方法可以包括如下步骤：

步骤501：获取请求文本；

例如，用户使用问答机器人，对着问答机器人询问：您好，请问今天天气如何。或者，对着问答机器人询问：办卡服务需要哪些信息。上述“您好，请问今天天气如何”和“办卡服务需要哪些信息”都可以作为请求文本。

步骤502：对所述请求文本进行实体意图匹配；

考虑到对于实体意图匹配算法而言，需要提取分词的词性、实体类型和前后置信息等。为了实现实体意图匹配，可以对所述请求文本进行分词处理，然后，确定分词的词性、实体类型和前后置信息；根据所述分词的词性、实体类型和前后置信息，进行实体意图匹配。

步骤503：在未成功识别匹配到实体意图后，对所述请求文本进行问答意图匹配，以得到问答结果。

在进行问答意图匹配的时候，可以通过TF-IDF_DOCS SIML意图相似度算法来解决短文本的匹配，可以解决例如：专业领域的特殊文本，多种类型文本组成的字符、英文、数字等意图的意图匹配问题，即，可以解决不具备通俗文本的语言信息的匹配。因为TF-IDF可以将一个意图理解为一个文档，所有意图归纳为一个文档集合，提取每个意图的关键词，并得到一个权重。同时，结合机器人工厂应用场景下，每个意图配置多个Q，相当于每个文档下包含多个自文档。可以计算到该关键词的文档权重，同时通过K占比和K共占比的计算方式，计算出每个关键词在每个意图中的信息量，并结合匹配到关键词的数量计算到请求文本和意图之间的相似度，而不仅仅是文本的相似度。由于TF-IDF_DOCS是以词维度进行的特征提取，因此所有的分词结果都可以很好地利用，不需要做语义层面的理解。

具体的，可以从所述请求文本中提取出多个关键词，然后计算所述多个关键词中各个关键词的信息量；根据各个关键词的信息量，计算得到各个关键词的K占比和K共占比；根据各个关键词的K占比和K共占比、关键词的数量，进行约束惩罚，以确定所述请求文本与配置意图之间的相似度。

为了满足不同的匹配需求，提升匹配准确度，在本例中提供了多种算法加强以及意图相似度融合算法，具体的，针对Q&A意图匹配提取了多种算法，例如：基于向量(vectors)的算法、基于字符串相似(levenshtein)的算法和的TF-IDF_DOCS意图相似度算法，每个算法会得到一个相似度分数(score1、score2和score3)，然而，再进行意图相似度融合，在进行意图相似度融合的时候，可以但不限于通过boosting、全局均衡化、融合决策和K近邻等策略进行意图相似度融合强化，从而得到Q&A意图匹配结果，以进行更准确的意图相似度匹配。

在实现的时候，上述对所述请求文本进行问答意图匹配，可以包括：基于预设的多个QA意图匹配算法对所述请求文本进行处理，得到所述请求文本在各意图下的相似度得分；通过预设的融合强化算法，对所述请求文本在各意图下的相似度得分进行融合处理，得到问答意图匹配结果。其中，融合强化算法可以包括但不限于以下至少之一：Boosting算法、全局均衡化算法、融合决策算法、K近似算法。上述QA意图匹配算法可以包括但不限于以下至少之一：向量匹配算法、字符串相似算法和词频逆文本频率算法。其中，算法强化指的是针对多种分类算法的结果，采用某种策略，得出强化分类算法。

在本例中，可以将异步构建和在线实时匹配预测进行结合，从而可以满足所有用户的机器人自定义需求，因为异步构建算法和实时匹配算法是分开的，因此，用户可以进行离线操作，通过增删改操作来配置意图，然后重新构建模型，实时算法将通过解析新的构建对象进行在线匹配。具体的，对所述请求文本进行问答意图匹配，可以包括：通过问答意图识别模型对所述请求文本进行在线实时的问答意图匹配，其中，问答意图识别模型是离线构建的。通过一系列的相似度加权融合，意图分类匹配算法的强化等算法，可以在绝大多数QA意图匹配场景上得到较好的结果。

在本例中，还提供了一种对话机器人定制方法，可以包括如下步骤：

步骤1：显示对话机器人配置界面；

对于配置触发，可以是通过web页面的形式呈现的，例如，用户可以输入配置页面的网址，就可以进入到配置页面，也可以是在某个应用中提供了配置入口，用户通过在该应用中打开配置入口，就可以进入配置页面。例如：可以接收用户登录web形式的配置界面的操作请求；响应于所述操作请求，显示对话机器人配置界面。

步骤2：接收用户在配置界面中配置的问题、问题对应的意图、意图对应的应答；

例如：应用方在配置问答机器人的时候，可以登陆到配置网站或者是打开配置应用，在里面输入问答信息，例如，用户配置问题(Q)为：今天天气如何？那么答案(A)可以配置为：直接的答复内容，例如：晴天，也可以配置为调用服务(如，可以为调用天气预报平台)。通过这种配置方式可以完成多个意图问答的配置，从而形成一个完整的问答机器人。

步骤3：基于所述配置的问题、问题对应的意图、意图对应的应答，生成通过上述的文本识别匹配方法进行问答匹配的对话机器人。

上述的文本识别匹配方法可以应用在对话机器人中，即，对话机器人可以通过上述的文本识别匹配方法进行问答匹配。例如：在办事大厅中，可以设置对话机器人，用户通过与办事大厅中的对话机器人进行问答对话，可以了解各个服务的办理流程、所需材料等等。例如，在图书馆、商场、车站等地方，也可以设置配置有上述的文本识别匹配方法的对话机器人，用户通过与对话机器人的对话可以在图书馆中确定自己所需要的书存放的位置、可以知道商场中某个商店的位置，可以知道进站口的位置等等。即，在需要进行沟通和问答的场景中都可以设置这种对话机器人，这样可以节约人力成本，用户也无需到处寻找服务人员，有效提升了用户体验。

基于不同应用需求的对话机器人，需求方可以根据对话机器人的使用场景和使用需求通过本例所提供的方式快速地创建自己的机器人，即，按照需求配置意图，然后快速地发布应用，并通过接口快速地融合到自己的服务场景中，有效地节约了人力成本，且大大提高了回应效率。在配置机器人的时候，可以通过平台提供的web服务配置对话机器人，从而可以达到快速便捷进行机器人配置的目的。因为采用的是基于意图匹配算法的机器人定制，因此，用户只需要配置意图，就可以定制专属的机器人，可以达到高准确率、高效和多场景的支持，同时因为支持具备实体泛化的意图快速回答，在智能助手、专属客户、问题咨询等场景都可以起到较好的应用效果。

本申请上述实施例所提供的方法实施例可以在移动终端、计算机终端或者类似的运算装置中执行。以运行在计算机终端上为例，图6是本发明实施例的一种文本识别匹配方法的计算机终端的硬件结构框图。如图6所示，计算机终端10可以包括一个或多个(图中仅示出一个)处理器102(处理器102可以包括但不限于微处理器MCU或可编程逻辑器件FPGA等的处理装置)、用于存储数据的存储器104、以及用于通信功能的传输模块106。本领域普通技术人员可以理解，图6所示的结构仅为示意，其并不对上述电子装置的结构造成限定。例如，计算机终端10还可包括比图6中所示更多或者更少的组件，或者具有与图6所示不同的配置。

存储器104可用于存储应用软件的软件程序以及模块，如本发明实施例中的文本识别匹配方法对应的程序指令/模块，处理器102通过运行存储在存储器104内的软件程序以及模块，从而执行各种功能应用以及数据处理，即实现上述的文本识别匹配方法。存储器104可包括高速随机存储器，还可包括非易失性存储器，如一个或者多个磁性存储装置、闪存、或者其他非易失性固态存储器。在一些实例中，存储器104可进一步包括相对于处理器102远程设置的存储器，这些远程存储器可以通过网络连接至计算机终端10。上述网络的实例包括但不限于互联网、企业内部网、局域网、移动通信网及其组合。

传输模块106用于经由一个网络接收或者发送数据。上述的网络具体实例可包括计算机终端10的通信供应商提供的无线网络。在一个实例中，传输模块106包括一个网络适配器(Network Interface Controller，NIC)，其可通过基站与其他网络设备相连从而可与互联网进行通讯。在一个实例中，传输模块106可以为射频(Radio Frequency，RF)模块，其用于通过无线方式与互联网进行通讯。

在软件层面，上述装置可以如图7所示，包括：

获取模块701，用于获取请求文本；

第一匹配模块702，用于对所述请求文本进行实体意图匹配；

第二匹配模块703，用于在未成功识别匹配到实体意图后，对所述请求文本进行问答意图匹配，以得到问答结果。

在一个实施方式中，上述第一匹配模块702可以包括：分词单元，用于对所述请求文本进行分词处理；第一确定单元，用于确定分词的词性、实体类型和前后置信息；匹配单元，用于根据所述分词的词性、实体类型和前后置信息，进行实体意图匹配。

在一个实施方式中，上述第二匹配模块703可以包括：提取单元，用于从所述请求文本中提取出多个关键词；第一计算单元，用于计算所述多个关键词中各个关键词的信息量；第二计算单元，用于根据各个关键词的信息量，计算得到各个关键词的K占比和K共占比；第二确定单元，用于根据各个关键词的K占比和K共占比、关键词的数量，进行约束惩罚，以确定所述请求文本与配置意图之间的相似度。

在一个实施方式中，上述第二匹配模块703可以包括：第一处理单元，用于基于预设的多个QA意图匹配算法对所述请求文本进行处理，得到所述请求文本在各意图下的相似度得分；第二处理单元，用于通过预设的融合强化算法，对所述请求文本在各意图下的相似度得分进行融合处理，得到问答意图匹配结果。

在一个实施方式中，上述融合强化算法可以包括但不限于以下至少之一：Boosting算法、全局均衡化算法、融合决策算法、K近似算法。

在一个实施方式中，上述QA意图匹配算法可以包括但不限于以下至少之一：向量匹配算法、字符串相似算法和词频逆文本频率算法。

在一个实施方式中，上述对所述请求文本进行问答意图匹配，可以包括：通过问答意图识别模型对所述请求文本进行在线实时的问答意图匹配。其中，问答意图识别模型是离线构建的。

其中，上述文本识别匹配装置可以设置在客户端中，其中，客户端可以是客户操作使用的终端设备或者软件。具体的，客户端可以是智能手机、平板电脑、笔记本电脑、台式计算机、智能手表或者其它可穿戴设备等终端设备。当然，客户端也可以是能运行于上述终端设备中的应用软件。

本申请的实施例还提供能够实现上述实施例中的文本识别匹配方法中全部步骤的一种电子设备的具体实施方式，所述电子设备具体包括如下内容：处理器(processor)、存储器(memory)、通信接口(Communications Interface)和总线；其中，所述处理器、存储器、通信接口通过所述总线完成相互间的通信；所述处理器用于调用所述存储器中的计算机程序，所述处理器执行所述计算机程序时实现上述实施例中的文本识别匹配方法中的全部步骤，例如，所述处理器执行所述计算机程序时实现下述步骤：

步骤1：获取请求文本；

步骤2：对所述请求文本进行实体意图匹配；

步骤3：在未成功识别匹配到实体意图后，对所述请求文本进行问答意图匹配，以得到问答结果。

从上述描述可知，本申请实施例先对请求文本进行实体意图匹配，如果未匹配到实体意图，再对请求文本进行问答意图匹配，以得到问答结果。即，集合了实体意图识别和问答意图匹配进行问答处理，从而解决了现有的算法模式所存在的匹配准确性低的问题，达到了有效提升匹配准确度的技术效果。

本申请的实施例还提供能够实现上述实施例中的文本识别匹配方法中全部步骤的一种计算机可读存储介质，所述计算机可读存储介质上存储有计算机程序，该计算机程序被处理器执行时实现上述实施例中的文本识别匹配方法的全部步骤，例如，所述处理器执行所述计算机程序时实现下述步骤：

步骤1：获取请求文本；

步骤2：对所述请求文本进行实体意图匹配；

本说明书中的各个实施例均采用递进的方式描述，各个实施例之间相同相似的部分互相参见即可，每个实施例重点说明的都是与其他实施例的不同之处。尤其，对于硬件+程序类实施例而言，由于其基本相似于方法实施例，所以描述的比较简单，相关之处参见方法实施例的部分说明即可。

上述对本说明书特定实施例进行了描述。其它实施例在所附权利要求书的范围内。在一些情况下，在权利要求书中记载的动作或步骤可以按照不同于实施例中的顺序来执行并且仍然可以实现期望的结果。另外，在附图中描绘的过程不一定要求示出的特定顺序或者连续顺序才能实现期望的结果。在某些实施方式中，多任务处理和并行处理也是可以的或者可能是有利的。

虽然本申请提供了如实施例或流程图所述的方法操作步骤，但基于常规或者无创造性的劳动可以包括更多或者更少的操作步骤。实施例中列举的步骤顺序仅仅为众多步骤执行顺序中的一种方式，不代表唯一的执行顺序。在实际中的装置或客户端产品执行时，可以按照实施例或者附图所示的方法顺序执行或者并行执行(例如并行处理器或者多线程处理的环境)。

上述实施例阐明的***、装置、模块或单元，具体可以由计算机芯片或实体实现，或者由具有某种功能的产品来实现。一种典型的实现设备为计算机。具体的，计算机例如可以为个人计算机、膝上型计算机、车载人机交互设备、蜂窝电话、相机电话、智能电话、个人数字助理、媒体播放器、导航设备、电子邮件设备、游戏控制台、平板计算机、可穿戴设备或者这些设备中的任何设备的组合。

虽然本说明书实施例提供了如实施例或流程图所述的方法操作步骤，但基于常规或者无创造性的手段可以包括更多或者更少的操作步骤。实施例中列举的步骤顺序仅仅为众多步骤执行顺序中的一种方式，不代表唯一的执行顺序。在实际中的装置或终端产品执行时，可以按照实施例或者附图所示的方法顺序执行或者并行执行(例如并行处理器或者多线程处理的环境，甚至为分布式数据处理环境)。术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含，从而使得包括一系列要素的过程、方法、产品或者设备不仅包括那些要素，而且还包括没有明确列出的其他要素，或者是还包括为这种过程、方法、产品或者设备所固有的要素。在没有更多限制的情况下，并不排除在包括所述要素的过程、方法、产品或者设备中还存在另外的相同或等同要素。

为了描述的方便，描述以上装置时以功能分为各种模块分别描述。当然，在实施本说明书实施例时可以把各模块的功能在同一个或多个软件和/或硬件中实现，也可以将实现同一功能的模块由多个子模块或子单元的组合实现等。以上所描述的装置实施例仅仅是示意性的，例如，所述单元的划分，仅仅为一种逻辑功能划分，实际实现时可以有另外的划分方式，例如多个单元或组件可以结合或者可以集成到另一个***，或一些特征可以忽略，或不执行。另一点，所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些接口，装置或单元的间接耦合或通信连接，可以是电性，机械或其它的形式。

本领域技术人员也知道，除了以纯计算机可读程序代码方式实现控制器以外，完全可以通过将方法步骤进行逻辑编程来使得控制器以逻辑门、开关、专用集成电路、可编程逻辑控制器和嵌入微控制器等的形式来实现相同功能。因此这种控制器可以被认为是一种硬件部件，而对其内部包括的用于实现各种功能的装置也可以视为硬件部件内的结构。或者甚至，可以将用于实现各种功能的装置视为既可以是实现方法的软件模块又可以是硬件部件内的结构。

本发明是参照根据本发明实施例的方法、设备(***)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器，使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。

这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读存储器中，使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品，该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。

这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上，使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理，从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。

在一个典型的配置中，计算设备包括一个或多个处理器(CPU)、输入/输出接口、网络接口和内存。

内存可能包括计算机可读介质中的非永久性存储器，随机存取存储器(RAM)和/或非易失性内存等形式，如只读存储器(ROM)或闪存(flash RAM)。内存是计算机可读介质的示例。

计算机可读介质包括永久性和非永久性、可移动和非可移动媒体可以由任何方法或技术来实现信息存储。信息可以是计算机可读指令、数据结构、程序的模块或其他数据。计算机的存储介质的例子包括，但不限于相变内存(PRAM)、静态随机存取存储器(SRAM)、动态随机存取存储器(DRAM)、其他类型的随机存取存储器(RAM)、只读存储器(ROM)、电可擦除可编程只读存储器(EEPROM)、快闪记忆体或其他内存技术、只读光盘只读存储器(CD-ROM)、数字多功能光盘(DVD)或其他光学存储、磁盒式磁带，磁带磁磁盘存储或其他磁性存储设备或任何其他非传输介质，可用于存储可以被计算设备访问的信息。按照本文中的界定，计算机可读介质不包括暂存电脑可读媒体(transitory media)，如调制的数据信号和载波。

本领域技术人员应明白，本说明书的实施例可提供为方法、***或计算机程序产品。因此，本说明书实施例可采用完全硬件实施例、完全软件实施例或结合软件和硬件方面的实施例的形式。而且，本说明书实施例可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、CD-ROM、光学存储器等)上实施的计算机程序产品的形式。

本说明书实施例可以在由计算机执行的计算机可执行指令的一般上下文中描述，例如程序模块。一般地，程序模块包括执行特定任务或实现特定抽象数据类型的例程、程序、对象、组件、数据结构等等。也可以在分布式计算环境中实践本说明书实施例，在这些分布式计算环境中，由通过通信网络而被连接的远程处理设备来执行任务。在分布式计算环境中，程序模块可以位于包括存储设备在内的本地和远程计算机存储介质中。

本说明书中的各个实施例均采用递进的方式描述，各个实施例之间相同相似的部分互相参见即可，每个实施例重点说明的都是与其他实施例的不同之处。尤其，对于***实施例而言，由于其基本相似于方法实施例，所以描述的比较简单，相关之处参见方法实施例的部分说明即可。在本说明书的描述中，参考术语“一个实施例”、“一些实施例”、“示例”、“具体示例”、或“一些示例”等的描述意指结合该实施例或示例描述的具体特征、结构、材料或者特点包含于本说明书实施例的至少一个实施例或示例中。在本说明书中，对上述术语的示意性表述不必须针对的是相同的实施例或示例。而且，描述的具体特征、结构、材料或者特点可以在任一个或多个实施例或示例中以合适的方式结合。此外，在不相互矛盾的情况下，本领域的技术人员可以将本说明书中描述的不同实施例或示例以及不同实施例或示例的特征进行结合和组合。

以上所述仅为本说明书实施例的实施例而已，并不用于限制本说明书实施例。对于本领域技术人员来说，本说明书实施例可以有各种更改和变化。凡在本说明书实施例的精神和原理之内所作的任何修改、等同替换、改进等，均应包含在本说明书实施例的权利要求范围之内。

Claims

1.一种文本识别匹配方法，其特征在于，所述方法包括：

获取请求文本；

对所述请求文本进行实体意图匹配；

在未成功识别匹配到实体意图后，对所述请求文本进行问答意图匹配，以得到问答结果；

其中，对所述请求文本进行问答意图匹配，包括：

从所述请求文本中提取出多个关键词；

计算所述多个关键词中各个关键词的信息量；

根据各个关键词的信息量，计算得到各个关键词的K占比和K共占比；

根据各个关键词的K占比和K共占比、关键词的数量，进行约束惩罚，以确定所述请求文本与配置意图之间的相似度；

所述根据各个关键词的K占比和K共占比、关键词的数量，进行约束惩罚，以确定所述请求文本与配置意图之间的相似度，包括：

通过词频逆文本频率算法将所述请求文本中的一个意图理解为一个文档，所有的意图归纳为一个文档集合；

提取每个意图的关键词，得到一个权重；

通过K占比和K共占比的计算方式，计算出每个关键词在每个意图中的信息量，结合匹配到关键词的数量计算到请求文本和意图之间的相似度。

2.根据权利要求1所述的方法，其特征在于，对所述请求文本进行实体意图匹配，包括：

对所述请求文本进行分词处理；

确定分词的词性、实体类型和前后置信息；

根据所述分词的词性、实体类型和前后置信息，进行实体意图匹配。

3.根据权利要求1所述的方法，其特征在于，对所述请求文本进行问答意图匹配，包括：

基于预设的多个QA意图匹配算法对所述请求文本进行处理，得到所述请求文本在各意图下的相似度得分；

通过预设的融合强化算法，对所述请求文本在各意图下的相似度得分进行融合处理，得到问答意图匹配结果。

4.根据权利要求3所述的方法，其特征在于，所述融合强化算法包括以下至少之一：Boosting算法、全局均衡化算法、融合决策算法、K近似算法。

5.根据权利要求3所述的方法，其特征在于，所述QA意图匹配算法包括以下至少之一：向量匹配算法、字符串相似算法和词频逆文本频率算法。

6.根据权利要求1所述的方法，其特征在于，对所述请求文本进行问答意图匹配，包括：通过问答意图识别模型对所述请求文本进行在线实时的问答意图匹配。

7.根据权利要求6所述的方法，其特征在于，所述问答意图识别模型是离线构建的。

8.一种文本识别匹配装置，其特征在于，包括：

获取模块，用于获取请求文本；

第一匹配模块，用于对所述请求文本进行实体意图匹配；

第二匹配模块，用于在未成功识别匹配到实体意图后，对所述请求文本进行问答意图匹配，以得到问答结果；

其中，所述第二匹配模块包括：

提取单元，用于从所述请求文本中提取出多个关键词；

第一计算单元，用于计算所述多个关键词中各个关键词的信息量；

第二计算单元，用于根据各个关键词的信息量，计算得到各个关键词的K占比和K共占比；

第二确定单元，用于根据各个关键词的K占比和K共占比、关键词的数量，进行约束惩罚，以确定所述请求文本与配置意图之间的相似度；

所述第二确定单元，还用于通过词频逆文本频率算法将所述请求文本中的一个意图理解为一个文档，所有的意图归纳为一个文档集合；

提取每个意图的关键词，得到一个权重；

9.根据权利要求8所述的装置，其特征在于，所述第一匹配模块包括：

分词单元，用于对所述请求文本进行分词处理；

第一确定单元，用于确定分词的词性、实体类型和前后置信息；

匹配单元，用于根据所述分词的词性、实体类型和前后置信息，进行实体意图匹配。

10.根据权利要求8所述的装置，其特征在于，所述第二匹配模块包括：

第一处理单元，用于基于预设的多个QA意图匹配算法对所述请求文本进行处理，得到所述请求文本在各意图下的相似度得分；

第二处理单元，用于通过预设的融合强化算法，对所述请求文本在各意图下的相似度得分进行融合处理，得到问答意图匹配结果。

11.一种终端设备，其特征在于，包括：

语音接收器，用于接收请求文本；

播放器，用于播放所述问答结果；

其中，对所述请求文本进行问答意图匹配，包括：

从所述请求文本中提取出多个关键词；

计算所述多个关键词中各个关键词的信息量；

提取每个意图的关键词，得到一个权重；

12.一种对话机器人定制方法，其特征在于，包括：

显示对话机器人配置界面；

基于所述配置的问题、问题对应的意图、意图对应的应答，生成通过权利要求1至7中任一项所述的文本识别匹配方法进行问答匹配的对话机器人。

13.根据权利要求12所述的方法，其特征在于，显示对话机器人配置界面，包括：

接收用户登录web形式的配置界面的操作请求；

响应于所述操作请求，显示对话机器人配置界面。

14.一种对话机器人，包括处理器以及用于存储处理器可执行指令的存储器，所述处理器执行所述指令时实现权利要求1至7中任一项所述方法的步骤。

15.一种终端设备，包括处理器以及用于存储处理器可执行指令的存储器，所述处理器执行所述指令时实现权利要求1至7中任一项所述方法的步骤。

16.一种计算机可读存储介质，其上存储有计算机指令，所述指令被执行时实现权利要求1至7中任一项所述方法的步骤。