CN115358241B

CN115358241B - 基于人机交互的标注方法及相关装置、设备和介质

Info

Publication number: CN115358241B
Application number: CN202211284037.2A
Authority: CN
Inventors: 肖建辉
Original assignee: iFlytek Co Ltd
Current assignee: iFlytek Co Ltd
Priority date: 2022-10-20
Filing date: 2022-10-20
Publication date: 2023-04-04
Anticipated expiration: 2042-10-20
Also published as: CN115358241A

Abstract

本申请公开了一种基于人机交互的标注方法及相关装置、设备和介质，其中，基于人机交互的标注方法包括：获取人机交互***响应于用户输入的请求信息而反馈的候选信息；其中，请求信息含有命名实体，候选信息含有与目标对象相关的命名实体，目标对象为请求信息中命名实体所属对象，且候选信息中命名实体采用标准名称；提取请求信息中命名实体作为第一实体，并提取用户选择的候选信息中命名实体作为第二实体；其中，人机交互***基于用户选择的候选信息与用户进行交互；基于第一实体与第二实体之间的文本相似度，确定是否将第一实体标注为第二实体的非标名称。上述方案，能够在降低标注成本的同时，提升标注质量。

Description

基于人机交互的标注方法及相关装置、设备和介质

技术领域

本申请涉及数据标注技术领域，特别是涉及一种基于人机交互的标注方法及相关装置、设备和介质。

背景技术

当前，诸如语音交互等人机交互技术已经在智能家居、移动终端、车载等领域广泛应用。为了提升交互效果，行业内普遍亟需标注出用户对各种对象的不同名称，特别是标准名称之外的非标名称。例如，对于标准名称“XX市第一中学”，其非标名称包括但不限于：“XX市一中”、“XX一中”等。

目前，通常采用人工识别并标注出非标名称，或基于规则自动生成非标名称。但是，前者需要耗费大量成本，后者所生成的非标名称不一定与真实情况相吻合。有鉴于此，如何在降低标注成本的同时，提升标注质量，成为亟待解决的问题。

发明内容

本申请主要解决的技术问题是提供一种基于人机交互的标注方法及相关装置、设备和介质，能够在降低标注成本的同时，提升标注质量。

为了解决上述技术问题，本申请第一方面提供了一种基于人机交互的标注方法，包括：获取人机交互***响应于用户输入的请求信息而反馈的候选信息；其中，请求信息含有命名实体，候选信息含有与目标对象相关的命名实体，目标对象为请求信息中命名实体所属对象，且候选信息中命名实体采用标准名称；提取请求信息中命名实体作为第一实体，并提取用户选择的候选信息中命名实体作为第二实体；其中，人机交互***基于用户选择的候选信息与用户进行交互；基于第一实体与第二实体之间的文本相似度，确定是否将第一实体标注为第二实体的非标名称。

为了解决上述技术问题，本申请第二方面提供了一种基于人机交互的标注装置，包括：信息获取模块、实体提取模块和非标确定模块，信息获取模块，用于获取人机交互***响应于用户输入的请求信息而反馈的候选信息；其中，请求信息含有命名实体，候选信息含有与目标对象相关的命名实体，目标对象为请求信息中命名实体所属对象，且候选信息中命名实体采用标准名称；实体提取模块，用于提取请求信息中命名实体作为第一实体，并提取用户选择的候选信息中命名实体作为第二实体；其中，人机交互***基于用户选择的候选信息与用户进行交互；非标确定模块，用于基于第一实体与第二实体之间的文本相似度，确定是否将第一实体标注为第二实体的非标名称。

为了解决上述技术问题，本申请第三方面提供了一种电子设备，包括相互耦接的存储器和处理器，存储器中存储有程序指令，处理器用于执行程序指令以实现上述第一方面的基于人机交互的标注方法。

为了解决上述技术问题，本申请第四方面提供了一种计算机可读存储介质，存储有能够被处理器运行的程序指令，程序指令用于实现上述第一方面的基于人机交互的标注方法。

上述方案，获取人机交互***响应于用户输入的请求信息而反馈的候选信息，且请求信息含有命名实体，候选信息含有与目标对象相关的命名实体，目标对象为请求信息中命名实体所属对象，候选信息中命名实体采用标准名称，在此基础上，提取请求信息中命名实体作为第一实体，并提取用户选择的候选信息中命名实体作为第二实体，且人机交互***基于用户选择的候选信息与用户进行交互，再基于第一实体与第二实体之间的文本相似度，确定是否将第一实体标注为第二实体的非标名称，一方面通过巧妙地复用在正常人机交互过程中用户输入的请求信息和用户选择的候选信息自动完成标注，而无需人工手动标注，也不会对正常人机交互产生干扰，有助于降低标注成本，另一方面由于通过第一实体和第二实体之间的文本相似度来确定是否将第一实体标注为非标名称，且第一实体也是真实的用户说法，而非规则生成，有助于提升标注质量。故此，能够在降低标注成本的同时，提升标注质量。

附图说明

图1是本申请基于人机交互的标注方法一实施例的流程示意图；

图2是本申请基于人机交互的标注方法另一实施例的流程示意图；

图3是本申请基于人机交互的标注装置一实施例的框架示意图；

图4是本申请电子设备一实施例的框架示意图；

图5是本申请计算机可读存储介质一实施例的框架示意图。

具体实施方式

下面结合说明书附图，对本申请实施例的方案进行详细说明。

以下描述中，为了说明而不是为了限定，提出了诸如特定***结构、接口、技术之类的具体细节，以便透彻理解本申请。

本文中术语“***”和“网络”在本文中常被可互换使用。本文中术语“和/或”，仅仅是一种描述关联对象的关联关系，表示可以存在三种关系，例如，A和/或B，可以表示：单独存在A，同时存在A和B，单独存在B这三种情况。另外，本文中片段“/”，一般表示前后关联对象是一种“或”的关系。此外，本文中的“多”表示两个或者多于两个。

本申请公开实施例，获取人机交互***响应于用户输入的请求信息而反馈的候选信息，且请求信息含有命名实体，候选信息含有与目标对象相关的命名实体，目标对象为请求信息中命名实体所属对象，候选信息中命名实体采用标准名称，在此基础上，提取请求信息中命名实体作为第一实体，并提取用户选择的候选信息中命名实体作为第二实体，且人机交互***基于用户选择的候选信息与用户进行交互，再基于第一实体与第二实体之间的文本相似度，确定是否将第一实体标注为第二实体的非标名称，一方面通过巧妙地复用在正常人机交互过程中用户输入的请求信息和用户选择的候选信息自动完成标注，而无需人工手动标注，也不会对正常人机交互产生干扰，有助于降低标注成本，另一方面由于通过第一实体和第二实体之间的文本相似度来确定是否将第一实体标注为非标名称，且第一实体也是真实的用户说法，而非规则生成，有助于提升标注质量。故此，能够在降低标注成本的同时，提升标注质量。

请参阅图1，图1是本申请基于人机交互的标注方法一实施例的流程示意图。具体而言，可以包括如下步骤：

步骤S11：获取人机交互***响应于用户输入的请求信息而反馈的候选信息。

本公开实施例中，请求信息含有命名实体，候选信息含有与目标对象相关的命名实体，目标对象为请求信息中命名实体所属对象，且候选信息中命名实体采用标准名称。需要说明的是，命名实体（named entity）人名、机构名、地名以及其他所有以名称为标识的实体，具体可以参阅命名实体的相关定义，在此不再赘述。此外，标准名称指为使命名尽可能不造成歧义，通常在正式场合、正式文件中所采用的名称，如可以包括但不限于：官方名称、正式名称等，在此不做限定。示例性地，命名实体“XX市第一高级中学”采用标准名称，而命名实体“XX一中”、“XX市一中”则并非标准名称；或者，命名实体“XX市妇幼保健医院”采用标准名称，而命名实体“XX妇幼”并非标准名称；或者，命名实体“张XX”采用标准名称，而命名实体“老张”、“小张”并非标准名称。此外，本申请公开实施例中，命名实体可以为人名实体、地名实体、机构实体等中任一者，在此不做限定。在命名实体为人名实体的情况下，可以为人名实体的标准名称标注其非标名称；在命名实体为地名实体的情况下，可以为地名实体的标准名称标注其非标名称；在命名实体为机构实体的情况下，可以为机构实体的标准名称标注其非标名称。其他情况可以以此类推，在此不再一一举例。

在一个实施场景中，在命名实体为地名实体的情况下，非标名称至少包括别名、简称。示例性地，如地名实体“安徽”，其简称为“皖”；或者，地名实体“广州”，其别称为“羊城”。其他情况可以以此类推，在此不再一一举例。

在一个实施场景中，在命名实体为人名实体的情况下，非标名称至少包括昵称。示例性地，如人名实体“张XX”，其昵称可以为“老张”、“小张”等。其他情况可以以此类推，在此不再一一举例。

在一个实施场景中，在命名实体为机构实体的情况下，非标名称至少包括简称、缩写。示例性地，如机构实体“XX大学附属医院”，其简称可以包括“XX附院”、“XX大学附院”等；或者，如机构实体“世界知识产权组织”，其缩写为“WIPO”。其他情况可以以此类推，在此不再一一举例。

需要说明的是，在某些情况下，上述机构实体、地名实体并不完全区分。如“XX市第一高级中学”、“XX市第一初级中学”、“XX一中”、“XX市一中”可以作为机构实体，但由于通常也指向具体地点，故也可以作为地名实体。

在一个实施场景中，与目标对象相关的命名实体，可以包括但不限于：目标对象自身所对应的命名实体、与其自身所对应的命名实体相似的其他命名实体，在此不做限定。示例性地，以请求信息“导航到XX一中”为例，其所含命名实体为“XX一中”，其所属对象（即目标对象）实际上是“XX市第一高级中学”，与其相关的命名实体包括但不限于：“XX市第一高级中学”（即其本身）、“XX市第一初级中学”（即与其高度相似）、“XX市第一实验中学”（即与其高度相似），且均采用标准名称，则相应的候选信息可以包括如下三个：“好的，导航到XX市第一高级中学”、“好的，导航到XX市第一初级中学”、“好的，导航到XX市第一实验中学”。需要说明的是，上述举例仅仅是实际应用时一种可能情况，并不因此而限定请求信息的具体内容。

在一个实施场景中，人机交互***可以包括但不限于：导航***、个人助理***等，在此不做限定。更为具体地，请求信息可以通过语音方式输入至人机交互***，即人机交互***支持语音输入，示例性地，人机交互***可以包括但不限于：语音导航***、语音助手***等，在此不做限定。当然，请求信息还可以通过诸如文本等其他方式输入至人机交互***，在此不做限定。上述方式，通过语音、文本中任一种方式将请求信息输入至人机交互***，从而能够使用户选择任意方式输入请求信息，有助于提升人机交互的便利性。

在一个实施场景中，如前所述，可以通过语音方式输入请求信息至人机交互***。在此情况下，可以对请求信息进行识别、理解及搜索，以得到若干候选信息。需要说明的是，上述识别、理解及搜索，可以在用户终端本地完成，也可以在云端服务器完成，或者，还可以部分在用户终端本地完成，部分在云端服务器完成，在此不做限定。此外，若上述至少部分需要在云端服务器完成，则人机交互时或人机交互前，可以告知用户由于在人机交互过程中需要联网，需要请求获取联网权限，以及请求获取将请求信息所含数据上传的用户授权，如若获取用户授权，则可以执行本申请基于人机交互的标注方法实施例中步骤，如若用户不同意授权，则可以正常与用户人机交互，而不再人机交互过程中通过本申请基于人机交互的标注方法实施例中步骤进行名称标注。

在一个具体的实施场景中，以请求信息中命名实体为地名实体“XX一中”为例，可以先对请求信息进行语音识别，得到与请求信息对应的识别文本“导航到XX一中”，再对识别文本进行语义理解，以得到用户意图（如，要搜索到“XX一中”的开车路线）。进一步地，可以结合上述用户意图在终端本地或云端服务器进行搜索，得到若干候选信息：候选信息A“好的，导航去XX市第一高级中学”、候选信息B“好的，导航去XX市第一初级中学”。需要说明的是，上述“XX市第一高级中学”、“XX市第一初级中学”均是地图数据库中的标准名称。

在一个具体的实施场景中，以请求信息中命名实体为人名实体“老张”为例，可以先对请求信息进行语音识别，得到与请求信息对应的识别文本“打电话给老张”，再对识别文本进行语义理解，以得到用户意图（如，致电给“老张”）。进一步地，可以结合上述用户意图在终端本地进行搜索联系人，以得到若干候选信息：候选信息C“好的，打电话给张某”、候选信息D“好的，打电话给张某某”。需要说明的是，上述“张某”、“张某某”均是联系人簿中的标准名称。

在一个实施场景中，如前所述，可以通过文本方式输入请求信息至人机交互***。在此情况下，可以对请求信息进行理解及搜索，以得到若干候选信息。此外，上述理解及搜索，可以在用户终端本地完成，也可以在云端服务器完成，或者，还可以部分在用户终端本地完成，部分在云端服务器完成，在此不做限定。若上述至少部分需要在云端服务器完成，则人机交互时或人机交互前，可以提示用户由于在人机交互过程中需要联网，并请求获取联网权限，以及请求获取将请求信息所含数据上传的用户授权。具体可以参阅前述相关描述，在此不再赘述。

在一个实施场景中，为了提升人机交互效率，并提升标注效率，在得到候选信息之后，以及在执行下述步骤S12之前，可以先检测人机交互***是否反馈唯一候选信息，若是，则可以认为请求信息中命名实体为非标名称的可能性几乎可以忽略不计，此时可以直接基于该唯一候选信息与用户进行交互，则不必再执行下述步骤S12，在得到新的请求信息之后，再重新从上述步骤S11开始执行本公开实施例中步骤。示例性地，请求信息为“导航到XX市第一高级中学”，由于请求信息给出的用户意图非常明确，此时人机交互***反馈唯一候选信息，如“好的，导航到XX市第一高级中学”，故可以直接为用户展示到“XX市第一高级中学”的开车路线。反之，如果人机交互***反馈的候选信息并不唯一，可以认为请求信息中命名实体有一定可能为非标名称，此时可以执行下述步骤S12。上述方式，检测人机交互***是否反馈唯一候选信息，并响应于人机交互***反馈的候选信息并不唯一，执行提取请求信息中命名实体作为第一实体，并提取用户选择的候选信息中命名实体作为第二实体的步骤，反之响应于人机交互***反馈唯一候选新新，直接基于唯一候选信息与用户进行交互，由于人机交互***反馈唯一候选信息时，请求信息中命名实体为非标名称的可能性几乎可以忽略不计，而人机交互***反馈的候选信息并不唯一时，请求信息中命名实体有一定可能为非标名称，故能够提升人机交互效率，并提升标注效率。

步骤S12：提取请求信息中命名实体作为第一实体，并提取用户选择的候选信息中命名实体作为第二实体。

本公开实施例中，人机交互***基于用户选择的候选信息与用户进行交互。特别地，如前所述，在人机交互***反馈唯一候选信息的情况下，人机交互***可以直接基于该唯一候选信息与用户进行交互，而在人机交互***反馈的候选信息并不唯一的情况下，人机交互***可以基于用户选择的候选信息与用户进行交互。此外，实体提取可以采用诸如LTP、PyHanlp、Lac等命名实体识别工具，在此不做限定。

步骤S13：基于第一实体与第二实体之间的文本相似度，确定是否将第一实体标注为第二实体的非标名称。

在一个实施场景中，文本相似度可以采用诸如：最小编辑距离、海明距离、Jacard相似度等相似度度量方式。具体度量过程，可以参阅上述相似度度量方式的技术细节，在此不再赘述。示例性地，以采用最小编辑距离为例，如可以从前述请求信息“导航到XX一中”提取得到第一实体“XX一中”，并可以从用户选择的候选信息“好的，导航到XX市第一高级中学”提取得到第二实体“XX市第一高级中学”，由于第一实体“XX一中”经过编辑操作“***”（即insert）如下字符：“市第”、“高级”、“学”，即可得到第二实体，故第一实体和第二实体之间的最小编辑距离为5个字符，而第一实体和第二实体的并集为9个字符，故可以取两者之差与并集字数的比值，作为文本相似度，即4/9，也就是44.44%。其他情况可以以此类推，在此不再一一举例。

在一个实施场景中，可以预先设置第一阈值和第二阈值，并在得到文本相似度之后，可以检测文本相似度是否位于第一阈值与第二阈值之间。在此基础上，响应于文本相似度位于第一阈值与第二阈值之间，可以确定将的第一实体标注为第二实体的非标名称，响应于文本相似度未处于第一阈值与第二阈值之间，可以确定第一实体并非第二实体的非标名称。需要说明的是，第一阈值和第二阈值可以根据实际测试情况进行调整，当然，也可以根据样本统计进行设置，具体可以参阅下述相关描述，在此暂不赘述。此外，文本相似度处于第一阈值与第二阈值之间，具体可以表明文本相似度大于第一阈值且小于第二阈值，同理，文本相似度未处于第一阈值与第二阈值之间，具体可以表明文本相似度小于或等于第一阈值，或者文本相似度大于或等于第二阈值。上述方式，响应于文本相似度处于第一阈值与第二阈值之间，确定将第一实体标注为第二实体的非标名称，响应于相似度未处于第一阈值与第二阈值之间，确定第一实体并非第二实体的非标名称，故通过设置第一阈值，排除文本相似度过低的情况，即与第二实体匹配度过低的第一实体极大可能是脏数据，类似地，通过设置第二阈值，排除文本相似度过高的情况，即与第二实体匹配度过高的第一实体极大可能不能作为非标名称，故能够有效排除干扰，提升标注准确性。

在一个具体的实施场景中，仍以前述第一实体“XX一中”和第二实体“XX市第一高级中学”为例，如前所述，两者之间的文本相似度为44.44%，第一阈值可以设置为20%，第二阈值可以设置为70%，则此时由于第一实体与第二实体之间的文本相似度处于第一阈值与第二阈值之间，故可以确定将第一实体“XX一中”标注为第二实体“XX市第一高级中学”的非标名称。在第一实体、第二实体、第一阈值和第二阈值为其他情况时，可以以此类推，在此不再一一举例。

在一个具体的实施场景中，如前所述，可以根据实际测试情况调整第一阈值和第二阈值。具体地，可以预先初始化第一阈值和第二阈值，如可以分别初始化为10%和90%，当然，初始化的具体数值并不局限于此，也可以设置为其他数值，如可以设置为20%和80%、15%和85%等等，在此不做限定。第i次标注测试时，在通过检测第一实体与第二实体之间的文本相似度是否处于第一阈值与第二阈值之间，确定是否将第一实体标注为第二实体的非标名称之后，可以将标注结果交由人工核验，如若核验通过，则可以维持第一阈值和第二阈值不变，否则可以调整第一阈值、第二阈值中至少一者。需要说明的是，第i次标注测试时的第一阈值和第二阈值，可以为经第i-1次标注测试之后最新的第一阈值和第二阈值。例如，若造成核验不通过的原因是第一阈值过小，使得本应不该标注为非标名称但由于文本相似度处于第一阈值与第二阈值之间而被错误标注为非标名称，则可以调大第一阈值，使其小于第二阈值且大于第i次标注测试时文本相似度；或者，若造成核验不通过的原因是第一阈值过大，使得本应标注为非标名称但由于文本相似度未处于第一阈值与第二阈值之间而未被标注为非标名称，则可以调小第一阈值，使其小于第i次标注测试时的文本相似度；或者，若造成核验不通过的原因是第二阈值过小，使得本应标注为非标名称但由于文本相似度未处于第一阈值与第二阈值之间而未被标注为非标名称，则可以调大第二阈值，使其大于第i次标注测试时的文本相似度；或者，若造成核验不通过的原因是第二阈值过大，使得本应不该标注为非标名称但由于文本相似度处于第一阈值与第二阈值之间而被标注为非标名称，则可以调小第二阈值，使其大于第一阈值且小于第i次标注测试时的文本相似度。第i+1次、第i+2次、……、第i+N次的标注测试，可以以此类推，在此不再一一举例。需要说明的是，当连续M次标注测试，第一阈值和第二阈值均无需调整时，则可以确定第一阈值和第二阈值已调整完毕，此时可以结束标注测试，并将最新的第一阈值和最新的第二阈值，作为后续正式标注时最终的第一阈值和最终的第二阈值。

在一个具体的实施场景中，如前所述，也可以根据样本统计进行设置第一阈值和第二阈值。具体地，可以收集若干次历史交互过程中分别产生的样本交互数据，并剔除满足第一条件的样本交互数据。需要说明的是，样本交互数据可以包括用户输入的样本请求信息和用户选择的样本候选信息，具体可以参阅前述关于请求信息和候选信息的相关描述，在此不再赘述。此外，第一条件可以设置为包括：样本请求信息中的命名实体为样本参考实体的非标名称，且样本参考实体为用户选择的样本候选信息中的命名实体。也就是说，对于剩余的样本交互数据而言，其样本请求信息中的命名实体要么是和样本候选信息中的命名实体匹配度过低，而不能作为非标名称，要么是和样本候选信息中的命名实体匹配度过高，而不能作为非标名称。因此，对于剩余的各个样本交互数据，可以度量样本请求信息中的命名实体与样本参考实体之间的文本相似度，并基于剩余的样本交互数据分别对应的文本相似度，将剩余的各个样本交互数据划分至第一数据集合和第二数据集合。具体来说，可以基于剩余的样本交互数据分别对应的文本相似度进行聚类（如，K-Means聚类等），从而将剩余的各个样本交互数据划分至第一数据集合和第二数据集合。示例性地，剩余的样本交互数据共有10个，分别对应的文本相似度为：20%、90%、96%、10%、89%、19%、15%、80%、88%、84%，在此基础上可以进行聚类，从而划分为两个数据集合，第一数据集合中各个样本交互数据分别对应的文本相似度为：20%、10%、19%、15%，第二数据集合中各个样本交互数据分别对应的文本相似度为：90%、96%、89%、80%、88%、84%。需要说明的是，上述举例仅仅是实际应用过程中一种可能的实施方式，并不因此而限定剩余的样本交互数据其实际情况。此外，为了提升第一阈值和第二阈值的准确性，理论上来说，准备的历史交互数据越多越好，如可以准备100个、500个、1000个等，在此不做限定。在得到第一数据集合第二数据集合之后，可以基于第一数据集合中样本交互数据对应的文本相似度，确定第一阈值，并基于第二数据集合中样本交互数据对应的文本相似度，确定第二阈值。示例性地，可以将第一数据集合中各样本交互数据分别对应的文本相似度中的最大值，确定为第一阈值，并将第二数据集合中各样本交互数据分别对应的文本相似度中的最小值，确定为第二阈值。仍以前述10个样本交互数据为例，可以将第一数据集合中各样本交互数据分别对应的文本相似度：20%、10%、19%、15%中的最大值，即20%作为第一阈值，并可以将第二数据集合中各样本交互数据分别对应的文本相似度：90%、96%、89%、80%、88%、84%中的最小值，即80%作为第二阈值。其他情况可以以此类推，在此不再一一举例。上述方式，收集若干次历史交互过程中分别产生的样本交互数据，并剔除满足第一条件的样本交互数据，且样本交互数据包括用户输入的样本请求信息和用户选择的样本候选信息，第一条件包括：样本请求信息中的命名实体为样本参考实体的非标名称，且样本参考实体为用户选择的样本候选信息中的命名实体。在此基础上，对于剩余的各个样本交互数据，度量样本请求信息中的命名实体与样本参考实体之间的文本相似度，并基于剩余的各个样本交互数据分别对应的文本相似度，将剩余的各个样本交互数据划分至第一数据集合和第二数据集合，从而基于第一数据集合中样本交互数据对应的文本相似度，确定第一阈值，并基于第二数据集合中样本交互数据对应的文本相似度，确定第二阈值，进而能够基于历史数据统计确定合适的第一阈值和第二阈值，有助于提升第一阈值和第二阈值的准确性。

在一个具体的实施场景中，与前述实施方式类似地，收集若干次历史交互过程中分别产生的样本交互数据，并保留满足第一条件的样本交互数据，具体可以参阅前述相关描述，在此不再赘述。在此基础上，对于剩余的各个样本交互数据，可以度量样本请求信息中的命名实体与样本参考实体之间的文本相似度，并将最小文本相似度作为第一阈值，以及将最大文本相似度作为第二阈值。

在一个实施场景中，若确定第一实体标注为第二实体的非标名称，则第一实体和第二实体可以绑定为实体对并归拢于名称集合。故此，在经过多次标注之后，名称集合的数据规模逐渐增大，在名称集合的数据规模满足第二条件的情况下，人机交互时，响应于新的请求信息，可以在名称集合中搜索与新的请求信息中的命名实体绑定的目标实体，并生成包含目标实体的反馈信息，且目标实体采用标准名称，从而可以将反馈信息作为新的候选信息，优先反馈给用户。需要说明的是，除上述包含目标实体的反馈信息，人机交互***基于新的请求信息，还可能生成其他新的候选信息，在此情况下，可以将上述反馈信息置顶，以将其优先反馈给用户。上述方式，在名称集合的数据规模满足第二条件的情况下，响应于新的请求信息，在名称集合中搜索与新的请求信息中的命名实体绑定的目标实体，并生成包含目标实体的反馈信息，且目标实体采用标准名称，从而将反馈信息作为新的候选信息，优先反馈用户，能够准确适应人机交互过程中用户可能输入的非标名称，有助于提升人机交互的交互效果。

在一个具体的实施场景中，如前所述，由于第一实体“XX一中”和第二实体“XX市第一高级中学”经上述检测，可以确定将第一实体“XX一中”标注为第二实体“XX市第一高级中学”的非标名称，从而第一实体“XX一中”和第二实体“XX市第一高级中学”绑定为实体对并归拢于名称集合。

在一个具体的实施场景中，第二条件具体设置为包括：名称集合中实体对的数量大于第三阈值。第三阈值可以设置为：1000、5000、10000等，在此不做限定。

在一个具体的实施场景中，以新的请求信息“导航到XX妇幼”为例，经搜索在名称集合中查找到与新的请求信息中命名实体“XX妇幼”绑定的目标实体“XX市妇幼保健医院”，并生成包含目标实体的反馈信息“好的，导航到XX市妇幼保健医院”，并将其作为新的候选信息，优先反馈给用户。其他情况可以以此类推，在此不再一一举例。

在一个具体的实施场景中，在新的请求信息中的命名实体为地名实体的情况下，搜索过程中，可以先获取输入新的请求信息的用户当前所在的地理位置，再在名称集合中查找与地理位置相关的实体对，归拢为目标子集，最后在目标子集中搜索与新的请求信息中的命名实体绑定的目标实体。示例性地，以输入新的请求信息的用户当前所在的地理位置为XX市为例，可以先在名称集合中查找与B市相关的实体对：（1）“XX市第一高级中学”—“XX一中”、（2）“XX市妇幼保健医院”—“XX妇幼”，归拢为目标子集，则在新的请求信息中的命名实体为“XX妇幼”的情况下，可以在目标子集搜索到与该命名实体绑定的目标实体“XX市妇幼保健医院”。其他情况可以以此类推，在此不再一一举例。上述方式，在新的请求信息中的命名实体为地名实体的情况下，获取输入新的请求信息的用户当前所在的地理位置，在名称集合中查找与地理位置相关的实体对，归拢为目标子集，再在目标子集中搜索与新的请求信息中命名实体绑定的目标实体，故通过地理位置筛选出目标子集，有助于缩小搜索范围，尽可能地排除无关实体的干扰，提升搜索效率，也有助于提升搜索的准确性。

在一个具体的实施场景中，人机交互***可以应用于地点导航场景，名称集合可以存储于云端服务器，并由使用人机交互***的各个用户共同更新云端服务器中的名称集合。示例性地，人机交互***可以为导航APP，安装有导航APP的用户可以视为使用该人机交互***的各个用户，则每个用户在与导航APP正常交互过程中，均可以通过本申请标注方法公开实施例中步骤，确定请求信息中命名实体是否可以标注为人机交互***推荐的候选信息中命名实体的非标名称，并在确定可以标注的情况下，形成实体对，从而在云端服务器中更新名称集合，进而随着用户的不断增多，使用次数的不断增多，名称集合也逐渐庞大，并从快速壮大，到逐渐趋于饱和，此时即可认为数据标注已经基本完成，而在此过程中，一方面并未对正常的人机交互造成影响，另一方面又能够免于人工标注或由规则生成。

在一个具体的实施场景中，人机交互***也可以应用于个人助理场景。考虑到个人助理场景下，标注信息通常具有较为强烈的个性（如，用户A在个人助理场景下说的“老张”，具体指的是“张某”，而用户B在个人助理场景下说的“老张”，具体指的是完全不相干的“张某某”），而不像导航场景般具有互通性，且又具有一定的隐私性，也不便于在网络共享，此时名称集合可以存储于用户终端本地，并由用户终端所属用户单独更新用户终端中的名称集合，即每个用户终端本次所存储的名称集合相互独立。示例性地，人机交互***可以为手机助理（如，Siri等），安装有手机助理的用户可以视为使用该人机交互***的各个用户，则每个用户在与手机助理正常交互过程中，均可以通过本申请标注方法公开实施例中步骤，确定请求信息中命名实体是否可以标注为人机交互***推荐的候选信息中命名实体的非标名称，并在确定可以标注的情况下，形成实体对，从而在用户终端更新名称集合，进而随着使用次数的不断增多，名称集合也逐渐庞大，并从快速壮大，到逐渐趋于饱和，此时即可认为数据标注已经基本完成，而在此过程中，一方面并未对正常的人机交互造成影响，另一方面又能够免于人工标注或由规则生成。

请参阅图2，图2是本申请基于人机交互的标注方法另一实施例的流程示意图。具体而言，可以包括如下步骤：

步骤S21：获取人机交互***响应于用户输入的请求信息而反馈的候选信息。

本公开实施例中，请求信息含有命名实体，候选信息含有与目标对象相关的命名实体，目标对象为请求信息中命名实体所属对象，且候选信息中命名实体采用标准名称，具体可以参阅前述公开实施例中相关描述，在此不再赘述。

步骤S22：检测人机交互***是否反馈唯一候选信息。若是，则执行步骤S23，否则执行步骤S24。

具体可以参阅前述公开实施例中相关描述，在此不再赘述。

步骤S23：直接基于唯一候选信息与用户进行交互。

具体可以参阅前述公开实施例中相关描述，在此不再赘述。

步骤S24：获取用户选择的候选信息，并基于用户选择的候选信息与用户进行交互。

具体可以参阅前述公开实施例中相关描述，在此不再赘述。

步骤S25：提取请求信息中命名实体作为第一实体，并提取用户选择的候选信息中命名实体作为第二实体。

本公开实施例中，人机交互***基于用户选择的候选信息与用户进行交互，具体可以参阅前述公开实施例中相关描述，在此不再赘述。

步骤S26：检测第一实体与第二实体之间的文本相似度是否位于第一阈值与第二阈值之间，若是则执行步骤S27，否则执行步骤S28。

具体可以参阅前述公开实施例中相关描述，在此不再赘述。

步骤S27：确定将第一实体标注为第二实体的非标名称。

具体可以参阅前述公开实施例中相关描述，在此不再赘述。

步骤S28：确定第一实体并非第二实体的非标名称。

具体可以参阅前述公开实施例中相关描述，在此不再赘述。

上述方案，获取人机交互***响应于用户输入的请求信息而反馈的候选信息，检测人机交互***是否反馈唯一候选信息，若是，则直接基于唯一候选信息与用户进行交互，反之，则获取用户选择的候选信息，并基于用户选择的候选信息与用户进行交互，并提取请求信息中命名实体作为第一实体，并提取用户选择的候选信息中命名实体作为第二实体。在此基础上，再检测第一实体与第二实体之间的文本相似度是否位于第一阈值与第二阈值之间，若是则确定将第一实体标注为第二实体的非标名称，反之则确定第一实体并非第二实体的非标名称，故巧妙地复用在正常人机交互过程中用户输入的请求信息和用户选择的候选信息自动完成标注，而又不影响正常的人机交互，能够在降低标注成本的同时，提升标注质量。

请参阅图3，图3是本申请基于人机交互的标注装置30一实施例的框架示意图。基于人机交互的标注装置30包括：信息获取模块31、实体提取模块32和非标确定模块33，信息获取模块31，用于获取人机交互***响应于用户输入的请求信息而反馈的候选信息；其中，请求信息含有命名实体，候选信息含有与目标对象相关的命名实体，目标对象为请求信息中命名实体所属对象，且候选信息中命名实体采用标准名称；实体提取模块32，用于提取请求信息中命名实体作为第一实体，并提取用户选择的候选信息中命名实体作为第二实体；其中，人机交互***基于用户选择的候选信息与用户进行交互；非标确定模块33，用于基于第一实体与第二实体之间的文本相似度，确定是否将第一实体标注为第二实体的非标名称。

在一些公开实施例中，非标确定模块33包括第一确定子模块，用于响应于文本相似度处于第一阈值与第二阈值之间，确定将第一实体标注为第二实体的非标名称；非标确定模块33包括第二确定子模块，用于响应于文本相似度未处于第一阈值与第二阈值之间，确定第一实体并非第二实体的非标名称。

在一些公开实施例中，基于人机交互的标注装置30包括数据获取模块，用于收集若干次历史交互过程中分别产生的样本交互数据，并剔除满足第一条件的样本交互数据；其中，样本交互数据包括用户输入的样本请求信息和用户选择的样本候选信息，第一条件包括：样本请求信息中的命名实体为样本参考实体的非标名称，且样本参考实体为用户选择的样本候选信息中的命名实体；基于人机交互的标注装置30包括相似度量模块，用于对于剩余的各个样本交互数据，度量样本请求信息中的命名实体与样本参考实体之间的文本相似度，基于人机交互的标注装置30包括数据划分模块，用于基于剩余的各个样本交互数据分别对应的文本相似度，将剩余的各个样本交互数据划分至第一数据集合和第二数据集合；基于人机交互的标注装置30包括阈值确定模块，用于基于第一数据集合中样本交互数据对应的文本相似度，确定第一阈值，并基于第二数据集合中样本交互数据对应的文本相似度，确定第二阈值。

在一些公开实施例中，阈值确定模块具体用于将第一数据集合中各样本交互数据分别对应的文本相似度中的最大值，确定为第一阈值，将第二数据集合中各样本交互数据分别对应的文本相似度中的最小值，确定为第二阈值。

在一些公开实施例中，若确定将第一实体标注为第二实体的非标名称，则第一实体和第二实体绑定为实体对并归拢于名称集合，基于人机交互的标注装置30还包括实体搜索模块，用于在名称集合的数据规模满足第二条件的情况下，响应于新的请求信息，在名称集合中搜索与新的请求信息中的命名实体绑定的目标实体，基于人机交互的标注装置30还包括反馈生成模块，用于生成包含目标实体的反馈信息；其中，目标实体采用标准名称；基于人机交互的标注装置30还包括信息反馈模块，用于将反馈信息作为新的候选信息，优先反馈用户。

在一些公开实施例中，人机交互***应用于地点导航场景，名称集合存储于云端服务器，并由使用人机交互***的各个用户共同更新云端服务器中的名称集合。

在一些公开实施例中，人机交互***应用于个人助理场景，名称集合存储于用户终端本地，并由用户终端所属用户单独更新用户终端中的名称集合。

在一些公开实施例中，实体搜索模块包括位置获取子模块，用于在新的请求信息中的命名实体为地名实体的情况下，获取输入新的请求信息的用户当前所在的地理位置；实体搜索模块包括子集查找子模块，用于在名称集合中查找与地理位置相关的实体对，归拢为目标子集；实体搜索模块包括目标搜索子模块，用于在目标子集中搜索与新的请求信息中的命名实体绑定的目标实体。

在一些公开实施例中，基于人机交互的标注装置30还包括信息检测模块，用于检测人机交互***是否反馈唯一候选信息；实体提取模块32具体用于响应于人机交互***反馈的候选信息并不唯一，执行提取请求信息中命名实体作为第一实体，并提取用户选择的候选信息中命名实体作为第二实体的步骤；基于人机交互的标注装置30还包括人机交互模块，用于响应于人机交互***反馈唯一候选信息，直接基于唯一候选信息与用户进行交互。

在一些公开实施例中，请求信息通过语音、文本中任一种方式输入至人机交互***。

在一些公开实施例中，在命名实体为地名实体的情况下，非标名称至少包括别名、简称；和/或，在命名实体为人名实体的情况下，非标名称至少包括昵称；和/或，在命名实体为机构实体的情况下，非标名称至少包括简称、缩写。

请参阅图4，图4是本申请电子设备40一实施例的框架示意图。电子设备40包括相互耦接的存储器41和处理器42，存储器41中存储有程序指令，处理器42用于执行程序指令以实现上述任一基于人机交互的标注方法实施例中的步骤。具体地，电子设备40可以包括但不限于：台式计算机、笔记本电脑、服务器、手机、平板电脑、智能音箱、车载终端、车机等等，在此不做限定。此外，电子设备40还可以进一步包括但不限于：麦克风（未图示）、显示屏（未图示）、扬声器（未图示）等，在此不做限定。

具体而言，处理器42用于控制其自身以及存储器41以实现上述任一基于人机交互的标注方法实施例中的步骤。处理器42还可以称为CPU（Central Processing Unit，中央处理单元）。处理器42可能是一种集成电路芯片，具有信号的处理能力。处理器42还可以是通用处理器、数字信号处理器（Digital Signal Processor, DSP）、专用集成电路（Application Specific Integrated Circuit, ASIC）、现场可编程门阵列（Field-Programmable Gate Array, FPGA）或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件。通用处理器可以是微处理器或者该处理器也可以是任何常规的处理器等。另外，处理器42可以由集成电路芯片共同实现。

上述方案，由于电子设备40中处理器42用于执行存储器41中程序指令以实现上述任一基于人机交互的标注方法实施例中的步骤，故一方面通过巧妙地复用在正常人机交互过程中用户输入的请求信息和用户选择的候选信息自动完成标注，而无需人工手动标注，也不会对正常人机交互产生干扰，有助于降低标注成本，另一方面由于通过第一实体和第二实体之间的文本相似度来确定是否将第一实体标注为非标名称，且第一实体也是真实的用户说法，而非规则生成，有助于提升标注质量。故此，能够在降低标注成本的同时，提升标注质量。

请参阅图5，图5是本申请计算机可读存储介质50一实施例的框架示意图。计算机可读存储介质50存储有能够被处理器运行的程序指令51，程序指令51用于实现上述任一基于人机交互的标注方法实施例中的步骤。

上述方案，由于计算机可读存储介质50存储有被处理器执行能够实现上述任一标注方法实施例中步骤的程序指令51，故一方面由于语音交互***中设置分别适用于不同交互场景的交互子***，且多个交互子***均能够对识别文本分析得到候选交互结果，而候选交互结果又包含候选交互文本和交互优先级，且交互子***适用的交互场景与识别文本之间的匹配程度、交互子***输出的候选交互结果中交互优先级两者之间正相关，故在后续结果仲裁时能够基于交互优先级准确地输出用于响应待识别语音的目标交互文本，即在面临切换交互场景时，区别于现有技术采用通用反馈话术，能够对待识别语音进行针对性的准确回复，故在面临业务场景切换时，提升语音交互的灵活性；另一方面由于分别适用于不同交互场景的多个交互子***相互独立，即通过不同交互子***分别在不同交互场景下进行语音交互，从而在面临业务场景切换时，能够尽可能地降低丢失继承关系的可能性，提升语音交互的准确性。故此，能够在面临业务场景切换时，提升语音交互的灵活性，并尽可能地降低丢失继承关系的可能性，提升语音交互的准确性。

在一些实施例中，本公开实施例提供的装置具有的功能或包含的模块可以用于执行上文方法实施例描述的方法，其具体实现可以参照上文方法实施例的描述，为了简洁，这里不再赘述。

上文对各个实施例的描述倾向于强调各个实施例之间的不同之处，其相同或相似之处可以互相参考，为了简洁，本文不再赘述。

在本申请所提供的几个实施例中，应该理解到，所揭露的方法和装置，可以通过其它的方式实现。例如，以上所描述的装置实施方式仅仅是示意性的，例如，模块或单元的划分，仅仅为一种逻辑功能划分，实际实现时可以有另外的划分方式，例如多个单元或组件可以结合或者可以集成到另一个***，或一些特征可以忽略，或不执行。另一点，所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些接口，装置或单元的间接耦合或通信连接，可以是电性、机械或其它的形式。

作为分离部件说明的单元可以是或者也可以不是物理上分开的，作为单元显示的部件可以是或者也可以不是物理单元，即可以位于一个地方，或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施方式方案的目的。

另外，在本申请各个实施例中的各功能单元可以集成在一个处理单元中，也可以是各个单元单独物理存在，也可以两个或两个以上单元集成在一个单元中。上述集成的单元既可以采用硬件的形式实现，也可以采用软件功能单元的形式实现。

集成的单元如果以软件功能单元的形式实现并作为独立的产品销售或使用时，可以存储在一个计算机可读取存储介质中。基于这样的理解，本申请的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的全部或部分可以以软件产品的形式体现出来，该计算机软件产品存储在一个存储介质中，包括若干指令用以使得一台计算机设备（可以是个人计算机，服务器，或者网络设备等）或处理器（processor）执行本申请各个实施方式方法的全部或部分步骤。而前述的存储介质包括：U盘、移动硬盘、只读存储器（ROM，Read-Only Memory）、随机存取存储器（RAM，Random Access Memory）、磁碟或者光盘等各种可以存储程序代码的介质。

若本申请技术方案涉及个人信息，应用本申请技术方案的产品在处理个人信息前，已明确告知个人信息处理规则，并取得个人自主同意。若本申请技术方案涉及敏感个人信息，应用本申请技术方案的产品在处理敏感个人信息前，已取得个人单独同意，并且同时满足“明示同意”的要求。例如，在摄像头等个人信息采集装置处，设置明确显著的标识告知已进入个人信息采集范围，将会对个人信息进行采集，若个人自愿进入采集范围即视为同意对其个人信息进行采集；或者在个人信息处理的装置上，利用明显的标识/信息告知个人信息处理规则的情况下，通过弹窗信息或请个人自行上传其个人信息等方式获得个人授权；其中，个人信息处理规则可包括个人信息处理者、个人信息处理目的、处理方式以及处理的个人信息种类等信息。

Claims

1.一种基于人机交互的标注方法，其特征在于，包括：

获取人机交互***响应于用户输入的请求信息而反馈的候选信息；其中，所述请求信息含有命名实体，所述候选信息含有与目标对象相关的命名实体，所述目标对象为所述请求信息中所述命名实体所属对象，且所述候选信息中所述命名实体采用标准名称；

提取所述请求信息中所述命名实体作为第一实体，并提取用户选择的候选信息中所述命名实体作为第二实体；其中，所述人机交互***基于用户选择的候选信息与用户进行交互；

基于所述第一实体与所述第二实体之间的文本相似度，确定是否将所述第一实体标注为所述第二实体的非标名称。

2.根据权利要求1所述的方法，其特征在于，所述基于所述第一实体与所述第二实体之间的文本相似度，确定是否将所述第一实体标注为所述第二实体的非标名称，包括：

响应于所述文本相似度处于第一阈值与第二阈值之间，确定将所述第一实体标注为所述第二实体的非标名称；

响应于所述文本相似度未处于第一阈值与第二阈值之间，确定所述第一实体并非所述第二实体的非标名称。

3.根据权利要求2所述的方法，其特征在于，所述第一阈值和所述第二阈值的获取步骤包括：

收集若干次历史交互过程中分别产生的样本交互数据，并剔除满足第一条件的样本交互数据；其中，所述样本交互数据包括用户输入的样本请求信息和用户选择的样本候选信息，所述第一条件包括：所述样本请求信息中的命名实体为样本参考实体的非标名称，且所述样本参考实体为所述用户选择的样本候选信息中的命名实体；

对于剩余的各个样本交互数据，度量所述样本请求信息中的命名实体与所述样本参考实体之间的文本相似度，并基于剩余的各个样本交互数据分别对应的文本相似度，将剩余的各个样本交互数据划分至第一数据集合和第二数据集合；

基于所述第一数据集合中所述样本交互数据对应的文本相似度，确定所述第一阈值，并基于所述第二数据集合中所述样本交互数据对应的文本相似度，确定所述第二阈值。

4.根据权利要求3所述的方法，其特征在于，所述第一阈值小于所述第二阈值，所述基于所述第一数据集合中所述样本交互数据对应的文本相似度，确定所述第一阈值，包括：

将所述第一数据集合中各所述样本交互数据分别对应的文本相似度中的最大值，确定为所述第一阈值；

所述基于所述第二数据集合中所述样本交互数据对应的文本相似度，确定所述第二阈值，包括：

将所述第二数据集合中各所述样本交互数据分别对应的文本相似度中的最小值，确定为所述第二阈值。

5.根据权利要求1所述的方法，其特征在于，若确定将所述第一实体标注为所述第二实体的非标名称，则所述第一实体和所述第二实体绑定为实体对并归拢于名称集合，在所述名称集合的数据规模满足第二条件的情况下，所述方法还包括：

响应于新的请求信息，在所述名称集合中搜索与所述新的请求信息中的命名实体绑定的目标实体，并生成包含所述目标实体的反馈信息；其中，所述目标实体采用标准名称；

将所述反馈信息作为新的候选信息，优先反馈用户。

6.根据权利要求5所述的方法，其特征在于，所述人机交互***应用于地点导航场景，所述名称集合存储于云端服务器，并由使用所述人机交互***的各个用户共同更新所述云端服务器中的名称集合。

7.根据权利要求5所述的方法，其特征在于，所述人机交互***应用于个人助理场景，所述名称集合存储于用户终端本地，并由所述用户终端所属用户单独更新所述用户终端中的名称集合。

8.根据权利要求5所述的方法，其特征在于，在所述新的请求信息中的命名实体为地名实体的情况下，所述在所述名称集合中搜索与所述新的请求信息中的命名实体绑定的目标实体，包括：

获取输入所述新的请求信息的用户当前所在的地理位置；

在所述名称集合中查找与所述地理位置相关的实体对，归拢为目标子集；

在所述目标子集中搜索与所述新的请求信息中的命名实体绑定的目标实体。

9.根据权利要求1所述的方法，其特征在于，在所述提取所述请求信息中所述命名实体作为第一实体，并提取用户选择的候选信息中所述命名实体作为第二实体之前，所述方法还包括：

检测所述人机交互***是否反馈唯一所述候选信息；

所述提取所述请求信息中所述命名实体作为第一实体，并提取用户选择的候选信息中所述命名实体作为第二实体，包括：

响应于所述人机交互***反馈的候选信息并不唯一，执行所述提取所述请求信息中所述命名实体作为第一实体，并提取用户选择的候选信息中所述命名实体作为第二实体的步骤；

所述方法还包括：

响应于所述人机交互***反馈唯一所述候选信息，直接基于唯一所述候选信息与用户进行交互。

10.根据权利要求1所述的方法，其特征在于，所述请求信息通过语音、文本中任一种方式输入至所述人机交互***。

11.根据权利要求1所述的方法，其特征在于，在所述命名实体为地名实体的情况下，所述非标名称至少包括别名、简称；

和/或，在所述命名实体为人名实体的情况下，所述非标名称至少包括昵称；

和/或，在所述命名实体为机构实体的情况下，所述非标名称至少包括简称、缩写。

12.一种基于人机交互的标注装置，其特征在于，包括：

信息获取模块，用于获取人机交互***响应于用户输入的请求信息而反馈的候选信息；其中，所述请求信息含有命名实体，所述候选信息含有与目标对象相关的命名实体，所述目标对象为所述请求信息中所述命名实体所属对象，且所述候选信息中所述命名实体采用标准名称；

实体提取模块，用于提取所述请求信息中所述命名实体作为第一实体，并提取用户选择的候选信息中所述命名实体作为第二实体；其中，所述人机交互***基于用户选择的候选信息与用户进行交互；

非标确定模块，用于基于所述第一实体与所述第二实体之间的文本相似度，确定是否将所述第一实体标注为所述第二实体的非标名称。

13.一种电子设备，其特征在于，包括相互耦接的存储器和处理器，所述存储器中存储有程序指令，所述处理器用于执行所述程序指令以实现权利要求1至11任一项所述的基于人机交互的标注方法。

14.一种计算机可读存储介质，其特征在于，存储有能够被处理器运行的程序指令，所述程序指令用于实现权利要求1至11任一项所述的基于人机交互的标注方法。