CN111933127A - 一种具备自学习能力的意图识别方法及意图识别*** - Google Patents

一种具备自学习能力的意图识别方法及意图识别*** Download PDF

Info

Publication number
CN111933127A
CN111933127A CN202010758935.1A CN202010758935A CN111933127A CN 111933127 A CN111933127 A CN 111933127A CN 202010758935 A CN202010758935 A CN 202010758935A CN 111933127 A CN111933127 A CN 111933127A
Authority
CN
China
Prior art keywords
intention
recognition
self
learning
candidate
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202010758935.1A
Other languages
English (en)
Other versions
CN111933127B (zh
Inventor
彭殷路
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Shengzhi Information Technology Nanjing Co ltd
Original Assignee
Shengzhi Information Technology Nanjing Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Shengzhi Information Technology Nanjing Co ltd filed Critical Shengzhi Information Technology Nanjing Co ltd
Priority to CN202010758935.1A priority Critical patent/CN111933127B/zh
Publication of CN111933127A publication Critical patent/CN111933127A/zh
Priority to PCT/CN2021/115933 priority patent/WO2022022746A1/zh
Priority to US17/818,686 priority patent/US20220383854A1/en
Application granted granted Critical
Publication of CN111933127B publication Critical patent/CN111933127B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/08Speech classification or search
    • G10L15/18Speech classification or search using natural language modelling
    • G10L15/1822Parsing for meaning understanding
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/06Creation of reference templates; Training of speech recognition systems, e.g. adaptation to the characteristics of the speaker's voice
    • G10L15/063Training
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/08Speech classification or search
    • G10L15/18Speech classification or search using natural language modelling
    • G10L15/1815Semantic context, e.g. disambiguation of the recognition hypotheses based on word meaning
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/22Procedures used during a speech recognition process, e.g. man-machine dialogue
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/06Creation of reference templates; Training of speech recognition systems, e.g. adaptation to the characteristics of the speaker's voice
    • G10L15/063Training
    • G10L2015/0635Training updating or merging of old and new templates; Mean values; Weighting
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/22Procedures used during a speech recognition process, e.g. man-machine dialogue
    • G10L2015/223Execution procedure of a spoken command
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/22Procedures used during a speech recognition process, e.g. man-machine dialogue
    • G10L2015/226Procedures used during a speech recognition process, e.g. man-machine dialogue using non-speech characteristics
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/22Procedures used during a speech recognition process, e.g. man-machine dialogue
    • G10L2015/226Procedures used during a speech recognition process, e.g. man-machine dialogue using non-speech characteristics
    • G10L2015/227Procedures used during a speech recognition process, e.g. man-machine dialogue using non-speech characteristics of the speaker; Human-factor methodology

Landscapes

  • Engineering & Computer Science (AREA)
  • Computational Linguistics (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Artificial Intelligence (AREA)
  • Machine Translation (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明公开了一种具备自学习能力的意图识别方法及意图识别***,属于意图识别技术领域,包含以下步骤,获取用户表述,将语音识别为对应的文本;对用户表述进行初步的意图识别,输出候选意图;获取候选意图的历史数据特征参数;根据预设的规则策略,决策是否直接输出最终识别意图,并根据各意图的特征参数进行规则计算,输出最终的识别意图;将意图识别过程中的候选意图和最终识别意图的预测数据提交至自学习***,进行自学习和指标参数的数据更新。本发明能够根据智能语音对话***和终端的实际使用场景中意图识别历史数据的特征分布进行自学习,动态调整意图识别的策略,以提高该使用场景下意图识别的准确率。

Description

一种具备自学习能力的意图识别方法及意图识别***
技术领域
本发明涉及意图识别技术领域,尤其涉及一种具备自学习能力的意图识别方法及意图识别***。
背景技术
随着人工智能和机器学习技术的发展,智能语音对话***在各个领域的应用越来越广泛。语音识别、语音合成以及自然语言理解作为智能语音对话***的主要技术点,这些技术的发展也推动着智能对话***能力的演进。
意图识别属于自然语言理解的技术范畴,是指通过对用户表述的识别和处理,输出用户说表达的真实意图。智能对话***可以根据用户的意图来组织正确的回应,以推动对话的正常进行。在意图识别的过程中,不论是采用哪种类型的意图识别技术,都会涉及到从多个候选的意图中选取最终意图的过程,而最终选择的意图的正确性又直接影响着对话能不能正确的进行下去。
现有的意图识别方案主要以基于规则的意图识别和基于机器学习模型的意图识别为主。
但是不论是选择何种意图识别技术,都需要解决从多个意图中选取最终意图的问题,基于规则的意图识别技术,可以根据匹配文本的长度或者编辑距离选择最终的意图;基于机器学习模型的意图识别技术,一般根据意图的得分进行排序选择分数最高的意图,但是这个结果过于依赖于模型的质量,即训练模型的语料的质量。
所以,存在的问题主要是,需要持续不断的根据存在问题的意图识别记录,进行规则的调整优化,或者对模型训练语料进行扩展优化,才能够提高或者维持意图识别的准确率。无法根据实际的语境和意图识别的历史记录的特征,动态的进行意图识别优化,通过自学习的方式和相关的识别策略,来调整意图识别的准确率。
在智能语音对话领域,意图识别技术是指在人机交互的过程中,智能语音对话***对于用户所表述的自然语言文本进行分析和识别,获取用户所表达的意图。一般来说,意图识别也称为意图分类,即根据自定义的意图领域和意图将用户表述分类到具体的意图类别中。
智能问答***就是一种典型的智能语音对话***,用户可以使用自然语言进行提问,***需要识别用户的真实问题,并根据问题查询答案。在这个场景中,意图识别的能力就是识别用户的真实问题的能力,只有满足这一点,***才能给用户提供正确的答案。
传统的智能语音对话***和终端一般使用以下技术来进行意图识别:
基于规则模版(Rule-Based)的意图识别
该技术使用人为构造的关键词、正则表达式以及其他常见的规则模板对意图文本进行分类。基于规则模板的意图识别方法不需要大量的训练数据,使用过程中所需要的资源消耗很很小,并且能够快速验证规则的准确性,广泛适用于意图识别模块的冷启动阶段。从效果上来看,基于规则模板的意图识别方法在意图类别数量较低的情况下能够具备较高的准确率,但是随着意图类别数量的增加,会面临多意图命中的问题,很难维持高准确率。
基于文本编辑距离的意图识别
文本编辑距离是指两个字符串文本之间,有一个转为另一个所需要的最少编辑操作次数。所谓的编辑操作是指将一个字符删除、新增或者替换为用另一个字符的操作。
文本编辑距离本意上是用来计算两个文本的相似程度。需要人为构造意图分类及各个意图分类下的文本语料,当用户表述的文本与某句语料文本的编辑距离最小的时候,即选取该语料文本所在的意图分类作为意图识别的结果。
基于文本分类的意图识别
该技术同样需要人为构造的意图分类以及各个意图分类下的语料文本,语料文本需要能够覆盖大部分用户表述的通用话术,然后需要人工打标和扩展语料来优化和扩展数据集。通过对数据机进行各种特征抽取和训练模型并调优,然后使用该模型对于用户表述文本进行意图识别预测,通常模型会输出命中的意图分类名称和预测分。基于文本分类的意图识别技术是机器学习技术发展后比较流行的意图识别技术,但是该技术对于模型训练数据集质量的要求很高,其意图识别效果经常取决于训练数据集质量的高低。
传统的意图识别技术,不论是基于规则模版或是基于编辑距离和文本分类的意图分类,首先对于预定义的规则、意图分类和意图语料都有较高的质量要求,同时不能够根据意图识别的历史请求结果对于意图识别的能力进行自学习,无法适应千差万别的用户表述意图的方式和不同语境下的真实意图的选择。
发明内容
本发明所要解决的技术问题是针对传统的意图识别技术意图识别的准确率过于依赖于规则或者模型训练数据的质量的高低,并且在使用过程中,不具备自学习的能力,需要持续的人工干预来维持和提供意图识别的准确率,本发明能够根据智能语音对话***和终端的实际使用场景中意图识别历史数据的特征分布进行自学习,动态调整意图识别的策略,以提高该使用场景下意图识别的准确率。
本发明为解决上述技术问题采用以下技术方案:
用于智能语音对话***的具备自学习能力的意图识别方法,具体包含如下步骤;
步骤1,获取用户表述,并通过语音识别技术将其识别为对应的文本;
步骤2,根据预设的策略中的配置对用户表述进行初步的意图识别,输出候选意图;
步骤3,根据当前的意图识别的上下文场景,以候选意图作为查询条件向意图场景特征自学习***发起查询,获取候选意图的历史数据特征参数;
步骤4,根据预设的意图选择规则策略,决策是否直接输出最终识别意图,或者使用意图选择规则策略中配置的其他意图识别算法对候选意图进行进一步的识别,并根据各意图的特征参数进行规则计算,输出最终的识别意图;
步骤5,将意图识别过程中的候选意图和最终识别意图的预测数据提交至自学习***,进行自学习和指标参数的数据更新。
作为本发明用于智能语音对话***的具备自学习能力的意图识别方法的进一步优选方案,在步骤1中,获取用户表述,是指通过智能对话***或者终端获得用户表述的音频。
作为本发明用于智能语音对话***的具备自学习能力的意图识别方法的进一步优选方案,在步骤2中,候选意图具体为:对步骤1中所输出的用户表述的文本进行初步的意图识别,可通过规则模版、计算成本较低的文本分类算法模型、语义槽值提取算法模型对用户的表述进行快速的分析,输出高相似度的候选意图分类。
作为本发明用于智能语音对话***的具备自学习能力的意图识别方法的进一步优选方案,在步骤3中,获取候选意图的历史数据特征参数的步骤,是指根据用户表述的对话上下文语境获取该语境下意图识别的历史记录的特征,提取上一步骤中输出的候选意图分类的特征参数,如该场景下所有意图识别历史数据中命中某一意图的比例、所有意图识别历史数据中某一意图分类下的各个语料的所占比例。
作为本发明用于智能语音对话***的具备自学习能力的意图识别方法的进一步优选方案,在步骤4中,
预设的意图选择规则策略行步骤,是指根据预设的策略,决策是否需要对候选意图使用成本较高的意图识别技术进行预测,输出所有候选意图的准确性预测得分;并根据上一步骤中获取的所有候选意图的场景特征参数进行规则计算,输出最终的识别意图。
作为本发明用于智能语音对话***的具备自学习能力的意图识别方法的进一步优选方案,在步骤5中,自学习***,是指将上述步骤中所预测的候选意图和最终识别意图及其相关的场景特征参数提交至自学习数据分析***,用于实时或者定期的数据分析和回归测试,更新意图识别的场景特征相关数据。
一种用于智能语音对话***的具备自学习能力的意图识别方法的意图识别***,包含
用户表述获取模块,用于将用户表述的语音转化为字符串文本,提供给其他模块进行意图识别;
意图识别算法模块,用于根据服务接口的定义,以用户表述的字符串文本和调用的意图识别算法类型为输入,在模块内部进行语义解析、规则匹配、关键词匹配和文本分类计算过程执行,输出用户表述文本可能属于的意图;
意图识别策略引擎模块,用于为用户预定义的意图识别策略配置,根据意图识别的策略配置调用制定的意图识别算法并与自学习模块进行数据的获取和提交,用于最终意图的选择和自学习数据的更新;
意图场景特征自学习模块,用于对于意图识别策略引擎模块上报的意图识别历史数据进行自学习,并在意图识别阶段提供基于上下文场景的历史数据指标参数,用于决策最终选择的意图。本发明采用以上技术方案与现有技术相比,具有以下技术效果:
本发明能够根据智能语音对话***和终端的实际使用场景中意图识别历史数据的特征分布进行自学习,动态调整意图识别的策略,以提高该使用场景下意图识别的准确率。
此外,采用以上的技术方案后,意图识别的准确率不再强依赖于规则的配置正确率和意图识别模型训练数据的质量的高低,在智能语音对话***和终端的使用过程中,也能有效的减少人工干预来维持意图识别的准确率。
附图说明
图1是本发明所描述的具备自学习能力的意图识别和自学习的流程图;
图2是本发明意图识别模块协同工作交互示意图。
具体实施方式
下面结合附图对本发明的技术方案做进一步的详细说明:
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
本发明要解决的问题是:传统的意图识别技术意图识别的准确率过于依赖于规则或者模型训练数据的质量的高低,并且在使用过程中,不具备自学习的能力,需要持续的人工干预来维持和提供意图识别的准确率。
本发明所提供的一种具备自学习能力的意图识别方法,能够根据智能语音对话***和终端的实际使用场景中意图识别历史数据的特征分布进行自学习,动态调整意图识别的策略,以提高该使用场景下意图识别的准确率。
该方法用于智能语音对话***的具备自学习能力的意图识别方法,如图1所示,具体包
含如下步骤;
步骤1,获取用户表述,并通过语音识别技术将其识别为对应的文本;
步骤2,根据预设的策略中的配置对用户表述进行初步的意图识别,输出候选意图;
步骤3,根据当前的意图识别的上下文场景,以候选意图作为查询条件向意图场景特征自学习***发起查询,获取候选意图的历史数据特征参数;
步骤4,根据预设的意图选择规则策略,决策是否直接输出最终识别意图,或者使用意图选择规则策略中配置的其他意图识别算法对候选意图进行进一步的识别,并根据各意图的特征参数进行规则计算,输出最终的识别意图;
步骤5,将意图识别过程中的候选意图和最终识别意图的预测数据提交至自学习***,进行自学习和指标参数的数据更新。
获取用户表述步骤,是指通过智能对话***或者终端获得用户表述的音频,并通过语音识别技术将其识别为对应的文本。
候选意图识别步骤,是指对上一步骤中所输出的用户表述的文本进行初步的意图识别,通常可以通过规则模版、计算成本较低的文本分类算法模型、语义槽值提取算法模型对用户的表述进行快速的分析,输出高相似度的候选意图分类。
场景特征获取步骤,是指根据用户表述的对话上下文语境获取该语境下意图识别的历史记录的特征,提取上一步骤中输出的候选意图分类的特征参数,如该场景下所有意图识别历史数据中命中某一意图的比例、所有意图识别历史数据中某一意图分类下的各个语料的所占比例等。
意图选择策略执行步骤,是指根据预设的策略,决策是否需要对候选意图使用成本较高的意图识别技术进行预测,输出所有候选意图的准确性预测得分;并根据上一步骤中获取的所有候选意图的场景特征参数进行规则计算,输出最终的识别意图场景特征自学习步骤,是指将上述步骤中所预测的候选意图和最终识别意图及其相关的场景特征参数提交至自学习数据分析***,用于实时或者定期的数据分析和回归测试,更新意图识别的场景特征相关数据。
为了更清楚了解本发明的技术内容和实施方式,特举具体实施案例并配合所附图示说明如下。
本发明在实施过程中,会涉及到以下模块的协同工作,以下结合附图对于本发明中各个模块的功能范围和协作过程进行阐述。
用户表述获取模块,用户表述通俗来说就是用户说的话,模块需要调用ASR(语音转文本)服务将用户表述的语音转化为字符串文本,提供给其他模块进行意图识别。
意图识别算法模块,该模块一般内部包含多种独立的意图识别算法的实现,包括本专利中所描述的基于规则模版或者基于文本分类的意图识别算法的实现。意图识别算法模块根据服务接口的定义,以用户表述的字符串文本和调用的意图识别算法类型为输入,在模块内部进行语义解析、规则匹配、关键词匹配和文本分类计算等过程执行,输出用户表述文本可能属于的意图。根据不同的意图识别算法的实现,输出的意图可能是一个意图,也有可能是多个意图,同时输出的意图识别的详细信息也可能不一致。比如基于规则匹配意图识别除了输出匹配识别的意图外,也会输出匹配命中的具体规则;基于文本编辑距离的意图识别方法,会额外输出识别出的意图及其对应的表示编辑距离的数值。
意图识别策略引擎模块,该模块是意图识别策略的执行模块,也是意图识别算法的调用方。模块输入为用户预定义的意图识别策略配置,该配置一般以JSON或者XML序列化的方式进行组织。模块根据意图识别的策略配置调用制定的意图识别算法并与自学习模块进行数据的获取和提交,用于最终意图的选择和自学习数据的更新。以下是意图识别策略的配置示例。
意图场景特征自学习模块,该模块对于意图识别策略引擎模块上报的意图识别历史数据进行自学习,并在意图识别阶段提供基于上下文场景的历史数据指标参数,用于决策最终选择的意图。
图2是意图识别过程中各模块协同工作交互示意图。
为了更清晰的阐述本发明实施过程中所涉及的各个模块在意图识别和自学习的各步骤中承担的功能范围,下文将以特定场景为例详细阐述具备自学习能力的意图识别方法。
1.智能语音对话***或者终端的用户表述获取模块接收到“请帮我购买两张票”的用户表述语音,并将其识别为对应的文本。
2.意图识别策略引擎模块根据预设的策略,首先从意图识别算法模块中调用基于规则模版的意图识别方法进行初步的意图识别,获取到候选的意图分别为“购买电影票”和“购买火车票”。
3.意图识别策略引擎模块使用会话的上下文场景对应的唯一标志符从意图场景特征自学习模块中获取该场景下两个候选意图的分布权重数值。
4.意图识别策略引擎模块从意图识别算法模块中调用文本分类的意图识别算法,获取两个候选意图的预测得分,如“购买电影票”和“购买火车票”得分分别为0.9分和0.85分。
5.意图识别策略引擎模块对于预测得分和意图场景特征自学习模块所提供的意图分布权重进行加权计算,并根据最终的分值输出最终意图为“购买电影票”。
意图识别策略引擎模块将本次意图识别的结果和相关计算数据提交至意图场景特征自学习模块,意图场景特征自学习模块进行自学习计算并更新该场景下相关意图的指标数据。
以上所述实施例,仅为本申请的具体实施方式,用以说明本申请的技术方案,而非对其限制,本申请的保护范围并不局限于此,尽管参照前述实施例对本申请进行了详细的说明,本领域的普通技术人员应当理解:任何熟悉本技术领域的技术人员在本申请揭露的技术范围内,其依然可以对前述实施例所记载的技术方案进行修改或可轻易想到变化,或者对其中部分技术特征进行等同替换;而这些修改、变化或者替换,并不使相应技术方案的本质脱离本申请实施例技术方案的精神和范围。都应涵盖在本申请的保护范围之内。因此,本申请的保护范围应以所述权利要求的保护范围为准。
本技术领域技术人员可以理解的是,除非另外定义,这里使用的所有术语(包括技术术语和科学术语)具有与本发明所属领域中的普通技术人员的一般理解相同的意义。还应该理解的是,诸如通用字典中定义的那些术语应该被理解为具有与现有技术的上下文中的意义一致的意义,并且除非像这里一样定义,不会用理想化或过于正式的含义来解释。
以上实施例仅为说明本发明的技术思想,不能以此限定本发明的保护范围,凡是按照本发明提出的技术思想,在技术方案基础上所做的任何改动,均落入本发明保护范围之内。上面对本发明的实施方式作了详细说明,但是本发明并不限于上述实施方式,在本领域普通技术人员所具备的知识范围内,还可以在不脱离本发明宗旨的前提下做出各种变化。

Claims (7)

1.用于智能语音对话***的具备自学习能力的意图识别方法,其特征在于:具体包含如下步骤;
步骤1,获取用户表述,并通过语音识别技术将其识别为对应的文本;
步骤2,根据预设的策略中的配置对用户表述进行初步的意图识别,输出候选意图;
步骤3,根据当前的意图识别的上下文场景,以候选意图作为查询条件向意图场景特征自学习***发起查询,获取候选意图的历史数据特征参数;
步骤4,根据预设的意图选择规则策略,决策是否直接输出最终识别意图,或者使用意图选择规则策略中配置的其他意图识别算法对候选意图进行进一步的识别,并根据各意图的特征参数进行规则计算,输出最终的识别意图;
步骤5,将意图识别过程中的候选意图和最终识别意图的预测数据提交至自学习***,进行自学习和指标参数的数据更新。
2.根据权利要求1所述的用于智能语音对话***的具备自学习能力的意图识别方法,其特征在于:在步骤1中,获取用户表述,是指通过智能对话***或者终端获得用户表述的音频。
3.根据权利要求1所述的用于智能语音对话***的具备自学习能力的意图识别方法,其特征在于:在步骤2中,候选意图具体为:对步骤1中所输出的用户表述的文本进行初步的意图识别,可通过规则模版、计算成本较低的文本分类算法模型、语义槽值提取算法模型对用户的表述进行快速的分析,输出高相似度的候选意图分类。
4.根据权利要求1所述的用于智能语音对话***的具备自学习能力的意图识别方法,其特征在于:在步骤3中,获取候选意图的历史数据特征参数的步骤,是指根据用户表述的对话上下文语境获取该语境下意图识别的历史记录的特征,提取上一步骤中输出的候选意图分类的特征参数,如该场景下所有意图识别历史数据中命中某一意图的比例、所有意图识别历史数据中某一意图分类下的各个语料的所占比例。
5.根据权利要求1所述的用于智能语音对话***的具备自学习能力的意图识别方法,其特征在于:在步骤4中,预设的意图选择规则策略行步骤,是指根据预设的策略,决策是否需要对候选意图使用成本较高的意图识别技术进行预测,输出所有候选意图的准确性预测得分;并根据上一步骤中获取的所有候选意图的场景特征参数进行规则计算,输出最终的识别意图。
6.根据权利要求1所述的用于智能语音对话***的具备自学习能力的意图识别方法,其特征在于:在步骤5中,自学习***,是指将上述步骤中所预测的候选意图和最终识别意图及其相关的场景特征参数提交至自学习数据分析***,用于实时或者定期的数据分析和回归测试,更新意图识别的场景特征相关数据。
7.一种基于权利要求1至5任一项所述的用于智能语音对话***的具备自学习能力的意图识别方法的意图识别***,其特征在于:包含
用户表述获取模块,用于将用户表述的语音转化为字符串文本,提供给其他模块进行意图识别;
意图识别算法模块,用于根据服务接口的定义,以用户表述的字符串文本和调用的意图识别算法类型为输入,在模块内部进行语义解析、规则匹配、关键词匹配和文本分类计算过程执行,输出用户表述文本可能属于的意图;
意图识别策略引擎模块,用于为用户预定义的意图识别策略配置,根据意图识别的策略配置调用制定的意图识别算法并与自学习模块进行数据的获取和提交,用于最终意图的选择和自学习数据的更新;
意图场景特征自学习模块,用于对于意图识别策略引擎模块上报的意图识别历史数据进行自学习,并在意图识别阶段提供基于上下文场景的历史数据指标参数,用于决策最终选择的意图。
CN202010758935.1A 2020-07-31 2020-07-31 一种具备自学习能力的意图识别方法及意图识别*** Active CN111933127B (zh)

Priority Applications (3)

Application Number Priority Date Filing Date Title
CN202010758935.1A CN111933127B (zh) 2020-07-31 2020-07-31 一种具备自学习能力的意图识别方法及意图识别***
PCT/CN2021/115933 WO2022022746A1 (zh) 2020-07-31 2021-09-01 一种具备自学习能力的意图识别方法及意图识别***
US17/818,686 US20220383854A1 (en) 2020-07-31 2022-08-09 Intent recognition method and intent recognition system having self learning capability

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202010758935.1A CN111933127B (zh) 2020-07-31 2020-07-31 一种具备自学习能力的意图识别方法及意图识别***

Publications (2)

Publication Number Publication Date
CN111933127A true CN111933127A (zh) 2020-11-13
CN111933127B CN111933127B (zh) 2024-06-25

Family

ID=73315043

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202010758935.1A Active CN111933127B (zh) 2020-07-31 2020-07-31 一种具备自学习能力的意图识别方法及意图识别***

Country Status (3)

Country Link
US (1) US20220383854A1 (zh)
CN (1) CN111933127B (zh)
WO (1) WO2022022746A1 (zh)

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112559719A (zh) * 2020-12-23 2021-03-26 中移(杭州)信息技术有限公司 意图识别方法、装置、电子设备和存储介质
CN112684711A (zh) * 2020-12-24 2021-04-20 青岛理工大学 一种人体行为与意图的交互识别方法
CN113205817A (zh) * 2021-07-06 2021-08-03 明品云(北京)数据科技有限公司 语音语义识别方法、***、设备及介质
US20220028373A1 (en) * 2020-07-24 2022-01-27 Comcast Cable Communications, Llc Systems and methods for training voice query models
WO2022022746A1 (zh) * 2020-07-31 2022-02-03 升智信息科技(南京)有限公司 一种具备自学习能力的意图识别方法及意图识别***
CN114254622A (zh) * 2021-12-10 2022-03-29 马上消费金融股份有限公司 一种意图识别方法和装置

Families Citing this family (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN116186585B (zh) * 2023-02-28 2023-10-31 省广营销集团有限公司 基于大数据分析的用户行为意图挖掘方法及装置
CN116483981A (zh) * 2023-06-16 2023-07-25 北京好心情互联网医院有限公司 对话生成方法、装置、设备及存储介质
CN116485450B (zh) * 2023-06-21 2023-08-29 江苏网进科技股份有限公司 一种需求自动识别的方法
CN117540447B (zh) * 2023-11-17 2024-04-16 上海烜翊科技有限公司 一种基于业务分析场景的组件化建模方法及***
CN118193854A (zh) * 2024-05-16 2024-06-14 浪潮软件股份有限公司 一种基于人工智能交互的数据集成任务构建装置

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103942198A (zh) * 2013-01-18 2014-07-23 佳能株式会社 用于挖掘意图的方法和设备
US20150254561A1 (en) * 2013-03-06 2015-09-10 Rohit Singal Method and system of continuous contextual user engagement
CN105068661A (zh) * 2015-09-07 2015-11-18 百度在线网络技术(北京)有限公司 基于人工智能的人机交互方法和***
CN106446524A (zh) * 2016-08-31 2017-02-22 北京智能管家科技有限公司 智能硬件多模态级联建模方法及装置
CN110704641A (zh) * 2019-10-11 2020-01-17 零犀(北京)科技有限公司 一种万级意图分类方法、装置、存储介质及电子设备
CN110837548A (zh) * 2019-11-05 2020-02-25 泰康保险集团股份有限公司 答案匹配方法、装置、电子设备及存储介质

Family Cites Families (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104756100B (zh) * 2012-11-30 2017-07-28 三菱电机株式会社 意图估计装置以及意图估计方法
DE112014006542B4 (de) * 2014-03-31 2024-02-08 Mitsubishi Electric Corporation Einrichtung und Verfahren zum Verständnis von einer Benutzerintention
JP6328260B2 (ja) * 2015-01-28 2018-05-23 三菱電機株式会社 意図推定装置及び意図推定方法
US10818288B2 (en) * 2018-03-26 2020-10-27 Apple Inc. Natural assistant interaction
US11348573B2 (en) * 2019-03-18 2022-05-31 Apple Inc. Multimodality in digital assistant systems
CN111933127B (zh) * 2020-07-31 2024-06-25 升智信息科技(南京)有限公司 一种具备自学习能力的意图识别方法及意图识别***

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103942198A (zh) * 2013-01-18 2014-07-23 佳能株式会社 用于挖掘意图的方法和设备
US20150254561A1 (en) * 2013-03-06 2015-09-10 Rohit Singal Method and system of continuous contextual user engagement
CN105068661A (zh) * 2015-09-07 2015-11-18 百度在线网络技术(北京)有限公司 基于人工智能的人机交互方法和***
CN106446524A (zh) * 2016-08-31 2017-02-22 北京智能管家科技有限公司 智能硬件多模态级联建模方法及装置
CN110704641A (zh) * 2019-10-11 2020-01-17 零犀(北京)科技有限公司 一种万级意图分类方法、装置、存储介质及电子设备
CN110837548A (zh) * 2019-11-05 2020-02-25 泰康保险集团股份有限公司 答案匹配方法、装置、电子设备及存储介质

Cited By (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20220028373A1 (en) * 2020-07-24 2022-01-27 Comcast Cable Communications, Llc Systems and methods for training voice query models
WO2022022746A1 (zh) * 2020-07-31 2022-02-03 升智信息科技(南京)有限公司 一种具备自学习能力的意图识别方法及意图识别***
CN112559719A (zh) * 2020-12-23 2021-03-26 中移(杭州)信息技术有限公司 意图识别方法、装置、电子设备和存储介质
CN112684711A (zh) * 2020-12-24 2021-04-20 青岛理工大学 一种人体行为与意图的交互识别方法
CN112684711B (zh) * 2020-12-24 2022-10-11 青岛理工大学 一种人体行为与意图的交互识别方法
CN113205817A (zh) * 2021-07-06 2021-08-03 明品云(北京)数据科技有限公司 语音语义识别方法、***、设备及介质
CN114254622A (zh) * 2021-12-10 2022-03-29 马上消费金融股份有限公司 一种意图识别方法和装置

Also Published As

Publication number Publication date
CN111933127B (zh) 2024-06-25
US20220383854A1 (en) 2022-12-01
WO2022022746A1 (zh) 2022-02-03

Similar Documents

Publication Publication Date Title
CN111933127B (zh) 一种具备自学习能力的意图识别方法及意图识别***
CN108597541B (zh) 一种增强愤怒与开心识别的语音情感识别方法及***
WO2020206957A1 (zh) 一种应用于智能客服机器人的意图识别方法及装置
CN111625641A (zh) 一种基于多维度语义交互表征模型的对话意图识别方法及***
CN110990543A (zh) 智能对话的生成方法、装置、计算机设备及计算机存储介质
CN112269868B (zh) 一种基于多任务联合训练的机器阅读理解模型的使用方法
CN108710704B (zh) 对话状态的确定方法、装置、电子设备及存储介质
CN110197279B (zh) 变换模型训练方法、装置、设备和存储介质
CN111984780A (zh) 多意图识别模型训练方法和多意图识别方法及相关装置
CN112487139A (zh) 基于文本的自动出题方法、装置及计算机设备
CN115599901B (zh) 基于语义提示的机器问答方法、装置、设备及存储介质
CN111161726B (zh) 一种智能语音交互方法、设备、介质及***
CN114911932A (zh) 基于主题语义增强的异构图结构多会话者情感分析方法
CN115545041B (zh) 一种增强医疗语句语义向量表示的模型构造方法及***
Cao et al. Speaker-independent speech emotion recognition based on random forest feature selection algorithm
CN116303966A (zh) 基于提示学习的对话行为识别***
CN111046674B (zh) 语义理解方法、装置、电子设备和存储介质
CN116757195A (zh) 一种基于提示学习的隐性情感识别方法
CN112015921B (zh) 一种基于学习辅助知识图谱的自然语言处理方法
CN112885338B (zh) 语音识别方法、设备、计算机可读存储介质及程序产品
KR20230116143A (ko) 상담 유형 분류 시스템
CN114239565A (zh) 一种基于深度学习的情绪原因识别方法及***
CN113609839A (zh) 一种文本处理方法、模型及存储介质
CN112908296A (zh) 一种方言识别方法
CN111753053A (zh) 一种基于预训练模型的阅读理解改进方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant