CN107015964A - 面向智能机器人开发的自定义意图实现方法及装置 - Google Patents

面向智能机器人开发的自定义意图实现方法及装置 Download PDF

Info

Publication number
CN107015964A
CN107015964A CN201710174481.1A CN201710174481A CN107015964A CN 107015964 A CN107015964 A CN 107015964A CN 201710174481 A CN201710174481 A CN 201710174481A CN 107015964 A CN107015964 A CN 107015964A
Authority
CN
China
Prior art keywords
text data
intention
word
similarity
rule example
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201710174481.1A
Other languages
English (en)
Other versions
CN107015964B (zh
Inventor
储兵兵
刘佳亮
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing Guangnian Wuxian Technology Co Ltd
Original Assignee
Beijing Guangnian Wuxian Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing Guangnian Wuxian Technology Co Ltd filed Critical Beijing Guangnian Wuxian Technology Co Ltd
Priority to CN201710174481.1A priority Critical patent/CN107015964B/zh
Publication of CN107015964A publication Critical patent/CN107015964A/zh
Application granted granted Critical
Publication of CN107015964B publication Critical patent/CN107015964B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • G06F40/279Recognition of textual entities
    • G06F40/289Phrasal analysis, e.g. finite state techniques or chunking
    • G06F40/295Named entity recognition
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/36Creation of semantic tools, e.g. ontology or thesauri
    • G06F16/367Ontology

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Computational Linguistics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • General Health & Medical Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • Artificial Intelligence (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Animal Behavior & Ethology (AREA)
  • Data Mining & Analysis (AREA)
  • Databases & Information Systems (AREA)
  • Machine Translation (AREA)

Abstract

本发明提供了一种面向智能机器人开发的自定义意图实现方法及装置,通过应用开发者输入的解析样例和需识别意图,并结合实体词库来生成需识别意图的匹配规则,基于该匹配规则可生成需识别意图文本数据的规则实例,进而通过匹配规则实例与待意图识别的文本数据的相似度进行意图识别,可以使智能机器人应用的开发者根据自己的需求进行意图识别的自定义,增加了智能机器人应用的开发灵活度,并且可以使应用的开发者通过简单的设定实现应用意图识别的设计,可以令更多的应用开发者加入到智能机器人的应用开发中,提高了智能机器人技术的发展速度,用户体验越来越好,通过规则实例与待意图识别的文本数据的相似度匹配,来实现意图识别,可以有效提高意图识别的准确率,进而令智能机器人的交互能力和智能性越来越强,能够满足更多人的需求。

Description

面向智能机器人开发的自定义意图实现方法及装置
技术领域
本发明涉及人机交互技术领域,具体地说,涉及一种面向智能机器人开发的自定义意图实现方法及装置。
背景技术
随着科学技术的不断发展,信息技术、计算机技术以及人工智能技术的引入,机器人的研究已经逐步走出工业领域,逐渐扩展到了医疗、保健、家庭、娱乐以及服务行业等领域。人们对于机器人的要求也从简单重复的机械动作提升为具有高度智能型、自主性及与其他智能体交互的智能机器人。
为了满足人们日益增长的需求,本领域技术人员需要不断提高智能机器人的交互能力和智能性,使智能机器人的用户体验越来越好。
发明内容
本发明提供了一种面向智能机器人的自定义意图识别的实现方法,包括:
获取用户输入的针对目标应用的意图识别解析样例及对应需识别意图;
对所述解析样例进行语义理解,根据实体词库识别所述解析样例中的实体词,获取所述实体词对应的实体名称,结合确定的实体名称,生成匹配参数,使用所述匹配参数替换所述解析样例中的实体词,生成规则句式;
获取待意图识别的文本数据,根据所述规则句式,解析所述文本数据生成对应的规则实例,结合所述规则实例与所述解析样例的相似度,判断所述文本数据是否匹配所述需识别意图;
当匹配成功时,执行所述需识别意图对应的控制指令。
根据本发明的一个实施例,所述根据所述规则句式,解析所述文本数据生成对应的规则实例包括:
提取所述待意图识别的文本数据中,与所述匹配参数对应的实体词;
使用所提取的实体词替换所述规则句式中的匹配参数,生成规则实例。
根据本发明的一个实施例,本发明提供的面向智能机器人的自定义意图识别的实现方法还包括:
获取用户输入的所述需识别意图对应的相似度阈值;当存在多个需匹配意图时,所述根据所述相似度,判断所述文本数据是否匹配所述需识别意图,包括:
确定与所述文本数据的相似度最高的规则实例;
判断其相似度是否超过该规则实例对应的相似度阈值,
当所述相似度超过所述相似度阈值时,判断所述文本数据与该规则实例对应的需识别意图匹配。
根据本发明的一个实施例,所述比较所述规则实例与所述文本数据的相似度,包括:
对所述规则实例及所述文本数据进行分词;
对分词结果进行无关词标注;
结合无关词标注结果,比较所述规则实例及所述文本数据的相似度。
根据本发明的一个实施例,结合词性、词频及词的前后关系,通过CRF对分词结果进行无关词标注。
本发明实施例还提供一种面向智能机器人的自定义意图识别的实现装置,包括:
获取模块,用于获取用户输入的针对目标应用的意图识别解析样例及对应需识别意图;
规则生成模块,用于对所述解析样例进行语义理解,根据实体词库识别所述解析样例中的实体词,获取所述实体词对应的实体名称,结合确定的实体名称,生成匹配参数,使用所述匹配参数替换所述解析样例中的实体词,生成规则句式;
意图识别模块,用于获取待意图识别的文本数据,根据所述规则句式,解析所述文本数据生成对应的规则实例,结合所述规则实例与所述解析样例的相似度,判断所述文本数据是否匹配所述需识别意图;
指令执行模块,用于当匹配成功时,执行所述需识别意图对应的控制指令。
根据本发明的一个实施例,所述规则生成模块根据所述规则句式,解析所述文本数据生成对应的规则实例包括:
提取所述待意图识别的文本数据中,与所述匹配参数对应的实体词;
使用所提取的实体词替换所述规则句式中的匹配参数,生成规则实例。
根据本发明的一个实施例,所述获取模块还用于:
获取用户输入的所述需识别意图对应的相似度阈值;
当存在多个需匹配意图时,所述意图识别模块根据所述相似度,判断所述文本数据是否匹配所述需识别意图,包括:
确定与所述文本数据的相似度最高的规则实例;
判断其相似度是否超过该规则实例对应的相似度阈值,
当所述相似度超过所述相似度阈值时,判断所述文本数据与该规则实例对应的需识别意图匹配。
根据本发明的一个实施例,所述意图识别模块比较所述规则实例与所述文本数据的相似度,包括:
对所述规则实例及所述文本数据进行分词;
对分词结果进行无关词标注;
结合无关词标注结果,比较所述规则实例及所述文本数据的相似度。
根据本发明的一个实施例,
结合词性、词频及词的前后关系,通过CRF对分词结果进行无关词标注。
本发明提供了一种面向智能机器人开发的自定义意图实现方法及装置,可以使智能机器人应用的开发者根据自己的需求进行意图识别的自定义,增加了智能机器人应用的开发灵活度,并且可以使应用的开发者通过简单的设定实现应用意图识别的设计,可以令更多的应用开发者加入到智能机器人的应用开发中,提高了智能机器人技术的发展速度,用户体验越来越好,通过规则实例与待意图识别的文本数据的相似度匹配,来实现意图识别,可以有效提高意图识别的准确率,进而令智能机器人的交互能力和智能性越来越强,能够满足更多人的需求。
本发明的其它特征和优点将在随后的说明书中阐述,并且,部分地从说明书中变得显而易见,或者通过实施本发明而了解。本发明的目的和其他优点可通过在说明书、权利要求书以及附图中所特别指出的结构来实现和获得。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要的附图做简单的介绍:
图1是本申请实施例提供的一种面向智能机器人的自定义意图识别的实现方法流程图;
图2是本申请实施例提供的一种意图识别方法流程图;
图3是本发明实施例提供的一种确定相似度方法流程图;
图4是本发明实施例提供的一种面向智能机器人的自定义意图识别的实现装置结构示意图;
图5是本发明实施例提供的另一种面向智能机器人的自定义意图识别的实现装置结构示意图。
具体实施方式
以下将结合附图及实施例来详细说明本发明的实施方式,借此对本发明如何应用技术手段来解决技术问题,并达成技术效果的实现过程能充分理解并据以实施。需要说明的是,只要不构成冲突,本发明中的各个实施例以及各实施例中的各个特征可以相互结合,所形成的技术方案均在本发明的保护范围之内。
同时,在以下说明中,出于解释的目的而阐述了许多具体细节,以提供对本发明实施例的彻底理解。然而,对本领域的技术人员来说显而易见的是,本发明可以不用这里的具体细节或者所描述的特定方式来实施。
另外,在附图的流程图示出的步骤可以在诸如一组计算机可执行指令的计算机***中执行,并且,虽然在流程图中示出了逻辑顺序,但是在某些情况下,可以以不同于此处的顺序执行所示出或描述的步骤。
目前,智能机器人技术在不断提高,越来越多的开发者加入了智能机器人应用开发的行列,然而,由于智能机器人的交互方式与传统的交互方式不同,与传统的手机和电脑等移动终端的触控式或者鼠标的操作方式相比,安装在智能机器人上的应用,由于智能机器人的智能性和类人性要求,需要主动响应用户的语音或者文字输入的意图,这就需要智能机器人有较强的意图识别能力。
由于开发者可能开发的应用多种多样,智能机器人很难对每个开发者开发的应用都进行准确度较高的意图识别,并且并不是所有的应用开发者都具有独立的开发整个机器人的能力,能够针对其应用单独开发可意图识别的机器人,因此,如何实现让机器人能够对各应用开发者设定的意图都能理解,满足应用开发者可通过简单、快捷的方式进行机器人应用开发,即可满足其应用的意图识别自定义需求,缩短开发周期,是本领域技术人员亟需解决的问题。
为了解决这个问题,本发明提供了一种面向智能机器人的自定义意图识别的实现方法,通过本发明,智能机器人应用的开发者可以设定针对其应用的意图识别规则,从而使智能机器人的意图识别能力满足其应用的需求。
本申请提供的方法和装置意图服务于智能机器人应用的开发者,因此,本文中所述用户为智能机器人应用的开发者。本申请中的智能机器人可以是智能硬件、实体机器人以及微信公众号和移动应用等第三方平台,本申请中智能机器人中的应用,可以是安装在实体机器人中的可从应用商店下载的客户端软件APP,也可以是用于微信公知号,网络平台,或移动应用上,实现家居场景,或者客服场景上某一具有交互功能的应用模块,或者其他任何基于人工智能技术,通过意图识别以实现与人的交互的应用或功能。本申请提供的方法的执行主体可以是用于智能机器人应用开发的平台或者***。
如图1所示,本发明实施例提供的一种面向智能机器人的自定义意图识别的实现方法,包括:
S101、获取用户输入的针对目标应用的意图识别解析样例及对应需识别意图;
S102、对所述解析样例进行语义理解,根据实体词库识别所述解析样例中的实体词,获取所述实体词对应的实体名称,结合确定的实体名称,生成匹配参数,使用所述匹配参数替换所述解析样例中的实体词,生成规则句式;
S103、获取待意图识别的文本数据,根据所述规则句式,解析所述文本数据生成对应的规则实例,结合所述规则实例与所述解析样例的相似度,判断所述文本数据是否匹配所述需识别意图;
S104、当匹配成功时,执行所述需识别意图对应的控制指令。
(1)以天气查询应用为例,用户输入的意图识别解析样例可以是“北京今天天气怎么样”,对应的需识别意图可以是“查天气”;
(2)接收到这样的解析样例(“北京今天天气怎么样”)之后,本发明提供的自定义意图识别方法,可以通过语义理解并结合实体词库对解析样例进行解析,例如,“北京今天天气怎么样”,其中的实体词包括“北京”,“今天”,进一步,确定各实体词对应的实体名称,例如,“北京”的实体名称可以为“城市”,“今天”的实体名称可以为“时间”。
(3)获取了解析样例中各实体的实体名称后,可以跟据该实体名称,生成匹配参数,如实体名称为“城市”,生成的对应匹配参数可以为“city”,实体名称为“时间”,匹配参数可以为“time”,匹配参数的生成规则不进行具体限定,匹配参数可以用来替换解析样例中的实体名称对应的实体词,来生成规则句式,例如“北京今天天气怎么样”,生成的规则句式,可以是“<city><time>天气怎么样”。
需要说明的是,所述匹配参数与实体名称相关联,而一个实体名称可能对应多个匹配参数,例如,应用开发者要开发查列车班次这一应用,输入的解析样例可以为“北京到上海的列车班次”,解析并提取到“北京”的实体名称“城市”,对应的匹配参数可以为“fromcity”,“上海”的实体名称为“城市”,对应的匹配参数可以为“to city”,其中“from city”与实体名称“城市”相关联,“to city”也与实体名称“城市”相关联。生成匹配参数时,可以仅根据实体名称生成匹配参数,例如将匹配参数生成为“city1”和“city2”,也可以结合“北京到上海的列车班次”这一解析样例的解析结果,将匹配参数生成为“from city”和“tocity”。
综上所述,对于匹配参数的形式,生成规则,本申请不进行限定,本领域技术人员可以根据需求进行匹配参数的设定,只要能满足生成规则句式的需要即可。
进一步,本申请实施例提供的意图识别方法,可以通过相似度计算实现,在接收到待意图识别的文本数据时,提取意图识别文本数据中的,与匹配参数对应的实体词,再使用提取的实体词替换规则句式中的匹配参数,生成该文本数据对应的规则实例。
其中,待意图识别的文本数据,可以是应用开发者输入的测试文本,也可以是安装该应用的机器人通过语音识别获取到的文本数据,当然,也可以是获取到的其他需要进行意图识别的文本数据,本申请不进行限定。
意图识别的过程中,假如输入的待意图识别的文本数据为“上海明天天气好么”,那么获取到文本数据中的与匹配参数对应的实体词可以为“上海”和“明天”,那么生成的规则实例可以是“上海明天天气怎么样”,再对规则实例“上海明天天气怎么样”和待意图识别的文本数据“上海明天天气好么”,进行相似度比对。
当存在多个需匹配意图时,可以通过比较该文本数据,与各需匹配意图对应的规则实例的相似度,来确定与该文本数据最贴近的意图,即:查天气。
例如,当查天气意图,和查列车班次意图并存时,查天气意图的规则句式为“<city><time>天气怎么样”,而查列车班次的规则句式为“从<from city>到<to city>的列车班次”,那么当获取到的待意图识别文本数据为“北京今天天气好不好”,此时查天气意图对应的规则实例为“北京今天天气怎么样”,而查列车班次意图对应的规则实例为“从北京到<tocity>的列车班次”,进而可以计算两个意图对应的规则实例,与待意图识别文本数据之间的相似度。
相似度的比较结果是,查天气意图对应的规则实例,与该待意图识别文本数据之间的相似度较高,则进一步判断相似度是否超过了该规则实例对应的相似度阈值,该相似度阈值,可以为用户自定义的相似度阈值,则本发明实施例提供的面向智能机器人的自定义意图识别的实现方法,还包括:获取用户输入的所述需识别意图对应的相似度阈值,其中,由于需识别意图与规则实例相对应,因此,该解析样例对应的相似度阈值,即为该需识别意图对应的相似度阈值。
如图2所示,根据所述相似度,判断所述文本数据是否匹配所述需识别意图,包括:
S201、确定与所述文本数据的相似度最高的规则实例;
S202、判断其相似度是否超过该规则实例对应的相似度阈值;
S203、当所述相似度超过所述相似度阈值时,判断所述文本数据与该规则实例对应的需识别意图匹配。
实际应用中,本领域技术人员可以采用多种方式比较规则实例与文本数据的相似度,较佳的,如图3所示,本申请提供的一种比较规则实例与文本数据相似度的方法包括:
S301、对所述规则实例及所述文本数据进行分词;
S302、对分词结果进行无关词标注;
S303、结合无关词标注结果,比较所述规则实例及所述文本数据的相似度。
实际应用中,获取到的解析样例,和待意图识别的文本数据中,可能存在大量的无关词,例如如果输入的文本数据为“麻烦你告诉我一下北京人口数”,而查天气意图对应的规则句式为“麻烦你告诉我一下<city>天气”,查人口数的规则句式为“<city>人口是多少”,如果直接根据分词结果获得的集合进行相似度比对,则得出的结果为文本数据与查天气的意图匹配,进而输出查天气的结果。
为了解决这一问题,本申请首先对分词结果中的无关词进行标注,将文本数据和规则句式中的“麻烦/你/告诉/我/一下”标注为无关词,进而能够基于核心词汇进行相似度比对,从而避免意图识别结果受太多无关音素的干扰,影响意图识别的准确度。
进一步,本申请中进一步采用条件随机场CRF对分词结果进行无关词标注。
根据本发明的一个实施例,所述通过CRF对分词结果进行无关词标注,包括:
结合词性、词频及词的前后关系,通过CRF对分词结果进行无关词标注。
由于本发明的方法描述的是在计算机***中实现的。该计算机***例如可以设置在机器人的控制核心处理器中。例如,本文所述的方法可以实现为能以控制逻辑来执行的软件,其由机器人控制***中的CPU来执行。本文所述的功能可以实现为存储在非暂时性有形计算机可读介质中的程序指令集合。当以这种方式实现时,该计算机程序包括一组指令,当该组指令由计算机运行时其促使计算机执行能实施上述功能的方法。可编程逻辑可以暂时或永久地安装在非暂时性有形计算机可读介质中,例如只读存储器芯片、计算机存储器、磁盘或其他存储介质。除了以软件来实现之外,本文所述的逻辑可利用分立部件、集成电路、与可编程逻辑设备(诸如,现场可编程门阵列(FPGA)或微处理器)结合使用的可编程逻辑,或者包括它们任意组合的任何其他设备来体现。所有此类实施例旨在落入本发明的范围之内。
本申请提供的面向智能机器人的自定义意图识别的实现方法,可以用于应用开发平台,应用开发服务器,或者可用于机器人应用开发的机器人本身,可以通过应用开发网站,应用开发器的形式,为智能机器人的应用开发者提供服务。
本发明实施例还提供一种自定义面向智能机器人的意图识别的实现装置,该实现装置的具体实施例可参考本发明实施中的自定义面向智能机器人的意图识别的实现方法的实施例,在此不做重复限定,本发明实施例提供的自定义面向智能机器人的意图识别的实现装置可以装载在网络服务器,以平台的形式服务于应用开发者,也可以存在于可进行应用开发的机器人上,可以实现智能硬件、实体机器人以及微信公众号和移动应用等第三方平台上的自定义意图识别的实现,如图4所示,该实现装置的结构包括:
获取模块401,用于获取用户输入的针对目标应用的意图识别解析样例及对应需识别意图;
规则生成模块402,用于对所述解析样例进行语义理解,根据实体词库识别所述解析样例中的实体词,获取所述实体词对应的实体名称,结合确定的实体名称,生成匹配参数,使用所述匹配参数替换所述解析样例中的实体词,生成规则句式;
意图识别模块403,用于获取待意图识别的文本数据,根据所述规则句式,解析所述文本数据生成对应的规则实例,结合所述规则实例与所述解析样例的相似度,判断所述文本数据是否匹配所述需识别意图;
指令执行模块404,用于当匹配成功时,执行所述需识别意图对应的控制指令。
所述规则生成模块根据所述规则句式,解析所述文本数据生成对应的规则实例包括:
提取所述待意图识别的文本数据中,与所述匹配参数对应的实体词;
使用所提取的实体词替换所述规则句式中的匹配参数,生成规则实例。
进一步,所述获取模块还用于:
获取用户输入的所述需识别意图对应的相似度阈值;
当存在多个需匹配意图时,所述意图识别模块根据所述相似度,判断所述文本数据是否匹配所述需识别意图,包括:
确定与所述文本数据的相似度最高的规则实例;
判断其相似度是否超过该规则实例对应的相似度阈值,
当所述相似度超过所述相似度阈值时,判断所述文本数据与该规则实例对应的需识别意图匹配。
所述意图识别模块比较所述规则实例与所述文本数据的相似度,包括:
对所述规则实例及所述文本数据进行分词;
对分词结果进行无关词标注;
结合无关词标注结果,比较所述规则实例及所述文本数据的相似度。
进一步,意图识别模块可以通过条件随机场CRF对分词结果进行无关词标注。
较佳的,意图识别模块可以结合词性、词频及词的前后关系,通过CRF对分词结果进行无关词标注。
如图5所示,本申请还提供一种面向智能机器人的自定义意图识别的实现装置,包括存储器501和一个或多个处理器502,其中,存储器501存储一个或多个计算机可读程序代码,所述一个或多个处理器502用于执行一个或多个计算机可读程序代码以实现:
获取用户输入的针对目标应用的意图识别解析样例及对应需识别意图;
对所述解析样例进行语义理解,根据实体词库识别所述解析样例中的实体词,获取所述实体词对应的实体名称,结合确定的实体名称,生成匹配参数,使用所述匹配参数替换所述解析样例中的实体词,生成规则句式;
获取待意图识别的文本数据,根据所述规则句式,解析所述文本数据生成对应的规则实例,结合所述规则实例与所述解析样例的相似度,判断所述文本数据是否匹配所述需识别意图;
当匹配成功时,执行所述需识别意图对应的控制指令。
根据本发明的一个实施例,所述根据所述规则句式,解析所述文本数据生成对应的规则实例包括:
提取所述待意图识别的文本数据中,与所述匹配参数对应的实体词;
使用所提取的实体词替换所述规则句式中的匹配参数,生成规则实例。
根据本发明的一个实施例,所述一个或多个处理器502还用于执行一个或多个计算机可读程序代码以实现:
获取用户输入的所述需识别意图对应的相似度阈值;当存在多个需匹配意图时,所述根据所述相似度,判断所述文本数据是否匹配所述需识别意图,包括:
确定与所述文本数据的相似度最高的规则实例;
判断其相似度是否超过该规则实例对应的相似度阈值,
当所述相似度超过所述相似度阈值时,判断所述文本数据与该规则实例对应的需识别意图匹配。
根据本发明的一个实施例,所述比较所述规则实例与所述文本数据的相似度,包括:
对所述规则实例及所述文本数据进行分词;
对分词结果进行无关词标注;
结合无关词标注结果,比较所述规则实例及所述文本数据的相似度。
根据本发明的一个实施例,通过条件随机场CRF对分词结果进行无关词标注。
根据本发明的一个实施例,所述通过CRF对分词结果进行无关词标注,包括:
结合词性、词频及词的前后关系,通过CRF对分词结果进行无关词标注。
应该理解的是,本发明所公开的实施例不限于这里所公开的特定结构、处理步骤或材料,而应当延伸到相关领域的普通技术人员所理解的这些特征的等同替代。还应当理解的是,在此使用的术语仅用于描述特定实施例的目的,而并不意味着限制。
说明书中提到的“一个实施例”或“实施例”意指结合实施例描述的特定特征、结构或特性包括在本发明的至少一个实施例中。因此,说明书通篇各个地方出现的短语“一个实施例”或“实施例”并不一定均指同一个实施例。
虽然上述示例用于说明本发明在一个或多个应用中的原理,但对于本领域的技术人员来说,在不背离本发明的原理和思想的情况下,明显可以在形式上、用法及实施的细节上作各种修改而不用付出创造性劳动。因此,本发明由所附的权利要求书来限定。

Claims (10)

1.一种面向智能机器人的自定义意图识别的实现方法,其特征在于,包括:
获取用户输入的针对目标应用的意图识别解析样例及对应需识别意图;
对所述解析样例进行语义理解,根据实体词库识别所述解析样例中的实体词,获取所述实体词对应的实体名称;
结合确定的实体名称,生成匹配参数,使用所述匹配参数替换所述解析样例中的实体词,生成规则句式;
获取待意图识别的文本数据,根据所述规则句式,解析所述文本数据生成对应的规则实例;
结合所述规则实例与所述待意图识别的文本数据的相似度,判断所述文本数据是否匹配所述需识别意图;
当匹配成功时,执行所述需识别意图对应的控制指令。
2.如权利要求1所述的实现方法,其特征在于,所述根据所述规则句式,解析所述文本数据生成对应的规则实例包括:
提取所述待意图识别的文本数据中,与所述匹配参数对应的实体词;
使用所提取的实体词替换所述规则句式中的匹配参数,生成规则实例。
3.如权利要求1所述的实现方法,其特征在于,还包括:
获取用户输入的所述需识别意图对应的相似度阈值;
当存在多个需匹配意图时,所述结合所述规则实例与所述待意图识别的文本数据的相似度,判断所述文本数据是否匹配所述需识别意图,包括:
确定与所述文本数据的相似度最高的规则实例;
判断其相似度是否超过该规则实例对应的相似度阈值,
当所述相似度超过所述相似度阈值时,判断所述文本数据与该规则实例对应的需识别意图匹配。
4.如权利要求1所述的实现方法,其特征在于,所述比较所述规则实例与所述文本数据的相似度,包括:
对所述规则实例及所述文本数据进行分词;
对分词结果进行无关词标注;
结合无关词标注结果,比较所述规则实例及所述文本数据的相似度。
5.如权利要求4所述的实现方法,其特征在于,包括:
结合词性、词频及词的前后关系,通过CRF对分词结果进行无关词标注。
6.一种面向智能机器人的自定义意图识别的实现装置,其特征在于,包括:
获取模块,用于获取用户输入的针对目标应用的意图识别解析样例及对应需识别意图;
规则生成模块,用于对所述解析样例进行语义理解,根据实体词库识别所述解析样例中的实体词,获取所述实体词对应的实体名称,结合确定的实体名称,生成匹配参数,使用所述匹配参数替换所述解析样例中的实体词,生成规则句式;
意图识别模块,用于获取待意图识别的文本数据,根据所述规则句式,解析所述文本数据生成对应的规则实例,结合所述规则实例与所述待意图识别的文本数据的相似度,判断所述文本数据是否匹配所述需识别意图;
指令执行模块,用于当匹配成功时,执行所述需识别意图对应的控制指令。
7.如权利要求6所述的实现装置,其特征在于,所述规则生成模块根据所述规则句式,解析所述文本数据生成对应的规则实例包括:
提取所述待意图识别的文本数据中,与所述匹配参数对应的实体词;
使用所提取的实体词替换所述规则句式中的匹配参数,生成规则实例。
8.如权利要求6所述的实现装置,其特征在于,所述获取模块还用于:
获取用户输入的所述需识别意图对应的相似度阈值;
当存在多个需匹配意图时,所述意图识别模块结合所述规则实例与所述待意图识别的文本数据的相似度,判断所述文本数据是否匹配所述需识别意图,包括:
确定与所述文本数据的相似度最高的规则实例;
判断其相似度是否超过该规则实例对应的相似度阈值,
当所述相似度超过所述相似度阈值时,判断所述文本数据与该规则实例对应的需识别意图匹配。
9.如权利要求8所述的实现装置,其特征在于,所述意图识别模块比较所述规则实例与所述文本数据的相似度,包括:
对所述规则实例及所述文本数据进行分词;
对分词结果进行无关词标注;
结合无关词标注结果,比较所述规则实例及所述文本数据的相似度。
10.如权利要求9所述的实现装置,其特征在于,包括:
结合词性、词频及词的前后关系,通过CRF对分词结果进行无关词标注。
CN201710174481.1A 2017-03-22 2017-03-22 面向智能机器人开发的自定义意图实现方法及装置 Active CN107015964B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201710174481.1A CN107015964B (zh) 2017-03-22 2017-03-22 面向智能机器人开发的自定义意图实现方法及装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201710174481.1A CN107015964B (zh) 2017-03-22 2017-03-22 面向智能机器人开发的自定义意图实现方法及装置

Publications (2)

Publication Number Publication Date
CN107015964A true CN107015964A (zh) 2017-08-04
CN107015964B CN107015964B (zh) 2021-10-19

Family

ID=59439981

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201710174481.1A Active CN107015964B (zh) 2017-03-22 2017-03-22 面向智能机器人开发的自定义意图实现方法及装置

Country Status (1)

Country Link
CN (1) CN107015964B (zh)

Cited By (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107967308A (zh) * 2017-11-16 2018-04-27 百度在线网络技术(北京)有限公司 一种智能交互的处理方法、装置、设备和计算机存储介质
CN109145100A (zh) * 2018-08-24 2019-01-04 深圳追科技有限公司 一种可定制化流程的任务型客服机器人***及其工作方法
CN109558479A (zh) * 2018-11-29 2019-04-02 北京羽扇智信息科技有限公司 一种规则匹配方法、装置、设备及存储介质
CN110083685A (zh) * 2019-04-26 2019-08-02 北京零秒科技有限公司 用于意图识别的数据配置方法及装置
CN110309400A (zh) * 2018-02-07 2019-10-08 鼎复数据科技(北京)有限公司 一种智能理解用户查询意图的方法及***
CN112259094A (zh) * 2020-10-20 2021-01-22 江苏峰鑫网络科技有限公司 一种语音客服机器人***
CN114970535A (zh) * 2022-05-31 2022-08-30 深圳集智数字科技有限公司 意图识别方法、***、装置及存储介质
US11848016B2 (en) 2018-08-07 2023-12-19 Huawei Technologies Co., Ltd. Voice control command generation method and terminal
CN114970535B (zh) * 2022-05-31 2024-07-16 深圳须弥云图空间科技有限公司 意图识别方法、***、装置及存储介质

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20110082688A1 (en) * 2009-10-01 2011-04-07 Samsung Electronics Co., Ltd. Apparatus and Method for Analyzing Intention
US8688690B2 (en) * 2010-04-15 2014-04-01 Palo Alto Research Center Incorporated Method for calculating semantic similarities between messages and conversations based on enhanced entity extraction
CN104469029A (zh) * 2014-11-21 2015-03-25 科大讯飞股份有限公司 通过语音进行查号的方法及装置
CN105094315A (zh) * 2015-06-25 2015-11-25 百度在线网络技术(北京)有限公司 基于人工智能的人机智能聊天的方法和装置
CN105701254A (zh) * 2016-03-09 2016-06-22 北京搜狗科技发展有限公司 一种信息处理方法和装置、一种用于信息处理的装置

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20110082688A1 (en) * 2009-10-01 2011-04-07 Samsung Electronics Co., Ltd. Apparatus and Method for Analyzing Intention
US8688690B2 (en) * 2010-04-15 2014-04-01 Palo Alto Research Center Incorporated Method for calculating semantic similarities between messages and conversations based on enhanced entity extraction
CN104469029A (zh) * 2014-11-21 2015-03-25 科大讯飞股份有限公司 通过语音进行查号的方法及装置
CN105094315A (zh) * 2015-06-25 2015-11-25 百度在线网络技术(北京)有限公司 基于人工智能的人机智能聊天的方法和装置
CN105701254A (zh) * 2016-03-09 2016-06-22 北京搜狗科技发展有限公司 一种信息处理方法和装置、一种用于信息处理的装置

Cited By (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107967308A (zh) * 2017-11-16 2018-04-27 百度在线网络技术(北京)有限公司 一种智能交互的处理方法、装置、设备和计算机存储介质
US11308948B2 (en) 2017-11-16 2022-04-19 Baidu Online Network Technology (Beijing) Co., Ltd. Intelligent interaction processing method and apparatus, device and computer storage medium
CN110309400A (zh) * 2018-02-07 2019-10-08 鼎复数据科技(北京)有限公司 一种智能理解用户查询意图的方法及***
US11848016B2 (en) 2018-08-07 2023-12-19 Huawei Technologies Co., Ltd. Voice control command generation method and terminal
CN109145100A (zh) * 2018-08-24 2019-01-04 深圳追科技有限公司 一种可定制化流程的任务型客服机器人***及其工作方法
CN109558479A (zh) * 2018-11-29 2019-04-02 北京羽扇智信息科技有限公司 一种规则匹配方法、装置、设备及存储介质
CN110083685A (zh) * 2019-04-26 2019-08-02 北京零秒科技有限公司 用于意图识别的数据配置方法及装置
CN112259094A (zh) * 2020-10-20 2021-01-22 江苏峰鑫网络科技有限公司 一种语音客服机器人***
CN114970535A (zh) * 2022-05-31 2022-08-30 深圳集智数字科技有限公司 意图识别方法、***、装置及存储介质
CN114970535B (zh) * 2022-05-31 2024-07-16 深圳须弥云图空间科技有限公司 意图识别方法、***、装置及存储介质

Also Published As

Publication number Publication date
CN107015964B (zh) 2021-10-19

Similar Documents

Publication Publication Date Title
CN107015964A (zh) 面向智能机器人开发的自定义意图实现方法及装置
Li et al. Contrast and generation make bart a good dialogue emotion recognizer
CN107015962A (zh) 面向智能机器人的自定义意图识别的实现方法及装置
JP7495467B2 (ja) タンパク質表現モデルの事前トレーニング、タンパク質相互作用の予測方法および装置
CN107577662A (zh) 面向中文文本的语义理解***及方法
CN108255805A (zh) 舆情分析方法及装置、存储介质、电子设备
CN111310476B (zh) 一种使用基于方面的情感分析方法的舆情监控方法和***
CN111460820A (zh) 一种基于预训练模型bert的网络空间安全领域命名实体识别方法和装置
CN111428025B (zh) 文本摘要方法、装置、电子设备和存储介质
CN108257593B (zh) 一种语音识别方法、装置、电子设备及存储介质
CN112784589B (zh) 一种训练样本的生成方法、装置及电子设备
CN113536795B (zh) 实体关系抽取的方法、***、电子装置和存储介质
CN113836268A (zh) 文档理解方法及装置、电子设备和介质
CN112528654A (zh) 自然语言处理方法、装置及电子设备
CN109977401A (zh) 一种基于神经网络的语义识别方法
CN109299470A (zh) 文本公告中触发词的抽取方法及***
CN110334340B (zh) 基于规则融合的语义分析方法、装置以及可读存储介质
CN115640520A (zh) 跨语言跨模态模型的预训练方法、设备和存储介质
CN110019305A (zh) 知识库扩展方法及存储介质、终端
CN111241843B (zh) 基于复合神经网络的语义关系推断***和方法
Bharathi et al. Machine Learning Based Approach for Sentiment Analysis on Multilingual Code Mixing Text.
CN107688594B (zh) 基于社交信息的风险事件的识别***及方法
CN112765330A (zh) 文本数据处理方法、装置、电子设备和存储介质
Zhou et al. Virtual data augmentation: A robust and general framework for fine-tuning pre-trained models
CN109934347A (zh) 扩展问答知识库的装置

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant