CN116705026B - 一种人工智能交互方法及*** - Google Patents

一种人工智能交互方法及*** Download PDF

Info

Publication number
CN116705026B
CN116705026B CN202310964247.4A CN202310964247A CN116705026B CN 116705026 B CN116705026 B CN 116705026B CN 202310964247 A CN202310964247 A CN 202310964247A CN 116705026 B CN116705026 B CN 116705026B
Authority
CN
China
Prior art keywords
service
action
man
optimization
character set
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202310964247.4A
Other languages
English (en)
Other versions
CN116705026A (zh
Inventor
王士信
胡飞菊
杨俊丹
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Jiangxi University of Technology
Original Assignee
Jiangxi University of Technology
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Jiangxi University of Technology filed Critical Jiangxi University of Technology
Priority to CN202310964247.4A priority Critical patent/CN116705026B/zh
Publication of CN116705026A publication Critical patent/CN116705026A/zh
Application granted granted Critical
Publication of CN116705026B publication Critical patent/CN116705026B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/22Procedures used during a speech recognition process, e.g. man-machine dialogue
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/26Speech to text systems
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/22Procedures used during a speech recognition process, e.g. man-machine dialogue
    • G10L2015/223Execution procedure of a spoken command
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02PCLIMATE CHANGE MITIGATION TECHNOLOGIES IN THE PRODUCTION OR PROCESSING OF GOODS
    • Y02P90/00Enabling technologies with a potential contribution to greenhouse gas [GHG] emissions mitigation
    • Y02P90/02Total factory control, e.g. smart factories, flexible manufacturing systems [FMS] or integrated manufacturing systems [IMS]

Landscapes

  • Engineering & Computer Science (AREA)
  • Computational Linguistics (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Telephonic Communication Services (AREA)

Abstract

本发明属于人工智能领域,涉及数据分析技术,用于解决现有的人工智能交互***在一次识别失败后无法获取针对性的二次语音指令的问题,具体是一种人工智能交互方法及***,包括人机交互平台,所述人机交互平台通信连接有指令分析模块、处理分析模块、优化分析模块、控制器以及存储模块;所述指令分析模块用于对人机交互平台的语音指令进行分析:在人机交互平台接收到语音指令后通过语音识别引擎将语音指令转化为字符组并标记为指令字符集;本发明可以对人机交互平台的语音指令进行分析,通过对语音指令进行拆解之后将指令字符集与动作字符集、服务字符集进行比对,通过拆解识别的方式提高识别通过率。

Description

一种人工智能交互方法及***
技术领域
本发明属于人工智能领域,涉及数据分析技术,具体是一种人工智能交互方法及***。
背景技术
工业人工智能是指人工智能在工业上的应用,与作为前沿研究学科的通用人工智能不同,工业人工智能是构建计算机化***执行需要人类智能的任务的前沿研究学科。
现有的工业人工智能交互***无法对人类发出的语音指令进行分解分析,从而导致语音指令的识别成功率低下,在一次识别失败后无法获取针对性的二次语音指令,导致人机交互功能不够完善,用户体验较差。
针对上述技术问题,本申请提出一种解决方案。
发明内容
本发明的目的在于提供一种人工智能交互方法及***,用于解决现有的现有的人工智能交互***在一次识别失败后无法获取针对性的二次语音指令的问题;
本发明需要解决的技术问题为:如何提供一种可以在一次识别失败后获取针对性的二次语音指令的人工智能交互方法及人工智能交互***。
本发明的目的可以通过以下技术方案实现:
一种人工智能交互***,包括人机交互平台,所述人机交互平台通信连接有指令分析模块、处理分析模块、优化分析模块、控制器以及存储模块;
所述指令分析模块用于对人机交互平台的语音指令进行分析:在人机交互平台接收到语音指令后通过语音识别引擎将语音指令转化为字符组并标记为指令字符集,通过存储模块获取到动作字符集与服务字符集,将指令字符集与动作字符集、服务字符集进行比对;
所述处理分析模块用于对指令分析结果进行处理分析:处理分析模块接收到动作字符与服务字符时,由动作字符与服务字符生成识别指令并将识别指令发送至人机交互平台;处理分析模块接收到动作字符与服务重新识别信号时进行服务重新识别分析;处理分析模块接收到服务字符与动作重新识别信号时进行动作重新识别分析;处理分析模块接收到动作重新识别信号与服务重新识别信号时生成重复问询语音并将重复问询语音发送至人机交互平台,人机交互平台接收到重复问询语音后控制语音播放器播放重新问询语音并重新获取语音指令;人机交互平台接收到识别指令后将识别指令发送至控制器,控制器接收到识别指令后通过识别指令进行自动化控制;
所述优化分析模块用于对人机交互平台的人机交互效率进行优化分析。
作为本发明的一种优选实施方式,将指令字符集与动作字符集、服务字符集进行比对的具体过程包括:若指令字符集与动作字符集存在共有的字符元素,则将共有的字符元素标记为动作字符,将动作字符发送至人机交互平台,人机交互平台接收到动作字符后将动作字符发送至处理分析模块;若指令字符集与动作字符集不存在共有的字符元素,则判定动作识别失败,生成动作重新识别信号并将动作重新识别信号发送至人机交互平台,人机交互平台接收到动作重新识别信号后将动作重新识别信号发送至处理分析模块;若指令字符集与服务字符集存在共有的字符元素,则将共有的字符元素标记为服务字符,将服务字符发送至人机交互平台,人机交互平台接收到服务字符后将服务字符发送至处理分析模块;若指令字符集与服务字符集不存在共有的字符元素,则判定服务识别失败,生成服务重新识别信号并将服务重新识别信号发送至人机交互平台,人机交互平台接收到服务重新识别信号后将服务重新识别信号发送至处理分析模块。
作为本发明的一种优选实施方式,服务重新识别分析的具体过程包括:根据动作字符生成服务问询语音,将服务问询语音发送至人机交互平台,人机交互平台接收到服务问询语音后控制语音播放器播放服务问询语音并再次接收语音指令,通过语音识别引擎将语音指令转化为字符组并标记为二次字符集,将二次字符集与服务字符集进行比对:若二次字符集与服务字符集存在共有的字符元素,则将共有的字符元素标记为服务字符,由动作字符与服务字符生成识别指令并将识别指令发送至人机交互平台;若二次字符集与服务字符集不存在共有的字符元素,则判定服务识别失败,生成服务识别失败信号并将服务识别失败信号通过人机交互平台发送至优化分析模块。
作为本发明的一种优选实施方式,动作重新识别分析的具体过程包括:根据服务字符生成动作问询语音,将动作问询语音发送至人机交互平台,人机交互平台接收到动作问询语音后控制语音播放器播放动作问询语音并再次接收语音指令,通过语音识别引擎将语音指令转化为字符组并标记为二次字符集,将二次字符集与动作字符集进行比对:若二次字符集与动作字符集存在共有的字符元素,则将共有的字符元素标记为动作字符,由动作字符与服务字符组成识别指令并将识别指令发送至人机交互平台;若二次字符集与动作字符集不存在共有的字符元素,则判定动作识别失败,生成动作识别失败信号并将动作识别失败信号通过人机交互平台发送至优化分析模块。
作为本发明的一种优选实施方式,优化分析模块对人机交互平台的人机交互效率进行优化分析的具体过程包括:生成优化周期,获取处理分析模块在优化周期内生成的动作问询语音、服务问询语音以及重复问询语音的次数并分别标记为动作值DZ、服务值FW以及重复值CF,通过对动作值DZ、服务值FW以及重复值CF进行数值计算得到优化周期的优化系数YH;通过存储模块获取到优化阈值YHmax,将优化周期的优化系数YH与优化阈值YHmax进行比较:若优化系数YH小于优化阈值YHmax,则判定优化周期不具有识别优化必要性;若优化系数YH大于等于优化阈值YHmax,则对优化周期进行识别优化分析。
作为本发明的一种优选实施方式,对优化周期进行识别优化分析的具体过程包括:将优化分析模块在优化周期内接收到动作识别失败信号与服务识别失败信号的次数分别标记为动作失败值DS与服务失败值FS,通过对动作失败值DS、服务失败值FS以及优化系数YH进行数值计算得到优化周期的决策系数JC;通过存储模块获取到决策阈值JCmax,将优化周期的决策系数JC与决策阈值JCmax进行比较并通过比较结果对优化决策进行判定。
作为本发明的一种优选实施方式,将优化周期的决策系数JC与决策阈值JCmax进行比较并通过比较结果对优化决策进行判定的具体过程包括:若决策系数JC小于决策阈值JCmax,则生成引擎优化信号并将引擎优化信号发送至人机交互平台,人机交互平台接收到引擎优化信号后将引擎优化信号发送至管理人员的手机终端;若决策系数JC大于等于决策阈值JCmax,则生成词库丰富信号并将词库丰富信号发送至人机交互平台,人机交互平台接收到词库丰富信号后将词库丰富信号发送至管理人员的手机终端。
一种人工智能交互方法,包括以下步骤:
步骤一:对人机交互平台的语音指令进行分析:在人机交互平台接收到语音指令后通过语音识别引擎将语音指令转化为字符组并标记为指令字符集,通过存储模块获取到动作字符集与服务字符集,将指令字符集与动作字符集、服务字符集进行比对,通过比对结果生成动作字符、服务字符、动作重新识别信号或服务重新识别信号并发送至处理分析模块;
步骤二:对指令分析结果进行处理分析并生成识别指令,将识别指令发送至人机交互平台,人机交互平台接收到识别指令后将识别指令发送至控制器,控制器接收到识别指令后通过识别指令进行自动化控制;
步骤三:对人机交互平台的人机交互效率进行优化分析:生成优化周期,获取处理分析模块在优化周期内生成的动作问询语音、服务问询语音以及重复问询语音的次数并分别标记为动作值DZ、服务值FW以及重复值CF,对动作值DZ、服务值FW以及重复值CF进行数值计算得到优化周期的优化系数YH,通过优化系数YH对优化周期是否具有识别优化必要性进行判定。
本发明具备下述有益效果:
1、通过指令分析模块可以对人机交互平台的语音指令进行分析,通过对语音指令进行拆解之后将指令字符集与动作字符集、服务字符集进行比对,然后根据比对结果生成对应的识别信号,通过拆解识别的方式提高识别通过率,并在一次识别不通过时生成人性化的提示语音来提高二次识别成功率;
2、通过处理分析模块可以对指令分析结果进行处理分析,通过接收到的不同的信号与字符生成对应的问询语音,以人与人的对话逻辑对人机交互中的语音识别进行优化,提高二次识别成功率的同时改善用体验;
3、通过优化分析模块可以对人机交互平台的人机交互效率进行优化分析,通过对问询语音的生成次数进行分析与数值计算得到优化系数,通过优化系数的数值对识别优化必要性进行判定,在需要进行识别优化时进行优化决策分析,实现人机交互的针对性优化。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1为本发明实施例一的方法流程图;
图2为本发明实施例二的***框图。
具体实施方式
下面将结合实施例对本发明的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其它实施例,都属于本发明保护的范围。
实施例一
如图1所示,一种人工智能交互方法,包括以下步骤:
步骤一:对人机交互平台的语音指令进行分析:在人机交互平台接收到语音指令后通过语音识别引擎将语音指令转化为字符组并标记为指令字符集,通过存储模块获取到动作字符集与服务字符集,将指令字符集与动作字符集、服务字符集进行比对,通过比对结果生成动作字符、服务字符、动作重新识别信号或服务重新识别信号并发送至处理分析模块;
步骤二:对指令分析结果进行处理分析并生成识别指令,将识别指令发送至人机交互平台,人机交互平台接收到识别指令后将识别指令发送至控制器,控制器接收到识别指令后通过识别指令进行自动化控制;
步骤三:对人机交互平台的人机交互效率进行优化分析:生成优化周期,获取处理分析模块在优化周期内生成的动作问询语音、服务问询语音以及重复问询语音的次数并分别标记为动作值DZ、服务值FW以及重复值CF,对动作值DZ、服务值FW以及重复值CF进行数值计算得到优化周期的优化系数YH,通过优化系数YH对优化周期是否具有识别优化必要性进行判定。
实施例二
如图2所示,一种人工智能交互***,包括人机交互平台,人机交互平台通信连接有指令分析模块、处理分析模块、优化分析模块、控制器以及存储模块。
指令分析模块用于对人机交互平台的语音指令进行分析:在人机交互平台接收到语音指令后通过语音识别引擎将语音指令转化为字符组并标记为指令字符集,通过存储模块获取到动作字符集与服务字符集,动作字符集的元素包括打开、关闭、开启、切断、连接、调取等,服务字符集的元素包括设备编号、线路编号、电源编号等,将指令字符集与动作字符集、服务字符集进行比对:若指令字符集与动作字符集存在共有的字符元素,则将共有的字符元素标记为动作字符,将动作字符发送至人机交互平台,人机交互平台接收到动作字符后将动作字符发送至处理分析模块;若指令字符集与动作字符集不存在共有的字符元素,则判定动作识别失败,生成动作重新识别信号并将动作重新识别信号发送至人机交互平台,人机交互平台接收到动作重新识别信号后将动作重新识别信号发送至处理分析模块;若指令字符集与服务字符集存在共有的字符元素,则将共有的字符元素标记为服务字符,将服务字符发送至人机交互平台,人机交互平台接收到服务字符后将服务字符发送至处理分析模块;若指令字符集与服务字符集不存在共有的字符元素,则判定服务识别失败,生成服务重新识别信号并将服务重新识别信号发送至人机交互平台,人机交互平台接收到服务重新识别信号后将服务重新识别信号发送至处理分析模块;对人机交互平台的语音指令进行分析,通过对语音指令进行拆解之后将指令字符集与动作字符集、服务字符集进行比对,然后根据比对结果生成对应的识别信号,通过拆解识别的方式提高识别通过率,并在一次识别不通过时生成人性化的提示语音来提高二次识别成功率。
处理分析模块用于对指令分析结果进行处理分析:处理分析模块接收到动作字符与服务字符时,由动作字符与服务字符生成识别指令并将识别指令发送至人机交互平台;处理分析模块接收到动作字符与服务重新识别信号时,根据动作字符生成服务问询语音,示例性的,处理分析模块接收到动作字符-打开以及服务重新识别信号时,生成打开什么设备/电源的服务问询语音,将服务问询语音发送至人机交互平台,人机交互平台接收到服务问询语音后控制语音播放器播放服务问询语音并再次接收语音指令,通过语音识别引擎将语音指令转化为字符组并标记为二次字符集,将二次字符集与服务字符集进行比对:若二次字符集与服务字符集存在共有的字符元素,则将共有的字符元素标记为服务字符,由动作字符与服务字符生成识别指令并将识别指令发送至人机交互平台;若二次字符集与服务字符集不存在共有的字符元素,则判定服务识别失败,生成服务识别失败信号并将服务识别失败信号通过人机交互平台发送至优化分析模块;人机交互平台接收到服务字符与动作重新识别信号时,根据服务字符生成动作问询语音,将动作问询语音发送至人机交互平台,人机交互平台接收到动作问询语音后控制语音播放器播放动作问询语音并再次接收语音指令,通过语音识别引擎将语音指令转化为字符组并标记为二次字符集,将二次字符集与动作字符集进行比对:若二次字符集与动作字符集存在共有的字符元素,则将共有的字符元素标记为动作字符,由动作字符与服务字符组成识别指令并将识别指令发送至人机交互平台;若二次字符集与动作字符集不存在共有的字符元素,则判定动作识别失败,生成动作识别失败信号并将动作识别失败信号通过人机交互平台发送至优化分析模块;处理分析模块接收到动作重新识别信号与服务重新识别信号时生成重复问询语音并将重复问询语音发送至人机交互平台,人机交互平台接收到重复问询语音后控制语音播放器播放重新问询语音并重新获取语音指令;人机交互平台接收到识别指令后将识别指令发送至控制器,控制器接收到识别指令后通过识别指令进行自动化控制;对指令分析结果进行处理分析,通过接收到的不同的信号与字符生成对应的问询语音,以人与人的对话逻辑对人机交互中的语音识别进行优化,提高二次识别成功率的同时改善用体验。
优化分析模块用于对人机交互平台的人机交互效率进行优化分析:生成优化周期,获取处理分析模块在优化周期内生成的动作问询语音、服务问询语音以及重复问询语音的次数并分别标记为动作值DZ、服务值FW以及重复值CF,通过公式YH=α1*DZ+α2*FW+α3*CF得到优化周期的优化系数YH,其中α1、α2以及α3均为比例系数,且α3>α2>α1>1;通过存储模块获取到优化阈值YHmax,将优化周期的优化系数YH与优化阈值YHmax进行比较:若优化系数YH小于优化阈值YHmax,则判定优化周期不具有识别优化必要性;若优化系数YH大于等于优化阈值YHmax,则对优化周期进行识别优化分析:将优化分析模块在优化周期内接收到动作识别失败信号与服务识别失败信号的次数分别标记为动作失败值DS与服务失败值FS,通过公式JC=(β1*DS+β2*FS)/(β3*YH)得到优化周期的决策系数JC,其中β1、β2以及β3均为比例系数,且β1>β2>β3>1;通过存储模块获取到决策阈值JCmax,将优化周期的决策系数JC与决策阈值JCmax进行比较:若决策系数JC小于决策阈值JCmax,则生成引擎优化信号并将引擎优化信号发送至人机交互平台,人机交互平台接收到引擎优化信号后将引擎优化信号发送至管理人员的手机终端;若决策系数JC大于等于决策阈值JCmax,则生成词库丰富信号并将词库丰富信号发送至人机交互平台,人机交互平台接收到词库丰富信号后将词库丰富信号发送至管理人员的手机终端;对人机交互平台的人机交互效率进行优化分析,通过对问询语音的生成次数进行分析与数值计算得到优化系数,通过优化系数的数值对识别优化必要性进行判定,在需要进行识别优化时进行优化决策分析,实现人机交互的针对性优化。
一种人工智能交互***,工作时,在人机交互平台接收到语音指令后通过语音识别引擎将语音指令转化为字符组并标记为指令字符集,通过存储模块获取到动作字符集与服务字符集,将指令字符集与动作字符集、服务字符集进行比对;对指令分析结果进行处理分析并生成识别指令,将识别指令发送至人机交互平台,人机交互平台接收到识别指令后将识别指令发送至控制器,控制器接收到识别指令后通过识别指令进行自动化控制;生成优化周期,获取处理分析模块在优化周期内生成的动作问询语音、服务问询语音以及重复问询语音的次数并分别标记为动作值DZ、服务值FW以及重复值CF,对动作值DZ、服务值FW以及重复值CF进行数值计算得到优化周期的优化系数YH,通过优化系数YH对优化周期是否具有识别优化必要性进行判定。
以上内容仅仅是对本发明结构所作的举例和说明,所属本技术领域的技术人员对所描述的具体实施例做各种各样的修改或补充或采用类似的方式替代,只要不偏离发明的结构或者超越本权利要求书所定义的范围,均应属于本发明的保护范围。
上述公式均是采集大量数据进行软件模拟得出且选取与真实值接近的一个公式,公式中的系数是由本领域技术人员根据实际情况进行设置;如:公式YH=α1*DZ+α2*FW+α3*CF;由本领域技术人员采集多组样本数据并对每一组样本数据设定对应的优化系数;将设定的优化系数和采集的样本数据代入公式,任意三个公式构成三元一次方程组,将计算得到的系数进行筛选并取均值,得到α1、α2以及α3的取值分别为4.25、2.68和2.13;
系数的大小是为了将各个参数进行量化得到的一个具体的数值,便于后续比较,关于系数的大小,取决于样本数据的多少及本领域技术人员对每一组样本数据初步设定对应的优化系数;只要不影响参数与量化后数值的比例关系即可,如优化系数与动作值的数值成正比。
在本说明书的描述中,参考术语“一个实施例”、“示例”、“具体示例”等的描述意指结合该实施例或示例描述的具体特征、结构、材料或者特点包含于本发明的至少一个实施例或示例中。在本说明书中,对上述术语的示意性表述不一定指的是相同的实施例或示例。而且,描述的具体特征、结构、材料或者特点可以在任何的一个或多个实施例或示例中以合适的方式结合。
以上公开的本发明优选实施例只是用于帮助阐述本发明。优选实施例并没有详尽叙述所有的细节,也不限制该发明仅为的具体实施方式。显然,根据本说明书的内容,可作很多的修改和变化。本说明书选取并具体描述这些实施例,是为了更好地解释本发明的原理和实际应用,从而使所属技术领域技术人员能很好地理解和利用本发明。本发明仅受权利要求书及其全部范围和等效物的限制。

Claims (3)

1.一种人工智能交互***,其特征在于,包括人机交互平台,所述人机交互平台通信连接有指令分析模块、处理分析模块、优化分析模块、控制器以及存储模块;
所述指令分析模块用于对人机交互平台的语音指令进行分析:在人机交互平台接收到语音指令后通过语音识别引擎将语音指令转化为字符组并标记为指令字符集,通过存储模块获取到动作字符集与服务字符集,将指令字符集与动作字符集、服务字符集进行比对:若指令字符集与动作字符集存在共有的字符元素,则将共有的字符元素标记为动作字符,将动作字符通过人机交互平台发送至处理分析模块;若指令字符集与动作字符集不存在共有的字符元素,则判定动作识别失败,生成动作重新识别信号并将动作重新识别信号通过人机交互平台发送至处理分析模块;若指令字符集与服务字符集存在共有的字符元素,则将共有的字符元素标记为服务字符,将服务字符通过人机交互平台发送至处理分析模块;若指令字符集与服务字符集不存在共有的字符元素,则判定服务识别失败,生成服务重新识别信号并将服务重新识别信号通过人机交互平台发送至处理分析模块;
所述处理分析模块用于对指令分析结果进行处理分析:处理分析模块接收到动作字符与服务字符时,由动作字符与服务字符生成识别指令并将识别指令发送至人机交互平台;处理分析模块接收到动作字符与服务重新识别信号时进行服务重新识别分析;处理分析模块接收到服务字符与动作重新识别信号时进行动作重新识别分析;处理分析模块接收到动作重新识别信号与服务重新识别信号时生成重复问询语音并将重复问询语音发送至人机交互平台,人机交互平台接收到重复问询语音后控制语音播放器播放重新问询语音并重新获取语音指令;人机交互平台接收到识别指令后将识别指令发送至控制器,控制器接收到识别指令后通过识别指令进行自动化控制;
所述优化分析模块用于对人机交互平台的人机交互效率进行优化分析;
服务重新识别分析的具体过程包括:根据动作字符生成服务问询语音,将服务问询语音发送至人机交互平台,人机交互平台接收到服务问询语音后控制语音播放器播放服务问询语音并再次接收语音指令,通过语音识别引擎将语音指令转化为字符组并标记为二次字符集,将二次字符集与服务字符集进行比对:若二次字符集与服务字符集存在共有的字符元素,则将共有的字符元素标记为服务字符,由动作字符与服务字符生成识别指令并将识别指令发送至人机交互平台;若二次字符集与服务字符集不存在共有的字符元素,则判定服务识别失败,生成服务识别失败信号并将服务识别失败信号通过人机交互平台发送至优化分析模块;
动作重新识别分析的具体过程包括:根据服务字符生成动作问询语音,将动作问询语音发送至人机交互平台,人机交互平台接收到动作问询语音后控制语音播放器播放动作问询语音并再次接收语音指令,通过语音识别引擎将语音指令转化为字符组并标记为二次字符集,将二次字符集与动作字符集进行比对:若二次字符集与动作字符集存在共有的字符元素,则将共有的字符元素标记为动作字符,由动作字符与服务字符组成识别指令并将识别指令发送至人机交互平台;若二次字符集与动作字符集不存在共有的字符元素,则判定动作识别失败,生成动作识别失败信号并将动作识别失败信号通过人机交互平台发送至优化分析模块;
优化分析模块对人机交互平台的人机交互效率进行优化分析的具体过程包括:生成优化周期,获取处理分析模块在优化周期内生成的动作问询语音、服务问询语音以及重复问询语音的次数并分别标记为动作值DZ、服务值FW以及重复值CF,通过对动作值DZ、服务值FW以及重复值CF进行数值计算得到优化周期的优化系数YH;通过存储模块获取到优化阈值YHmax,将优化周期的优化系数YH与优化阈值YHmax进行比较:若优化系数YH小于优化阈值YHmax,则判定优化周期不具有识别优化必要性;若优化系数YH大于等于优化阈值YHmax,则对优化周期进行识别优化分析;
优化周期的优化系数YH的计算公式为:,其中/>以及/>均为比例系数,且/>
2.根据权利要求1所述的一种人工智能交互***,其特征在于,对优化周期进行识别优化分析的具体过程包括:将优化分析模块在优化周期内接收到动作识别失败信号与服务识别失败信号的次数分别标记为动作失败值DS与服务失败值FS,通过对动作失败值DS、服务失败值FS以及优化系数YH进行数值计算得到优化周期的决策系数JC;通过存储模块获取到决策阈值JCmax,将优化周期的决策系数JC与决策阈值JCmax进行比较并通过比较结果对优化决策进行判定;
优化周期的决策系数JC的计算公式为:,其中/>、/>以及/>均为比例系数,且/>
3.根据权利要求2所述的一种人工智能交互***,其特征在于,将优化周期的决策系数JC与决策阈值JCmax进行比较并通过比较结果对优化决策进行判定的具体过程包括:若决策系数JC小于决策阈值JCmax,则生成引擎优化信号并将引擎优化信号发送至人机交互平台,人机交互平台接收到引擎优化信号后将引擎优化信号发送至管理人员的手机终端;若决策系数JC大于等于决策阈值JCmax,则生成词库丰富信号并将词库丰富信号发送至人机交互平台,人机交互平台接收到词库丰富信号后将词库丰富信号发送至管理人员的手机终端。
CN202310964247.4A 2023-08-02 2023-08-02 一种人工智能交互方法及*** Active CN116705026B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202310964247.4A CN116705026B (zh) 2023-08-02 2023-08-02 一种人工智能交互方法及***

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202310964247.4A CN116705026B (zh) 2023-08-02 2023-08-02 一种人工智能交互方法及***

Publications (2)

Publication Number Publication Date
CN116705026A CN116705026A (zh) 2023-09-05
CN116705026B true CN116705026B (zh) 2023-10-13

Family

ID=87824268

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202310964247.4A Active CN116705026B (zh) 2023-08-02 2023-08-02 一种人工智能交互方法及***

Country Status (1)

Country Link
CN (1) CN116705026B (zh)

Citations (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104965426A (zh) * 2015-06-24 2015-10-07 百度在线网络技术(北京)有限公司 基于人工智能的智能机器人控制***、方法和装置
CN106782539A (zh) * 2017-01-16 2017-05-31 上海智臻智能网络科技股份有限公司 一种智能语音交互方法、装置及***
CN110047479A (zh) * 2019-04-18 2019-07-23 深圳市三宝创新智能有限公司 一种用于智能机器人的语音交互装置
CN110289000A (zh) * 2019-05-27 2019-09-27 北京蓦然认知科技有限公司 一种语音识别方法、装置
CN111179928A (zh) * 2019-12-30 2020-05-19 上海欣能信息科技发展有限公司 一种基于语音交互的变配电站智能控制方法
CN111341309A (zh) * 2020-02-18 2020-06-26 百度在线网络技术(北京)有限公司 一种语音交互方法、装置、设备和计算机存储介质
CN113327612A (zh) * 2021-05-27 2021-08-31 广州广电运通智能科技有限公司 基于智能点评的语音应答优化方法、***、设备及介质
CN113348502A (zh) * 2019-04-17 2021-09-03 深圳市欢太科技有限公司 语音识别方法、装置、存储介质及电子设备
CN115376504A (zh) * 2021-05-19 2022-11-22 北京小米移动软件有限公司 智能产品的语音交互方法、装置及可读存储介质
CN116415590A (zh) * 2021-12-31 2023-07-11 云米互联科技(广东)有限公司 基于多轮次问询的意图识别方法及装置

Family Cites Families (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US10019984B2 (en) * 2015-02-27 2018-07-10 Microsoft Technology Licensing, Llc Speech recognition error diagnosis
US10650811B2 (en) * 2018-03-13 2020-05-12 Microsoft Technology Licensing, Llc Correction of speech recognition on repetitive queries

Patent Citations (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104965426A (zh) * 2015-06-24 2015-10-07 百度在线网络技术(北京)有限公司 基于人工智能的智能机器人控制***、方法和装置
CN106782539A (zh) * 2017-01-16 2017-05-31 上海智臻智能网络科技股份有限公司 一种智能语音交互方法、装置及***
CN113348502A (zh) * 2019-04-17 2021-09-03 深圳市欢太科技有限公司 语音识别方法、装置、存储介质及电子设备
CN110047479A (zh) * 2019-04-18 2019-07-23 深圳市三宝创新智能有限公司 一种用于智能机器人的语音交互装置
CN110289000A (zh) * 2019-05-27 2019-09-27 北京蓦然认知科技有限公司 一种语音识别方法、装置
CN111179928A (zh) * 2019-12-30 2020-05-19 上海欣能信息科技发展有限公司 一种基于语音交互的变配电站智能控制方法
CN111341309A (zh) * 2020-02-18 2020-06-26 百度在线网络技术(北京)有限公司 一种语音交互方法、装置、设备和计算机存储介质
CN115376504A (zh) * 2021-05-19 2022-11-22 北京小米移动软件有限公司 智能产品的语音交互方法、装置及可读存储介质
CN113327612A (zh) * 2021-05-27 2021-08-31 广州广电运通智能科技有限公司 基于智能点评的语音应答优化方法、***、设备及介质
CN116415590A (zh) * 2021-12-31 2023-07-11 云米互联科技(广东)有限公司 基于多轮次问询的意图识别方法及装置

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
面向任务口语理解研究现状综述;侯丽仙;李艳玲;李成城;;计算机工程与应用(11);全文 *

Also Published As

Publication number Publication date
CN116705026A (zh) 2023-09-05

Similar Documents

Publication Publication Date Title
CN111933127B (zh) 一种具备自学习能力的意图识别方法及意图识别***
CN111522839B (zh) 一种基于深度学习的自然语言查询方法
CN112599124A (zh) 一种面向电网调度的语音调度方法及***
CN107346340A (zh) 一种用户意图识别方法及***
CN104751227B (zh) 用于语音识别的深度神经网络的构建方法及***
CN113314106A (zh) 基于语音和意图识别的电力信息查询与调控功能调用方法
CN112632288A (zh) 一种基于知识图谱的电力调度***及方法
CN109460459A (zh) 一种基于日志学习的对话***自动优化方法
CN111694940A (zh) 一种用户报告的生成方法及终端设备
CN113591978B (zh) 一种基于置信惩罚正则化的自我知识蒸馏的图像分类方法、设备及存储介质
CN108447475A (zh) 一种基于电力调度***的语音识别模型的建立方法
CN110415697A (zh) 一种基于深度学习的车载语音控制方法及其***
CN111179944B (zh) 语音唤醒及年龄检测方法、装置及计算机可读存储介质
CN117149977A (zh) 一种基于机器人流程自动化的智能催收机器人
CN115249479A (zh) 基于brnn的电网调度复杂语音识别方法、***及终端
CN116705026B (zh) 一种人工智能交互方法及***
CN117713377A (zh) 调度自动化主站智能语音联调***
CN116682414B (zh) 一种基于大数据的方言语音识别***
CN112863485A (zh) 口音语音识别方法、装置、设备及存储介质
CN112420053A (zh) 智能交互式人机对话***
CN112769619B (zh) 一种基于决策树的多分类网络故障预测方法
CN110656385B (zh) 一种基于神经网络的静电纺丝纤维平均直径预测方法
CN110266894A (zh) 一种自动忙音检测的通话方法及***
CN113297579B (zh) 基于时序神经通路的语音识别模型中毒检测方法及装置
CN111353305A (zh) 基于自然语言识别的规程自动化执行方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant