CN114144773B - 基于人-机认知交互中的行为调整对话流 - Google Patents

基于人-机认知交互中的行为调整对话流 Download PDF

Info

Publication number
CN114144773B
CN114144773B CN202080052710.2A CN202080052710A CN114144773B CN 114144773 B CN114144773 B CN 114144773B CN 202080052710 A CN202080052710 A CN 202080052710A CN 114144773 B CN114144773 B CN 114144773B
Authority
CN
China
Prior art keywords
cognitive
human
interaction
machine
responses
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202080052710.2A
Other languages
English (en)
Other versions
CN114144773A (zh
Inventor
I·佩雷茨冈萨雷茨
F·佩德拉佐里
A·德尔加多桑切斯
A·P·加西亚古埃雷罗
M·J·阿尔瓦雷茨费尔南德茨
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
International Business Machines Corp
Original Assignee
International Business Machines Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by International Business Machines Corp filed Critical International Business Machines Corp
Publication of CN114144773A publication Critical patent/CN114144773A/zh
Application granted granted Critical
Publication of CN114144773B publication Critical patent/CN114144773B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/30Semantic analysis
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • G06F40/279Recognition of textual entities
    • G06F40/289Phrasal analysis, e.g. finite state techniques or chunking
    • G06F40/295Named entity recognition
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N5/00Computing arrangements using knowledge-based models
    • G06N5/04Inference or reasoning models
    • G06N5/041Abduction
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N5/00Computing arrangements using knowledge-based models
    • G06N5/04Inference or reasoning models
    • G06N5/046Forward inferencing; Production systems
    • G06N5/047Pattern matching networks; Rete networks
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/22Procedures used during a speech recognition process, e.g. man-machine dialogue
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/30Semantic analysis
    • G06F40/35Discourse or dialogue representation

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Computational Linguistics (AREA)
  • Physics & Mathematics (AREA)
  • Artificial Intelligence (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Health & Medical Sciences (AREA)
  • General Health & Medical Sciences (AREA)
  • Software Systems (AREA)
  • Mathematical Physics (AREA)
  • Computing Systems (AREA)
  • Evolutionary Computation (AREA)
  • Data Mining & Analysis (AREA)
  • Human Computer Interaction (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Information Transfer Between Computers (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

提供了一种用于基于在认知交互服务的网关处执行的人‑机认知交互中的用户行为调整对话流的方法和***。所述方法包括:接收对话流期间的一系列人‑机认知交互;确定人类认知交互的行为模式满足定义的行为模式;确定多个机器响应满足对定义的行为模式的响应的最大重复的定义的阈值;以及向认知交互服务指示按照定义的行为模式的定义的动作来调整后续响应的类型。

Description

基于人-机认知交互中的行为调整对话流
背景技术
本发明涉及人-机认知交互,更具体地涉及基于对话流中的行为来调整对话流。
已知各种不同的认知交互引擎,其中向以自然语言提出问题的人类用户提供问答服务。该服务寻求理解问题并且返回对问题的精确回答。
一个示例是国际商业机器公司的IBM Watson Assistant(IBM和IBM Watson是国际商业机器公司的注册商标)。IBM Watson***将问题解析成不同的关键字和句子片段,以便找到统计相关的短语。IBM Watson Assistant服务是将对话接口构建到任何应用、设备或通道中的产品。
认知交互引擎允许构建能够理解用户在维持对话的同时提供的不同消息的意图和实体的***。
认知交互引擎遵循对话流中在设计阶段期间定义的规则。
识别对话的主要话题和子话题以改进交互、生成适合所涵盖的话题的交互内容的方法是已知的。
另一种已知的方法提供了一种通过创建与可能存在的不同变体相匹配的字块来改进与虚拟助理的通信的方式,以改善对自然语言的理解。
发明内容
根据本发明的一方面,提供了一种用于基于在认知交互服务的网关处执行的人-机认知交互中的用户行为调整对话流的计算机实现的方法,包括:接收对话流期间的一系列人-机认知交互;确定人类认知交互的行为模式满足定义的行为模式;确定多个机器响应满足对定义的行为模式的响应的最大重复的定义的阈值;以及向认知交互服务指示按照定义的行为模式的定义的动作来调整后续响应的类型。
根据本发明的另一方面,提供了一种用于用于基于人-机认知交互中的用户行为调整对话流的***,所述***是认知交互服务的网关并且包括处理器和存储器,所述存储器被配置为向处理器提供计算机程序指令以执行以下组件的功能:对话流接收组件,用于接收对话流期间的一系列人-机认知交互;行为模式确定组件,用于确定人类认知交互的行为模式满足定义的行为模式;机器响应确定组件,用于确定多个机器响应满足对定义的行为模式的响应的最大重复的定义的阈值;以及指令组件,用于认知交互服务指示按照定义的行为模式的定义的动作来调整后续响应的类型。
根据本发明的另一方面,提供了一种基于人-机认知交互中的用户行为调整对话流的计算机程序产品,所述计算机程序产品包括具有随其包含的程序指令的计算机可读存储介质,所述程序指令可由处理器执行以使处理器:接收对话流期间的一系列人-机认知交互;确定人类认知交互的行为模式满足定义的行为模式;确定多个机器响应满足对定义的行为模式的响应的最大重复的定义的阈值;以及向认知交互服务指示按照定义的行为模式的定义的动作来调整后续响应的类型。
附图说明
在说明书的结论部分特别指出并明确要求保护被视为本发明的主题。当结合附图阅读时,通过参考以下详细描述,可以最好地理解本发明(关于操作的组织和方法)及其目标、特征和优点。
现在将参考以下附图仅通过实例的方式来描述本发明的优选实施例,在附图中:
图1是其中可以实现根据本发明的方法的***的示例性实施例的示意图;
图2是根据本发明的方法的示例性实施例的流程图;
图3是根据本发明的***的示例性实施例的框图;
图4是其中可以实现本发明的计算机***或云服务器的实施例的框图;
图5是其中可以实现本发明的云计算环境的示意图;和
图6是其中可以实现本发明的云计算环境的抽象模型层的图。
应当理解,为了说明的简单和清晰,图中所示的元件不一定按比例绘制。例如,为了清楚起见,一些元件的尺寸可能相对于其他元件被放大。进一步,在认为适当的情况下,附图中附图标记可以重复以指示对应或类似的特征。
具体实施方式
本发明涉及人-机认知交互领域,具体对应于在人类用户与机器之间的包括意图和实体的声音对话。给定交互的意图和实体允许创建对话流,以便为用户提供有用的信息。
所描述的方法和***监控人类用户与机器之间的对话流,并监控包括人类用户的行为的交互。人类用户的行为被定义为用户在对话期间与认知机器交互的方式。当用户的交互遵守预定义的模式时,这被识别为特定行为。也在对话流中监控机器对用户行为的响应,并相应地调整后续的响应。
所描述的方法和***具有定义用于规制对话流的行为原则的能力。不是依靠***中定义的一组固定的规则来进行对话流,而是按照用户可能具有的不同行为基于“行为原则”进行对话。
参见图1,框图示出了其中可以实现所描述的方法和***的***100的示例性实施例。
提供应用的前端102,其负责接收人类用户的请求111并且将其作为应用编程接口(API)调用发送到编制引擎103。前端102还向用户返回来自编制引擎103的机器响应112,并且根据通信通道调制它。用户请求111和机器响应112建立对话流120。
前端102的例子是聊天机器人。可以使用认知交互服务130在异步事件驱动JavaScript(JavaScript是甲骨文公司的商标)运行时环境中创建示例聊天机器人,认知交互服务130跨移动设备、消息收发平台等构建、测试和部署机器人或虚拟代理。
编制引擎103是一部分基础设施,负责从前端102接收从通道提取的作为API调用的用户请求111。编制引擎103协调对不同服务API的调用,并将机器响应112返回到前端102的通道。
编制引擎103可以向前端102和认知交互服务130之间的通信添加一个定制层。编制引擎103可以充当认知交互服务130的代理,拦截消息请求和响应并通过使用第三方API来修改它们。
编制引擎103可以将对话的历史存储在储存库104中。
可以提供负责管理人类用户与机器之间的对话的认知交互服务130。认知交互服务的一些示例包括:国际商业机器公司的IBM Watson、微软公司的LanguageUnderstanding Intelligent Service(LUIS)、或谷歌公司的Dialogflow。
在认知交互服务130中,可以通过使用附加服务来增强流。例如,IBM WatsonNatural Language Understanding(自然语言理解)服务可用于识别实体,并且IBM WatsonTone Analyzer(语气分析器)服务可用于检测客户情绪。对于常见问题(FAQ),调用IBMWatson Discovery服务可以用段落检索来从文档集合拉取答案。
IBM Watson Discovery服务是一种认知搜索和内容分析引擎,用于识别模式、趋势和可操作的见解的应用。IBM Watson自然语言理解服务利用自然语言理解来分析文本以从诸如概念、实体、关键词、类别、情感、情绪、关系、语义角色之类的内容中提取元数据。IBMWatson语气分析器服务使用语言学分析来检测书面文本中的交流语气。这些服务可以通过云服务提供。
所描述的***提供行为管理器***120,其检测用户的行为,并且在检测到先前定义的行为模式和定义数量的机器响应的情况下,向认知交互服务130指示它应当如何响应。行为管理器***120可以参考定义的用户行为模式121和对行为模式121的机器响应的重复的阈值122的储存库。认知交互服务130可以具有可以在行为管理器***120指示对行为模式的所需响应时执行的定义的动作131的储存库。
用户可以通过应用的前端102开始与认知交互服务130的交互。用户请求111的消息可以由编制引擎103转发到认知交互服务130,并可存储在对话历史104中。在到达认知交互服务130之前,消息通过所述的行为管理器***120。行为管理器***120确定用户的行为是否被识别具有任何先前定义的行为模式121;如果是,则负责向认知交互服务130指示如何对待它。
参见图2,流程图200示出了如由图1的行为管理器***120执行的所描述的方法的示例性实施例。
行为管理器***120可以接收201对话流期间的一系列人-机认知交互,并且可以监控202人类行为和机器响应。
可以确定203人类交互是否满足定义的用户行为模式。这可以通过应用标识定义的用户行为模式的规则来实现。如果没有模式匹配,则该方法可以继续接收201和监控202对话流。
如果某行为模式匹配,则该方法可以确定204多个机器响应是否满足所匹配的行为模式的最大重复的定义的阈值。如果不满足定义的阈值,则方法可以可选地向用户提供205针对行为的响应,然后该方法可以继续接收201和监控202对话流以确定行为是否继续。
如果满足定义阈值,则行为管理器***可以指示认知交互服务调整206对定义的动作的后续响应。
下表示出了一些示例定义的用户行为模式、响应阈值和示例动作。
Figure BDA0003481336380000041
第一列定义可能在用户对对话流的贡献中检测到的用户行为模式。第二列定义从机器交互接收的响应的最大重复次数。第三列定义如果满足行为模式允许的最大响应数量则指示要执行的动作。该动作可以包括,例如,跳转到节点(node)或题外话(digression)。
可针对对话流定义各种用户行为模式。上表示出了如下一些示例性定义的用户行为模式。用户行为模式可以由标识指示定义的用户行为模式的用户行为的各方面的规则来定义。
可以定义规则以识别被用户禁用的词。所定义的用户行为可以查找禁用词汇,并且该方法使得能够以特定方式处理这样的对话流。
可以定义规则,使得相同话题在单个交互中不被重复超过定义的次数。这可以通过用户交互中的重复的词或短语来识别。
可以定义规则,以识别客户何时在需要解释时给出短回答(例如,当需要解释时,“是”或“否”)或客户何时在需要简明回答时给出长回答。可以将响应长度用作响应是解释响应还是简明响应的度量。
可以定义规则来检测用户的语气。这可以使用语气检测工具来识别。
可以定义表中未示出的其他规则,包括自造词或无效句子的用户。
落入行为模式内的用户输入在每个实例中可能不是完全相同的输入,但是它们可能导致机器做出相同的响应。因此,所描述的方法对针对定义的用户行为模式的响应的数量进行计数,并确定响应的数量何时满足定义的阈值。当满足定义的阈值时,可以按照认知交互服务的要求来配置动作。在采取动作之前这提供了对用户行为的定义的数量的响应的缓冲。
该方法不需要重复完全相同的用户输入。通过重复的响应识别出落在同一规则的不同用户行为,并采取动作。
可以定义所采取的动作。在上表中,给出了以下示例。
该动作可以跳转到题外话。题外话是时间上的上下文改变。题外话允许用户脱离一个对话分支,临时改变话题,然后返回到原始对话流。
以下是题外话的示例:
用户:I would like a contract for a new credit card.(我想签一张新***合同。)
机器:Perfect,what is your name?(好的,你叫什么名字?)
用户:Alejandro.(亚历杭德罗。)
机器:And your address?(你的地址?)
用户:Madrid.(马德里。)
机器:Do you have any preferred color?(你有什么喜欢的颜色吗?)
用户:Green.(绿色。)
机器:And what limit do you choose?(你选择什么限额?)
用户:I lost my previous card(我以前的卡丢失了)==>>>>>这对双方来说都很重要,需要处理并将引发题外话。
机器:Perfect,as soon as we finish this,we will look into it(好的,等我们做完这件事,再看看)==>>>>>表示有兴趣。
机器:What is the required limit?(需要的限额是多少?)==>>>>>继续原始流
用户:300$(300美元)
机器:Perfect we will send your card.(很好。我们将发送你的卡。)
机器:Where do you think you lost your card,maybe someone is using it?(你觉得卡是在哪儿丢的,也许有人还在用)==>>>>>开始题外话。
在该示例中,digression_id="stolen_card"(被盗卡)且node_id="contract_intent"(合同意向)。
在工业化环境中,具有各自理解特定话题的不同聊天机器人是惯例。在所描述的方法和***中,引入行为原理的概念,其有助于定义聊天机器人应当如何响应才可跨不同话题的聊天机器人应用。
该方法的优点之一是所有对话都由相同的规则管理,而不管开发者是谁。这样,所有的对话都具有标准的行为结构。使对话遵循相同结构对于处理它们是有益的,记住可能有不同的人在同一项目上工作。在了解对话之后的结构方面,具有一系列共同规则简化了工作。
参见图3,所描述的***的示例性实施例以行为管理器***120的形式示出,行为管理器***120充当一个或多个认知交互服务的网关,并且在计算***300中提供。
计算***300可以包括至少一个处理器301、硬件模块、或用于执行所描述组件的功能的电路,所述组件可以是在至少一个处理器上执行的软件单元。可以提供运行并行处理线程的多个处理器,从而能够并行处理组件的功能中的一些或全部。存储器302可以被配置为向至少一个处理器301提供执行组件的功能的计算机指令303。
行为管理器***120可以包括用于接收对话流期间的一系列人-机认知交互的对话流接收组件311。对话流的人-机认知交互可以作为来自应用(诸如聊天机器人)的前端的调用进行协调。
行为管理器***120可以包括用于监控人类认知交互的人类交互监控组件312和用于分析人类认知交互以确定用户行为的人类交互分析组件313。人类交互分析组件313可以包括用于分析交互的语气的语气分析器组件314。语气分析器组件314可以访问远程分析器服务。
行为管理器***120可以包括用于监控机器响应并且对对话流中的响应的重复进行计数的机器响应监控组件315。
行为管理器***120可以包括用于确定人类认知交互的行为模式满足定义的行为模式的行为模式确定组件320。行为模式确定组件320可以包括行为规则定义组件321,用于通过提供用于在人类认知交互中识别行为模式的规则来配置所定义的行为模式。
行为管理器***120可以包括配置组件316,用于配置一组定义的行为模式,其中每个定义的行为模式具有最大响应重复阈值和将由认知交互服务执行的定义的动作。行为管理器***120可以包括用于存储配置规则和行为模式定义规则的储存库317。
行为管理器***120可以包括机器响应确定组件322,用于确定多个机器响应满足对定义的行为模式的响应的最大重复的定义的阈值。
行为管理器***120可以包括指令组件323,用于向认知交互服务指示按照定义的行为模式的定义的动作来调整后续响应的类型。
图4示出根据本发明的实施例的图3的计算***300的组件的框图。应当理解,图4仅提供一种实现方式的图示,并不暗示关于其中可以实现不同实施例的环境的任何限制。可以对所示的环境做出许多修改。
计算***300可包括全部通过通信结构418互连的一个或多个处理器402、一个或多个计算机可读RAM 404、一个或多个计算机可读ROM 406、一个或多个计算机可读存储介质408、设备驱动器412、读/写驱动器或接口414、以及网络适配器或接口416。通信结构418可以用被设计用于在处理器(诸如微处理器、通信和网络处理器等)、***存储器、***设备和***内的任何其他硬件组件之间传递数据和/或控制信息的任何架构来实现。
一个或多个操作***410和应用程序411(诸如行为管理器***120)被存储在一个或多个计算机可读存储介质408上,以供一个或多个处理器402通过一个或多个相应的RAM404(其通常包括高速缓冲存储器)来执行。在所示实施例中,根据本发明的实施例,计算机可读存储介质408中的每个可以是内部硬驱的磁盘存储设备、CD-ROM、DVD、记忆棒、磁带、磁盘、光盘、诸如RAM、ROM、EPROM、闪存的半导体存储设备或者能够存储计算机程序和数字信息的任何其他计算机可读存储介质。
计算***300还可以包括用于从一个或多个便携式计算机可读存储介质426读取和写入一个或多个便携式计算机可读存储介质426的R/W驱动器或接口414。计算***300上的应用程序411可存储在一个或多个便携式计算机可读存储介质426上,通过相应的R/W驱动器或接口414读取并加载到相应的计算机可读存储介质408中。
计算***300还可包括网络调整器或接口416,诸如TCP/IP调整器卡或无线通信调整器。计算***300上的应用程序411可通过网络(例如,互联网、局域网或其他广域网或无线网络)和网络调整器或接口416从外部计算机或外部存储装置下载到计算设备。程序可以从网络调整器或接口416加载到计算机可读存储介质408中。网络可以包括铜线、光纤、无线传输、路由器、防火墙、交换机、网关计算机和边缘服务器。
计算***300还可以包括显示屏420、键盘或小键盘422、以及计算机鼠标或触摸板424。设备驱动程序412与用于成像的显示屏420、键盘或小键盘422、计算机鼠标或触摸板424、和/或用于字母数字字符输入和用户选择的压力感测的显示屏420接口连接。设备驱动器412、R/W驱动器或接口414、以及网络调整器或接口416可以包括存储在计算机可读存储介质408和/或ROM 406中的硬件和软件。
本发明可以是任何可能的技术细节集成度的***、方法和/或计算机程序产品。计算机程序产品可包括其上具有用于使处理器执行本发明的各方面的计算机可读程序指令的计算机可读存储介质(或多个介质)。
计算机可读存储介质可为可保留和存储供指令执行装置使用的指令的有形装置。计算机可读存储介质可以是,例如但不限于,电子存储设备、磁存储设备、光存储设备、电磁存储设备、半导体存储设备、或者上述的任意合适的组合。计算机可读存储介质的更具体示例的非穷尽列表包括以下各项:便携式计算机盘、硬盘、随机存取存储器(RAM)、只读存储器(ROM)、可擦式可编程只读存储器(EPROM或闪存)、静态随机存取存储器(SRAM)、便携式紧凑盘只读存储器(CD-ROM)、数字通用盘(DVD)、记忆棒、软盘、诸如穿孔卡或具有记录在其上的指令的槽中的凸出结构的之类的机械编码设备、以及上述各项的任何合适的组合。如本文所使用的计算机可读存储介质不应被解释为暂时性信号本身,例如无线电波或其他自由传播的电磁波、通过波导或其他传输介质传播的电磁波(例如,穿过光纤电缆的光脉冲)或通过电线发射的电信号。
本文所描述的计算机可读程序指令可以从计算机可读存储介质下载到相应的计算/处理设备,或者通过网络,例如通过因特网、局域网、广域网和/或无线网络,下载到外部计算机或外部存储设备。网络可以包括铜传输电缆、光传输纤维、无线传输、路由器、防火墙、交换机、网关计算机和/或边缘服务器。每个计算/处理设备中的网络调整器卡或网络接口接收来自网络的计算机可读程序指令,并转发计算机可读程序指令以存储在相应计算/处理设备内的计算机可读存储介质中。
用于执行本发明的操作的计算机可读程序指令可以是汇编指令、指令集架构(ISA)指令、机器指令、机器相关指令、微代码、固件指令、状态设置数据、集成电路的配置数据、或以一种或多种程序设计语言的任何组合编写的源代码或目标代码,这些程序设计语言包括面向对象的程序设计语言(诸如Smalltalk、C++等)和过程程序设计语言(诸如“C”程序设计语言或类似程序设计语言)。计算机可读程序指令可以完全地在用户计算机上执行、部分在用户计算机上执行、作为独立软件包执行、部分在用户计算机上部分在远程计算机上执行或者完全在远程计算机或服务器上执行。在后一种情况下,远程计算机可通过任何类型的网络(包括局域网(LAN)或广域网(WAN))连接至用户计算机,或者可连接至外部计算机(例如,使用互联网服务提供商通过互联网)。在一些实施例中,包括例如可编程逻辑电路、现场可编程门阵列(FPGA)或可编程逻辑阵列(PLA)的电子电路可以通过利用计算机可读程序指令的状态信息来使电子电路个性化来执行计算机可读程序指令,以便执行本发明的各方面。
参照根据本发明实施例的方法、装置(***)和计算机程序产品的流程图和/或框图描述了本发明。应当理解,流程图和/或框图的每个方框以及流程图和/或框图中各方框的组合,都可以由计算机可读程序指令实现。
这些计算机可读程序指令可被提供给通用计算机、专用计算机或其他可编程数据处理装置的处理器以产生机器,使得通过计算机或其他可编程数据处理装置的处理器执行的指令创建用于实现在流程图和/或框图的或多个框中指定的功能/动作的装置。也可以把这些计算机可读程序指令存储在计算机可读存储介质中,这些指令使得计算机、可编程数据处理装置、和/或其他设备以特定方式工作,从而,其中存储有指令的计算机可读存储介质包括包含实现流程图和/或框图中的或多个方框中规定的功能/动作的方面的指令的制造品。
也可以把计算机可读程序指令加载到计算机、其他可编程数据处理装置、或其他设备上,使得在计算机、其他可编程装置或其他设备上执行一系列操作步骤,以产生计算机实现的处理,使得在计算机、其他可编程装置或其他设备上执行的指令实现流程图和/或框图中的或多个方框中规定的功能/动作。
附图中的流程图和框图示出了根据本发明的不同实施例的***、方法和计算机程序产品的可能实现方式的架构、功能和操作。对此,流程图或框图中的每个框可表示指令的模块、段或部分,其包括用于实现指定的逻辑功能的一个或多个可执行指令。在一些备选实现中,框中标注的功能可以不按照图中标注的顺序发生。例如,取决于所涉及的功能,连续示出的两个框实际上可以基本上同时执行,或者这些框有时可以以相反的顺序执行。也要注意的是,框图和/或流程图中的每个方框、以及框图和/或流程图中的方框的组合,可以用执行规定的功能或动作或执行专用硬件与计算机指令的组合的专用的基于硬件的***来实现。
云计算
应当理解,虽然本公开包括关于云计算的详细描述,但是本文所引用的教导的实现不限于云计算环境。相反,本发明的实施例能够结合现在已知的或以后开发的任何其他类型的计算环境来实现。云计算是服务交付的模型,用于使得能够方便地、按需地网络访问可配置计算资源(例如,网络、网络带宽、服务器、处理、存储器、存储、应用、虚拟机和服务)的共享池,所述可配置计算资源可以以最小的管理努力或与所述服务的提供者的交互来快速供应和释放。该云模型可以包括至少五个特性、至少三个服务模型和至少四个部署模型。
特性如下:
按需自助服务:云消费者可以单方面地根据需要自动地提供计算能力,诸如服务器时间和网络存储,而不需要与服务的提供者的人类交互。
广泛的网络接入:能力可通过网络获得并且通过标准机制接入,该标准机制促进异构瘦客户机平台或厚客户机平台(例如,移动电话、膝上型计算机和PDA)的使用。
资源池:提供者的计算资源被池化以使用多租户模型来服务于多个消费者,其中不同的物理和虚拟资源根据需要动态地指派和重新指派。存在位置独立性的感觉,因为消费者通常不具有对所提供的资源的确切位置的控制或了解,但可能能够以较高抽象级别(例如,国家、州或数据中心)指定位置。
快速弹性:能够快速和弹性地提供能力,在一些情况下自动地快速缩小和快速释放以快速放大。对于消费者而言,可用于供应的能力通常显得不受限制并且可以在任何时间以任何数量购买。
测量的服务:云***通过在适合于服务类型(例如,存储、处理、带宽和活动用户账户)的某个抽象级别处利用计量能力来自动控制和优化资源使用。可以监控、控制和报告资源使用,为所利用的服务的提供者和消费者提供透明度。
服务模型如下:
软件即服务(SaaS):提供给消费者的能力是使用在云基础设施上运行的提供者的应用。可通过诸如web浏览器(例如,基于web的电子邮件)之类的瘦客户端接口从不同客户端设备访问应用。消费者不管理或控制包括网络、服务器、操作***、存储或甚至单独的应用能力的底层云基础设施,可能的例外是有限的用户特定应用配置设置。
平台即服务(PaaS):提供给消费者的能力是将消费者创建的或获取的使用由提供商支持的编程语言和工具创建的应用部署到云基础设施上。消费者不管理或控制包括网络、服务器、操作***或存储的底层云基础设施,但是对所部署的应用和可能的应用托管环境配置具有控制。
基础设施即服务(IaaS):提供给消费者的能力是提供处理、存储、网络和消费者能够部署和运行任意软件的其他基本计算资源,所述软件可以包括操作***和应用。消费者不管理或控制底层云基础设施,而是具有对操作***、存储、所部署的应用的控制以及对所选联网组件(例如,主机防火墙)的可能受限的控制。
部署模型如下:
私有云:云基础架构仅为组织运作。它可以由组织或第三方管理,并且可以存在于场所内或场所外。
社区云:云基础架构被若干组织共享并支持共享了关注(例如,任务、安全要求、策略、和合规性考虑)的特定社区。它可以由组织或第三方管理,并且可以存在于场所内或场所外。公共云:使云基础架构对公众或大型行业组可用,并且由出售云服务的组织拥有。
混合云:云基础架构是两个或更多个云(私有、社区或公共)的组合,这些云保持唯一实体但通过使数据和应用能够移植的标准化或专有技术(例如,云突发以用于云之间的负载平衡)绑定在一起
云计算环境是面向服务的,集中于无状态、低耦合、模块化和语义互操作性。云计算的核心是包括互连节点网络的基础设施。
现在参见图5,描绘了示例性云计算环境50。如图所示,云计算环境50包括云消费者使用的本地计算设备可以与其通信的一个或多个云计算节点10,本地计算设备诸如例如个人数字助理(PDA)或蜂窝电话54A、台式计算机54B、膝上型计算机54C和/或汽车计算机***54N。节点10可彼此通信。它们可以物理地或虚拟地分组(未示出)在一个或多个网络中,诸如如上所述的私有云、社区云、公共云或混合云、或其组合。这允许云计算环境50提供基础设施、平台和/或软件作为云消费者不需要为其维护本地计算设备上的资源的服务。应当理解,图5中所示的计算设备54A-N的类型仅旨在是说明性的,并且计算节点10和云计算环境50可通过任何类型的网络和/或网络可寻址连接(例如,使用网络浏览器)与任何类型的计算机化设备通信。
现在参见图6,示出了由云计算环境50(图5)提供的一组功能抽象层。应当事先理解,图6中所示的组件、层和功能仅旨在是说明性的,并且本发明的实施例不限于此。如所描述,提供以下层和对应功能:
硬件和软件层60包括硬件和软件组件。硬件组件的示例包括:大型机61;基于RISC(精简指令集计算机)架构的服务器62;服务器63;刀片服务器64;存储设备65;以及网络和联网组件66。在一些实施例中,软件组件包括网络应用服务器软件67和数据库软件68。虚拟化层70提供抽象层,从该抽象层可以提供虚拟实体的以下示例:虚拟服务器71;虚拟存储器72;虚拟网络73,包括虚拟专用网络;虚拟应用和操作***74;以及虚拟客户端75。
在一个示例中,管理层80可以提供以下描述的功能。资源供应81提供用于在云计算环境内执行任务的计算资源和其他资源的动态采购。计量和定价82在云计算环境内利用资源时提供成本跟踪,并为这些资源的消费开账单或***。在一个示例中,这些资源可以包括应用软件许可证。安全性为云消费者和任务提供身份验证,以及为数据和其他资源提供保护。用户门户83为消费者和***管理员提供对云计算环境的访问。服务水平管理84提供云计算资源分配和管理,使得满足所需的服务水平。服务水平协议(SLA)规划和履行85提供根据SLA预期未来需求的云计算资源的预安排和采购。
工作负载层90提供可以利用云计算环境的功能的示例。可以从该层提供的工作负载和功能的示例包括:地图和导航91;软件开发和生命周期管理92;虚拟课堂教育交付93;数据分析处理94;交易处理95;以及人-机认知交互处理96。
已经出于说明的目的呈现了本发明的各种实施例的描述,但上述描述并不旨在是详尽的或者限于所公开的实施例。在不脱离所描述的实施例的范围和精神的情况下,许多修改和变化对本领域普通技术人员将是显而易见的。这里使用的术语被选择来最好地解释实施例的原理、实际应用或对在市场中找到的技术的技术改进,或者使得本领域普通技术人员能够理解这里公开的实施例。
在不脱离本发明的范围的情况下,可以对前述内容进行改进和修改。

Claims (20)

1.一种计算机实施的方法,用于基于在认知交互服务的网关处执行的人-机认知交互中的用户行为调整对话流,包括:
接收对话流期间的一系列人-机认知交互;
确定人类认知交互的行为模式满足定义的行为模式;
确定多个机器响应满足对定义的行为模式的响应的最大重复的定义的阈值;以及
向认知交互服务指示按照定义的行为模式的定义的动作来调整后续响应的类型。
2.根据权利要求1所述的方法,包括通过提供规则以识别人类认知交互中的行为模式来配置定义的行为模式。
3.根据权利要求2所述的方法,包括监控人类认知交互和分析人类认知交互以确定人类认知交互是否满足标识定义的行为模式的规则。
4.根据权利要求3所述的方法,其中,分析人类认知交互包括分析交互的语气。
5.根据权利要求2所述的方法,其中,所述规则包括识别以下的组中的一个或多个:禁用词的使用、词或短语重复、检测到的阈值愤怒程度、以及用户交互长度。
6.根据权利要求1所述的方法,包括监控机器响应并对对话流中的响应的重复进行计数。
7.根据权利要求1所述的方法,包括针对定义的行为模式配置响应的最大重复的阈值和将由认知交互服务执行的定义的动作。
8.根据权利要求1所述的方法,其中,定义的动作转到认知交互服务的识别的节点或题外话。
9.根据权利要求1所述的方法,包括:
确定人类认知交互的行为模式满足定义的行为模式;以及
确定多个机器响应不满足对定义的行为模式的响应的最大重复的定义的阈值;以及
提供对定义的行为模式的默认响应。
10.一种用于基于人-机认知交互中的用户行为调整对话流的***,所述***是认知交互服务的网关并且包括:
处理器和存储器,所述存储器被配置为向处理器提供计算机程序指令以执行以下组件的功能:
对话流接收组件,用于接收对话流期间的一系列人-机认知交互;
行为模式确定组件,用于确定人类认知交互的行为模式满足定义的行为模式;
机器响应确定组件,用于确定多个机器响应满足对定义的行为模式的响应的最大重复的定义的阈值;以及
指令组件,用于认知交互服务指示按照定义的行为模式的定义的动作来调整后续响应的类型。
11.根据权利要求10所述的***,包括行为规则定义组件,用于通过提供规则以识别人类认知交互中的行为模式来配置定义的行为模式。
12.根据权利要求10所述的***,包括用于监控人类认知交互的人类交互监控组件、用于分析人类认知交互的人类交互分析组件以及用于确定人类认知交互是否满足标识定义的用户行为的规则的规则组件。
13.根据权利要求12所述的***,其中,人类交互分析组件包括用于分析交互的语气的语气分析器组件。
14.根据权利要求11所述的***,其中,所述规则包括识别以下的组中的一个或多个:禁用词的使用、词或短语重复、检测到的阈值愤怒程度、以及用户交互长度。
15.根据权利要求10所述的***,包括机器响应监控组件,用于监控机器响应并对对话流中的响应的重复进行计数。
16.根据权利要求10所述的***,包括配置组件,用于配置一组定义的行为模式,其中每个定义的行为模式具有响应的最大重复的阈值和将由认知交互服务执行的定义的动作。
17.根据权利要求11所述的***,包括用于存储用于被配置的行为模式的规则的储存库。
18.根据权利要求10所述的***,其中,定义的动作是转到认知交互服务的识别的节点或题外话。
19.根据权利要求10所述的***,以在前端交互服务和多个认知交互服务之间提供的认知交互服务的网关的形式,以便统一认知交互服务响应于用户行为模式而采取的行动。
20.一种计算机可读介质,其上存储有程序指令,所述程序指令可由处理器执行以使处理器:接收对话流期间的一系列人-机认知交互;
确定人类认知交互的行为模式满足定义的行为模式;
确定多个机器响应满足对定义的行为模式的响应的最大重复的定义的阈值;以及
向认知交互服务指示按照定义的行为模式的定义的动作来调整后续响应的类型。
CN202080052710.2A 2019-08-01 2020-07-29 基于人-机认知交互中的行为调整对话流 Active CN114144773B (zh)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
EP19382667 2019-08-01
EP19382667.4 2019-08-01
PCT/IB2020/057143 WO2021019456A1 (en) 2019-08-01 2020-07-29 Adapting conversation flow based on behavior in human-machine cognitive interaction

Publications (2)

Publication Number Publication Date
CN114144773A CN114144773A (zh) 2022-03-04
CN114144773B true CN114144773B (zh) 2022-10-28

Family

ID=67658457

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202080052710.2A Active CN114144773B (zh) 2019-08-01 2020-07-29 基于人-机认知交互中的行为调整对话流

Country Status (5)

Country Link
US (1) US11288459B2 (zh)
JP (1) JP7441583B2 (zh)
CN (1) CN114144773B (zh)
DE (1) DE112020003661T5 (zh)
WO (1) WO2021019456A1 (zh)

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN115298639A (zh) * 2020-01-23 2022-11-04 阿恩启达卡诗技术私人有限公司 用于用户发起的与人工智能机器的通用对话的***
US20230409838A1 (en) * 2022-05-31 2023-12-21 International Business Machines Corporation Explaining natural-language-to-flow pipelines

Citations (15)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101001287A (zh) * 2006-12-26 2007-07-18 华为技术有限公司 语音服务器及语音应答方法
CA2898048A1 (en) * 2013-01-11 2014-07-17 Teknision Inc. Method and system for configuring selection of contextual dashboards
CN105513593A (zh) * 2015-11-24 2016-04-20 南京师范大学 一种语音驱动的智能人机交互方法
US9519683B1 (en) * 2011-09-06 2016-12-13 Google Inc. Inferring social affinity based on interactions with search results
CN107153710A (zh) * 2017-05-19 2017-09-12 肇庆市智高电机有限公司 一种大数据处理方法及***
CN107870994A (zh) * 2017-10-31 2018-04-03 北京光年无限科技有限公司 用于智能机器人的人机交互方法及***
CN108369767A (zh) * 2015-12-06 2018-08-03 声钰科技 基于用户认知状态和/或情境状态的会话调整***和方法
CN108446290A (zh) * 2017-02-16 2018-08-24 谷歌有限责任公司 流式实时对话管理
WO2018215825A1 (en) * 2017-05-22 2018-11-29 International Business Machines Corporation Adaptive adjustment using sensor data and distributed data
CN109036544A (zh) * 2018-05-31 2018-12-18 平安医疗科技有限公司 医疗信息推送方法、装置、计算机设备和存储介质
CN109240830A (zh) * 2012-12-18 2019-01-18 微软技术许可有限责任公司 基于服务器健康以及客户端信息的应用智能请求管理
CN109377998A (zh) * 2018-12-11 2019-02-22 科大讯飞股份有限公司 一种语音交互方法及装置
CN109616108A (zh) * 2018-11-29 2019-04-12 北京羽扇智信息科技有限公司 多轮对话交互处理方法、装置、电子设备及存储介质
CN109918650A (zh) * 2019-02-03 2019-06-21 北京大学 自动生成采访稿的采访智能机器人装置及智能采访方法
CN110020007A (zh) * 2017-09-15 2019-07-16 上海挖数互联网科技有限公司 机器人交互控制方法及装置、存储介质、服务器

Family Cites Families (14)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20050069122A1 (en) * 2003-09-30 2005-03-31 Xiaofan Lin System and method for operator assisted automated call handling
JP4095577B2 (ja) 2004-05-19 2008-06-04 日本電信電話株式会社 対話装置、音声対話装置、対話プログラム、音声対話プログラムおよび記録媒体
DE102006055864A1 (de) 2006-11-22 2008-05-29 Deutsche Telekom Ag Verfahren zur Dialoganpassung und Dialogsystem zur Durchführung
JP2009193448A (ja) 2008-02-15 2009-08-27 Oki Electric Ind Co Ltd 対話システム、方法及びプログラム
US8943394B2 (en) * 2008-11-19 2015-01-27 Robert Bosch Gmbh System and method for interacting with live agents in an automated call center
US20130325482A1 (en) 2012-05-29 2013-12-05 GM Global Technology Operations LLC Estimating congnitive-load in human-machine interaction
US10068174B2 (en) 2012-08-02 2018-09-04 Artifical Solutions Iberia S.L. Hybrid approach for developing, optimizing, and executing conversational interaction applications
US20150309988A1 (en) 2014-04-29 2015-10-29 International Business Machines Corporation Evaluating Crowd Sourced Information Using Crowd Sourced Metadata
JP6832502B2 (ja) 2016-07-01 2021-02-24 パナソニックIpマネジメント株式会社 エージェント装置、対話システム、対話方法及びプログラム
US20180101776A1 (en) 2016-10-12 2018-04-12 Microsoft Technology Licensing, Llc Extracting An Emotional State From Device Data
US20180174055A1 (en) 2016-12-19 2018-06-21 Giridhar S. Tirumale Intelligent conversation system
WO2019011356A1 (de) * 2017-07-14 2019-01-17 Cognigy Gmbh Verfahren zur dialogführung zwischen mensch und computer
US10565634B2 (en) * 2017-08-01 2020-02-18 Facebook, Inc. Training a chatbot for a digital advertisement to simulate common conversations associated with similar digital advertisements
US20200005118A1 (en) * 2018-06-28 2020-01-02 Microsoft Technology Licensing, Llc Offtrack virtual agent interaction session detection

Patent Citations (15)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101001287A (zh) * 2006-12-26 2007-07-18 华为技术有限公司 语音服务器及语音应答方法
US9519683B1 (en) * 2011-09-06 2016-12-13 Google Inc. Inferring social affinity based on interactions with search results
CN109240830A (zh) * 2012-12-18 2019-01-18 微软技术许可有限责任公司 基于服务器健康以及客户端信息的应用智能请求管理
CA2898048A1 (en) * 2013-01-11 2014-07-17 Teknision Inc. Method and system for configuring selection of contextual dashboards
CN105513593A (zh) * 2015-11-24 2016-04-20 南京师范大学 一种语音驱动的智能人机交互方法
CN108369767A (zh) * 2015-12-06 2018-08-03 声钰科技 基于用户认知状态和/或情境状态的会话调整***和方法
CN108446290A (zh) * 2017-02-16 2018-08-24 谷歌有限责任公司 流式实时对话管理
CN107153710A (zh) * 2017-05-19 2017-09-12 肇庆市智高电机有限公司 一种大数据处理方法及***
WO2018215825A1 (en) * 2017-05-22 2018-11-29 International Business Machines Corporation Adaptive adjustment using sensor data and distributed data
CN110020007A (zh) * 2017-09-15 2019-07-16 上海挖数互联网科技有限公司 机器人交互控制方法及装置、存储介质、服务器
CN107870994A (zh) * 2017-10-31 2018-04-03 北京光年无限科技有限公司 用于智能机器人的人机交互方法及***
CN109036544A (zh) * 2018-05-31 2018-12-18 平安医疗科技有限公司 医疗信息推送方法、装置、计算机设备和存储介质
CN109616108A (zh) * 2018-11-29 2019-04-12 北京羽扇智信息科技有限公司 多轮对话交互处理方法、装置、电子设备及存储介质
CN109377998A (zh) * 2018-12-11 2019-02-22 科大讯飞股份有限公司 一种语音交互方法及装置
CN109918650A (zh) * 2019-02-03 2019-06-21 北京大学 自动生成采访稿的采访智能机器人装置及智能采访方法

Non-Patent Citations (5)

* Cited by examiner, † Cited by third party
Title
Designing and evaluating an adaptive spoken dialogue system;DianeJ.Litman 等;《User Modeling and User-Adapted Interaction》;20020630;第111-137页 *
Toward detecting emotions in spoken dialogs;Chul Min Lee等;《IEEE Transactions on Speech and Audio Processing》;20050222;第293-303页 *
一种空间服务机器人在轨人机交互***设计;谭启蒙等;《载人航天》;20180615(第03期);第12-18+52页 *
基于上下文感知的智能交互***模型;岳玮宁等;《计算机辅助设计与图形学学报》;20050120(第01期);第75-80页 *
基于多传感器的机器人遥操作人机交互***;易润泽等;《测控技术》;20180918(第09期);第61-64页 *

Also Published As

Publication number Publication date
JP2022542045A (ja) 2022-09-29
JP7441583B2 (ja) 2024-03-01
WO2021019456A1 (en) 2021-02-04
US11288459B2 (en) 2022-03-29
US20210034820A1 (en) 2021-02-04
CN114144773A (zh) 2022-03-04
DE112020003661T5 (de) 2022-04-21

Similar Documents

Publication Publication Date Title
US10169428B1 (en) Mining procedure dialogs from source content
US20190318219A1 (en) Personalized artificial intelligence interactions and customized responses of a computer system
US11250204B2 (en) Context-aware knowledge base system
US11978060B2 (en) Dynamic categorization of it service tickets using natural language description
CN114144773B (zh) 基于人-机认知交互中的行为调整对话流
US10558689B2 (en) Leveraging contextual information in topic coherent question sequences
CN115827832A (zh) 与外部事件相关的对话***内容
US10679003B2 (en) Assisting with written communication style based on recipient dress style
US20220101833A1 (en) Ontology-based organization of conversational agent
WO2023216857A1 (en) Multi-agent chatbot with multi-intent recognition
US10902046B2 (en) Breaking down a high-level business problem statement in a natural language and generating a solution from a catalog of assets
CN112528678A (zh) 基于上下文信息的对话***
US12020689B2 (en) Method to improve digital agent conversations
US20220043977A1 (en) Determining user complaints from unstructured text
US11250215B2 (en) Form-based transactional conversation system design
US10599783B2 (en) Automatically suggesting a temporal opportunity for and assisting a writer in writing one or more sequel articles via artificial intelligence
US11914650B2 (en) Data amalgamation management between multiple digital personal assistants
US20230419047A1 (en) Dynamic meeting attendee introduction generation and presentation
US11853712B2 (en) Conversational AI with multi-lingual human chatlogs
US20230409831A1 (en) Information sharing with effective attention management system
US20220335224A1 (en) Writing-style transfer based on real-time dynamic context
US20230172508A1 (en) Cognitive notifications choreographer
US20220200935A1 (en) Generating a chatbot utilizing a data source
US20220309466A1 (en) Detecting and mitigating sensitive expression during a meeting

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant