CN116842143A - 基于人工智能的对话模拟方法、装置、电子设备及介质 - Google Patents
基于人工智能的对话模拟方法、装置、电子设备及介质 Download PDFInfo
- Publication number
- CN116842143A CN116842143A CN202310146134.3A CN202310146134A CN116842143A CN 116842143 A CN116842143 A CN 116842143A CN 202310146134 A CN202310146134 A CN 202310146134A CN 116842143 A CN116842143 A CN 116842143A
- Authority
- CN
- China
- Prior art keywords
- answer
- dialogue
- target
- simulation
- question
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000004088 simulation Methods 0.000 title claims abstract description 197
- 238000000034 method Methods 0.000 title claims abstract description 65
- 238000013473 artificial intelligence Methods 0.000 title claims abstract description 44
- 238000006243 chemical reaction Methods 0.000 claims abstract description 35
- 230000004044 response Effects 0.000 claims abstract description 29
- 238000004458 analytical method Methods 0.000 claims abstract description 27
- 238000012549 training Methods 0.000 claims description 22
- 238000013507 mapping Methods 0.000 claims description 10
- 238000001356 surgical procedure Methods 0.000 claims description 10
- 238000004590 computer program Methods 0.000 claims description 4
- 230000008569 process Effects 0.000 description 20
- 230000006870 function Effects 0.000 description 12
- 238000005516 engineering process Methods 0.000 description 10
- 238000010586 diagram Methods 0.000 description 6
- 238000012545 processing Methods 0.000 description 6
- 238000013528 artificial neural network Methods 0.000 description 4
- 238000004891 communication Methods 0.000 description 3
- 230000003993 interaction Effects 0.000 description 3
- 230000000007 visual effect Effects 0.000 description 3
- 239000003814 drug Substances 0.000 description 2
- 238000011835 investigation Methods 0.000 description 2
- 238000012552 review Methods 0.000 description 2
- 230000005540 biological transmission Effects 0.000 description 1
- 238000004364 calculation method Methods 0.000 description 1
- 238000010276 construction Methods 0.000 description 1
- 238000013135 deep learning Methods 0.000 description 1
- 238000001514 detection method Methods 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 238000007599 discharging Methods 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 230000010365 information processing Effects 0.000 description 1
- 238000010801 machine learning Methods 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000003058 natural language processing Methods 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/33—Querying
- G06F16/332—Query formulation
- G06F16/3329—Natural language query formulation or dialogue systems
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/10—Text processing
- G06F40/12—Use of codes for handling textual entities
- G06F40/151—Transformation
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/10—Text processing
- G06F40/166—Editing, e.g. inserting or deleting
- G06F40/186—Templates
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/30—Semantic analysis
- G06F40/35—Discourse or dialogue representation
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- Artificial Intelligence (AREA)
- Computational Linguistics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Health & Medical Sciences (AREA)
- General Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Mathematical Physics (AREA)
- Human Computer Interaction (AREA)
- Databases & Information Systems (AREA)
- Data Mining & Analysis (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
本发明涉及人工智能技术领域,提供一种基于人工智能的对话模拟方法、装置、电子设备及介质,所述方法包括:基于对话场景类型确定目标问答树及第一问询节点;将第一问询节点的第一问题发送至话术管理模型中;接收话术管理模型输出的第一问题的第一目标答案;将第二问询节点的第二问题发送至模拟用户对应的语义识别模型中;接收语义识别模型响应于第二问题输出的语义答复,并对语义答复进行语义转换,得到第二目标答案;当第二目标答案不满足模拟用户的约束要求时,获取最终对话内容;对最终对话内容进行分析,得到分析结果。本发明通过基于对话场景类型确定目标问答树实现模拟对话,提高了模拟对话内容的准确率。
Description
技术领域
本发明涉及人工智能技术领域,具体涉及一种基于人工智能的对话模拟方法、装置、电子设备及介质。
背景技术
随着人工智能技术的发展,在开发一个任务型对话***时,由于真实用户的交互数据的采集费时费力,无法支持模型的快速迭代,现有技术通过构建用户模拟器模拟对话内容。
然而,现有的用户模拟器,主要通过规则和统计方案实现,泛化性不强,导致对话模拟效果不佳,进而导致模拟的真实用户对话准确率低。
发明内容
鉴于以上内容,有必要提出一种基于人工智能的对话模拟方法、装置、电子设备及介质,通过基于对话场景类型确定目标问答树实现模拟对话,提高了模拟对话内容的准确率。
本发明的第一方面提供一种基于人工智能的对话模拟方法,所述方法包括:
响应于接收的对话模拟请求,获取模拟用户和对话场景类型;
基于所述对话场景类型确定目标问答树及对应的第一问询节点;
对所述目标问答树进行至少一轮迭代模拟对话,直至获得最终对话内容,其中,所述至少一轮迭代模拟对话中的任意一轮模板对话包括:
将所述第一问询节点的第一问题发送至话术管理模型中;
接收所述话术管理模型输出的第一问题的第一目标答案;
基于所述第一目标答案确定第二问询节点;
将所述第二问询节点的第二问题发送至所述模拟用户对应的语义识别模型中;
接收所述语义识别模型输出的语义答复,并对所述语义答复进行语义转换,得到第二目标答案;
判断所述第二目标答案是否满足所述模拟用户的约束要求;
当所述第二目标答案满足所述模拟用户的约束条件时,基于所述第二目标答案确定第三问询节点,从所述第三问询节点开始进行下一轮迭代模拟对话;或者
当所述第二目标答案不满足所述模拟用户的约束要求时,获取最终对话内容。
可选地,所述基于所述对话场景类型确定目标问答树及对应的第一问询节点包括:
当所述对话场景类型为预设场景时,从预设的数据库中匹配出与所述预设场景关联的每个子场景的问答树;按照预设的话术顺序,对所述预设场景关联的所有子场景的多个问答树进行关联,将关联后的问答树确定为目标问答树,并将所述目标问答树中的第一个问答树的第一个节点确定为所述目标问答树的第一问询节点;或者
当所述对话场景类型为预设场景的子场景时,从所述预设的数据库中匹配出所述子场景的问答树,将所述问答树确定为目标问答树,并将所述目标问答树的第一个节点确地为所述目标问答树的第一个问询节点。
可选地,所述判断所述第二目标答案是否满足所述模拟用户的约束要求包括:
识别所述第二目标答案是否与所述模拟用户的用户画像匹配;
当所述第二目标答案与所述模拟用户的用户画像完全匹配时,确定所述第二目标答案满足模拟用户的约束要求;或者
当所述第二目标答案与所述模拟用户的用户画像不完全匹配时,确定所述第二目标答案不满足所述模拟用户的约束要求。
可选地,所述对所述语义答复进行语义转换,得到第二目标***括:
判断所述语义答复的类别;
当所述语义答复为键值对类别时,将所述键值对作为第二目标答案;或者
当所述语义答复为语义类别时,对所述语义答复进行文本转换,得到第二目标答案;或者
当所述语义答复包含键值对类别的第一语义答复和语义类别的第二语义答复时,将所述第一语义答复作为第一文本,及对所述第二语义答复进行文本转换,得到第二文本;将所述第一文本和所述第二文本进行拼接,得到第二目标答案。
可选地,所述对所述语义答复进行文本转换,得到第二目标***括:
根据所述目标问答树,确定所述语义答复的意图和实体;
根据所述意图和实体,从预设的数据库中遍历出与所述意图和实体匹配的句子模板;
将所述意图和实体分别映射至对应的句子模板中,得到第二目标答案。
可选地,在所述获取最终对话内容之后,所述方法还包括:
获取所述对话场景类型的初始模板和预设模板;
将所述最终对话内容映射至所述初始模板中,得到目标模板;
将所述目标模板与所述预设模板进行匹配;
从匹配结果中查询出失败信息;
统计所述最终对话内容的对话轮数;
计算所述最终对话内容占所述对话场景类型对应的目标对话内容的覆盖率;
将所述失败信息、所述对话轮数及所述覆盖率确定为所述最终对话内容的分析结果。
可选地,所述方法还包括:
根据所述分析结果,确定所述最终对话内容是否满足样本要求;
当所述最终对话内容满足所述样本要求时,将所述最终对话内容作为训练样本;
基于所述训练样本重新训练所述话术管理模型,得到目标话术管理模型。
本发明的第二方面提供一种基于人工智能的对话模拟装置,所述装置包括:
获取模块,用于响应于接收的对话模拟请求,获取模拟用户和对话场景类型;
确定模块,用于基于所述对话场景类型确定目标问答树及对应的第一问询节点;
模拟对话模块,用于对所述目标问答树进行至少一轮迭代模拟对话,直至获得最终对话内容,其中,所述至少一轮迭代模拟对话中的任意一轮模板对话包括:
发送模块,用于将所述第一问询节点的第一问题发送至话术管理模型中;
输出模块,用于接收所述话术管理模型输出的第一问题的第一目标答案;
所述确定模块,还用于基于所述第一目标答案确定第二问询节点;
所述发送模块,还用于将所述第二问询节点的第二问题发送至所述模拟用户对应的语义识别模型中;
语义转换模块,还用于接收所述语义识别模型输出的语义答复,并对所述语义答复进行语义转换,得到第二目标答案;
判断模块,用于判断所述第二目标答案是否满足所述模拟用户的约束要求;
所述确定模块,还用于当所述第二目标答案满足所述模拟用户的约束条件时,基于所述第二目标答案确定第三问询节点,从所述第三问询节点开始进行下一轮迭代模拟对话;或者
所述获取模块,还用于当所述第二目标答案不满足所述模拟用户的约束要求时,获取最终对话内容。
本发明的第三方面提供一种电子设备,所述电子设备包括处理器和存储器,所述处理器用于执行所述存储器中存储的计算机程序时实现所述的基于人工智能的对话模拟方法。
本发明的第四方面提供一种计算机可读存储介质,所述计算机可读存储介质上存储有计算机程序,所述计算机程序被处理器执行时实现所述的基于人工智能的对话模拟方法。
综上所述,本发明所述的基于人工智能的对话模拟方法、装置、电子设备及介质,能够推动智慧城市的建设,应用于智慧建筑、智慧安防、智慧社区、智慧生活、物联网等领域,通过基于所述对话场景类型确定目标问答树及对应的第一问询节点,通过基于所述对话场景类型确定目标问答树,确定的目标问答树更加具有针对性和合理性,进而提高了后续的模拟对话准确率和效率。通过对所述语义答复进行语义转换,得到第二目标答案,使得模拟对话内容更加的直观,可读性强。判断所述第二目标答案是否满足所述模拟用户的约束要求,在构建用户画像时增加约束条件,用以维持模拟用户在局部对话中的上下文一致性,使得模拟的对话内容更加真实,提高了模拟对话内容的准确率。
附图说明
图1是本发明实施例一提供的基于人工智能的对话模拟方法的应用环境架构图。
图2是本发明实施例二提供的基于人工智能的对话模拟方法的流程图。
图3是本发明实施例二提供的任意一轮模板对话的流程图。
图4是本发明实施例三提供的基于人工智能的对话模拟装置的结构图。
图5是本发明实施例四提供的电子设备的结构示意图。
具体实施方式
为了能够更清楚地理解本发明的上述目的、特征和优点,下面结合附图和具体实施例对本发明进行详细描述。需要说明的是,在不冲突的情况下,本发明的实施例及实施例中的特征可以相互组合。
除非另有定义,本文所使用的所有的技术和科学术语与属于本发明的技术领域的技术人员通常理解的含义相同。本文中在本发明的说明书中所使用的术语只是为了描述具体的实施例的目的,不是旨在于限制本发明。
实施例一
参阅图1所示,为本发明实施例一提供的基于人工智能的对话模拟方法的应用环境架构图。
所述基于人工智能的对话模拟方法可以应用于在一个或者多个电子设备构成的环境中,例如,由对话管理器110和用户模拟器120构成的环境中,所述对话管理器110与用户模拟器120通讯连接。
具体地,通过所述对话管理器110与所述用户模拟器120进行对话交互,实现对话模拟。
实施例二
图2是本发明实施例二提供的基于人工智能的对话模拟方法的流程图。
在本实施例中,所述基于人工智能的对话模拟方法可以应用于电子设备中,对于需要进行对话模拟的电子设备,可以直接在电子设备上集成本发明的方法所提供的对话模拟的功能,或者以软件开发工具包(Software Development Kit,SDK)的形式运行在电子设备中。
本发明实施例可以基于人工智能技术对相关的数据进行获取和处理。其中,人工智能(Artificial Intelligence,AI)是利用数字计算机或者数字计算机控制的机器模拟、延伸和扩展人的智能,感知环境、获取知识并使用知识获得最佳结果的理论、方法、技术及应用***。
人工智能基础技术一般包括如传感器、专用人工智能芯片、云计算、分布式存储、大数据处理技术、操作/交互***、机电一体化等技术。人工智能软件技术主要包括计算机视觉技术、机器人技术、生物识别技术、语音处理技术、自然语言处理技术以及机器学习、深度学习等几大方向。
如图2所示,所述基于人工智能的对话模拟方法具体包括以下步骤,根据不同的需求,该流程图中步骤的顺序可以改变,某些可以省略。
101,响应于接收的对话模拟请求,获取模拟用户和对话场景类型。
本实施例中,现有的智能对话的话术管理模型在各个行业都有很多应用,例如,应用于医疗数字、催收场景、客户需求调查场景等,都需要开发一个任务型对话管理器,由于真实用户的交互数据的采集费时费力,无法支持模型的快速迭代,通过构建一个用户模拟器与对话管理器进行交互,产生大量的交互数据。
本实施例中,对话模拟请求是指用户请求用户模拟器与对话管理器进行模拟对话,在电子设备接收到对话模拟请求时,解析所述对话模拟请求,获取对话模拟报文,从所述对话模拟报文中获取模拟用户和对话场景类型。
102,基于所述对话场景类型确定目标问答树及对应的第一问询节点。
本实施例中,目标问答树中包含有模拟对话的各个节点,可以根据目标问答树的其中一个节点确定下一个节点。
在一个可选的实施例中,所述基于所述对话场景类型确定目标问答树及对应的第一问询节点包括:
当所述对话场景类型为预设场景时,从预设的数据库中匹配出与所述预设场景关联的每个子场景的问答树;按照预设的话术顺序,对所述预设场景关联的所有子场景的多个问答树进行关联,将关联后的问答树确定为目标问答树,并将所述目标问答树中的第一个问答树的第一个节点确定为所述目标问答树的第一问询节点;或者
当所述对话场景类型为预设场景的子场景时,从所述预设的数据库中匹配出所述子场景的问答树,将所述问答树确定为目标问答树,并将所述目标问答树的第一个节点确地为所述目标问答树的第一个问询节点。
本实施例中,所述对话场景类型包含预设场景和预设场景的子场景,具体地,所述预设场景中包含有至少一个子场景,例如,预设场景为医疗数字,预设场景对应的子场景有就诊场景、复诊场景、买药场景等。
本实施例中,预设场景的目标问答树由多个子场景的问答树拼接而成,故一个目标问答树中包含有至少一个问答树。
本实施例中,通过基于所述对话场景类型确定目标问答树,确定的目标问答树更加具有针对性和合理性,进而提高了后续的模拟对话准确率和效率。
103,对所述目标问答树进行至少一轮迭代模拟对话,直至获得最终对话内容。
本实施例中,所述最终对话内容是指针对所述对话模拟请求进行的完整的模拟对话内容。
具体地,所述至少一轮迭代模拟对话中的任意一轮模板对话具体包括以下步骤,如图3所示。
1031,将所述第一问询节点的第一问题发送至话术管理模型中。
本实施例中,在所述对话管理器与所述用户模拟器进行模拟对话过程中,所述用户模拟器和所述对话管理器的接口在逻辑上都是:输入外部请求-内部处理该请求-输出对外部的响应。
本实施例中,所述控制器维护所述用户模拟器中创建的所有角色的模拟用户,通过FST(Finite State Transducer,有限状态转换器)跟踪和处理对话流程节点,具体地,FST是一种词典索引数据结构,用以快速定位每个问询节点的位置。
本实施例中,所述对话管理器接收所述用户模拟器中的控制器发送的第一问题,及将所述第一问题发送至话术管理模型中。
具体地,所述话术管理模型的训练过程包括:
获取所述模拟用户及所述对话场景类型对应的历史对话语料集,其中,所述历史对话语料中包含有问题集及每个问题的答案;
将所述历史对话语料集作为样本数据集;
将所述样本数据集输入预设神经网络中进行训练,得到话术管理模型。
本实施例中,通过将第一问题输入至话术管理模型中,所述话术管理模型可以输出对应的目标答案。
本实施例中,通过在所述用户模拟器中增加控制器进行消息转换和转发,让对话流程自动进行下去,进而模拟出完整的对话内容,提高了获取的模拟对话内容的完整性。
1032,接收所述话术管理模型输出的第一问题的第一目标答案。
本实施例中,当话术管理模型输出第一问题的第一目标答案时,所述控制器接收所述第一目标答案。
1033,基于所述第一目标答案确定第二问询节点。
本实施例中,在控制器接收到第一目标答案时,基于所述第一目标答案遍历所述目标问答树,确定第二问询节点。
1034,将所述第二问询节点的第二问题发送至所述模拟用户对应的语义识别模型中。
本实施例中,当所述控制器确定了第二问询节点时,将所述第二问询节点的第二问题发送至所述模拟用户对应的语义识别模型中。
具体地,所述语义识别模型的训练过程包括:
获取所述模拟用户及所述对话场景类型对应的历史对话语料集,其中,所述历史对话语料中包含有问题集及每个问题的语义答复;
提取每个问题的第一语义特征集,及提取每个问题的语义答复的第二语义特征集;
将所述第一语义特征集和所述第二语义特征集作为样本数据集;
将所述样本数据集输入预设神经网络中进行训练,得到语义识别模型。
本实施例中,所述语义识别模型输出的为语义答复。
1035,接收所述语义识别模型响应于所述第二问题输出的语义答复,并对所述语义答复进行语义转换,得到第二目标答案。
本实施例中的,语义识别模型是基于每个角色的多个模拟用户的历史对话语料训练得到的,具体地训练过程,在此不做详述。
本实施例中,不同角色的模拟用户对应有语义识别模型,在控制器接收到第二问题时,确定所述模拟用户的语义识别模型,将所述第二问题输入至所述模拟用户对应的语义识别模型中,输出语义答复。
在一个可选的实施例中,在接收所述语义识别模型响应于所述第二问题输出的语义答复之前,所述方法还包括:
解析所述对话模拟要求,获取模拟用户的配置信息;
基于所述配置信息为所述模拟用户构建用户画像。
本实施例中,配置信息中包含多个概率,每个概率用于表征模拟用户在对话流程中生成问题答复的偏好度。
本实施例中,通过在配置信息中设定合理的概率值,并基于所述配置信息为所述模拟用户构建用户画像,后续经过大量对话的模拟,使得用户画像能够比较完整的覆盖整个对话流程。
本实施例中,在构建用户画像的过程中,还会在配置信息中增加一些约束条件,用以维持模拟用户在局部对话中的上下文一致性,使得模拟的对话内容更加真实,提高了模拟对话内容的准确率。
具体地,约束条件可以为模拟用户针对当前问题已经进行过答复,例如:当前问题为:你去A区使用了什么交通工具?在回答当前问题之前,用户已经表明自己做高铁去的A区,确定模拟用户针对当前问题已经进行过答复;或者,约束条件也可以模拟用户未针对当前问题进行正确答复,例如,当前问题为:你去A区使用了什么交通工具?模拟用户作为的答复为:今天天气很好,确定模拟用户未针对当前问题进行正确答复。
本实施例中,通过在用户画像中设置约束条件,可以使得模拟用户对话更加的真实,提高了模拟对话内容的准确率。
在一个可选的实施例中,所述对所述语义答复进行语义转换,得到第二目标***括:
判断所述语义答复的类别;
当所述语义答复为键值对类别时,将所述键值对作为第二目标答案;或者
当所述语义答复为语义类别时,对所述语义答复进行文本转换,得到第二目标答案;或者
当所述语义答复包含键值对类别的第一语义答复和语义类别的第二语义答复时,将所述第一语义答复作为第一文本,及对所述第二语义答复进行文本转换,得到第二文本;将所述第一文本和所述第二文本进行拼接,得到第二目标答案。
本实施例中,语义答复的类别包括以下一种或者多种方式组合:键值对类别;语义类别,具体地,针对键值对类别,直接将键值对作为生成的文本;针对语义类别,进行文本转换,得到第二目标答案。
进一步地,所述对所述语义答复进行文本转换,得到第二目标***括:
根据所述目标问答树,确定所述语义答复的意图和实体;
根据所述意图和实体,从预设的数据库中遍历出与所述意图和实体匹配的句子模板;
将所述意图和实体分别映射至对应的句子模板中,得到第二目标答案。
本实施例中,当第二目标答案考虑语义时,从所述目标问答树中确定所述第二问题的节点,从所述目标问答树的第二问题的节点获取预先设置的意图和实体,将所述意图和实体作为所述语义答复的意图和实体,并从预设的数据库中匹配出所述意图和实体对应的句子模板,例如,意图为:去A银行;实体为:M公交,对应的句子模板为:乘坐XXX去XXX银行;将所述意图和实体映射至所述句子模板得到第二目标答案为:乘坐M公交去A银行。
本实施例中,由于语义表示不便于用户观看,故将语义答复转换为文本,即第二目标答案,使得模拟对话内容更加的直观,可读性强,同时后续采用所述第二目标答案进行模拟对话分析,提高了模拟对话分析的准确率。
1036,判断所述第二目标答案是否满足所述模拟用户的约束要求。
本实施例中,可以预先为模拟用户设置约束条件,具体地,所述约束条件设置在模拟用户的用户画像中。
在一个可选的实施例中,所述判断所述第二目标答案是否满足所述模拟用户的约束要求包括:
识别所述第二目标答案是否与所述模拟用户的用户画像匹配;
当所述第二目标答案与所述模拟用户的用户画像完全匹配时,确定所述第二目标答案满足模拟用户的约束要求;或者
当所述第二目标答案与所述模拟用户的用户画像不完全匹配时,确定所述第二目标答案不满足所述模拟用户的约束要求。
本实施例中,通过判断所述第二目标答案是否与所述模拟用户的用户画像是否匹配,可以确定所述模拟对话流程能否进行下去。
1037,当所述第二目标答案满足所述模拟用户的约束条件时,基于所述第二目标答案确定第三问询节点,从所述第三问询节点开始进行下一轮迭代模拟对话。
本实施例中,在所述第二目标答案满足所述模拟用户的约束条件时,确定继续所述模拟对话流程。
1038,当所述第二目标答案不满足所述模拟用户的约束要求时,获取最终对话内容。
本实施例中,所述最终对话内容是指针对该次对话模拟请求所进行的完整对话内容,所述最终对话内容中包括每轮模拟对话的目标问题,及所述目标问题对应的目标答案,例如,第一问题及所述第一问题的第一目标答案、第二问题及所述第二问题的第二目标答案。
具体地,在所述第二目标答案不满足所述模拟用户的约束条件时,确定所述模拟对话流程无法继续下去,直接结束所述模拟对话流程,获取已经完成的模拟对话内容,作为最终对话内容。
在一个可选的实施例中,在所述获取最终对话内容之后,所述方法还包括:
对所述最终对话内容进行分析,得到分析结果。
本实施例中,在得到最终对话内容时,需要对最终对话内容进行分析,例如,可以将所述最终对话内容转换为特定格式的日志或者报告,便于后期进一步对所述最终对话内容进行分析。
进一步地,所述对所述最终对话内容进行分析,得到分析结果包括:
获取所述对话场景类型的初始模板和预设模板;
将所述最终对话内容映射至所述初始模板中,得到目标模板;
将所述目标模板与所述预设模板进行匹配;
从匹配结果中查询出失败信息;
统计所述最终对话内容的对话轮数;
计算所述最终对话内容占所述对话场景类型对应的目标对话内容的覆盖率;
将所述失败信息、所述对话轮数及所述覆盖率确定为所述最终对话内容的分析结果。
本实施例中,初始模板用于表征对话场景类型的空白模板,所述预设模板用以表征基于对话场景类型的预设的对话内容生成的模板,目标对话内容是指对话场景类型对应的预设的对话内容。
本实施例中,在对所述最终对话内容进行分析时,可以通过计算的对话轮数、最终对话内容占目标对话内容的覆盖率及定位出的失败信息,评估该次的模板对话的质量,其中,所述失败信息包括对话内容识别码和失败的对话内容。
进一步地,所述方法还包括:
根据所述分析结果,确定所述最终对话内容是否满足样本要求;
当所述最终对话内容满足所述样本要求时,将所述最终对话内容作为训练样本;
基于所述训练样本重新训练所述话术管理模型,得到目标话术管理模型。
本实施例中,所述样本要求可以为所述分析结果中的覆盖率大于或者等于预设的覆盖率阈值,也可以为所述分析结果中的对话轮数大于或者等于预设的对话轮数阈值。样本要求可以根据实际场景进行设置,在此不做限制。
本实施例中,在所述最终对话内容满足样本要求时,可以将所述最终对话内容作为训练样本进行话术管理模型的训练,通过不断的模拟对话内容,将模拟的模拟对话内容作为训练样本不断的训练话术管理模型,提高了话术管理模型的鲁棒性,同时无需去线上收集用户的真实对话信息,提高了话术管理模型的更新迭代速率,进而提高了模拟对话内容的准确率。
综上所述,本实施例所述的基于人工智能的对话模拟方法,通过基于所述对话场景类型确定目标问答树及对应的第一问询节点,通过基于所述对话场景类型确定目标问答树,确定的目标问答树更加具有针对性和合理性,进而提高了后续的模拟对话准确率和效率。通过对所述语义答复进行语义转换,得到第二目标答案,使得模拟对话内容更加的直观,可读性强。判断所述第二目标答案是否满足所述模拟用户的约束要求,在构建用户画像时增加约束条件,用以维持模拟用户在局部对话中的上下文一致性,使得模拟的对话内容更加真实,提高了模拟对话内容的准确率。
此外,对获取的最终对话内容并进行分析,基于所述分析结果重新训练所述话术管理模型,得到目标话术管理模型,利用模拟对话内容训练话术管理模型,提高了话术管理模型的鲁棒性,同时无需去线上收集用户的真实对话信息,提高了话术管理模型的更新迭代速率,进而提高了模拟对话内容的准确率。
实施例三
图4是本发明实施例三提供的基于人工智能的对话模拟装置的结构图。
在一些实施例中,所述基于人工智能的对话模拟装置20可以包括多个由程序代码段所组成的功能模块。所述基于人工智能的对话模拟装置20中的各个程序段的程序代码可以存储于电子设备的存储器中,并由所述至少一个处理器所执行,以执行(详见图1至图3描述)对话模拟的功能。
本实施例中,所述基于人工智能的对话模拟装置20根据其所执行的功能,可以被划分为多个功能模块。所述功能模块可以包括:获取模块201、确定模块202、模拟对话模块203、发送模块204、输出模块205、语义转换模块206、判断模块207及分析模块208。本发明所称的模块是指一种能够被至少一个处理器所执行并且能够完成固定功能的一系列计算机可读指令段,其存储在存储器中。在本实施例中,关于各模块的功能将在后续的实施例中详述。
获取模块201,用于响应于接收的对话模拟请求,获取模拟用户和对话场景类型。
本实施例中,现有的智能对话的话术管理模型在各个行业都有很多应用,例如,应用于医疗数字、催收场景、客户需求调查场景等,都需要开发一个任务型对话管理器,由于真实用户的交互数据的采集费时费力,无法支持模型的快速迭代,通过构建一个用户模拟器与对话管理器进行交互,产生大量的交互数据。
本实施例中,对话模拟请求是指用户请求用户模拟器与对话管理器进行模拟对话,在电子设备接收到对话模拟请求时,解析所述对话模拟请求,获取对话模拟报文,从所述对话模拟报文中获取模拟用户和对话场景类型。
确定模块202,用于基于所述对话场景类型确定目标问答树及对应的第一问询节点。
本实施例中,目标问答树中包含有模拟对话的各个节点,可以根据目标问答树的其中一个节点确定下一个节点。
在一个可选的实施例中,所述确定模块202基于所述对话场景类型确定目标问答树及对应的第一问询节点包括:
当所述对话场景类型为预设场景时,从预设的数据库中匹配出与所述预设场景关联的每个子场景的问答树;按照预设的话术顺序,对所述预设场景关联的所有子场景的多个问答树进行关联,将关联后的问答树确定为目标问答树,并将所述目标问答树中的第一个问答树的第一个节点确定为所述目标问答树的第一问询节点;或者
当所述对话场景类型为预设场景的子场景时,从所述预设的数据库中匹配出所述子场景的问答树,将所述问答树确定为目标问答树,并将所述目标问答树的第一个节点确地为所述目标问答树的第一个问询节点。
本实施例中,所述对话场景类型包含预设场景和预设场景的子场景,具体地,所述预设场景中包含有至少一个子场景,例如,预设场景为医疗数字,预设场景对应的子场景有就诊场景、复诊场景、买药场景等。
本实施例中,预设场景的目标问答树由多个子场景的问答树拼接而成,故一个目标问答树中包含有至少一个问答树。
本实施例中,通过基于所述对话场景类型确定目标问答树,确定的目标问答树更加具有针对性和合理性,进而提高了后续的模拟对话准确率和效率。
模拟对话模块203,用于对所述目标问答树进行至少一轮迭代模拟对话,直至获得最终对话内容。
本实施例中,所述最终对话内容是指针对所述对话模拟请求进行的完整的模拟对话内容。
具体地,所述至少一轮迭代模拟对话中的任意一轮模板对话具体包括以下步骤,如图3所示。
发送模块204,用于将所述第一问询节点的第一问题发送至话术管理模型中。
本实施例中,在所述对话管理器与所述用户模拟器进行模拟对话过程中,本实施例中,所述用户模拟器和所述对话管理器的接口在逻辑上都是:输入外部请求-内部处理该请求-输出对外部的响应。
本实施例中,所述控制器维护所述用户模拟器中创建的所有角色的模拟用户,通过FST(Finite State Transducer,有限状态转换器)跟踪和处理对话流程节点,具体地,FST是一种词典索引数据结构,用以快速定位每个问询节点的位置。
本实施例中,所述对话管理器接收所述用户模拟器中的控制器发送的第一问题,及将所述第一问题发送至话术管理模型中。
具体地,所述话术管理模型的训练过程包括:
获取所述模拟用户及所述对话场景类型对应的历史对话语料集,其中,所述历史对话语料中包含有问题集及每个问题的答案;
将所述历史对话语料集作为样本数据集;
将所述样本数据集输入预设神经网络中进行训练,得到话术管理模型。
本实施例中,通过将第一问题输入至话术管理模型中,所述话术管理模型可以输出对应的目标答案。
本实施例中,通过在所述用户模拟器中增加控制器进行消息转换和转发,让对话流程自动进行下去,进而模拟出完整的对话内容,提高了获取的模拟对话内容的完整性。
输出模块205,用于接收所述话术管理模型输出的第一问题的第一目标答案。
本实施例中,当话术管理模型输出第一问题的第一目标答案时,所述控制器接收所述第一目标答案。
所述确定模块205,还用于基于所述第一目标答案确定第二问询节点。
本实施例中,在控制器接收到第一目标答案时,基于所述第一目标答案遍历所述目标问答树,确定第二问询节点。
所述发送模块204,还用于将所述第二问询节点的第二问题发送至所述模拟用户对应的语义识别模型中。
本实施例中,当所述控制器确定了第二问询节点时,将所述第二问询节点的第二问题发送至所述模拟用户对应的语义识别模型中。
具体地,所述语义识别模型的训练过程包括:
获取所述模拟用户及所述对话场景类型对应的历史对话语料集,其中,所述历史对话语料中包含有问题集及每个问题的语义答复;
提取每个问题的第一语义特征集,及提取每个问题的语义答复的第二语义特征集;
将所述第一语义特征集和所述第二语义特征集作为样本数据集;
将所述样本数据集输入预设神经网络中进行训练,得到语义识别模型。
本实施例中,所述语义识别模型输出的为语义答复。
语义转换模块206,用于接收所述语义识别模型响应于所述第二问题输出的语义答复,并对所述语义答复进行语义转换,得到第二目标答案。
本实施例中的,语义识别模型是基于每个角色的多个模拟用户的历史对话语料训练得到的,具体地训练过程,在此不做详述。
本实施例中,不同角色的模拟用户对应有语义识别模型,在控制器接收到第二问题时,确定所述模拟用户的语义识别模型,将所述第二问题输入至所述模拟用户对应的语义识别模型中,输出语义答复。
在一个可选的实施例中,在语义转换模块206接收所述语义识别模型响应于所述第二问题输出的语义答复之前,所述方法还包括:
解析所述对话模拟要求,获取模拟用户的配置信息;
基于所述配置信息为所述模拟用户构建用户画像。
本实施例中,配置信息中包含多个概率,每个概率用于表征模拟用户在对话流程中生成问题答复的偏好度。
本实施例中,通过在配置信息中设定合理的概率值,并基于所述配置信息为所述模拟用户构建用户画像,后续经过大量对话的模拟,使得用户画像能够比较完整的覆盖整个对话流程。
本实施例中,在构建用户画像的过程中,还会在配置信息中增加一些约束条件,用以维持模拟用户在局部对话中的上下文一致性,使得模拟的对话内容更加真实,提高了模拟对话内容的准确率。
具体地,约束条件可以为模拟用户针对当前问题已经进行过答复,例如:当前问题为:你去A区使用了什么交通工具?在回答当前问题之前,用户已经表明自己做高铁去的A区,确定模拟用户针对当前问题已经进行过答复;或者,约束条件也可以模拟用户未针对当前问题进行正确答复,例如,当前问题为:你去A区使用了什么交通工具?模拟用户作为的答复为:今天天气很好,确定模拟用户未针对当前问题进行正确答复。
本实施例中,通过在用户画像中设置约束条件,可以使得模拟用户对话更加的真实,提高了模拟对话内容的准确率。
在一个可选的实施例中,所述语义转换模块206对所述语义答复进行语义转换,得到第二目标***括:
判断所述语义答复的类别;
当所述语义答复为键值对类别时,将所述键值对作为第二目标答案;或者
当所述语义答复为语义类别时,对所述语义答复进行文本转换,得到第二目标答案;或者
当所述语义答复包含键值对类别的第一语义答复和语义类别的第二语义答复时,将所述第一语义答复作为第一文本,及对所述第二语义答复进行文本转换,得到第二文本;将所述第一文本和所述第二文本进行拼接,得到第二目标答案。
本实施例中,语义答复的类别包括以下一种或者多种方式组合:键值对类别;语义类别,具体地,针对键值对类别,直接将键值对作为生成的文本;针对语义类别,进行文本转换,得到第二目标答案。
进一步地,所述对所述语义答复进行文本转换,得到第二目标***括:
根据所述目标问答树,确定所述语义答复的意图和实体;
根据所述意图和实体,从预设的数据库中遍历出与所述意图和实体匹配的句子模板;
将所述意图和实体分别映射至对应的句子模板中,得到第二目标答案。
本实施例中,当第二目标答案考虑语义时,从所述目标问答树中确定所述第二问题的节点,从所述目标问答树的第二问题的节点获取预先设置的意图和实体,将所述意图和实体作为所述语义答复的意图和实体,并从预设的数据库中匹配出所述意图和实体对应的句子模板,例如,意图为:去A银行;实体为:M公交,对应的句子模板为:乘坐XXX去XXX银行;将所述意图和实体映射至所述句子模板得到第二目标答案为:乘坐M公交去A银行。
本实施例中,由于语义表示不便于用户观看,故将语义答复转换为文本,即第二目标答案,使得模拟对话内容更加的直观,可读性强,同时后续采用所述第二目标答案进行模拟对话分析,提高了模拟对话分析的准确率。
判断模块207,用于判断所述第二目标答案是否满足所述模拟用户的约束要求。
本实施例中,可以预先为模拟用户设置约束条件,具体地,所述约束条件设置在模拟用户的用户画像中。
在一个可选的实施例中,所述判断模块207判断所述第二目标答案是否满足所述模拟用户的约束要求包括:
识别所述第二目标答案是否与模拟用户的用户画像匹配识别所述第二目标答案是否与所述模拟用户的用户画像匹配;
当所述第二目标答案与所述模拟用户的用户画像完全匹配时,确定所述第二目标答案满足模拟用户的约束要求;或者
当所述第二目标答案与所述模拟用户的用户画像不完全匹配时,确定所述第二目标答案不满足所述模拟用户的约束要求。
本实施例中,通过判断所述第二目标答案是否与所述模拟用户的用户画像是否匹配,可以确定所述模拟对话流程能否进行下去。
所述确定模块202,还用于当所述第二目标答案满足所述模拟用户的约束条件时,基于所述第二目标答案确定第三问询节点,从所述第三问询节点开始进行下一轮迭代模拟对话。
本实施例中,在所述第二目标答案满足所述模拟用户的约束条件时,确定继续所述模拟对话流程。
所述获取模块201,还用于当所述第二目标答案不满足所述模拟用户的约束要求时,获取最终对话内容。
本实施例中,所述最终对话内容是指针对该次对话模拟请求所进行的完整对话内容,所述最终对话内容中包括每轮模拟对话的目标问题,及所述目标问题对应的目标答案,例如,第一问题及所述第一问题的第一目标答案、第二问题及所述第二问题的第二目标答案。
具体地,在所述第二目标答案不满足所述模拟用户的约束条件时,确定所述模拟对话流程无法继续下去,直接结束所述模拟对话流程,获取已经完成的模拟对话内容,作为最终对话内容。
进一步地,在所述获取最终对话内容之后,分析模块208,用于对所述最终对话内容进行分析,得到分析结果。
本实施例中,在得到最终对话内容时,需要对最终对话内容进行分析,例如,可以将所述最终对话内容转换为特定格式的日志或者报告,便于后期进一步对所述最终对话内容进行分析。
具体地,所述分析模块208对所述最终对话内容进行分析,得到分析结果包括:
获取所述对话场景类型的初始模板和预设模板;
将所述最终对话内容映射至所述初始模板中,得到目标模板;
将所述目标模板与所述预设模板进行匹配;
从匹配结果中查询出失败信息;
统计所述最终对话内容的对话轮数;
计算所述最终对话内容占所述对话场景类型对应的目标对话内容的覆盖率;
将所述失败信息、所述对话轮数及所述覆盖率确定为所述最终对话内容的分析结果。
本实施例中,初始模板用于表征对话场景类型的空白模板,所述预设模板用以表征基于对话场景类型的预设的对话内容生成的模板,目标对话内容是指对话场景类型对应的预设的对话内容。
本实施例中,在对所述最终对话内容进行分析时,可以通过计算的对话轮数、最终对话内容占目标对话内容的覆盖率及定位出的失败信息,评估该次的模板对话的质量,其中,所述失败信息包括对话内容识别码和失败的对话内容。
进一步地,根据所述分析结果,确定所述最终对话内容是否满足样本要求;当所述最终对话内容满足所述样本要求时,将所述最终对话内容作为训练样本;基于所述训练样本重新训练所述话术管理模型,得到目标话术管理模型。
本实施例中,所述样本要求可以为所述分析结果中的覆盖率大于或者等于预设的覆盖率阈值,也可以为所述分析结果中的对话轮数大于或者等于预设的对话轮数阈值。样本要求可以根据实际场景进行设置,在此不做限制。
本实施例中,在所述最终对话内容满足样本要求时,可以将所述最终对话内容作为训练样本进行话术管理模型的训练,通过不断的模拟对话内容,将模拟的模拟对话内容作为训练样本不断的训练话术管理模型,提高了话术管理模型的鲁棒性,同时无需去线上收集用户的真实对话信息,提高了话术管理模型的更新迭代速率,进而提高了模拟对话内容的准确率。
综上所述,本实施例所述的基于人工智能的对话模拟装置,通过基于所述对话场景类型确定目标问答树及对应的第一问询节点,通过基于所述对话场景类型确定目标问答树,确定的目标问答树更加具有针对性和合理性,进而提高了后续的模拟对话准确率和效率。通过对所述语义答复进行语义转换,得到第二目标答案,使得模拟对话内容更加的直观,可读性强。判断所述第二目标答案是否满足所述模拟用户的约束要求,在构建用户画像时增加约束条件,用以维持模拟用户在局部对话中的上下文一致性,使得模拟的对话内容更加真实,提高了模拟对话内容的准确率。
此外,对获取的最终对话内容并进行分析,基于所述分析结果重新训练所述话术管理模型,得到目标话术管理模型,利用模拟对话内容训练话术管理模型,提高了话术管理模型的鲁棒性,同时无需去线上收集用户的真实对话信息,提高了话术管理模型的更新迭代速率,进而提高了模拟对话内容的准确率。
实施例四
参阅图5所示,为本发明实施例四提供的电子设备的结构示意图。在本发明较佳实施例中,所述电子设备3包括存储器31、至少一个处理器32、至少一条通信总线33及收发器34。
本领域技术人员应该了解,图5示出的电子设备的结构并不构成本发明实施例的限定,既可以是总线型结构,也可以是星形结构,所述电子设备3还可以包括比图示更多或更少的其他硬件或者软件,或者不同的部件布置。
在一些实施例中,所述电子设备3是一种能够按照事先设定或存储的指令,自动进行数值计算和/或信息处理的电子设备,其硬件包括但不限于微处理器、专用集成电路、可编程门阵列、数字处理器及嵌入式设备等。所述电子设备3还可包括客户设备,所述客户设备包括但不限于任何一种可与客户通过键盘、鼠标、遥控器、触摸板或声控设备等方式进行人机交互的电子产品,例如,个人计算机、平板电脑、智能手机、数码相机等。
需要说明的是,所述电子设备3仅为举例,其他现有的或今后可能出现的电子产品如可适应于本发明,也应包含在本发明的保护范围以内,并以引用方式包含于此。
在一些实施例中,所述存储器31用于存储程序代码和各种数据,例如安装在所述电子设备3中的基于人工智能的对话模拟装置20,并在电子设备3的运行过程中实现高速、自动地完成程序或数据的存取。所述存储器31包括只读存储器(Read-Only Memory,ROM)、可编程只读存储器(Programmable Read-Only Memory,PROM)、可擦除可编程只读存储器(Erasable Programmable Read-Only Memory,EPROM)、一次可编程只读存储器(One-timeProgrammable Read-Only Memory,OTPROM)、电子擦除式可复写只读存储器(Electrically-Erasable Programmable Read-Only Memory,EEPROM)、只读光盘(CompactDisc Read-Only Memory,CD-ROM)或其他光盘存储器、磁盘存储器、磁带存储器、或者能够用于携带或存储数据的计算机可读的任何其他介质。
在一些实施例中,所述至少一个处理器32可以由集成电路组成,例如可以由单个封装的集成电路所组成,也可以是由多个相同功能或不同功能封装的集成电路所组成,包括一个或者多个中央处理器(Central Processing unit,CPU)、微处理器、数字处理芯片、图形处理器及各种控制芯片的组合等。所述至少一个处理器32是所述电子设备3的控制核心(Control Unit),利用各种接口和线路连接整个电子设备3的各个部件,通过运行或执行存储在所述存储器31内的程序或者模块,以及调用存储在所述存储器31内的数据,以执行电子设备3的各种功能和处理数据。
在一些实施例中,所述至少一条通信总线33被设置为实现所述存储器31以及所述至少一个处理器32等之间的连接通信。
尽管未示出,所述电子设备3还可以包括给各个部件供电的电源(比如电池),可选的,电源可以通过电源管理装置与所述至少一个处理器32逻辑相连,从而通过电源管理装置实现管理充电、放电、以及功耗管理等功能。电源还可以包括一个或一个以上的直流或交流电源、再充电装置、电源故障检测电路、电源转换器或者逆变器、电源状态指示器等任意组件。所述电子设备3还可以包括多种传感器、蓝牙模块、Wi-Fi模块等,在此不再赘述。
应该了解,所述实施例仅为说明之用,在专利申请范围上并不受此结构的限制。
上述以软件功能模块的形式实现的集成的单元,可以存储在一个计算机可读取存储介质中。上述软件功能模块存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机,电子设备,或者网络设备等)或处理器(processor)执行本发明各个实施例所述方法的部分。
在进一步的实施例中,结合图4,所述至少一个处理器32可执行所述电子设备3的操作装置以及安装的各类应用程序(如所述的基于人工智能的对话模拟装置20)、程序代码等,例如,上述的各个模块。
所述存储器31中存储有程序代码,且所述至少一个处理器32可调用所述存储器31中存储的程序代码以执行相关的功能。例如,图4中所述的各个模块是存储在所述存储器31中的程序代码,并由所述至少一个处理器32所执行,从而实现所述各个模块的功能以达到对话模拟的目的。
示例性的,所述程序代码可以被分割成一个或多个模块/单元,所述一个或者多个模块/单元被存储在所述存储器31中,并由所述处理器32执行,以完成本申请。所述一个或多个模块/单元可以是能够完成特定功能的一系列计算机可读指令段,该指令段用于描述所述程序代码在所述电子设备3中的执行过程。例如,所述程序代码可以被分割成获取模块201、确定模块202、模拟对话模块203、发送模块204、输出模块205、语义转换模块206、判断模块207及分析模块208。
在本发明的一个实施例中,所述存储器31存储多个计算机可读指令,所述多个计算机可读指令被所述至少一个处理器32所执行以实现对话模拟的功能。
具体地,所述至少一个处理器32对上述指令的具体实现方法可参考图1至图3对应实施例中相关步骤的描述,在此不赘述。
在本发明所提供的几个实施例中,应该理解到,所揭露的装置和方法,可以通过其它的方式实现。例如,以上所描述的装置实施例仅仅是示意性的,例如,所述模块的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式。
所述作为分离部件说明的模块可以是或者也可以不是物理上分开的,作为模块显示的部件可以是或者也可以不是物理单元,既可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部模块来实现本实施例方案的目的。
另外,在本发明各个实施例中的各功能模块可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中。上述集成的单元既可以采用硬件的形式实现,也可以采用硬件加软件功能模块的形式实现。
对于本领域技术人员而言,显然本发明不限于上述示范性实施例的细节,而且在不背离本发明的精神或基本特征的情况下,能够以其他的具体形式实现本发明。因此,无论从哪一点来看,均应将实施例看作是示范性的,而且是非限制性的,本发明的范围由所附权利要求而不是上述说明限定,因此旨在将落在权利要求的等同要件的含义和范围内的所有变化涵括在本发明内。不应将权利要求中的任何附图标记视为限制所涉及的权利要求。此外,显然“包括”一词不排除其他单元或,单数不排除复数。本发明中陈述的多个单元或装置也可以由一个单元或装置通过软件或者硬件来实现。第一,第二等词语用来表示名称,而并不表示任何特定的顺序。
最后应说明的是,以上实施例仅用以说明本发明的技术方案而非限制,尽管参照较佳实施例对本发明进行了详细说明,本领域的普通技术人员应当理解,可以对本发明的技术方案进行修改或等同替换,而不脱离本发明技术方案的精神和范围。
Claims (10)
1.一种基于人工智能的对话模拟方法,其特征在于,所述方法包括:
响应于接收的对话模拟请求,获取模拟用户和对话场景类型;
基于所述对话场景类型确定目标问答树及对应的第一问询节点;
对所述目标问答树进行至少一轮迭代模拟对话,直至获得最终对话内容,其中,所述至少一轮迭代模拟对话中的任意一轮模板对话包括:
将所述第一问询节点的第一问题发送至话术管理模型中;
接收所述话术管理模型输出的第一问题的第一目标答案;
基于所述第一目标答案确定第二问询节点;
将所述第二问询节点的第二问题发送至所述模拟用户对应的语义识别模型中;
接收所述语义识别模型输出的语义答复,并对所述语义答复进行语义转换,得到第二目标答案;
判断所述第二目标答案是否满足所述模拟用户的约束要求;
当所述第二目标答案满足所述模拟用户的约束条件时,基于所述第二目标答案确定第三问询节点,从所述第三问询节点开始进行下一轮迭代模拟对话;或者
当所述第二目标答案不满足所述模拟用户的约束要求时,获取最终对话内容。
2.如权利要求1所述的基于人工智能的对话模拟方法,其特征在于,所述基于所述对话场景类型确定目标问答树及对应的第一问询节点包括:
当所述对话场景类型为预设场景时,从预设的数据库中匹配出与所述预设场景关联的每个子场景的问答树;按照预设的话术顺序,对所述预设场景关联的所有子场景的多个问答树进行关联,将关联后的问答树确定为目标问答树,并将所述目标问答树中的第一个问答树的第一个节点确定为所述目标问答树的第一问询节点;或者
当所述对话场景类型为预设场景的子场景时,从所述预设的数据库中匹配出所述子场景的问答树,将所述问答树确定为目标问答树,并将所述目标问答树的第一个节点确地为所述目标问答树的第一个问询节点。
3.如权利要求1所述的基于人工智能的对话模拟方法,其特征在于,所述判断所述第二目标答案是否满足所述模拟用户的约束要求包括:
识别所述第二目标答案是否与所述模拟用户的用户画像匹配;
当所述第二目标答案与所述模拟用户的用户画像完全匹配时,确定所述第二目标答案满足模拟用户的约束要求;或者
当所述第二目标答案与所述模拟用户的用户画像不完全匹配时,确定所述第二目标答案不满足所述模拟用户的约束要求。
4.如权利要求1所述的基于人工智能的对话模拟方法,其特征在于,所述对所述语义答复进行语义转换,得到第二目标***括:
判断所述语义答复的类别;
当所述语义答复为键值对类别时,将所述键值对作为第二目标答案;或者
当所述语义答复为语义类别时,对所述语义答复进行文本转换,得到第二目标答案;或者
当所述语义答复包含键值对类别的第一语义答复和语义类别的第二语义答复时,将所述第一语义答复作为第一文本,及对所述第二语义答复进行文本转换,得到第二文本;将所述第一文本和所述第二文本进行拼接,得到第二目标答案。
5.如权利要求4所述的基于人工智能的对话模拟方法,其特征在于,所述对所述语义答复进行文本转换,得到第二目标***括:
根据所述目标问答树,确定所述语义答复的意图和实体;
根据所述意图和实体,从预设的数据库中遍历出与所述意图和实体匹配的句子模板;
将所述意图和实体分别映射至对应的句子模板中,得到第二目标答案。
6.如权利要求1所述的基于人工智能的对话模拟方法,其特征在于,在所述获取最终对话内容之后,所述方法还包括:
获取所述对话场景类型的初始模板和预设模板;
将所述最终对话内容映射至所述初始模板中,得到目标模板;
将所述目标模板与所述预设模板进行匹配;
从匹配结果中查询出失败信息;
统计所述最终对话内容的对话轮数;
计算所述最终对话内容占所述对话场景类型对应的目标对话内容的覆盖率;
将所述失败信息、所述对话轮数及所述覆盖率确定为所述最终对话内容的分析结果。
7.如权利要求6所述的基于人工智能的对话模拟方法,其特征在于,所述方法还包括:
根据所述分析结果,确定所述最终对话内容是否满足样本要求;
当所述最终对话内容满足所述样本要求时,将所述最终对话内容作为训练样本;
基于所述训练样本重新训练所述话术管理模型,得到目标话术管理模型。
8.一种基于人工智能的对话模拟装置,其特征在于,所述装置包括:
获取模块,用于响应于接收的对话模拟请求,获取模拟用户和对话场景类型;
确定模块,用于基于所述对话场景类型确定目标问答树及对应的第一问询节点;
模拟对话模块,用于对所述目标问答树进行至少一轮迭代模拟对话,直至获得最终对话内容,其中,所述至少一轮迭代模拟对话中的任意一轮模板对话包括:
发送模块,用于将所述第一问询节点的第一问题发送至话术管理模型中;
输出模块,用于接收所述话术管理模型输出的第一问题的第一目标答案;
所述确定模块,还用于基于所述第一目标答案确定第二问询节点;
所述发送模块,还用于将所述第二问询节点的第二问题发送至所述模拟用户对应的语义识别模型中;
语义转换模块,还用于接收所述语义识别模型输出的语义答复,并对所述语义答复进行语义转换,得到第二目标答案;
判断模块,用于判断所述第二目标答案是否满足所述模拟用户的约束要求;
所述确定模块,还用于当所述第二目标答案满足所述模拟用户的约束条件时,基于所述第二目标答案确定第三问询节点,从所述第三问询节点开始进行下一轮迭代模拟对话;或者
所述获取模块,还用于当所述第二目标答案不满足所述模拟用户的约束要求时,获取最终对话内容。
9.一种电子设备,其特征在于,所述电子设备包括处理器和存储器,所述处理器用于执行所述存储器中存储的计算机程序时实现如权利要求1至7中任意一项所述的基于人工智能的对话模拟方法。
10.一种计算机可读存储介质,所述计算机可读存储介质上存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现如权利要求1至7中任意一项所述的基于人工智能的对话模拟方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202310146134.3A CN116842143A (zh) | 2023-02-15 | 2023-02-15 | 基于人工智能的对话模拟方法、装置、电子设备及介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202310146134.3A CN116842143A (zh) | 2023-02-15 | 2023-02-15 | 基于人工智能的对话模拟方法、装置、电子设备及介质 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN116842143A true CN116842143A (zh) | 2023-10-03 |
Family
ID=88164087
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202310146134.3A Pending CN116842143A (zh) | 2023-02-15 | 2023-02-15 | 基于人工智能的对话模拟方法、装置、电子设备及介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN116842143A (zh) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN117312530A (zh) * | 2023-11-10 | 2023-12-29 | 北京百度网讯科技有限公司 | 问卷调查、模型训练方法、装置、设备、介质及产品 |
-
2023
- 2023-02-15 CN CN202310146134.3A patent/CN116842143A/zh active Pending
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN117312530A (zh) * | 2023-11-10 | 2023-12-29 | 北京百度网讯科技有限公司 | 问卷调查、模型训练方法、装置、设备、介质及产品 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN111125309A (zh) | 自然语言处理方法、装置及计算设备、存储介质 | |
CN109033068A (zh) | 基于注意力机制的用于阅读理解的方法、装置和电子设备 | |
CN110807566A (zh) | 人工智能模型评测方法、装置、设备及存储介质 | |
CN109101624A (zh) | 对话处理方法、装置、电子设备及存储介质 | |
US20220358292A1 (en) | Method and apparatus for recognizing entity, electronic device and storage medium | |
WO2020073533A1 (zh) | 自动问答方法及装置 | |
CN116737908A (zh) | 知识问答方法、装置、设备和存储介质 | |
CN111737432A (zh) | 一种基于联合训练模型的自动对话方法和*** | |
CN113435582B (zh) | 基于句向量预训练模型的文本处理方法及相关设备 | |
CN113486203B (zh) | 基于问答平台的数据处理方法、装置及相关设备 | |
CN112685550B (zh) | 智能问答方法、装置、服务器及计算机可读存储介质 | |
CN113807973B (zh) | 文本纠错方法、装置、电子设备及计算机可读存储介质 | |
CN113705191A (zh) | 样本语句的生成方法、装置、设备及存储介质 | |
CN112949758A (zh) | 应答模型的训练方法、应答方法、装置、设备及存储介质 | |
US20230013796A1 (en) | Method and apparatus for acquiring pre-trained model, electronic device and storage medium | |
CN114461777A (zh) | 智能问答方法、装置、设备及存储介质 | |
CN115803734A (zh) | 使用动作解释的自然语言丰富 | |
CN116842143A (zh) | 基于人工智能的对话模拟方法、装置、电子设备及介质 | |
CN117473057A (zh) | 问答处理方法、***、设备和存储介质 | |
CN113486659A (zh) | 文本匹配方法、装置、计算机设备及存储介质 | |
CN110263346B (zh) | 基于小样本学习的语意分析方法、电子设备及存储介质 | |
CN117332054A (zh) | 表格问答处理方法、装置及设备 | |
CN116956934A (zh) | 任务处理方法、装置、设备及存储介质 | |
CN116303945A (zh) | 视觉问答模型的样本生成方法及相关设备 | |
CN115098665A (zh) | 一种对话数据扩展方法、装置及设备 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |