CN113468297B - 一种对话数据处理方法、装置、电子设备及存储设备 - Google Patents

一种对话数据处理方法、装置、电子设备及存储设备 Download PDF

Info

Publication number
CN113468297B
CN113468297B CN202010236572.5A CN202010236572A CN113468297B CN 113468297 B CN113468297 B CN 113468297B CN 202010236572 A CN202010236572 A CN 202010236572A CN 113468297 B CN113468297 B CN 113468297B
Authority
CN
China
Prior art keywords
dialogue data
data
analyzed
dialogue
target
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202010236572.5A
Other languages
English (en)
Other versions
CN113468297A (zh
Inventor
姜剑
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Alibaba Group Holding Ltd
Original Assignee
Alibaba Group Holding Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Alibaba Group Holding Ltd filed Critical Alibaba Group Holding Ltd
Priority to CN202010236572.5A priority Critical patent/CN113468297B/zh
Publication of CN113468297A publication Critical patent/CN113468297A/zh
Application granted granted Critical
Publication of CN113468297B publication Critical patent/CN113468297B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/33Querying
    • G06F16/332Query formulation
    • G06F16/3329Natural language query formulation or dialogue systems
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/33Querying
    • G06F16/3331Query processing
    • G06F16/334Query execution
    • G06F16/3344Query execution using natural language analysis

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Artificial Intelligence (AREA)
  • Mathematical Physics (AREA)
  • Computational Linguistics (AREA)
  • Data Mining & Analysis (AREA)
  • Databases & Information Systems (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Human Computer Interaction (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本申请公开了一种对话数据处理方法,包括:获取待分析对话数据,以及获取与所述待分析对话数据对应的关联对话数据,其中,所述关联对话数据与所述待分析对话数据之间满足预设的相关性条件;根据所述待分析对话数据和所述关联对话数据,获得与所述待分析对话数据对应的目标内容特征信息和目标关联特征信息;根据所述目标内容特征信息和所述目标关联特征信息,确定所述待分析对话数据是否用于咨询问题。所述方法可以方便、准确的获得用于咨询问题的对话数据。

Description

一种对话数据处理方法、装置、电子设备及存储设备
技术领域
本申请涉及计算机技术领域,具体涉及对话数据处理方法、装置及电子设备。本申请还涉及一种问题决策模型的获得方法、装置及电子设备。本申请还涉及一种数据推送方法、装置及电子设备。本申请还涉及一种数据展示方法、装置及电子设备。
背景技术
随着互联网技术的不断发展,通过客服与客户进行在线对话,尤其是通过多用户对话群组进行多客服、多客户的在线对话,以解决客户在使用企业产品或享用企业服务时可能遇到的问题,可以为企业和客户带来极大的便利。
目前在判断对话数据中是否为用于咨询产品使用问题或产品改善问题等问题的对话数据时,一种常用的方法是在客户与企业客服对话的过程中,由企业客服通过人工确定对话数据是否与问题相关,若与问题相关,则进行回答或生产成本任务单由后台技术人员解决;当然,目前也存在通过预先根据相应关键字训练获得的识别模型,识别客户与企业客户的对话数据中的相关关键字,将包含对应关键字的对话数据作为可能存在问题的对话数据,并提供给客服人员,由客服人员确认,其中,训练识别模型所使用的关键字一般是包含“请问”、“如何”等词语的关键字或正则表达式。
根据上述描述可知,目前从客户与企业客服咨询问题的原始对话数据中,获得咨询问题的对话数据的方法,一种常用的方法是需要人工参与,即需要客服时刻关注对话数据,这样比较费时费力,不够方便,尤其是当对话是发生在多用户对话群组中时,由于同一时间可能存在多个不同客户的对话问题,这将使的客服判断对话数据是否用于咨询业务的难度大大增加;另外,目前还被广泛使用的一种方法是根据关键字识别对话数据是否用于咨询问题,但是,如果客户在咨询问题时并没有使用相关关键字,则不能准确的获得用于咨询问题的对话数据。由此可知,现有技术在从原始对话数据中获取用于咨询问题的对话数据时,存在不够方便、准确的问题。
发明内容
本申请实施例提供一种对话数据处理方法,以解决现有技术在从原始对话数据中获取用于咨询问题的对话数据时,存在的不够方便、准确的问题。
本申请实施例提供一种对话数据处理方法,包括:
获取待分析对话数据,以及获取与所述待分析对话数据对应的关联对话数据,其中,所述关联对话数据与所述待分析对话数据之间满足预设的相关性条件;根据所述待分析对话数据和所述关联对话数据,获得与所述待分析对话数据对应的目标内容特征信息和目标关联特征信息;根据所述目标内容特征信息和所述目标关联特征信息,确定所述待分析对话数据是否用于咨询问题。
可选的,还包括:获取原始对话数据;所述获取待分析对话数据,以及获取与所述待分析对话数据对应的关联对话数据,包括:从所述原始对话数据中,获取所述待分析对话数据,以及获取与所述待分析对话数据对应的关联对话数据。
可选的,所述从所述原始对话数据中,获取所述待分析对话数据,以及获取与所述待分析对话数据对应的关联对话数据,包括:
从所述原始对话数据中,获取所述待分析对话数据,以及获取与所述待分析对话数据对应的第一关联对话数据,其中,所述待分析对话数据在所述原始对话数据中的位置与所述第一关联对话数据的位置相邻,并且,所述待分析对话数据对应的时间信息晚于所述第一关联对话数据对应的时间信息。
可选的,所述与所述待分析对话数据对应的目标内容特征信息通过以下方法获得:
将所述待分析对话数据输入到第一识别模型中,获取与所述待分析对话数据对应的第一内容特征信息,其中,所述第一识别模型用于识别所述待分析对话数据是否用于咨询第一问题;
将所述第一关联对话数据输入到第二识别模型中,获取与所述第二对话数据对应的第二内容特征信息,其中,所述第二识别模型用于识别所述第一关联对话数据是否为用于结束用于咨询第二问题对应的对话的对话数据;
根据所述第一内容特征信息和所述第二内容特征信息,获得所述目标内容特征信息。
可选的,所述与所述待分析对话数据对应的目标关联特征信息通过以下方法获得:
获取所述待分析对话数据的发言人所对应的第一用户类型;
判断所述待分析对话数据的发言人与所述第一关联对话数据的发言人是否相同,获得第一判断结果;
获取所述待分析对话数据与第一关联对话数据所述待分析对话数据之间的时间间隔,作为第一时间间隔数据;
根据所述第一用户类型、所述第一判断结果以及所述第一时间间隔数据,获得所述目标关联特征信息。
可选的,所述根据所述目标内容特征信息和所述目标关联特征信息,确定所述待分析对话数据是否用于咨询问题,包括:
将所述目标内容特征信息和所述目标关联特征信息输入到问题决策模型中,获得目标决策结果,其中,所述问题决策模型用于根据获得到的所述目标内容特征信息和所述目标关联特征信息,确定所述待分析对话数据是否用于咨询问题,所述目标决策结果用于标识所述待分析对话数据是否用于咨询问题。
可选的,所述从所述原始对话数据中,获取所述待分析对话数据,以及获取与所述待分析对话数据对应的关联对话数据,还包括:
从所述原始对话数据中,获取与所述待分析对话数据对应的第二关联对话数据,其中,所述待分析对话数据与所述第二关联对话数据之间间隔预定数量的对话数据,并且,所述待分析对话数据对应的时间信息晚于所述关联对话数据对应的时间信息。
可选的,所述与所述待分析对话数据对应的目标内容特征信息还通过以下方法获得:
获取与所述第二关联对话数据对应的第三内容特征信息;
根据所述第一内容特征信息、所述第二内容特征信息和所述第三内容特征信息,获得所述目标内容特征信息。
可选的,所述与所述待分析对话数据对应的目标关联特征信息还通过以下方法获得:
获取所述第二关联对话数据的发言人所对应的第二用户类型;
判断所述待分析对话数据的发言人与所述第二关联对话数据的发言人是否相同,获得第二判断结果;
获取所述待分析对话数据与所述第二关联对话数据之间的时间间隔,作为第二时间间隔数据;
根据所述第一用户类型、所述第一判断结果、所述第一时间间隔数据以及所述第二用户类型、所述第二判断结果、所述第二时间间隔数据,获得所述目标关联特征信息。
可选的,还包括:如果确定所述待分析对话数据用于咨询问题,则生成与所述待分析对话数据对应的、用于针对所述问题进行处理的任务数据。
可选的,所述方法应用于服务端,所述生成与所述待分析对话数据对应的、用于针对所述问题进行处理的任务数据,包括:
将所述待分析对话数据提供给客户端;
接收客户端发送的用于生成所述任务数据的数据请求消息;
根据所述数据请求消息,生成所述任务数据。
可选的,所述方法应用于客户端,所述生成与所述待分析对话数据对应的、用于针对所述问题进行处理的任务数据,包括:
接收服务端提供的所述待分析对话数据;
根据所述待分析对话数据,生成用于生成所述任务数据的数据请求消息;
向所述服务端发送所述数据请求消息。
可选的,所述问题决策模型通过以下方法获得:
从历史对话数据中,获取用于咨询问题的相关对话数据作为正样本对话数据,以及,获取不是用于咨询问题的相关对话数据作为负样本对话数据,其中,所述正样本对话数据中以及所述负样本对话数据中的对话数据之间满足所述预设的相关性条件;
使用所述正样本对话数据和所述负样本数据作为样本数据,训练获得所述问题决策模型;
其中,所述样本数据中包括待分析样本对话数据和与所述待分析样本数据之间满足所述预设的相关性条件的关联对话数据,所述问题决策模型用于根据输入的、与所述待分析样本对话数据对应的样本内容特征信息和样本关联特征信息,确定所述待分析样本对话数据是否用于咨询问题。
可选的,所述根据所述第一内容特征信息和所述第二内容特征信息,获得所述目标内容特征信息,包括:
根据所述待分析对话数据,获取第一符号标识信息和第二符号标识信息,其中,所述第一符号标识信息用于标识所述待分析对话数据中是否存在感叹号,所述第二符号标识信息用于标识所述待分析对话数据中是否存在问号;
根据所述第一关联对话数据,获取第三符号标识信息和第四符号标识信息,其中,所述第三符号标识信息用于标识所述第一关联对话数据中是否存在感叹号,所述第四符号标识信息用于标识所述第一关联对话数据中是否存在问号;
根据所述第一内容特征信息、所述第二内容特征信息、所述第一符号标识信息、第二符号标识信息、第三符号标识信息和所述第四符号标识信息,获得所述目标内容特征信息。
可选的,所述第一内容特征信息包括:第一结果标识信息,第一分值信息,其中,所述第一结果标识信息用于标识所述待分析对话数据是否与所述第一问题对应,所述第一分值信息用于表示所述第一结果标识信息的正确程度;
所述第二内容特征信息包括:第二结果标识信息,第二分值信息,其中,所述第二结果标识信息用于标识所述第一关联对话数据是否为用于结束与所述第二问题对应的对话的对话数据,所述第二分值信息用于表示所述第二结果标识信息的正确程度。
可选的,所述获取与所述第二关联对话数据对应的第三内容特征信息,包括:
根据所述第二关联对话数据,获取第五符号标识信息和第六符号标识信息,其中,所述第五符号标识信息用于标识所述第二关联对话数据中是否存在感叹号,所述第六符号标识信息用于标识所述第二关联对话数据中是否存在问号;
根据所述第五符号标识信息和第六符号标识信息,获得所述第三内容特征信息。
可选的,所述原始对话数据包括文本数据、音频数据以及视频数据。
本申请实施例还提供另一种对话数据处理方法,包括:
从用于为用户提供目标产品咨询服务的多用户对话群组中,获取原始对话数据;
从所述原始对话数据中,获取当前对话数据作为待分析对话数据,以及获取与所述待分析对话数据对应的关联对话数据,其中,所述关联对话数据与所述待分析对话数据之间满足预设的相关性条件;
根据所述待分析对话数据和所述关联对话数据,获得与所述待分析对话数据对应的目标内容特征信息和目标关联特征信息;
根据所述目标内容特征信息和所述目标关联特征信息,确定所述待分析对话数据是否为用于咨询所述目标产品的使用问题的对话数据。
本申请实施例还提供一种问题决策模型的获得方法,包括:
从历史对话数据中,获取用于咨询问题的相关对话数据作为正样本对话数据,以及,获取不是用于咨询问题的相关对话数据作为负样本对话数据,其中,所述正样本对话数据中以及所述负样本对话数据中的对话数据之间满足所述预设的相关性条件;
使用所述正样本对话数据和所述负样本数据作为样本数据,训练获得问题决策模型;
其中,所述样本数据中包括待分析样本对话数据和与所述待分析样本数据之间满足所述预设的相关性条件的关联对话数据,所述问题决策模型用于根据输入的、与所述待分析样本对话数据对应的样本内容特征信息和样本关联特征信息,确定所述待分析样本对话数据是否用于咨询问题。
本申请实施例还提供一种数据推送方法,应用于服务端,包括:
获取客户端发送的原始对话数据;获取与所述原始对话数据对应的目标问题清单数据,其中,所述目标问题清单数据是使用上述对话数据处理方法获得到的、包含至少一条用于咨询问题的对话数据的数据;将所述目标问题清单数据推送给所述客户端。
可选的,还包括:获取所述客户端发送的用于获得目标任务数据的数据请求消息,其中,所述目标任务数据是与所述目标问题清单数据中用于咨询问题的对话数据对应的、用于针对所述问题进行处理的数据;根据所述目标问题清单数据,生成所述目标任务数据;将所述目标任务数据推送给所述客户端。
本申请实施例还提供一种数据展示方法,应用于客户端,包括:获取原始对话数据;向服务端发送所述原始对话数据;接收所述服务端推送的与所述原始对话数据对应的目标问题清单数据,其中,所述目标问题清单数据是所述服务端使用上述对话数据处理方法获得到的、包含至少一条用于咨询问题的对话数据的数据。
可选的,还包括:向所述服务端发送用于获得目标任务数据的数据请求消息,其中,所述目标任务数据是与所述目标问题清单数据中用于咨询问题的对话数据对应的、用于针对所述问题进行处理的数据;接收所述服务端推送的所述目标任务数据;展示所述目标任务数据。
本申请实施例还提供一种对话数据处理装置,包括:
数据获取单元,用于从所述原始对话数据中,获取待分析对话数据,以及获取与所述待分析对话数据对应的关联对话数据,其中,所述关联对话数据与所述待分析对话数据之间满足预设的相关性条件;
特征信息获取单元,用于根据所述待分析对话数据和所述关联对话数据,获得与所述待分析对话数据对应的目标内容特征信息和目标关联特征信息;
确定单元,用于根据所述目标内容特征信息和所述目标关联特征信息,确定所述待分析对话数据是否用于咨询问题。
本申请实施例还提供一种电子设备,包括:
处理器;
存储器,用于存储对话数据处理方法的程序,该设备通电并通过所述处理器运行所述对话数据处理方法的程序后,执行下述步骤:
获取待分析对话数据,以及获取与所述待分析对话数据对应的关联对话数据,其中,所述关联对话数据与所述待分析对话数据之间满足预设的相关性条件;
根据所述待分析对话数据和所述关联对话数据,获得与所述待分析对话数据对应的目标内容特征信息和目标关联特征信息;
根据所述目标内容特征信息和所述目标关联特征信息,确定所述待分析对话数据是否用于咨询问题。
本申请实施例还提供另一种对话数据处理装置,包括:
原始对话数据获取单元,从用于为用户提供目标产品咨询服务的多用户对话群组中,获取原始对话数据;
数据获取单元,从所述原始对话数据中,获取当前对话数据作为待分析对话数据,以及获取与所述待分析对话数据对应的关联对话数据,其中,所述关联对话数据与所述待分析对话数据之间满足预设的相关性条件;
特征信息获取单元,用于根据所述待分析对话数据和所述关联对话数据,获得与所述待分析对话数据对应的目标内容特征信息和目标关联特征信息;
确定单元,用于根据所述目标内容特征信息和所述目标关联特征信息,确定所述待分析对话数据是否为用于咨询所述目标产品的使用问题的对话数据。
本申请实施例还提供另一种电子设备,包括:
处理器;
存储器,用于存储对话数据处理方法的程序,该设备通电并通过所述处理器运行所述对话数据处理方法的程序后,执行下述步骤:
从用于为用户提供目标产品咨询服务的多用户对话群组中,获取原始对话数据;
从所述原始对话数据中,获取当前对话数据作为待分析对话数据,以及获取与所述待分析对话数据对应的关联对话数据,其中,所述关联对话数据与所述待分析对话数据之间满足预设的相关性条件;
根据所述待分析对话数据和所述关联对话数据,获得与所述待分析对话数据对应的目标内容特征信息和目标关联特征信息;
根据所述目标内容特征信息和所述目标关联特征信息,确定所述待分析对话数据是否为用于咨询所述目标产品的使用问题的对话数据。
本申请实施例还提供一种问题决策模型的获得装置,包括:
样本数据获取单元,用于从历史对话数据中,获取用于咨询问题的相关对话数据作为正样本对话数据,以及,获取不是用于咨询问题的相关对话数据作为负样本对话数据,其中,所述正样本对话数据中以及所述负样本对话数据中的对话数据之间满足所述预设的相关性条件;
训练单元,用于使用所述正样本对话数据和所述负样本数据作为样本数据,训练获得问题决策模型;
其中,所述样本数据中包括待分析样本对话数据和与所述待分析样本数据之间满足所述预设的相关性条件的关联对话数据,所述问题决策模型用于根据输入的、与所述待分析样本对话数据对应的样本内容特征信息和样本关联特征信息,确定所述待分析样本对话数据是否用于咨询问题。
本申请实施例还提供又一种电子设备,包括:
处理器;
存储器,用于存储问题决策模型的获得方法的程序,该设备通电并通过所述处理器运行所述问题决策模型的获得方法的程序后,执行下述步骤:
从历史对话数据中,获取用于咨询问题的相关对话数据作为正样本对话数据,以及,获取不是用于咨询问题的相关对话数据作为负样本对话数据,其中,所述正样本对话数据中以及所述负样本对话数据中的对话数据之间满足所述预设的相关性条件;
使用所述正样本对话数据和所述负样本数据作为样本数据,训练获得问题决策模型;
其中,所述样本数据中包括待分析样本对话数据和与所述待分析样本数据之间满足所述预设的相关性条件的关联对话数据,所述问题决策模型用于根据输入的、与所述待分析样本对话数据对应的样本内容特征信息和样本关联特征信息,确定所述待分析样本对话数据是否用于咨询问题。
与现有技术相比,本申请具有以下优点:
本申请实施例提供一种对话数据处理方法,包括:获取待分析对话数据,以及获取与所述待分析对话数据对应的关联对话数据,其中,所述关联对话数据与所述待分析对话数据之间满足预设的相关性条件;根据所述待分析对话数据和所述关联对话数据,获得与所述待分析对话数据对应的目标内容特征信息和目标关联特征信息;根据所述目标内容特征信息和所述目标关联特征信息,确定所述待分析对话数据是否用于咨询问题。所述方法不需要人工方式或根据关键字信息识别对话数据是否用于咨询问题,而是通过获取待分析对话数据,以及与待分析对话数据之间满足预设的相关性条件的关联对话数据,获得对话过程中的与待分析对话数据对应的多维度特征信息,并根据该多维度特征信息确定待分析对话数据是否用于咨询问题,可以方便、准确的获得与问题相关的对话数据。
附图说明
图1-A是本申请第一实施例提供的一种对话数据处理方法的第一应用场景示意图。
图1-B是本申请第一实施例提供的一种对话数据处理方法的第二应用场景示意图。
图1-C是本申请第一实施例提供的一种对话数据处理方法的第三应用场景示意图。
图2是本申请第一实施例提供的一种对话数据处理方法的流程图。
图3是本申请第二实施例提供的另一种对话数据处理方法的流程图。
图4是本申请第三实施例提供的一种问题决策模型的获得方法的流程图。
图5是本申请第四实施例提供的一种对话数据处理装置的示意图。
图6是本申请第五实施例提供的一种电子设备的示意图。
图7是本申请第六实施例提供的另一种对话数据处理装置的示意图。
图8是本申请第八实施例提供的一种问题决策模型的获得装置的示意图。
图9是本申请第十实施例提供的一种数据推送方法的流程图。
图10是本申请第十一实施例提供的一种数据展示方法的流程图。
图11是本申请第十二实施例提供的一种数据推送装置的示意图。
图12是本申请第十四实施例提供的一种数据展示装置的示意图。
具体实施方式
在下面的描述中阐述了很多具体细节以便于充分理解本申请。但是本申请能够以很多不同于在此描述的其它方式来实施,本领域技术人员可以在不违背本申请内涵的情况下做类似推广,因此本申请不受下面公开的具体实施的限制。
为了使本领域的技术人员更好的理解本申请方案,下面基于本申请提供的对话数据处理方法,对其实施例的具体应用场景进行详细描述。所述方法可以应用与客户端与服务端交互的场景,如图1-A所示,其为本申请第一实施例提供的一种对话数据处理方法的第一应用场景示意图。
在具体实施时,所述方法可以应用于分析为用户提供目标产品咨询服务的多用户对话群组中的对话数据,并向企业客服提供用于咨询问题,例如,用于咨询所述目标产品的使用问题的对话数据,以供企业客服及时响应客户问题,具体来讲,在客户端获得原始对话数据之后,将原始对话数据发送给服务端;服务端从接收的原始对话数据中,获取待分析对话数据,以及获取与所述待分析对话数据对应的关联对话数据,其中,所述关联对话数据与所述待分析对话数据之间满足预设的相关性条件;之后,服务端根据所述待分析对话数据和所述关联对话数据,获得与所述待分析对话数据对应的目标内容特征信息和目标关联特征信息;并根据所述目标内容特征信息和所述目标关联特征信息,确定所述待分析对话数据是否用于咨询问题,如果所述待分析对话数据用于咨询问题,则服务端将该待分析对话数据提供给客户端;客户端获得该待分析对话数据之后,展示该待分析对话数据,或者还可以生成针对该待分析对话数据的通知消息,又或者还可以生成针对该待分析对话数据的任务数据,如任务单,以供企业客服以及后台相关技术人员能够及时响应该待分析对话数据中的问题,以对客户进行及时响应,增加客户体验。
如图1-B所示,其为本申请第一实施例提供的一种对话数据处理方法的第二应用场景示意图,根据图1-B内容可知,在确定待分析对话数据“发言人C(15:30:00):你好,咨询一下,我有个问题是……?”是用于咨询问题的对话数据之后,客户端可以展示该对话数据供企业客服查看。另外,如图1-C所示,其为本申请第一实施例提供的一种对话数据处理方法的第三应用场景示意图,根据图1-C内容可知,企业客服可以根据客户端展示的该待分析对话数据,生成针对该待分析对话数据中对应的问题的任务单。
另外,如果客户与企业客服进行对话的对话平台所对应的服务端是由企业自行研发的,也就是服务端不需要客户端发送原始对话数据,而是在客户与企业客服对话的过程中即可自动获得原始对话数据,那么,所述方法也可以单独应用于服务端。具体来讲,在服务端获得客户与企业客服进行对话的原始对话数据之后,实时的从原始对话数据中,获取当前对话数据作为待分析对话数据以及获取与待分析对话数据对应的关联对话数据,并获得与待分析对话数据对应的目标内容特征信息和目标关联特征信息,之后,根据所述目标内容特征信息和目标关联特征信息,确定待分析对话数据是否用于咨询问题,如果是,则服务端向企业客服提供该待分析对话数据,或者,服务端直接根据所述待分析对话数据对应的问题所对应的后台技术人员,直接生成对应的任务数据,如任务单,并将该任务数据推送给该后台技术人员。
当然,也可以将上述方法单独应用于企业客服所使用的客户端中,在该客户端获取到客户与企业客服进行对话的原始对话数据之后,不需要将该原始对话数据发送给服务端,而是直接从原始对话数据中,获取待分析对话数据和关联对话数据,并通过获取到的与待分析对话数据对应的目标内容特征信息和目标关联特征信息,确定待分析对话数据是否用于咨询问题,如果是,则客户端直接生成针对该待分析对话数据的通知消息,以供企业客服查看并进行及时响应。
所述客户端可以是移动终端设备,如手机、平板电脑等,也可以是常用的计算机设备。所述服务端一般是指服务器,该服务器可以是物理服务器,也可以是云端服务器,此处不做特殊限定。
所述目标产品,可以是企业开发的用于为用户提供应用服务的应用程序,当然目标产品也可以是实体产品或是其它的提供虚拟服务的产品,例如,目标产品可以是移动终端中的应用程序,可以是具有实体特征的生活用品、交通工具等实体产品,还可以是提供通信费充值服务的虚拟服务等。
需要说明的是,以上应用场景仅仅是本申请第一实施例提供的对话数据处理方法的具体实施例,提供上述应用场景实施例的目的是便于理解本申请第一实施例提供的所述方法,而并非用于限定所述方法。
如图2所示,其为本申请第一实施例提供的一种对话数据处理方法的流程图,以下结合图2对所述方法进行详细说明。
步骤S201,从所述原始对话数据中,获取待分析对话数据,以及获取与所述待分析对话数据对应的关联对话数据,其中,所述关联对话数据与所述待分析对话数据之间满足预设的相关性条件。
所述待分析对话数据,可以是原始对话数据中的任意一条对话数据,当然,如果服务端可以实时获取到原始对话数据,那么,待分析对话数据一般是指实时产生的对话数据,即当前对话数据。
所述原始对话数据,是包括至少一个用户发出的至少一条对话数据的数据,原始对话数据的内容可以是文本数据、图像数据、音频数据以及视频数据中的至少一种数据,原始对话数据可以是用户经由即时通讯应用程序发出的文本或图像数据,或是通过移动终端设备进行的语音或视频对话数据。
需要说明的是,原始对话数据中的一条对话数据,是指单个用户在单位时间内一次性发出的内容,例如,当对话数据为文本数据时,一条对话数据可以是单个用户在单位时间内一次性发出的一句文本,也可以是单个用户在单位时间内一次性发出的至少一段文本。
也就是说,在获取待分析对话数据,以及获取与所述待分析对话数据对应的关联对话数据之前,本申请第一实施例提供的所述方法,还包括:获取原始对话数据;所述获取待分析对话数据,以及获取与所述待分析对话数据对应的关联对话数据,包括:从所述原始对话数据中,获取所述待分析对话数据,以及获取与所述待分析对话数据对应的关联对话数据。
在实际中,在单聊对话数据,即客户与企业客服单独进行对话的对话数据中,确定某条对话数据是否用于咨询问题是比较简单的;而在为用户提供目标产品咨询服务的多用户对话群组中的对话数据中,由于该群组中同一时刻可能由多个用户,即多个发言人在并行的咨询以及处理不同的问题,因此,从多用户对话群组中的对话数据中定位某条对话数据是否用于咨询问题比较困难的,因此,在本申请第一实施例中,如无特殊说明,以原始对话数据为来源于为用户提供目标产品咨询服务的多用户对话群组中的对话数据说明所述对话数据处理方法。
例如,原始对话数据可以是“1、发言人A(10:00:00):问题已经解决;2、发言人B(10:10:00):好的,如果有其它问题可以再反馈给我;3、发言人C(15:30:00):你好,咨询一下,我有个问题是……?……”,其中,发言人A、发言人C均为客户,发言人B为企业客服。
所述获取原始对话数据,可以是由客户端经由客户或企业客服确认之后,将客户端中存储的客户与企业客服进行对话时的原始对话数据发送给服务端;当然,也可以是经由客户或企业客服确认之后,由服务端自行获取原始对话数据,并使用所述对话处理方法确认该原始对话数据中是否存在用于咨询问题的对话数据。
所述关联对话数据包括第一关联对话数据,其中,第一关联对话数据在原始对话数据中的位置与待分析对话数据的位置相邻,并且,第一关联对话数据对应的时间信息早于待分析对话数据对应的时间信息。也就是说,第一关联对话数据可以是待分析对话数据的上一条对话数据,即,所述从所述原始对话数据中,获取待分析对话数据,以及获取与所述待分析对话数据对应的关联对话数据,包括:从所述原始对话数据中,获取所述待分析对话数据,以及获取与所述待分析对话数据对应的第一关联对话数据,其中,所述待分析对话数据在所述原始对话数据中的位置与所述第一关联对话数据的位置相邻,并且,所述待分析对话数据对应的时间信息晚于所述第一关联对话数据对应的时间信息。
需要说明的是,在具体实施时,待分析对话数据可以为至少一条对话数据,关联对话数据也可以为至少一条对话数据;在本申请第一实施例中,为了减少计算复杂度,以及增加获得最终决策结果的速度,以待分析对话数据和关联对话数据仅为原始对话数据中的一条对话数据为例进行说明。
例如,针对原始对话数据“1、发言人A(10:00:00):问题已经解决;2、发言人B(10:10:00):好的,如果有其它问题可以再反馈给我;3、发言人C(15:30:00):你好,咨询一下,我有个问题是……?”,如果待分析对话数据为第3条对话数据,那么,第一关联对话数据为第2条对话数据;而如果待分析对话数据为第2条对话数据,那么第一关联对话数据为第1条对话数据。
另外,为了进一步增加更多维度的与待分析对话数据对应的特征信息,所述关联对话数据还包括第二关联对话数据,其中,第二关联对话数据是待分析对话数据之间间隔预定数量的对话数据,并且,第二关联对话数据对应的时间信息早于待分析对话数据对应的时间信息,也就是说,第二关联对话数据可以是待分析对话数据的上两句对话数据,即,第二关联对话数据与待分析对话数据之间间隔一条上述第一关联对话数据。因此,所述从所述原始对话数据中,获取待分析对话数据,以及获取与所述待分析对话数据对应的关联对话数据,还包括:从所述原始对话数据中,获取与所述待分析对话数据对应的第二关联对话数据,其中,所述待分析对话数据与所述第二关联对话数据之间间隔预定数量的对话数据,并且,所述待分析对话数据对应的时间信息晚于所述关联对话数据对应的时间信息。
例如,针对原始对话数据“1、发言人A(10:00:00):问题已经解决;2、发言人B(10:10:00):好的,如果有其它问题可以再反馈给我;3、发言人C(15:30:00):你好,咨询一下,我有个问题是……?”,如果待分析对话数据为第3条对话数据,那么,第二关联对话数据为第1条对话数据。需要说明的是,此处以所述预定数量为1条进行举例说明,在具体实施时,也可根据需要将预定数量设置为其它数值。
此外,原始对话数据中可能存在若干数量的对话数据,因此,可以根据上述方法将原始对话数据拆分为至少一对由相对的待分析对话数据和关联对话数据构成的对话数据对,之后,即可根据每一对话数据对,获取各个对话数据对中的待分析对话数据所对应的多维度特征信息,如内容特征信息和关联特征信息。
在步骤S201之后,执行步骤S202,根据所述待分析对话数据和所述关联对话数据,获得与所述待分析对话数据对应的目标内容特征信息和目标关联特征信息。
经过上述步骤获得至少一对由相对的待分析对话数据和关联对话数据构成的对话数据对之后,即可根据该对话数据对,即根据待分析对话数据和关联对话数据,构建与待分析对话数据对应的目标内容特征信息和目标关联特征信息,作为待分析对话数据对应的多维度特征信息。
为了更清楚的说明上述步骤,先对后续处理中所需要使用到的第一识别模型和第二识别模型进行介绍。
所述第一识别模型和所述第二识别模型,是预先训练获得的卷积神经网络网络模型。
第一识别模型,用于识别其输入内容是否用于咨询第一问题,第一识别模型的输出结果包括用于标识输入内容是否为用于咨询第一问题的对话数据的第一结果标识信息,以及,与该第一结果标识信息对应的、用于表示所述第一结果标识信息的正确程度的第一分值信息。
例如,第一结果标识信息可以为0或1,其中,0表示其输入内容不是用于咨询第一问题的对话数据,1表示其输入内容是用于咨询第一问题的对话数据;第一分值信息的范围可以为0~1,如果第一分值信息的数值接近1,则表示第一结果标识信息的正确度较高。
第二识别模型,用于识别其输入内容是否为用于结束用于咨询第二问题对应的对话的对话数据,第二识别模型的输出结果包括用于标识其输入内容是否为用于结束用于咨询所述第二问题对应的对话的对话数据的第二结果标识信息,以及,与该第二结果标识信息对应的、用于表示所述第二结果标识信息的正确程度的第二分值信息。
例如,第二结果标识信息可以为0或1,其中,0表示其输入内容不是用于结束与所述第二问题对应的对话的对话数据,1表示其输入内容是用于结束与所述第二问题对应的对话的对话数据;第二分值信息的范围页可以为0~1,如果第二分值信息的数值接近1,则表示第二结果标识信息的正确度较高。
需要说明的是,上述第一问题和第二问题是不同的问题,之所以要使用到第一识别模型和第二识别模型,是因为一般在原始对话数据中,一条用于咨询新问题的对话数据之前的上一条对话数据通常是用于结束上一问题的对话的对话数据,而在本申请第一实施例中,在确定待分析对话数据是否为用于咨询问题的对话数据时,是通过由包括待分析对话数据和第一关联对话数据的对话数据对,来构建与待分析对话数据对应的多维度特征信息,因此,如果第一关联对话数据是用于结束上一问题的对话的对话数据,那么待分析对话数据为用于咨询新问题的对话数据的概率将会较高,因此,通过第一识别模型和第二识别模型分别对待分析对话数据和第一关联对话数据进行识别,可以获得较为精准的用于增加最终决策结果的特征信息。
在本申请第一实施例中,所述第一识别模型和第二识别模型是文本卷积神经网络模型(TextCNN,Text Convolutional Neural Networks),因此,如果待分析对话数据和第一关联对话数据为图像数据、音频数据或视频数据时,则可以预先将其转换为对应的文本内容,或者也可以根据待分析对话数据和第一关联对话数据的格式的不同,预先训练针对不同格式的其它分类模型作为第一识别模型和第二识别模型。
所述第一识别模型的获得方法,包括:从历史对话数据中,获取用于咨询问题的相关对话数据作为正样本对话数据,以及,获取不是用于咨询问题的相关对话数据作为负样本对话数据,其中,所述正样本对话数据中以及所述负样本对话数据中的对话数据之间满足所述预设的相关性条件;使用所述正样本对话数据和所述负样本数据中所包括的待分析样本对话数据作为第一样本数据,训练获得所述第一识别模型。
所述第二识别模型的获得方法,包括:从历史对话数据中,获取用于咨询问题的相关对话数据作为正样本对话数据,以及,获取不是用于咨询问题的相关对话数据作为负样本对话数据,其中,所述正样本对话数据中以及所述负样本对话数据中的对话数据之间满足所述预设的相关性条件;使用所述正样本对话数据和所述负样本数据中所包括的与上述待分析样本对话数据对应的第一关联样本对话数据作为第二样本数据,训练获得所述第二识别模型。
有关网络模型的具体训练过程因为现有技术中有详细描述,此处不再赘述。
以上,详细说明了后续处理中所需要使用到的第一识别模型和第二识别模型,以下就如何根据待分析对话数据和关联对话数据,使用上述预先训练获得到的第一识别模型和第二识别模型,获得与待分析对话数据对应的目标内容特征信息和目标关联特征信息进行详细说明。
需要说明的是,当在上述步骤S201中仅获得了与待分析对话数据对应的第一关联对话数据时,所述与所述待分析对话数据对应的目标内容特征信息可以通过以下方法获得:将所述待分析对话数据输入到第一识别模型中,获取与所述待分析对话数据对应的第一内容特征信息,其中,所述第一识别模型用于识别所述待分析对话数据是否用于咨询第一问题;将所述第一关联对话数据输入到第二识别模型中,获取与所述第二对话数据对应的第二内容特征信息,其中,所述第二识别模型用于识别所述第一关联对话数据是否为用于结束用于咨询第二问题对应的对话的对话数据;根据所述第一内容特征信息和所述第二内容特征信息,获得所述目标内容特征信息。
其中,所述第一内容特征信息包括:第一结果标识信息,第一分值信息,其中,所述第一结果标识信息用于标识所述待分析对话数据是否与所述第一问题对应,所述第一分值信息用于表示所述第一结果标识信息的正确程度;所述第二内容特征信息包括:第二结果标识信息,第二分值信息,其中,所述第二结果标识信息用于标识所述第一关联对话数据是否为用于结束与所述第二问题对应的对话的对话数据,所述第二分值信息用于表示所述第二结果标识信息的正确程度。
例如,待分析对话数据为“发言人C(15:30:00):你好,咨询一下,我有个问题是……?”,第一关联对话数据为“发言人B(10:10:00):好的,如果有其它问题可以再反馈给我”,那么,将待分析对话数据输入到第一识别模型中,可以获取到第一结果标识信息为1,第一分值信息为0.95,即第一内容特征信息为(1,0.95);而将第一关联对话数据输入到第二识别模型中,可以获取到第二结果标识信息为1,第二分值信息为0.98,即第二内容特征信息为(1,0.98);那么,根据第一内容特征信息和第二内容特征信息,可获得与待分析对话数据对应的目标内容特征信息为(1,0.95,1,0.98)。
另外,为了增加最终决策结果的准确性,还可以进一步的获取与待分析对话数据对应的其它维度的特征信息,例如,还可以获取待分析对话数据和第一关联对话数据中的符号信息,例如,当对话数据以感叹号,即“!”结尾时,通常是用于表示感谢的、结束上一问题的对话的对话数据;当对话数据以问号,即“?”结尾时,通常表示对话数据是用于咨询一个新的问题的对话数据,因此,在根据第一内容特征信息和第二内容特征信息,获得目标内容特征信息时,还可以进一步的获得待分析对话数据和第一关联对话数据中的符号信息作为目标内容特征信息中的内容。
具体来讲,所述根据所述第一内容特征信息和所述第二内容特征信息,获得所述目标内容特征信息,包括:根据所述待分析对话数据,获取第一符号标识信息和第二符号标识信息,其中,所述第一符号标识信息用于标识所述待分析对话数据中是否存在感叹号,所述第二符号标识信息用于标识所述待分析对话数据中是否存在问号;根据所述第一关联对话数据,获取第三符号标识信息和第四符号标识信息,其中,所述第三符号标识信息用于标识所述第一关联对话数据中是否存在感叹号,所述第四符号标识信息用于标识所述第一关联对话数据中是否存在问号;根据所述第一内容特征信息、所述第二内容特征信息、所述第一符号标识信息、第二符号标识信息、第三符号标识信息和所述第四符号标识信息,获得所述目标内容特征信息。
例如,待分析对话数据为“发言人C(15:30:00):你好,咨询一下,我有个问题是……?”,第一关联对话数据为“发言人B(10:10:00):好的,如果有其它问题可以再反馈给我”,在上述处理中获取到第一内容特征信息为(1,0.95),第二内容特征信息为(1,0.98);而在待分析对话数据中存在问号,并且不存在感叹号,因此,从待分析对话数据中,可获得第一符号标识信息为0,第二符号标识信息1;而从第一关联对话数据中,可获得第三符号标识信息为0,第四符号标识信息0,则可获得目标内容特征信息为(1,0.95,1,0.98,0,1,0,0)。需要说明的是,此处以0表示符号不存在,以1表示符号存在,在具体实施时,也可以以其它数值或形式来表示,此处不再赘述。
需要说明的是,如果在上述步骤S201中,还获取了与待分析对话数据对应的第二关联对话数据,即,为了进一步增加决策结果的准确性,还可以通过第二关联对话数据,获取与待分析对话数据对应的更多维度的内容特征信息,即,所述与所述待分析对话数据对应的目标内容特征信息还可以通过以下方法获得:获取与所述第二关联对话数据对应的第三内容特征信息;根据所述第一内容特征信息、所述第二内容特征信息和所述第三内容特征信息,获得所述目标内容特征信息。
所述获取与所述第二关联对话数据对应的第三内容特征信息,包括:根据所述第二关联对话数据,获取第五符号标识信息和第六符号标识信息,其中,所述第五符号标识信息用于标识所述第二关联对话数据中是否存在感叹号,所述第六符号标识信息用于标识所述第二关联对话数据中是否存在问号;根据所述第五符号标识信息和第六符号标识信息,获得所述第三内容特征信息。
例如,待分析对话数据为“发言人C(15:30:00):你好,咨询一下,我有个问题是……?”,第一关联对话数据为“发言人B(10:10:00):好的,如果有其它问题可以再反馈给我”,第二关联对话数据为“发言人A(10:00:00):问题已经解决”,在上述处理中获取到第一内容特征信息为(1,0.95),第二内容特征信息为(1,0.98);第一符号标识信息为0,第二符号标识信息1;第三符号标识信息为0,第四符号标识信息0;而根据分析可得第二关联对话数据中既不存在问号也不存在感叹号,则第五符号标识信息和第六符号标识信息均为0,因此,可得目标内容特征信息为(1,0.95,1,0.98,0,1,0,0,0,0)。
以上,详细描述了如何根据待分析对话数据和关联对话数据,获得与待分析对话数据对应的目标内容特征信息,根据上述描述可知,本申请第一实施例提供的对话处理方法,在确定待分析对话数据是否为用于咨询问题的对话数据时,不需要根据关键字进行识别,而是通过与待分析对话数据对应的上下文对话数据,获得与待分析对话数据对应的多维的内容特征信息,以增加最终决策结果的准确性。
以下,对如何获得与待分析对话数据对应的目标关联特征信息进行详细说明。
当在上述步骤S201中仅获得了与待分析对话数据对应的第一关联对话数据时,所述与所述待分析对话数据对应的目标关联特征信息通过以下方法获得:获取所述待分析对话数据的发言人所对应的第一用户类型;判断所述待分析对话数据的发言人与所述第一关联对话数据的发言人是否相同,获得第一判断结果;获取所述待分析对话数据与第一关联对话数据所述待分析对话数据之间的时间间隔,作为第一时间间隔数据;根据所述第一用户类型、所述第一判断结果以及所述第一时间间隔数据,获得所述目标关联特征信息。
例如,待分析对话数据为“发言人C(15:30:00):你好,咨询一下,我有个问题是……?”,第一关联对话数据为“发言人B(10:10:00):好的,如果有其它问题可以再反馈给我”;如果以1表示用户类型为客户,以0表示用户类型为客服,以0表示发言人不相同,以1表示发言人相同,以第一时间间隔数据的单位为秒进行表示的话,可得第一用户类型为1,第一判断结果为0,第一时间间隔数据为19200秒,因此可得,目标关联特征信息为(1,0,19200)。
需要说明的是,如果在上述步骤S201中,还获取了与待分析对话数据对应的第二关联对话数据,则所述与所述待分析对话数据对应的目标关联特征信息还通过以下方法获得:获取所述第二关联对话数据的发言人所对应的第二用户类型;判断所述待分析对话数据的发言人与所述第二关联对话数据的发言人是否相同,获得第二判断结果;获取所述待分析对话数据与所述第二关联对话数据之间的时间间隔,作为第二时间间隔数据;根据所述第一用户类型、所述第一判断结果、所述第一时间间隔数据以及所述第二用户类型、所述第二判断结果、所述第二时间间隔数据,获得所述目标关联特征信息。
以上,详细说明了如何根据待分析对话数据和关联对话数据,获取的与待分析对话数据对应的多维度的特征信息,如所述目标内容特征信息和所述目标关联特征信息,在获取到所述多维度的特征信息之后,即可根据所述特征信息,确定待分析对话数据是否用于咨询问题。
在步骤S202之后,执行步骤S203,根据所述目标内容特征信息和所述目标关联特征信息,确定所述待分析对话数据是否用于咨询问题。
以下对如何根据上述获取到的与待分析对话数据对应的目标内容特征信息和目标关联特征信息,确定待分析对话数据是否用于咨询问题进行接收。
具体来讲,确定待分析对话数据是否为用于咨询问题的对话数据的方法,包括:将所述目标内容特征信息和所述目标关联特征信息输入到问题决策模型中,获得目标决策结果,其中,所述问题决策模型用于根据获得到的所述目标内容特征信息和所述目标关联特征信息,确定所述待分析对话数据是否用于咨询问题,所述目标决策结果用于标识所述待分析对话数据是否用于咨询问题。
需要说明的是,本申请第一实施例使用的问题决策模型是预先训练获得的随机森林模型,所述问题决策模型通过以下方法获得:从历史对话数据中,获取用于咨询问题的相关对话数据作为正样本对话数据,以及,获取不是用于咨询问题的相关对话数据作为负样本对话数据,其中,所述正样本对话数据中以及所述负样本对话数据中的对话数据之间满足所述预设的相关性条件;使用所述正样本对话数据和所述负样本数据作为样本数据,训练获得所述问题决策模型;其中,所述样本数据中包括待分析样本对话数据和与所述待分析样本数据之间满足所述预设的相关性条件的关联对话数据,所述问题决策模型用于根据输入的、与所述待分析样本对话数据对应的样本内容特征信息和样本关联特征信息,确定所述待分析样本对话数据是否用于咨询问题。
为了增加问题决策模型的决策结果的准确性,也可以将本申请第一实施例提供的对话数据处理方法中所使用到的第一识别模型、第二识别模型和问题决策模型进行联合训练,以获得收敛后的上述三个模型,具体来讲,所述联合训练的过程包括:从历史对话数据中,获取用于咨询问题的相关对话数据作为正样本对话数据,以及,获取不是用于咨询问题的相关对话数据作为负样本对话数据,其中,所述正样本对话数据中以及所述负样本对话数据中的对话数据之间满足所述预设的相关性条件;根据所述正样本对话数据和所述负样本对话数据,获得目标样本对话数据,其中,所述目标样本对话数据中包括待分析样本对话数据和关联样本对话数据,所述关联样本对话数据与所述待分析样本对话数据之间满足所述预设的相关性条件;使用所述待分析样本对话数据训练所述第一识别模型,以及,使用所述关联样本对话数据训练所述第二识别模型,获得与所述待分析样本对话数据对应的样本内容特征信息;获得与所述待分析样本对话数据对应的样本关联特征信息;使用所述样本内容特征信息和所述样本关联特征信息,训练所述问题决策模型;其中,在训练的过程中,使用所述第一识别模型、所述第二识别模型和所述问题决策模型共同对应的损失函数调整所述第一识别模型、所述第二识别模型和所述问题决策模型的参数,使所述第一识别模型、所述第二识别模型和所述问题决策模型达到预设的收敛条件。
在获得问题决策模型之后,即可根据上述获得的待分析对话数据对应的多维特征信息,获得用于标识待分析对话数据是否为用于咨询问题的对话数据的目标决策结果。
例如,将目标内容特征信息与目标关联特征信息(1,0.95,1,0.98,0,1,0,0,0,0,1,0,19200…)输入到问题决策模型中,即可获得目标决策结果。
根据上述描述可知,本申请第一实施例所述对话数据处理方法,通过在原始对话数据中,获取与待分析对话数据之间满足预设的相关性条件的关联对话数据,进而获得与待分析对话数据对应的多维度的特征信息,并根据该特征信息,确定待分析对话数据是否用于咨询问题;相对于使用人工或基于关键字进行识别,所述方法更为方便、准确。
需要说明的是,所述方法还包括:如果确定所述待分析对话数据用于咨询问题,则生成与所述待分析对话数据对应的、用于针对所述问题进行处理的任务数据。
如图1-B所示,当所述方法应用于服务端时,所述生成与所述待分析对话数据对应的、用于针对所述问题进行处理的任务数据,包括:将所述待分析对话数据提供给客户端;接收客户端发送的用于生成所述任务数据的数据请求消息;根据所述数据请求消息,生成所述任务数据。而当所述方法应用于客户端时,所述生成与所述待分析对话数据对应的、用于针对所述问题进行处理的任务数据,包括:接收服务端提供的所述待分析对话数据;根据所述待分析对话数据,生成用于生成所述任务数据的数据请求消息;向所述服务端发送所述数据请求消息。
即,当通过所述对话数据处理方法确定待分析对话数据用于咨询问题时,就可以生成对应的任务数据,例如,任务单,并将该任务数据推送给关联人员,如客户人员以及对应的后台技术人员。
例如,如图1-B、图1-C所示,在客户端获得原始对话数据之后,可以将该原始对话数据发送给服务端;服务端获得该原始对话数据之后,使用本申请第一实施例所示对话数据处理方法获取该原始对话数据中包含的用于咨询问题的对话数据,并将该用于咨询问题的对话数据以问题清单的方式推送给客户端;客户端在获得该问题清单之后,可以展示该问题清单,同时,还可以向用户确认是否生成与该问题清单中用于咨询问题的对话数据对应的、用于针对其所包含的问题进行处理的任务数据;如果用户确认可以生成该任务数据,则客户端向服务端发送用于获得目标任务数据的数据请求消息,服务端在获得该数据请求消息之后,可以生成与该问题清单中的问题对应的目标任务数据,并将该目标任务数据推送给客户端;客户端在获得该任务数据后,可以展示该任务数据供用户确认。
综上所述,本申请第一实施例提供的所述对话数据处理方法,包括:获取待分析对话数据,以及获取与所述待分析对话数据对应的关联对话数据,其中,所述关联对话数据与所述待分析对话数据之间满足预设的相关性条件;根据所述待分析对话数据和所述关联对话数据,获得与所述待分析对话数据对应的目标内容特征信息和目标关联特征信息;根据所述目标内容特征信息和所述目标关联特征信息,确定所述待分析对话数据是否用于咨询问题。所述方法不需要人工方式或根据关键字信息识别对话数据是否用于咨询问题,而是通过获取待分析对话数据,以及与待分析对话数据之间满足预设的相关性条件的关联对话数据,获得对话过程中的与待分析对话数据对应的多维度特征信息,并根据该多维度特征信息确定待分析对话数据是否用于咨询问题,可以方便、准确的获得与问题相关的对话数据。
与本申请第一实施例提供的对话数据处理方法相对应,本申请第二实施例还提供另一种对话数据处理方法,其为具体的场景处理方法,请参看图3所示,其为本申请第二实施例提供的另一种对话数据处理方法的流程图,其中部分步骤在本申请第一实施例中已经详细描述,所以此处描述的比较简单,相关之处参见本申请第一实施例中的部分说明即可,下述描述的处理过程仅是示意性的。
步骤S301,从用于为用户提供目标产品咨询服务的多用户对话群组中,获取原始对话数据。
步骤S302,从所述原始对话数据中,获取当前对话数据作为待分析对话数据,以及获取与所述待分析对话数据对应的关联对话数据,其中,所述关联对话数据与所述待分析对话数据之间满足预设的相关性条件。
步骤S303,根据所述待分析对话数据和所述关联对话数据,获得与所述待分析对话数据对应的目标内容特征信息和目标关联特征信息。
步骤S304,根据所述目标内容特征信息和所述目标关联特征信息,确定所述待分析对话数据是否为用于咨询所述目标产品的使用问题的对话数据。
与本申请第一实施例提供的对话数据处理方法相对应,本申请第三实施例还提供一种问题决策模型的获得方法,请参看图4所示,其为本申请第三实施例提供的一种问题决策模型的获得方法的流程图,其中部分步骤在本申请第一实施例中已经详细描述,所以此处描述的比较简单,相关之处参见本申请第一实施例中的部分说明即可,下述描述的处理过程仅是示意性的。
步骤S401,从历史对话数据中,获取用于咨询问题的相关对话数据作为正样本对话数据,以及,获取不是用于咨询问题的相关对话数据作为负样本对话数据,其中,所述正样本对话数据中以及所述负样本对话数据中的对话数据之间满足所述预设的相关性条件。
步骤S402,使用所述正样本对话数据和所述负样本数据作为样本数据,训练获得问题决策模型;其中,所述样本数据中包括待分析样本对话数据和与所述待分析样本数据之间满足所述预设的相关性条件的关联对话数据,所述问题决策模型用于根据输入的、与所述待分析样本对话数据对应的样本内容特征信息和样本关联特征信息,确定所述待分析样本对话数据是否用于咨询问题。
与本申请第一实施例提供的一种对话数据处理方法相对应,本申请第四实施例还提供一种对话数据处理装置,请参看图5,其为本申请第四实施例提供的一种对话数据处理装置的示意图,由于装置实施例基本相似于方法实施例,所以描述的比较简单,相关之处参见方法实施例的部分说明即可,下述描述的装置实施例仅仅是示意性的。本申请第四实施例提供的一种对话数据处理装置包括如下部分:
数据获取单元501,用于获取待分析对话数据,以及获取与所述待分析对话数据对应的关联对话数据,其中,所述关联对话数据与所述待分析对话数据之间满足预设的相关性条件。
特征信息获取单元502,用于根据所述待分析对话数据和所述关联对话数据,获得与所述待分析对话数据对应的目标内容特征信息和目标关联特征信息。
确定单元503,用于根据所述目标内容特征信息和所述目标关联特征信息,确定所述待分析对话数据是否用于咨询问题。
与本申请第一实施例提供的一种对话数据处理方法相对应,本申请第五实施例还提供一种电子设备,请参看图6,其为本申请第五实施例提供的一种电子设备的示意图,由于电子设备实施例基本相似于方法实施例,所以描述的比较简单,相关之处参见方法实施例的部分说明即可,下述描述的电子设备实施例仅仅是示意性的。本申请第五实施例提供的一种电子设备包括:
处理器601;
存储器602,用于存储用于对话数据处理方法的程序,该设备通电并通过所述处理器运行所述对话数据处理方法的程序后,执行下述步骤:
获取待分析对话数据,以及获取与所述待分析对话数据对应的关联对话数据,其中,所述关联对话数据与所述待分析对话数据之间满足预设的相关性条件;
根据所述待分析对话数据和所述关联对话数据,获得与所述待分析对话数据对应的目标内容特征信息和目标关联特征信息;
根据所述目标内容特征信息和所述目标关联特征信息,确定所述待分析对话数据是否用于咨询问题。
与本申请第二实施例提供的另一种对话数据处理方法相对应,本申请第六实施例还提供另一种对话数据处理装置,请参看图7,其为本申请第六实施例提供的另一种对话数据处理装置的示意图,由于装置实施例基本相似于方法实施例,所以描述的比较简单,相关之处参见方法实施例的部分说明即可,下述描述的装置实施例仅仅是示意性的。本申请第六实施例提供的一种对话数据处理装置包括如下部分:
原始对话数据获取单元701,从用于为用户提供目标产品咨询服务的多用户对话群组中,获取原始对话数据。
数据获取单元702,从所述原始对话数据中,获取当前对话数据作为待分析对话数据,以及获取与所述待分析对话数据对应的关联对话数据,其中,所述关联对话数据与所述待分析对话数据之间满足预设的相关性条件。
特征信息获取单元703,用于根据所述待分析对话数据和所述关联对话数据,获得与所述待分析对话数据对应的目标内容特征信息和目标关联特征信息。
确定单元704,用于根据所述目标内容特征信息和所述目标关联特征信息,确定所述待分析对话数据是否为用于咨询所述目标产品的使用问题的对话数据。
与本申请第二实施例提供的另一种对话数据处理方法相对应,本申请第七实施例还提供一种电子设备,由于电子设备实施例基本相似于方法实施例,所以描述的比较简单,相关之处参见方法实施例的部分说明即可,下述描述的电子设备实施例仅仅是示意性的。本申请第七实施例提供的一种电子设备包括:
处理器;
存储器,用于存储对话数据处理方法的程序,该设备通电并通过所述处理器运行所述对话数据处理方法的程序后,执行下述步骤:
从用于为用户提供目标产品咨询服务的多用户对话群组中,获取原始对话数据;
从所述原始对话数据中,获取当前对话数据作为待分析对话数据,以及获取与所述待分析对话数据对应的关联对话数据,其中,所述关联对话数据与所述待分析对话数据之间满足预设的相关性条件;
根据所述待分析对话数据和所述关联对话数据,获得与所述待分析对话数据对应的目标内容特征信息和目标关联特征信息;
根据所述目标内容特征信息和所述目标关联特征信息,确定所述待分析对话数据是否为用于咨询所述目标产品的使用问题的对话数据。
与本申请第三实施例提供的一种问题决策模型的获得方法相对应,本申请第八实施例还提供一种问题决策模型的获得装置,请参看图8,其为本申请第八实施例提供的一种问题决策模型的获得装置的示意图,由于装置实施例基本相似于方法实施例,所以描述的比较简单,相关之处参见方法实施例的部分说明即可,下述描述的装置实施例仅仅是示意性的。本申请第八实施例提供的一种问题决策模型的获得装置包括如下部分:
样本数据获取单元801,用于从历史对话数据中,获取用于咨询问题的相关对话数据作为正样本对话数据,以及,获取不是用于咨询问题的相关对话数据作为负样本对话数据,其中,所述正样本对话数据中以及所述负样本对话数据中的对话数据之间满足所述预设的相关性条件。
训练单元802,用于使用所述正样本对话数据和所述负样本数据作为样本数据,训练获得问题决策模型;其中,所述样本数据中包括待分析样本对话数据和与所述待分析样本数据之间满足所述预设的相关性条件的关联对话数据,所述问题决策模型用于根据输入的、与所述待分析样本对话数据对应的样本内容特征信息和样本关联特征信息,确定所述待分析样本对话数据是否用于咨询问题。
与本申请第三实施例提供的一种问题决策模型的获得方法相对应,本申请第九实施例还提供一种电子设备,由于电子设备实施例基本相似于方法实施例,所以描述的比较简单,相关之处参见方法实施例的部分说明即可,下述描述的电子设备实施例仅仅是示意性的。本申请第九实施例提供的一种电子设备包括:
处理器;
存储器,用于存储问题决策模型的获得方法的程序,该设备通电并通过所述处理器运行所述问题决策模型的获得方法的程序后,执行下述步骤:
从历史对话数据中,获取用于咨询问题的相关对话数据作为正样本对话数据,以及,获取不是用于咨询问题的相关对话数据作为负样本对话数据,其中,所述正样本对话数据中以及所述负样本对话数据中的对话数据之间满足所述预设的相关性条件;
使用所述正样本对话数据和所述负样本数据作为样本数据,训练获得问题决策模型;
其中,所述样本数据中包括待分析样本对话数据和与所述待分析样本数据之间满足所述预设的相关性条件的关联对话数据,所述问题决策模型用于根据输入的、与所述待分析样本对话数据对应的样本内容特征信息和样本关联特征信息,确定所述待分析样本对话数据是否用于咨询问题。
与本申请第一实施例提供的对话数据处理方法相对应,本申请第十实施例还提供一种数据推送方法,其为具体的场景处理方法,请参看图9所示,其为本申请第十实施例提供的一种数据推送方法的流程图,其中部分步骤在本申请第一实施例中已经详细描述,所以此处描述的比较简单,相关之处参见本申请第一实施例中的部分说明即可,下述描述的处理过程仅是示意性的。
步骤S901,获取客户端发送的原始对话数据。
步骤S902,获取与所述原始对话数据对应的目标问题清单数据,其中,所述目标问题清单数据是使用本申请第一实施例提供的对话数据处理方法获得到的、包含至少一条用于咨询问题的对话数据的数据。
步骤S903,将所述目标问题清单数据推送给所述客户端。
可选的,所述方法还包括:获取所述客户端发送的用于获得目标任务数据的数据请求消息,其中,所述目标任务数据是与所述目标问题清单数据中用于咨询问题的对话数据对应的、用于针对所述问题进行处理的数据;根据所述目标问题清单数据,生成所述目标任务数据;将所述目标任务数据推送给所述客户端。
与本申请第一实施例提供的对话数据处理方法、第十实施例提供的数据推送方法相对应,本申请第十一实施例还提供一种数据展示方法,其为具体的场景处理方法,请参看图10所示,其为本申请第十一实施例提供的一种数据展示方法的流程图,其中部分步骤在上述实施例中已经详细描述,所以此处描述的比较简单,相关之处参见上述实施例中的部分说明即可,下述描述的处理过程仅是示意性的。
步骤S1001,获取原始对话数据。
步骤S1002,向服务端发送所述原始对话数据。
步骤S1003,接收所述服务端推送的与所述原始对话数据对应的目标问题清单数据,其中,所述目标问题清单数据是所述服务端使用本申请第一实施例提供的对话数据处理方法获得到的、包含至少一条用于咨询问题的对话数据的数据。
步骤S1004,展示所述目标问题清单数据。
可选的,所述方法还包括:向所述服务端发送用于获得目标任务数据的数据请求消息,其中,所述目标任务数据是与所述目标问题清单数据中用于咨询问题的对话数据对应的、用于针对所述问题进行处理的数据;接收所述服务端推送的所述目标任务数据;展示所述目标任务数据。
与本申请第十实施例提供的一种数据推送方法相对应,本申请第十二实施例还提供一种数据推送装置,请参看图11,其为本申请第十二实施例提供的一种数据推送装置的示意图,由于装置实施例基本相似于方法实施例,所以描述的比较简单,相关之处参见方法实施例的部分说明即可,下述描述的装置实施例仅仅是示意性的。本申请第十二实施例提供的一种数据推算装置包括如下部分:
数据获取单元1101,用于获取客户端发送的原始对话数据。
问题清单数据获取单元1102,用于获取与所述原始对话数据对应的目标问题清单数据,其中,所述目标问题清单数据是本申请第一实施例提供的对话数据处理方法获得到的、包含至少一条用于咨询问题的对话数据的数据。
推送单元1103,用于将所述目标问题清单数据推送给所述客户端。
可选的,所述装置还包括:请求消息获取单元,用于获取所述客户端发送的用于获得目标任务数据的数据请求消息,其中,所述目标任务数据是与所述目标问题清单数据中用于咨询问题的对话数据对应的、用于针对所述问题进行处理的数据;任务数据生成单元,用于根据所述目标问题清单数据,生成所述目标任务数据;任务数据展示单元,用于将所述目标任务数据推送给所述客户端。
与本申请第十实施例提供的一种数据推送方法相对应,本申请第十三实施例还提供一种电子设备,由于电子设备实施例基本相似于方法实施例,所以描述的比较简单,相关之处参见方法实施例的部分说明即可,下述描述的电子设备实施例仅仅是示意性的。本申请第十三实施例提供的一种电子设备包括:
处理器;
存储器,用于存储数据推送方法的程序,该设备通电并通过所述处理器运行所述数据推送方法的程序后,执行下述步骤:
获取客户端发送的原始对话数据;
获取与所述原始对话数据对应的目标问题清单数据,其中,所述目标问题清单数据是使用本申请第一实施例提供的对话数据处理方法获得到的、包含至少一条用于咨询问题的对话数据的数据;
将所述目标问题清单数据推送给所述客户端。
与本申请第十一实施例提供的一种数据展示方法相对应,本申请第十四实施例还提供一种数据展示装置,请参看图12,其为本申请第十四实施例提供的一种数据展示装置的示意图,由于装置实施例基本相似于方法实施例,所以描述的比较简单,相关之处参见方法实施例的部分说明即可,下述描述的装置实施例仅仅是示意性的。本申请第十四实施例提供的一种数据展示装置包括如下部分:
数据获取单元1201,用于获取原始对话数据。
数据发送单元1202,用于向服务端发送所述原始对话数据。
问题清单数据接收单元1203,用于接收所述服务端推送的与所述原始对话数据对应的目标问题清单数据,其中,所述目标问题清单数据是所述服务端使用本申请第一实施例提供的对话数据处理方法获得到的、包含至少一条用于咨询问题的对话数据的数据。
展示单元1204,用于展示所述目标问题清单数据。
可选的,所述装置还包括:请求消息发送单元,用于向所述服务端发送用于获得目标任务数据的数据请求消息,其中,所述目标任务数据是与所述目标问题清单数据中用于咨询问题的对话数据对应的、用于针对所述问题进行处理的数据;任务数据接收单元,用于接收所述服务端推送的所述目标任务数据;任务数据展示单元,用于展示所述目标任务数据。
与本申请第十一实施例提供的一种数据展示方法相对应,本申请第十五实施例还提供一种电子设备,由于电子设备实施例基本相似于方法实施例,所以描述的比较简单,相关之处参见方法实施例的部分说明即可,下述描述的电子设备实施例仅仅是示意性的。本申请第十五实施例提供的一种电子设备包括:
处理器;
存储器,用于存储数据展示方法的程序,该设备通电并通过所述处理器运行所述数据展示方法的程序后,执行下述步骤:
获取原始对话数据;
向服务端发送所述原始对话数据;
接收所述服务端推送的与所述原始对话数据对应的目标问题清单数据,其中,所述目标问题清单数据是所述服务端使用本申请第一实施例提供的对话数据处理方法获得到的、包含至少一条用于咨询问题的对话数据的数据;
展示所述目标问题清单数据。
本申请虽然以较佳实施例公开如上,但其并不是用来限定本申请,任何本领域技术人员在不脱离本申请的精神和范围内,都可以做出可能的变动和修改,因此本申请的保护范围应当以本申请权利要求所界定的范围为准。
在一个典型的配置中,计算设备包括一个或多个处理器(CPU)、输入/输出接口、网络接口和内存。
内存可能包括计算机可读介质中的非永久性存储器,随机存取存储器(RAM)和/或非易失性内存等形式,如只读存储器(ROM)或闪存(flashRAM)。内存是计算机可读介质的示例。
计算机可读介质包括永久性和非永久性、可移动和非可移动媒体可以由任何方法或技术来实现信息存储。信息可以是计算机可读指令、数据结构、程序的模块或其他数据。计算机的存储介质的例子包括,但不限于相变内存(PRAM)、静态随机存取存储器(SRAM)、动态随机存取存储器(DRAM)、其他类型的随机存取存储器(RAM)、只读存储器(ROM)、电可擦除可编程只读存储器(EEPROM)、快闪记忆体或其他内存技术、只读光盘只读存储器(CD-ROM)、数字多功能光盘(DVD)或其他光学存储、磁盒式磁带,磁带磁磁盘存储或其他磁性存储设备或任何其他非传输介质,可用于存储可以被计算设备访问的信息。按照本文中的界定,计算机可读介质不包括非暂存电脑可读媒体(transitory media),如调制的数据信号和载波。
本领域技术人员应明白,本申请的实施例可提供为方法、***或计算机程序产品。因此,本申请可采用完全硬件实施例、完全软件实施例或结合软件和硬件方面的实施例的形式。而且,本申请可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、CD-ROM、光学存储器等)上实施的计算机程序产品的形式。

Claims (28)

1.一种对话数据处理方法,其特征在于,包括:
获取待分析对话数据,以及获取与所述待分析对话数据对应的关联对话数据,其中,所述关联对话数据与所述待分析对话数据之间满足预设的相关性条件;
根据所述待分析对话数据和所述关联对话数据,获得与所述待分析对话数据对应的目标内容特征信息和目标关联特征信息,其中,所述与所述待分析对话数据对应的目标内容特征信息通过以下方法获得:
将所述待分析对话数据输入到第一识别模型中,获取与所述待分析对话数据对应的第一内容特征信息,其中,所述第一识别模型用于识别所述待分析对话数据是否用于咨询第一问题;将与所述待分析对话数据对应的第一关联对话数据输入到第二识别模型中,获取与第二对话数据对应的第二内容特征信息,其中,所述第二识别模型用于识别所述第一关联对话数据是否为用于结束用于咨询第二问题对应的对话的对话数据;根据所述第一内容特征信息和所述第二内容特征信息,获得所述目标内容特征信息;
所述与所述待分析对话数据对应的目标关联特征信息通过以下方法获得:
获取所述待分析对话数据的发言人所对应的第一用户类型;判断所述待分析对话数据的发言人与所述第一关联对话数据的发言人是否相同,获得第一判断结果;获取所述待分析对话数据与第一关联对话数据所述待分析对话数据之间的时间间隔,作为第一时间间隔数据;根据所述第一用户类型、所述第一判断结果以及所述第一时间间隔数据,获得所述目标关联特征信息;
根据所述目标内容特征信息和所述目标关联特征信息,确定所述待分析对话数据是否用于咨询问题。
2.根据权利要求1所述的对话数据处理方法,其特征在于,还包括:获取原始对话数据;
所述获取待分析对话数据,以及获取与所述待分析对话数据对应的关联对话数据,包括:
从所述原始对话数据中,获取所述待分析对话数据,以及获取与所述待分析对话数据对应的关联对话数据。
3.根据权利要求2所述的对话数据处理方法,其特征在于,所述从所述原始对话数据中,获取所述待分析对话数据,以及获取与所述待分析对话数据对应的关联对话数据,包括:
从所述原始对话数据中,获取所述待分析对话数据,以及获取与所述待分析对话数据对应的第一关联对话数据,其中,所述待分析对话数据在所述原始对话数据中的位置与所述第一关联对话数据的位置相邻,并且,所述待分析对话数据对应的时间信息晚于所述第一关联对话数据对应的时间信息。
4.根据权利要求1所述的对话数据处理方法,其特征在于,所述根据所述目标内容特征信息和所述目标关联特征信息,确定所述待分析对话数据是否用于咨询问题,包括:
将所述目标内容特征信息和所述目标关联特征信息输入到问题决策模型中,获得目标决策结果,其中,所述问题决策模型用于根据获得到的所述目标内容特征信息和所述目标关联特征信息,确定所述待分析对话数据是否用于咨询问题,所述目标决策结果用于标识所述待分析对话数据是否用于咨询问题。
5.根据权利要求2所述的对话数据处理方法,其特征在于,所述从所述原始对话数据中,获取所述待分析对话数据,以及获取与所述待分析对话数据对应的关联对话数据,还包括:
从所述原始对话数据中,获取与所述待分析对话数据对应的第二关联对话数据,其中,所述待分析对话数据与所述第二关联对话数据之间间隔预定数量的对话数据,并且,所述待分析对话数据对应的时间信息晚于所述关联对话数据对应的时间信息。
6.根据权利要求1所述的对话数据处理方法,其特征在于,所述与所述待分析对话数据对应的目标内容特征信息还通过以下方法获得:
获取与第二关联对话数据对应的第三内容特征信息;
根据所述第一内容特征信息、所述第二内容特征信息和所述第三内容特征信息,获得所述目标内容特征信息。
7.根据权利要求1所述的对话数据处理方法,其特征在于,所述与所述待分析对话数据对应的目标关联特征信息还通过以下方法获得:
获取第二关联对话数据的发言人所对应的第二用户类型;
判断所述待分析对话数据的发言人与所述第二关联对话数据的发言人是否相同,获得第二判断结果;
获取所述待分析对话数据与所述第二关联对话数据之间的时间间隔,作为第二时间间隔数据;
根据所述第一用户类型、所述第一判断结果、所述第一时间间隔数据以及所述第二用户类型、所述第二判断结果、所述第二时间间隔数据,获得所述目标关联特征信息。
8.根据权利要求1所述的对话数据处理方法,其特征在于,还包括:
如果确定所述待分析对话数据用于咨询问题,则生成与所述待分析对话数据对应的、用于针对所述问题进行处理的任务数据。
9.根据权利要求8所述的对话数据处理方法,其特征在于,所述方法应用于服务端,所述生成与所述待分析对话数据对应的、用于针对所述问题进行处理的任务数据,包括:
将所述待分析对话数据提供给客户端;
接收客户端发送的用于生成所述任务数据的数据请求消息;
根据所述数据请求消息,生成所述任务数据。
10.根据权利要求8所述的对话数据处理方法,其特征在于,所述方法应用于客户端,所述生成与所述待分析对话数据对应的、用于针对所述问题进行处理的任务数据,包括:
接收服务端提供的所述待分析对话数据;
根据所述待分析对话数据,生成用于生成所述任务数据的数据请求消息;
向所述服务端发送所述数据请求消息。
11.根据权利要求4所述的对话数据处理方法,其特征在于,所述问题决策模型通过以下方法获得:
从历史对话数据中,获取用于咨询问题的相关对话数据作为正样本对话数据,以及,获取不是用于咨询问题的相关对话数据作为负样本对话数据,其中,所述正样本对话数据中以及所述负样本对话数据中的对话数据之间满足所述预设的相关性条件;
使用所述正样本对话数据和所述负样本对话数据作为样本数据,训练获得所述问题决策模型;
其中,所述样本数据中包括待分析样本对话数据和与所述待分析样本对话数据之间满足所述预设的相关性条件的关联对话数据,所述问题决策模型用于根据输入的、与所述待分析样本对话数据对应的样本内容特征信息和样本关联特征信息,确定所述待分析样本对话数据是否用于咨询问题。
12.根据权利要求1所述的对话数据处理方法,其特征在于,所述根据所述第一内容特征信息和所述第二内容特征信息,获得所述目标内容特征信息,包括:
根据所述待分析对话数据,获取第一符号标识信息和第二符号标识信息,其中,所述第一符号标识信息用于标识所述待分析对话数据中是否存在感叹号,所述第二符号标识信息用于标识所述待分析对话数据中是否存在问号;
根据所述第一关联对话数据,获取第三符号标识信息和第四符号标识信息,其中,所述第三符号标识信息用于标识所述第一关联对话数据中是否存在感叹号,所述第四符号标识信息用于标识所述第一关联对话数据中是否存在问号;
根据所述第一内容特征信息、所述第二内容特征信息、所述第一符号标识信息、第二符号标识信息、第三符号标识信息和所述第四符号标识信息,获得所述目标内容特征信息。
13.根据权利要求1所述的对话数据处理方法,其特征在于,所述第一内容特征信息包括:第一结果标识信息,第一分值信息,其中,所述第一结果标识信息用于标识所述待分析对话数据是否与所述第一问题对应,所述第一分值信息用于表示所述第一结果标识信息的正确程度;
所述第二内容特征信息包括:第二结果标识信息,第二分值信息,其中,所述第二结果标识信息用于标识所述第一关联对话数据是否为用于结束与所述第二问题对应的对话的对话数据,所述第二分值信息用于表示所述第二结果标识信息的正确程度。
14.根据权利要求6所述的对话数据处理方法,其特征在于,所述获取与所述第二关联对话数据对应的第三内容特征信息,包括:
根据所述第二关联对话数据,获取第五符号标识信息和第六符号标识信息,其中,所述第五符号标识信息用于标识所述第二关联对话数据中是否存在感叹号,所述第六符号标识信息用于标识所述第二关联对话数据中是否存在问号;
根据所述第五符号标识信息和第六符号标识信息,获得所述第三内容特征信息。
15.根据权利要求2所述的对话数据处理方法,其特征在于,所述原始对话数据包括文本数据、图像数据、音频数据以及视频数据。
16.一种对话数据处理方法,其特征在于,包括:
从用于为用户提供目标产品咨询服务的多用户对话群组中,获取原始对话数据;
从所述原始对话数据中,获取当前对话数据作为待分析对话数据,以及获取与所述待分析对话数据对应的关联对话数据,其中,所述关联对话数据与所述待分析对话数据之间满足预设的相关性条件;
根据所述待分析对话数据和所述关联对话数据,获得与所述待分析对话数据对应的目标内容特征信息和目标关联特征信息,其中,所述与所述待分析对话数据对应的目标内容特征信息通过以下方法获得:
将所述待分析对话数据输入到第一识别模型中,获取与所述待分析对话数据对应的第一内容特征信息,其中,所述第一识别模型用于识别所述待分析对话数据是否用于咨询第一问题;将与所述待分析对话数据对应的第一关联对话数据输入到第二识别模型中,获取与第二对话数据对应的第二内容特征信息,其中,所述第二识别模型用于识别所述第一关联对话数据是否为用于结束用于咨询第二问题对应的对话的对话数据;根据所述第一内容特征信息和所述第二内容特征信息,获得所述目标内容特征信息;
所述与所述待分析对话数据对应的目标关联特征信息通过以下方法获得:
获取所述待分析对话数据的发言人所对应的第一用户类型;判断所述待分析对话数据的发言人与所述第一关联对话数据的发言人是否相同,获得第一判断结果;获取所述待分析对话数据与第一关联对话数据所述待分析对话数据之间的时间间隔,作为第一时间间隔数据;根据所述第一用户类型、所述第一判断结果以及所述第一时间间隔数据,获得所述目标关联特征信息;
根据所述目标内容特征信息和所述目标关联特征信息,确定所述待分析对话数据是否为用于咨询所述目标产品的使用问题的对话数据。
17.一种数据推送方法,其特征在于,应用于服务端,包括:
获取客户端发送的原始对话数据;
获取与所述原始对话数据对应的目标问题清单数据,其中,所述目标问题清单数据是使用权利要求1-15中任意一项对话数据处理方法获得到的、包含至少一条用于咨询问题的对话数据的数据;
将所述目标问题清单数据推送给所述客户端。
18.根据权利要求17所述的数据推送方法,其特征在于,还包括:
获取所述客户端发送的用于获得目标任务数据的数据请求消息,其中,所述目标任务数据是与所述目标问题清单数据中用于咨询问题的对话数据对应的、用于针对所述问题进行处理的数据;
根据所述目标问题清单数据,生成所述目标任务数据;
将所述目标任务数据推送给所述客户端。
19.一种数据展示方法,其特征在于,应用于客户端,包括:
获取原始对话数据;
向服务端发送所述原始对话数据;
接收所述服务端推送的与所述原始对话数据对应的目标问题清单数据,其中,所述目标问题清单数据是所述服务端使用权利要求1-15中任意一项对话数据处理方法获得到的、包含至少一条用于咨询问题的对话数据的数据;
展示所述目标问题清单数据。
20.根据权利要求19所述的数据展示方法,其特征在于,还包括:
向所述服务端发送用于获得目标任务数据的数据请求消息,其中,所述目标任务数据是与所述目标问题清单数据中用于咨询问题的对话数据对应的、用于针对所述问题进行处理的数据;
接收所述服务端推送的所述目标任务数据;
展示所述目标任务数据。
21.一种对话数据处理装置,其特征在于,包括:
数据获取单元,用于从原始对话数据中,获取待分析对话数据,以及获取与所述待分析对话数据对应的关联对话数据,其中,所述关联对话数据与所述待分析对话数据之间满足预设的相关性条件;
特征信息获取单元,用于根据所述待分析对话数据和所述关联对话数据,获得与所述待分析对话数据对应的目标内容特征信息和目标关联特征信息,其中,所述与所述待分析对话数据对应的目标内容特征信息通过以下方法获得:
将所述待分析对话数据输入到第一识别模型中,获取与所述待分析对话数据对应的第一内容特征信息,其中,所述第一识别模型用于识别所述待分析对话数据是否用于咨询第一问题;将与所述待分析对话数据对应的第一关联对话数据输入到第二识别模型中,获取与第二对话数据对应的第二内容特征信息,其中,所述第二识别模型用于识别所述第一关联对话数据是否为用于结束用于咨询第二问题对应的对话的对话数据;根据所述第一内容特征信息和所述第二内容特征信息,获得所述目标内容特征信息;
所述与所述待分析对话数据对应的目标关联特征信息通过以下方法获得:
获取所述待分析对话数据的发言人所对应的第一用户类型;判断所述待分析对话数据的发言人与所述第一关联对话数据的发言人是否相同,获得第一判断结果;获取所述待分析对话数据与第一关联对话数据所述待分析对话数据之间的时间间隔,作为第一时间间隔数据;根据所述第一用户类型、所述第一判断结果以及所述第一时间间隔数据,获得所述目标关联特征信息;
确定单元,用于根据所述目标内容特征信息和所述目标关联特征信息,确定所述待分析对话数据是否用于咨询问题。
22.一种电子设备,其特征在于,包括:
处理器;
存储器,用于存储对话数据处理方法的程序,该设备通电并通过所述处理器运行所述对话数据处理方法的程序后,执行下述步骤:
获取待分析对话数据,以及获取与所述待分析对话数据对应的关联对话数据,其中,所述关联对话数据与所述待分析对话数据之间满足预设的相关性条件;
根据所述待分析对话数据和所述关联对话数据,获得与所述待分析对话数据对应的目标内容特征信息和目标关联特征信息,其中,所述与所述待分析对话数据对应的目标内容特征信息通过以下方法获得:
将所述待分析对话数据输入到第一识别模型中,获取与所述待分析对话数据对应的第一内容特征信息,其中,所述第一识别模型用于识别所述待分析对话数据是否用于咨询第一问题;将与所述待分析对话数据对应的第一关联对话数据输入到第二识别模型中,获取与第二对话数据对应的第二内容特征信息,其中,所述第二识别模型用于识别所述第一关联对话数据是否为用于结束用于咨询第二问题对应的对话的对话数据;根据所述第一内容特征信息和所述第二内容特征信息,获得所述目标内容特征信息;
所述与所述待分析对话数据对应的目标关联特征信息通过以下方法获得:
获取所述待分析对话数据的发言人所对应的第一用户类型;判断所述待分析对话数据的发言人与所述第一关联对话数据的发言人是否相同,获得第一判断结果;获取所述待分析对话数据与第一关联对话数据所述待分析对话数据之间的时间间隔,作为第一时间间隔数据;根据所述第一用户类型、所述第一判断结果以及所述第一时间间隔数据,获得所述目标关联特征信息;
根据所述目标内容特征信息和所述目标关联特征信息,确定所述待分析对话数据是否用于咨询问题。
23.一种对话数据处理装置,其特征在于,包括:
原始对话数据获取单元,从用于为用户提供目标产品咨询服务的多用户对话群组中,获取原始对话数据;
数据获取单元,从所述原始对话数据中,获取当前对话数据作为待分析对话数据,以及获取与所述待分析对话数据对应的关联对话数据,其中,所述关联对话数据与所述待分析对话数据之间满足预设的相关性条件;
特征信息获取单元,用于根据所述待分析对话数据和所述关联对话数据,获得与所述待分析对话数据对应的目标内容特征信息和目标关联特征信息,其中,所述与所述待分析对话数据对应的目标内容特征信息通过以下方法获得:
将所述待分析对话数据输入到第一识别模型中,获取与所述待分析对话数据对应的第一内容特征信息,其中,所述第一识别模型用于识别所述待分析对话数据是否用于咨询第一问题;将与所述待分析对话数据对应的第一关联对话数据输入到第二识别模型中,获取与第二对话数据对应的第二内容特征信息,其中,所述第二识别模型用于识别所述第一关联对话数据是否为用于结束用于咨询第二问题对应的对话的对话数据;根据所述第一内容特征信息和所述第二内容特征信息,获得所述目标内容特征信息;
所述与所述待分析对话数据对应的目标关联特征信息通过以下方法获得:
获取所述待分析对话数据的发言人所对应的第一用户类型;判断所述待分析对话数据的发言人与所述第一关联对话数据的发言人是否相同,获得第一判断结果;获取所述待分析对话数据与第一关联对话数据所述待分析对话数据之间的时间间隔,作为第一时间间隔数据;根据所述第一用户类型、所述第一判断结果以及所述第一时间间隔数据,获得所述目标关联特征信息;
确定单元,用于根据所述目标内容特征信息和所述目标关联特征信息,确定所述待分析对话数据是否为用于咨询所述目标产品的使用问题的对话数据。
24.一种电子设备,其特征在于,包括:
处理器;
存储器,用于存储对话数据处理方法的程序,该设备通电并通过所述处理器运行所述对话数据处理方法的程序后,执行下述步骤:
从用于为用户提供目标产品咨询服务的多用户对话群组中,获取原始对话数据;
从所述原始对话数据中,获取当前对话数据作为待分析对话数据,以及获取与所述待分析对话数据对应的关联对话数据,其中,所述关联对话数据与所述待分析对话数据之间满足预设的相关性条件;
根据所述待分析对话数据和所述关联对话数据,获得与所述待分析对话数据对应的目标内容特征信息和目标关联特征信息,其中,所述与所述待分析对话数据对应的目标内容特征信息通过以下方法获得:
将所述待分析对话数据输入到第一识别模型中,获取与所述待分析对话数据对应的第一内容特征信息,其中,所述第一识别模型用于识别所述待分析对话数据是否用于咨询第一问题;将与所述待分析对话数据对应的第一关联对话数据输入到第二识别模型中,获取与第二对话数据对应的第二内容特征信息,其中,所述第二识别模型用于识别所述第一关联对话数据是否为用于结束用于咨询第二问题对应的对话的对话数据;根据所述第一内容特征信息和所述第二内容特征信息,获得所述目标内容特征信息;
所述与所述待分析对话数据对应的目标关联特征信息通过以下方法获得:
获取所述待分析对话数据的发言人所对应的第一用户类型;判断所述待分析对话数据的发言人与所述第一关联对话数据的发言人是否相同,获得第一判断结果;获取所述待分析对话数据与第一关联对话数据所述待分析对话数据之间的时间间隔,作为第一时间间隔数据;根据所述第一用户类型、所述第一判断结果以及所述第一时间间隔数据,获得所述目标关联特征信息;
根据所述目标内容特征信息和所述目标关联特征信息,确定所述待分析对话数据是否为用于咨询所述目标产品的使用问题的对话数据。
25.一种数据推送装置,其特征在于,应用于服务端,包括:
数据获取单元,用于获取客户端发送的原始对话数据;
问题清单数据获取单元,用于获取与所述原始对话数据对应的目标问题清单数据,其中,所述目标问题清单数据是使用权利要求1-15中任意一项对话数据处理方法获得到的、包含至少一条用于咨询问题的对话数据的数据;
推送单元,用于将所述目标问题清单数据推送给所述客户端。
26.一种电子设备,其特征在于,应用于服务端,包括:
处理器;
存储器,用于存储数据推送方法的程序,该设备通电并通过所述处理器运行所述数据推送方法的程序后,执行下述步骤:
获取客户端发送的原始对话数据;
获取与所述原始对话数据对应的目标问题清单数据,其中,所述目标问题清单数据是使用权利要求1-15中任意一项对话数据处理方法获得到的、包含至少一条用于咨询问题的对话数据的数据;
将所述目标问题清单数据推送给所述客户端。
27.一种数据展示装置,其特征在于,应用于客户端,包括:
数据获取单元,用于获取原始对话数据;
数据发送单元,用于向服务端发送所述原始对话数据;
问题清单数据接收单元,用于接收所述服务端推送的与所述原始对话数据对应的目标问题清单数据,其中,所述目标问题清单数据是所述服务端使用权利要求1-15中任意一项对话数据处理方法获得到的、包含至少一条用于咨询问题的对话数据的数据;
展示单元,用于展示所述目标问题清单数据。
28.一种电子设备,其特征在于,应用于客户端,包括:
处理器;
存储器,用于存储数据展示方法的程序,该设备通电并通过所述处理器运行所述数据展示方法的程序后,执行下述步骤:
获取原始对话数据;
向服务端发送所述原始对话数据;
接收所述服务端推送的与所述原始对话数据对应的目标问题清单数据,其中,所述目标问题清单数据是所述服务端使用权利要求1-15中任意一项对话数据处理方法获得到的、包含至少一条用于咨询问题的对话数据的数据;
展示所述目标问题清单数据。
CN202010236572.5A 2020-03-30 2020-03-30 一种对话数据处理方法、装置、电子设备及存储设备 Active CN113468297B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202010236572.5A CN113468297B (zh) 2020-03-30 2020-03-30 一种对话数据处理方法、装置、电子设备及存储设备

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202010236572.5A CN113468297B (zh) 2020-03-30 2020-03-30 一种对话数据处理方法、装置、电子设备及存储设备

Publications (2)

Publication Number Publication Date
CN113468297A CN113468297A (zh) 2021-10-01
CN113468297B true CN113468297B (zh) 2024-02-27

Family

ID=77864874

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202010236572.5A Active CN113468297B (zh) 2020-03-30 2020-03-30 一种对话数据处理方法、装置、电子设备及存储设备

Country Status (1)

Country Link
CN (1) CN113468297B (zh)

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108399169A (zh) * 2017-02-06 2018-08-14 阿里巴巴集团控股有限公司 基于问答***的对话处理方法、装置和***及移动设备
CN108897771A (zh) * 2018-05-30 2018-11-27 东软集团股份有限公司 自动问答方法、装置、计算机可读存储介质及电子设备
CN109241251A (zh) * 2018-07-27 2019-01-18 众安信息技术服务有限公司 一种会话交互方法
CN110209897A (zh) * 2018-02-12 2019-09-06 腾讯科技(深圳)有限公司 智能对话方法、装置、存储介质及设备
CN110704586A (zh) * 2019-09-30 2020-01-17 支付宝(杭州)信息技术有限公司 一种信息处理方法及***

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20100241610A1 (en) * 2009-03-19 2010-09-23 Gibson James Allen Methods and systems for preserving and accessing information related to decision-making

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108399169A (zh) * 2017-02-06 2018-08-14 阿里巴巴集团控股有限公司 基于问答***的对话处理方法、装置和***及移动设备
CN110209897A (zh) * 2018-02-12 2019-09-06 腾讯科技(深圳)有限公司 智能对话方法、装置、存储介质及设备
CN108897771A (zh) * 2018-05-30 2018-11-27 东软集团股份有限公司 自动问答方法、装置、计算机可读存储介质及电子设备
CN109241251A (zh) * 2018-07-27 2019-01-18 众安信息技术服务有限公司 一种会话交互方法
CN110704586A (zh) * 2019-09-30 2020-01-17 支付宝(杭州)信息技术有限公司 一种信息处理方法及***

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
基于神经主题模型的对话情感分析;王建成;徐扬;刘启元;吴良庆;李寿山;;中文信息学报(第01期);全文 *

Also Published As

Publication number Publication date
CN113468297A (zh) 2021-10-01

Similar Documents

Publication Publication Date Title
WO2018224034A1 (zh) 智能问答方法、服务器、终端及存储介质
CN106685916B (zh) 电子会议智能装置及方法
CN107886949B (zh) 一种内容推荐方法及装置
WO2022095380A1 (zh) 基于ai的虚拟交互模型生成方法、装置、计算机设备及存储介质
US9621851B2 (en) Augmenting web conferences via text extracted from audio content
CN112365894B (zh) 基于ai的复合语音交互方法、装置及计算机设备
US20160239537A1 (en) Electronic meeting question management
US10468051B2 (en) Meeting assistant
CN107870896A (zh) 一种对话分析方法及装置
CN111382264A (zh) 会话质量评价方法、装置及电子设备
EP4020468A1 (en) System, method and apparatus for conversational guidance
CN115643341A (zh) 人工智能客服应答***
US11361754B2 (en) Method and system for speech effectiveness evaluation and enhancement
CN113111658B (zh) 校验信息的方法、装置、设备和存储介质
KR102327011B1 (ko) 상담 품질 향상 방법 및 장치
WO2021159734A1 (zh) 一种数据处理方法、装置、设备及介质
CN113468297B (zh) 一种对话数据处理方法、装置、电子设备及存储设备
CN112288584A (zh) 保险报案处理方法、装置、计算机可读介质及电子设备
CN117094690A (zh) 信息处理方法、电子设备及存储介质
US20220405862A1 (en) System for users to increase and monetize livestream audience engagement
US20230169272A1 (en) Communication framework for automated content generation and adaptive delivery
CN114363277A (zh) 基于社会关系的智能聊天方法、装置及相关产品
De Kok et al. Analyzing nonverbal listener responses using parallel recordings of multiple listeners
CN113158058A (zh) 服务信息的发送方法及装置、接收方法及装置
CN112632241A (zh) 智能会话的方法、装置、设备和计算机可读介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
REG Reference to a national code

Ref country code: HK

Ref legal event code: DE

Ref document number: 40063920

Country of ref document: HK

GR01 Patent grant
GR01 Patent grant