CN112434501B - 工单智能生成的方法、装置、电子设备及介质 - Google Patents

工单智能生成的方法、装置、电子设备及介质 Download PDF

Info

Publication number
CN112434501B
CN112434501B CN202011150090.4A CN202011150090A CN112434501B CN 112434501 B CN112434501 B CN 112434501B CN 202011150090 A CN202011150090 A CN 202011150090A CN 112434501 B CN112434501 B CN 112434501B
Authority
CN
China
Prior art keywords
work order
service
model
data
label model
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202011150090.4A
Other languages
English (en)
Other versions
CN112434501A (zh
Inventor
陈勇达
王振众
陈曦
麻志毅
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Advanced Institute of Information Technology AIIT of Peking University
Hangzhou Weiming Information Technology Co Ltd
Original Assignee
Advanced Institute of Information Technology AIIT of Peking University
Hangzhou Weiming Information Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Advanced Institute of Information Technology AIIT of Peking University, Hangzhou Weiming Information Technology Co Ltd filed Critical Advanced Institute of Information Technology AIIT of Peking University
Priority to CN202011150090.4A priority Critical patent/CN112434501B/zh
Publication of CN112434501A publication Critical patent/CN112434501A/zh
Application granted granted Critical
Publication of CN112434501B publication Critical patent/CN112434501B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/10Text processing
    • G06F40/166Editing, e.g. inserting or deleting
    • G06F40/186Templates
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/33Querying
    • G06F16/332Query formulation
    • G06F16/3329Natural language query formulation or dialogue systems
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/35Clustering; Classification
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • G06F40/205Parsing
    • G06F40/211Syntactic parsing, e.g. based on context-free grammar [CFG] or unification grammars
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • G06F40/205Parsing
    • G06F40/216Parsing using statistical methods
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02PCLIMATE CHANGE MITIGATION TECHNOLOGIES IN THE PRODUCTION OR PROCESSING OF GOODS
    • Y02P90/00Enabling technologies with a potential contribution to greenhouse gas [GHG] emissions mitigation
    • Y02P90/30Computing systems specially adapted for manufacturing

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Artificial Intelligence (AREA)
  • Computational Linguistics (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • General Health & Medical Sciences (AREA)
  • Mathematical Physics (AREA)
  • Databases & Information Systems (AREA)
  • Data Mining & Analysis (AREA)
  • Human Computer Interaction (AREA)
  • Probability & Statistics with Applications (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本申请公开了一种工单智能生成的方法、装置、电子设备及介质。其中,通过应用本申请的技术方案,可以首先根据历史时段的客服与用户的对话文本数据训练得到用于判断本次会话业务类别的第一分类标签模型和第二分类标签模型,以及用于填充工单具体内容的工单信息标签模型。进而避免相关技术中存在的每次客服与用户的业务会话中,均需要客服人员手动从模板库中寻找合适模板所导致的降低工作效率的问题。

Description

工单智能生成的方法、装置、电子设备及介质
技术领域
本申请中涉及数据处理技术,尤其是一种工单智能生成的方法、装置、电子设备及介质。
背景技术
由于通信时代和社会的兴起,用户经常会通过智能终端在业务平台上使用各种业务。
进一步的,利用电话与客服进行联系以获取对应的业务也成为了一种趋势。其中,客服普遍存在于各行各业中,用户服务热线通常为用户提供业务查询、充值缴费、业务办理、信息订阅等服务,客服热线服务质量代表企业形象。为保证优质服务质量,许多企业的售后客服实行全天24小时人工客服在线。客服人员在接听用户来电的同时需要记录用户个人信息和用户诉求,并在通话结束后手动载入工单模板填写工单。有时客服人员因遗忘重要信息还需要听电话录音以完成工单填写。
相关技术中,通常客服使用的工单***中需要预置几十上百种工单模版,客服人员需要在接听来电的同时,在***目录中浏览并寻找最合适的工单模板。然而这样的处理方式对于业务不熟练的员工来说,通常需要耗费客服人员较大的精力以及时间,从而降低工作效率。
发明内容
本申请实施例提供一种工单智能生成的方法、装置、电子设备及介质,本申请实施例用于解决相关技术中存在的每次客服与用户的业务会话中,均需要客服人员手动从模板库中寻找合适模板所导致的降低工作效率的问题。
其中,根据本申请实施例的一个方面,提供的一种工单智能生成的方法,其特征在于,包括:
获取历史时间段内,客服与用户在业务会话过程中生成的第一对话文本数据以及对应的第一工单数据;
基于所述第一对话文本数据以及对应的第一工单数据,训练得到第一分类标签模型、第二分类标签模型以及工单信息标签模型;
当采集到本次客服与用户在业务会话过程中生成的第二对话文本数据时,基于所述第一分类标签模型以及所述第二分类标签模型,确定本次业务会话对应的目标工单模板;
基于所述工单信息标签模型以及所述第二对话文本数据,将所述目标工单模板中的工单信息进行填充,得到本次会话的目标工单。
可选地,在基于本申请上述方法的另一个实施例中,在所述获取历史时间段内,客服与用户在业务会话过程中生成的第一对话文本数据以及对应的第一工单数据之后,还包括:
将所述第一对话文本数据以及对应的第一工单数据进行数据关联,得到关联后的历史数据;
将所述关联后的历史数据通过唯一标识位存储至逗号分隔值CSV文件。
可选地,在基于本申请上述方法的另一个实施例中,在所述将所述关联后的历史数据通过唯一标识位存储至逗号分隔值CSV文件之后,还包括:
将所述关联后的历史数据区分为用户文本数据以及客服文本数据;
分别获取所述用户文本数据以及所述客服文本数的最大词数值,以及对同一句式中,词数值不满足所述最大词数值的句式进行预设处理,所述预设处理包括零填充补全或截取处理的任意一种,得到第一处理文本;
获取所述客服文本数的最大句数值,以及,对所述第一处理文本中,句数值不满足所述最大句数值的文本进行所述预设处理,得到第二处理文本;
将所述第二处理文本作为样本训练数据。
可选地,在基于本申请上述方法的另一个实施例中,在所述将所述词式历史数据以及所述句式历史数据合并作为样本训练数据之后,还包括:
获取所述样本训练数据;
利用所述样本训练数据对随机初始化的第一层次注意力模型进行训练,得到满足预设条件的所述第一分类标签模型,其中所述第一分类标签模型用于确定对话文本数据的业务类型。
可选地,在基于本申请上述方法的另一个实施例中,在所述到满足预设条件的所述第一分类标签模型之后,还包括:
获取所述第一分类标签模型中清除输出层的模型参数以及所述样本训练数据;
利用所述模型参数以及所述样本训练数据对随机初始化的第二层次注意力模型进行训练,得到满足预设条件的所述第二分类标签模型,其中所述第二分类标签模型用于确定对话文本数据的业务类型下的子业务标签。
可选地,在基于本申请上述方法的另一个实施例中,在所述得到满足预设条件的所述第二分类标签模型之后,还包括:
从所述关联后的历史数据中提取第三数量的工单信息对应的业务类别,并分别建立对应的类别标签;
清除所述第一分类标签模型的输出层,并在所述第二分类标签模型输出的隐变量后,针对所述第一数量个输出层对每个工单信息的状态进行类别标签判断,得到对应的判断结果;
基于所述判断结果以及所述清除输出层的第二分类标签模型,生成所述工单信息标签模型。
可选地,在基于本申请上述方法的另一个实施例中,所述基于所述第一分类标签模型以及所述第二分类标签模型,确定本次业务会话对应的工单模板,包括:
将所述第二对话文本数据输入至所述第一分类标签模型,得到所述第二对话文本数据对应的主业务标签;
将所述业务类别标签以及所述第二对话文本数据输入至所述第二分类标签模型,得到所述第二对话文本数据对应的子业务标签;
从预存的多个不同业务标签的工单模板中,选取与所述主业务标签与所述子业务标签相匹配的目标工单模板。
可选地,在基于本申请上述方法的另一个实施例中,所述主业务标签包括以下至少一种:故障业务、咨询业务、投诉业务、业务办理业务;以及,
所述子业务标签包括以下至少一种:费用业务、人员业务、网站业务、设备业务、网络业务。
其中,根据本申请实施例的又一个方面,提供的一种工单智能生成的装置,其特征在于,包括:
获取模块,被配置为获取历史时间段内,客服与用户在业务会话过程中生成的第一对话文本数据以及对应的第一工单数据;
生成模块,被配置为基于所述第一对话文本数据以及对应的第一工单数据,训练得到第一分类标签模型、第二分类标签模型以及工单信息标签模型;
确定模块,被配置为当采集到本次客服与用户在业务会话过程中生成的第二对话文本数据时,基于所述第一分类标签模型以及所述第二分类标签模型,确定本次业务会话对应的目标工单模板;
填充模块,被配置为基于所述工单信息标签模型以及所述第二对话文本数据,将所述目标工单模板中的工单信息进行填充,得到本次会话的目标工单。
根据本申请实施例的又一个方面,提供的一种电子设备,包括:
存储器,用于存储可执行指令;以及
显示器,用于与所述存储器显示以执行所述可执行指令从而完成上述任一所述工单智能生成的方法的操作。
根据本申请实施例的还一个方面,提供的一种计算机可读存储介质,用于存储计算机可读取的指令,所述指令被执行时执行上述任一所述工单智能生成的方法的操作。
本申请中,可以获取历史时间段内,客服与用户在业务会话过程中生成的第一对话文本数据以及对应的第一工单数据;基于第一对话文本数据以及对应的第一工单数据,训练得到第一分类标签模型、第二分类标签模型以及工单信息标签模型;当采集到本次客服与用户在业务会话过程中生成的第二对话文本数据时,基于第一分类标签模型以及第二分类标签模型,确定本次业务会话对应的目标工单模板;基于工单信息标签模型以及第二对话文本数据,将目标工单模板中的工单信息进行填充,得到本次会话的目标工单。通过应用本申请的技术方案,可以首先根据历史时段的客服与用户的对话文本数据训练得到用于判断本次会话业务类别的第一分类标签模型和第二分类标签模型,以及用于填充工单具体内容的工单信息标签模型。进而避免相关技术中存在的每次客服与用户的业务会话中,均需要客服人员手动从模板库中寻找合适模板所导致的降低工作效率的问题。
下面通过附图和实施例,对本申请的技术方案做进一步的详细描述。
附图说明
构成说明书的一部分的附图描述了本申请的实施例,并且连同描述一起用于解释本申请的原理。
参照附图,根据下面的详细描述,可以更加清楚地理解本申请,其中:
图1为本申请提出的工单智能生成的示意图;
图2为本申请提出的第一分类标签模型以及第二分类标签模型的架构图;
图3为本申请提出的工单信息标签模型的架构图;
图4为本申请工单智能生成的电子装置的结构示意图;
图5为本申请显示电子设备结构示意图。
具体实施方式
现在将参照附图来详细描述本申请的各种示例性实施例。应注意到:除非另外具体说明,否则在这些实施例中阐述的部件和步骤的相对布置、数字表达式和数值不限制本申请的范围。
同时,应当明白,为了便于描述,附图中所示出的各个部分的尺寸并不是按照实际的比例关系绘制的。
以下对至少一个示例性实施例的描述实际上仅仅是说明性的,不作为对本申请及其应用或使用的任何限制。
对于相关领域普通技术人员已知的技术、方法和设备可能不作详细讨论,但在适当情况下,所述技术、方法和设备应当被视为说明书的一部分。
应注意到:相似的标号和字母在下面的附图中表示类似项,因此,一旦某一项在一个附图中被定义,则在随后的附图中不需要对其进行进一步讨论。
另外,本申请各个实施例之间的技术方案可以相互结合,但是必须是以本领域普通技术人员能够实现为基础,当技术方案的结合出现相互矛盾或无法实现时应当认为这种技术方案的结合不存在,也不在本申请要求的保护范围之内。
需要说明的是,本申请实施例中所有方向性指示(诸如上、下、左、右、前、后……)仅用于解释在某一特定姿态(如附图所示)下各部件之间的相对位置关系、运动情况等,如果该特定姿态发生改变时,则该方向性指示也相应地随之改变。
下面结合图1-图3来描述根据本申请示例性实施方式的用于进行工单智能生成的方法。需要注意的是,下述应用场景仅是为了便于理解本申请的精神和原理而示出,本申请的实施方式在此方面不受任何限制。相反,本申请的实施方式可以应用于适用的任何场景。
本申请还提出一种工单智能生成的方法、装置、目标终端及介质。
图1示意性地示出了根据本申请实施方式的一种工单智能生成的方法的流程示意图。如图1所示,该方法包括:
S101,获取历史时间段内,客服与用户在业务会话过程中生成的第一对话文本数据以及对应的第一工单数据。
首先,本申请不对历史时间段做具体限定,例如可以为一周,也可以为一个月等等。其中,第一对话文本数据即可以为用户与客服在沟通过程中的语音数据转换生成的文本数据。而第一工单数据则是在前次沟通过程中,客服人工手动选择的对应工单数据。
进一步的,在将用户与客服在沟通过程中的语音数据转换生成文本数据的过程中,可以首先进行语音识别技术将人类的语音中的词汇内容转换为计算机可读的输入,例如按键、二进制编码或者字符序列等等。其中,语音识别技术所涉及的领域包括:信号处理、模式识别、概率论和信息论、发声机理和听觉机理、人工智能等等。
再进一步的,还可以利用自然语音处理技术(Natural Language ProcessingNLP)对语音识别得到的数据进行文字识别。其中,NLP是计算机领域与人工智能领域中的一个重要分支。由于数据的大幅度增强、计算力的大幅度提升、深度学习实现端到端的训练。
S102,基于第一对话文本数据以及对应的第一工单数据,训练得到第一分类标签模型、第二分类标签模型以及工单信息标签模型。
进一步的,本申请中的第一分类标签模型可以为区分本次会话过程所述业务类型的模型,例如通常分为故障、咨询、投诉、业务办理等几大类别,提取工单一级类别作为工单一级分类模型的标签。
另外,本申请中的第二分类标签模型可以为以一级业务类别为咨询为例,其对应的工单模板又可分为:售后网址查询、费用查询、业务人员查询等二级工单模板类别,提取二级工单模板类别作为二级分类模型的标签。
再者,本申请中的工单信息标签模型可以为用于填充工单模板中的工单信息的模型。其中,工单信息即可以为工单模板中待填入的信息,例如可以为用户信息,业务地址,工单序列号等等。
进一步的,以业务类型为“信息查询”类型的工单模板为例,用户可以通过告知自身的地址、户名、身份证号的任意一种查询其想要的信息。并在确定用户通过身份份证号进行档案信息查询之后,将用户的身份证信息输入至工单模板中对应的工单信息位置处。
在一种方式中,本申请不对标签模型进行具体限定,例如可以为卷积神经网络模型,也可以为层次注意力网络模型(Hierarchical Attention Networks HAN)。
其中,层次注意力网络(HAN)是一种用于文档分类的神经网络。该模型有两个鲜明的特征:即具有层次结构(单词构成句子,句子形成文档),可以反映文档的层次结构,可以通过首先构建句子的表示然后将它们聚合成文档表示来构造文档表示。另外,还可以在单词和句子级别应用了两个级别的注意机制,使其能够在构建文档表示时区别地参与越来越重要的内容。
S103,当采集到本次客服与用户在业务会话过程中生成的第二对话文本数据时,基于第一分类标签模型以及第二分类标签模型,确定本次业务会话对应的目标工单模板。
进一步的,本申请实施例可以将预处理后的对话文本数据输入第一分类标签模型以及第二分类标签模型,进而根据两个分类标签模型输出的选择,从预设的多个工单模板中选择本次业务会话对应的目标工单模板。
例如可以在将预处理后的第一对话文本数据输入第一分类标签模型以及第二分类标签模型之后,得到本次业务会话对应的为费用查询业务,进而即可以从多个工单模板中选择费用查询对应的工单模板作为目标工单模型。
S104,基于工单信息标签模型以及第二对话文本数据,将目标工单模板中的工单信息进行填充,得到本次会话的目标工单。
进一步的,在确定本次业务会话对应的目标工单模板之后,即可以实施本次业务会话的工单信息提取,具体可以为将预处理后的第二对话文本数据输入基于多任务学习的工单信息标签模型实现工单信息的提取,进而将提取后的工单信息填入至随机初始化的目标工单模板中。
也就是说,本申请实施例可以通过对话文本的一级分类与二级分类得到随机初始化的目标工单模板。再基于预先对每一种业务类别制定对应的工单内容模板中,预留工单信息槽,以使此次将从第二对话文本中提取到的工单信息填入对应槽位从而完成工单内容的智能生成。
本申请中,可以获取历史时间段内,客服与用户在业务会话过程中生成的第一对话文本数据以及对应的第一工单数据;基于第一对话文本数据以及对应的第一工单数据,训练得到第一分类标签模型、第二分类标签模型以及工单信息标签模型;当采集到本次客服与用户在业务会话过程中生成的第二对话文本数据时,基于第一分类标签模型以及第二分类标签模型,确定本次业务会话对应的目标工单模板;基于工单信息标签模型以及第二对话文本数据,将目标工单模板中的工单信息进行填充,得到本次会话的目标工单。通过应用本申请的技术方案,可以首先根据历史时段的客服与用户的对话文本数据训练得到用于判断本次会话业务类别的第一分类标签模型和第二分类标签模型,以及用于填充工单具体内容的工单信息标签模型。进而避免相关技术中存在的每次客服与用户的业务会话中,均需要客服人员手动从模板库中寻找合适模板所导致的降低工作效率的问题。
可选的,在本申请一种可能的实施方式中,在S101(获取历史时间段内,客服与用户在业务会话过程中生成的第一对话文本数据以及对应的第一工单数据)之后,可以实施下述步骤:
将第一对话文本数据以及对应的第一工单数据进行数据关联,得到关联后的历史数据;
将关联后的历史数据通过唯一标识位存储至逗号分隔值CSV文件。
进一步的,由于通常来说,历史时段的用户与客服之间的语音通话转译后的对话文本和与其对应的人工录入工单是分开存放的。例如,客服人工录入的工单可以存于关系型数据库中,而通话转译文本因其文字内容较多,将文件压缩后直接存于服务器磁盘中。
那么为了获取模型训练的数据,本申请实施例首先要将第一业务对话文本与历史工单进行数据关联,并通过唯一标识位将对话文本与对应的工单关联后写入CSV文件。
其中,CSV文件是一种通用的、相对简单的文件格式。其被用户、商业和科学广泛应用。最广泛的应用是在程序之间转移表格数据,而这些程序本身是在不兼容的格式上进行操作的(往往是私有的和/或无规范的格式)。因为大量程序都支持某种CSV变体,所以采用CSV文件存储可以作为一种可选择的输入/输出格式。
可选的,在本申请一种可能的实施方式中,在将关联后的历史数据通过唯一标识位存储至逗号分隔值CSV文件之后,可以实施下述步骤:
将关联后的历史数据区分为用户文本数据以及客服文本数据;
分别获取用户文本数据以及客服文本数的最大词数值,以及对同一句式中,词数值不满足最大词数值的句式进行预设处理,预设处理包括零填充补全或截取处理的任意一种,得到第一处理文本;
获取客服文本数的最大句数值,以及,对第一处理文本中,句数值不满足最大句数值的文本进行预设处理,得到第二处理文本;
将第二处理文本作为样本训练数据。
进一步的,本申请实施例在对分类标签模型训练前,还可以将预处理的数据截断和补全后输入模型以作为训练数据。例如对会话文本中的每一句客服与用户的对话,均需要保留说话人身份(也即分为用户文本数据以及客服文本数据)。进而截取最大词数T(第一数量),对于每个句子若词数小于T(第一数量),则需要以零填充补全,若大于T(第一数量),则需要进行截取操作以保证词数为L,进而得到第二处理文本。
再者,对会话文本中的每一通对话,也需要截取最大句子数L(第二数量),若句子数小于L(第二数量),则需要进行零填充补全,若大于L(第二数量),则需要进行截取操作以保证句数为L,进而得到第二处理文本,并将第二处理文本作为样本训练数据。
其中,第一数量以及第二数量为超参数,可根据对话文本数据分布进行择优选取。本申请不对此进行具体限定。
可选的,在本申请一种可能的实施方式中,在将词式历史数据以及句式历史数据合并作为样本训练数据之后,还可以实施下述步骤:
获取样本训练数据;
利用样本训练数据对随机初始化的第一层次注意力模型进行训练,得到满足预设条件的第一分类标签模型,其中第一分类标签模型用于确定对话文本数据的业务类型。
本申请中,可以通过基于对话文本获取到的样本训练数据与对应的工单一级类别标签训练随机初始化的第一层次注意力模型,进而得到训练完成的第一分类标签模型;通过对话文本与工单二级类别标签训练对话文本二级分类模型。其中第一分类标签模型与第二分类标签模型均可以选用HAN模型(层次注意力模型)。HAN模型对一句话中的每个词表示向量赋予不同的权重求和得到句子表示向量,对每个句子表示向量赋予不同权重求和得到文本表示向量,模型能更关注于意图描述的词语与句子,实现对无用信息的过滤。
可选的,在本申请一种可能的实施方式中,在得到满足预设条件的第一分类标签模型之后,还可以实施下述步骤:
获取第一分类标签模型的模型参数以及样本训练数据;
利用模型参数以及样本训练数据对随机初始化的第二层次注意力模型进行训练,得到满足预设条件的第二分类标签模型,其中第二分类标签模型用于确定对话文本数据的业务类型下的子业务标签。
进一步的,如图2所示,为第一分类标签模型结构与第二分类标签模型的模型架构。由于第二分类标签模型结构与第一分类标签模型一致,模型的输入输出相似,且由于二级分类相较于一级分类数据量较小,因此在训练对话文本二级标签分类时利用迁移学习机制,模型初始化时加载对话文本一级分类模型除输出层以外的模型参数。通过加载一级分类模型参数可以使模型收敛更快,而且可以缓解因训练数据不足导致的过拟合问题。
进一步可选的,在本申请一种可能的实施方式中,在得到满足预设条件的第二分类标签模型之后,还可以实施下述步骤:
从关联后的历史数据中提取第三数量的工单信息对应的业务类别,并分别建立对应的类别标签;
清除第一分类标签模型的输出层,并在第二分类标签模型输出的隐变量后,利用多任务学习方式针对第一数量个输出层对每个工单信息的状态进行类别标签判断,得到对应的判断结果;
基于判断结果以及清除输出层的第二分类标签模型,生成工单信息标签模型。
进一步的,通过对话文本与工单信息训练多任务学习工单信息提取模型,用以提取对话文本中的关键信息要素,将工单内容生成任务转化为分类任务,从而实现任务简化,提高工单生成内容的准确性和规范性。
具体可以为从关联后的历史数据中提取第三数量的工单信息对应的业务类别,并分别建立对应的类别标签,构建多任务学习模型。其中,工单信息标签模型架构如图3所示,可以利用迁移学习思想,将第二分类标签模型去掉输出层并固定参数,根据工单信息的数量K,在模型最后输出的隐变量后连接K个输出层对每个工单信息的状态进行分类判断,输出层由全连接层和softmax组成。以上即完成工单信息状态判断的多任务学习模型组网,模型训练时仅更新输出层的参数。
更进一步的,通过这种多任务学习的方式可同时对K个(第三数量)工单信息进行状态分类,避免单独构建并训练K个(第三数量)分类模型对每个工单信息状态单独判断,可有效减小模型构建和训练的工作量并节省计算机资源。同时利用迁移学习思想可一定程度上解决某些工单信息状态分类数据不足导致的模型欠拟合或数据分布不均衡导致的过拟合问题。
进一步可选的,在本申请一种可能的实施方式中,基于第一分类标签模型以及第二分类标签模型,确定本次业务会话对应的工单模板,包括:
将第二对话文本数据输入至第一分类标签模型,得到第二对话文本数据对应的主业务标签;
将主业务标签以及第二对话文本数据输入至第二分类标签模型,得到第二对话文本数据对应的子业务标签;
从预存的多个不同业务标签的工单模板中,选取与主业务标签与子业务标签相匹配的目标工单模板。
本申请在确定目标工单模板的过程中,可以将预处理后的对话文本数据输入第一分类标签模型得主业务标签(例如故障业务标签、咨询业务标签、投诉业务标签、业务办理标签等等)。
更进一步的,还需要将主业务标签与对话文本数据输入第二分类标签模型得到子业务标签(例如费用业务标签、人员业务标签、网站业务标签、设备业务、网络业务等等),进而确定本次会话的业务属性,从而该业务属性的工单模板选择。
在本申请的另外一种实施方式中,如图4所示,本申请还提供一种工单智能生成的装置。其中,包括获取模块201,生成模块202,确定模块203,填充模块204,其中,
获取模块201,被配置为获取历史时间段内,客服与用户在业务会话过程中生成的第一对话文本数据以及对应的第一工单数据;
生成模块202,被配置为基于第一对话文本数据以及对应的第一工单数据,训练得到第一分类标签模型、第二分类标签模型以及工单信息标签模型;
确定模块203,被配置为当采集到本次客服与用户在业务会话过程中生成的第二对话文本数据时,基于第一分类标签模型以及第二分类标签模型,确定本次业务会话对应的目标工单模板;
填充模块204,被配置为基于工单信息标签模型以及第二对话文本数据,将目标工单模板中的工单信息进行填充,得到本次会话的目标工单。
本申请中,可以获取历史时间段内,客服与用户在业务会话过程中生成的第一对话文本数据以及对应的第一工单数据;基于第一对话文本数据以及对应的第一工单数据,训练得到第一分类标签模型、第二分类标签模型以及工单信息标签模型;当采集到本次客服与用户在业务会话过程中生成的第二对话文本数据时,基于第一分类标签模型以及第二分类标签模型,确定本次业务会话对应的目标工单模板;基于工单信息标签模型以及第二对话文本数据,将目标工单模板中的工单信息进行填充,得到本次会话的目标工单。通过应用本申请的技术方案,可以首先根据历史时段的客服与用户的对话文本数据训练得到用于判断本次会话业务类别的第一分类标签模型和第二分类标签模型,以及用于填充工单具体内容的工单信息标签模型。进而避免相关技术中存在的每次客服与用户的业务会话中,均需要客服人员手动从模板库中寻找合适模板所导致的降低工作效率的问题。
在本申请的另外一种实施方式中,获取模块201,还包括:
获取模块201,被配置为将第一对话文本数据以及对应的第一工单数据进行数据关联,得到关联后的历史数据;
获取模块201,被配置为将关联后的历史数据通过唯一标识位存储至逗号分隔值CSV文件。
在本申请的另外一种实施方式中,获取模块201,还包括:
获取模块201,被配置为将关联后的历史数据区分为用户文本数据以及客服文本数据;
获取模块201,被配置为分别获取所述用户文本数据以及所述客服文本数的最大词数值,以及对同一句式中,词数值不满足所述最大词数值的句式进行预设处理,所述预设处理包括零填充补全或截取处理的任意一种,得到第一处理文本;
获取模块201,被配置为获取所述客服文本数的最大句数值,以及,对所述第一处理文本中,句数值不满足所述最大句数值的文本进行所述预设处理,得到第二处理文本;
获取模块201,被配置为将所述第二处理文本作为样本训练数据。
在本申请的另外一种实施方式中,获取模块201,还包括:
获取模块201,被配置为获取样本训练数据;
获取模块201,被配置为利用样本训练数据对随机初始化的第一层次注意力模型进行训练,得到满足预设条件的第一分类标签模型,其中第一分类标签模型用于确定对话文本数据的业务类型。
在本申请的另外一种实施方式中,获取模块201,还包括:
获取模块201,被配置为获取第一分类标签模型的模型参数以及样本训练数据;
获取模块201,被配置为利用模型参数以及样本训练数据对随机初始化的第二层次注意力模型进行训练,得到满足预设条件的第二分类标签模型,其中第二分类标签模型用于确定对话文本数据的业务类型下的子业务标签。
在本申请的另外一种实施方式中,获取模块201,还包括:
获取模块201,被配置为从关联后的历史数据中提取第三数量的工单信息对应的业务类别,并分别建立对应的类别标签;
获取模块201,被配置为清除第一分类标签模型的输出层,并在第二分类标签模型输出的隐变量后,利用多任务学习方式针对第一数量个输出层对每个工单信息的状态进行类别标签判断,得到对应的判断结果;
获取模块201,被配置为基于判断结果以及清除输出层的第二分类标签模型,生成工单信息标签模型。
在本申请的另外一种实施方式中,获取模块201,还包括:
获取模块201,被配置为将第二对话文本数据输入至第一分类标签模型,得到第二对话文本数据对应的主业务标签;
获取模块201,被配置为将主业务标签以及第二对话文本数据输入至第二分类标签模型,得到第二对话文本数据对应的子业务标签;
获取模块201,被配置为从预存的多个不同业务标签的工单模板中,选取与主业务标签与子业务标签相匹配的目标工单模板。
在本申请的另外一种实施方式中,主业务标签包括以下至少一种:故障业务、咨询业务、投诉业务、业务办理;以及,子业务标签包括以下至少一种:费用业务、人员业务、网站业务、设备业务、网络业务。
图5是根据一示例性实施例示出的一种电子设备的逻辑结构框图。例如,电子设备300可以是移动电话,计算机,数字广播终端,消息收发设备,游戏控制台,平板设备,医疗设备,健身设备,个人数字助理等。
在示例性实施例中,还提供了一种包括指令的非临时性计算机可读存储介质,例如包括指令的存储器,上述指令可由电子设备处理器执行以完成上述工单智能生成的方法,该方法包括:获取历史时间段内,客服与用户在业务会话过程中生成的第一对话文本数据以及对应的第一工单数据;基于第一对话文本数据以及对应的第一工单数据,训练得到第一分类标签模型、第二分类标签模型以及工单信息标签模型;当采集到本次客服与用户在业务会话过程中生成的第二对话文本数据时,基于第一分类标签模型以及第二分类标签模型,确定本次业务会话对应的目标工单模板;基于工单信息标签模型以及第二对话文本数据,将目标工单模板中的工单信息进行填充,得到本次会话的目标工单。可选地,上述指令还可以由电子设备的处理器执行以完成上述示例性实施例中所涉及的其他步骤。例如,非临时性计算机可读存储介质可以是ROM、随机存取存储器(RAM)、CD-ROM、磁带、软盘和光数据存储设备等。
在示例性实施例中,还提供了一种应用程序/计算机程序产品,包括一条或多条指令,该一条或多条指令可以由电子设备的处理器执行,以完成上述工单智能生成的方法,该方法包括:获取历史时间段内,客服与用户在业务会话过程中生成的第一对话文本数据以及对应的第一工单数据;基于第一对话文本数据以及对应的第一工单数据,训练得到第一分类标签模型、第二分类标签模型以及工单信息标签模型;当采集到本次客服与用户在业务会话过程中生成的第二对话文本数据时,基于第一分类标签模型以及第二分类标签模型,确定本次业务会话对应的目标工单模板;基于工单信息标签模型以及第二对话文本数据,将目标工单模板中的工单信息进行填充,得到本次会话的目标工单。可选地,上述指令还可以由电子设备的处理器执行以完成上述示例性实施例中所涉及的其他步骤。
图5为计算机设备30的示例图。本领域技术人员可以理解,示意图5仅仅是计算机设备30的示例,并不构成对计算机设备30的限定,可以包括比图示更多或更少的部件,或者组合某些部件,或者不同的部件,例如计算机设备30还可以包括输入输出设备、网络接入设备、总线等。
所称处理器302可以是中央处理单元(Central Processing Unit,CPU),还可以是其他通用处理器、数字信号处理器(Digital Signal Processor,DSP)、专用集成电路(Application Specific Integrated Circuit,ASIC)、现场可编程门阵列(Field-Programmable Gate Array,FPGA)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件等。通用处理器可以是微处理器或者该处理器302也可以是任何常规的处理器等,处理器302是计算机设备30的控制中心,利用各种接口和线路连接整个计算机设备30的各个部分。
存储器301可用于存储计算机可读指令303,处理器302通过运行或执行存储在存储器301内的计算机可读指令或模块,以及调用存储在存储器301内的数据,实现计算机设备30的各种功能。存储器301可主要包括存储程序区和存储数据区,其中,存储程序区可存储操作***、至少一个功能所需的应用程序(比如声音播放功能、图像播放功能等)等;存储数据区可存储根据计算机设备30的使用所创建的数据等。此外,存储器301可以包括硬盘、内存、插接式硬盘,智能存储卡(Smart Media Card,SMC),安全数字(Secure Digital,SD)卡,闪存卡(Flash Card)、至少一个磁盘存储器件、闪存器件、只读存储器(Read-OnlyMemory,ROM)、随机存取存储器(Random Access Memory,RAM)或其他非易失性/易失性存储器件。
计算机设备30集成的模块如果以软件功能模块的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本发明实现上述实施例方法中的全部或部分流程,也可以通过计算机可读指令来指令相关的硬件来完成,的计算机可读指令可存储于一计算机可读存储介质中,该计算机可读指令在被处理器执行时,可实现上述各个方法实施例的步骤。
本领域技术人员在考虑说明书及实践这里公开的发明后,将容易想到本申请的其它实施方案。本申请旨在涵盖本申请的任何变型、用途或者适应性变化,这些变型、用途或者适应性变化遵循本申请的一般性原理并包括本申请未公开的本技术领域中的公知常识或惯用技术手段。说明书和实施例仅被视为示例性的,本申请的真正范围和精神由下面的权利要求指出。
应当理解的是,本申请并不局限于上面已经描述并在附图中示出的精确结构,并且可以在不脱离其范围进行各种修改和改变。本申请的范围仅由所附的权利要求来限制。

Claims (9)

1.一种工单智能生成的方法,其特征在于,包括:
获取历史时间段内,客服与用户在业务会话过程中生成的第一对话文本数据以及对应的第一工单数据;
基于所述第一对话文本数据以及对应的第一工单数据,训练得到第一分类标签模型、第二分类标签模型以及工单信息标签模型,其中所述第一分类标签模型与所述第二分类标签模型用于判断本次会话的业务类别;
当采集到本次客服与用户在业务会话过程中生成的第二对话文本数据时,基于所述第一分类标签模型以及所述第二分类标签模型,确定本次业务会话对应的目标工单模板;
基于所述工单信息标签模型以及所述第二对话文本数据,将所述目标工单模板中的工单信息进行填充,得到本次会话的目标工单;
其中,所述基于所述第一分类标签模型以及所述第二分类标签模型,确定本次业务会话对应的工单模板,包括:
将所述第二对话文本数据输入至所述第一分类标签模型,得到所述第二对话文本数据对应的主业务标签;
将所述主业务标签以及所述第二对话文本数据输入至所述第二分类标签模型,得到所述第二对话文本数据对应的子业务标签;
从预存的多个不同业务标签的工单模板中,选取与所述主业务标签与所述子业务标签相匹配的目标工单模板;
将所述第一对话文本数据以及对应的第一工单数据进行数据关联,得到关联后的历史数据;
在得到满足预设条件的所述第二分类标签模型之后,还包括:
从所述关联后的历史数据中提取第三数量的工单信息对应的业务类别,并分别建立对应的类别标签;
清除所述第一分类标签模型的输出层,并在所述第二分类标签模型输出的隐变量后,利用多任务学习方式针对第一数量个所述输出层对每个工单信息的状态进行类别标签判断,得到对应的判断结果;
基于所述判断结果以及清除输出层的第二分类标签模型,生成所述工单信息标签模型。
2.如权利要求1所述的方法,其特征在于,在所述获取历史时间段内,客服与用户在业务会话过程中生成的第一对话文本数据以及对应的第一工单数据之后,还包括:
将所述关联后的历史数据通过唯一标识位存储至逗号分隔值CSV文件。
3.如权利要求2所述的方法,其特征在于,在所述将所述关联后的历史数据通过唯一标识位存储至逗号分隔值CSV文件之后,还包括:
将所述关联后的历史数据区分为用户文本数据以及客服文本数据;
分别获取所述用户文本数据以及所述客服文本数的最大词数值,以及对同一句式中,词数值不满足所述最大词数值的句式进行预设处理,所述预设处理包括零填充补全或截取处理的任意一种,得到第一处理文本;
获取所述客服文本数的最大句数值,以及,对所述第一处理文本中,句数值不满足所述最大句数值的文本进行所述预设处理,得到第二处理文本;
将所述第二处理文本作为样本训练数据。
4.如权利要求3所述的方法,其特征在于,在将词式历史数据以及句式历史数据合并作为样本训练数据之后,还包括:
获取所述样本训练数据;
利用所述样本训练数据对随机初始化的第一层次注意力模型进行训练,得到满足预设条件的所述第一分类标签模型,其中所述第一分类标签模型用于确定对话文本数据的业务类型。
5.如权利要求3或4所述的方法,其特征在于,在所述得到满足预设条件的所述第一分类标签模型之后,还包括:
获取所述第一分类标签模型中清除输出层的模型参数,以及所述样本训练数据;
利用所述模型参数以及所述样本训练数据对随机初始化的第二层次注意力模型进行训练,得到满足预设条件的所述第二分类标签模型,其中所述第二分类标签模型用于确定对话文本数据的业务类型下的子业务标签。
6.如权利要求1所述的方法,其特征在于,所述主业务标签包括以下至少一种:故障业务、咨询业务、投诉业务、业务办理;以及,
所述子业务标签包括以下至少一种:费用业务、人员业务、网站业务、设备业务、网络业务。
7.一种工单智能生成的装置,其特征在于,包括:
获取模块,被配置为获取历史时间段内,客服与用户在业务会话过程中生成的第一对话文本数据以及对应的第一工单数据;
生成模块,被配置为基于所述第一对话文本数据以及对应的第一工单数据,训练得到第一分类标签模型、第二分类标签模型以及工单信息标签模型,其中所述第一分类标签模型与所述第二分类标签模型用于判断本次会话的业务类别;
确定模块,被配置为当采集到本次客服与用户在业务会话过程中生成的第二对话文本数据时,基于所述第一分类标签模型以及所述第二分类标签模型,确定本次业务会话对应的目标工单模板;
填充模块,被配置为基于所述工单信息标签模型以及所述第二对话文本数据,将所述目标工单模板中的工单信息进行填充,得到本次会话的目标工单;
其中,所述基于所述第一分类标签模型以及所述第二分类标签模型,确定本次业务会话对应的工单模板,包括:
将所述第二对话文本数据输入至所述第一分类标签模型,得到所述第二对话文本数据对应的主业务标签;
将所述主业务标签以及所述第二对话文本数据输入至所述第二分类标签模型,得到所述第二对话文本数据对应的子业务标签;
从预存的多个不同业务标签的工单模板中,选取与所述主业务标签与所述子业务标签相匹配的目标工单模板;
将所述第一对话文本数据以及对应的第一工单数据进行数据关联,得到关联后的历史数据;
在得到满足预设条件的所述第二分类标签模型之后,还包括:
从所述关联后的历史数据中提取第三数量的工单信息对应的业务类别,并分别建立对应的类别标签;
清除所述第一分类标签模型的输出层,并在所述第二分类标签模型输出的隐变量后,利用多任务学习方式针对第一数量个所述输出层对每个工单信息的状态进行类别标签判断,得到对应的判断结果;
基于所述判断结果以及清除输出层的第二分类标签模型,生成所述工单信息标签模型。
8.一种电子设备,其特征在于,包括:
存储器,用于存储可执行指令;以及,
处理器,用于与所述存储器显示以执行所述可执行指令从而完成权利要求1-6中任一所述工单智能生成的方法的操作。
9.一种计算机可读存储介质,用于存储计算机可读取的指令,其特征在于,所述指令被执行时执行权利要求1-6中任一所述工单智能生成的方法的操作。
CN202011150090.4A 2020-10-23 2020-10-23 工单智能生成的方法、装置、电子设备及介质 Active CN112434501B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202011150090.4A CN112434501B (zh) 2020-10-23 2020-10-23 工单智能生成的方法、装置、电子设备及介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202011150090.4A CN112434501B (zh) 2020-10-23 2020-10-23 工单智能生成的方法、装置、电子设备及介质

Publications (2)

Publication Number Publication Date
CN112434501A CN112434501A (zh) 2021-03-02
CN112434501B true CN112434501B (zh) 2024-07-02

Family

ID=74696004

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202011150090.4A Active CN112434501B (zh) 2020-10-23 2020-10-23 工单智能生成的方法、装置、电子设备及介质

Country Status (1)

Country Link
CN (1) CN112434501B (zh)

Families Citing this family (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113836864A (zh) * 2021-08-26 2021-12-24 广西电网有限责任公司来宾供电局 开发工单内容比对方法及***
CN113779216A (zh) * 2021-09-02 2021-12-10 携程计算机技术(上海)有限公司 基于多方对话的事件记录方法、***、设备及存储介质
CN117041633A (zh) * 2022-02-14 2023-11-10 杭州脸脸会网络技术有限公司 虚拟智能客服方法、装置、电子装置和存储介质
CN115871361A (zh) * 2022-11-28 2023-03-31 深圳市弘海精密科技有限公司 工程图纸打印方法、装置、电子设备及存储介质
CN116644145B (zh) * 2023-07-26 2023-10-13 北京仁科互动网络技术有限公司 会话数据处理方法、装置、设备和存储介质

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102572134A (zh) * 2010-12-30 2012-07-11 上海博泰悦臻电子设备制造有限公司 工单处理方法、工单建立***以及工单处理***
CN109726372A (zh) * 2017-10-31 2019-05-07 百度在线网络技术(北京)有限公司 基于通话记录的工单的生成方法、装置及计算机可读介质
CN110888968A (zh) * 2019-10-15 2020-03-17 浙江省北大信息技术高等研究院 客服对话意图分类方法及装置、电子设备及介质
CN111680497A (zh) * 2019-02-25 2020-09-18 北京嘀嘀无限科技发展有限公司 会话特征提取方法、会话识别模型训练方法及装置

Family Cites Families (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8898779B1 (en) * 2012-02-03 2014-11-25 Symantec Corporation Data loss prevention of information using structured document templates and forms
US11580179B2 (en) * 2018-09-24 2023-02-14 Salesforce.Com, Inc. Method and system for service agent assistance of article recommendations to a customer in an app session
US20200133439A1 (en) * 2018-10-31 2020-04-30 International Business Machines Corporation Chat session dynamic user interface
CN111581390B (zh) * 2019-02-19 2023-02-28 北京嘀嘀无限科技发展有限公司 一种知识图谱的构建方法、装置以及电子设备
CN111026867A (zh) * 2019-11-28 2020-04-17 杭州飞步科技有限公司 客诉处理方法和装置、电子设备、存储介质
CN111125317A (zh) * 2019-12-27 2020-05-08 携程计算机技术(上海)有限公司 对话型文本分类的模型训练、分类、***、设备和介质

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102572134A (zh) * 2010-12-30 2012-07-11 上海博泰悦臻电子设备制造有限公司 工单处理方法、工单建立***以及工单处理***
CN109726372A (zh) * 2017-10-31 2019-05-07 百度在线网络技术(北京)有限公司 基于通话记录的工单的生成方法、装置及计算机可读介质
CN111680497A (zh) * 2019-02-25 2020-09-18 北京嘀嘀无限科技发展有限公司 会话特征提取方法、会话识别模型训练方法及装置
CN110888968A (zh) * 2019-10-15 2020-03-17 浙江省北大信息技术高等研究院 客服对话意图分类方法及装置、电子设备及介质

Also Published As

Publication number Publication date
CN112434501A (zh) 2021-03-02

Similar Documents

Publication Publication Date Title
CN112434501B (zh) 工单智能生成的方法、装置、电子设备及介质
CN107612814A (zh) 用于生成候选回复信息的方法和装置
CN108305050B (zh) 报案信息及服务需求信息的提取方法、装置、设备及介质
CN105657129A (zh) 通话信息获取方法和装置
CN111400465B (zh) 客服机器人的生成方法、装置、电子设备及介质
CN110399473B (zh) 为用户问题确定答案的方法和装置
CN111221949A (zh) 基于强化学习的智能回访方法、装置、设备及存储介质
CN114549241A (zh) 合同审查方法、装置、***与计算机可读存储介质
CN111611370B (zh) 电费查询方法及电子设备
CN114841128B (zh) 基于人工智能的业务交互方法、装置、设备、介质及产品
CN117251547A (zh) 用户提问应答方法及其装置、设备、介质
CN111309882B (zh) 用于实现智能客服问答的方法和装置
CN108595141A (zh) 语音输入方法及装置、计算机装置和计算机可读存储介质
CN112288584A (zh) 保险报案处理方法、装置、计算机可读介质及电子设备
CN111782792A (zh) 用于信息处理的方法和装置
CN110046233A (zh) 问题派发方法及装置
CN109683727A (zh) 一种数据处理方法及装置
CN113987202A (zh) 一种基于知识图谱的交互电话呼入方法及装置
CN113422810A (zh) 向服务提供商发送信息的方法及设备
CN113192511A (zh) 信息录入方法、信息录入装置、电子设备以及存储介质
CN113378037A (zh) 资费配置的获取方法及装置
CN110222150A (zh) 一种自动提醒方法、自动提醒装置及计算机可读存储介质
CN112765331B (zh) 对话知识模板构建方法、装置、计算机设备及存储介质
CN117874211B (zh) 基于saas软件的智能问答方法、***、介质及电子设备
CN111414151B (zh) 流程类应用的页面生成方法、装置、电子设备和存储介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant