CN112463962A - 一种聊天记录质检方法及装置 - Google Patents
一种聊天记录质检方法及装置 Download PDFInfo
- Publication number
- CN112463962A CN112463962A CN202011291366.0A CN202011291366A CN112463962A CN 112463962 A CN112463962 A CN 112463962A CN 202011291366 A CN202011291366 A CN 202011291366A CN 112463962 A CN112463962 A CN 112463962A
- Authority
- CN
- China
- Prior art keywords
- chat
- data
- determining
- chat data
- classification
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000007689 inspection Methods 0.000 title claims abstract description 103
- 238000000034 method Methods 0.000 title claims abstract description 47
- 238000013145 classification model Methods 0.000 claims abstract description 58
- 238000009223 counseling Methods 0.000 claims description 21
- 238000012545 processing Methods 0.000 claims description 20
- 230000008569 process Effects 0.000 claims description 10
- 238000004422 calculation algorithm Methods 0.000 claims description 6
- 238000006243 chemical reaction Methods 0.000 claims description 6
- 238000012937 correction Methods 0.000 claims description 5
- 238000003908 quality control method Methods 0.000 claims 9
- 238000004590 computer program Methods 0.000 description 19
- 230000006870 function Effects 0.000 description 8
- 238000004364 calculation method Methods 0.000 description 5
- 238000012549 training Methods 0.000 description 5
- 230000006399 behavior Effects 0.000 description 4
- 230000006854 communication Effects 0.000 description 4
- 238000010586 diagram Methods 0.000 description 4
- 230000004044 response Effects 0.000 description 4
- 230000008878 coupling Effects 0.000 description 3
- 238000010168 coupling process Methods 0.000 description 3
- 238000005859 coupling reaction Methods 0.000 description 3
- 230000002452 interceptive effect Effects 0.000 description 3
- 238000004891 communication Methods 0.000 description 2
- 238000013527 convolutional neural network Methods 0.000 description 2
- 230000003247 decreasing effect Effects 0.000 description 2
- 238000002372 labelling Methods 0.000 description 2
- 238000013461 design Methods 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 230000010354 integration Effects 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 238000006467 substitution reaction Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/35—Clustering; Classification
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/33—Querying
- G06F16/3331—Query processing
- G06F16/334—Query execution
- G06F16/3346—Query execution using probabilistic model
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/30—Semantic analysis
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Computational Linguistics (AREA)
- Databases & Information Systems (AREA)
- Data Mining & Analysis (AREA)
- Probability & Statistics with Applications (AREA)
- Health & Medical Sciences (AREA)
- Artificial Intelligence (AREA)
- Audiology, Speech & Language Pathology (AREA)
- General Health & Medical Sciences (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
本申请适用于信息技术领域,提供了一种聊天记录质检方法及装置。本申请实施例中获取待处理的咨询服务单,根据所述咨询服务单的各条聊天数据类型对应的分类模型对所述各条聊天数据进行分类处理;确定所述各条聊天数据的分类结果,根据所述各条聊天数据的分类结果确定所述咨询服务单的质检结果,从而提高了质检员的质检效率。
Description
技术领域
本申请属于信息技术领域,尤其涉及一种聊天记录质检方法及装置。
背景技术
随着社会的发展,互联网行业在人们的生活中越来越常见,人们在互联网上通常会与人交谈或与相关网站客服进行线上咨询等交流过程,在这个交流过程中会产生大量的图片、文字以及语音等聊天记录,而为了保证服务质量,某些网站会设网站质检员,其主要职能是对上述所说的聊天记录进行检查,从而人工确定是否出现违规、违法等状况。但是由于咨询服务量的日渐增多,而出现问题的咨询服务也仅仅只占日渐增多的咨询服务量中小小的一部分,导致在聊天记录质检的过程中,存在大量干扰质检的聊天记录,再加上网站质检员的数量有限,其面对海量的咨询服务量仅能依照经验进行抽查,又很容易出现漏检现象,最终导致质检效率较低。
发明内容
本申请实施例提供了一种聊天记录质检方法及装置,可以解决质检员质检效率较低的问题。
第一方面,本申请实施例提供了一种聊天记录质检方法,包括:
获取待处理的咨询服务单,根据所述咨询服务单的各条聊天数据类型对应的分类模型对所述各条聊天数据进行分类处理;
确定所述各条聊天数据的分类结果,根据所述各条聊天数据的分类结果确定所述咨询服务单的质检结果。
可选的,所述根据所述咨询服务单的各条聊天数据的类型对应的分类模型对各条聊天数据进行分类处理,包括:
当所述聊天数据为图像类型时,确定所述图像类型对应的图像分类模型;
根据所述图像分类模型对所述图像类型的聊天数据进行分类处理。
可选的,所述根据所述咨询服务单的各条聊天数据的类型对应的分类模型对各条聊天数据进行分类处理,还包括:
当所述聊天数据为文字类型时,确定所述文字类型对应的语义分类模型;
根据所述语义分类模型对所述文字类型的聊天数据进行分类处理。
可选的,在所述聊天数据为文字类型之前,包括:
当所述聊天数据为语音类型时,根据预设的转化方式对所述语音类型的聊天数据进行转化,以使所述语音类型的聊天数据转化为所述文字类型的聊天数据。
可选的,所述确定所述各条聊天数据的分类结果,包括:
根据所述分类模型确定所述聊天数据所属的各个预设类别的概率;
根据所述各个预设类别的概率确定所述聊天数据的风险度;
根据所述聊天数据的风险度确定所述聊天数据的分类结果。
可选的,所述根据所述各个预设类别的概率确定所述聊天数据的风险度,包括:
确定所述聊天数据所属的各个预设类别对应的权重值;
以预设算法对所述各个预设类别的概率和各个预设类别对应的权重值进行计算,确定所述聊天数据的风险度。
可选的,所述根据所述各条聊天数据的分类结果确定所述咨询服务单的质检结果,包括:
获取所述咨询服务单的各个参数信息,确定所述各个参数信息对应的参数权重值;
根据所述各条聊天数据的分类结果和所述各个参数信息对应的参数权重值确定所述咨询服务单的质检结果。
可选的,所述根据所述各条聊天数据的分类结果和所述各个参数信息对应的参数权重值确定所述咨询服务单的质检结果,包括:
计算各个聊天数据的风险度和各个参数信息对应的参数权值的总和,将所述总和记为所述质检结果。
可选的,获取分类错误指令,根据所述分类错误指令将所述分类错误指令对应的聊天数据的类别进行标签修正。
第二方面,本申请实施例提供了一种聊天记录质检装置,包括:
分类处理模块,用于获取待处理的咨询服务单,根据所述咨询服务单的各条聊天数据类型对应的分类模型对所述各条聊天数据进行分类处理;
确定结果模块,用于确定所述各条聊天数据的分类结果,根据所述各条聊天数据的分类结果确定所述咨询服务单的质检结果。
第三方面,本申请实施例提供了一种终端设备,包括存储器、处理器以及存储在所述存储器中并可在所述处理器上运行的计算机程序,所述处理器执行所述计算机程序时实现上述任一种聊天记录质检方法的步骤。
第四方面,本申请实施例提供了一种计算机可读存储介质,所述计算机可读存储介质存储有计算机程序,所述的计算机程序被处理器执行时实现上述任一种聊天记录质检方法的步骤。
第五方面,本申请实施例提供了一种计算机程序产品,当计算机程序产品在终端设备上运行时,使得终端设备执行上述第一方面中任一种聊天记录质检方法。
本申请实施例中获取待处理的咨询服务单,根据所述咨询服务单的各条聊天数据类型对应的分类模型对所述各条聊天数据进行分类处理;确定所述各条聊天数据的分类结果,根据所述各条聊天数据的分类结果确定所述咨询服务单的质检结果。通过利用对应的分类模型对咨询服务单的各条聊天数据分类进行处理确定其分类结果,再根据各条聊天数据的分类结果来确定咨询服务单的质检结果,从而提高了质检员的质检效率。
附图说明
为了更清楚地说明本申请实施例中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本申请的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1是本申请实施例提供的聊天记录质检方法的第一种流程示意图;
图2是本申请实施例提供的聊天记录质检方法的第二种流程示意图;
图3是本申请实施例提供的聊天记录质检方法的第三种流程示意图;
图4是本申请实施例提供的聊天记录质检方法的第四种流程示意图;
图5是本申请实施例提供的聊天记录质检装置的结构示意图;
图6是本申请实施例提供的终端设备的结构示意图。
具体实施方式
以下描述中,为了说明而不是为了限定,提出了诸如特定***结构、技术之类的具体细节,以便透彻理解本申请实施例。然而,本领域的技术人员应当清楚,在没有这些具体细节的其它实施例中也可以实现本申请。在其它情况中,省略对众所周知的***、装置、电路以及方法的详细说明,以免不必要的细节妨碍本申请的描述。
应当理解,当在本申请说明书和所附权利要求书中使用时,术语“包括”指示所描述特征、整体、步骤、操作、元素和/或组件的存在,但并不排除一个或多个其它特征、整体、步骤、操作、元素、组件和/或其集合的存在或添加。
还应当理解,在本申请说明书和所附权利要求书中使用的术语“和/或”是指相关联列出的项中的一个或多个的任何组合以及所有可能组合,并且包括这些组合。
如在本申请说明书和所附权利要求书中所使用的那样,术语“如果”可以依据上下文被解释为“当...时”或“一旦”或“响应于确定”或“响应于检测到”。类似地,短语“如果确定”或“如果检测到[所描述条件或事件]”可以依据上下文被解释为意指“一旦确定”或“响应于确定”或“一旦检测到[所描述条件或事件]”或“响应于检测到[所描述条件或事件]”。
另外,在本申请说明书和所附权利要求书的描述中,术语“第一”、“第二”、“第三”等仅用于区分描述,而不能理解为指示或暗示相对重要性。
图1所示为本申请实施例中一种聊天记录质检方法的流程示意图,该方法的执行主体可以是终端设备,如图1所示,所述聊天记录质检方法可以包括如下步骤:
步骤S101、获取待处理的咨询服务单,根据所述咨询服务单的各条聊天数据类型对应的分类模型对所述各条聊天数据进行分类处理。
在本实施例中,人们在互联网上通常会与人交谈或与相关网站客服进行线上咨询等交流过程,在这个交流过程中会产生大量的图片、文字以及语音等聊天数据组成的咨询服务单,因咨询服务单中存在着各种不同类型的聊天数据,故为了提高对该咨询服务单进行质检的效率,可利用分类模型对咨询服务单中的各条聊天数据根据类型对应的分类处理,以确定当前各条聊天数据的风险度类别,可以更加准确的判断各条聊天数据所组成的咨询服务单的风险度。
可选的,如图2所示,步骤S101包括:
步骤S201、当所述聊天数据为图像类型时,确定所述图像类型对应的图像分类模型。
步骤S202、根据所述图像分类模型对所述图像类型的聊天数据进行分类处理。
在本实施例中,预先利用已知的图片以及针对该图片的人工标注的类别,来训练可进行图像分类的图像分类模型,在判断出咨询服务单中的聊天数据为图像类型时,可利用上述训练好的图像分类模型,来对上述图像类型的聊天数据进行分类处理,以得到该条聊天数据的风险度类别。
具体示例而非限定的,获取预设数量的图片,再将风险度划分为三个类别,分别为干扰质检的图像类别、疑似需要质检的图像类别以及需要质检的图像类别,根据上述三个类别将预设数量的图片人工进行类别标注,并利用所标注的图片训练上述图像分类模型。当终端设备检测到当前待处理的咨询服务单中存在图像类型的聊天数据时,利用已训练好的图像分类模型对该图像类型的聊天数据进行分类处理。
可选的,上述图像分类模型可以为基于卷积神经网络(Convolutional NeuralNetworks,CNN)的图像分类模型。
可选的,步骤S101还包括:
步骤S203、当所述聊天数据为文字类型时,确定所述文字类型对应的语义分类模型。
步骤S204、根据所述语义分类模型对所述文字类型的聊天数据进行分类处理。
在本实施例中,预先利用已知的文字以及针对该文字的人工标注的类别,来训练可进行语义分类的语义分类模型,在判断出咨询服务单中的聊天数据为文字类型时,可利用上述训练好的语义分类模型,来对上述文字类型的聊天数据进行分类处理,以得到该条聊天数据的风险度类别。
具体示例而非限定的,获取预设数量的文字聊天数据,再将风险度划分为三个类别,分别为干扰质检的文字类别、疑似需要质检的文字类别以及需要质检的文字类别,根据上述三个类别将预设数量的文字聊天数据人工进行类别标注,并利用所标注的文字聊天数据训练上述语义分类模型。当终端设备检测到当前待处理的咨询服务单中存在文字类型的聊天数据时,利用已训练好的语义分类模型对该文字类型的聊天数据进行分类处理。
可选的,上述语义分类模型可以为基于语义的深度网络分类模型。
可选的,在对上述文字类型的聊天数据进行分类处理之前,利用预设的中文预训练模型对所述文字类型的聊天数据进行语义向量化处理,再将语义向量化处理之后的聊天数据进行分类处理,上述中文预训练模型可以采用中文BERT预训练模型。
可选的,在步骤S203之前,包括:
当所述聊天数据为语音类型时,根据预设的转化方式对所述语音类型的聊天数据进行转化,以使所述语音类型的聊天数据转化为所述文字类型的聊天数据。
在本实施例中,当聊天数据的类型为语音类型时,可利用预设的转化方式,例如腾讯语音转文字API,来对语音类型的聊天数据进行转化,并转化文文字类型的聊天数据,以便于对该聊天数据进行分类处理。
步骤S102、确定所述各条聊天数据的分类结果,根据所述各条聊天数据的分类结果确定所述咨询服务单的质检结果。
在本实施例中,根据分类模型对各条聊天数据进行分类处理,来确定各条聊天数据的分类结果,再进行整合考虑,根据各条聊天数据的分类结果确定整体咨询服务单的质检结果,以便于质检人员根据质检结果进行进一步的审查,查看该质检结果有无错误,或者查看需要质检的咨询服务单中存在问题的地方,以便于提高质检员的质检效率。
可选的,如图3所示,步骤S102中的确定所述各条聊天数据的分类结果,包括:
步骤S301、根据所述分类模型确定所述聊天数据所属的各个预设类别的概率。
步骤S302、根据所述各个预设类别的概率确定所述聊天数据的风险度。
步骤S303、根据所述聊天数据的风险度确定所述聊天数据的分类结果。
在本实施例中,可根据上述各条聊天数据所对应的分类模型确定,各条聊天数据所属的各个预设类别的概率,根据各个类别的概率进行整体计算确定该条聊天数据的风险度,再根据该条聊天数据的风险度确定该条聊天数据的分类结果。
具体示例而非限定的,若当前聊天数据为文字类型聊天数据,将该聊天数据通过BERT模型转化为768个特征,每个特征取值区间为0至1,将768个特征作为输入源,输入至语义分类模型中,再利用该语义分类模型中的Softmax算法进行处理,输出所设定的各个类别的概率为多少,若所设定的类别为干扰质检的文字类别、疑似需要质检的文字类别以及需要质检的文字类别,那么即可得到上述各个类别所对应的概率是多少。
可选的,确定所述各条聊天数据的分类结果还可以包括,在根据分类模型确定上述聊天数据的各个预设类别的概率之后,将各个预设类别所对应的概率进行对比,选取最大概率所对应的类别为该聊天数据的分类结果。例如,若当前聊天数据为文字类型聊天数据,该文字类型的聊天数据所设定的类别对应的概率分别为干扰质检的文字类别0.08、疑似需要质检的文字类别0.12以及需要质检的文字类别0.8,则最大概率0.8所对应的类别为需要质检的文字类别,则该分类结果为需要质检的文字,可对该条聊天数据进行相应的提示操作,以便于质检人员及时发现咨询服务单中的需要质检的聊天数据。
可选的,还可将各条聊天数据中的需要质检的聊天数据以及疑似需要质检的聊天数据在咨询服务单中进行预设方式的显示,以使质检员能迅速看到,并进行质检,以提高质检员的效率。
可选的,步骤S302包括:
确定所述聊天数据所属的各个预设类别对应的权重值。
以预设算法对所述各个预设类别的概率和各个预设类别对应的权重值进行计算,确定所述聊天数据的风险度。
在本实施例中,将上述针对于聊天数据所属的各个类别设定权重值,该权重值可根据用户需求进行设定,当设定完成各个类别对应的权重值之后,计算各个类别与该类别对应的权重值的乘积,再计算各个乘积的总和,该总和为上述聊天数据的风险度,计算聊天数据的风险度的计算公式:
其中,上述Ai代表咨询服务单中第i条聊天数据的风险度;上述Wj为上述聊天数据中类别j对应的权重值;上述Pij为上述第i条聊天数据中类别j对应的概率,且Pi0+Pi1+···+PiM=1。
可选的,如图4所示,步骤S102中的根据所述各条聊天数据的分类结果确定所述咨询服务单的质检结果,包括:
步骤S401、获取所述咨询服务单的各个参数信息,确定所述各个参数信息对应的参数权重值。
在本实施例中,因咨询服务单中可能存在某种行为,而导致该咨询服务单的违规的风险度提升或降低,例如,若当前咨询服务单为最近预设时间内入职的客服,那么就有可能出现因言辞不当而出现被认为违规或风险度较高的聊天数据,故可获取针对该行为设置权重,加入至咨询服务单整体的风险度计算中,以提高咨询服务单的质检结果的准确性。前述参数信息也就是指上述行为,因咨询服务单重存在各个行为变量导致咨询服务单的违规的风险度提升或降低,故为了提高咨询服务单的质检结果的准确性,可获取咨询服务单的各个参数信息,并确定各个参数信息对应的参数权重值,以得到各个参数信息对应的风险度,计算各个参数信息对应的风险度的计算公式:
CZ=BZLZ
其中,上述CZ代表咨询服务单中参数信息Z的风险度;上述BZ代表咨询服务单中参数信息Z的权重值;上述LZ代表咨询服务单中是否存在参数信息Z,若存在,则LZ=1;若不存在,则LZ=0。
步骤S402、根据所述各条聊天数据的分类结果和所述各个参数信息对应的参数权重值确定所述咨询服务单的质检结果。
在本实施例中,根据所确定的各条聊天数据的分类结果,确定各条聊天数据的分类结果带来的咨询服务单的风险度,以及根据所述所确定的参数信息对应的参数权重值,确定参数信息带来的咨询服务单的风险度,将两者结合考虑确定咨询服务单整体的质检结果。
上述各条聊天数据的分类结果的计算公式:
其中,上述R代表上述各条聊天数据的分类结果确定的咨询服务单的风险度。
上述各个参数信息对应的参数权重值的计算公式:
其中,上述E代表上述各个参数信息对应的参数权重值确定的咨询服务单的风险度。
可选的,可设定风险度阈值,若当前咨询服务单的质检结果对应的风险度大于上述所设定的风险度阈值时,终端设备可进行报警操作。
可选的,可设定风险度范围值,若当前咨询服务单的质检结果对应的风险度小于或等于风险度范围值中的最小值,则将该咨询服务单设定为干扰质检的咨询服务单;若当前咨询服务单的质检结果对应的风险度大于或等于风险度范围值中的最大值,则将该咨询服务单设定为需要质检的咨询服务单,并以预设方式进行提示操作,以使质检员对该咨询服务单进行质检;若当前咨询服务单的质检结果对应的风险度处于风险度范围值内,则将该咨询服务单设定为疑似需要质检的咨询服务单。将上述定性好的各个类别的咨询服务单,分类别进行显示,以使质检员优先质检需要质检的咨询服务单以及疑似需要质检的咨询服务单,以提高质检员的质检效率。
可选的,因将当前咨询服务单的风险度作为咨询服务单的质检结果,故可将同一批次的各个带质检的咨询服务单以风险度从高到低进行排列显示,以使质检员优先质检风险度高的咨询服务单。
可选的,步骤S402包括:
计算各个聊天数据的风险度和各个参数信息对应的参数权值的总和,将所述总和记为所述质检结果。
在本实施例中,计算各个聊天数据的风险度和各个参数信息对应的参数权值的总和,将其总和得到的风险度作为整体咨询服务单的质检结果。
上述计算总和的计算公式:
D=R+E
其中,上述D代表上述咨询服务单的风险度。
可选的,获取分类错误指令,根据所述分类错误指令将所述分类错误指令对应的聊天数据的类别进行标签修正。
在本实施例中,若质检员在质检过程中发现咨询服务单中各条聊天数据根据分类模型所确定的类别或分类结果是错误的,则将分类错误指令发送给终端设备,该分类错误指令中包括分类错误的聊天数据以及该聊天数据对应的正确分类结果,终端设备再根据分类错误指令将分类错误指令对应的聊天数据的类别进行标签修正,以防止下次再遇到该类型的聊天数据时出现分类错误。
可选的,终端设备可每隔预设周期收集人工对其分类结果的反馈,该反馈中包括人工的标注结果,终端设备根据上述反馈对聊天数据的基于深度网络的分类模型进行增量训练,以使训练之后的分类结果更加符合预期。
本申请实施例中获取待处理的咨询服务单,根据所述咨询服务单的各条聊天数据类型对应的分类模型对所述各条聊天数据进行分类处理;确定所述各条聊天数据的分类结果,根据所述各条聊天数据的分类结果确定所述咨询服务单的质检结果。通过利用对应的分类模型对咨询服务单的各条聊天数据分类进行处理确定其分类结果,再根据各条聊天数据的分类结果来确定咨询服务单的质检结果,从而提高了质检员的质检效率。
应理解,上述实施例中各步骤的序号的大小并不意味着执行顺序的先后,各过程的执行顺序应以其功能和内在逻辑确定,而不应对本申请实施例的实施过程构成任何限定。
对应于上文所述的一种聊天记录质检方法,图5所示为本申请实施例中一种聊天记录质检装置的结构示意图,如图5所示,所述聊天记录质检装置可以包括:
分类处理模块501,用于获取待处理的咨询服务单,根据所述咨询服务单的各条聊天数据类型对应的分类模型对所述各条聊天数据进行分类处理。
确定结果模块502,用于确定所述各条聊天数据的分类结果,根据所述各条聊天数据的分类结果确定所述咨询服务单的质检结果。
可选的,所述分类处理模块501可以包括:
第一确定模型单元,用于当所述聊天数据为图像类型时,确定所述图像类型对应的图像分类模型。
第一分类处理单元,用于根据所述图像分类模型对所述图像类型的聊天数据进行分类处理。
可选的,所述分类处理模块501还可以包括:
第二确定模型单元,用于当所述聊天数据为文字类型时,确定所述文字类型对应的语义分类模型。
第二分类处理单元,用于根据所述语义分类模型对所述文字类型的聊天数据进行分类处理。
可选的,所述聊天记录质检装置还可以包括:
转化模块,用于当所述聊天数据为语音类型时,根据预设的转化方式对所述语音类型的聊天数据进行转化,以使所述语音类型的聊天数据转化为所述文字类型的聊天数据。
可选的,所述确定结果模块502可以包括:
确定概率单元,用于根据所述分类模型确定所述聊天数据所属的各个预设类别的概率。
确定风险度单元,用于根据所述各个预设类别的概率确定所述聊天数据的风险度。
确定分类结果单元,用于根据所述聊天数据的风险度确定所述聊天数据的分类结果。
可选的,所述确定风险度单元可以包括:
确定权重子单元,用于确定所述聊天数据所属的各个预设类别对应的权重值。
确定风险度子单元,用于以预设算法对所述各个预设类别的概率和各个预设类别对应的权重值进行计算,确定所述聊天数据的风险度。
可选的,所述确定结果模块502还可以包括:
确定权重单元,用于获取所述咨询服务单的各个参数信息,确定所述各个参数信息对应的参数权重值。
确定质检结果单元,用于根据所述各条聊天数据的分类结果和所述各个参数信息对应的参数权重值确定所述咨询服务单的质检结果。
可选的,所述确定质检结果单元可以包括:
计算总和子单元,用于计算各个聊天数据的风险度和各个参数信息对应的参数权值的总和,将所述总和记为所述质检结果。
可选的,所述聊天记录质检装置还可以包括:
修正模块,用于获取分类错误指令,根据所述分类错误指令将所述分类错误指令对应的聊天数据的类别进行标签修正。
本申请实施例中获取待处理的咨询服务单,根据所述咨询服务单的各条聊天数据类型对应的分类模型对所述各条聊天数据进行分类处理;确定所述各条聊天数据的分类结果,根据所述各条聊天数据的分类结果确定所述咨询服务单的质检结果。通过利用对应的分类模型对咨询服务单的各条聊天数据分类进行处理确定其分类结果,再根据各条聊天数据的分类结果来确定咨询服务单的质检结果,从而提高了质检员的质检效率。
所属领域的技术人员可以清楚地了解到,为描述的方便和简洁,上述描述的装置和模块的具体工作过程,可以参考前述***实施例以及方法实施例中的对应过程,在此不再赘述。
图6为本申请实施例提供的终端设备的结构示意图。为了便于说明,仅示出了与本申请实施例相关的部分。
如图6所示,该实施例的终端设备6包括:至少一个处理器600(图6中仅示出一个),与所述处理器600连接的存储器601,以及存储在所述存储器601中并可在所述至少一个处理器600上运行的计算机程序602,例如聊天记录质检程序。所述处理器600执行所述计算机程序602时实现上述各个聊天记录质检方法实施例中的步骤,例如图1所示的步骤S101至S102。或者,所述处理器600执行所述计算机程序602时实现上述各装置实施例中各模块的功能,例如图5所示模块501至502的功能。
示例性的,所述计算机程序602可以被分割成一个或多个模块,所述一个或者多个模块被存储在所述存储器601中,并由所述处理器600执行,以完成本申请。所述一个或多个模块可以是能够完成特定功能的一系列计算机程序指令段,该指令段用于描述所述计算机程序602在所述终端设备6中的执行过程。例如,所述计算机程序602可以被分割成分类处理模块501、确定结果模块502,各模块具体功能如下:
分类处理模块501,用于获取待处理的咨询服务单,根据所述咨询服务单的各条聊天数据类型对应的分类模型对所述各条聊天数据进行分类处理;
确定结果模块502,用于确定所述各条聊天数据的分类结果,根据所述各条聊天数据的分类结果确定所述咨询服务单的质检结果。
所述终端设备6可包括,但不仅限于,处理器600、存储器601。本领域技术人员可以理解,图6仅仅是终端设备6的举例,并不构成对终端设备6的限定,可以包括比图示更多或更少的部件,或者组合某些部件,或者不同的部件,例如还可以包括输入输出设备、网络接入设备、总线等。
所称处理器600可以是中央处理单元(Central Processing Unit,CPU),该处理器600还可以是其他通用处理器、数字信号处理器(Digital Signal Processor,DSP)、专用集成电路(Application Specific Integrated Circuit,ASIC)、现成可编程门阵列(Field-Programmable Gate Array,FPGA)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件等。通用处理器可以是微处理器或者该处理器也可以是任何常规的处理器等。
所述存储器601在一些实施例中可以是所述终端设备6的内部存储单元,例如终端设备6的硬盘或内存。所述存储器601在另一些实施例中也可以是所述终端设备6的外部存储设备,例如所述终端设备6上配备的插接式硬盘,智能存储卡(Smart Media Card,SMC),安全数字(Secure Digital,SD)卡,闪存卡(Flash Card)等。进一步地,所述存储器601还可以既包括所述终端设备6的内部存储单元也包括外部存储设备。所述存储器601用于存储操作***、应用程序、引导装载程序(Boot Loader)、数据以及其他程序等,例如所述计算机程序的程序代码等。所述存储器601还可以用于暂时地存储已经输出或者将要输出的数据。
所属领域的技术人员可以清楚地了解到,为了描述的方便和简洁,仅以上述各功能单元、模块的划分进行举例说明,实际应用中,可以根据需要而将上述功能分配由不同的功能单元、模块完成,即将所述装置的内部结构划分成不同的功能单元或模块,以完成以上描述的全部或者部分功能。实施例中的各功能单元、模块可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中,上述集成的单元既可以采用硬件的形式实现,也可以采用软件功能单元的形式实现。另外,各功能单元、模块的具体名称也只是为了便于相互区分,并不用于限制本申请的保护范围。上述***中单元、模块的具体工作过程,可以参考前述方法实施例中的对应过程,在此不再赘述。
在上述实施例中,对各个实施例的描述都各有侧重,某个实施例中没有详述或记载的部分,可以参见其它实施例的相关描述。
本领域普通技术人员可以意识到,结合本文中所公开的实施例描述的各示例的单元及算法步骤,能够以电子硬件、或者计算机软件和电子硬件的结合来实现。这些功能究竟以硬件还是软件方式来执行,取决于技术方案的特定应用和设计约束条件。专业技术人员可以对每个特定的应用来使用不同方法来实现所描述的功能,但是这种实现不应认为超出本申请的范围。
在本申请所提供的实施例中,应该理解到,所揭露的装置/终端设备和方法,可以通过其它的方式实现。例如,以上所描述的装置/终端设备实施例仅仅是示意性的,例如,所述模块或单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,例如多个单元或组件可以结合或者可以集成到另一个***,或一些特征可以忽略,或不执行。另一点,所显示或讨论的相互之间的耦合或直接耦合或通讯连接可以是通过一些接口,装置或单元的间接耦合或通讯连接,可以是电性,机械或其它的形式。
所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。
另外,在本申请各个实施例中的各功能单元可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中。上述集成的单元既可以采用硬件的形式实现,也可以采用软件功能单元的形式实现。
所述集成的单元如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本申请实现上述实施例方法中的全部或部分流程,可以通过计算机程序来指令相关的硬件来完成,所述的计算机程序可存储于一计算机可读存储介质中,该计算机程序在被处理器执行时,可实现上述各个方法实施例的步骤。其中,所述计算机程序包括计算机程序代码,所述计算机程序代码可以为源代码形式、对象代码形式、可执行文件或某些中间形式等。所述计算机可读介质至少可以包括:能够将计算机程序代码携带到拍照装置/终端设备的任何实体或装置、记录介质、计算机存储器、只读存储器(ROM,Read-Only Memory)、随机存取存储器(RAM,RandomAccess Memory)、电载波信号、电信信号以及软件分发介质。例如U盘、移动硬盘、磁碟或者光盘等。在某些司法管辖区,根据立法和专利实践,计算机可读介质不可以是电载波信号和电信信号。
以上所述实施例仅用以说明本申请的技术方案,而非对其限制;尽管参照前述实施例对本申请进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本申请各实施例技术方案的精神和范围,均应包含在本申请的保护范围之内。
Claims (10)
1.一种聊天记录质检方法,其特征在于,包括:
获取待处理的咨询服务单,根据所述咨询服务单的各条聊天数据类型对应的分类模型对所述各条聊天数据进行分类处理;
确定所述各条聊天数据的分类结果,根据所述各条聊天数据的分类结果确定所述咨询服务单的质检结果。
2.如权利要求1所述的聊天记录质检方法,其特征在于,所述根据所述咨询服务单的各条聊天数据的类型对应的分类模型对各条聊天数据进行分类处理,包括:
当所述聊天数据为图像类型时,确定所述图像类型对应的图像分类模型;
根据所述图像分类模型对所述图像类型的聊天数据进行分类处理。
3.如权利要求1所述的聊天记录质检方法,其特征在于,所述根据所述咨询服务单的各条聊天数据的类型对应的分类模型对各条聊天数据进行分类处理,还包括:
当所述聊天数据为文字类型时,确定所述文字类型对应的语义分类模型;
根据所述语义分类模型对所述文字类型的聊天数据进行分类处理。
4.如权利要求3所述的聊天记录质检方法,其特征在于,在所述聊天数据为文字类型之前,包括:
当所述聊天数据为语音类型时,根据预设的转化方式对所述语音类型的聊天数据进行转化,以使所述语音类型的聊天数据转化为所述文字类型的聊天数据。
5.如权利要求1所述的聊天记录质检方法,其特征在于,所述确定所述各条聊天数据的分类结果,包括:
根据所述分类模型确定所述聊天数据所属的各个预设类别的概率;
根据所述各个预设类别的概率确定所述聊天数据的风险度;
根据所述聊天数据的风险度确定所述聊天数据的分类结果。
6.如权利要求5所述的聊天记录质检方法,其特征在于,所述根据所述各个预设类别的概率确定所述聊天数据的风险度,包括:
确定所述聊天数据所属的各个预设类别对应的权重值;
以预设算法对所述各个预设类别的概率和各个预设类别对应的权重值进行计算,确定所述聊天数据的风险度。
7.如权利要求5所述的聊天记录质检方法,其特征在于,所述根据所述各条聊天数据的分类结果确定所述咨询服务单的质检结果,包括:
获取所述咨询服务单的各个参数信息,确定所述各个参数信息对应的参数权重值;
根据所述各条聊天数据的分类结果和所述各个参数信息对应的参数权重值确定所述咨询服务单的质检结果。
8.如权利要求7所述的聊天记录质检方法,其特征在于,所述根据所述各条聊天数据的分类结果和所述各个参数信息对应的参数权重值确定所述咨询服务单的质检结果,包括:
计算各个聊天数据的风险度和各个参数信息对应的参数权值的总和,将所述总和记为所述质检结果。
9.如权利要求1至8任一项所述的聊天记录质检方法,其特征在于,包括:
获取分类错误指令,根据所述分类错误指令将所述分类错误指令对应的聊天数据的类别进行标签修正。
10.一种聊天记录质检装置,其特征在于,包括:
分类处理模块,用于获取待处理的咨询服务单,根据所述咨询服务单的各条聊天数据类型对应的分类模型对所述各条聊天数据进行分类处理;
确定结果模块,用于确定所述各条聊天数据的分类结果,根据所述各条聊天数据的分类结果确定所述咨询服务单的质检结果。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202011291366.0A CN112463962A (zh) | 2020-11-18 | 2020-11-18 | 一种聊天记录质检方法及装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202011291366.0A CN112463962A (zh) | 2020-11-18 | 2020-11-18 | 一种聊天记录质检方法及装置 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN112463962A true CN112463962A (zh) | 2021-03-09 |
Family
ID=74836639
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202011291366.0A Pending CN112463962A (zh) | 2020-11-18 | 2020-11-18 | 一种聊天记录质检方法及装置 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN112463962A (zh) |
Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20180097902A1 (en) * | 2016-10-05 | 2018-04-05 | Fuji Xerox Co., Ltd. | Systems and methods for chat message management and document generation on devices |
CN110083689A (zh) * | 2019-03-20 | 2019-08-02 | 上海拍拍贷金融信息服务有限公司 | 客户服务质量检测方法及装置、可读存储介质 |
CN110929011A (zh) * | 2019-11-28 | 2020-03-27 | 北京思特奇信息技术股份有限公司 | 一种对话分析方法、装置和设备 |
CN111382264A (zh) * | 2018-12-27 | 2020-07-07 | 阿里巴巴集团控股有限公司 | 会话质量评价方法、装置及电子设备 |
CN111598485A (zh) * | 2020-05-28 | 2020-08-28 | 成都晓多科技有限公司 | 一种多维度智能质检方法、装置、终端设备及介质 |
CN111861501A (zh) * | 2019-12-16 | 2020-10-30 | 北京嘀嘀无限科技发展有限公司 | 申诉处理方法、处理***、计算机设备及存储介质 |
-
2020
- 2020-11-18 CN CN202011291366.0A patent/CN112463962A/zh active Pending
Patent Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20180097902A1 (en) * | 2016-10-05 | 2018-04-05 | Fuji Xerox Co., Ltd. | Systems and methods for chat message management and document generation on devices |
CN111382264A (zh) * | 2018-12-27 | 2020-07-07 | 阿里巴巴集团控股有限公司 | 会话质量评价方法、装置及电子设备 |
CN110083689A (zh) * | 2019-03-20 | 2019-08-02 | 上海拍拍贷金融信息服务有限公司 | 客户服务质量检测方法及装置、可读存储介质 |
CN110929011A (zh) * | 2019-11-28 | 2020-03-27 | 北京思特奇信息技术股份有限公司 | 一种对话分析方法、装置和设备 |
CN111861501A (zh) * | 2019-12-16 | 2020-10-30 | 北京嘀嘀无限科技发展有限公司 | 申诉处理方法、处理***、计算机设备及存储介质 |
CN111598485A (zh) * | 2020-05-28 | 2020-08-28 | 成都晓多科技有限公司 | 一种多维度智能质检方法、装置、终端设备及介质 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN111274782B (zh) | 一种文本审核方法、装置、计算机设备及可读存储介质 | |
CN111858242B (zh) | 一种***日志异常检测方法、装置及电子设备和存储介质 | |
CN109635292B (zh) | 基于机器学习算法的工单质检方法和装置 | |
CN111178410A (zh) | 违规图片的识别方法及装置 | |
WO2019242164A1 (zh) | 文档管理方法、装置、计算机设备及存储介质 | |
CN110851591A (zh) | 一种裁判文书的质量评估方法、装置、设备及存储介质 | |
CN112579621B (zh) | 数据展示方法、装置、电子设备及计算机存储介质 | |
CN112184143B (zh) | 一种合规审核规则中的模型训练方法、装置和设备 | |
WO2019056496A1 (zh) | 图片复审概率区间生成方法及图片复审判定方法 | |
CN113643260A (zh) | 用于检测图像质量的方法、装置、设备、介质和产品 | |
CN112528633A (zh) | 文本纠错方法、装置、电子设备及计算机可读存储介质 | |
CN112995690A (zh) | 直播内容品类识别方法、装置、电子设备和可读存储介质 | |
CN108804501B (zh) | 一种检测有效信息的方法及装置 | |
CN110569509A (zh) | 一种风险团伙识别的方法及装置 | |
CN113626717A (zh) | 一种舆情监测的方法、装置、电子设备和存储介质 | |
CN111783883A (zh) | 一种异常数据的检测方法及装置 | |
CN112463962A (zh) | 一种聊天记录质检方法及装置 | |
CN112882707B (zh) | 一种渲染方法、装置、存储介质及电子设备 | |
CN115660451A (zh) | 基于rpa的供应商风险预警方法、装置、设备及介质 | |
CN114581219A (zh) | 一种反电信网络诈骗预警方法及*** | |
CN113641823A (zh) | 文本分类模型训练、文本分类方法、装置、设备及介质 | |
CN110083807B (zh) | 合同的修改影响自动预测方法、装置、介质及电子设备 | |
CN110827261B (zh) | 图像质量检测方法及装置、存储介质及电子设备 | |
CN112395179A (zh) | 一种模型训练方法、磁盘预测方法、装置及电子设备 | |
CN113052509B (zh) | 模型评估方法、模型评估装置、电子设备和存储介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
CB02 | Change of applicant information |
Address after: 518000 Room 01, 20th Floor, Cuilin Building, No. 10, Kaifeng Road, Maling Community, Meilin Street, Futian District, Shenzhen, Guangdong Applicant after: Shenzhen Handhui Technology Group Co.,Ltd. Address before: 518000 20 / F, Cuilin building, 10 Kaifeng Road, Maling community, Meilin street, Futian District, Shenzhen City, Guangdong Province Applicant before: Shenzhen muchenglin Technology Co.,Ltd. |
|
CB02 | Change of applicant information |