CN114356982A - 营销合规性检查方法、装置、计算机设备及存储介质 - Google Patents
营销合规性检查方法、装置、计算机设备及存储介质 Download PDFInfo
- Publication number
- CN114356982A CN114356982A CN202111553260.8A CN202111553260A CN114356982A CN 114356982 A CN114356982 A CN 114356982A CN 202111553260 A CN202111553260 A CN 202111553260A CN 114356982 A CN114356982 A CN 114356982A
- Authority
- CN
- China
- Prior art keywords
- marketing
- communication data
- content
- compliance
- marketing communication
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Images
Landscapes
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
本发明实施例公开了营销合规性检查方法、装置、计算机设备及存储介质。所述方法包括:获取营销通话数据;对营销的理财产品提取结构化信息,以得到提取结果;对所述营销通话数据结合所述提取结果判断所述营销通话数据是否出现缺失的信息;若是,则确定缺失的信息;判断所述营销通话数据中是否出现过度承诺的不合规现象;若是,则筛选出过度承诺的内容;判断所述营销通话数据中是否出现敏感性内容;若是,则筛选出所述营销通话数据中的敏感性内容。通过实施本发明实施例的方法可实现对营销内容的合规性进行自动检查。
Description
技术领域
本发明涉及计算机,更具体地说是指营销合规性检查方法、装置、计算机设备及存储介质。
背景技术
在银行金融领域,有大量的推广营销场景如***拉新、存款、借贷、投资理财等业务场景,对于较高质量的用户,一般都由相关业务经理通过电话等方式进行推广营销;但由于银行业绩考核等原因,一些基层业务人员为了提高业绩转化,没有就营销推广产品的收益率、风险性、收益周期等产品特性,向客户进行充分必要地说明或再营销中存在情绪化态度问题,从而导致相关合规性问题,目前并没有对营销内容的合规性进行自动检查。
因此,有必要设计一种新的方法,实现对营销内容的合规性进行自动检查。
发明内容
本发明的目的在于克服现有技术的缺陷,提供营销合规性检查方法、装置、计算机设备及存储介质。
为实现上述目的,本发明采用以下技术方案:营销合规性检查方法,包括:
获取营销通话数据;
对营销的理财产品提取结构化信息,以得到提取结果;
对所述营销通话数据结合所述提取结果判断所述营销通话数据是否出现缺失的信息;
若所述营销通话数据出现缺失的信息,则确定缺失的信息;
判断所述营销通话数据中是否出现过度承诺的不合规现象;
若所述营销通话数据中出现过度承诺的不合规现象,则筛选出过度承诺的内容;
判断所述营销通话数据中是否出现敏感性内容;
若所述营销通话数据中出现敏感性内容,则筛选出所述营销通话数据中的敏感性内容。
其进一步技术方案为:所述获取营销通话数据,包括:
获取营销通话录音;
对所述营销通话录音转换为文本,以得到营销通话数据。
其进一步技术方案为:所述对营销的理财产品提取结构化信息,以得到提取结果,包括:
对营销的理财产品的介绍文档进行分词和实体识别,以得到营销业务化分词;
对所述营销业务化分词采用TextCNN文本分类和CRF序列化标注算法进行产品特性分类识别以及特性描述词汇识别,以得到提取结果。
其进一步技术方案为:所述对所述营销通话数据结合所述提取结果判断所述营销通话数据是否出现缺失的信息,包括:
对所述营销通话数据采用TextCNN模型进行产品特性项提取,以得到产品特性集合;
判断所述产品特性集合与所述提取结果是否一致;
若所述产品特性集合与所述提取结果一致,则确定所述营销通话数据未出现缺失的信息;
若所述产品特性集合与所述提取结果不一致,则确定所述营销通话数据出现缺失的信息。
其进一步技术方案为:所述确定缺失的信息,包括:
筛选存在所述提取结果但未存在所述产品特性集合内的信息,以得到缺失的信息。
其进一步技术方案为:所述判断所述营销通话数据中是否出现过度承诺的不合规现象,包括:
采用CRF序列模型对所述产品特性集合进行具体内容提取,以得到产品特性的内容字段项;
判断所述产品特性的内容字段项与所述提取结果内对应的内容字段项是否一致;
若所述产品特性的内容字段项与所述提取结果内对应的内容字段项不一致,则确定所述营销通话数据中出现过度承诺的不合规现象;
若所述产品特性的内容字段项与所述提取结果内对应的内容字段项一致,则确定所述营销通话数据中未出现过度承诺的不合规现象。
其进一步技术方案为:所述判断所述营销通话数据中是否出现敏感性内容,包括:
通过已训练的模型对所述营销通话数据进行脏话、敏感词以及情绪化分类识别,以得到识别结果;
判断所述识别结果是否是出现脏话或敏感词或情绪化表达的内容;
若所述识别结果出现脏话或敏感词或情绪化表达的内容,则确定所述营销通话数据中出现敏感性内容;
若所述识别结果未出现脏话或敏感词或情绪化表达的内容,则确定所述营销通话数据中未出现敏感性内容。
本发明还提供了营销合规性检查装置,包括:
数据获取单元,用于获取营销通话数据;
提取单元,用于对营销的理财产品提取结构化信息,以得到提取结果;
缺失判断单元,用于对所述营销通话数据结合所述提取结果判断所述营销通话数据是否出现缺失的信息;
确定单元,用于若所述营销通话数据出现缺失的信息,则确定缺失的信息;
过度承诺判断单元,用于判断所述营销通话数据中是否出现过度承诺的不合规现象;
过度承诺内容筛选单元,用于若所述营销通话数据中出现过度承诺的不合规现象,则筛选出过度承诺的内容;
敏感内容判断单元,用于判断所述营销通话数据中是否出现敏感性内容;
敏感内容筛选单元,用于若所述营销通话数据中出现敏感性内容,则筛选出所述营销通话数据中的敏感性内容。
本发明还提供了一种计算机设备,所述计算机设备包括存储器及处理器,所述存储器上存储有计算机程序,所述处理器执行所述计算机程序时实现上述的方法。
本发明还提供了一种存储介质,其特征在于,所述存储介质存储有计算机程序,所述计算机程序被处理器执行时可实现上述的方法。
本发明与现有技术相比的有益效果是:本发明通过获取营销通话数据,并对营销的理财产品提取结构化信息,以进行营销通话数据中是否出现缺失信息和过度承诺的现象的判断,还对营销通话数据是否出现脏话、敏感词以及情绪化语句进行识别,实现对营销内容的合规性进行自动检查,可提高银行营销服务的质量。
下面结合附图和具体实施例对本发明作进一步描述。
附图说明
为了更清楚地说明本发明实施例技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1为本发明实施例提供的营销合规性检查方法的应用场景示意图;
图2为本发明实施例提供的营销合规性检查方法的流程示意图;
图3为本发明实施例提供的营销合规性检查方法的子流程示意图;
图4为本发明实施例提供的营销合规性检查方法的子流程示意图;
图5为本发明实施例提供的营销合规性检查方法的子流程示意图;
图6为本发明实施例提供的营销合规性检查方法的子流程示意图;
图7为本发明实施例提供的营销合规性检查方法的子流程示意图;
图8为本发明实施例提供的营销合规性检查装置的示意性框图;
图9为本发明实施例提供的营销合规性检查装置的数据获取单元的示意性框图;
图10为本发明实施例提供的营销合规性检查装置的提取单元的示意性框图;
图11为本发明实施例提供的营销合规性检查装置的缺失判断单元的示意性框图;
图12为本发明实施例提供的营销合规性检查装置的过度承诺判断单元的示意性框图;
图13为本发明实施例提供的营销合规性检查装置的敏感内容判断单元的示意性框图;
图14为本发明实施例提供的计算机设备的示意性框图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
应当理解,当在本说明书和所附权利要求书中使用时,术语“包括”和“包含”指示所描述特征、整体、步骤、操作、元素和/或组件的存在,但并不排除一个或多个其它特征、整体、步骤、操作、元素、组件和/或其集合的存在或添加。
还应当理解,在此本发明说明书中所使用的术语仅仅是出于描述特定实施例的目的而并不意在限制本发明。如在本发明说明书和所附权利要求书中所使用的那样,除非上下文清楚地指明其它情况,否则单数形式的“一”、“一个”及“该”意在包括复数形式。
还应当进一步理解,在本发明说明书和所附权利要求书中使用的术语“和/或”是指相关联列出的项中的一个或多个的任何组合以及所有可能组合,并且包括这些组合。
请参阅图1和图2,图1为本发明实施例提供的营销合规性检查方法的应用场景示意图。图2为本发明实施例提供的营销合规性检查方法的示意性流程图。该营销合规性检查方法应用于服务器中。该服务器与终端进行数据交互,通过从终端获取营销通话数据,结合对营销的理财产品提取结构化信息,综合判断所述营销通话数据是否出现缺失的信息、过度承诺的不合规现象以及敏感性内容,实现对营销内容的合规性进行自动检查。
图2是本发明实施例提供的营销合规性检查方法的流程示意图。如图2所示,该方法包括以下步骤S110至S180。
S110、获取营销通话数据。
在本实施例中,营销通话数据是指营销通话录音转换为文本之后的数据。
银行***中业务经理进行电话营销推广时,都采用专门电话线路进行拨打,需要对营销推广的对话记录数据进行实时录音采集,此外还包括电话路线、业务经理身份ID、营销场景、通话时间、用户意向标记等信息。
在一实施例中,请参阅图3,上述的步骤S110可包括步骤S111~S112。
S111、获取营销通话录音。
在本实施例中,营销通话录音是指采用专门电话线路进行营销通话时的录音内容。
在银行***中,一般搭建专门的数字电话用于业务经理业务推广,该数字电话能将语音模拟型号转化为以SIP(由IETF因特网工程任务组制定的多媒体通信协议,Sessioninitialization Protocol)协议管控的RTP(实时传输协议,Real-time TransportProtocol)多媒体内容传输协议,进行TCP/IP的数字信息传输。当业务经理对***进行营销推广时,SIP电话首先请求部署在银行内部的运营商通信业务服务器,其连接到运营上通信网络并最终链接到用户手机,建立起SIP(会话初始协议,Session initializationProtocol)会话;在建立其会话之后,业务经理与用户之间的语音对话就能够通过数字电话进行分帧转码等处理,并最终转化为RTP通话语音流,因此,可以对整个通话进行录音记录,并且可以根据数据传输的方向进行分通道进行语音记录,将用户与业务经理的语音信息分别采集记录。
S112、对所述营销通话录音转换为文本,以得到营销通话数据。
实时记录以获取业务经理实时营销通话录音,虽然主要对业务经理进行营销合规性检查,但对于营销过程业务经理是否合规回答用户提问,是需要结合整个对话进行分析识别处理的,因此,需要将通话过程中的业务经理和用户说话信息都进行语音转化。由于本文内容重点在于对于合规性文本分析,对于语音识别主要是利用AI语音开放平台进行语音转写,语音识别开放平台有阿里、百度、讯飞等已做得非常出色,因此,本实施例采用相关开放平台API功能就可以实现电话语音转文本功能。经过上述处理操作之后,就能够获取得到银行营销推广业务中,业务经理全部语音通话对话信息。
S120、对营销的理财产品提取结构化信息,以得到提取结果。
在进行银行金融营销时,对于营销产品例如***拉新、办理存贷或投资理财,每个理财产品都有自己的产品特性,这些产品可能给客户带来信用记录、资金亏损等情况,因此银行对这些产品都有明确要求业务经理在营销时进行必须的产品特性介绍和风险提示说明。由于业务电话营销之后,用户可能并不感兴趣办理。因此,需要先对通话进行筛选,筛选出业务经理明确标记为“有意向”或“可能有意向”的用户,只对这部分通话进行风险提示缺失识别。
在本实施例中,提取结果是指银行营销产品特性结构化字段信息,具体如表1所示。
表1.提取结果
产品特性字段 | 描述文本 |
产品名称 | xxx |
产品类型 | 非保本浮动收益型产品 |
风险类型 | 中低风险 |
预期年化收益率 | 4.65% |
... | ... |
在一实施例中,请参阅图4,上述的步骤S120可包括步骤S121~S122。
S121、对营销的理财产品的介绍文档进行分词和实体识别,以得到营销业务化分词。
在本实施例中,营销业务化分词是指营销的理财产品的介绍文档进行分词以及实体识别后得到的词语以及分词信息。
S122、对所述营销业务化分词采用TextCNN文本分类和CRF序列化标注算法进行产品特性分类识别以及特性描述词汇识别,以得到提取结果。
具体地,每个营销的理财产品有自己的介绍说明,并对营销必要提示事项进行了详细列表,需要对相关产品的产品介绍文本和必要提示项进行识别处理。银行关于营销产品提供的相关文档大致包括:产品概览、购买说明书、风险揭示说明等几类,尤其重点关注产品说明书和风险揭示书中的有关内容。从相关文档中重点梳理并抽取相关银行推广营销产品特性如投资类型、风险评级、业绩比较基准、产品风险因子等信息,并且确定哪些特性介绍在业务推广过程中一定明确提到。在整理完毕这些基本产品特性字段项之后,根据产品文档进行相关内容的抽取,具体方法为:首先,对产品的介绍文档进行分词和实体识别,银行业务化词语和实体主要通过自动发现与人工整理相结合的方式获取而来;主要对银行的产品说明文档、购买说明文档、风险提示文档、产品公告、业务营销对话文本语料先利用文本标点进行分割成文本句片,然后对文本句片中的字进行NGram组合,将满足一定频率的NGram交由人工整理审核,从而得到银行业务词汇。银行业务化词汇加入到通用分词模型中,在分词时先利用这些业务化词语进行匹配对文本事先进行BI标记,然后再利用通用分词模型对为匹配词语进行标记分类,从而得到银行营销业务化分词。
具体地,B、I是文本分词序列化标识符号体系,B表示序列中词语开始,I表示序列词语中间部分。例如:“大额至少20万元以上”分词为“大额”、“至少”、“20万元”、“以上”,该文本序列化的BI表示方式为“B I B I B I I I B I”分别对应文本每个字,第一个“B I”表示“大”是词语的开头、“额”是词语中间,而第三个位置由于是“B”,其表示新词“至少”的开头,同时也表示“大额”这个词语结束了。
其次,对产品特性进行文本分类抽取。在对产品文本按照银行营销业务化分词和实体识别之后,就需要根据识别出来的银行营销业务化分词和分词信息,采用TextCNN文本分类和CRF(条件随机场,Conditional Random Fields)序列化标注算法,对介绍文档中的句段依次进行产品特性分类识别和特性描述词汇识别,从而识别出产品特性描述句段信息,例如描述产品投资类型、风险评级、主要风险因子等产品特性描述句段信息,从而获取得到银行营销产品特性结构化字段信息。
S130、对所述营销通话数据结合所述提取结果判断所述营销通话数据是否出现缺失的信息。
对于风险提示缺失合规性检查,就是需要根据上述挖掘出来的银行理财产品结构化信息进行对比,通过自动模型判别哪些关键数据项在业务经理营销通话过程中没有提及到,由此确定是否出现缺失的信息。
在一实施例中,请参阅图5,上述的步骤S130可包括步骤S131~S134。
S131、对所述营销通话数据采用TextCNN模型进行产品特性项提取,以得到产品特性集合。
在本实施例中,产品特性集合是指营销通话数据中所提及的产品特性项构成的集合。
由于电话通话中对于产品特性的介绍,可能是用户问到,而业务经理只是简要回答,因此关于某个产品特性的提示说明,虽然重点是对业务经理的话术进行识别,但是也需要上下文的用户提问进行分析。因此,对于待识别的客户经理每一句话,都需要加上前后紧邻的用户话术,即<用户前文话术,业务经理当前话术,用户后文话术>的形式进行识别判断。
对于产品特性项说明,采用具体识别方法是采用TextCNN模型,TextCNN模型主要是用于特性项分类识别。TextCNN模型的建模过程如下:
TextCNN是分类模型,可以将一段话是否提到某个产品特性项看成是分类问题。具体:将“全部产品特性项+其他”看成是待分别的全部类别,其中,“其他”表示什么产品特性项也没有提到,而文本分类的特征则采用上述<用户前面话术,业务经理当前话术,用户后面话术>的全部分词和实体识别特征。由于TextCNN是一个深度学习模型,其输入需要进行特征化处理,因此,将这些分词与实体识别结果采用Word2Vec方式进行向量化表示。而TextCNN的输出是“全部产品特性项+其他”全部类别中每个类别的概率,并且由于一句话可能会存在提到多个产品特性项,因此,将每个类别按照概率从高到低排列,如果第N个类别的概率大于一定阈值并且与第一个最佳类别概率差值小于一定阈值,那么,就将第一到第N的都视为有正常提示说明。如此以来,便获取得到了一通对话中,业务经理对于该产品提到了的产品特性项全部集合。
S132、判断所述产品特性集合与所述提取结果是否一致;
S133、若所述产品特性集合与所述提取结果一致,则确定所述营销通话数据未出现缺失的信息;
S134、若所述产品特性集合与所述提取结果不一致,则确定所述营销通话数据出现缺失的信息。
通过产品特性项全部集合与提取结果进行对比,就获取得到在营销过程中哪些没有内容缺失了。如果缺失信息,且该信息是必须要介绍到的,那么就可以将该通对话识别为提示缺失性不合规,也就是所述营销通话数据出现缺失的信息。
S140、若所述营销通话数据出现缺失的信息,则确定缺失的信息。
在本实施例中,缺失的信息是指该信息是必须要介绍到的但没有在通话中介绍到的产品特性项。
具体地,筛选存在所述提取结果但未存在所述产品特性集合内的信息,以得到缺失的信息。
S150、判断所述营销通话数据中是否出现过度承诺的不合规现象。
有些营销场景也需要对营销产品的产品特性项进行具体特性内容层面的对比,例如查看业务经理是否如实反馈相关收益,有没有存在夸大成分,因此,需要进行营销通话数据中是否出现过度承诺的不合规现象的判断。
在一实施例中,请参阅图6,上述的步骤S150可包括步骤S151~S154。
S151、采用CRF序列模型对所述产品特性集合进行具体内容提取,以得到产品特性的内容字段项。
在本实施例中,产品特性的内容字段项是指产品特性对应的具体内容。
对于当前通话片段<用户前文话术,业务经理当前话术,用户后文话术>有没有提到某个产品特性进行判断,当提到了该产品特性,就可以根据CRF序列模型进行具体内容的抽取,CRF是一个序列抽取模型,采用与深度模型相结合的方式对业务经理话术中的产品特性项的具体字段内容继续抽取,具体为:将TextCNN识别出来的产品特性项列表结果即产品特性集合进行向量化表示,此时可能存在多个向量,并与当前业务经理话术中即营销通话数据中的业务经理所说的内容的分词的Word Embedding进行语义拼接,最终组合成一个向量矩阵信息,经过深度BiLSTM双向长短记忆循环网络进行语义特征抽取,最后在上层采用CRF的Viterbi最佳匹配路径解码算法,以得到最终的实体最佳标签匹配序列,从而完成产品特性的内容字段项抽取。
S152、判断所述产品特性的内容字段项与所述提取结果内对应的内容字段项是否一致;
S153、若所述产品特性的内容字段项与所述提取结果内对应的内容字段项不一致,则确定所述营销通话数据中出现过度承诺的不合规现象;
S154、若所述产品特性的内容字段项与所述提取结果内对应的内容字段项一致,则确定所述营销通话数据中未出现过度承诺的不合规现象。
获取得到在通话过程中的业务经理对产品特性项的回答信息,例如对于收益率和风险等级、产品保本性等方面的回答,也就是产品特性的内容字段项,进一步进行产品特性字段内容对比,来确定营销合规性。具体方法为:
对于产品特性的内容字段项是数值型产品特性字段,需要进行数字大小以及数值范围的对比。这里需要将提取结果中的产品特性字段内容,与从业务经理话术中识别抽取出来内容进行数值化处理转化,转化为具体数据或者数值范围,然后分别对比数值或数值范围上下限,如果数值不等、数值下限不等或者数值上限不等,则认为营销承诺不合规。例如,产品本身的收益率在3%到5%,而业务经理说至少收益3%以上,而不进行收益上限限定说明,那么收益上限不匹配,则收益承诺不合规。对于产品特性的内容字段项是限定等级性字段,例如风险等级,有高风险、低风险、无风险等,一个产品本来是低风险,而业务经理说么有风险;或者高风险说成低风险,那么也视为不合规。对于产品特性的内容字段项是赎回时间性字段,也进行时间范围解析和对比。例如封闭期至少1年,而客户经理说半年多就可以赎回,那么则认为承诺不合规。
S160、若所述营销通话数据中出现过度承诺的不合规现象,则筛选出过度承诺的内容。
在本实施例中,过度承诺的内容是指营销通话数据中承诺不合规的内容。
S170、判断所述营销通话数据中是否出现敏感性内容。
在本实施例中,敏感性内容是指脏话、敏感词以及情绪化语句。
在一实施例中,请参阅图7,上述的步骤S170可包括步骤S171~S174。
S171、通过已训练的模型对所述营销通话数据进行脏话、敏感词以及情绪化分类识别,以得到识别结果。
在本实施例中,识别结果是指所述营销通话数据中是否出现脏话、敏感词以及情绪化语句。
S172、判断所述识别结果是否是出现脏话或敏感词或情绪化表达的内容;
S173、若所述识别结果出现脏话或敏感词或情绪化表达的内容,则确定所述营销通话数据中出现敏感性内容;
S174、若所述识别结果未出现脏话或敏感词或情绪化表达的内容,则确定所述营销通话数据中未出现敏感性内容。
银行严禁杜绝辱骂客户的行为,通过脏话识别模型进行识别。具体为通过收集整理脏话词语,通过词语匹配的模式进行识别,如果业务经理营销话术中出现脏话字眼则识别成不合规问题。同脏话识别一样,需要对一些敏感词进行识别,特别是对涉及到国家领导人等话术进行识别,也可采用模型识别的方式执行,当出现这类问题时,也视为不合规。
除了上述基于分词的识别,按照模型分类方式对一些消极情绪化表达进行泛化识别。具体为采用TextCNN分类模型,对业务经理的上下文语言进行拼接,由此得到<业务经理前文话术,业务经理当前话术,业务经理下文话术>,从而获取得到业务经理的话术文本,然后采用分词、实体识别等,为了增加准确性,也将脏话词、人物敏感词、消极情绪化词语通过人工词典的方式加入到分词中,最后采用Word2Vec方式进行语义向量化表示,最后将问句映射分类成{消极情绪化、正常}两大类,由此识别出消极情绪化的语句。
S180、若所述营销通话数据中出现敏感性内容,则筛选出所述营销通话数据中的敏感性内容。
具体地,当识别到营销通话数据中出现敏感性内容,则直接输出这些敏感性内容。
若所述营销通话数据未出现缺失的信息,则执行所述步骤S150;
若所述营销通话数据中未出现过度承诺的不合规现象,则执行所述步骤S170;
若所述营销通话数据中未出现敏感性内容,则进入结束步骤。
上述的营销合规检查方法,通过获取营销通话数据,并对营销的理财产品提取结构化信息,以进行营销通话数据中是否出现缺失信息和过度承诺的现象的判断,还对营销通话数据是否出现脏话、敏感词以及情绪化语句进行识别,实现对营销内容的合规性进行自动检查,可提高银行营销服务的质量。
图8是本发明实施例提供的一种营销合规性检查装置300的示意性框图。如图8所示,对应于以上营销合规性检查方法,本发明还提供一种营销合规性检查装置300。该营销合规性检查装置300包括用于执行上述营销合规性检查方法的单元,该装置可以被配置于服务器中。具体地,请参阅图8,该营销合规性检查装置300包括数据获取单元301、提取单元302、缺失判断单元303、确定单元304、过度承诺判断单元305、过度承诺内容筛选单元306、敏感内容判断单元307以及敏感内容筛选单元308。
数据获取单元301,用于获取营销通话数据;提取单元302,用于对营销的理财产品提取结构化信息,以得到提取结果;缺失判断单元303,用于对所述营销通话数据结合所述提取结果判断所述营销通话数据是否出现缺失的信息;确定单元304,用于若所述营销通话数据出现缺失的信息,则确定缺失的信息;过度承诺判断单元305,用于判断所述营销通话数据中是否出现过度承诺的不合规现象;过度承诺内容筛选单元306,用于若所述营销通话数据中出现过度承诺的不合规现象,则筛选出过度承诺的内容;敏感内容判断单元307,用于判断所述营销通话数据中是否出现敏感性内容;敏感内容筛选单元308,用于若所述营销通话数据中出现敏感性内容,则筛选出所述营销通话数据中的敏感性内容。
在一实施例中,如图9所示,所述数据获取单元301包括录音获取子单元3011以及文本转换子单元3012。
录音获取子单元3011,用于获取营销通话录音;文本转换子单元3012,用于对所述营销通话录音转换为文本,以得到营销通话数据。
在一实施例中,如图10所示,所述提取单元302包括分词处理子单元3021以及识别子单元3022。
分词处理子单元3021,用于对营销的理财产品的介绍文档进行分词和实体识别,以得到营销业务化分词;识别子单元3022,用于对所述营销业务化分词采用TextCNN文本分类和CRF序列化标注算法进行产品特性分类识别以及特性描述词汇识别,以得到提取结果。
在一实施例中,如图11所示,所述缺失判断单元303包括集合确定子单元3031、一致性判断子单元3032、第一确定子单元3033以及第二确定子单元3034。
集合确定子单元3031,用于对所述营销通话数据采用TextCNN模型进行产品特性项提取,以得到产品特性集合;一致性判断子单元3032,用于判断所述产品特性集合与所述提取结果是否一致;第一确定子单元3033,用于若所述产品特性集合与所述提取结果一致,则确定所述营销通话数据未出现缺失的信息;第二确定子单元3034,用于若所述产品特性集合与所述提取结果不一致,则确定所述营销通话数据出现缺失的信息。
在一实施例中,确定单元304,用于筛选存在所述提取结果但未存在所述产品特性集合内的信息,以得到缺失的信息。
在一实施例中,如图12所示,所述过度承诺判断单元305包括字段内容提取子单元3051、内容判断子单元3052、第三确定子单元3053以及第四确定子单元3054。
内容提取子单元,用于采用CRF序列模型对所述产品特性集合进行具体内容提取,以得到产品特性的内容字段项;字段内容判断子单元3052,用于判断所述产品特性的内容字段项与所述提取结果内对应的内容字段项是否一致;第三确定子单元3053,用于若所述产品特性的内容字段项与所述提取结果内对应的内容字段项不一致,则确定所述营销通话数据中出现过度承诺的不合规现象;第四确定子单元3054,用于若所述产品特性的内容字段项与所述提取结果内对应的内容字段项一致,则确定所述营销通话数据中未出现过度承诺的不合规现象。
在一实施例中,如图13所示,所述敏感内容判断单元307包括敏感内容识别子单元3071、敏感内容判断子单元3072、第五确定子单元3073以及第六确定子单元3074。
敏感内容识别子单元3071,用于通过已训练的模型对所述营销通话数据进行脏话、敏感词以及情绪化分类识别,以得到识别结果;敏感内容判断子单元3072,用于判断所述识别结果是否是出现脏话或敏感词或情绪化表达的内容;第五确定子单元3073,用于若所述识别结果出现脏话或敏感词或情绪化表达的内容,则确定所述营销通话数据中出现敏感性内容;第六确定子单元3074,用于若所述识别结果未出现脏话或敏感词或情绪化表达的内容,则确定所述营销通话数据中未出现敏感性内容。
需要说明的是,所属领域的技术人员可以清楚地了解到,上述营销合规性检查装置300和各单元的具体实现过程,可以参考前述方法实施例中的相应描述,为了描述的方便和简洁,在此不再赘述。
上述营销合规性检查装置300可以实现为一种计算机程序的形式,该计算机程序可以在如图14所示的计算机设备上运行。
请参阅图14,图14是本申请实施例提供的一种计算机设备的示意性框图。该计算机设备500可以是服务器,其中,服务器可以是独立的服务器,也可以是多个服务器组成的服务器集群。
参阅图14,该计算机设备500包括通过***总线501连接的处理器502、存储器和网络接口505,其中,存储器可以包括非易失性存储介质503和内存储器504。
该非易失性存储介质503可存储操作***5031和计算机程序5032。该计算机程序5032包括程序指令,该程序指令被执行时,可使得处理器502执行一种营销合规性检查方法。
该处理器502用于提供计算和控制能力,以支撑整个计算机设备500的运行。
该内存储器504为非易失性存储介质503中的计算机程序5032的运行提供环境,该计算机程序5032被处理器502执行时,可使得处理器502执行一种营销合规性检查方法。
该网络接口505用于与其它设备进行网络通信。本领域技术人员可以理解,图14中示出的结构,仅仅是与本申请方案相关的部分结构的框图,并不构成对本申请方案所应用于其上的计算机设备500的限定,具体的计算机设备500可以包括比图中所示更多或更少的部件,或者组合某些部件,或者具有不同的部件布置。
其中,所述处理器502用于运行存储在存储器中的计算机程序5032,以实现如下步骤:
获取营销通话数据;对营销的理财产品提取结构化信息,以得到提取结果;对所述营销通话数据结合所述提取结果判断所述营销通话数据是否出现缺失的信息;若所述营销通话数据出现缺失的信息,则确定缺失的信息;判断所述营销通话数据中是否出现过度承诺的不合规现象;若所述营销通话数据中出现过度承诺的不合规现象,则筛选出过度承诺的内容;判断所述营销通话数据中是否出现敏感性内容;若所述营销通话数据中出现敏感性内容,则筛选出所述营销通话数据中的敏感性内容。
在一实施例中,处理器502在实现所述获取营销通话数据步骤时,具体实现如下步骤:
获取营销通话录音;对所述营销通话录音转换为文本,以得到营销通话数据。
在一实施例中,处理器502在实现所述对营销的理财产品提取结构化信息,以得到提取结果步骤时,具体实现如下步骤:
对营销的理财产品的介绍文档进行分词和实体识别,以得到营销业务化分词;对所述营销业务化分词采用TextCNN文本分类和CRF序列化标注算法进行产品特性分类识别以及特性描述词汇识别,以得到提取结果。
在一实施例中,处理器502在实现所述对所述营销通话数据结合所述提取结果判断所述营销通话数据是否出现缺失的信息步骤时,具体实现如下步骤:
对所述营销通话数据采用TextCNN模型进行产品特性项提取,以得到产品特性集合;判断所述产品特性集合与所述提取结果是否一致;若所述产品特性集合与所述提取结果一致,则确定所述营销通话数据未出现缺失的信息;若所述产品特性集合与所述提取结果不一致,则确定所述营销通话数据出现缺失的信息。
在一实施例中,处理器502在实现所述确定缺失的信息步骤时,具体实现如下步骤:
筛选存在所述提取结果但未存在所述产品特性集合内的信息,以得到缺失的信息。
在一实施例中,处理器502在实现所述判断所述营销通话数据中是否出现过度承诺的不合规现象步骤时,具体实现如下步骤:
采用CRF序列模型对所述产品特性集合进行具体内容提取,以得到产品特性的内容字段项;判断所述产品特性的内容字段项与所述提取结果内对应的内容字段项是否一致;若所述产品特性的内容字段项与所述提取结果内对应的内容字段项不一致,则确定所述营销通话数据中出现过度承诺的不合规现象;若所述产品特性的内容字段项与所述提取结果内对应的内容字段项一致,则确定所述营销通话数据中未出现过度承诺的不合规现象。
在一实施例中,处理器502在实现所述判断所述营销通话数据中是否出现敏感性内容步骤时,具体实现如下步骤:
通过已训练的模型对所述营销通话数据进行脏话、敏感词以及情绪化分类识别,以得到识别结果;判断所述识别结果是否是出现脏话或敏感词或情绪化表达的内容;若所述识别结果出现脏话或敏感词或情绪化表达的内容,则确定所述营销通话数据中出现敏感性内容;若所述识别结果未出现脏话或敏感词或情绪化表达的内容,则确定所述营销通话数据中未出现敏感性内容。
应当理解,在本申请实施例中,处理器502可以是中央处理单元(CentralProcessing Unit,CPU),该处理器502还可以是其他通用处理器、数字信号处理器(DigitalSignal Processor,DSP)、专用集成电路(Application Specific Integrated Circuit,ASIC)、现成可编程门阵列(Field-Programmable Gate Array,FPGA)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件等。其中,通用处理器可以是微处理器或者该处理器也可以是任何常规的处理器等。
本领域普通技术人员可以理解的是实现上述实施例的方法中的全部或部分流程,是可以通过计算机程序来指令相关的硬件来完成。该计算机程序包括程序指令,计算机程序可存储于一存储介质中,该存储介质为计算机可读存储介质。该程序指令被该计算机***中的至少一个处理器执行,以实现上述方法的实施例的流程步骤。
因此,本发明还提供一种存储介质。该存储介质可以为计算机可读存储介质。该存储介质存储有计算机程序,其中该计算机程序被处理器执行时使处理器执行如下步骤:
获取营销通话数据;对营销的理财产品提取结构化信息,以得到提取结果;对所述营销通话数据结合所述提取结果判断所述营销通话数据是否出现缺失的信息;若所述营销通话数据出现缺失的信息,则确定缺失的信息;判断所述营销通话数据中是否出现过度承诺的不合规现象;若所述营销通话数据中出现过度承诺的不合规现象,则筛选出过度承诺的内容;判断所述营销通话数据中是否出现敏感性内容;若所述营销通话数据中出现敏感性内容,则筛选出所述营销通话数据中的敏感性内容。
在一实施例中,所述处理器在执行所述计算机程序而实现所述获取营销通话数据步骤时,具体实现如下步骤:
获取营销通话录音;对所述营销通话录音转换为文本,以得到营销通话数据。
在一实施例中,所述处理器在执行所述计算机程序而实现所述对营销的理财产品提取结构化信息,以得到提取结果步骤时,具体实现如下步骤:
对营销的理财产品的介绍文档进行分词和实体识别,以得到营销业务化分词;对所述营销业务化分词采用TextCNN文本分类和CRF序列化标注算法进行产品特性分类识别以及特性描述词汇识别,以得到提取结果。
在一实施例中,所述处理器在执行所述计算机程序而实现所述对所述营销通话数据结合所述提取结果判断所述营销通话数据是否出现缺失的信息步骤时,具体实现如下步骤:
对所述营销通话数据采用TextCNN模型进行产品特性项提取,以得到产品特性集合;判断所述产品特性集合与所述提取结果是否一致;若所述产品特性集合与所述提取结果一致,则确定所述营销通话数据未出现缺失的信息;若所述产品特性集合与所述提取结果不一致,则确定所述营销通话数据出现缺失的信息。
在一实施例中,所述处理器在执行所述计算机程序而实现所述确定缺失的信息步骤时,具体实现如下步骤:
筛选存在所述提取结果但未存在所述产品特性集合内的信息,以得到缺失的信息。
在一实施例中,所述处理器在执行所述计算机程序而实现所述判断所述营销通话数据中是否出现过度承诺的不合规现象步骤时,具体实现如下步骤:
采用CRF序列模型对所述产品特性集合进行具体内容提取,以得到产品特性的内容字段项;判断所述产品特性的内容字段项与所述提取结果内对应的内容字段项是否一致;若所述产品特性的内容字段项与所述提取结果内对应的内容字段项不一致,则确定所述营销通话数据中出现过度承诺的不合规现象;若所述产品特性的内容字段项与所述提取结果内对应的内容字段项一致,则确定所述营销通话数据中未出现过度承诺的不合规现象。
在一实施例中,所述处理器在执行所述计算机程序而实现所述判断所述营销通话数据中是否出现敏感性内容步骤时,具体实现如下步骤:
通过已训练的模型对所述营销通话数据进行脏话、敏感词以及情绪化分类识别,以得到识别结果;判断所述识别结果是否是出现脏话或敏感词或情绪化表达的内容;若所述识别结果出现脏话或敏感词或情绪化表达的内容,则确定所述营销通话数据中出现敏感性内容;若所述识别结果未出现脏话或敏感词或情绪化表达的内容,则确定所述营销通话数据中未出现敏感性内容。
所述存储介质可以是U盘、移动硬盘、只读存储器(Read-Only Memory,ROM)、磁碟或者光盘等各种可以存储程序代码的计算机可读存储介质。
本领域普通技术人员可以意识到,结合本文中所公开的实施例描述的各示例的单元及算法步骤,能够以电子硬件、计算机软件或者二者的结合来实现,为了清楚地说明硬件和软件的可互换性,在上述说明中已经按照功能一般性地描述了各示例的组成及步骤。这些功能究竟以硬件还是软件方式来执行,取决于技术方案的特定应用和设计约束条件。专业技术人员可以对每个特定的应用来使用不同方法来实现所描述的功能,但是这种实现不应认为超出本发明的范围。
在本发明所提供的几个实施例中,应该理解到,所揭露的装置和方法,可以通过其它的方式实现。例如,以上所描述的装置实施例仅仅是示意性的。例如,各个单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式。例如多个单元或组件可以结合或者可以集成到另一个***,或一些特征可以忽略,或不执行。
本发明实施例方法中的步骤可以根据实际需要进行顺序调整、合并和删减。本发明实施例装置中的单元可以根据实际需要进行合并、划分和删减。另外,在本发明各个实施例中的各功能单元可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以是两个或两个以上单元集成在一个单元中。
该集成的单元如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个存储介质中。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分,或者该技术方案的全部或部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机,终端,或者网络设备等)执行本发明各个实施例所述方法的全部或部分步骤。
以上所述,仅为本发明的具体实施方式,但本发明的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本发明揭露的技术范围内,可轻易想到各种等效的修改或替换,这些修改或替换都应涵盖在本发明的保护范围之内。因此,本发明的保护范围应以权利要求的保护范围为准。
Claims (10)
1.营销合规性检查方法,其特征在于,包括:
获取营销通话数据;
对营销的理财产品提取结构化信息,以得到提取结果;
对所述营销通话数据结合所述提取结果判断所述营销通话数据是否出现缺失的信息;
若所述营销通话数据出现缺失的信息,则确定缺失的信息;
判断所述营销通话数据中是否出现过度承诺的不合规现象;
若所述营销通话数据中出现过度承诺的不合规现象,则筛选出过度承诺的内容;
判断所述营销通话数据中是否出现敏感性内容;
若所述营销通话数据中出现敏感性内容,则筛选出所述营销通话数据中的敏感性内容。
2.根据权利要求1所述的营销合规性检查方法,其特征在于,所述获取营销通话数据,包括:
获取营销通话录音;
对所述营销通话录音转换为文本,以得到营销通话数据。
3.根据权利要求1所述的营销合规性检查方法,其特征在于,所述对营销的理财产品提取结构化信息,以得到提取结果,包括:
对营销的理财产品的介绍文档进行分词和实体识别,以得到营销业务化分词;
对所述营销业务化分词采用TextCNN文本分类和CRF序列化标注算法进行产品特性分类识别以及特性描述词汇识别,以得到提取结果。
4.根据权利要求3所述的营销合规性检查方法,其特征在于,所述对所述营销通话数据结合所述提取结果判断所述营销通话数据是否出现缺失的信息,包括:
对所述营销通话数据采用TextCNN模型进行产品特性项提取,以得到产品特性集合;
判断所述产品特性集合与所述提取结果是否一致;
若所述产品特性集合与所述提取结果一致,则确定所述营销通话数据未出现缺失的信息;
若所述产品特性集合与所述提取结果不一致,则确定所述营销通话数据出现缺失的信息。
5.根据权利要求4所述的营销合规性检查方法,其特征在于,所述确定缺失的信息,包括:
筛选存在所述提取结果但未存在所述产品特性集合内的信息,以得到缺失的信息。
6.根据权利要求5所述的营销合规性检查方法,其特征在于,所述判断所述营销通话数据中是否出现过度承诺的不合规现象,包括:
采用CRF序列模型对所述产品特性集合进行具体内容提取,以得到产品特性的内容字段项;
判断所述产品特性的内容字段项与所述提取结果内对应的内容字段项是否一致;
若所述产品特性的内容字段项与所述提取结果内对应的内容字段项不一致,则确定所述营销通话数据中出现过度承诺的不合规现象;
若所述产品特性的内容字段项与所述提取结果内对应的内容字段项一致,则确定所述营销通话数据中未出现过度承诺的不合规现象。
7.根据权利要求6所述的营销合规性检查方法,其特征在于,所述判断所述营销通话数据中是否出现敏感性内容,包括:
通过已训练的模型对所述营销通话数据进行脏话、敏感词以及情绪化分类识别,以得到识别结果;
判断所述识别结果是否是出现脏话或敏感词或情绪化表达的内容;
若所述识别结果出现脏话或敏感词或情绪化表达的内容,则确定所述营销通话数据中出现敏感性内容;
若所述识别结果未出现脏话或敏感词或情绪化表达的内容,则确定所述营销通话数据中未出现敏感性内容。
8.营销合规性检查装置,其特征在于,包括:
数据获取单元,用于获取营销通话数据;
提取单元,用于对营销的理财产品提取结构化信息,以得到提取结果;
缺失判断单元,用于对所述营销通话数据结合所述提取结果判断所述营销通话数据是否出现缺失的信息;
确定单元,用于若所述营销通话数据出现缺失的信息,则确定缺失的信息;
过度承诺判断单元,用于判断所述营销通话数据中是否出现过度承诺的不合规现象;
过度承诺内容筛选单元,用于若所述营销通话数据中出现过度承诺的不合规现象,则筛选出过度承诺的内容;
敏感内容判断单元,用于判断所述营销通话数据中是否出现敏感性内容;
敏感内容筛选单元,用于若所述营销通话数据中出现敏感性内容,则筛选出所述营销通话数据中的敏感性内容。
9.一种计算机设备,其特征在于,所述计算机设备包括存储器及处理器,所述存储器上存储有计算机程序,所述处理器执行所述计算机程序时实现如权利要求1至7中任一项所述的方法。
10.一种存储介质,其特征在于,所述存储介质存储有计算机程序,所述计算机程序被处理器执行时可实现如权利要求1至7中任一项所述的方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202111553260.8A CN114356982A (zh) | 2021-12-17 | 2021-12-17 | 营销合规性检查方法、装置、计算机设备及存储介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202111553260.8A CN114356982A (zh) | 2021-12-17 | 2021-12-17 | 营销合规性检查方法、装置、计算机设备及存储介质 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN114356982A true CN114356982A (zh) | 2022-04-15 |
Family
ID=81098754
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202111553260.8A Pending CN114356982A (zh) | 2021-12-17 | 2021-12-17 | 营销合规性检查方法、装置、计算机设备及存储介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN114356982A (zh) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN116913460A (zh) * | 2023-09-13 | 2023-10-20 | 福州市迈凯威信息技术有限公司 | 一种药械及检验试剂的营销业务合规性判断分析方法 |
-
2021
- 2021-12-17 CN CN202111553260.8A patent/CN114356982A/zh active Pending
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN116913460A (zh) * | 2023-09-13 | 2023-10-20 | 福州市迈凯威信息技术有限公司 | 一种药械及检验试剂的营销业务合规性判断分析方法 |
CN116913460B (zh) * | 2023-09-13 | 2023-12-29 | 福州市迈凯威信息技术有限公司 | 一种药械及检验试剂的营销业务合规性判断分析方法 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN112804400B (zh) | 客服呼叫语音质检方法、装置、电子设备及存储介质 | |
CN110597964B (zh) | 一种双录质检语义分析方法、装置及双录质检*** | |
US9014363B2 (en) | System and method for automatically generating adaptive interaction logs from customer interaction text | |
CN111640436B (zh) | 向坐席提供通话对象的动态客户画像的方法 | |
US11553085B2 (en) | Method and apparatus for predicting customer satisfaction from a conversation | |
WO2022267174A1 (zh) | 话术文本生成方法、装置、计算机设备和存储介质 | |
CN112966082A (zh) | 音频质检方法、装置、设备以及存储介质 | |
CN113407677B (zh) | 评估咨询对话质量的方法、装置、设备和存储介质 | |
CN111563377A (zh) | 数据增强方法与装置 | |
CN113240510A (zh) | 异常用户预测方法、装置、设备及存储介质 | |
CN113239204A (zh) | 文本分类方法及装置、电子设备、计算机可读存储介质 | |
CN113626573A (zh) | 一种销售会话异议及应对提取方法及*** | |
CN115186051A (zh) | 敏感词检测方法、装置及计算机可读存储介质 | |
CN111241262A (zh) | 基于人工智能的贷款资质审核方法及相关设备 | |
CN114356982A (zh) | 营销合规性检查方法、装置、计算机设备及存储介质 | |
CN113657773A (zh) | 话术质检方法、装置、电子设备及存储介质 | |
CN112580350A (zh) | 一种诉求分析方法、装置、电子设备和存储介质 | |
CN112434953A (zh) | 一种基于计算机数据处理的客服人员考核方法和装置 | |
CN111783424A (zh) | 一种文本分句方法和装置 | |
CN111309288A (zh) | 适用于银行业务的软件需求规格文件的分析方法及装置 | |
CN115983285A (zh) | 问卷稽核方法、装置、电子设备和存储介质 | |
CN110728145A (zh) | 一种基于录音对话的自然语言理解模型的建立方法 | |
CN112133308B (zh) | 一种用于语音识别文本多标签分类的方法和装置 | |
US11947872B1 (en) | Natural language processing platform for automated event analysis, translation, and transcription verification | |
CN113515642A (zh) | 电话营销关键断点确定方法及装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |