CN110502675B - 基于数据分析的语音拨叫用户分类方法及相关设备 - Google Patents

基于数据分析的语音拨叫用户分类方法及相关设备 Download PDF

Info

Publication number
CN110502675B
CN110502675B CN201910633951.5A CN201910633951A CN110502675B CN 110502675 B CN110502675 B CN 110502675B CN 201910633951 A CN201910633951 A CN 201910633951A CN 110502675 B CN110502675 B CN 110502675B
Authority
CN
China
Prior art keywords
user
classification
data
information
information data
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201910633951.5A
Other languages
English (en)
Other versions
CN110502675A (zh
Inventor
吴少华
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Ping An Puhui Enterprise Management Co Ltd
Original Assignee
Ping An Puhui Enterprise Management Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Ping An Puhui Enterprise Management Co Ltd filed Critical Ping An Puhui Enterprise Management Co Ltd
Priority to CN201910633951.5A priority Critical patent/CN110502675B/zh
Publication of CN110502675A publication Critical patent/CN110502675A/zh
Application granted granted Critical
Publication of CN110502675B publication Critical patent/CN110502675B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/903Querying
    • G06F16/9032Query formulation
    • G06F16/90332Natural language query formulation or dialogue systems
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/906Clustering; Classification
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/907Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually
    • G06F16/908Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually using metadata automatically derived from the content
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q30/00Commerce
    • G06Q30/01Customer relationship services
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q40/00Finance; Insurance; Tax strategies; Processing of corporate or income taxes
    • G06Q40/08Insurance

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Databases & Information Systems (AREA)
  • General Physics & Mathematics (AREA)
  • Business, Economics & Management (AREA)
  • Finance (AREA)
  • General Engineering & Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Accounting & Taxation (AREA)
  • Marketing (AREA)
  • Development Economics (AREA)
  • Economics (AREA)
  • Library & Information Science (AREA)
  • Strategic Management (AREA)
  • General Business, Economics & Management (AREA)
  • Mathematical Physics (AREA)
  • Technology Law (AREA)
  • Artificial Intelligence (AREA)
  • Computational Linguistics (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Telephonic Communication Services (AREA)

Abstract

本发明涉及数据分析技术领域,尤其涉及一种基于数据分析的语音拨叫用户分类方法及相关设备,其中,所述方法包括:获取业务分类需求后获取对应的所有目标用户的原始信息并汇总后生成原始信息数据集;对原始信息数据集中的用户原始信息进行数据清理并汇总后得到用户信息数据集,对齐分类后用户分类结果;根据用户分类结果和业务分类需求从预设的问题库中提取对应问题后拨叫对应用户并获得应答结果,分析应答结果生成待维护记录后发送至原始信息来源方;接收来源方的更新数据后更新用户信息数据集并据此获得修正后的分类结果。本发明实现了对待拨叫用户的自动分类、自动拨叫和分类结果自动修正的效果,节省了人力和时间成本,分类精度和准确度高。

Description

基于数据分析的语音拨叫用户分类方法及相关设备
技术领域
本发明涉及智能推荐技术领域,尤其涉及一种基于数据分析的语音拨叫用户分类方法及相关设备。
背景技术
传统客服业务采用人工呼叫方式开展。在进行拨叫前,一般通过人工方式对目标用户按服务项目对应的业务分类需求进行预先的分类,比如,业务分类需求为某类金融理财保险产品或者寿险产品时,可按年龄为分类策略制定不同的分类条件后将不同年龄的用户分为几个年龄区段,然后定向对其中的几个年龄区段的用户进行产品推送,或者,按性别将用户分为男性和女性后向其中一类用户推送针对性别特征定制的特定产品,再或者,按居住区域分类后推送由地区特点定制的产品,等等。
但是这类传统的人工操作存在如下缺点:
1)人力和时间成本投入较大;
2)人工处理方式出错率较高,分类准确性不足;
3)由于参与分类的工作人员自身的素质和技能限制,可能导致分类结果具有偏向性,从而导致分类的精度降低,比如,不同的工作人员对于同一组目标用户进行分类,可能最终呈现不一样的结果;
4)在进行拨叫时,依然受制于人工操作的局限性,比如疲劳、情绪控制、职业技能等方面的因素,而导致对目标用户呈现不一样的对待态度和处理结果,从而使用户反馈呈现一定的偏向,且人工操作在疲劳度较高或者拨叫任务繁重的情况下,拨叫信息记录的实时性和准确性不能得到确保,容易出现漏记情况而导致信息记录不全和内容失真,为后续的客户维护工作带来隐患。
发明内容
本发明提供了一种基于数据分析的语音拨叫用户分类方法及相关设备,采用自动收集用户原始信息、根据原始信息生成分类基础数据、根据分类基础数据生成分类结果、根据分类结果自动拨叫用户后进行问答处理后,汇总问答处理结果后进行分类结果修正的技术手段,实现了对待拨叫用户的精准分类,且经过修正后的分类结果的准确度优于传统手段,拨叫记录详实完备,有助于坐席工作的开展。
一方面,本发明实施例提供一种基于数据分析的语音拨叫用户分类方法,包括:
获取业务分类需求,根据所述业务分类需求获取对应所述业务分类需求的所有目标用户的原始信息,汇总所有所述目标用户的原始信息后生成原始信息数据集;
对所述原始信息数据集中的任一所述目标用户的原始信息进行数据清理,汇总清理后得到的所有的所述目标用户的信息数据后生成用户信息数据集,根据预设的分类规则对所述用户信息数据集中的所有的所述目标用户进行分类后得到分类结果;
对所述用户信息数据集中的任一目标用户进行自动语音拨叫,根据所述业务分类需求和所述任一目标用户的分类结果对应的分类类别从预设的问题库中提取对应的问题数据后进行问答处理,对问答处理结果进行分析后判断所述任一目标用户的原始信息是否有误,在有误时生成对应所述任一目标用户的待维护记录后发送至目标用户的原始信息的来源方;
接收所述来源方的更新数据,根据所述更新数据更新所述用户信息数据集,根据更新后的所述用户信息数据集对存在错误的所述原始信息对应的分类结果进行重新分类后获得修正后的分类结果。
在其中一些可能的实施例中,所述获取业务分类需求,根据所述业务分类需求获取对应所述业务分类需求的所有目标用户的原始信息,汇总所有所述目标用户的原始信息后生成原始信息数据集,包括:
从分类需求方处获取所述业务分类需求,根据所述业务分类需求访问对应所述业务分类需求的业务区块;
获取所述业务区块中的用户列表,根据所述用户列表从记录有所述业务区块的用户数据的数据存储单元中逐一获取每一个目标用户的原始信息后生成对应所述目标用户的原始信息记录;
汇总所有所述目标用户的原始信息记录后生成原始信息数据集。
在其中一些可能的实施例中,所述对所述原始信息数据集中的任一所述目标用户的原始信息进行数据清理,汇总清理后得到的所有的所述目标用户的信息数据后生成用户信息数据集,根据预设的分类规则对所述用户信息数据集中的所有的所述目标用户进行分类后得到分类结果,包括:
获取预设的初始字段表,所述初始字段表中定义了所有的在进行对应于所述业务分类需求的业务分类操作时所需的用户信息字段;
从所述原始信息数据集中提取任一目标用户的原始信息,再从所述初始字段表中提取对应所述任一目标用户的原始信息的用户信息字段后生成空白的用户信息表;
将所述任一目标用户的原始信息中的每一条信息数据逐一进行数据清理后,再写入所述用户信息表中的对应的用户信息字段中,生成对应所述任一目标用户的数据记录;
按上述操作遍历所述原始信息数据集后在所述用户信息表中生成所有所述目标用户的数据记录后得到所述用户信息数据集;
获取预设的分类规则列表,所述分类规则列表中预设了多个用于对所述目标用户进行分类的分类策略,根据不同的分类策略对所述用户信息数据集中的所有目标用户进行分类后得到对应所述分类策略的分类结果。
在其中一些可能的实施例中,所述将所述任一目标用户的原始信息中的每一条信息数据逐一进行数据清理后,再写入所述用户信息表中的对应的用户信息字段中,生成对应所述任一目标用户的数据记录,包括:
提取任一目标用户的原始信息中的每一条信息数据,判断所述每一条信息数据在所述用户信息表中是否存在对应的用户信息字段,如果是,则对所述信息数据进行数据清理后写入对应的用户信息字段内;
如果所述用户信息表中没有所述目标用户的原始信息中的信息数据对应的用户信息字段,则分析当前信息数据与所述用户信息表种的每一个用户信息字段A之间的语义相关度,当所述用户信息字段A与所述信息数据的语义相关度大于预设的语义相关度阈值X时,将所述目标用户的原始信息中的信息数据写入所述用户信息字段A中;
当所述用户信息字段A与所述信息数据的语义相关度小于等于所述语义相关度阈值X时,则分析所述信息数据与所述初始字段表中的任一用户信息字段B之间的语义相关度,当命中用户信息字段B与所述信息数据的语义相关度大于所述语义相关度阈值X时,将所述用户信息字段B追加到用户信息表中生成新的字段数据列,并将所述目标用户的原始信息中的信息数据写入新的字段数据列中。
在其中一些可能的实施例中,所述获取预设的分类规则列表,所述分类规则列表中预设了多个用于对所述目标用户进行分类的分类策略,根据不同的分类策略对所述用户信息数据集中的所有目标用户进行分类后得到对应所述分类策略的分类结果,包括:
获取预设的分类规则列表,所述分类规则列表中的任一分类策略均对应设有一规则名称;
提取其中的一条分类策略,根据所述分类策略的规则条件对所述用户信息数据集中的所有目标用户执行所述分类策略的规则实体后得到分类结果;
将所述分类策略的规则名称作为分类结果的前缀为所述分类结果命名;
顺序执行所述分类规则列表中的每一条分类策略后得到所有的分类结果。
在其中一些可能的实施例中,所述对所述用户信息数据集中的任一目标用户进行自动语音拨叫,根据所述业务分类需求和所述任一目标用户的分类结果对应的分类类别从预设的问题库中提取对应的问题数据后进行问答处理,对问答处理结果进行分析后判断所述任一目标用户的原始信息是否有误,在有误时生成对应所述任一目标用户的待维护记录后发送至目标用户的原始信息的来源方,包括:
提取所述用户信息数据集中的任一目标用户的电话号码,连接电话拨叫中心后调用所述电话拨交中心的IVR功能对所述电话号码进行语音拨叫;
拨通后,在所述分类结果中获取所述任一目标用户的分类类别,从预设的问题库中提取对应所述分类类别和所述业务分类需求的问题数据后与所述任一目标用户进行语音问答,并记录语音问答过程中的用户的应答数据、对应所述应答数据的问题数据,根据应答数据和问题数据生成问答处理结果,语音问答结束后,在所述用户信息数据集中为对应的目标用户设置用于标记已进行过语音问答的状态标记;
遍历所述用户信息数据集后重复上述操作,获取未设置所述状态标记的所有已分类的目标用户的问答处理结果;
提取任一目标用户的所述问答处理结果中的应答数据,当所述应答数据对应的用户信息字段已经存在于所述用户信息数据集中,则将所述应答数据与所述用户信息数据集中的对应所述任一目标用户的信息数据字段中的数据进行语义相关度计算,当两者的语义相关度小于等于预设的语义相关度阈值时,则确定所述应答数据与所述用户信息数据集中的对应所述任一目标用户的信息数据存在不符的情况,此时,根据所述任一目标用户在所述用户信息数据集中的信息数据和所述应答数据对应的问题数据后生成待维护记录;
遍历所有的目标用户的问题处理结果后,获得所有存在用户信息数据集的信息数据与应答数据不符的情况的目标用户的待维护记录;
汇总所有的待维护记录后发送至目标用户的原始信息的来源方。
在其中一些可能的实施例中,所述接收所述来源方的更新数据,根据所述更新数据更新所述用户信息数据集,根据更新后的所述用户信息数据集对存在错误的所述原始信息对应的分类结果进行重新分类后获得修正后的分类结果,包括:
接收来自所述目标用户的原始信息的来源方的反馈数据;
提取所述反馈数据更新所述用户信息数据集中的对用所述反馈数据的目标用户的信息数据后得到新的用户信息数据集;
提取所述分类规则列表中的所有的分类策略的规则条件的特征词,计算发生错误的所述原始信息的数据字段与任一所述特征词的语义相似度,当两者的语义相似度大于设定判断阈值时,按所述特征词对应的分类策略对所述新的用户信息数据集进行重新分类后获得修正后的分类结果。
另一方面,本发明实施例还提供了一种基于数据分析的语音拨叫用户分类装置,包括:用户信息获取模块、目标用户分类模块、目标用户拨叫模块和分类结果修正模块,其中,
用户信息获取模块,设置为获取业务分类需求,根据所述业务分类需求获取对应所述业务分类需求的所有目标用户的原始信息,汇总所有所述目标用户的原始信息后生成原始信息数据集;
目标用户分类模块,设置为对所述原始信息数据集中的任一所述目标用户的原始信息进行数据清理,汇总清理后得到的所有的所述目标用户的信息数据后生成用户信息数据集,根据预设的分类规则对所述用户信息数据集中的所有的所述目标用户进行分类后得到分类结果;
目标用户拨叫模块,设置为对所述用户信息数据集中的任一目标用户进行自动语音拨叫,根据所述业务分类需求和所述任一目标用户的分类结果对应的分类类别从预设的问题库中提取对应的问题数据后进行问答处理,对问答处理结果进行分析后判断所述任一目标用户的原始信息是否有误,在有误时生成对应所述任一目标用户的待维护记录后发送至目标用户的原始信息的来源方;
分类结果修正模块,设置为接收所述来源方的更新数据,根据所述更新数据更新所述用户信息数据集,根据更新后的所述用户信息数据集对存在错误的所述原始信息对应的分类结果进行重新分类后获得修正后的分类结果。
基于相同的发明构思,本发明实施例还提供了一种计算机设备,包括存储器和处理器,所述存储器中存储有计算机可读指令,所述计算机可读指令被所述处理器执行时,实现上述任意实施例所述的基于数据分析的语音拨叫用户分类方法。
基于相同的发明构思,本发明实施例还提供了一种计算机可读存储介质,其上存储有计算机可读指令,所述计算机可读指令被一个或多个处理器执行时,实现上述任意实施例所述的基于数据分析的语音拨叫用户分类方法。
有益效果:本发明通过对待拨叫用户进行拨叫前的自动分类、根据分类结果进行自动拨叫、根据拨叫情况进行分类结果的自动修正,实现了坐席工作中的分类工作的自动化进程,具有如下优点:
1)节省了人力和时间成本;
2)提高了分类准确性;
3)提升了分类精度;
4)确保了拨叫记录的完整性和真实性。
附图说明
图1为本发明实施例的基于数据分析的语音拨叫用户分类方法的主流程图;
图2为本发明实施例的基于数据分析的语音拨叫用户分类方法的获取用户原始信息的流程图;
图3为本发明实施例的基于数据分析的语音拨叫用户分类方法的对目标用户进行分类的流程图;
图4为本发明实施例的基于数据分析的语音拨叫用户分类方法的对用户原始信息进行数据清理的流程图;
图5为本发明实施例的基于数据分析的语音拨叫用户分类方法的根据分类规则对用户进行分类的流程图;
图6为本发明实施例的基于数据分析的语音拨叫用户分类方法的对分类后的目标用户进行自动拨叫的流程图;
图7为本发明实施例的基于数据分析的语音拨叫用户分类方法的根据拨叫情况对用户分类结果进行修正的流程图;
图8为本发明实施例的基于数据分析的语音拨叫用户分类装置的功能框图。
具体实施方式
本发明实施例提供了一种基于数据分析的语音拨叫用户分类方法及相关设备,用于辅助坐席人员的拨叫工作,通过在拨叫工作开展前对待拨叫用户根据业务内容的不同进行分门别类,再根据分类情况对用户进行自动拨叫后根据拨叫情况进行分类情况的修正,从而使坐席人员的拨叫工作开展得以顺利进行,且靶向性更好,更能贴合目标用户的实际需求。
为了使本技术领域的人员更好地理解本发明方案,下面将结合本发明实施例中的附图,对本发明实施例进行描述。
本发明的说明书和权利要求书及上述附图中的术语“第一”、“第二”、“第三”、“第四”等(如果存在)是用于区别类似的对象,而不必用于描述特定的顺序或先后次序。应该理解这样使用的数据在适当情况下可以互换,以便这里描述的实施例能够以除了在这里图示或描述的内容以外的顺序实施。此外,术语“包括”或“具有”及其任何变形,意图在于覆盖不排他的包含,例如,包含了一系列步骤或单元的过程、方法、***、产品或设备不必限于清楚地列出的那些步骤或单元,而是可包括没有清楚地列出的或对于这些过程、方法、产品或设备固有的其它步骤或单元。
图1为本发明实施例提供的基于数据分析的语音拨叫用户分类方法的主流程图,如图所示,一种基于数据分析的语音拨叫用户分类方法,包括步骤S1~S4,其中:
S1、获取业务分类需求,根据所述业务分类需求获取对应所述业务分类需求的所有目标用户的原始信息,汇总所有所述目标用户的原始信息后生成原始信息数据集。
具体的,首先获取业务分类需求,所述业务分类需求确定了对目标用户的分类基于什么业务需求展开。比如,某企业的业务体系中存在不同的业务区块,有金融理财、人寿保险业务等,这些业务区块对应的目标用户群体是不一样的,如果将该企业的所有用户都汇总后进行整体分类,工作量会很大,因此,根据具体的业务区块来汇总待分类的用户信息,不仅可有效提升分类效率,提高分类精度,也可以提高业务推广后的命中率。
S2、对所述原始信息数据集中的任一所述目标用户的原始信息进行数据清理,汇总清理后得到的所有的所述目标用户的信息数据后生成用户信息数据集,根据预设的分类规则对所述用户信息数据集中的所有的所述目标用户进行分类后得到分类结果。
具体的,由于获取的目标用户的原始信息来源于不同的渠道,因此可能存在记载形式多样,数据字段不统一等情况。比如,有些用户的名字按照中英文混写、中文大小写混写、姓氏和名字倒置、带有数字标记等,如果不进行预处理后使其统一格式,则可能发生在进行分类时,将同一个用户的不同的姓名记录形式识别为不同的人,从而造成重复记录,影响拨叫时的用户体验,也会浪费坐席资源。因此,对收集到的用户信息在分类前进行预处理,使用户信息的格式明确,清除干扰项目,便于后续分类工作的负担得以减轻,有助于提高分类的精度和效率。在数据清理完毕后,根据预先设置好的分类规则对用户信息数据集进行处理后获得分类结果。分类的原始数据记载至同一总数据表时,分类结果可以以记载有根据不同的分类条件筛选得到的符合条件的目标用户组成的子数据表的形式呈现,比如,按照年龄分类的子数据表、按照居住区域分类的子数据表等。
S3、对所述用户信息数据集中的任一目标用户进行自动语音拨叫,根据所述业务分类需求和所述任一目标用户的分类结果对应的分类类别从预设的问题库中提取对应的问题数据后进行问答处理,对问答处理结果进行分析后判断所述任一目标用户的原始信息是否有误,在有误时生成对应所述任一目标用户的待维护记录后发送至目标用户的原始信息的来源方。
具体的,按照分类结果,结合IVR等自动化语音拨叫手段与分类结果中的目标用户建立连接后,再根据预设的问题与这些用户形成人机互动,从而获取简单的基础数据,这些基础数据用于与用户的原始数据进行比较后,判断是否原始数据的记载发生错误,从而为用户数据的准确性和后续维护提供基础,这些错误记载情况生成对应的待维护记录后返回到用户原始数据的来源方,由来源方负责用户原始数据的更新情况。
S4、接收所述来源方的更新数据,根据所述更新数据更新所述用户信息数据集,根据更新后的所述用户信息数据集对存在错误的所述原始信息对应的分类结果进行重新分类后获得修正后的分类结果。
具体的,接收来源方发来的更新数据,对更新数据进行数据清理,再替换用户信息数据集中的对应项目,将替换数据后的新的用户信息数据集作为再次分类的数据基础,然后根据发生错误的用户数据所在的数据字段判断哪些分类规则受到影响,调用这些受到影响的分类规则进行再分类后获得新的分类结果,新的分类结果替换旧分类结果后,实现分类结果的修正。
本实施例,通过自动化执行目标用户的原始数据获取、数据清理、用户分类、分类后的用户自动拨叫、根据拨叫结果对分类情况进行修正,实现了坐席工作前序部分的自动化展开,节省了人力和时间,提高了分类精度和准确性。
图2为本发明实施例提供的基于数据分析的语音拨叫用户分类方法中的获取用户原始信息的流程图,如图所示,所述S1、获取业务分类需求,根据所述业务分类需求获取对应所述业务分类需求的所有目标用户的原始信息,汇总所有所述目标用户的原始信息后生成原始信息数据集,包括S101步骤~S103步骤:
S101、从分类需求方处获取所述业务分类需求,根据所述业务分类需求访问对应所述业务分类需求的业务区块。
具体的,业务分类需求可有不同的来源,一般都基于实际业务开展的需要,由需求方提供,其中记载了业务分类需求的来源和访问权限,通过这些信息访问对应所述业务分类需求的各个业务区块,比如,同一业务***中的上下游部门,或者所述业务区块的合作伙伴等第三方机构或单位。这些业务区块的服务器或者数据库中存储了对应所述业务区块的各类用户的数据,比如,用户姓名、年龄、性别的基础性的通用数据,也包括了一些和业务区块的业务紧密关联的专用数据,如历年的保险合同的签订情况等。
S102、获取所述业务区块中的用户列表,根据所述用户列表从记录有所述业务区块的用户数据的数据存储单元中逐一获取每一个目标用户的原始信息后生成对应所述目标用户的原始信息记录。
具体的,根据获取的访问权限等信息连接业务区块的服务器成功后,首先获取所述业务区块中的用户列表,在根据用户列表的顺序依次获取每一个目标用户的用户数据,这些用户数据作为所述原始信息被用于后续的数据清理和生成用户分类的基础数据。可预先将这些信息提取后,为每个用户生成一个专用于存储其用户数据的数据记录,将各类数据填充其中的字段中。
S103、汇总所有所述目标用户的原始信息记录后生成原始信息数据集;
具体的,获取了对应所述业务分类需求的所有的用户信息后,将所有已经生成的目标用户的数据记录记录在同一个数据表或者数据文件中,该数据表或者数据文件即作为原始信息数据集的记录形式,用作后续的分类处理依据之一。
本实施例根据业务分类需求访问不同的业务区块获取用户数据,并汇总为存储有所有用户数据的原始信息数据集,实现了信息搜集的自动化。
图3为本发明实施例提供的基于数据分析的语音拨叫用户分类方法中的对目标用户进行分类的流程图,如图所示,所述S2、对所述原始信息数据集中的任一所述目标用户的原始信息进行数据清理,汇总清理后得到的所有的所述目标用户的信息数据后生成用户信息数据集,根据预设的分类规则对所述用户信息数据集中的所有的所述目标用户进行分类后得到分类结果,具体包括S201步骤~S205步骤:
S201、获取预设的初始字段表,所述初始字段表中定义了所有的在进行对应于所述业务分类需求的业务分类操作时所需的用户信息字段。
具体的,初始字段表可根据历史业务过程汇总业务***中所有业务区块在各种业务环境下使用过的用户数据的数据字段后生成,该表作为生成空白的用户信息表的生成基础,其中定义了各个用户数据的字段名称、长度、字符编码形式等数据记录格式。
S202、从所述原始信息数据集中提取任一目标用户的原始信息,再从所述初始字段表中提取对应所述任一目标用户的原始信息的用户信息字段后生成空白的用户信息表;
S203、将所述任一目标用户的原始信息中的每一条信息数据逐一进行数据清理后,再写入所述用户信息表中的对应的用户信息字段中,生成对应所述任一目标用户的数据记录;
S204、按上述操作遍历所述原始信息数据集后在所述用户信息表中生成所有所述目标用户的数据记录后得到所述用户信息数据集。
具体的,根据已经获得的目标用户的原始信息数据情况确定一共有哪些用户数据字段,再从初始字段表中获取对应这些所需字段的字段定义后生成一张空白的用户信息表,所述用户信息表用于将已经获取的用户数据均按照统一的数据记录格式记录,比如业务区块A中,对于保险业务人员记录为“保险经理人”,而业务区块B中,则记录为“保险代理人”,诸如此类的用词不统一将造成字段的重复,也不利于分类是的精准性。生成用户信息表后,从原始信息数据集中提取每个用户的数据后,按照用户信息表中的字段定义,填充数据后生成该用户的数据记录。
S205、获取预设的分类规则列表,所述分类规则列表中预设了多个用于对所述目标用户进行分类的分类策略,根据不同的分类策略对所述用户信息数据集中的所有目标用户进行分类后得到对应所述分类策略的分类结果。
具体的,分类规则列表可以以记录有多条规则条件、对应的规则动作实体的规则脚本形式生成文件后供外部程序调用,可预先按照业务分类需求生成不同的分类规则后,汇总这些需求对应的分类规则脚本,即生成可供调用的总的规则脚本文件,其中的每个分类策略都是一个可驱动执行的规则,命名时,可根据规则条件命名对应的分类策略,比如,按不同年龄区段作为规则条件时,则该分类策略可命名为“年龄分类”。每个分类策略对用户信息数据集执行后均生成一分类结果,该分类结果可以以与用户信息数据集的相同记录形式的子集存储。
本实施例,通过对作为分类基础的原始信息数据集中的用户数据进行数据清理后生成待分类的数据集,再加载规则脚本形式的分类策略对待分类数据集进行处理后生成分类结果子集,确保了分类精度和准确性。
图4为本发明实施例提供的基于数据分析的语音拨叫用户分类方法中的对用户原始信息进行数据清理的流程图,如图所示,所述S203、将所述任一目标用户的原始信息中的每一条信息数据逐一进行数据清理后,再写入所述用户信息表中的对应的用户信息字段中,生成对应所述任一目标用户的数据记录,具体包括S20301步骤~S20303步骤:
S20301、提取任一目标用户的原始信息中的每一条信息数据,判断所述每一条信息数据在所述用户信息表中是否存在对应的用户信息字段,如果是,则对所述信息数据进行数据清理后写入对应的用户信息字段内;
S20302、如果所述用户信息表中没有所述目标用户的原始信息中的信息数据对应的用户信息字段,则分析当前信息数据与所述用户信息表种的每一个用户信息字段A之间的语义相关度,当所述用户信息字段A与所述信息数据的语义相关度大于预设的语义相关度阈值X时,将所述目标用户的原始信息中的信息数据写入所述用户信息字段A中;
具体的,比如,当某一用户的原始信息中有名为“age”的字段,值为28,则在用户信息表中检索是否有同名的字段名存在,如果存在,则将28按照用户信息表中的字段名的其他定义填入其中,如果不存在同名的字段名,则逐一将“age”字段名与用户信息表中的其他字段名中的任一个计算语义相似度,当两者判断为本质相同,比如age字段与表中的“年龄”字段的语义相似度大于设定阈值X,则判断age本质与年龄的语义相同,则将值28填入表中的“年龄”字段中对应该用户的数据记录中。
S20303、当所述用户信息字段A与所述信息数据的语义相关度小于等于所述语义相关度阈值X时,则分析所述信息数据与所述初始字段表中的任一用户信息字段B之间的语义相关度,当命中用户信息字段B与所述信息数据的语义相关度大于所述语义相关度阈值X时,将所述用户信息字段B追加到用户信息表中生成新的字段数据列,并将所述目标用户的原始信息中的信息数据写入新的字段数据列中。
具体的,当无法在用户信息表中不存在该用户原始信息的字段时,则在初始字段表中按照语义相关度检索同义词后在用户信息表中生成新的字段数据列,再将用户信息填充其中。
本实施例通过在用户数据的清理过程中根据用户数据对应字段动态扩展用户信息表,使用户信息表的制备较高的灵活性。
图5为本发明实施例提供的基于数据分析的语音拨叫用户分类方法中的根据分类规则对用户进行分类的流程图,如图所示,所述S205、获取预设的分类规则列表,所述分类规则列表中预设了多个用于对所述目标用户进行分类的分类策略,根据不同的分类策略对所述用户信息数据集中的所有目标用户进行分类后得到对应所述分类策略的分类结果,具体包括S20501步骤~S20504步骤:
S20501、获取预设的分类规则列表,所述分类规则列表中的任一分类策略均对应设有一规则名称;
S20502、提取其中的一条分类策略,根据所述分类策略的规则条件对所述用户信息数据集中的所有目标用户执行所述分类策略的规则实体后得到分类结果;
S20503、将所述分类策略的规则名称作为分类结果的前缀为所述分类结果命名。
具体的,分类规则列表中可包括数条分类策略,每一条分类策略均包括一个规则条件、一个规则实体,任一分类策略的名称可按照其规则条件的关键词或者该关键词的上位词作为命名组成之一或者命名前缀来生成分类策略名,比如,规则条件是按照某几个年龄作为分界点将用户分为非青年、青年、中年、老年,则该几个年龄点的值的上位为“年龄”,则此分类策略可命名为“年龄分类策略”。
S20504、顺序执行所述分类规则列表中的每一条分类策略后得到所有的分类结果。
具体的,按照分类规则列表中的分类策略的排序,顺序执行每一项分类策略后,每个分类策略生成对应的分类结果,分类结果可能包括不止一个数据子集,比如,年龄段分类结果可有几个数据子集,对应每个年龄段。比如,在某年办理过A业务的用户,则分类结果可能仅生成一个数据子集。
本实施例将分类策略打包组成分类规则列表,顺序一次执行列表后获得对应每个分类策略的分类结果,执行效率高。
图6为本发明实施例提供的基于数据分析的语音拨叫用户分类方法中的对分类后的目标用户进行自动拨叫的流程图,如图所示,所述S3、对所述用户信息数据集中的任一目标用户进行自动语音拨叫,根据所述业务分类需求和所述任一目标用户的分类结果对应的分类类别从预设的问题库中提取对应的问题数据后进行问答处理,对问答处理结果进行分析后判断所述任一目标用户的原始信息是否有误,在有误时生成对应所述任一目标用户的待维护记录后发送至目标用户的原始信息的来源方,具体包括S301步骤~S306步骤:
S301、提取所述用户信息数据集中的任一目标用户的电话号码,连接电话拨叫中心后调用所述电话拨交中心的IVR功能对所述电话号码进行语音拨叫;
S302、拨通后,在所述分类结果中获取所述任一目标用户的分类类别,从预设的问题库中提取对应所述分类类别和所述业务分类需求的问题数据后与所述任一目标用户进行语音问答,并记录语音问答过程中的用户的应答数据、对应所述应答数据的问题数据,根据应答数据和问题数据生成问答处理结果,语音问答结束后,在所述用户信息数据集中为对应的目标用户设置用于标记已进行过语音问答的状态标记;
S303、遍历所述用户信息数据集后重复上述操作,获取未设置所述状态标记的所有已分类的目标用户的问答处理结果;
具体的,从用户原始数据或者经处理后的用户信息数据集中获取用户的电话号码,然后与电话拨叫中心等机构建立连接,连接成功后调用其开放的IVR等自动拨叫功能对该号码进行自动拨号,根据预先设置好的问题与用户进行问答对接,通过人机语音交互实现用户基础信息的获取,问题集的设置可包含对用户的原始数据中的各个数据的确认,记录问的问题和用户的答复,可以直接记录语音数据,也可以通过对语音数据转移为文字资料后记录文本数据,在拨通并搜集到对应的问题结果数据后,对该用户在用户信息数据集中设置标记,以便与其他没有经过拨叫的用户区分,防止重复拨叫。
S304、提取任一目标用户的所述问答处理结果中的应答数据,当所述应答数据对应的用户信息字段已经存在于所述用户信息数据集中,则将所述应答数据与所述用户信息数据集中的对应所述任一目标用户的信息数据字段中的数据进行语义相关度计算,当两者的语义相关度小于等于预设的语义相关度阈值时,则确定所述应答数据与所述用户信息数据集中的对应所述任一目标用户的信息数据存在不符的情况,此时,根据所述任一目标用户在所述用户信息数据集中的信息数据和所述应答数据对应的问题数据后生成待维护记录;
S305、遍历所有的目标用户的问题处理结果后,获得所有存在用户信息数据集的信息数据与应答数据不符的情况的目标用户的待维护记录;
S306、汇总所有的待维护记录后发送至目标用户的原始信息的来源方。
具体的,应答数据包括语音数据和文本数据,在进行本步骤处理时,可将语音数据通过语音识别引擎处理为文本数据,然后对应答结果中的关键信息进行提取后,按照问题所对应的用户字段将该关键信息与存储于用户信息数据集中的用户数据进行相关度比较,以便判断两者是否文意本质相同,比如,对职业进行问询时,可能用户回答为“对,我是代码民工”,而已有的记录则为“程序员”,此时,通过提取“代码民工”和“程序员”进行语义分析,判断两者的相关度后得出两者本质为相同文意。进行相关度计算的工具可采用如Simase_LSTM模型等相似度计算工具。当发现用户的应答数据和原始记录数据有出入时,将该情况记录后生成待维护记录,该记录中包括问题本身、用户的回答情况、原始记录数据等相关数据,用于发送给来源方的客户信息维护人员作为用户信息的核实依据。
本实施例,通过自动拨叫已分类的用户,以便进行用户信息的核实,核实过程采用语义分析方式判断用户的应答中的关键信息和原始记录信息的语义一致性,并将判断为语义有差异的用户数据、对应的问题和用户应答生成待维护记录后发送给用户数据的来源方,为来源方的用户数据维护提供数据支撑。
图7为本发明实施例提供的基于数据分析的语音拨叫用户分类方法中的根据拨叫情况对用户分类结果进行修正的流程图,如图所示,所述S4、接收所述来源方的更新数据,根据所述更新数据更新所述用户信息数据集,根据更新后的所述用户信息数据集对存在错误的所述原始信息对应的分类结果进行重新分类后获得修正后的分类结果,具体包括S401步骤~S403步骤:
S401、接收来自所述目标用户的原始信息的来源方的反馈数据;
S402、提取所述反馈数据更新所述用户信息数据集中的对用所述反馈数据的目标用户的信息数据后得到新的用户信息数据集;
S403、提取所述分类规则列表中的所有的分类策略的规则条件的特征词,计算发生错误的所述原始信息的数据字段与任一所述特征词的语义相似度,当两者的语义相似度大于设定判断阈值时,按所述特征词对应的分类策略对所述新的用户信息数据集进行重新分类后获得修正后的分类结果。
具体的,连接来源方后,获取来源方发来的反馈数据,根据其中的用户名称等关键信息或者其中的标识性数据判断是否为已经经过来源方维护后的用户数据的更新数据,再根据这些更新数据替换用户信息数据集中的对应数据,然后将出错的用户数据的原始数据对应的数据字段名称与分类规则列表中的每一个分类策略的规则条件中提取的特征词进行语义相似度的计算,两者如果判断为一致,则将这些特征词对应的分类策略作为新的分类策略对更新数据后的用户信息数据集进行再次分类后获得新的分类结果,这些结果替换旧的分类结果,比如,分类策略中的规则条件如“居住地在A区域内”、“居住地在B区C街道”等提炼出特征词为“居住地”,而出错的原始数据是某一用户的居住地址,则该地址的字段名称“居住地址”与“居住地”进行语义相似度计算后,确定两者为相同语义,则将“居住地在A区域内”、“居住地在B区C街道”等规则条件对应的分类策略均作为重新分类需要使用的分类策略对新的用户信息数据表进行再分类,将再分类结果替换对应的原分类结果后完成分类结果的修正。
本实施例根据来源方的反馈修正用户信息数据表后,再对其进行再分类,实现了分类结果的修正,提高了分类结果的准确性。
在一些实施例中,本发明提出了一种基于数据分析的语音拨叫用户分类装置。如图8所示为所述基于数据分析的语音拨叫用户分类装置的功能框图,所述基于数据分析的语音拨叫用户分类装置包括:用户信息获取模块11、目标用户分类模块12、目标用户拨叫模块13和分类结果修正模块14,其中:
用户信息获取模块11,设置为获取业务分类需求,根据所述业务分类需求获取对应所述业务分类需求的所有目标用户的原始信息,汇总所有所述目标用户的原始信息后生成原始信息数据集;
目标用户分类模块12,设置为对所述原始信息数据集中的任一所述目标用户的原始信息进行数据清理,汇总清理后得到的所有的所述目标用户的信息数据后生成用户信息数据集,根据预设的分类规则对所述用户信息数据集中的所有的所述目标用户进行分类后得到分类结果;
目标用户拨叫模块13,设置为对所述用户信息数据集中的任一目标用户进行自动语音拨叫,根据所述业务分类需求和所述任一目标用户的分类结果对应的分类类别从预设的问题库中提取对应的问题数据后进行问答处理,对问答处理结果进行分析后判断所述任一目标用户的原始信息是否有误,在有误时生成对应所述任一目标用户的待维护记录后发送至目标用户的原始信息的来源方;
分类结果修正模块14,设置为接收所述来源方的更新数据,根据所述更新数据更新所述用户信息数据集,根据更新后的所述用户信息数据集对存在错误的所述原始信息对应的分类结果进行重新分类后获得修正后的分类结果。
在其中一些实施例中,本发明提出了一种计算机设备,所述计算机设备包括存储器和处理器,存储器中存储有计算机可读指令,计算机可读指令被处理器执行时,使得处理器执行上述各实施例中的所述基于数据分析的语音拨叫用户分类方法的步骤。
在其中一些实施例中,本发明提出了一种存储有计算机可读指令的存储介质,该计算机可读指令被一个或多个处理器执行时,使得一个或多个处理器执行上述各实施例中的所述基于数据分析的语音拨叫用户分类方法的步骤,其中,所述存储介质可以为非易失性存储介质。
本领域普通技术人员可以理解上述实施例的各种方法中的全部或部分步骤是可以通过程序来指令相关的硬件来完成,该程序可以存储于一计算机可读存储介质中,存储介质可以包括:只读存储器(ROM,Read Only Memory)、随机存取存储器(RAM,RandomAccess Memory)、磁盘或光盘等。
以上所述实施例的各技术特征可以进行任意的组合,为使描述简洁,未对上述实施例中的技术特征所有可能的组合都进行描述,然而,只要这些技术特征的组合不存在矛盾,都应当认为是本说明书记载的范围。
以上所述实施例仅表达了本申请一些示例性实施例,其中描述较为具体和详细,但并不能因此而理解为对本申请专利范围的限制。应当指出的是,对于本领域的普通技术人员来说,在不脱离本申请构思的前提下,还可以做出若干变形和改进,这些都属于本申请的保护范围。因此,本申请专利的保护范围应以所附权利要求为准。

Claims (9)

1.基于数据分析的语音拨叫用户分类方法,其特征在于,包括:
获取业务分类需求,根据所述业务分类需求获取对应所述业务分类需求的所有目标用户的原始信息,汇总所有所述目标用户的原始信息后生成原始信息数据集;
对所述原始信息数据集中的任一所述目标用户的原始信息进行数据清理,汇总清理后得到的所有的所述目标用户的信息数据后生成用户信息数据集,根据预设的分类规则对所述用户信息数据集中的所有的所述目标用户进行分类后得到分类结果;
对所述用户信息数据集中的任一目标用户进行自动语音拨叫,根据所述业务分类需求和所述任一目标用户的分类结果对应的分类类别从预设的问题库中提取对应的问题数据后进行问答处理,对问答处理结果进行分析后判断所述任一目标用户的原始信息是否有误,在有误时生成对应所述任一目标用户的待维护记录后发送至目标用户的原始信息的来源方;
接收所述来源方的更新数据,根据所述更新数据更新所述用户信息数据集,根据更新后的所述用户信息数据集对存在错误的所述原始信息对应的分类结果进行重新分类后获得修正后的分类结果;
所述对所述原始信息数据集中的任一所述目标用户的原始信息进行数据清理,汇总清理后得到的所有的所述目标用户的信息数据后生成用户信息数据集,根据预设的分类规则对所述用户信息数据集中的所有的所述目标用户进行分类后得到分类结果,包括:
获取预设的初始字段表,所述初始字段表中定义了所有的在进行对应于所述业务分类需求的业务分类操作时所需的用户信息字段;
从所述原始信息数据集中提取任一目标用户的原始信息,再从所述初始字段表中提取对应所述任一目标用户的原始信息的用户信息字段后生成空白的用户信息表;
将所述任一目标用户的原始信息中的每一条信息数据逐一进行数据清理后,再写入所述用户信息表中的对应的用户信息字段中,生成对应所述任一目标用户的数据记录;
按上述操作遍历所述原始信息数据集后在所述用户信息表中生成所有所述目标用户的数据记录后得到所述用户信息数据集;
获取预设的分类规则列表,所述分类规则列表中预设了多个用于对所述目标用户进行分类的分类策略,根据不同的分类策略对所述用户信息数据集中的所有目标用户进行分类后得到对应所述分类策略的分类结果。
2.根据权利要求1所述的基于数据分析的语音拨叫用户分类方法,其特征在于,所述获取业务分类需求,根据所述业务分类需求获取对应所述业务分类需求的所有目标用户的原始信息,汇总所有所述目标用户的原始信息后生成原始信息数据集,包括:
从分类需求方处获取所述业务分类需求,根据所述业务分类需求访问对应所述业务分类需求的业务区块;
获取所述业务区块中的用户列表,根据所述用户列表从记录有所述业务区块的用户数据的数据存储单元中逐一获取每一个目标用户的原始信息后生成对应所述目标用户的原始信息记录;
汇总所有所述目标用户的原始信息记录后生成原始信息数据集。
3.根据权利要求1所述的基于数据分析的语音拨叫用户分类方法,其特征在于,所述将所述任一目标用户的原始信息中的每一条信息数据逐一进行数据清理后,再写入所述用户信息表中的对应的用户信息字段中,生成对应所述任一目标用户的数据记录,包括:
提取任一目标用户的原始信息中的每一条信息数据,判断所述每一条信息数据在所述用户信息表中是否存在对应的用户信息字段,如果是,则对所述信息数据进行数据清理后写入对应的用户信息字段内;
如果所述用户信息表中没有所述目标用户的原始信息中的信息数据对应的用户信息字段,则分析当前信息数据与所述用户信息表中的每一个用户信息字段A之间的语义相关度,当所述用户信息字段A与所述信息数据的语义相关度大于预设的语义相关度阈值X时,将所述目标用户的原始信息中的信息数据写入所述用户信息字段A中;
当所述用户信息字段A与所述信息数据的语义相关度小于等于所述语义相关度阈值X时,则分析所述信息数据与所述初始字段表中的任一用户信息字段B之间的语义相关度,当命中用户信息字段B与所述信息数据的语义相关度大于所述语义相关度阈值X时,将所述用户信息字段B追加到用户信息表中生成新的字段数据列,并将所述目标用户的原始信息中的信息数据写入新的字段数据列中。
4.根据权利要求1所述的基于数据分析的语音拨叫用户分类方法,其特征在于,所述获取预设的分类规则列表,所述分类规则列表中预设了多个用于对所述目标用户进行分类的分类策略,根据不同的分类策略对所述用户信息数据集中的所有目标用户进行分类后得到对应所述分类策略的分类结果,包括:
获取预设的分类规则列表,所述分类规则列表中的任一分类策略均对应设有一规则名称;
提取其中的一条分类策略,根据所述分类策略的规则条件对所述用户信息数据集中的所有目标用户执行所述分类策略的规则实体后得到分类结果;
将所述分类策略的规则名称作为分类结果的前缀为所述分类结果命名;
顺序执行所述分类规则列表中的每一条分类策略后得到所有的分类结果。
5.根据权利要求1所述的基于数据分析的语音拨叫用户分类方法,其特征在于,所述对所述用户信息数据集中的任一目标用户进行自动语音拨叫,根据所述业务分类需求和所述任一目标用户的分类结果对应的分类类别从预设的问题库中提取对应的问题数据后进行问答处理,对问答处理结果进行分析后判断所述任一目标用户的原始信息是否有误,在有误时生成对应所述任一目标用户的待维护记录后发送至目标用户的原始信息的来源方,包括:
提取所述用户信息数据集中的任一目标用户的电话号码,连接电话拨叫中心后调用所述电话拨叫 中心的IVR功能对所述电话号码进行语音拨叫;
拨通后,在所述分类结果中获取所述任一目标用户的分类类别,从预设的问题库中提取对应所述分类类别和所述业务分类需求的问题数据后与所述任一目标用户进行语音问答,并记录语音问答过程中的用户的应答数据、对应所述应答数据的问题数据,根据应答数据和问题数据生成问答处理结果,语音问答结束后,在所述用户信息数据集中为对应的目标用户设置用于标记已进行过语音问答的状态标记;
遍历所述用户信息数据集后重复上述从提取所述用户信息数据集中的任一目标用户的电话号码到在所述用户信息数据集中为对应的目标用户设置用于标记已进行过语音问答的状态标记的操作,获取未设置所述状态标记的所有已分类的目标用户的问答处理结果;
提取任一目标用户的所述问答处理结果中的应答数据,当所述应答数据对应的用户信息字段已经存在于所述用户信息数据集中,则将所述应答数据与所述用户信息数据集中的对应所述任一目标用户的信息数据字段中的数据进行语义相关度计算,当两者的语义相关度小于等于预设的语义相关度阈值时,则确定所述应答数据与所述用户信息数据集中的对应所述任一目标用户的信息数据存在不符的情况,此时,根据所述任一目标用户在所述用户信息数据集中的信息数据和所述应答数据对应的问题数据后生成待维护记录;
遍历所有的目标用户的问题处理结果后,获得所有存在用户信息数据集的信息数据与应答数据不符的情况的目标用户的待维护记录;
汇总所有的待维护记录后发送至目标用户的原始信息的来源方。
6.根据权利要求1所述的基于数据分析的语音拨叫用户分类方法,其特征在于,所述接收所述来源方的更新数据,根据所述更新数据更新所述用户信息数据集,根据更新后的所述用户信息数据集对存在错误的所述原始信息对应的分类结果进行重新分类后获得修正后的分类结果,包括:
接收来自所述目标用户的原始信息的来源方的反馈数据;
提取所述反馈数据更新所述用户信息数据集中的对用所述反馈数据的目标用户的信息数据后得到新的用户信息数据集;
提取所述分类规则列表中的所有的分类策略的规则条件的特征词,计算发生错误的所述原始信息的数据字段与任一所述特征词的语义相似度,当两者的语义相似度大于设定判断阈值时,按所述特征词对应的分类策略对所述新的用户信息数据集进行重新分类后获得修正后的分类结果。
7.基于数据分析的语音拨叫用户分类装置,其特征在于,包括:
用户信息获取模块,设置为获取业务分类需求,根据所述业务分类需求获取对应所述业务分类需求的所有目标用户的原始信息,汇总所有所述目标用户的原始信息后生成原始信息数据集;
目标用户分类模块,设置为对所述原始信息数据集中的任一所述目标用户的原始信息进行数据清理,汇总清理后得到的所有的所述目标用户的信息数据后生成用户信息数据集,根据预设的分类规则对所述用户信息数据集中的所有的所述目标用户进行分类后得到分类结果;
目标用户拨叫模块,设置为对所述用户信息数据集中的任一目标用户进行自动语音拨叫,根据所述业务分类需求和所述任一目标用户的分类结果对应的分类类别从预设的问题库中提取对应的问题数据后进行问答处理,对问答处理结果进行分析后判断所述任一目标用户的原始信息是否有误,在有误时生成对应所述任一目标用户的待维护记录后发送至目标用户的原始信息的来源方;
分类结果修正模块,设置为接收所述来源方的更新数据,根据所述更新数据更新所述用户信息数据集,根据更新后的所述用户信息数据集对存在错误的所述原始信息对应的分类结果进行重新分类后获得修正后的分类结果;
所述目标用户分类模块,还设置为获取预设的初始字段表,所述初始字段表中定义了所有的在进行对应于所述业务分类需求的业务分类操作时所需的用户信息字段;从所述原始信息数据集中提取任一目标用户的原始信息,再从所述初始字段表中提取对应所述任一目标用户的原始信息的用户信息字段后生成空白的用户信息表;将所述任一目标用户的原始信息中的每一条信息数据逐一进行数据清理后,再写入所述用户信息表中的对应的用户信息字段中,生成对应所述任一目标用户的数据记录;按上述操作遍历所述原始信息数据集后在所述用户信息表中生成所有所述目标用户的数据记录后得到所述用户信息数据集;获取预设的分类规则列表,所述分类规则列表中预设了多个用于对所述目标用户进行分类的分类策略,根据不同的分类策略对所述用户信息数据集中的所有目标用户进行分类后得到对应所述分类策略的分类结果。
8.一种计算机设备,包括存储器和处理器,所述存储器中存储有计算机可读指令,其特征在于,所述计算机可读指令被所述处理器执行时,实现如权利要求1至6中任意一项所述的基于数据分析的语音拨叫用户分类方法。
9.一种计算机可读存储介质,其上存储有计算机可读指令,其特征在于,所述计算机可读指令被一个或多个处理器执行时,实现如权利要求1至6中任意一项所述的基于数据分析的语音拨叫用户分类方法。
CN201910633951.5A 2019-07-15 2019-07-15 基于数据分析的语音拨叫用户分类方法及相关设备 Active CN110502675B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201910633951.5A CN110502675B (zh) 2019-07-15 2019-07-15 基于数据分析的语音拨叫用户分类方法及相关设备

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201910633951.5A CN110502675B (zh) 2019-07-15 2019-07-15 基于数据分析的语音拨叫用户分类方法及相关设备

Publications (2)

Publication Number Publication Date
CN110502675A CN110502675A (zh) 2019-11-26
CN110502675B true CN110502675B (zh) 2022-08-23

Family

ID=68585489

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201910633951.5A Active CN110502675B (zh) 2019-07-15 2019-07-15 基于数据分析的语音拨叫用户分类方法及相关设备

Country Status (1)

Country Link
CN (1) CN110502675B (zh)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN114970552B (zh) * 2022-07-27 2022-10-11 成都乐超人科技有限公司 基于微服务的用户回访信息分析方法、装置、设备及介质

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102708511A (zh) * 2012-04-17 2012-10-03 苏州工业园区凌志软件有限公司 金融营销服务的客户服务管理***及其实现方法
CN107507087A (zh) * 2017-07-25 2017-12-22 厦门快商通科技股份有限公司 一种面向客户的业务信息收集方法及***
CN108108900A (zh) * 2017-12-22 2018-06-01 中山市榄商置业发展有限公司 一种基于信息技术的客户服务***
CN108509484A (zh) * 2018-01-31 2018-09-07 腾讯科技(深圳)有限公司 分类器构建及智能问答方法、装置、终端及可读存储介质
CN108521525A (zh) * 2018-04-03 2018-09-11 南京甄视智能科技有限公司 基于用户标签体系的智能机器人客服营销方法和***

Family Cites Families (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8060386B2 (en) * 2009-04-30 2011-11-15 Trustnode, Inc. Persistent sales agent for complex transactions
US20140100888A1 (en) * 2012-10-04 2014-04-10 Derek Wirz Method to Identify Potential Workers Compensation Customers and Mapping Their Location
CN105159896A (zh) * 2014-05-28 2015-12-16 无锡韩光电器有限公司 一种基于互联网搜索关键字信息的装置
US9396483B2 (en) * 2014-08-28 2016-07-19 Jehan Hamedi Systems and methods for determining recommended aspects of future content, actions, or behavior
CN104731895B (zh) * 2015-03-18 2018-09-18 北京京东尚科信息技术有限公司 自动应答的方法和装置
US10049663B2 (en) * 2016-06-08 2018-08-14 Apple, Inc. Intelligent automated assistant for media exploration
US10949909B2 (en) * 2017-02-24 2021-03-16 Sap Se Optimized recommendation engine
CN107798461A (zh) * 2017-09-15 2018-03-13 平安科技(深圳)有限公司 坐席监控方法、装置、设备及计算机可读存储介质
US10878033B2 (en) * 2017-12-01 2020-12-29 International Business Machines Corporation Suggesting follow up questions from user behavior
CN107909494B (zh) * 2017-12-08 2020-07-21 中国平安财产保险股份有限公司 保险数据信息的配置方法、装置、计算机设备和存储介质
CN108984754B (zh) * 2018-07-18 2023-04-18 平安科技(深圳)有限公司 客户信息更新方法、装置、计算机设备及存储介质

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102708511A (zh) * 2012-04-17 2012-10-03 苏州工业园区凌志软件有限公司 金融营销服务的客户服务管理***及其实现方法
CN107507087A (zh) * 2017-07-25 2017-12-22 厦门快商通科技股份有限公司 一种面向客户的业务信息收集方法及***
CN108108900A (zh) * 2017-12-22 2018-06-01 中山市榄商置业发展有限公司 一种基于信息技术的客户服务***
CN108509484A (zh) * 2018-01-31 2018-09-07 腾讯科技(深圳)有限公司 分类器构建及智能问答方法、装置、终端及可读存储介质
CN108521525A (zh) * 2018-04-03 2018-09-11 南京甄视智能科技有限公司 基于用户标签体系的智能机器人客服营销方法和***

Also Published As

Publication number Publication date
CN110502675A (zh) 2019-11-26

Similar Documents

Publication Publication Date Title
Azeroual et al. Data quality measures and data cleansing for research information systems
US7020804B2 (en) Test data generation system for evaluating data cleansing applications
RU2680746C2 (ru) Способ и устройство для создания модели качества веб-страницы
Balci Credibility assessment of simulation results
CN110689325A (zh) 信息处理方法、装置及计算机可读存储介质
CN112416778A (zh) 测试用例推荐方法、装置和电子设备
CN110580291B (zh) 基于erp客户服务知识图谱的智能搜索方法及计算机设备
CN112036842A (zh) 一种科技服务智能匹配平台
CN113051291A (zh) 工单信息的处理方法、装置、设备及存储介质
CN106844730A (zh) 文件内容的显示方法及装置
US11790380B2 (en) Systems and methods for finding an interaction subset within a set of interactions
CN113435627A (zh) 基于工单轨迹信息的电力客户投诉预测方法及装置
CN117520503A (zh) 基于llm模型的金融客服对话生成方法、装置、设备及介质
Dixon et al. Firm dynamics: Employment growth rates of small versus large firms in canada
CN110109678B (zh) 一种代码审计规则库生成方法、装置、设备及介质
CN110502675B (zh) 基于数据分析的语音拨叫用户分类方法及相关设备
Oliver et al. Constructing relational and verifiable protest event data: Four challenges and some solutions
Zealand Data integration manual
CN116578499B (zh) 公共组件功能变更影响的智能化分析测试方法及其***
CN112036841A (zh) 基于智能语义识别的政策解析***及方法
CN117093497A (zh) 测试报告处理方法、装置、电子设备及存储介质
Wowczko A case study of evaluating job readiness with data mining tools and CRISP-DM methodology
CN115525575A (zh) 一种基于Dataworks平台的数据自动化测试方法及***
CN114372479A (zh) 文本识别方法、装置、电子设备及计算机可读存储介质
CN112988704A (zh) 一种基于ai咨询数据库集群搭建方法和***

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant