CN112861980A - 一种基于大数据的事历任务表挖掘方法及计算机设备 - Google Patents

一种基于大数据的事历任务表挖掘方法及计算机设备 Download PDF

Info

Publication number
CN112861980A
CN112861980A CN202110194607.8A CN202110194607A CN112861980A CN 112861980 A CN112861980 A CN 112861980A CN 202110194607 A CN202110194607 A CN 202110194607A CN 112861980 A CN112861980 A CN 112861980A
Authority
CN
China
Prior art keywords
calendar
executed
account
target
task table
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202110194607.8A
Other languages
English (en)
Other versions
CN112861980B (zh
Inventor
余雯
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Ping An Technology Shenzhen Co Ltd
Original Assignee
Ping An Technology Shenzhen Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Ping An Technology Shenzhen Co Ltd filed Critical Ping An Technology Shenzhen Co Ltd
Priority to CN202110194607.8A priority Critical patent/CN112861980B/zh
Publication of CN112861980A publication Critical patent/CN112861980A/zh
Application granted granted Critical
Publication of CN112861980B publication Critical patent/CN112861980B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/21Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
    • G06F18/214Generating training patterns; Bootstrap methods, e.g. bagging or boosting
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q30/00Commerce
    • G06Q30/02Marketing; Price estimation or determination; Fundraising
    • G06Q30/0201Market modelling; Market analysis; Collecting market data

Landscapes

  • Engineering & Computer Science (AREA)
  • Business, Economics & Management (AREA)
  • Strategic Management (AREA)
  • Theoretical Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Finance (AREA)
  • Development Economics (AREA)
  • Accounting & Taxation (AREA)
  • General Physics & Mathematics (AREA)
  • Entrepreneurship & Innovation (AREA)
  • Physics & Mathematics (AREA)
  • Evolutionary Computation (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • General Engineering & Computer Science (AREA)
  • Artificial Intelligence (AREA)
  • Evolutionary Biology (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Game Theory and Decision Science (AREA)
  • Economics (AREA)
  • Marketing (AREA)
  • General Business, Economics & Management (AREA)
  • Life Sciences & Earth Sciences (AREA)

Abstract

本申请涉及大数据技术领域,提供了一种基于大数据的事历任务表挖掘方法、事历任务表挖掘装置、计算机设备及计算机可读存储介质。其中,一种基于大数据的事历任务表挖掘方法,将目标账户的行事历数据输入训练后的事历权重模型进行优化环节识别,得到待优化事历环节信息,因为目标事历池中的信息用于描述目标账户与各待优化事历环节中各事历内容之间的对应关系,所以根据待优化事历环节信息能够从目标账户对应的目标事历池中确定出待执行事历集合,故基于待执行事历集合输出待执行事历任务表,令该事历任务表中的内容与目标账户之间更加匹配,能够避免挖掘出的内容具有特征偏性,提高事务列表的有效性。此外,本申请还适用于区块链技术领域。

Description

一种基于大数据的事历任务表挖掘方法及计算机设备
技术领域
本发明属于大数据技术领域,尤其涉及一种基于大数据的事历任务表挖掘方法、基于大数据的事历任务表挖掘装置、计算机设备及计算机可读存储介质。
背景技术
随着大数据分析技术被各行各业广泛使用,无论是产品的研发、产品的推广以及产品的销售渠道等,早已离不开大数据分析技术的支持。
然而,以往的大数据分析手段,主要基于用户的各方面信息进行特征提取,并生成该用户的用户画像或者用户标签,再基于用户画像或用户标签进行分类、资源推荐等操作。例如,在基于大数据分析,为销售员输出事历任务时,需要根据销售员的相关信息与业绩数据进行特征挖掘,这里的相关信息可以包括:销售员的属性信息,如学历、年龄、性别、婚姻情况等,业绩数据如某类产品的销量等。但是,现有技术中进行特征挖掘时,容易引入影响程度较小甚至无关的变量,例如销售员的学历、婚姻情况等。或者,容易因某些异常数据导致挖掘出的特征存在偏性,如在某时段内出现的爆款产品,其销售数据较高,并且对所有销售员的销售数据均产生一定影响,从而导致挖掘出的特征受到该爆款产品销售数据的影响,出现特征偏性。
发明内容
有鉴于此,本申请实施例提供了一种基于大数据的事历任务表挖掘方法、基于大数据的事历任务表挖掘装置、计算机设备及计算机可读存储介质,以解决现有的数据分析方案存在挖掘出的内容具有特征偏性的问题。
本申请实施例的第一方面提供了一种基于大数据的事历任务表挖掘方法,包括:
将目标账户的行事历数据输入训练后的事历权重模型进行优化环节识别,得到待优化事历环节信息;
根据所述待优化事历环节信息,从所述目标账户对应的目标事历池中确定出待执行事历集合;其中,所述目标事历池是基于所述目标账户对应的账户类型构建得到;
基于所述待执行事历集合输出待执行事历任务表。
本申请实施例的第二方面提供了一种基于大数据的事历任务表挖掘装置,包括:
识别单元,用于将目标账户的行事历数据输入训练后的事历权重模型进行优化环节识别,得到待优化事历环节信息;
确定单元,用于根据所述待优化事历环节信息,从所述目标账户对应的目标事历池中确定出待执行事历集合;其中,所述目标事历池是基于所述目标账户对应的账户类型构建得到;
输出单元,用于基于所述待执行事历集合输出待执行事历任务表。
本申请实施例的第三方面提供了一种计算机设备,包括存储器、处理器以及存储在所述存储器中并可在所述处理器上运行的计算机程序,所述处理器执行所述计算机程序时实现第一方面的各个步骤。
本申请实施例的第四方面提供了一种计算机可读存储介质,所述计算机可读存储介质存储有计算机程序,所述计算机程序被处理器执行时实现第一方面的各个步骤。
实施本申请实施例提供的一种基于大数据的事历任务表挖掘方法、事历任务表挖掘装置、计算机设备及计算机可读存储介质具有以下有益效果:
本申请实施例,将目标账户的行事历数据输入训练后的事历权重模型进行优化环节识别,由于目标账户的行事历数据表征了目标账户的实际行事内容,因此利用训练后的事历权重模型根据目标账户的行事历数据进行优化环节识别,能够确定出需要进行优化的事历环节,也即得到待优化事历环节信息,因为目标事历池中的信息用于描述目标账户与各待优化事历环节中各事历内容之间的对应关系,所以根据待优化事历环节信息能够从目标账户对应的目标事历池中确定出待执行事历集合,故基于待执行事历集合输出待执行事历任务表,令该事历任务表中的内容与目标账户之间更加匹配,提高了输出事务列表的有效性,避免了挖掘出的内容具有特征偏性。
附图说明
为了更清楚地说明本申请实施例中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本申请的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。
图1是本申请实施例提供的一种基于大数据的事历任务表挖掘方法的实现流程图;
图2是本申请实施例中步骤S11的实现流程图;
图3是本申请另一实施例提供的一种基于大数据的事历任务表挖掘方法的实现流程图;
图4是本申请实施例提供的一种基于大数据的事历任务表挖掘装置的结构框图;
图5是本申请实施例提供的一种计算机设备的结构框图。
具体实施方式
为了使本申请的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,对本申请进行进一步详细说明。应当理解,此处所描述的具体实施例仅仅用以解释本申请,并不用于限定本申请。
本实施例提供的一种基于大数据的事历任务表的输出方法,执行主体为服务器或终端,具体可以是配置有该方法或功能的服务器或终端,其中,服务器可以是服务器集群中的任一服务器。服务器集群可以是由多个服务器组成的集群,基于该服务器集群构建分布式***,使得服务器集群中的多个服务器之间可以实现数据共享或数据同步。在此基础上,向该服务器集群中的任一服务器配置目标脚本文件,由该目标脚本文件描述本实施例提供的基于大数据的事历任务表的输出方法,使得该配置有目标脚本文件的服务器能够通过执行该目标脚本文件,进而执行输出事历任务表的方法中的各个步骤。在由终端执行输出事历任务表的方法时,可以是在终端上安装相应的应用程序,由于该应用程序中配置有目标脚本文件,且该目标脚本文件用于描述基于大数据的事历任务表的输出方法的各执行步骤,因此终端能够通过应用程序执行该目标脚本文件,进而执行基于大数据的事历任务表的输出方法中的各个步骤。
在实现时,服务器或者终端将目标账户的行事历数据输入训练后的事历权重模型进行优化环节识别,由于目标账户的行事历数据表征了目标账户的实际行事内容,因此利用训练后的事历权重模型根据目标账户的行事历数据进行优化环节识别,能够确定出需要进行优化的事历环节,也即得到待优化事历环节信息,因为目标事历池是基于目标账户对应的账户类型构建得到,且目标事历池中的信息用于描述目标账户与各待优化事历环节中各事历内容之间的对应关系,所以根据待优化事历环节信息能够从目标账户对应的目标事历池中确定出待执行事历集合,基于待执行事历集合输出待执行事历任务表,使得事历任务表中的内容与目标账户之间更加匹配,提高了输出事务列表的有效性,进而提升了事历任务的输出效率。
例如,上述目标账户与“销售人员”对应,以事历数据为“销售人员”在实际销售活动过程中的行为数据为例,终端或服务器将“销售人员”对应的目标账户的行事历数据输入训练后的事历权重模型进行优化环节识别,由于“销售人员”的行事历数据表征了“销售人员”的实际行事内容,因此利用训练后的事历权重模型根据“销售人员”的行事历数据进行优化环节识别,能够确定出需要进行优化的事历环节,也即得到与该“销售人员”对应的待优化事历环节信息,因为目标事历池是基于“销售人员”的目标账户所对应的账户类型构建得到,且目标事历池中的信息用于描述“销售人员”与各待优化事历环节中各事历内容之间的对应关系,也即描述了适合“销售人员”于各待优化事历环节中进行改进的事历内容,所以根据待优化事历环节信息能够从“销售人员”对应的目标事历池中确定出待执行事历集合,终端或服务器基于待执行事历集合输出待执行事历任务表,使得事历任务表中的内容与“销售人员”之间更加匹配,提高了输出事务列表的有效性,进而提升了事历任务的输出效率。
以下通过具体实现方式对本实施例提供的一种基于大数据的事历任务表挖掘方法进行详细说明。
图1示出了本申请实施例提供的基于大数据的事历任务表挖掘方法的实现流程图,详述如下:
S11:将目标账户的行事历数据输入训练后的事历权重模型进行优化环节识别,得到待优化事历环节信息。
在步骤S11中,目标账户与实际的销售员之间存在唯一对应关系,也即不同销售员可以对应不同的账户。这里,目标账户泛指需要通过终端或者服务器为其输出事历任务表的销售员所使用的账户。
在实现时,行事历数据可以包括编辑内容与记录内容,其中编辑内容是由销售员自行编辑得到,记录内容则是根据销售员的实际操作进行记录得到,例如,销售员在实际执行事历,如向客户发送宣传信息进行互动后,于其账户中进行行事历内容以及资源指标数据的编辑,进而得到该行事历数据中的编辑内容;销售员在与客户进行宣传互动的过程中完成的产品交易后,该交易的所有信息被作为行事历数据中的记录内容。
在其他实施例中,行事历数据中的编辑内容与记录内容,都可以是在销售员对应的账户中配置多个事历环节,每个事历环节对应多个事历内容,由用户自行勾选事历内容作为编辑内容,填写资源指标数据作为记录内容,进而形成事历数据。例如,事历环节可以包括:“客户积累”、“互动开拓”、“产品交易促成”以及“关联服务”等,在事历环节为“客户积累”下,还设置有“查看客户联系方式”、“向客户发送产品信息”、“线下宣传活动”等事历内容,销售员在实际执行相应的事历内容后,于其账户中自行勾选事历内容作为编辑内容,并填写在开展该事历内容后获得的资源指标数据作为记录内容,例如,客户数量或者交易数额等。
在本申请的所有实施例中,训练后的事历权重模型用于描述行事历数据与待优化事历环节信息之间的对应关系。由于行事历数据为目标账户所标识的销售员实际执行事历的内容,及其相应的资源指标数据,且资源指标数据能够表征实际执行事历所产生的有益效果,因此利用训练后的事历权重模型对销售员实际执行事历的内容与资源指标数据进行优化环节识别。这里,优化环节识别指的是基于销售员实际执行事历的内容,进行待优化环节挖掘,由于训练后的事历权重模型用于描述行事历数据与待优化事历环节信息之间的对应关系,因此利用训练后的事历权重模型对销售员实际执行事历的内容与资源指标数据进行优化环节识别,能够挖掘出目标账户对应的销售员在实际执行相应的事历内容时存在的遗漏或者不足之处,令得到的待优化事历环节信息能够用于描目标账户对应的销售员在未来需要执行的事历内容对应的事历环节。
在实现时,训练后的事历权重模型可以是基于已知的LR逻辑回归模型构建并训练得到,行事历数据中的实际执行事历内容及其指标数据,作为模型的输入信息,输入该训练后的事历权重模型,利用该训练后的事历权重模型预测目标账户未来的指标数据是否会提升,最后将代表潜力值的概率转换成分值,形成目标账户的活动量评分,其中,概率越大则表示提升的可能性越大,也即可提高的空间与未来可执行的事历内容就越多,概率与活动量评分之间可以是正比或反比。通过将目标账户的活动量评分对应事历环节进行拆分,得到每个事历环节对应的权重分值,再基于权重分值进行判断相应的事历环节是否为待优化事历环节,进而得到待优化事历环节信息。
可以理解的是,在实际应用中,训练后的事历权重模型可以是基于已知的LR逻辑回归模型构建并训练得到,因此本领域技术人员知晓,可以根据实际需求利用与LR逻辑回归模型相似的其它模型框架,也能够构建得到具有本实施例中事历权重模型相同功能的其他模型,再利用包含行事历数据样本与事历环节样本的样本数据集合对其进行训练,即可得到训练后的事历权重模型,故此处不再赘述如何训练或者如何构建训练后的事历权重模型。
图2出了本实施例中步骤S11的实现流程图。如图2示,作为一个实施例,行事历数据包括所述目标账户的实际执行事历环节,以及所述实际执行事历环节对应的资源指标数据;步骤S11具体包括:
S111:利用训练后的事历权重模型根据所述资源指标数据,确定所述实际执行事历环节的可提升概率值;
S112:按照预设转换策略将所述可提升概率值换算为活动量评分,所述活动量评分用于表征所述实际执行事历环节的待优化程度;
S113:基于所述活动量评分得到待优化事历环节信息。
在本实施例中,行事历数据包括该销售员的实际执行事历内容,以及与该实际执行事历对应的指标数据,其中,实际执行事历内容用于描述该销售员以往开展的与销售活动相关的事务;指标数据用于描述销售员开展了与销售活动相关的事务后获得的资源指标数据。作为一个示例,资源指标数据可以包括记录的客户信息数量、需求内容数量、产品需求数量、产品销量、产品收益等。
需要说明的是,在本实施例中预设转换策略用于描述将可提升概率值换算为活动量评分的逻辑内容,这里,预设的转换策略可以配置为一个脚本文件,或者配置为模型的另一分支模块嵌入事历权重模型中,如LR逻辑回归的评分卡模型单元。
在实现过程中,可以将资源指标数据作为输入量X,输入训练后的事历权重模型进行分箱处理,通过将行事历数据中的资源指标数据进行划分,如划分为0-1个标数区间、1-3个标数区间或者3-5个标数区间,进而将指标数据转换为离散变量,具体划分的节点可以通过卡方检验,具有最小卡方值的相邻区间合并在一起。计算各个资源指标数据的证据权重WOE值后,可以将WOE值替代输入量X,作为模型的输入。这样可以增加模型的非线性,提升模型的表达能力,并且易于计算。
作为一个示例,通过LR逻辑回归的评分卡模型,预测目标账户的绩效是否提升,模型会输出代理人绩效提升的概率。例如,将概率转换为分数,具体可以通过如下公式测算得到;
Score=A+B*ln(Odds);其中,A为基本系数;B为比例系数;Odds=p/(1-p);p为训练后的事历权重模型输出的预测概率。
进一步地,通过方程组求:P0=A+B*ln(Odds);P0+PDO=A+B*ln(2*Odds);可以解出基本系数A与比例系数B。在上述方程组中,P0为预设的初始分数点;PDO表示概率翻倍时希望提升的分数;具体分数可以根据实际情况,在设定的分数区间范围内进行调整。最终可以算出Score的分数值,表示对每个代理人绩效提升的评分。总分的分数又可以分配到每个变量X中,通过逻辑回归的公式:
Figure BDA0002946140960000081
可以计算出:
ln(Odds)=w0+w1*x1+w2*x2+…;Score=A+B*(w0+w1*x1+w2*x2+…)。
本实施例中,将总分拆解为各个指标的分值加总,计算出目标账户的每个事历环节的资源指标数据对应的分值,并将其与预设参考数值进行比较,该预设参考数值可以是所有其他账户的平均分值,找出差距最大,显著低于均分情况的事历环节作为待优化事历环节。
S12:根据所述待优化事历环节信息,从所述目标账户对应的目标事历池中确定出待执行事历集合;其中,所述目标事历池是基于所述目标账户对应的账户类型构建得到。
在步骤S12中,目标事历池中的信息用于描述待优化环节信息与待执行事历集合之间的对应关系,且目标事历池与目标账户之间存在关联关系。待执行事历集合中包括至少一项待执行事历。
在本实施例中,待优化事历环节信息描述的是,目标账户对应的销售员在未来需要执行的事历内容对应的事历环节,而事务环节下对应有多个事务内容,并非所有事务内容均与目标账户匹配,因此针对不同的账户可以配置不同的目标事历池。这里,由于目标账户与实际的销售员之间存在唯一对应关系,也即不同销售员对应不同的账户,因此可以根据不同销售员的特征或属性,对所有的账户进行分类,进而区分不同账户之间的账户类型,再根据不同的账户类型配置不同的目标事历池。
在实际应用中,为不同账户类型的账户配置不同的目标事历池时,可以是根据账户的分类结果,也即根据分类后的每个账户类型,将每个事历环节中所有事历内容进行对应划分,从事历环节中选取与账户类别更匹配事历内容,进而组成该账户类别对应的目标事历池。
例如,事历环节可以包括:“客户积累”与“互动开拓”,在事历环节为“客户积累”下,设置的事历内容有“查看客户联系方式”、“向客户发送产品信息”、“线下宣传活动”;在事历环节为“互动开拓”下,设置的事历内容有“邮件推送”、“微信推送”、“赠送礼品”;账户A对应的目标事历池中可以包括:事历环节为“客户积累”下的所有事历内容,与事历环节为“互动开拓”下部分事历内容,也即“查看客户联系方式”、“向客户发送产品信息”、“线下宣传活动”以及“微信推送”;账户B对应的目标事历池中可以包括:事历环节为“客户积累”下的部分事历内容,与事历环节为“互动开拓”全部事历内容,也即“查看客户联系方式”、“向客户发送产品信息”、“邮件推送”以及“微信推送”。
作为一个实施例,步骤S12可以包括:
根据所述目标账户对应的账户类型,确定与所述账户类型对应的目标事历池;根据所述待优化事历环节信息从所述目标事历池中确定出待执行事历集合。
在本实施例中,账户类型用于区分或识别目标账户对应的目标事历池,这里,可以预先对所有销售人员对应的账户集合进行分类处理,得到多个账户子集,使得账户集合中的全部账户能够精确分类,再为每个账户子集分配相应的目标事历池,使得在为目标账户查询适用事历时,无需推荐所有未记录或未处理事历,只需要从目标事历池中匹配更准确的目标事历即可。
应当理解的是,在实现时,由于对账户集合进行分类得到多个账户子集,以及为每个账户子集分配相应的目标事历池,可以在步骤S12之前完成,因此在为每个账户子集分配相应的目标事历池后,之后每次执行S12时,无需再为每个账户子集分配相应的目标事历池,直到对账户集合进行重新分类为止。
以上述实施例为基础,作为本申请的一个实施例,基于大数据的事历任务表挖掘方法中,在步骤S12之前还包括如下步骤:
基于账户集合中每个账户携带的属性信息,对所述账户集合进行分类处理,得到多个账户子集;其中,所述多个账户子集对应多个账户类型;
分别为各所述账户子集,从事历样本池中选取事历样本构建目标事历池。
在本实施例中,属性信息为账户对应的销售员的个人信息,比如年龄、性别、学历等作为特征。基于每个账户携带的属性信息对账户集合进行分类处理,可以是先基于属性信息筛选出最为显著或者具有代表性的若干个账户,再通过比较若干个账户与其他账户之间的相似度,进而实现对账户集合的分类处理,得到多个账户子集。
在实现时,可以先通过Kmeans++聚类方法基于账户集合中每个账户携带的属性信息,将账户集合进行聚类操作,然后通过对特征的统计值,找出每一类的最显著特征,比如年轻、女性等。为每一个账户群体提取出关键特征后,筛选出最符合这些特征的若干账户,剩余的其他账户可以通过KNN算法计算和哪个账户群体中的账户最为相似,就可以将其划分至对应的账户群体中。在对账户集合进行分类处理后,对于每个账户子集而言,输入每个账户对应的行事历数据作为因子,利用分类预测模型预测该账户的未来资源指标提升概率,例如,利用XGBoost模型、LightGBM模型等,预测账户对应的销售员,在未来三个月内的绩效是否会提升。利用分类预测模型可以直接输出每个行事历数据的重要性,将重要性从高到低排序后,选择累计重要性较高的事历内容组成相应的目标事历池。
作为本实施例一种可能实现的方式,在步骤分别为各所述账户子集,从事历样本池中选取事历样本构建目标事历池之前,还可以包括:基于账户集合中每个账户对应的行事历数据构建事历样本池。
在本实施例中,基于账户集合中每个账户对应的行事历数据构建事历样本池,是为了对已知的所有账户配置准确的事历样本池。事历样本池中的事历样本,是通过对所有账户中实际记录的事历内容进行筛选得到,通过对所有事历内容进行筛选,从中确定出更符合实际执行条件,或者适用范围更广、适用效果更好的事历作为事历样本。
在实现时,可以根据每个账户对应的行事历数据,测算事历环节中每个事历内容的饱和度、相关性等。其中,饱和度用于描述事历内容的执行范围大小,相关性则是表征事历内容之间的相似程度。
例如,100个销售员,看某个动作有多少销售员做了,如果只有少于10个人做过,则饱和度较低可对该事历内容进行剔除。
再例如,事历内容1:查看客户联系方式,与事历内容2:拨打电话,基本上查看联系方式的代理人同时也会拨打电话,通过这100个销售员的这两个事历内容的完成次数计算出的相关性系数很高,如果高于80%,我们会选择剔除掉重复的特征。
在本实施例中,由于事历样本池中的事历样本是通过对所有账户中实际记录的事历内容进行筛选得到,且是通过对所有事历内容进行筛选,从中确定出更符合实际执行条件,或者适用范围更广、适用效果更好的事历作为事历样本,因此能够在为各账户子集构建目标事历池之前先对事历样本池进行样本优化,令从事历样本池中选取事历样本提供了更好的样本挑选环境。
S13:基于所述待执行事历集合输出待执行事历任务表。
在步骤S13中,待执行事历集合中包括至少一项待执行事历,该待执行事历可以是事历环节,或者是事历环节下的一个或多个事历内容。
在本实施例中,待执行事历任务表用于在终端或者服务器上显示的数据列表,当待执行事历集合中包括多项待执行事历时,可以通过比较每项待执行事历的难易程度或者重要程度,进而为该待执行事历集合进行排序,再由终端或服务器间排序后的结果作为待执行事历任务表进行输出。
作为一个实施例,步骤S13可以包括:
若待执行事历集合中的待执行事历总数N大于预设阈值,则调用排序工具对所述待执行事历集合中的N个所述待执行事历进行排序,得到排序后的待执行事历集合;其中,N为大于2的整数;将所述排序后的待执行事历集合作为待执行事历任务表进行输出。
在本实施例中,需要为目标账户输出的待执行事历集合进行排序,找出最应该优先推荐、有效且适合目标账户对应的销售员的事历内容。排序工具可以是采用FM,FFM,Wide&Deep,DCN等算法构建得到的排序模型。
在实现时,以DeepFM为例,DeepFM算法有效的结合了因子分解机与神经网络在特征学习中的优点:同时提取到低阶组合特征与高阶组合特征。在DeepFM中,FM算法负责对一阶特征以及由一阶特征两两组合而成的二阶特征进行特征的提取;DNN算法负责对由输入的一阶特征进行全连接等操作形成的高阶特征进行特征的提取。最终排序模型的输出也是两部分组成,具体表征如公式:Y=sigmoid(yFM+yDNN);
其中,FM部分输出:
Figure BDA0002946140960000121
这里w是权重系数,用于衡量特征x的重要性,x为目标账户的行事历数据中与待执行事历的关联数据,如待执行事历的执行次数、时间等。DNN部分,将特征的embedding表示展开成一个全连接向量,进行几层全连接计算。
例如,从目标事历池中找出50个待执行事历作为待执行事历集合,通过DeepFM等推荐模型,预测在该待执行事历集合的场景下,资源指标数据的提升的概率。将目标账户这50条待执行事历输出的概率值进行排序,可以选出排名靠前的5个待执行事历。
以上方案中,将目标账户的行事历数据输入训练后的事历权重模型进行优化环节识别,由于目标账户的行事历数据表征了目标账户的实际行事内容,因此利用训练后的事历权重模型根据目标账户的行事历数据进行优化环节识别,能够确定出需要进行优化的事历环节,也即得到待优化事历环节信息,因为目标事历池中的信息用于描述目标账户与各待优化事历环节中各事历内容之间的对应关系,所以根据待优化事历环节信息能够从目标账户对应的目标事历池中确定出待执行事历集合,故基于待执行事历集合输出待执行事历任务表,令该事历任务表中的内容与目标账户之间更加匹配,避免了挖掘出的内容具有特征偏性。
此外,由于利用本实施例提供的基于大数据的事历任务表挖掘方法,输出的事历任务表中的内容与目标账户之间更加匹配,因此还能够提高输出事务列表的有效性,提升了事历任务的输出效率。
图3示出了本申请另一实施例提供的一种基于大数据的事历任务表挖掘方法的实现流程图。参见图3,相对于图1所述实施例,本实施例提供的一种基于大数据的事历任务表挖掘方法中,在所述基于所述待执行事历集合输出待执行事历任务表的步骤之后,还包括:S21,具体详述如下:
在本实施例中,在所述基于所述待执行事历集合输出待执行事历任务表的步骤之后,还包括:
S21:将所述待执行事历任务表部署至区块链节点中。
在本实施例中,为了将待执行事历任务表进行共享,将待执行事历任务表部署至区块链中,进而避免该待执行事历任务表的内容被篡改。
在本申请的所有实施例中,将待执行事历任务表部署至区块链节点中可令该区块链节点能够通过调用该待执行事历任务表,进而获得该待执行事历任务表,也即提供给目标账户对应销售员的未来工作计划。同时,还能够保证该待执行事历任务表安全性和对用户的公正透明性。本示例所指区块链是分布式数据存储、点对点传输、共识机制、加密算法等计算机技术的新型应用模式。区块链(Blockchain),本质上是一个去中心化的数据库,是一串使用密码学方法相关联产生的数据块,每一个数据块中包含了一批次网络交易的信息,用于验证其信息的有效性(防伪)和生成下一个区块。区块链可以包括区块链底层平台、平台产品服务层以及应用服务层等。
以上方案中,将目标账户的行事历数据输入训练后的事历权重模型进行优化环节识别,由于目标账户的行事历数据表征了目标账户的实际行事内容,因此利用训练后的事历权重模型根据目标账户的行事历数据进行优化环节识别,能够确定出需要进行优化的事历环节,也即得到待优化事历环节信息,因为目标事历池中的信息用于描述目标账户与各待优化事历环节中各事历内容之间的对应关系,所以根据待优化事历环节信息能够从目标账户对应的目标事历池中确定出待执行事历集合,故基于待执行事历集合输出待执行事历任务表,令该事历任务表中的内容与目标账户之间更加匹配,避免了挖掘出的内容具有特征偏性。
此外,由于利用本实施例提供的基于大数据的事历任务表挖掘方法,输出的事历任务表中的内容与目标账户之间更加匹配,因此还能够提高输出事务列表的有效性,提升了事历任务的输出效率。
此外,将待执行事历任务表部署至区块链节点中,使得该待执行事历任务表能够被区块链中的其他具有调用权限的节点获取并使用,能够进一步提高该待执行事历任务表的利用率。
请参阅图4,图4是本申请实施例提供的一种基于大数据的事历任务表挖掘装置的结构框图。本实施例中该移动终端包括的各单元用于执行图1与图3对应的实施例中的各步骤。具体请参阅图1与图3以及图1与图3所对应的实施例中的相关描述。为了便于说明,仅示出了与本实施例相关的部分。参见图4,事历任务表挖掘装置40包括:识别单元41、确定单元42以及输出单元43。具体地:
识别单元41,用于将目标账户的行事历数据输入训练后的事历权重模型进行优化环节识别,得到待优化事历环节信息;
确定单元42,用于根据所述待优化事历环节信息,从所述目标账户对应的目标事历池中确定出待执行事历集合;其中,所述目标事历池是基于所述目标账户对应的账户类型构建得到;
输出单元43,用于基于所述待执行事历集合输出待执行事历任务表。
作为本申请一实施例,行事历数据包括所述目标账户的实际执行事历环节,以及所述实际执行事历环节对应的资源指标数据;识别单元41具体用于,利用训练后的事历权重模型根据所述资源指标数据,确定所述实际执行事历环节的可提升概率值;按照预设转换策略将所述可提升概率值换算为活动量评分,所述活动量评分用于表征所述实际执行事历环节的待优化程度;基于所述活动量评分得到待优化事历环节信息。
作为本申请一实施例,确定单元42具体用于,根据所述目标账户对应的账户类型,确定与所述账户类型对应的目标事历池;根据所述待优化事历环节信息从所述目标事历池中确定出待执行事历集合。
作为本申请一实施例,输出单元43具体用于,若待执行事历集合中的待执行事历总数N大于预设阈值,则调用排序工具对所述待执行事历集合中的N个所述待执行事历进行排序,得到排序后的待执行事历集合;其中,N为大于2的整数;将所述排序后的待执行事历集合作为待执行事历任务表进行输出。
作为本申请一实施例,基于大数据的事历任务表挖掘装置40还包括:
分类单元,用于基于账户集合中每个账户携带的属性信息,对所述账户集合进行分类处理,得到多个账户子集;其中,所述多个账户子集对应多个账户类型;
第一构建单元,用于分别为各所述账户子集,从事历样本池中选取事历样本构建目标事历池。
作为本申请一实施例,基于大数据的事历任务表挖掘装置40还包括:
第二构建单元,用于基于账户集合中每个账户对应的行事历数据构建事历样本池。
作为本申请一实施例,基于大数据的事历任务表挖掘装置40还包括:
部署单元44,用于将所述待执行事历任务表部署至区块链节点中。
应当理解的是,图4示出的基于大数据的事历任务表挖掘装置的结构框图中,各单元用于执行图1与3对应的实施例中的各步骤,而对于图1与图3对应的实施例中的各步骤已在上述实施例中进行详细解释,具体请参阅图1与图3以及图1与图3所对应的实施例中的相关描述,此处不再赘述。
图5是本申请实施例提供的一种计算机设备的结构框图。如图5所示,该实施例的计算机设备50包括:处理器51、存储器52以及存储在所述存储器52中并可在所述处理器51上运行的计算机程序53,例如基于大数据的事历任务表挖掘方法的程序。处理器51执行所述计算机程序53时实现上述各个基于大数据的事历任务表挖掘方法各实施例中的步骤,例如图1所示的S11至S13,或者图3所示的S11至S21。或者,所述处理器51执行所述计算机程序53时实现上述图4对应的实施例中各单元的功能,例如,图4所示的单元41至44的功能,具体请参阅图4对应的实施例中的相关描述,此处不赘述。
示例性的,所述计算机程序53可以被分割成一个或多个单元,所述一个或者多个单元被存储在所述存储器52中,并由所述处理器51执行,以完成本申请。所述一个或多个单元可以是能够完成特定功能的一系列计算机程序指令段,该指令段用于描述所述计算机程序53在所述计算机设备50中的执行过程。例如,所述计算机程序53可以被分割成识别单元、确定单元以及输出单元,各单元具体功能如上所述。
所述转台设备可包括,但不仅限于,处理器51、存储器52。本领域技术人员可以理解,图5仅仅是计算机设备50的示例,并不构成对计算机设备50的限定,可以包括比图示更多或更少的部件,或者组合某些部件,或者不同的部件,例如所述转台设备还可以包括输入输出设备、网络接入设备、总线等。
所称处理器51可以是中央处理单元(Central Processing Unit,CPU),还可以是其他通用处理器、数字信号处理器(Digital Signal Processor,DSP)、专用集成电路(Application Specific Integrated Circuit,ASIC)、现成可编程门阵列(Field-Programmable Gate Array,FPGA)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件等。通用处理器可以是微处理器或者该处理器也可以是任何常规的处理器等。
所述存储器52可以是所述计算机设备50的内部存储单元,例如计算机设备50的硬盘或内存。所述存储器52也可以是所述计算机设备50的外部存储设备,例如所述计算机设备50上配备的插接式硬盘,智能存储卡(Smart Media Card,SMC),安全数字(SecureDigital,SD)卡,闪存卡(Flash Card)等。进一步地,所述存储器52还可以既包括所述计算机设备50的内部存储单元也包括外部存储设备。所述存储器52用于存储所述计算机程序以及所述转台设备所需的其他程序和数据。所述存储器52还可以用于暂时地存储已经输出或者将要输出的数据。
以上所述实施例仅用以说明本申请的技术方案,而非对其限制;尽管参照前述实施例对本申请进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本申请各实施例技术方案的精神和范围,均应包含在本申请的保护范围之内。

Claims (10)

1.一种基于大数据的事历任务表挖掘方法,其特征在于,包括:
将目标账户的行事历数据输入训练后的事历权重模型进行优化环节识别,得到待优化事历环节信息;
根据所述待优化事历环节信息,从所述目标账户对应的目标事历池中确定出待执行事历集合;其中,所述目标事历池是基于所述目标账户对应的账户类型构建得到;
基于所述待执行事历集合输出待执行事历任务表。
2.根据权利要求1所述的基于大数据的事历任务表挖掘方法,其特征在于,所述行事历数据包括所述目标账户的实际执行事历环节,以及所述实际执行事历环节对应的资源指标数据;
所述将目标账户的行事历数据输入训练后的事历权重模型进行优化环节识别,得到待优化事历环节信息,包括:
利用训练后的事历权重模型根据所述资源指标数据,确定所述实际执行事历环节的可提升概率值;
按照预设转换策略将所述可提升概率值换算为活动量评分,所述活动量评分用于表征所述实际执行事历环节的待优化程度;
基于所述活动量评分得到待优化事历环节信息。
3.根据权利要求1所述的基于大数据的事历任务表挖掘方法,其特征在于,所述根据所述待优化事历环节信息,从所述目标账户对应的目标事历池中确定出待执行事历集合,包括:
根据所述目标账户对应的账户类型,确定与所述账户类型对应的目标事历池;
根据所述待优化事历环节信息从所述目标事历池中确定出待执行事历集合。
4.根据权利要求1所述的基于大数据的事历任务表挖掘方法,其特征在于,所述基于所述待执行事历集合输出待执行事历任务表,包括:
若待执行事历集合中的待执行事历总数N大于预设阈值,则调用排序工具对所述待执行事历集合中的N个所述待执行事历进行排序,得到排序后的待执行事历集合;其中,N为大于2的整数;
将所述排序后的待执行事历集合作为待执行事历任务表进行输出。
5.根据权利要求1所述的基于大数据的事历任务表挖掘方法,其特征在于,在所述根据所述待优化事历环节信息,从所述目标账户对应的目标事历池中确定出待执行事历集合的步骤之前,还包括:
基于账户集合中每个账户携带的属性信息,对所述账户集合进行分类处理,得到多个账户子集;其中,所述多个账户子集对应多个账户类型;
分别为各所述账户子集,从事历样本池中选取事历样本构建目标事历池。
6.根据权利要求5所述的基于大数据的事历任务表挖掘方法,其特征在于,在所述分别为各所述账户子集,从事历样本池中选取事历样本构建目标事历池的步骤之前,还包括:
基于账户集合中每个账户对应的行事历数据构建事历样本池。
7.根据权利要求1-6任一项所述的基于大数据的事历任务表挖掘方法,其特征在于,在所述基于所述待执行事历集合输出待执行事历任务表的步骤之后,还包括:
将所述待执行事历任务表部署至区块链节点中。
8.一种基于大数据的事历任务表挖掘装置,其特征在于,包括:
识别单元,用于将目标账户的行事历数据输入训练后的事历权重模型进行优化环节识别,得到待优化事历环节信息;
确定单元,用于根据所述待优化事历环节信息,从所述目标账户对应的目标事历池中确定出待执行事历集合;其中,所述目标事历池是基于所述目标账户对应的账户类型构建得到;
输出单元,用于基于所述待执行事历集合输出待执行事历任务表。
9.一种计算机设备,其特征在于,所述计算机设备包括存储器、处理器以及存储在所述存储器中并可在所述处理器上运行的计算机程序,所述处理器执行所述计算机程序时如权利要求1至7任一项所述方法的步骤。
10.一种计算机可读存储介质,所述计算机可读存储介质存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现如权利要求1至7任一项所述方法的步骤。
CN202110194607.8A 2021-02-21 2021-02-21 一种基于大数据的事历任务表挖掘方法及计算机设备 Active CN112861980B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202110194607.8A CN112861980B (zh) 2021-02-21 2021-02-21 一种基于大数据的事历任务表挖掘方法及计算机设备

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202110194607.8A CN112861980B (zh) 2021-02-21 2021-02-21 一种基于大数据的事历任务表挖掘方法及计算机设备

Publications (2)

Publication Number Publication Date
CN112861980A true CN112861980A (zh) 2021-05-28
CN112861980B CN112861980B (zh) 2021-09-28

Family

ID=75988368

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202110194607.8A Active CN112861980B (zh) 2021-02-21 2021-02-21 一种基于大数据的事历任务表挖掘方法及计算机设备

Country Status (1)

Country Link
CN (1) CN112861980B (zh)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113761521A (zh) * 2021-09-02 2021-12-07 恒安嘉新(北京)科技股份公司 一种基于机器学习的脚本文件检测方法、装置、设备和存储介质
CN113835847A (zh) * 2021-08-10 2021-12-24 复旦大学 基于快照的分布式账本平台事务处理优化方法
CN117252309A (zh) * 2023-11-15 2023-12-19 青岛海信信息科技股份有限公司 一种用于办公事务流程的自动化定时执行方法

Citations (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101477656A (zh) * 2009-02-11 2009-07-08 浪潮集团山东通用软件有限公司 一种生产管理过程中生产任务逐步适应能力排产的实现方法
CN106156257A (zh) * 2015-04-28 2016-11-23 北大方正集团有限公司 一种微博舆情事件的态势预测方法
CN107451249A (zh) * 2017-07-28 2017-12-08 成都澳海川科技有限公司 事件发展趋势的预测方法及装置
CN108475365A (zh) * 2015-12-30 2018-08-31 微软技术许可有限责任公司 将管理任务分类和划分优先级
CN109063920A (zh) * 2018-08-20 2018-12-21 阿里巴巴集团控股有限公司 一种交易风险识别方法、装置、及计算机设备
CN110322093A (zh) * 2018-03-30 2019-10-11 阿里巴巴集团控股有限公司 信息处理方法、信息显示方法、装置及计算设备
CN111199440A (zh) * 2018-11-16 2020-05-26 北京嘀嘀无限科技发展有限公司 事件预估方法、装置以及电子设备
CN111291589A (zh) * 2018-12-06 2020-06-16 西安光启未来技术研究院 信息的关联分析方法及装置、储存介质、电子装置
CN111583010A (zh) * 2019-02-18 2020-08-25 北京奇虎科技有限公司 一种数据处理方法、装置、设备及存储介质
CN111930805A (zh) * 2020-08-10 2020-11-13 中国平安人寿保险股份有限公司 一种信息挖掘方法及计算机设备

Patent Citations (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101477656A (zh) * 2009-02-11 2009-07-08 浪潮集团山东通用软件有限公司 一种生产管理过程中生产任务逐步适应能力排产的实现方法
CN106156257A (zh) * 2015-04-28 2016-11-23 北大方正集团有限公司 一种微博舆情事件的态势预测方法
CN108475365A (zh) * 2015-12-30 2018-08-31 微软技术许可有限责任公司 将管理任务分类和划分优先级
CN107451249A (zh) * 2017-07-28 2017-12-08 成都澳海川科技有限公司 事件发展趋势的预测方法及装置
CN110322093A (zh) * 2018-03-30 2019-10-11 阿里巴巴集团控股有限公司 信息处理方法、信息显示方法、装置及计算设备
CN109063920A (zh) * 2018-08-20 2018-12-21 阿里巴巴集团控股有限公司 一种交易风险识别方法、装置、及计算机设备
CN111199440A (zh) * 2018-11-16 2020-05-26 北京嘀嘀无限科技发展有限公司 事件预估方法、装置以及电子设备
CN111291589A (zh) * 2018-12-06 2020-06-16 西安光启未来技术研究院 信息的关联分析方法及装置、储存介质、电子装置
CN111583010A (zh) * 2019-02-18 2020-08-25 北京奇虎科技有限公司 一种数据处理方法、装置、设备及存储介质
CN111930805A (zh) * 2020-08-10 2020-11-13 中国平安人寿保险股份有限公司 一种信息挖掘方法及计算机设备

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
李淑婷: "针对大规模网络访问数据的相关性及用户行为预测分析", 《中国优秀硕士学位论文全文数据库 信息科技辑》 *

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113835847A (zh) * 2021-08-10 2021-12-24 复旦大学 基于快照的分布式账本平台事务处理优化方法
CN113835847B (zh) * 2021-08-10 2023-11-24 复旦大学 基于快照的分布式账本平台事务处理优化方法
CN113761521A (zh) * 2021-09-02 2021-12-07 恒安嘉新(北京)科技股份公司 一种基于机器学习的脚本文件检测方法、装置、设备和存储介质
CN117252309A (zh) * 2023-11-15 2023-12-19 青岛海信信息科技股份有限公司 一种用于办公事务流程的自动化定时执行方法
CN117252309B (zh) * 2023-11-15 2024-02-13 青岛海信信息科技股份有限公司 一种用于办公事务流程的自动化定时执行方法

Also Published As

Publication number Publication date
CN112861980B (zh) 2021-09-28

Similar Documents

Publication Publication Date Title
Zohair et al. Prediction of Student’s performance by modelling small dataset size
CN112861980B (zh) 一种基于大数据的事历任务表挖掘方法及计算机设备
Altuntas et al. Analysis of patent documents with weighted association rules
CN113435202A (zh) 基于用户画像的产品推荐方法、装置、电子设备及介质
CN113051291A (zh) 工单信息的处理方法、装置、设备及存储介质
CN107622326A (zh) 用户分类、可用资源预测方法、装置及设备
CN113424207B (zh) 高效地训练可理解模型的***和方法
CN113420018A (zh) 用户行为数据分析方法、装置、设备及存储介质
CN114328277A (zh) 一种软件缺陷预测和质量分析方法、装置、设备及介质
Enouen et al. Sparse interaction additive networks via feature interaction detection and sparse selection
CN114519508A (zh) 基于时序深度学习和法律文书信息的信用风险评估方法
CN113591881A (zh) 基于模型融合的意图识别方法、装置、电子设备及介质
CN113327132A (zh) 多媒体推荐方法、装置、设备及存储介质
US20100169106A1 (en) System and method for profiling jurors
Krichene et al. Business cycles’ correlation and systemic risk of the Japanese supplier-customer network
CN110619564B (zh) 一种反欺诈特征生成方法和装置
Jeyaraman et al. Practical Machine Learning with R: Define, build, and evaluate machine learning models for real-world applications
Mints Classification of tasks of data mining and data processing in the economy
Bhuvaneswari et al. Predicting periodical sales of products using a machine learning algorithm
Branch A case study of applying som in market segmentation of automobile insurance customers
CN113888265A (zh) 产品推荐方法、装置、设备及计算机可读存储介质
CN113435741A (zh) 培训计划生成方法、装置、设备及存储介质
CN112732891A (zh) 办公课程推荐方法、装置、电子设备及介质
Rahul et al. Introduction to Data Mining and Machine Learning Algorithms
KR20210023453A (ko) 리뷰 광고 매칭 장치 및 방법

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant