CN110874758A - 潜在客户预测方法、装置、***、电子设备、存储介质 - Google Patents

潜在客户预测方法、装置、***、电子设备、存储介质 Download PDF

Info

Publication number
CN110874758A
CN110874758A CN201811024999.8A CN201811024999A CN110874758A CN 110874758 A CN110874758 A CN 110874758A CN 201811024999 A CN201811024999 A CN 201811024999A CN 110874758 A CN110874758 A CN 110874758A
Authority
CN
China
Prior art keywords
prediction
customer information
potential customer
sample
quasi
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201811024999.8A
Other languages
English (en)
Inventor
刘文龙
段满福
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing Jingdong Financial Technology Holding Co Ltd
Original Assignee
Beijing Jingdong Financial Technology Holding Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing Jingdong Financial Technology Holding Co Ltd filed Critical Beijing Jingdong Financial Technology Holding Co Ltd
Priority to CN201811024999.8A priority Critical patent/CN110874758A/zh
Publication of CN110874758A publication Critical patent/CN110874758A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q30/00Commerce
    • G06Q30/02Marketing; Price estimation or determination; Fundraising
    • G06Q30/0201Market modelling; Market analysis; Collecting market data
    • G06Q30/0202Market predictions or forecasting for commercial activities

Landscapes

  • Business, Economics & Management (AREA)
  • Strategic Management (AREA)
  • Engineering & Computer Science (AREA)
  • Accounting & Taxation (AREA)
  • Development Economics (AREA)
  • Finance (AREA)
  • Entrepreneurship & Innovation (AREA)
  • Game Theory and Decision Science (AREA)
  • Data Mining & Analysis (AREA)
  • Economics (AREA)
  • Marketing (AREA)
  • Physics & Mathematics (AREA)
  • General Business, Economics & Management (AREA)
  • General Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本发明提供一种潜在客户预测方法、装置、***、电子设备、存储介质,潜在客户预测方法包括:采用样本潜在客户信息训练多个准预测模型;计算该多个准预测模型的召回率,当该多个准预测模型的召回率大于预设阈值时,将准确率最高的准预测模型作为预测模型;以及将待预测潜在客户信息作为所述预测模型的输入,所述预测模型的输出为所述待预测潜在客户信息的预测值,所述预测值指示潜在客户成单概率。本发明提高潜在客户预测的准确率。

Description

潜在客户预测方法、装置、***、电子设备、存储介质
技术领域
本发明涉及计算机应用技术领域,尤其涉及一种潜在客户预测方法、装置、***、电子设备、存储介质。
背景技术
销售通过客户管理***跟进潜在客户信息识别潜在客户,在跟进过程中对潜在客户的质量依赖销售个人的经验评判,但由于销售能力差异和流动性大对跟进效果影响很大,对无意愿潜在客户打扰严重。目前判断潜在客户质量主要技术是:
目前技术都是简单分析和人工判断,对业务理解和数据缺乏深度应用和挖掘,然而这样的方式会具有如下缺陷:1)潜在客户的识别仅客户管理***内部数据汇总的呈现,仅是碎片信息;2)潜在客户质量全依赖人工判断,大量跟进和通话造成资源浪费和成本增加;3)需要有专门的数据挖掘团队支持耗时时间长,且所采用的特征仅为内部数据(潜在客户还未成为客户,数据完整性不足)产生导致模型准确性不高。
发明内容
本发明为了克服上述相关技术存在的缺陷,提供一种潜在客户预测方法、装置、***、电子设备、存储介质,进而至少在一定程度上克服由于相关技术的限制和缺陷而导致的一个或者多个问题。
根据本发明的一个方面,提供一种潜在客户预测方法,其特征在于,包括:
采用样本潜在客户信息训练多个准预测模型;
计算该多个准预测模型的召回率,当该多个准预测模型的召回率大于预设阈值时,将准确率最高的准预测模型作为预测模型;以及
将待预测潜在客户信息作为所述预测模型的输入,所述预测模型的输出为所述待预测潜在客户信息的预测值,所述预测值指示潜在客户成单概率。
可选地,所述样本潜在客户信息和/或所述待预测潜在客户信息来自多个平台,并至少基于潜在客户的标识信息的匹配形成同一潜在客户的潜在客户信息。
可选地,所述采用样本潜在客户信息训练多个准预测模型包括:
对所述样本潜在客户信息进行特征处理。
可选地,对所述样本潜在客户信息进行特征处理包括:
对所述样本潜在客户信息进行异常值处理、缺失值处理、归一化处理、离散化处理中的至少一项。
可选地,所述对所述样本潜在客户信息进行特征处理之后,还包括:
若特征处理后的样本潜在客户信息为离散型字段,则对特征处理后的样本潜在客户信息进行卡方检验。
可选地,所述对所述样本潜在客户信息进行特征处理之后,还包括:
若特征处理后的样本潜在客户信息为连续型字段,则对特征处理后的样本潜在客户信息进行F检验。
可选地,所述待预测潜在客户信息采用与所述样本潜在客户信息相同的方式进行特征处理。
可选地,所述多个准预测模型为二分类模型。
可选地,所述二分类模型包括逻辑回归模型、支持向量机模型、神经网络模型中的至少两项。
根据本发明的又一方面,还提供一种潜在客户预测装置,包括:
训练模块,用于采用样本潜在客户信息训练多个准预测模型;
模型选择模块,用于计算该多个准预测模型的召回率,当该多个准预测模型的召回率大于预设阈值时,将准确率最高的准预测模型作为预测模型;以及
预测模块,用于将待预测潜在客户信息作为所述预测模型的输入,所述预测模型的输出为所述待预测潜在客户信息的预测值,所述预测值指示潜在客户成单概率。
根据本发明的又一方面,还提供一种电子设备,所述电子设备包括:处理器;存储介质,其上存储有计算机程序,所述计算机程序被所述处理器运行时执行如上所述的步骤。
根据本发明的又一方面,还提供一种存储介质,所述存储介质上存储有计算机程序,所述计算机程序被处理器运行时执行如上所述的步骤。
相比现有技术,本发明的优势在于:
一方面,结合多个预测模型的训练,并采用召回率大于预定阈值时,准确率最高的预测模型进行预测,增加潜在客户预测的准确率;再一方面,通过预测模型输出的用于指示潜在客户成单概率的潜在客户预测的预测值,便于工作人员基于预测值进行后序工作,缓解由于跟进和通话造成资源浪费和成本增加。
附图说明
通过参照附图详细描述其示例实施方式,本发明的上述和其它特征及优点将变得更加明显。
图1示出了根据本发明实施例的潜在客户预测方法的流程图。
图2示出了根据本发明具体实施例的潜在客户预测方法的***架构图。
图3示出了根据本发明实施例的潜在客户预测装置的模块图。
图4示出了根据本发明具体实施例的潜在客户预测装置的模块图。
图5示意性示出本发明示例性实施例中一种计算机可读存储介质示意图。
图6示意性示出本发明示例性实施例中一种电子设备示意图。
具体实施方式
现在将参考附图更全面地描述示例实施方式。然而,示例实施方式能够以多种形式实施,且不应被理解为限于在此阐述的范例;相反,提供这些实施方式使得本发明将更加全面和完整,并将示例实施方式的构思全面地传达给本领域的技术人员。所描述的特征、结构或特性可以以任何合适的方式结合在一个或更多实施方式中。
此外,附图仅为本发明的示意性图解,并非一定是按比例绘制。图中相同的附图标记表示相同或类似的部分,因而将省略对它们的重复描述。附图中所示的一些方框图是功能实体,不一定必须与物理或逻辑上独立的实体相对应。可以采用软件形式来实现这些功能实体,或在一个或多个硬件模块或集成电路中实现这些功能实体,或在不同网络和/或处理器装置和/或微控制器装置中实现这些功能实体。
附图中所示的流程图仅是示例性说明,不是必须包括所有的步骤。例如,有的步骤还可以分解,而有的步骤可以合并或部分合并,因此,实际执行的顺序有可能根据实际情况改变。
图1示出了根据本发明实施例的潜在客户预测方法的流程图。参考图1,所述潜在客户预测方法包括如下步骤:
步骤S110:采用样本潜在客户信息训练多个准预测模型;
步骤S120:计算该多个准预测模型的召回率,当该多个准预测模型的召回率大于预设阈值时,将准确率最高的准预测模型作为预测模型;以及
步骤S130:将待预测潜在客户信息作为所述预测模型的输入,所述预测模型的输出为所述待预测潜在客户信息的预测值,所述预测值指示潜在客户成单概率。
在本发明的示例性实施方式的潜在客户预测方法中,一方面,结合多个预测模型的训练,并采用召回率大于预定阈值时,准确率最高的预测模型进行预测,增加潜在客户预测的准确率;再一方面,通过预测模型输出的用于指示潜在客户成单概率的潜在客户预测的预测值,便于工作人员基于预测值进行后序工作,缓解由于跟进和通话造成资源浪费和成本增加。
潜在客户信息可以包括潜在客户的跟进信息、潜在客户的客户信息等。潜在客户信息主要可以包括连续型字段和离散型字段。
下面结合图2示出的根据本发明具体实施例的潜在客户预测方法的***架构图,进一步对上述步骤进行描述。
具体而言,上述的样本潜在客户信息及待预测潜在客户信息都可从多个平台获取潜在客户信息。
例如,可以从客户管理***的潜在客户信息日志201获取潜在客户信息;还可以从其它平台(诸如电商、搜索引擎、垂直网站、电信等)的潜在客户信息来源202获取潜在客户信息,由此,可以根据潜在客户的标识完善潜在客户信息。
在上述步骤S110中,可以自客户管理***的潜在客户信息日志201及潜在客户信息来源202获取潜在客户信息作为样本潜在客户信息203。
进一步地,上述步骤S110采用样本潜在客户信息203训练多个准预测模型还包括:对所述样本潜在客户信息203进行特征处理。
对所述样本潜在客户信息203进行特征处理可以包括:对所述样本潜在客户信息203进行异常值处理、缺失值处理、归一化处理、离散化处理中的至少一项。
异常值处理主要针对连续型字段的样本潜在客户信息203,对于连续型字段的异常值处理首先计算各个潜在客户的连续型字段的均值和标准差,若当前连续型字段的潜在客户信息的值大于(均值+M*标准差)时,则将该当前连续型字段的潜在客户信息的值修正为(均值+M*标准差)。(均值+M*标准差)即作为异常值处理中的临界值,且M为大于等于3的常数。
缺失值处理中,将缺失的离散型字段的样本潜在客户信息203赋值为-999;对于与预测值正相关的连续型字段的样本潜在客户信息203赋值为0;对于与预测值负相关的连续型字段的样本潜在客户信息203赋值为上述异常值中的临界值。
归一化处理中,对各连续型字段的样本潜在客户信息203,使得该连续型字段的样本潜在客户信息203赋值为x-min(x)/(max(x)-min(x)),其中,x为当前连续型字段的样本潜在客户信息203的值,min(x)为各潜在客户的该连续型字段的样本潜在客户信息203的最小值,max(x)为各潜在客户的该连续型字段的样本潜在客户信息203的最大值。
离散处理中,将离散型字段的样本潜在客户信息203,如地域设置为(a01,a02,a03),其中,相当于判断当前地域是否为a01、当前地域是否为a02、当前地域是否为a03三个值(例如若是,赋值为1,若否赋值为0)形成的特征。
进一步地,上述特征处理中,还可以包括对字段名称加密,从有规则的命名字段变换为无业务含义的字段名称。例如,可以对潜在客户信息日志201和不同潜在客户信息来源202的潜在客户数据匹配需要的字段名称,如身份证ID,手机号码,姓名,设备号等进行MD5(消息摘要算法第五版)加密。
进一步地,为了增加模型训练的准确率,在所述对所述样本潜在客户信息203进行特征处理的步骤之后,还包括特征处理后的样本潜在客户信息203的选择的步骤。
具体而言,若特征处理后的样本潜在客户信息203为离散型字段,则对特征处理后的样本潜在客户信息203进行卡方检验。
在卡方检验步骤中,首先计算特征处理后的离散型字段的样本潜在客户信息203与标签(例如,对该样本潜在客户信息203标记的是否成单)的实际分布,然后计算特征处理后的离散型字段的样本潜在客户信息203与标签的期望分布,基于实际分布和期望分布计算特征处理后的离散型字段的样本潜在客户信息203的卡方值和自由度,并基于根据卡方值表确定特征处理后的离散型字段的样本潜在客户信息203与标签是否关系显著(卡方值的显著性)。即在该步骤中,可仅保留与标签是关系显著的离散型字段的样本潜在客户信息203,以减少相关性较小的样本潜在客户信息203在模型中的多余计算量,加快模型训练效率。
具体而言,若特征处理后的样本潜在客户信息203为连续型字段,则对特征处理后的样本潜在客户信息203进行F检验。
在F检验步骤中,首先计算特征处理后的样本潜在客户信息203为连续型字段的第一标准差,然后计算标记的预测值(例如,对该样本潜在客户信息203标记的是否成单,成单标记为1,不成单标记为0)的第二标准差,计算F值=第一标准差/第二标准差,并根据F值表确定特征处理后的样本潜在客户信息203为连续型字段与标记的预测值是否关系显著。即在该步骤中,可仅保留与标签是关系显著的连续型字段的样本潜在客户信息203,以减少相关性较小的样本潜在客户信息203在模型中的多余计算量,加快模型训练效率。
然后在如标号205,利用特征处理后且经筛选的样本潜在客户信息203训练多个准预测模型。该多个准预测模型可以是二分类模型。所述二分类模型可以包括逻辑回归模型、支持向量机模型、神经网络模型中的至少两项。逻辑回归模型的应用广泛性的原因主要是因为其概率表达式的显性特点,逻辑回归模型的求解速度快,应用方便。当逻辑回归模型选择集没有发生变化,而仅仅是当各变量的水平发生变化时(如出行时间发生变化),可以方便的求解各选择枝在新环境下的各选择枝的被选概率。根据逻辑回归模型的特性,选择枝的减少或者增加不影响其他各选择之间被选概率比值的大小,因此,可以直接将需要去掉的选择枝从逻辑回归模型中去掉,也可将新加入的选择枝添加到逻辑回归模型中直接用于预测。支持向量机模型是通过一个非线性映射p,把样本空间映射到一个高维乃至无穷维的特征空间中(Hilbert空间),使得在原来的样本空间中非线性可分的问题转化为在特征空间中的线性可分的问题。简单地说,就是升维和线性化.升维,就是把样本向高维空间做映射,一般情况下这会增加计算的复杂性,甚至会引起“维数灾难”,因而人们很少问津.但是作为分类、回归等问题来说,很可能在低维样本空间无法线性处理的样本集,在高维特征空间中却可以通过一个线性超平面实现线性划分(或回归)。一般的升维都会带来计算的复杂化,支持向量机模型巧妙地解决了这个难题:应用核函数的展开定理,就不需要知道非线性映射的显式表达式;由于是在高维特征空间中建立线性学习机,所以与线性模型相比,不但几乎不增加计算的复杂性,而且在某种程度上避免了“维数灾难”。神经网络模型中的BP神经网络模型是一种对非线性可微分函数进行权值训练的多层网络。它的最大特点是仅仅借助样本数据,无需建立***的数学模型,就可对***实现由m个输入神经元的模式向量p组成的pm空间到yn空间n(为输出节点数)的高度非线性映射。BP算法是为了解决多层前向神经网络的权系数优化而提出来的。本发明还可以采用其它二分类模型,再次不予赘述。
进一步地,本发明通过计算该多个准预测模型的召回率(召回率=预测为正且真实为正样本数/全部正样本数),当该多个准预测模型的召回率大于预设阈值(例如接近100%)时,将准确率最高的准预测模型作为预测模型。由此,可以在考虑到召回率的同时,利用准确率最高的预测模型进行后续预测。此外,本发明还可以计算各准预测模型的不同预测分段([0.0,0.1],[0.1,0.2],…,[0.9,1.0])的样本数和正样本数据,以供分析应用。
进一步地,待预测潜在客户信息204的特征处理步骤可以与样本潜在客户信息203的特征处理步骤相同。然后如标号206,将待预测潜在客户信息作为所述预测模型的输入,所述预测模型的输出为所述待预测潜在客户信息的预测值207,所述预测值207指示潜在客户成单概率。
下面结合图3描述本发明提供的潜在客户预测装置。图3示出了根据本发明实施例的潜在客户预测装置的模块图。潜在客户预测装置300包括训练模块310、模型选择模块320及预测模块330。
训练模块310用于采用样本潜在客户信息训练多个准预测模型;
模型选择模块320用于计算该多个准预测模型的召回率,当该多个准预测模型的召回率大于预设阈值时,将准确率最高的准预测模型作为预测模型;以及
预测模块330用于将待预测潜在客户信息作为所述预测模型的输入,所述预测模型的输出为所述待预测潜在客户信息的预测值,所述预测值指示潜在客户成单概率。
潜在客户信息可以包括潜在客户的跟进信息、潜在客户的客户信息等。潜在客户信息主要可以包括连续型字段和离散型字段。
在本发明的示例性实施方式的潜在客户预测装置中,一方面,结合多个预测模型的训练,并采用召回率大于预定阈值时,准确率最高的预测模型进行预测,增加潜在客户预测的准确率;再一方面,通过预测模型输出的用于指示潜在客户成单概率的潜在客户预测的预测值,便于工作人员基于预测值进行后序工作,缓解由于跟进和通话造成资源浪费和成本增加。
进一步地,参考图4,图4示出了根据本发明具体实施例的潜在客户预测装置的模块图。潜在客户预测装置400包括训练模块410、模型选择模块420及预测模块430。各模块的作用与图3中训练模块310、模型选择模块320及预测模块330相同。与图3不同的是训练模块410包括特征处理模块411及特征选择模块412。
特征处理模块411用于对所述样本潜在客户信息进行特征处理。对所述样本潜在客户信息进行特征处理可以包括:对所述样本潜在客户信息进行异常值处理、缺失值处理、归一化处理、离散化处理中的至少一项。
特征选择模块412用于特征处理后的样本潜在客户信息进行选择。特征选择模块412包括离散检验模块4121和连续检验模块4122。
具体而言,若特征处理后的样本潜在客户信息为离散型字段,则离散检验模块4121对特征处理后的样本潜在客户信息进行卡方检验。
在卡方检验步骤中,首先计算特征处理后的离散型字段的样本潜在客户信息与标签(例如,对该样本潜在客户信息标记的是否成单)的实际分布,然后计算特征处理后的离散型字段的样本潜在客户信息与标签的期望分布,基于实际分布和期望分布计算特征处理后的离散型字段的样本潜在客户信息的卡方值和自由度,并基于根据卡方值表确定特征处理后的离散型字段的样本潜在客户信息与标签是否关系显著(卡方值的显著性)。即在该步骤中,可仅保留与标签是关系显著的离散型字段的样本潜在客户信息,以减少相关性较小的样本潜在客户信息在模型中的多余计算量,加快模型训练效率。
具体而言,若特征处理后的样本潜在客户信息为连续型字段,则连续检验模块4122对特征处理后的样本潜在客户信息进行F检验。
在F检验步骤中,首先计算特征处理后的样本潜在客户信息为连续型字段的第一标准差,然后计算标记的预测值(例如,对该样本潜在客户信息标记的是否成单,成单标记为1,不成单标记为0)的第二标准差,计算F值=第一标准差/第二标准差,并根据F值表确定特征处理后的样本潜在客户信息为连续型字段与标记的预测值是否关系显著。即在该步骤中,可仅保留与标签是关系显著的连续型字段的样本潜在客户信息,以减少相关性较小的样本潜在客户信息在模型中的多余计算量,加快模型训练效率。
在本发明的示例性实施例中,还提供了一种计算机可读存储介质,其上存储有计算机程序,该程序被例如处理器执行时可以实现上述任意一个实施例中所述电子处方流转处理方法的步骤。在一些可能的实施方式中,本发明的各个方面还可以实现为一种程序产品的形式,其包括程序代码,当所述程序产品在终端设备上运行时,所述程序代码用于使所述终端设备执行本说明书上述电子处方流转处理方法部分中描述的根据本发明各种示例性实施方式的步骤。
参考图5所示,描述了根据本发明的实施方式的用于实现上述方法的程序产品500,其可以采用便携式紧凑盘只读存储器(CD-ROM)并包括程序代码,并可以在终端设备,例如个人电脑上运行。然而,本发明的程序产品不限于此,在本文件中,可读存储介质可以是任何包含或存储程序的有形介质,该程序可以被指令执行***、装置或者器件使用或者与其结合使用。
所述程序产品可以采用一个或多个可读介质的任意组合。可读介质可以是可读信号介质或者可读存储介质。可读存储介质例如可以为但不限于电、磁、光、电磁、红外线、或半导体的***、装置或器件,或者任意以上的组合。可读存储介质的更具体的例子(非穷举的列表)包括:具有一个或多个导线的电连接、便携式盘、硬盘、随机存取存储器(RAM)、只读存储器(ROM)、可擦式可编程只读存储器(EPROM或闪存)、光纤、便携式紧凑盘只读存储器(CD-ROM)、光存储器件、磁存储器件、或者上述的任意合适的组合。
所述计算机可读存储介质可以包括在基带中或者作为载波一部分传播的数据信号,其中承载了可读程序代码。这种传播的数据信号可以采用多种形式,包括但不限于电磁信号、光信号或上述的任意合适的组合。可读存储介质还可以是可读存储介质以外的任何可读介质,该可读介质可以发送、传播或者传输用于由指令执行***、装置或者器件使用或者与其结合使用的程序。可读存储介质上包含的程序代码可以用任何适当的介质传输,包括但不限于无线、有线、光缆、RF等等,或者上述的任意合适的组合。
可以以一种或多种程序设计语言的任意组合来编写用于执行本发明操作的程序代码,所述程序设计语言包括面向对象的程序设计语言—诸如Java、C++等,还包括常规的过程式程序设计语言—诸如“C”语言或类似的程序设计语言。程序代码可以完全地在租户计算设备上执行、部分地在租户设备上执行、作为一个独立的软件包执行、部分在租户计算设备上部分在远程计算设备上执行、或者完全在远程计算设备或服务器上执行。在涉及远程计算设备的情形中,远程计算设备可以通过任意种类的网络,包括局域网(LAN)或广域网(WAN),连接到租户计算设备,或者,可以连接到外部计算设备(例如利用因特网服务提供商来通过因特网连接)。
在本发明的示例性实施例中,还提供一种电子设备,该电子设备可以包括处理器,以及用于存储所述处理器的可执行指令的存储器。其中,所述处理器配置为经由执行所述可执行指令来执行上述任意一个实施例中所述电子处方流转处理方法的步骤。
所属技术领域的技术人员能够理解,本发明的各个方面可以实现为***、方法或程序产品。因此,本发明的各个方面可以具体实现为以下形式,即:完全的硬件实施方式、完全的软件实施方式(包括固件、微代码等),或硬件和软件方面结合的实施方式,这里可以统称为“电路”、“模块”或“***”。
下面参照图6来描述根据本发明的这种实施方式的电子设备600。图6显示的电子设备600仅仅是一个示例,不应对本发明实施例的功能和使用范围带来任何限制。
如图6所示,电子设备600以通用计算设备的形式表现。电子设备600的组件可以包括但不限于:至少一个处理单元610、至少一个存储单元620、连接不同***组件(包括存储单元620和处理单元610)的总线630、显示单元640等。
其中,所述存储单元存储有程序代码,所述程序代码可以被所述处理单元610执行,使得所述处理单元610执行本说明书上述电子处方流转处理方法部分中描述的根据本发明各种示例性实施方式的步骤。例如,所述处理单元610可以执行如图1所示的步骤。
所述存储单元620可以包括易失性存储单元形式的可读介质,例如随机存取存储单元(RAM)6201和/或高速缓存存储单元6202,还可以进一步包括只读存储单元(ROM)6203。
所述存储单元620还可以包括具有一组(至少一个)程序模块6205的程序/实用工具6204,这样的程序模块6205包括但不限于:操作***、一个或者多个应用程序、其它程序模块以及程序数据,这些示例中的每一个或某种组合中可能包括网络环境的实现。
总线630可以为表示几类总线结构中的一种或多种,包括存储单元总线或者存储单元控制器、***总线、图形加速端口、处理单元或者使用多种总线结构中的任意总线结构的局域总线。
电子设备600也可以与一个或多个外部设备700(例如键盘、指向设备、蓝牙设备等)通信,还可与一个或者多个使得租户能与该电子设备600交互的设备通信,和/或与使得该电子设备600能与一个或多个其它计算设备进行通信的任何设备(例如路由器、调制解调器等等)通信。这种通信可以通过输入/输出(I/O)接口650进行。并且,电子设备600还可以通过网络适配器660与一个或者多个网络(例如局域网(LAN),广域网(WAN)和/或公共网络,例如因特网)通信。网络适配器660可以通过总线630与电子设备600的其它模块通信。应当明白,尽管图中未示出,可以结合电子设备600使用其它硬件和/或软件模块,包括但不限于:微代码、设备驱动器、冗余处理单元、外部磁盘驱动阵列、RAID***、磁带驱动器以及数据备份存储***等。
通过以上的实施方式的描述,本领域的技术人员易于理解,这里描述的示例实施方式可以通过软件实现,也可以通过软件结合必要的硬件的方式来实现。因此,根据本发明实施方式的技术方案可以以软件产品的形式体现出来,该软件产品可以存储在一个非易失性存储介质(可以是CD-ROM,U盘,移动硬盘等)中或网络上,包括若干指令以使得一台计算设备(可以是个人计算机、服务器、或者网络设备等)执行根据本发明实施方式的上述电子处方流转处理方法。
相比现有技术,本发明的优势在于:
一方面,结合多个预测模型的训练,并采用召回率大于预定阈值时,准确率最高的预测模型进行预测,增加潜在客户预测的准确率;再一方面,通过预测模型输出的用于指示潜在客户成单概率的潜在客户预测的预测值,便于工作人员基于预测值进行后序工作,缓解由于跟进和通话造成资源浪费和成本增加。
本领域技术人员在考虑说明书及实践这里公开的发明后,将容易想到本发明的其它实施方案。本申请旨在涵盖本发明的任何变型、用途或者适应性变化,这些变型、用途或者适应性变化遵循本发明的一般性原理并包括本发明未公开的本技术领域中的公知常识或惯用技术手段。说明书和实施例仅被视为示例性的,本发明的真正范围和精神由所附的权利要求指出。

Claims (12)

1.一种潜在客户预测方法,其特征在于,包括:
采用样本潜在客户信息训练多个准预测模型;
计算该多个准预测模型的召回率,当该多个准预测模型的召回率大于预设阈值时,将准确率最高的准预测模型作为预测模型;以及
将待预测潜在客户信息作为所述预测模型的输入,所述预测模型的输出为所述待预测潜在客户信息的预测值,所述预测值指示潜在客户成单概率。
2.如权利要求1所述的潜在客户预测方法,其特征在于,所述样本潜在客户信息和/或所述待预测潜在客户信息来自多个平台,并至少基于潜在客户的标识信息的匹配形成同一潜在客户的潜在客户信息。
3.如权利要求1所述的潜在客户预测方法,其特征在于,所述采用样本潜在客户信息训练多个准预测模型包括:
对所述样本潜在客户信息进行特征处理。
4.如权利要求3所述的潜在客户预测方法,其特征在于,对所述样本潜在客户信息进行特征处理包括:
对所述样本潜在客户信息进行异常值处理、缺失值处理、归一化处理、离散化处理中的至少一项。
5.如权利要求3所述的潜在客户预测方法,其特征在于,所述对所述样本潜在客户信息进行特征处理之后,还包括:
若特征处理后的样本潜在客户信息为离散型字段,则对特征处理后的样本潜在客户信息进行卡方检验。
6.如权利要求3所述的潜在客户预测方法,其特征在于,所述对所述样本潜在客户信息进行特征处理之后,还包括:
若特征处理后的样本潜在客户信息为连续型字段,则对特征处理后的样本潜在客户信息进行F检验。
7.如权利要求3至6任一项所述的潜在客户预测方法,其特征在于,所述待预测潜在客户信息采用与所述样本潜在客户信息相同的方式进行特征处理。
8.如权利要求1至6任一项所述的潜在客户预测方法,其特征在于,所述多个准预测模型为二分类模型。
9.如权利要求8所述的潜在客户预测方法,其特征在于,所述二分类模型包括逻辑回归模型、支持向量机模型、神经网络模型中的至少两项。
10.一种潜在客户预测装置,其特征在于,包括:
训练模块,用于采用样本潜在客户信息训练多个准预测模型;
模型选择模块,用于计算该多个准预测模型的召回率,当该多个准预测模型的召回率大于预设阈值时,将准确率最高的准预测模型作为预测模型;以及
预测模块,用于将待预测潜在客户信息作为所述预测模型的输入,所述预测模型的输出为所述待预测潜在客户信息的预测值,所述预测值指示潜在客户成单概率。
11.一种电子设备,其特征在于,所述电子设备包括:
处理器;
存储器,其上存储有计算机程序,所述计算机程序被所述处理器运行时执行如权利要求1至9任一项所述的步骤。
12.一种存储介质,其特征在于,所述存储介质上存储有计算机程序,所述计算机程序被处理器运行时执行如权利要求1至9任一项所述的步骤。
CN201811024999.8A 2018-09-03 2018-09-03 潜在客户预测方法、装置、***、电子设备、存储介质 Pending CN110874758A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201811024999.8A CN110874758A (zh) 2018-09-03 2018-09-03 潜在客户预测方法、装置、***、电子设备、存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201811024999.8A CN110874758A (zh) 2018-09-03 2018-09-03 潜在客户预测方法、装置、***、电子设备、存储介质

Publications (1)

Publication Number Publication Date
CN110874758A true CN110874758A (zh) 2020-03-10

Family

ID=69716886

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201811024999.8A Pending CN110874758A (zh) 2018-09-03 2018-09-03 潜在客户预测方法、装置、***、电子设备、存储介质

Country Status (1)

Country Link
CN (1) CN110874758A (zh)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2021139432A1 (zh) * 2020-10-13 2021-07-15 平安科技(深圳)有限公司 基于人工智能的用户等级预测方法、装置、终端及介质
CN113157763A (zh) * 2021-01-04 2021-07-23 北京汇达城数科技发展有限公司 具有指定行为信息的用户的精准识别***及方法

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2021139432A1 (zh) * 2020-10-13 2021-07-15 平安科技(深圳)有限公司 基于人工智能的用户等级预测方法、装置、终端及介质
CN113157763A (zh) * 2021-01-04 2021-07-23 北京汇达城数科技发展有限公司 具有指定行为信息的用户的精准识别***及方法
CN113157763B (zh) * 2021-01-04 2023-10-13 北京汇达城数科技发展有限公司 具有指定行为信息的用户的精准识别***及方法

Similar Documents

Publication Publication Date Title
CN110070391B (zh) 数据处理方法、装置、计算机可读介质及电子设备
CN111950738B (zh) 机器学习模型优化效果评估方法、装置、终端及存储介质
CN110349009B (zh) 一种多头借贷违约预测方法、装置和电子设备
CN110995459B (zh) 异常对象识别方法、装置、介质及电子设备
CN112270545A (zh) 基于迁移样本筛选的金融风险预测方法、装置和电子设备
US20190026805A1 (en) Issue resolution utilizing feature mapping
CN110705719A (zh) 执行自动机器学习的方法和装置
CN110335140B (zh) 基于社交关系预测贷款黑中介的方法、装置、电子设备
US10824956B1 (en) System and method for price estimation of reports before execution in analytics
CN112015562A (zh) 基于迁移学习的资源分配方法、装置及电子设备
CN112348662B (zh) 基于用户职业预测的风险评估方法、装置和电子设备
CN111210109A (zh) 基于关联用户预测用户风险的方法、装置和电子设备
CN111178687A (zh) 金融风险分类方法、装置及电子设备
CN112508723A (zh) 基于自动择优建模的金融风险预测方法、装置和电子设备
CN111191677B (zh) 用户特征数据生成方法、装置及电子设备
CN110874758A (zh) 潜在客户预测方法、装置、***、电子设备、存储介质
US11520757B2 (en) Explanative analysis for records with missing values
US20220171985A1 (en) Item recommendation with application to automated artificial intelligence
CN112488865A (zh) 基于金融时间节点的金融风险预测方法、装置和电子设备
US20230206114A1 (en) Fair selective classification via a variational mutual information upper bound for imposing sufficiency
US20230169389A1 (en) Domain adaptation
US11809375B2 (en) Multi-dimensional data labeling
CN111626438B (zh) 基于模型迁移的用户策略分配方法、装置及电子设备
US20220366300A1 (en) Data drift mitigation in machine learning for large-scale systems
US20140164069A1 (en) Generating Global Optimized Strategies For Information Requests, Proposals, And Statements of Work Within a Time Period Across Hierarchical Entity Boundaries

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
CB02 Change of applicant information
CB02 Change of applicant information

Address after: Room 221, 2 / F, block C, 18 Kechuang 11th Street, Daxing District, Beijing, 100176

Applicant after: Jingdong Technology Holding Co.,Ltd.

Address before: Room 221, 2 / F, block C, 18 Kechuang 11th Street, Daxing District, Beijing, 100176

Applicant before: Jingdong Digital Technology Holding Co.,Ltd.

Address after: Room 221, 2 / F, block C, 18 Kechuang 11th Street, Daxing District, Beijing, 100176

Applicant after: Jingdong Digital Technology Holding Co.,Ltd.

Address before: Room 221, 2 / F, block C, 18 Kechuang 11th Street, Daxing District, Beijing, 100176

Applicant before: JINGDONG DIGITAL TECHNOLOGY HOLDINGS Co.,Ltd.

Address after: Room 221, 2 / F, block C, 18 Kechuang 11th Street, Daxing District, Beijing, 100176

Applicant after: JINGDONG DIGITAL TECHNOLOGY HOLDINGS Co.,Ltd.

Address before: Room 221, 2nd floor, Block C, 18 Kechuang 11th Street, Daxing Economic and Technological Development Zone, Beijing, 100176

Applicant before: BEIJING JINGDONG FINANCIAL TECHNOLOGY HOLDING Co.,Ltd.