CN108428020A

CN108428020A - 业务员薪资预测方法、装置、计算机设备以及存储介质

Info

Publication number: CN108428020A
Application number: CN201810463400.4A
Authority: CN
Inventors: 李晓燕
Original assignee: Ping An Life Insurance Company of China Ltd
Current assignee: Ping An Life Insurance Company of China Ltd
Priority date: 2018-05-15
Filing date: 2018-05-15
Publication date: 2018-08-21

Abstract

本发明实施例公开了一种业务员薪资预测方法、装置、计算机设备以及存储介质，其中，所述方法包括：获取业务员的历史薪资数据；根据业务员的历史薪资数据计算业务员的历史薪资涨幅数据；对所述业务员的历史薪资涨幅数据进行k‑fold分组，并得到测试集和训练集；建立多元线性回归模型；根据所建立的多元线性回归模型以及所述业务员的历史薪资数据和训练集计算多元线性回归模型的回归系数；根据回归系数构建业务员薪资预测方程，并使用所述测试集对所述业务员薪资预测方程进行测试；若所述测试结果符合预期结果，根据所述业务员薪资预测方程预测业务员的薪资。本发明实施例可以提高员工薪资预测的准确率。

Description

业务员薪资预测方法、装置、计算机设备以及存储介质

技术领域

本发明涉及计算机技术领域，尤其涉及一种业务员薪资预测方法、装置、计算机设备以及存储介质。

背景技术

现有技术中，对于销售界内业务员薪资的预测还没有一个完整方法，传统的业务员薪资是由业务员的个人先提出申请，再对业务员的个人申请进行评估，最后再确定业务员所获得的薪资，该种预测方式通常不合理且不准确，并且随着技术的不断革新，业务员业绩的不断增长，利用人工预测业务员薪资的方式已经不能满足当下的业务需求与发展。

发明内容

有鉴于此，本发明实施例提供一种业务员薪资预测方法、装置、计算机设备以及存储介质，可以提高员工薪资预测的准确率。

一方面，本发明实施例提供了一种业务员薪资预测方法，该方法包括：

获取业务员的历史薪资数据；

根据业务员的历史薪资数据计算业务员的历史薪资涨幅数据；

对所述业务员的历史薪资涨幅数据进行k-fold分组，并得到测试集和训练集；

建立多元线性回归模型；

根据所建立的多元线性回归模型以及所述业务员的历史薪资数据和训练集计算多元线性回归模型的回归系数；

根据回归系数构建业务员薪资预测方程，并使用所述测试集对所述业务员薪资预测方程进行测试；

若所述测试结果符合预期结果，根据所述业务员薪资预测方程预测业务员的薪资。

另一方面，本发明实施例提供了一种业务员薪资预测装置，所述装置包括：

获取单元，用于获取业务员的历史薪资数据；

第一计算单元，用于根据业务员的历史薪资数据计算业务员的历史薪资涨幅数据；

分组单元，用于对所述业务员的历史薪资涨幅数据进行k-fold分组，并得到测试集和训练集；

建立单元，用于建立多元线性回归模型；

第二计算单元，用于根据所建立的多元线性回归模型以及所述业务员的历史薪资数据和训练集计算多元线性回归模型的回归系数；

构建单元，用于根据回归系数构建业务员薪资预测方程，并使用所述测试集对所述业务员薪资预测方程进行测试；

预测单元，用于若所述测试结果符合预期结果，根据所述业务员薪资预测方程预测业务员的薪资。

又一方面，本发明实施例还提供了一种计算机设备，包括存储器、处理器及存储在所述存储器上并可在所述处理器上运行的计算机程序，所述处理器执行所述计算机程序时实现如上所述的业务员薪资预测方法。

再一方面，本发明实施例还提供了一种计算机可读存储介质，所述计算机可读存储介质存储有一个或者一个以上程序，所述一个或者一个以上程序可被一个或者一个以上的处理器执行，以实现如上所述的业务员薪资预测方法。

本发明实施例提供一种业务员薪资预测方法、装置、计算机设备以及存储介质，其中方法包括：获取业务员的历史薪资数据；根据业务员的历史薪资数据计算业务员的历史薪资涨幅数据；对所述业务员的历史薪资涨幅数据进行k-fold分组，并得到测试集和训练集；建立多元线性回归模型；根据所建立的多元线性回归模型以及所述业务员的历史薪资数据和训练集计算多元线性回归模型的回归系数；根据回归系数构建业务员薪资预测方程，并使用所述测试集对所述业务员薪资预测方程进行测试；若所述测试结果符合预期结果，根据所述业务员薪资预测方程预测业务员的薪资。本发明实施例可以提高员工薪资预测的准确率。

附图说明

为了更清楚地说明本发明实施例技术方案，下面将对实施例描述中所需要使用的附图作简单地介绍，显而易见地，下面描述中的附图是本发明的一些实施例，对于本领域普通技术人员来讲，在不付出创造性劳动的前提下，还可以根据这些附图获得其他的附图。

图1是本发明实施例提供的一种业务员薪资预测方法的示意流程图；

图2是本发明实施例提供的一种业务员薪资预测方法的示意流程图；

图3是本发明实施例提供的一种业务员薪资预测方法的示意流程图；

图4是本发明另一实施例提供的一种业务员薪资预测方法的示意流程图；

图5是本发明实施例提供的一种业务员薪资预测装置的示意性框图；

图6是本发明实施例提供的一种业务员薪资预测装置的另一示意性框图；

图7是本发明实施例提供的一种员业务员薪资预测装置的另一示意性框图；

图8是本发明实施例提供的一种业务员薪资预测装置的另一示意性框图；

图9是本发明实施例提供的一种计算机设备的结构组成示意图。

具体实施方式

下面将结合本发明实施例中的附图，对本发明实施例中的技术方案进行清楚、完整地描述，显然，所描述的实施例是本发明一部分实施例，而不是全部的实施例。基于本发明中的实施例，本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例，都属于本发明保护的范围。

应当理解，当在本说明书和所附权利要求书中使用时，术语“包括”和“包含”指示所描述特征、整体、步骤、操作、元素和/或组件的存在，但并不排除一个或多个其它特征、整体、步骤、操作、元素、组件和/或其集合的存在或添加。

还应当理解，在此本发明说明书中所使用的术语仅仅是出于描述特定实施例的目的而并不意在限制本发明。如在本发明说明书和所附权利要求书中所使用的那样，除非上下文清楚地指明其它情况，否则单数形式的“一”、“一个”及“该”意在包括复数形式。

请参阅图1，图1为本发明实施例提供的一种业务员薪资预测方法的示意流程图。如图1所示，该方法包括步骤S101～S107。

S101，获取业务员的历史薪资数据。

在本发明实施例中，所述获取的业务员的历史薪资数据可以具体保存在数据库中，该数据库可以是ORACLE数据库，所述业务员的历史薪资数据包括业务员每个月工作薪资，在本实施例中，可以通过连接ORACLE数据库的方式获取所述业务员的历史薪资数据，可选的，可以通过JDBC(Java DataBase Connectivity，Java数据库连接)方式连接ORACLE数据库，以获取ORACLE数据库中的业务员的历史薪资数据。

S102，根据业务员的历史薪资数据计算业务员的历史薪资涨幅数据。

在本发明实施例中，当从数据库中获得业务员的历史薪资数据后，针对每一名业务员的每月的历史薪资数据，并对前后每个月的历史薪资进行作差，得到前后每个月的差值，将该差值作为业务员的历史薪资涨幅数据。

S103，对所述业务员的历史薪资涨幅数据进行k-fold分组，并得到测试集和训练集。

在本发明实施例中，所述k-fold指的是k-折叠交叉验证，通过对所述业务员的历史薪资涨幅数据进行k-fold分组可以提高数据在模型中进行训练时的拟合度。

进一步地，如图2所示，所述步骤S103包括步骤S201～S202：

S201，对所述业务员的历史薪资涨幅数据按照预设数目进行随机划分，并得到若干数据包。

具体地，该预设数目可以为k个，该预设数目表示将历史薪资涨幅数据分成的包的总个数，所分成的每个数据包将成为不相交的子集。可选的，在matlab中，可以利用函数crossvalind('Kfold',x,k)来实现业务员的历史薪资涨幅数据的分组操作，其中，x为历史薪资涨幅的个数，k为要分成的组的总个数。

S202，将所得到的若干数据包中的一个数据包作为测试集，其余的数据包作为训练集。

具体地，例如将业务员的历史薪资涨幅数据A随机分为k个包，每次将其中一个包作为测试集，剩下k-1个包作为训练集进行训练。

S104，建立多元线性回归模型。

在本发明实施例中，所述多元线性回归模型为：

y＝b₀+b₁x₁+b₂x₂+...+b_kx_k+e，

其中，因变量y为业务员薪资预测值，自变量x₁、x₂、...、x_k为业务员历史涨幅数据，b₀、b₁、...、b_k为模型中的回归系数，e为模型中的常数项，表示误差变量，多元线性回归模型表示因变量y可以近似地为自变量x₁、x₂、...、x_k的线性函数。具体地，将业务员薪资预测值作为多元线性回归模型的因变量，将业务员的历史涨幅数据作为多元线性回归模型的自变量，获得该多元线性回归模型。

需要说明的是，建立多元性回归模型时，为了保证回归模型具有优良的解释能力和预测效果，应首先注意自变量的选择，其准则是：

(1)自变量对因变量必须有显著的影响，并呈密切的线性相关；

(2)自变量与因变量之间的线性相关必须是真实的，而不是形式上的；

(3)自变量之间应具有一定的互斥性，即自变量之间的相关程度不应高于自变量与因变量之因的相关程度；

(4)自变量应具有完整的统计数据，其预测值容易确定。

S105，根据所建立的多元线性回归模型以及所述业务员的历史薪资数据和训练集计算多元线性回归模型的回归系数。

在本发明实施例中，根据所建立的多元线性回归模型，使用业务员的历史薪资数据和训练集中的业务员的历史薪资涨幅数据采用最小二乘法计算该回归系数；具体地，在实际应用时，误差变量e的值可以忽略不计，以二元线性回归模型为例，可以得到求解回归系数的方程组为：

其中，y代表业务员的历史薪资数据值，x代表业务员的历史薪资涨幅数据，解以上方程组可以求得b₀，b₁，b₂这些回归***的常值，有了这些系数的常值方便我们得出业务员薪资预测方程。

S106，根据回归系数构建业务员薪资预测方程，并使用所述测试集对所述业务员薪资预测方程进行测试。

在本发明实施例中，在实际应用时，误差变量e的值可以忽略不计，根据步骤S105的方程式可以得出回归系数b₀、b₁、...、b_k的值，有了这些系数的常值便可以得出预业务员薪资预测方程为：

y＝b₀+b₁x₁+b₂x₂+...+b_kx_k，其中，自变量x₁、x₂、...、x_k为业务员历史涨幅数据，b₀、b₁、...、b_k的值为已知系数。

为了验证所构建的业务员薪资预测方程，可以使用测试集中的业务员的历史薪资涨幅数据作为自变量代入方程中进行计算。

进一步地，如图3所示，所述步骤S106包括步骤S301～S302。

S301，将所述回归系数代入所述多元线性回归模型中，并得到所述业务员薪资预测方程。

S302，将测试集中的业务员薪资涨幅数据代入所述业务员薪资预测方程，以完成对所述业务员薪资预测方程的测试。

S107，若所述测试结果符合预期结果，根据所述业务员薪资预测方程预测业务员的薪资。

在本发明实施例中，根据使用测试集中的业务员的历史薪资涨幅数据作为方程的自变量代入方程中进行计算，若所计算出的因变量y与数据库中相对应的业务员历史薪资数据基本相同(或者所得到的结果误差不大)，则所述业务员薪资预测方程可以用于预测业务的薪资。

由以上可见，本实施例通过获取业务员的历史薪资数据；根据业务员的历史薪资数据计算业务员的历史薪资涨幅数据；对所述业务员的历史薪资涨幅数据进行k-fold分组，并得到测试集和训练集；建立多元线性回归模型；根据所建立的多元线性回归模型以及所述业务员的历史薪资数据和训练集计算多元线性回归模型的回归系数；根据回归系数构建业务员薪资预测方程，并使用所述测试集对所述业务员薪资预测方程进行测试；若所述测试结果符合预期结果，根据所述业务员薪资预测方程预测业务员的薪资。本发明实施例可以提高员工薪资预测的准确率。

请参阅图4，图4是本发明实施例提供的一种业务员薪资预测方法的示意流程图。如图4所示，该方法包括步骤S401～S407。

S401，获取业务员的历史薪资数据。

S402，根据业务员的历史薪资数据计算业务员的历史薪资涨幅数据。

S403，对所述业务员的历史薪资涨幅数据进行k-fold分组，并得到测试集和训练集。

S404，建立多元线性回归模型。

在本发明实施例中，所述多元线性回归模型为：

y＝b₀+b₁x₁+b₂x₂+...+b_kx_k+e，

(4)自变量应具有完整的统计数据，其预测值容易确定。

S405，将所述业务员的历史薪资数据和训练集中的业务员历史涨幅数据作为多元线性回归模型的样本数据，使用最小二乘法计算多元线性回归模型中的回归系数。

S406，根据回归系数构建业务员薪资预测方程，并使用所述测试集对所述业务员薪资预测方程进行测试。

S407，若所述测试结果符合预期结果，根据所述业务员薪资预测方程预测业务员的薪资。

请参阅图5，对应上述一种业务员薪资预测方法，本发明实施例还提出一种业务员薪资预测装置，该装置100包括：获取单元101、第一计算单元102、分组单元103、建立单元104、第二计算单元105、构建单元106、预测单元107。

其中，所述获取单元101，用于获取业务员的历史薪资数据。

第一计算单元102，用于根据业务员的历史薪资数据计算业务员的历史薪资涨幅数据。

分组单元103，用于对所述业务员的历史薪资涨幅数据进行k-fold分组，并得到测试集和训练集。

建立单元104，用于建立多元线性回归模型。

第二计算单元105，用于根据所建立的多元线性回归模型以及所述业务员的历史薪资数据和训练集计算多元线性回归模型的回归系数；

构建单元106，用于根据回归系数构建业务员薪资预测方程，并使用所述测试集对所述业务员薪资预测方程进行测试；

预测单元107，用于若所述测试结果符合预期结果，根据所述业务员薪资预测方程预测业务员的薪资。

如图6所示，所述分组单元103，包括：

划分单元1031，用于对所述业务员的历史薪资涨幅数据按照预设数目进行随机划分，并得到若干数据包。

执行单元1032，用于将所得到的若干数据包中的一个数据包作为测试集，其余的数据包作为训练集。

如图7所示，所述构建单元106，包括：

第一代入单元1061，用于将所述回归***代入所述多元线性回归模型中，并得到所述业务员薪资预测方程。

第二代入单元1062，用于将测试集中的业务员薪资涨幅数据代入所述业务员薪资预测方程，以完成对所述业务员薪资预测方程的测试。

请参阅图8，对应上述一种员工离职风险预测方法，本发明实施例还提出一种业务员薪资预测装置，该装置200包括：获取单元201、第一计算单元202、分组单元203、建立单元204、第二计算子单元205、构建单元206、预测单元207。

其中，所述获取单元201，用于获取业务员的历史薪资数据。

第一计算单元202，用于根据业务员的历史薪资数据计算业务员的历史薪资涨幅数据。

分组单元203，用于对所述业务员的历史薪资涨幅数据进行k-fold分组，并得到测试集和训练集。

建立单元204，建立多元线性回归模型。

第二计算子单元205，用于根据所建立的多元线性回归模型以及所述业务员的历史薪资数据和训练集计算多元线性回归模型的回归系数。

构建单元206，用于根据回归系数构建业务员薪资预测方程，并使用所述测试集对所述业务员薪资预测方程进行测试。

预测单元207，用于若所述测试结果符合预期结果，根据所述业务员薪资预测方程预测业务员的薪资。

上述业务员薪资预测装置与上述业务员薪资预测方法一一对应，其具体的原理和过程与上述实施例所述方法相同，不再赘述。

上述业务员薪资预测装置可以实现为一种计算机程序的形式，计算机程序可以在如图9所示的计算机设备上运行。

图9为本发明一种计算机设备的结构组成示意图。该设备可以是终端，也可以是服务器，其中，终端可以是智能手机、平板电脑、笔记本电脑、台式电脑、个人数字助理和穿戴式装置等具有通信功能的电子装置。服务器可以是独立的服务器，也可以是多个服务器组成的服务器集群。参照图9，该计算机设备500包括通过***总线501连接的处理器502、非易失性存储介质503、内存储器504和网络接口505。其中，该计算机设备500的非易失性存储介质503可存储操作***5031和计算机程序5032，该计算机程序5032被执行时，可使得处理器502执行一种业务员薪资预测方法。该计算机设备500的处理器502用于提供计算和控制能力，支撑整个计算机设备500的运行。该内存储器504为非易失性存储介质503中的计算机程序5032的运行提供环境，该计算机程序被处理器执行时，可使得处理器502执行一种业务员薪资预测方法。计算机设备500的网络接口505用于进行网络通信，如发送分配的任务等。本领域技术人员可以理解，图9中示出的结构，仅仅是与本申请方案相关的部分结构的框图，并不构成对本申请方案所应用于其上的计算机设备的限定，具体的计算机设备可以包括比图中所示更多或更少的部件，或者组合某些部件，或者具有不同的部件布置。

其中，所述处理器502执行所述计算机程序时实现如下操作：

获取业务员的历史薪资数据；

建立多元线性回归模型；

在一个实施例中，对所述业务员的历史薪资涨幅数据进行k-fold分组，并得到测试集和训练集，包括：

对所述业务员的历史薪资涨幅数据按照预设数目进行随机划分，并得到若干数据包；

将所得到的若干数据包中的一个数据包作为测试集，其余的数据包作为训练集。

在一个实施例中，所述多元线性回归模型为：

y＝b₀+b₁x₁+b₂x₂+...+b_kx_k+e，

其中，因变量y为业务员薪资预测值，自变量x₁、x₂、...、x_k为业务员历史涨幅数据，b₀、b₁、...、b_k为模型中的回归系数，e为模型中的常数项，表示随机变量，多元线性回归模型表示因变量y可以近似地为自变量x₁、x₂、...、x_k的线性函数。

在一个实施例中，根据所建立的多元线性回归模型以及所述业务员的历史薪资数据和训练集计算多元线性回归模型的回归系数，包括：

将所述业务员的历史薪资数据和训练集中的业务员历史涨幅数据作为多元线性回归模型的样本数据，使用最小二乘法计算多元线性回归模型中的回归系数。

在一个实施例中，根据回归系数构建业务员薪资预测方程，并使用所述测试集对所述业务员薪资预测方程进行测试，包括：

将所述回归系数代入所述多元线性回归模型中，并得到所述业务员薪资预测方程；

将测试集中的业务员薪资涨幅数据代入所述业务员薪资预测方程，以完成对所述业务员薪资预测方程的测试。

本领域技术人员可以理解，图9中示出的计算机设备的实施例并不构成对计算机设备具体构成的限定，在其他实施例中，计算机设备可以包括比图示更多或更少的部件，或者组合某些部件，或者不同的部件布置。例如，在一些实施例中，计算机设备仅包括存储器及处理器，在这样的实施例中，存储器及处理器的结构及功能与图9所示实施例一致，在此不再赘述。

本发明提供了一种计算机可读存储介质，计算机可读存储介质存储有一个或者一个以上程序，所述一个或者一个以上程序可被一个或者一个以上的处理器执行，以实现以下步骤：

获取业务员的历史薪资数据；

建立多元线性回归模型；

在一个实施例中，所述多元线性回归模型为：

y＝b₀+b₁x₁+b₂x₂+...+b_kx_k+e，

其中，因变量y为业务员薪资预测值，自变量x₁、x₂、...、x_k为业务员历史涨幅数据，b₀、b₁、...、b_k为模型中的回归系数，e为模型中的常数项，表示随机变量，多元线性回归模型表示因变量y可以近似地为自变量x₁、x₂、…、x_k的线性函数。

本发明前述的存储介质包括：磁碟、光盘、只读存储记忆体(Read-Only Memory，ROM)等各种可以存储程序代码的介质。

本发明所有实施例中的单元可以通过通用集成电路，例如CPU(CentralProcessing Unit，中央处理器)，或通过ASIC(Application Specific IntegratedCircuit，专用集成电路)来实现。

本发明实施例业务员薪资预测方法中的步骤可以根据实际需要进行顺序调整、合并和删减。

本发明实施例业务员薪资预测装置中的单元可以根据实际需要进行合并、划分和删减。

以上所述，仅为本发明的具体实施方式，但本发明的保护范围并不局限于此，任何熟悉本技术领域的技术人员在本发明揭露的技术范围内，可轻易想到各种等效的修改或替换，这些修改或替换都应涵盖在本发明的保护范围之内。因此，本发明的保护范围应以权利要求的保护范围为准。

Claims

1.一种业务员薪资预测方法，其特征在于，所述方法包括：

获取业务员的历史薪资数据；

建立多元线性回归模型；

2.如权利要求1所述的方法，其特征在于，对所述业务员的历史薪资涨幅数据进行k-fold分组，并得到测试集和训练集，包括：

3.如权利要求1所述的方法，其特征在于，所述多元线性回归模型为：

y＝b₀+b₁x₁+b₂x₂+...+b_kx_k+e，

4.如权利要求1所述的方法，其特征在于，根据所建立的多元线性回归模型以及所述业务员的历史薪资数据和训练集计算多元线性回归模型的回归系数，包括：

5.如权利要求1所述的方法，其特征在于，根据回归系数构建业务员薪资预测方程，并使用所述测试集对所述业务员薪资预测方程进行测试，包括：

6.一种业务员薪资预测装置，其特征在于，所述装置包括：

获取单元，用于获取业务员的历史薪资数据；

建立单元，用于建立多元线性回归模型；

构建单元，用于根据回归***构建业务员薪资预测方程，并使用所述测试集对所述业务员薪资预测方程进行测试；

7.如权利要求6所述的装置，其特征在于，所述分组单元，包括：

划分单元，用于对所述业务员的历史薪资涨幅数据按照预设数目进行随机划分，并得到若干数据包；

执行单元，用于将所得到的若干数据包中的一个数据包作为测试集，其余的数据包作为训练集。

8.如权利要求6所述的装置，其特征在于，所述多元线性回归模型为：

y＝b₀+b₁x₁+b₂x₂+...+b_kx_k+e，

9.一种计算机设备，包括存储器、处理器及存储在所述存储器上并可在所述处理器上运行的计算机程序，其特征在于，所述处理器执行所述计算机程序时实现如权利要求1-5任一项所述的业务员薪资预测方法。

10.一种计算机可读存储介质，其特征在于，所述计算机可读存储介质存储有一个或者一个以上程序，所述一个或者一个以上程序可被一个或者一个以上的处理器执行，以实现如权利要求1-5任一项所述的业务员薪资预测方法。