CN108009926A

CN108009926A - 用于用户分类的方法、信息处理装置及可读存储介质

Info

Publication number: CN108009926A
Application number: CN201711282768.2A
Authority: CN
Inventors: 朱志亮; 刘利
Original assignee: Shanghai Point Information Technology Co Ltd
Current assignee: Shanghai Point Information Technology Co Ltd
Priority date: 2017-12-07
Filing date: 2017-12-07
Publication date: 2018-05-08

Abstract

本发明的实施例公开了用于用户分类的方法和信息处理装置。该方法包括：基于与注册用户相关联的上下文数据，提取注册用户中的未首投用户的特征信息，所述未首投用户的特征信息包括用户身份信息和用户行为信息；将所提取的未首投用户的特征信息输入到预测模型，以预测未首投用户中将在预定时间段内进行首投和不进行首投的用户，其中，所述预测模型是根据基于与历史注册用户相关联的上下文数据而提取的特征变量和目标变量来生成的，所述特征变量包括历史用户身份信息和历史用户行为信息，所述目标变量包括用于描述历史用户首投的信息。

Description

用于用户分类的方法、信息处理装置及可读存储介质

技术领域

概括地说，本公开涉及数据处理领域，更具体地说，涉及用于用户分类的方法、信息处理装置及计算机可读存储介质。

背景技术

随着网络服务的日益完善，传统上通过柜面、现场等提供投资服务的方式开始凸显出局限性，其不能满足投资者随时随地实现投资活动的需求，而通过网络提供投资服务的方式变得越来越流行，其原因很大程度上在于它解决了传统投资活动在时间、地域上的限制，实现随时随地轻松投资能够满足用户的投资需求。投资活动所涉及的投资对象通常是具有一定价值的可投资资产，例如其可以包括但不限于理财产品、股票、基金、保险、外汇、大宗商品、艺术收藏品、房地产、专利权、音乐版权等。在通过网络实现投资活动时，投资者需要在与提供投资服务的机构(例如，银行、互联网金融公司、证券公司、保险公司等投资机构)相关联的投资平台上注册(例如，直接注册或通过第三方登录接入注册或其它方式注册)，并且在注册成功后以注册用户的身份开展投资活动。

由于网络带来的用户流动性增强，对于投资平台而言，在用户生命周期管理的各个阶段(用户引入、成长、成熟、衰退和流失)设法提升用户留存率和增加用户价值变得非常重要。传统上，一般基于业务和市场分析以提升用户留存率和转化率的方式，会从产品路径和用户***台的用户数量可能非常庞大，从业务和运营的时效性考虑，使用传统方式来提升投资平台的用户留存率和注册转化率不论效率还是效果都不够理想。用户首次投资(以下简称“首投”)各个环节的体验对于用户是否重复投资(以下简称“复投”)产生了非常大的影响，因此确定首投目标用户和非首投目标用户继而针对性地进行运营管理，以提升首投转化率，对于提高用户的粘性从而提升用户留存率具有重要的意义。

因此，亟需一种改进的方法来对用户进行分类。

发明内容

传统上基于业务和市场分析而建立的规则***来进行用户分类和运营管理，这样做速度慢、效率低而且效果不理想，因此这样的解决方案并不能满足当前网络投资平台对业务和运营的时效性的要求。本发明针对以上问题，提出了用于用户分类的方法、信息处理装置和计算机可读存储介质。

本公开的第一方面提供了一种用于用户分类的方法，包括：基于与注册用户相关联的上下文数据，提取所述注册用户中的未首投用户的特征信息，所述未首投用户的特征信息包括用户身份信息和用户行为信息；以及将所提取的所述未首投用户的特征信息输入到预测模型，以预测所述未首投用户中将在预定时间段内进行首投的用户和不进行首投的用户。

本公开的第二方面提供了一种用于用户分类的信息处理装置，包括：存储器，其用于存储指令；以及处理器，其耦合到所述存储器，所述处理器被配置为基于所述指令来执行以下操作：基于与注册用户相关联的上下文数据，提取所述注册用户中的未首投用户的特征信息，所述未首投用户的特征信息包括用户身份信息和用户行为信息；以及将所提取的所述未首投用户的特征信息输入到预测模型，以预测所述未首投用户中将在预定时间段内进行首投的用户和不进行首投的用户。

本公开的第三方面提供了一种其上存储有指令的计算机可读存储介质。所述指令在被执行时实现如上文所述的方法。

不同于传统上用户(特别是网络投资平台用户)的生命周期管理，本发明充分考虑到行业业务和用户特点及运营的时效性，通过预测模型来预测多层面的目标用户，有助于对不同类别目标用户采取差异化的分层运营，以有效地提升注册用户的首投转化率，不需要人工干预且时间效率较高。

附图说明

结合附图并参考以下详细描述，本公开的各实施例的特征、优点及其它方面将变得更加明显，在此以示例性而非限制性的方式示出了本公开的若干实施例，在附图中：

图1示出用户与投资平台的示例***互100的示意图；

图2示出依据本发明实施例的用于用户分类的示例性方法200的流程图；

图3示出依据本发明实施例的用于用户分类的示例性信息处理装置300的示意图；以及

图4示出依据本发明的实施例的用于用户分类的方法的一个具体示例400。

具体实施方式

以下参考附图详细描述本公开的各个示例性实施例。虽然以下描述示例性方法、装置包括在其它组件当中硬件上执行的软件和/或固件，但应注意，这些示例仅仅是说明性的，不应看作限制。例如，考虑在硬件中独占地、在软件中独占地、或在硬件和软件的任何组合中可以实施任何或所有硬件、软件和固件组件。因此，虽然以下描述示例性方法和装置，但本领域技术人员应容易理解，提供的示例不仅仅是用于实现这些方法和装置方式。

此外，附图中的流程图和框图示出了根据本公开的各种实施例的方法和***的可能实现的体系架构、功能和操作。应当注意，方框中所标注的功能也可以按照不同于附图中所标注的顺序发生。例如，两个接连地表示的方框实际上可以基本并行地执行，或者它们有时也可以按照相反的顺序执行，这取决于所涉及的功能。同样应当注意的是，流程图和/或框图中的每个方框、以及流程图和/或框图中的方框的组合，可以使用执行规定的功能或操作的专用的基于硬件的***来实现，或者可以使用专用硬件与计算机指令的组合来实现。

本文使用词语“示例性”表示“充当示例、实例或举例说明”。本文中被描述为“示例性”的任何实施例都并非必然解释为对于其它实施例而言是优选的或有优势的。

图1示出用户与投资平台的示例***互100的示意图。图1包括多个用户102、多个用户设备104、网络108和服务器112。用户102通过用户设备104经由数据链路106接入网络108，并经由数据链路110访问服务器112上的投资平台以实现交互。在其它示例中，投资平台可以驻留在与服务器112类似的基础设施上。在其它示例中，用户设备104也可以通过数据链路106直接访问(图中未示出)服务器112。用户设备104可以是蜂窝电话、个人数字助理(PDA)、无线调制解调器、无线通信设备、手持设备、平板计算机、膝上型计算机、台式计算机或其它可实现与投资平台交互的任何设备等。数据链路106和110可以包括有线、无线或混合连接。例如，用户102可以使用用户设备104上的应用(例如，浏览器应用或为投资平台专门开发的应用等)来实现与投资平台的交互。用户从引入完成注册、使用应用、到未来可能参与投资等的每个过程中都可能产生数据，这些数据对解决业务需求可以产生价值，本文中将描述用户与投资平台之间的交互而产生的数据统称为上下文数据。例如，可以使用各种大数据架构(例如，Kafka、Flume、或其任意组合等)和/或其它数据结构来实现对注册用户的上下文数据的收集、传输和存储，其中，数据收集有些可以是在线(实时)的，有些可以是离线的。应当理解，图1中的用户、用户设备和服务器的数量、类型和架构只是说明性的，而不是限制性的。

图2示出依据本发明实施例的用于用户分类的示例性方法200的流程图。如流程图所示，方法200包括以下步骤：

步骤S201：基于与注册用户相关联的上下文数据，提取注册用户中的未首投用户的特征信息，未首投用户的特征信息包括用户身份信息和用户行为信息。在该步骤中，与注册用户相关联的上下文数据可以是从利用大数据架构而存储的数据库或其它数据结构中获得的。注册用户包括未首投用户和已首投用户，这里针对未首投用户进行处理，未首投用户是潜在的投资群体，如上文所述，提升首投转化率对于提升用户留存率具有重要的意义。可以通过例如机器学习算法自动地提取未首投用户的特征信息。所提取的特征信息可以是上下文数据中的特征信息或基于上下文数据而获得的特征信息。特征信息可以包括用户身份信息和用户行为信息。例如，用户身份信息可以包括但不限于用户的ID、性别、学历、职业、年龄、年收入、注册时间和来源、实名信息、信用等级等。例如，用户行为信息可以包括但不限于参与活动信息、充值取现行为、绑定银行卡、通话信息、不同时间段应用行为、应用行为统计信息等。

步骤S202：将所提取的未首投用户的特征信息输入到预测模型，以预测未首投用户中将在预定时间段内进行首投的用户和不进行首投的用户，其中，预测模型是根据基于与历史注册用户相关联的上下文数据而提取的特征变量和目标变量来生成的，特征变量包括历史用户身份信息和历史用户行为信息，目标变量包括用于描述历史用户首投的信息。历史用户身份信息和历史用户行为信息可以分别类似于上文所描述的用户身份信息和用户行为信息，用于描述历史用户首投的信息可以包括但不限于用户是否进行过首投、首投金额等。在该步骤中，通过预测模型来对未首投用户进行分类，即，在预定时间段内进行首投和不进行首投的用户。例如，与历史注册用户相关联的上下文数据可以是从利用大数据架构而存储的数据库或其它数据结构中获得的。在该步骤中，例如，通过将具有已知目标变量标签的样本来根据特征变量进行训练来生成预测模型。例如，生成预测模型的过程可以包括对上下文数据进行数据清洗和特征处理，得到具有目标变量标签的历史数据作为模型训练数据以及得到特征变量，并且基于模型训练数据，利用训练算法(例如，机器学习算法等)进行训练来得到预测模型。数据清洗是数据预处理步骤，例如对数据进行填充、补齐、标准化、异常值处理等，其目的有两个，第一是通过清洗让数据可用，第二是让数据变得更适合进行后续的处理。特征处理是获取和筛选出有意义的特征变量并将其输入训练算法进行模型训练。在一个实施例中，预测模型可以采用分类模型来实现。例如，可以采用机器学习中的随机森林模型，该模型由多棵决策树组成，输入自变量包括从上下文数据中提取的用户身份信息和用户行为信息，输出因变量为分类结果(例如，用户标签)，当待分类样本进入随机森林时，由多棵决策树进行分类，最后选取被所有决策树选择次数最多的类别作为最终的分类结果。在一个实施例中，预测模型可以采用回归模型来实现。例如，同样可以采用随机森林模型，输出因变量为分类概率，当选择一个或多个概率阈值时，可以实现二分类和多分类。在其它示例中，可以使用任何其它合适的模型来实现类似的预测效果。

可选地，方法200还可以包括以下步骤：定制用于所预测的用户的资源以激励用户。在该步骤中，针对所预测的用户，为其定制相关的资源，例如，向用户推送特定消息、打电话、发送优惠券等，以针对性地激励潜在的用户对资源的响应。可选地，方法200还可以包括：基于所预测的用户对所定制的资源的响应，来进一步调整用于用户的资源。例如，可以基于响应程度来调整优惠券的发送。

这样，通过预测模型对用户进行分类，使得后续的运营尽可能对较可能产生响应的目标用户进行，一方面节省运营成本，另一方面降低过多的运营对非目标用户造成的负面效果的骚扰。同时，目标用户对诸如最低成本券之类的资源进行响应，又可由此对不同用户进行差异化资源分配(例如，不同价格的成本券)。

对于注册用户中的未首投用户，可能存在两种类型：未首投新增用户，未首投存量用户。可以通过注册时间的长短来区分未首投新增用户和未首投存量用户。例如，将a天以下注册的用户称为新增用户，而将b天以上注册的用户称为存量用户。

在一个实施例中，未首投用户可以包括未首投新增用户，并且预测模型可以包括第一分类模型。在该实施例中，步骤S202可以包括将所提取的未首投新增用户的特征信息输入到第一分类模型，以预测未首投新增用户中将在第一预定时间段内进行首投的第一目标用户和不进行首投的第二目标用户。这里，第一分类模型可以参照如上文在步骤S202中针对预测模型所描述的来进行分类。

在该实施例中，可选地，预测模型可以包括回归模型，并且方法200还可以包括：将所提取的第一目标用户的特征信息输入到回归模型，以预测第一目标用户的首投金额范围。例如，回归模型可以包括线性或非线性回归模型、决策树回归模型等。在一个示例中，回归模型可以包括GBDT(Gradient Boosting Decision Tree，梯度提升决策树)模型，GBDT模型通过迭代多棵弱的决策树(回归树)来共同决策进行提升，把多颗决策树的结果累加起来作为最终的预测输出，能够在训练精度和泛化能力两个方面都能达到较好的效果。除了传统的GBDT模型实现方式，GBDT模型还可以利用xgboost来高效地实现，xgboost是一个大规模、分布式的通用Gradient Boosting(GBDT)库，它在Gradient Boosting框架下实现了GBDT和一些广义的线性机器学习算法，并具有速度快、效果好、能处理大规模数据、支持自定义损失函数等优点。不同于传统的GBDT实现方式，只利用一阶的导数信息，xgboost对损失函数做了二阶的泰勒展开，并在目标函数之外加入了正则项整体求最优解，用以权衡目标函数的下降和模型的复杂程度，避免过拟合。

可选地，在该实施例中，方法200还可以包括：基于所预测的第一目标用户的首投金额范围来定制用于第一目标用户的资源以激励第一目标用户。例如，可以对于首投金额在不同区间范围的用户，采取不同频度和力度来推送消息、打电话、发送优惠券等以激励用户在更快或更多首投数额的方向上进行转化，从而提升首投转化率。

在另一个实施例中，未首投用户可以包括未首投存量用户，并且预测模型可以包括第二分类模型。在该实施例中，步骤S202可以包括将所提取的未首投存量用户的特征信息输入到第二分类模型，以预测未首投存量用户中将在第二预定时间段内进行首投的第三目标用户。这里，第二分类模型可以参照如上文在步骤S202中针对预测模型所描述的来进行分类。

可选地，方法200还可以包括：与历史注册用户相关联的上下文数据周期性地进行更新。例如，注册用户在一时间段内产生的上下文数据可以被收集、传输和存储转而被添加到与历史注册用户相关联的上下文数据，使得与历史注册用户相关联的上下文数据可以周期性地进行更新，从而实现数据的闭环更新，同时经更新的该上下文数据可以用于训练预测模型，从而实现训练模型的自动更新。

图3示出依据本发明实施例的用于用户分类的示例性信息处理装置300的示意图。装置300可以包括：存储器301和耦合到存储器301的处理器302。存储器301用于存储指令，处理器302被配置为基于存储器301存储的指令来实现如图2中任一实施例所描述的方法。

如图3所示，装置300还可以包括通信接口303，用于与其它设备进行信息交互。此外，装置300还可以包括总线304，存储器301、处理器302和通信接口303通过总线304来彼此进行通信。

存储器301可以包括易失性存储器，也可以包括非易失性存储器。处理器302可以是中央处理器(CPU)、微控制器、专用集成电路(ASIC)、数字信号处理器(DSP)、现场可编程门阵列(FPGA)或其它可编程逻辑器件、或是被配置为实现本发明的实施例的一个或多个集成电路。

为了更好地表达本发明的构思，下面结合一个具体的示例来进行说明。

在示例400中，若干用户402通过理财APP注册成为理财平台用户，在与理财平台的交互中，用户从引入完成注册、使用APP、到未来可能参与投资等的每个过程中都可能产生上下文数据404。上下文数据404可以被收集、传输并存储到大数据设备406。例如，基于Kafka和Flume架构进行上下文数据收集传输，最后对上下文数据进行必要解析存储到SparkHive。在一些场景中，也可以在oracle、mysql和mongodb进行部分存储。

用户从注册到首投前这段时间相对较短并且无投资行为，用户产生的数据少，因此特征信息的抽取成了必须面对的关键问题。例如，可以从大数据设备406存储的与注册用户相关联的上下文数据中提取未首投用户的特征信息408，特征信息408可以包括用户身份信息和用户行为信息。例如，用户身份信息可以包括用户的ID、性别、学历、职业、年龄、年收入、注册时间(例如，注册天数等)、注册来源(例如，从网络广告点击跳转、已注册用户推荐链接注册、第三方软件跳转注册、或直接注册等)、实名信息、信用等级等。例如，用户行为信息可以包括绑定身份证和银行卡、对历史运营活动的响应行为、通话信息(例如，理财平台客服和用户通话等)、充值取现行为、在理财APP上的点击行为等。基于对互联网金融业务的考虑，这些数据有助于对未首投用户的首投行为的预测。同样，可以从大数据设备406存储的与历史注册用户相关联的上下文数据中提取特征变量410和目标变量412(例如，经由如上文所述的数据清洗和特征处理)。特征变量410可以包括历史用户身份信息和历史用户行为信息。目标变量412可以包括用于描述历史用户首投的信息。根据训练算法(例如，GBDT算法)，基于特征变量410和目标变量412来训练具有用户标签的历史数据得到预测模型414。随后，将所提取的未首投用户的特征信息408输入到已生成的预测模型414，从而输出用户标签416，例如未首投用户是否进行首投、首投金额范围等。用户402在一段时间上会产生上下文数据，该上下文数据被收集、传输和存储到大数据设备406，转而对与历史注册用户相关联的上下文数据进行更新，从而实现数据的闭环更新，同时经更新的数据可以用于训练预测模型414，从而实现预测模型414的自动更新。可选地，可以将用户标签416传送给运营管理端(未示出)，以进行针对性运营。

根据注册天数，未首投用户可以包括未首投新增用户和/或未首投存量用户。预测模型414可以包括分类和/或回归模型。

如果存在未首投新增用户，则将所提取的用户的特征信息408输入到预测模型414的第一分类模型，以预测从当天到未来距离注册x1天以内会首投的第一目标用户(例如，用户1、2和3)和在x1天以内不会首投的第二目标用户(例如，用户4)。对于会首投的第一目标用户，运营管理端可以采取电话、APP推送信息或发券等措施予以刺激，希望用户会将首投时间进一步提前，从而提升整体的注册首投率；对于不会首投的第二目标用户，运营管理端可以给予相应的加息券刺激，希望用户朝首投方向转变。进一步地，可以将所提取的第一目标用户的特征信息408输入到预测模型414的回归模型，以预测第一目标用户的首投金额范围。对于首投金额在不同区间范围的第一目标用户，运营管理端可以采取不同频度和力度的APP推送信息、电话、加息券等措施予以刺激，希望用户在更快或更多首投数额的方向上进行转化。

例如，通过数据收集发现用户1具有良好的个人信用且频繁地点击理财产品，用户2的年收入较高且绑定了银行卡并查看高价值理财产品，用户3的年收入中等且充值了一定金额，用户4为自由职业者且偶尔地浏览理财消息。基于这些从上下文数据中提取的特征信息，通过预测模型414进行预测，用户1、2和3被预测为将会在x1＝30天以内首投，并且用户1、2和3的预计首投金额范围分别为50000～100000、200000～500000和2000～5000元，相应地，运营管理端可以向用户1、2和3分别发送1.5％、2.5％和0.5％加息券予以刺激；而用户4被预测为不会在x1＝30天以内首投，相应地，运营管理端可以向用户4发送0.25％加息券予以刺激。例如，用户1在收到加息券后，产生了进一步关注、收藏、咨询某类理财产品等行为，运营管理端可以优先为用户1预留一定额度的理财产品或调整其它用于用户1的资源等。类似地，运营管理端可以根据用户2、3和4的响应，来进一步调整用于这些用户的资源。

如果存在未首投存量用户，则将所提取的用户的特征信息408输入到预测模型414的第二分类模型，以预测从当天到未来距离注册x2～x3天以内会首投的目标用户(例如，用户6和7)。对于会首投的目标用户，运营管理端可以采取电话、APP推送信息或发券等措施予以刺激，希望用户会将首投时间进一步提前，从而提升整体的注册首投率。例如，对用户6和7的预测和资源定制可以类似于上文关于用户1、2和3所描述的。

在该示例400中，利用预测模型414输出的用户标签416，运营管理端做差异化运营,以提升业务目标。

本发明通过预测模型来预测用户在预定时间上是否产生预期的行为来挖掘出目标用户，有助于用户运营端使目标用户朝首投方向转化或进一步提前首投时间或提高首投金额，从而在成本控制的条件下，较精准和明显地提升用户首投率，进而实现用户留存率的提升。同时，与传统的基于业务规则的用户分类和运营相比，本发明充分考虑到业务和用户特点及运营的时效性，全部处理都可由计算机处理完成，不需要人工干预，时间效率较高。

此外，替代地，上述的用于用户分类的方法能够通过计算机程序产品，即有形的计算机可读存储介质来实现。计算机程序产品可以包括计算机可读存储介质，其上载有用于执行本公开的各个方面的计算机可读程序指令。计算机可读存储介质可以是可以保持和存储由指令执行设备使用的指令的有形设备。计算机可读存储介质例如可以是但不限于电存储设备、磁存储设备、光存储设备、电磁存储设备、半导体存储设备或者上述的任意合适的组合。计算机可读存储介质的更具体的例子(非穷举的列表)包括：便携式计算机盘、硬盘、随机存取存储器(RAM)、只读存储器(ROM)、可擦式可编程只读存储器(EPROM或闪存)、静态随机存取存储器(SRAM)、便携式压缩盘只读存储器(CD-ROM)、数字多功能盘(DVD)、记忆棒、软盘、机械编码设备、例如其上存储有指令的打孔卡或凹槽内凸起结构、以及上述的任意合适的组合。这里所使用的计算机可读存储介质不被解释为瞬时信号本身，诸如无线电波或者其它自由传播的电磁波、通过波导或其它传输媒介传播的电磁波(例如，通过光纤电缆的光脉冲)、或者通过电线传输的电信号。

此外，用于执行本公开的各个方面的计算机可读程序指令或者计算机程序产品也能够存储在云端，在需要调用时，用户能够通过移动互联网、固网或者其它网络访问存储在云端上的用于执行本公开的各个方面的计算机可读程序指令，从而实施依据本公开的各个方面所公开的技术方案。

以上所述仅为本公开的可选实施例，并不用于限制本公开的实施例，对于本领域的技术人员来说，本公开的实施例可以有各种更改和变化。凡在本公开的实施例的精神和原则之内，所作的任何修改、等效替换、改进等，均应包含在本公开的实施例的保护范围之内。

虽然已经参考若干具体实施例描述了本公开的实施例，但是应该理解，本公开的实施例并不限于所公开的具体实施例。本公开的实施例旨在涵盖在所附权利要求的精神和范围内所包括的各种修改和等同布置。所附权利要求的范围符合最宽泛的解释，从而包含所有这样的修改及等同结构和功能。

Claims

1.一种用于用户分类的方法，其特征在于，包括：

基于与注册用户相关联的上下文数据，提取所述注册用户中的未首投用户的特征信息，其中，所述未首投用户的特征信息包括用户身份信息和用户行为信息；以及

将所提取的所述未首投用户的特征信息输入到预测模型，以预测所述未首投用户中将在预定时间段内进行首投的用户和不进行首投的用户，其中，所述预测模型是根据基于与历史注册用户相关联的上下文数据而提取的特征变量和目标变量来生成的，其中，所述特征变量包括历史用户身份信息和历史用户行为信息，所述目标变量包括用于描述历史用户首投的信息。

2.根据权利要求1所述的方法，其特征在于，所述未首投用户包括未首投新增用户，并且所述预测模型包括第一分类模型，

其中，将所提取的所述未首投用户的特征信息输入到预测模型，以预测所述未首投用户中将在预定时间段内进行首投的用户和不进行首投的用户包括：将所提取的所述未首投新增用户的特征信息输入到所述第一分类模型，以预测所述未首投新增用户中将在第一预定时间段内进行首投的第一目标用户和不进行首投的第二目标用户。

3.根据权利要求2所述的方法，其特征在于，所述预测模型包括回归模型，所述方法还包括：

将所提取的所述第一目标用户的特征信息输入到所述回归模型，以预测所述第一目标用户的首投金额范围。

4.根据权利要求3所述的方法，其特征在于，所述回归模型包括GBDT模型。

5.根据权利要求1所述的方法，其特征在于，所述未首投用户包括未首投存量用户，并且所述预测模型包括第二分类模型，

其中，将所提取的所述未首投用户的特征信息输入到预测模型，以预测所述未首投用户中将在预定时间段内进行首投的用户和不进行首投的用户包括：将所提取的所述未首投存量用户的特征信息输入到所述第二分类模型，以预测所述未首投存量用户中将在第二预定时间段内进行首投的第三目标用户。

6.根据权利要求1所述的方法，其特征在于，与所述历史注册用户相关联的上下文数据周期性地进行更新。

7.一种用于用户分类的信息处理装置，其特征在于，包括：

存储器，其用于存储指令；以及

处理器，其耦合到所述存储器，所述处理器被配置为基于所述指令来执行以下操作：

基于与注册用户相关联的上下文数据，提取所述注册用户中的未首投用户的特征信息，所述未首投用户的特征信息包括用户身份信息和用户行为信息；

将所提取的所述未首投用户的特征信息输入到预测模型，以预测所述未首投用户中将在预定时间段内进行首投的用户和不进行首投的用户，其中，所述预测模型是根据基于与历史注册用户相关联的上下文数据而提取的特征变量和目标变量来生成的，所述特征变量包括历史用户身份信息和历史用户行为信息，所述目标变量包括用于描述历史用户首投的信息。

8.根据权利要求7所述的信息处理装置，其特征在于，所述未首投用户包括未首投新增用户，并且所述预测模型包括第一分类模型，

9.根据权利要求8所述的信息处理装置，其特征在于，所述预测模型包括回归模型，

其中，所述处理器还被配置为基于所述指令来执行以下操作：将所提取的所述第一目标用户的特征信息输入到所述回归模型，以预测所述第一目标用户的首投金额范围。

10.根据权利要求9所述的信息处理装置，其特征在于，所述回归模型包括GBDT模型。

11.根据权利要求7所述的信息处理装置，其特征在于，所述未首投用户包括未首投存量用户，并且所述预测模型包括第二分类模型，

12.根据权利要求7所述的信息处理装置，其特征在于，与所述历史注册用户相关联的上下文数据周期性地进行更新。

13.一种计算机可读存储介质，其特征在于，所述计算机可读存储介质存储有指令，所述指令在被执行时用于实现如权利要求1-6中任一项所述的方法。