CN112950359B - 一种用户识别方法和装置 - Google Patents

一种用户识别方法和装置 Download PDF

Info

Publication number
CN112950359B
CN112950359B CN202110338740.6A CN202110338740A CN112950359B CN 112950359 B CN112950359 B CN 112950359B CN 202110338740 A CN202110338740 A CN 202110338740A CN 112950359 B CN112950359 B CN 112950359B
Authority
CN
China
Prior art keywords
data
user
preset
user data
model
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202110338740.6A
Other languages
English (en)
Other versions
CN112950359A (zh
Inventor
邓强
史博慧
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
China Construction Bank Corp
Original Assignee
CCB Finetech Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by CCB Finetech Co Ltd filed Critical CCB Finetech Co Ltd
Priority to CN202110338740.6A priority Critical patent/CN112950359B/zh
Publication of CN112950359A publication Critical patent/CN112950359A/zh
Application granted granted Critical
Publication of CN112950359B publication Critical patent/CN112950359B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q40/00Finance; Insurance; Tax strategies; Processing of corporate or income taxes
    • G06Q40/03Credit; Loans; Processing thereof
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N20/00Machine learning
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q40/00Finance; Insurance; Tax strategies; Processing of corporate or income taxes
    • G06Q40/04Trading; Exchange, e.g. stocks, commodities, derivatives or currency exchange

Landscapes

  • Engineering & Computer Science (AREA)
  • Business, Economics & Management (AREA)
  • Accounting & Taxation (AREA)
  • Finance (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • General Business, Economics & Management (AREA)
  • Technology Law (AREA)
  • Strategic Management (AREA)
  • Marketing (AREA)
  • Economics (AREA)
  • Development Economics (AREA)
  • Software Systems (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Data Mining & Analysis (AREA)
  • Evolutionary Computation (AREA)
  • Medical Informatics (AREA)
  • Artificial Intelligence (AREA)
  • Computing Systems (AREA)
  • General Engineering & Computer Science (AREA)
  • Mathematical Physics (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本发明公开了用户识别方法和装置,涉及大数据技术领域。该方法的一具体实施方式包括通过调用预设的数据接口,从数据仓库中获取用户数据;基于所述用户数据,根据预设的客群分类组件确定所属客群,以匹配所属客群对应的识别模型;调用识别模型引擎,选取数据采集时点,以获取所述用户的历史数据,进而根据所述历史数据计算得到所述用户的评分结果,将评分结果符合预设匹配条件的用户数据推送至第三方营销平台。从而,本发明的实施方式能够解决现有房贷产品推荐精准度低、用户体验差,而且耗费人力物力的问题。

Description

一种用户识别方法和装置
技术领域
本发明涉及大数据技术领域,具体为数据分析与挖掘领域,尤其涉及一种用户识别方法和装置。
背景技术
近年来,随着经济发展,居民的住房消费比重上升趋势明显,个人住房贷款需求旺盛。在实现本发明过程中,发明人发现现有技术中至少存在如下问题:目前完全是凭借人员经验向众多用户进行大范围的房贷产品推荐,不仅精准度低、用户体验差,而且耗费人力物力。
发明内容
有鉴于此,本发明实施例提供一种用户识别方法和装置,能够解决现有房贷产品推荐精准度低、用户体验差,而且耗费人力物力的问题。
为实现上述目的,根据本发明实施例的一个方面,提供了一种用户识别方法,包括通过调用预设的数据接口,从数据仓库中获取用户数据;基于所述用户数据,根据预设的客群分类组件确定所属客群,以匹配所属客群对应的识别模型;调用识别模型引擎,选取数据采集时点,以获取所述用户的历史数据,进而根据所述历史数据计算得到所述用户的评分结果,将评分结果符合预设匹配条件的用户数据推送至第三方营销平台。
可选地,通过调用预设的数据接口,从数据仓库中获取用户数据之后,包括:
调用预设的筛选组件,对获取的用户数据进行过滤,以生成待识别的用户数据。
可选地,根据预设的客群分类组件确定所属客群,包括:
根据所述用户数据,向征信数据库服务器发送数据请求,进而判断接收的处理结果是否存在第一目标属性值,若是则确定所属第一客群;若否则调用存储的第二目标属性表,判断是否存在所述用户数据,如果是则确定所属第二客群,如果否则确定所属第三客群。
可选地,获取所述用户的历史数据,包括:
根据所述识别模型,获取相应的配置信息,进而通过预设的时间窗口对不同类型的配置信息计算各窗口内相应的统计变量。
可选地,包括:
调用识别模型的评价引擎,根据预设的评价模型和稳定性验证模型对各个客群对应的识别模型进行处理;
待监控到处理结果不符合预设的目标条件时,触发模型训练程序,以对识别模型的参数进行调整。
可选地,还包括:
基于lightGBM模型,分别对各种客群进行机器学习,以训练得到对应的识别模型,进而构建识别模型引擎。
另外,本发明还提供了一种用户识别装置,包括获取模块,用于通过调用预设的数据接口,从数据仓库中获取用户数据;处理模块,用于基于所述用户数据,根据预设的客群分类组件确定所属客群,以匹配所属客群对应的识别模型;调用识别模型引擎,选取数据采集时点,以获取所述用户的历史数据,进而根据所述历史数据计算得到所述用户的评分结果,将评分结果符合预设匹配条件的用户数据推送至第三方营销平台。
可选地,获取模块通过调用预设的数据接口,从数据仓库中获取用户数据之后,包括:
调用预设的筛选组件,对获取的用户数据进行过滤,以生成待识别的用户数据。
可选地,处理模块根据预设的客群分类组件确定所属客群,包括:
根据所述用户数据,向征信数据库服务器发送数据请求,进而判断接收的处理结果是否存在第一目标属性值,若是则确定所属第一客群;若否则调用存储的第二目标属性表,判断是否存在所述用户数据,如果是则确定所属第二客群,如果否则确定所属第三客群。
可选地,处理模块获取所述用户的历史数据,包括:
根据所述识别模型,获取相应的配置信息,进而通过预设的时间窗口对不同类型的配置信息计算各窗口内相应的统计变量。
可选地,还包括:
监控模块,用于调用识别模型的评价引擎,根据预设的评价模型和稳定性验证模型对各个客群对应的识别模型进行处理;待监控到处理结果不符合预设的目标条件时,触发模型训练程序,以对识别模型的参数进行调整。
可选地,处理模块,还用于:
基于lightGBM模型,分别对各种客群进行机器学习,以训练得到对应的识别模型,进而构建识别模型引擎。
上述发明中的一个实施例具有如下优点或有益效果:本发明基于客户的性别、年龄层、受教育程度、职业属性、所在地区等等用户数据,利用客户在银行的交易流水,金融资产等多维度的历史数据,建立识别模型,将撒网营销目标群体进行细分,挑选出房贷需求高,办理房贷可能性大的目标群体推送至第三方营销平台进行投放,有利于对目标消费者进行精准定位,缩小营销群体的范围,把营销信息精准地投放到目标消费者的眼前,提高营销成功的概率,降低了营销成本,提高了获客效率,取得最大化的营销效果。
上述的非惯用的可选方式所具有的进一步效果将在下文中结合具体实施方式加以说明。
附图说明
附图用于更好地理解本发明,不构成对本发明的不当限定。其中:
图1是根据本发明第一实施例的用户识别方法的主要流程的示意图;
图2是根据本发明实施例的PSI参数的示意图;
图3是根据本发明第二实施例的用户识别方法的主要流程的示意图;
图4是根据本发明实施例的识别模型构建的主要流程的示意图;
图5是根据本发明第一实施例的用户识别装置的主要模块的示意图;
图6是根据本发明第二实施例的用户识别装置的主要模块的示意图;
图7是本发明实施例可以应用于其中的示例性***架构图;
图8是适于用来实现本发明实施例的终端设备或服务器的计算机***的结构示意图。
具体实施方式
以下结合附图对本发明的示范性实施例做出说明,其中包括本发明实施例的各种细节以助于理解,应当将它们认为仅仅是示范性的。因此,本领域普通技术人员应当认识到,可以对这里描述的实施例做出各种改变和修改,而不会背离本发明的范围和精神。同样,为了清楚和简明,以下的描述中省略了对公知功能和结构的描述。
图1是根据本发明第一实施例的用户识别方法的主要流程的示意图,如图1所示,所述用户识别方法包括:
步骤S101,通过调用预设的数据接口,从数据仓库中获取用户数据。
在实施例中,在进行步骤S101之后可以调用预设的筛选组件,对获取的用户数据进行过滤,以生成待识别的用户数据。也就是说,可以根据不同业务需求预先配置筛选组件,筛除不满足业务准入条件的客户,例如筛除不满足房贷业务准入条件的客户。
步骤S102,基于所述用户数据,根据预设的客群分类组件确定所属客群,以匹配所属客群对应的识别模型。
在实施例中,根据预设的客群分类组件确定所属客群,具体的实施过程包括:根据所述用户数据,向征信数据库服务器发送数据请求,进而判断接收的处理结果是否存在第一目标属性值,若是则确定所属第一客群;若否则调用存储的第二目标属性表,判断是否存在所述用户数据,如果是则确定所属第二客群,如果否则确定所属第三客群。
也就是说,向征信数据库服务器发送数据请求,如果接收的处理结果存在征信数据即第一目标属性值则确定所属第一客群(例如征信客群),如果接收的处理结果不存在征信数据则调用存储的第二目标属性表(例如代发工资数据表)。若具有代发工资数据则确定所属第二客群(例如代发工资客群),若不具有代发工资数据则确定所属第三客群(例如一般客群)。
步骤S103,调用识别模型引擎,选取数据采集时点,以获取所述用户的历史数据,进而根据所述历史数据计算得到所述用户的评分结果,将评分结果符合预设匹配条件的用户数据推送至第三方营销平台。
在实施例中,获取所述用户的历史数据的时候,可以根据所述识别模型,获取相应的配置信息,进而通过预设的时间窗口对不同类型的配置信息计算各窗口内相应的统计变量。也就是说,不同所属客群对应有不同的识别模型,因而各个识别模型的配置信息(即入参)也不相同,因此先获取对应识别模型的相应配置信息,根据配置信息的不同类型,通过预设的时间窗口对不同类型的配置信息计算各窗口内相应的统计变量。例如:对于配置信息中的数值型字段通过时间窗口计算求和、均值、分位数、最小值、最大值、标准差、变异系数等。对于配置信息中的分类型变量通过时间窗口计算主要类型的出现次数,出现类型的种类等。
需要说明的是,基于lightGBM模型,分别对各种客群进行机器学习,以训练得到对应的识别模型,进而构建识别模型引擎。也就是说,本发明实施例基于lightGBM模型,通过不同所属客群的历史数据进行机器学习,以训练得到对应的识别模型,进而构建识别模型引擎。其中,LigthGBM算法是一种集合算法,是对GBDT算法的高效实现,GBDT算法的主要思想是利用弱分类器(决策树)迭代训练以得到最优模型,而LigthGBM算法采用损失函数的负梯度作为当前决策树的残差近似值,去拟合新的决策树。
作为另一些实施例,本发明还可以调用识别模型的评价引擎,根据预设的评价模型和稳定性验证模型对各个客群对应的识别模型进行处理。待监控到处理结果不符合预设的目标条件时,触发模型训练程序,以对识别模型的参数进行调整。较佳的,预设的评价模型的指标主要有Gini和KS,都是衡量模型区分度的指标,对于区分度指标不好的模型,可通过调参进行优化。值得说明的是,调参仅可以使用训练数据,不允许使用测试数据。其中,Gini是用来评估评分卡模型能在多大程度上区分好坏。KS常用于衡量模型对正负样本的区分度。
另外,稳定性验证模型通过计量单位PSI来衡量,测试集和训练集可以按着等分数段进行划分,也可以等等分位数(即每组样本占比相同)进行划分。计算表示每组训练样本占总训练样本的比例,表示每组测试样本占总测试样本的比例,最后加总:ln(训练%/测试%)*(训练%-测试%)。PSI基准可参考如图2所示。
值得说明的是,还可以对识别模型业务效果评估,通过对模型业务效果分析,能够很好把握识别模型对未来业务的影响。基于建模数据,在评分下设置cut-off,使得cut-off之上客户群的房贷客户占比较高。
作为再一些实施例,基于构建的房贷精准营销模型,批量跑批筛选后的用户的模型结果,得到每个用户的识别模型得分,对用户办理房贷的可能性进行评价。本发明预先设置cut-off,将评分结果符合预设匹配条件(即在cut-off之上的评分结果)的用户数据推送至第三方营销平台进行精准营销。
综上所述,本发明房贷精准营销,缩小了营销范围,大大降低了营销所需耗费的成本,避免无效的营销信息容易引起用户反感,提高了营销效率。即只对大概率有房贷需求的客户进行营销,不骚扰过多的无关客户,避免对完全没有房贷需求的客户进行房贷相关的营销,减少给客户带来反感的情绪,避免丢失部分潜在客户。另外,本发明利用LightGbm的机器学习技术,基于多维度数据建立了房贷精准营销模型,可以预测房贷需求可能性高的客户,预测准确率高,错误率低,从而有针对性的制定营销策略。
图3是根据本发明第二实施例的用户识别方法的主要流程示意图,如图3所示,所述用户识别方法可以包括:通过调用预设的数据接口,从数据仓库中获取用户数据。然后调用预设的筛选组件,对获取的用户数据进行过滤(即对客户进行筛选),以生成待识别的用户数据。例如:筛除不满足房贷业务准入条件的客户,预设的筛选组件可以为:客户年龄为18-65周岁,客户成为行内客户至少半年以上,当前客户家庭未办理房贷业务(含申请流程中和已放款业务),非黑名单客户,在当前时点贷款以及***状态正常,行内贷款、***历史还款累计逾期不超过6期且无90天以上逾期记录,征信报告中贷款和***历史还款累计逾期不超过6期且无90天以上逾期记录等等。
基于所述用户数据,向征信数据库服务器发送数据请求,进而判断接收的处理结果是否存在第一目标属性值(例如:当前时间点3个月内有征信数据),若是则确定所属征信客群;若否则调用存储的第二目标属性表(例如:代发工资数据表),判断是否存在所述用户数据,如果是则确定所属代发工资客群,如果否则确定所属一般客群。匹配所属客群对应的识别模型(例如有征信客群模型、代发工资客群模型、一般客群模型),调用识别模型引擎,选取数据采集时点,以获取所述用户的历史数据,进而根据所述历史数据计算得到所述用户的评分结果,将评分结果大于或等于预设评分阈值的用户数据推送至第三方营销平台。较佳的,在调用识别模型引擎之前可以对入模特征进行加工,例如进行特征衍生。
本发明实施例基于lightGBM模型对于三个不同的训练测试集,分别利用筛选后的特征构建征信客群识别模型、代发工资客群识别模型和一般客群识别模型,并根据识别模型使用特征权重,删除没有进入模型、模型权重低以及不能解释的特征,重新迭代建模,从而学习到不同客户群特征的特点和差异,对客户申请房贷可能做出更精准的判断。如图4所示,需要对识别模型定义目标Y,房贷需求客户(y=1):客户及其配偶的个人征信信息中显示观察时点后半年内有办理“个人住房公积金贷款”或“个人住房贷款”或者观察时点后半年内客户在建行有审批通过的商业住房贷款或公积金贷款。同时客户及其配偶的个人征信信息中显示在观察时点之前没有申请过“个人住房公积金贷款”和“个人住房贷款”且观察时点前客户在在建行没有审批通过的商业住房贷款或公积金贷款。非房贷需求客户(y=0):客户和配偶(或无配偶)在观察时点半年之后有征信报告,同时观察时点前客户和配偶的个人征信信息中显示没有“个人住房公积金贷款”或“个人住房贷款”且观察时点前客户在建行没有审批通过的商业住房贷款或公积金贷款。
还有,分别建立三个客群的样本集合,为减少房贷业务的季节性影响,训练样本和测试样本抽取为每季度选择一个月月初作为观察时间点,总共4个观察时间点,在每个观察时间点抽3万样本用户(按1:5比例随机抽y=0和y=1的用户各25000人、5000人),每个客群的12万用户作为模型训练测试样本(其中训练集和测试集按7:3切分)。同时为验证模型效果,分别对三个客群建立验证样本,验证样本抽取在每季度选择一个月月初作为观察时间点,总共4个观察时间点,在每个观察时间点随机抽25万样本用户总共100万样本做为验证样本。另外,针对整体样本集的用户,获取客户行内的各类原始数据,包括客户基本信息、借记卡合约信息、借记卡账户信息、借记卡账户流水、AUM信息等多维度数据的用户数据。
需要说明的是,对样本进行特征衍生具体包括:针对数值类型的字段,并且每一个样本只有单一条记录时,比如年龄,学历等无需对该特征进行多值聚合,可以直接透传作为入模特征。对于分类型变量,通常会对不常见类型进行类型合并,如学生专业,公司类型,职业等,然后再透传。还可以对特征进行统计聚合:对行内AUM、交易信息、代发记录等特征,每个用户都可能有多条不同时间发生的流水记录。还有人行贷款明细、人行的住宅地址、职业信息、公积金信息等数据,都可以看作是流水型数据。对于这类流水特征,通常会划分不同的时间窗口计算各窗口内的统计变量,如对于数值型字段计算求和、均值、分位数、最小值、最大值、标准差、变异系数等。另外,也可以对特征进行交叉衍生:对于分类型变量计算主要类型的出现次数,出现类型的种类等。还可以将两个衍生特征进行交叉运算,得到一个新的特征,比如计算近6个月AUM环比增长月份数/AUM月份数。
之后,对衍生的样本进行特征筛选,即在不分客群的全量样本(开发训练集+开发测试集)上进行特征覆盖率及IV(Information Value)计算,用以评估特征对预测目标的有效性。并在分客群的开发训练集与开发测试集之间计算特征的PSI,用于评估特征的稳定性,其中IV、PSI解读如下:
IV:
小于0.02:几乎没有区分力
0.02~0.1:区分力较弱
0.1~0.3:中等区分力
大于0.3:强区分力
PSI:
小于0.1:分布变化不大
0.1~0.25:分布有较小变化
大于0.25:分布有较大变化
衍生特征的覆盖度及IV差异很大:对于覆盖度特别低的特征,即使iv数值很高,也很难确定是否偶然,其泛化能力会受到限制;PSI较高的特征在训练与测试集上的分布差距很大,说明其分布不够稳定,很难用这些特征构建泛化能力好的稳定模型;IV数值过低意味着特征与预测目标的关联度很低,放入模型中只会增加复杂度与噪音。所以需要根据这些指标,对特征进行初步筛选后进行建模。
值得说明的是,本发明还可以对构建的模型进行模型评价及调参、以及模型验证。具体地,调用识别模型的评价引擎,根据预设的评价模型和稳定性验证模型对各个客群对应的识别模型进行处理。待监控到处理结果不符合预设的目标条件时,触发模型训练程序,以对识别模型的参数进行调整。较佳的,预设的评价模型的指标主要有Gini和KS,都是衡量模型区分度的指标,对于区分度指标不好的模型,可通过调参进行优化。值得说明的是,调参仅可以使用训练数据,不允许使用测试数据。另外,稳定性验证模型通过计量单位PSI来衡量,测试集和训练集按分数化成1至20组,划分可以按着等分数段进行,也可以等等分位数(即每组样本占比相同)进行。计算表示每组训练样本占总训练样本的比例,表示每组测试样本占总测试样本的比例,最后加总:ln(训练%/测试%)*(训练%-测试%)。
图5是根据本发明实施例的用户识别装置的主要模块的示意图,如图5所示,所述用户识别装置包括获取模块501和处理模块502。其中,获取模块501通过调用预设的数据接口,从数据仓库中获取用户数据;处理模块502基于所述用户数据,根据预设的客群分类组件确定所属客群,以匹配所属客群对应的识别模型;调用识别模型引擎,选取数据采集时点,以获取所述用户的历史数据,进而根据所述历史数据计算得到所述用户的评分结果,将评分结果符合预设匹配条件的用户数据推送至第三方营销平台。
在一些实施例中,获取模块501通过调用预设的数据接口,从数据仓库中获取用户数据之后,包括:
调用预设的筛选组件,对获取的用户数据进行过滤,以生成待识别的用户数据。
在一些实施例中,处理模块502根据预设的客群分类组件确定所属客群,包括:
根据所述用户数据,向征信数据库服务器发送数据请求,进而判断接收的处理结果是否存在第一目标属性值,若是则确定所属第一客群;若否则调用存储的第二目标属性表,判断是否存在所述用户数据,如果是则确定所属第二客群,如果否则确定所属第三客群。
在一些实施例中,处理模块502获取所述用户的历史数据,包括:
根据所述识别模型,获取相应的配置信息,进而通过预设的时间窗口对不同类型的配置信息计算各窗口内相应的统计变量。
在一些实施例中,处理模块502,还用于:
基于lightGBM模型,分别对各种客群进行机器学习,以训练得到对应的识别模型,进而构建识别模型引擎。
作为本发明的另一些实施例,如图6所示,所述用户识别装置包括获取模块501、处理模块502和监控模块503。其中,获取模块501通过调用预设的数据接口,从数据仓库中获取用户数据;处理模块502基于所述用户数据,根据预设的客群分类组件确定所属客群,以匹配所属客群对应的识别模型;调用识别模型引擎,选取数据采集时点,以获取所述用户的历史数据,进而根据所述历史数据计算得到所述用户的评分结果,将评分结果符合预设匹配条件的用户数据推送至第三方营销平台。监控模块503调用识别模型的评价引擎,根据预设的评价模型和稳定性验证模型对各个客群对应的识别模型进行处理;待监控到处理结果不符合预设的目标条件时,触发模型训练程序,以对识别模型的参数进行调整。
需要说明的是,在本发明所述用户识别方法和所述用户识别装置在具体实施内容上具有相应关系,故重复内容不再说明。
图7示出了可以应用本发明实施例的用户识别方法或用户识别装置的示例性***架构700。
如图7所示,***架构700可以包括终端设备701、702、703,网络704和服务器705。网络704用以在终端设备701、702、703和服务器705之间提供通信链路的介质。网络704可以包括各种连接类型,例如有线、无线通信链路或者光纤电缆等等。
用户可以使用终端设备701、702、703通过网络704与服务器705交互,以接收或发送消息等。终端设备701、702、703上可以安装有各种通讯客户端应用,例如购物类应用、网页浏览器应用、搜索类应用、即时通信工具、邮箱客户端、社交平台软件等(仅为示例)。
终端设备701、702、703可以是具有用户识别屏并且支持网页浏览的各种电子设备,包括但不限于智能手机、平板电脑、膝上型便携计算机和台式计算机等等。
服务器705可以是提供各种服务的服务器,例如对用户利用终端设备701、702、703所浏览的购物类网站提供支持的后台管理服务器(仅为示例)。后台管理服务器可以对接收到的产品信息查询请求等数据进行分析等处理,并将处理结果(例如目标推送信息、产品信息--仅为示例)反馈给终端设备。
需要说明的是,本发明实施例所提供的用户识别方法一般由服务器705执行,相应地,计算装置一般设置于服务器705中。
应该理解,图7中的终端设备、网络和服务器的数目仅仅是示意性的。根据实现需要,可以具有任意数目的终端设备、网络和服务器。
下面参考图8,其示出了适于用来实现本发明实施例的终端设备的计算机***800的结构示意图。图8示出的终端设备仅仅是一个示例,不应对本发明实施例的功能和使用范围带来任何限制。
如图8所示,计算机***800包括中央处理单元(CPU)801,其可以根据存储在只读存储器(ROM)802中的程序或者从存储部分808加载到随机访问存储器(RAM)803中的程序而执行各种适当的动作和处理。在RAM803中,还存储有计算机***800操作所需的各种程序和数据。CPU801、ROM802以及RAM803通过总线804彼此相连。输入/输出(I/O)接口805也连接至总线804。
以下部件连接至I/O接口805:包括键盘、鼠标等的输入部分806;包括诸如阴极射线管(CRT)、液晶用户识别器(LCD)等以及扬声器等的输出部分807;包括硬盘等的存储部分808;以及包括诸如LAN卡、调制解调器等的网络接口卡的通信部分809。通信部分809经由诸如因特网的网络执行通信处理。驱动器810也根据需要连接至I/O接口805。可拆卸介质811,诸如磁盘、光盘、磁光盘、半导体存储器等等,根据需要安装在驱动器810上,以便于从其上读出的计算机程序根据需要被安装入存储部分808。
特别地,根据本发明公开的实施例,上文参考流程图描述的过程可以被实现为计算机软件程序。例如,本发明公开的实施例包括一种计算机程序产品,其包括承载在计算机可读介质上的计算机程序,该计算机程序包含用于执行流程图所示的方法的程序代码。在这样的实施例中,该计算机程序可以通过通信部分809从网络上被下载和安装,和/或从可拆卸介质811被安装。在该计算机程序被中央处理单元(CPU)801执行时,执行本发明的***中限定的上述功能。
需要说明的是,本发明所示的计算机可读介质可以是计算机可读信号介质或者计算机可读存储介质或者是上述两者的任意组合。计算机可读存储介质例如可以是——但不限于——电、磁、光、电磁、红外线、或半导体的***、装置或器件,或者任意以上的组合。计算机可读存储介质的更具体的例子可以包括但不限于:具有一个或多个导线的电连接、便携式计算机磁盘、硬盘、随机访问存储器(RAM)、只读存储器(ROM)、可擦式可编程只读存储器(EPROM或闪存)、光纤、便携式紧凑磁盘只读存储器(CD-ROM)、光存储器件、磁存储器件、或者上述的任意合适的组合。在本发明中,计算机可读存储介质可以是任何包含或存储程序的有形介质,该程序可以被指令执行***、装置或者器件使用或者与其结合使用。而在本发明中,计算机可读的信号介质可以包括在基带中或者作为载波一部分传播的数据信号,其中承载了计算机可读的程序代码。这种传播的数据信号可以采用多种形式,包括但不限于电磁信号、光信号或上述的任意合适的组合。计算机可读的信号介质还可以是计算机可读存储介质以外的任何计算机可读介质,该计算机可读介质可以发送、传播或者传输用于由指令执行***、装置或者器件使用或者与其结合使用的程序。计算机可读介质上包含的程序代码可以用任何适当的介质传输,包括但不限于:无线、电线、光缆、RF等等,或者上述的任意合适的组合。
附图中的流程图和框图,图示了按照本发明各种实施例的***、方法和计算机程序产品的可能实现的体系架构、功能和操作。在这点上,流程图或框图中的每个方框可以代表一个模块、程序段、或代码的一部分,上述模块、程序段、或代码的一部分包含一个或多个用于实现规定的逻辑功能的可执行指令。也应当注意,在有些作为替换的实现中,方框中所标注的功能也可以以不同于附图中所标注的顺序发生。例如,两个接连地表示的方框实际上可以基本并行地执行,它们有时也可以按相反的顺序执行,这依所涉及的功能而定。也要注意的是,框图或流程图中的每个方框、以及框图或流程图中的方框的组合,可以用执行规定的功能或操作的专用的基于硬件的***来实现,或者可以用专用硬件与计算机指令的组合来实现。
描述于本发明实施例中所涉及到的模块可以通过软件的方式实现,也可以通过硬件的方式来实现。所描述的模块也可以设置在处理器中,例如,可以描述为:一种处理器包括获取模块和处理模块。其中,这些模块的名称在某种情况下并不构成对该模块本身的限定。
作为另一方面,本发明还提供了一种计算机可读介质,该计算机可读介质可以是上述实施例中描述的设备中所包含的;也可以是单独存在,而未装配入该设备中。上述计算机可读介质承载有一个或者多个程序,当上述一个或者多个程序被一个该设备执行时,使得该设备包括通过调用预设的数据接口,从数据仓库中获取用户数据;基于所述用户数据,根据预设的客群分类组件确定所属客群,以匹配所属客群对应的识别模型;调用识别模型引擎,选取数据采集时点,以获取所述用户的历史数据,进而根据所述历史数据计算得到所述用户的评分结果,将评分结果符合预设匹配条件的用户数据推送至第三方营销平台。
根据本发明实施例的技术方案,能够解决现有房贷产品推荐精准度低、用户体验差,而且耗费人力物力的问题。
上述具体实施方式,并不构成对本发明保护范围的限制。本领域技术人员应该明白的是,取决于设计要求和其他因素,可以发生各种各样的修改、组合、子组合和替代。任何在本发明的精神和原则之内所作的修改、等同替换和改进等,均应包含在本发明保护范围之内。

Claims (12)

1.一种用户识别方法,其特征在于,包括:
通过调用预设的数据接口,从数据仓库中获取用户数据;
基于所述用户数据,根据预设的客群分类组件确定所属客群,以匹配所属客群对应的识别模型;
调用识别模型引擎,选取数据采集时点,以获取所述用户的历史数据,进而根据所述历史数据计算得到所述用户的评分结果,将评分结果符合预设匹配条件的用户数据推送至第三方营销平台;
其中,根据预设的客群分类组件确定所属客群,包括:
根据所述用户数据,向征信数据库服务器发送数据请求,进而判断接收的处理结果是否存在第一目标属性值,若是则确定所属第一客群;若否则调用存储的第二目标属性表,判断是否存在所述用户数据,如果是则确定所属第二客群,如果否则确定所属第三客群。
2.根据权利要求1所述的方法,其特征在于,通过调用预设的数据接口,从数据仓库中获取用户数据之后,包括:
调用预设的筛选组件,对获取的用户数据进行过滤,以生成待识别的用户数据。
3.根据权利要求1所述的方法,其特征在于,获取所述用户的历史数据,包括:
根据所述识别模型,获取相应的配置信息,进而通过预设的时间窗口对不同类型的配置信息计算各窗口内相应的统计变量。
4.根据权利要求1所述的方法,其特征在于,包括:
调用识别模型的评价引擎,根据预设的评价模型和稳定性验证模型对各个客群对应的识别模型进行处理;
待监控到处理结果不符合预设的目标条件时,触发模型训练程序,以对识别模型的参数进行调整。
5.根据权利要求1-4任一所述的方法,其特征在于,还包括:
基于lightGBM模型,分别对各种客群进行机器学习,以训练得到对应的识别模型,进而构建识别模型引擎。
6.一种用户识别装置,其特征在于,包括:
获取模块,用于通过调用预设的数据接口,从数据仓库中获取用户数据;
处理模块,用于基于所述用户数据,根据预设的客群分类组件确定所属客群,以匹配所属客群对应的识别模型;调用识别模型引擎,选取数据采集时点,以获取所述用户的历史数据,进而根据所述历史数据计算得到所述用户的评分结果,将评分结果符合预设匹配条件的用户数据推送至第三方营销平台;
其中,处理模块根据预设的客群分类组件确定所属客群,包括:
根据所述用户数据,向征信数据库服务器发送数据请求,进而判断接收的处理结果是否存在第一目标属性值,若是则确定所属第一客群;若否则调用存储的第二目标属性表,判断是否存在所述用户数据,如果是则确定所属第二客群,如果否则确定所属第三客群。
7.根据权利要求6所述的装置,其特征在于,获取模块通过调用预设的数据接口,从数据仓库中获取用户数据之后,包括:
调用预设的筛选组件,对获取的用户数据进行过滤,以生成待识别的用户数据。
8.根据权利要求6所述的装置,其特征在于,处理模块获取所述用户的历史数据,包括:
根据所述识别模型,获取相应的配置信息,进而通过预设的时间窗口对不同类型的配置信息计算各窗口内相应的统计变量。
9.根据权利要求6所述的装置,其特征在于,还包括:
监控模块,用于调用识别模型的评价引擎,根据预设的评价模型和稳定性验证模型对各个客群对应的识别模型进行处理;待监控到处理结果不符合预设的目标条件时,触发模型训练程序,以对识别模型的参数进行调整。
10.根据权利要求6-9任一所述的装置,其特征在于,处理模块,还用于:
基于lightGBM模型,分别对各种客群进行机器学习,以训练得到对应的识别模型,进而构建识别模型引擎。
11.一种电子设备,其特征在于,包括:
一个或多个处理器;
存储装置,用于存储一个或多个程序,
当所述一个或多个程序被所述一个或多个处理器执行,使得所述一个或多个处理器实现如权利要求1-5中任一所述的方法。
12.一种计算机可读介质,其上存储有计算机程序,其特征在于,所述程序被处理器执行时实现如权利要求1-5中任一所述的方法。
CN202110338740.6A 2021-03-30 2021-03-30 一种用户识别方法和装置 Active CN112950359B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202110338740.6A CN112950359B (zh) 2021-03-30 2021-03-30 一种用户识别方法和装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202110338740.6A CN112950359B (zh) 2021-03-30 2021-03-30 一种用户识别方法和装置

Publications (2)

Publication Number Publication Date
CN112950359A CN112950359A (zh) 2021-06-11
CN112950359B true CN112950359B (zh) 2022-06-28

Family

ID=76227473

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202110338740.6A Active CN112950359B (zh) 2021-03-30 2021-03-30 一种用户识别方法和装置

Country Status (1)

Country Link
CN (1) CN112950359B (zh)

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN114897099A (zh) * 2022-06-06 2022-08-12 上海淇玥信息技术有限公司 基于客群偏差平滑优化的用户分类方法、装置及电子设备
CN116468265A (zh) * 2023-03-23 2023-07-21 杭州瓴羊智能服务有限公司 批量用户数据处理方法和装置

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108765094A (zh) * 2018-06-06 2018-11-06 中国平安人寿保险股份有限公司 保险数据处理方法、装置、计算机设备和存储介质
CN111612519A (zh) * 2020-04-13 2020-09-01 广发证券股份有限公司 一种识别金融产品潜在客户的方法、装置及存储介质
CN112053237A (zh) * 2020-09-30 2020-12-08 中国银行股份有限公司 一种银行对公客户的工商信息识别方法、装置及设备
CN112464094A (zh) * 2020-11-30 2021-03-09 泰康保险集团股份有限公司 信息推荐方法、装置、电子设备及存储介质

Family Cites Families (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106600369A (zh) * 2016-12-09 2017-04-26 广东奡风科技股份有限公司 基于朴素贝叶斯分类的银行金融产品实时推荐***和方法
CN109670848A (zh) * 2018-09-11 2019-04-23 深圳平安财富宝投资咨询有限公司 基于大数据的客户细分方法、用户设备、存储介质及装置
CN109598535A (zh) * 2018-11-05 2019-04-09 宁波大红鹰学院 一种基于大数据对分布式光伏客户分类的方法及***
CN111626766A (zh) * 2020-04-23 2020-09-04 深圳索信达数据技术有限公司 一种融合多个机器学习模型的手机银行营销客户筛选方法
CN111563628A (zh) * 2020-05-09 2020-08-21 重庆锐云科技有限公司 房地产客户成交时间预测方法、装置及存储介质
CN112541817A (zh) * 2020-12-22 2021-03-23 建信金融科技有限责任公司 一种个人消费贷款潜在客户的营销响应处理方法及***

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108765094A (zh) * 2018-06-06 2018-11-06 中国平安人寿保险股份有限公司 保险数据处理方法、装置、计算机设备和存储介质
CN111612519A (zh) * 2020-04-13 2020-09-01 广发证券股份有限公司 一种识别金融产品潜在客户的方法、装置及存储介质
CN112053237A (zh) * 2020-09-30 2020-12-08 中国银行股份有限公司 一种银行对公客户的工商信息识别方法、装置及设备
CN112464094A (zh) * 2020-11-30 2021-03-09 泰康保险集团股份有限公司 信息推荐方法、装置、电子设备及存储介质

Also Published As

Publication number Publication date
CN112950359A (zh) 2021-06-11

Similar Documents

Publication Publication Date Title
CN112561685B (zh) 客户的分类方法和装置
CN112950359B (zh) 一种用户识别方法和装置
CN113627566A (zh) 一种网络诈骗的预警方法、装置和计算机设备
CN114186626A (zh) 一种异常检测方法、装置、电子设备及计算机可读介质
CN111080178A (zh) 一种风险监控方法和装置
CN114078050A (zh) 贷款逾期预测方法、装置、电子设备及计算机可读介质
CN110866698A (zh) 用于评定服务提供方的服务分值的装置
CN115545886A (zh) 逾期风险识别方法、装置、设备及存储介质
CN111245815B (zh) 数据处理方法、装置、存储介质及电子设备
Wang Research on bank marketing behavior based on machine learning
CN114092230A (zh) 一种数据处理方法、装置、电子设备及计算机可读介质
CN112990311A (zh) 一种准入客户的识别方法和装置
CN113450208A (zh) 贷款风险变动预警、模型训练方法和装置
CN114626940A (zh) 数据分析方法、装置及电子设备
CN114493851A (zh) 一种风险处理方法及装置
CN114880369A (zh) 一种基于弱数据技术的风险授信方法和***
CN112734352A (zh) 一种基于数据维度的单据审核方法和装置
CN111429257A (zh) 一种交易监控方法和装置
CN117974297A (zh) 一种业务处理方法、装置、电子设备及计算机可读介质
CN113034270A (zh) 信贷风险预警方法和装置
CN115953023A (zh) 物品归属方收款限额的方法、装置、设备、介质及产品
CN115062698A (zh) 用户识别方法、装置、设备及介质
CN114066513A (zh) 一种用户分类的方法和装置
CN115496590A (zh) 处理授信数据的方法、装置、电子设备和计算机可读介质
CN112580971A (zh) 一种对外部机构评级的有效性核查的方法和装置

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant
TR01 Transfer of patent right

Effective date of registration: 20220926

Address after: 25 Financial Street, Xicheng District, Beijing 100033

Patentee after: CHINA CONSTRUCTION BANK Corp.

Address before: 12 / F, 15 / F, No. 99, Yincheng Road, Shanghai pilot Free Trade Zone, 200120

Patentee before: Jianxin Financial Science and Technology Co.,Ltd.

TR01 Transfer of patent right