CN110188796A - 用户识别方法、装置、存储介质和处理器 - Google Patents

用户识别方法、装置、存储介质和处理器 Download PDF

Info

Publication number
CN110188796A
CN110188796A CN201910339945.9A CN201910339945A CN110188796A CN 110188796 A CN110188796 A CN 110188796A CN 201910339945 A CN201910339945 A CN 201910339945A CN 110188796 A CN110188796 A CN 110188796A
Authority
CN
China
Prior art keywords
multidimensional
user
numerical
data
characteristic
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201910339945.9A
Other languages
English (en)
Inventor
李刚毅
文诗奇
李玮巍
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
BEYONDSOFT Corp
Original Assignee
BEYONDSOFT Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by BEYONDSOFT Corp filed Critical BEYONDSOFT Corp
Priority to CN201910339945.9A priority Critical patent/CN110188796A/zh
Publication of CN110188796A publication Critical patent/CN110188796A/zh
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/906Clustering; Classification
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/953Querying, e.g. by the use of web search engines
    • G06F16/9535Search customisation based on user profiles and personalisation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/24Classification techniques

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Databases & Information Systems (AREA)
  • Data Mining & Analysis (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Artificial Intelligence (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Evolutionary Biology (AREA)
  • Evolutionary Computation (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明公开了一种用户识别方法、装置、存储介质和处理器。其中,该方法包括:获取用户的多维特征信息;将多维特征信息转换为多维数组,其中,多维数组中的数值处于预定取值区间内;根据预定机器学习模型对多维数组进行分析,识别多维数组对应的用户类型,其中,该预定机器学习模型为通过机器学习对至少一组训练数据进行训练得到的,每组训练数据包括:多维数组和多维数组对应的用户类型。本发明解决了传统机器学习算法在进行用户分类时特征提取困难、不准确,学习效率低下,且容易过拟合的技术问题。

Description

用户识别方法、装置、存储介质和处理器
技术领域
本发明涉及计算机领域,具体而言,涉及一种用户识别方法、装置、存储介质和处理器。
背景技术
在大数据背景下,可以根据用户的历史信息进行分析,并根据分析结果构建精确的用户分类,分析用户的消费能力,向用户推荐用户感兴趣的商品,从而进行有针对性的商品销售。
传统的用户分类过程数据特征提取困难、不准确,学习效率低下、易于过拟合。
针对上述传统机器学习算法在进行用户分类时特征提取困难、不准确,学习效率低下,且容易过拟合的问题,目前尚未提出有效的解决方案。
针对上述传统机器学习算法在进行用户分类时特征提取困难、不准确,学习效率低下,且容易过拟合的问题,目前尚未提出有效的解决方案。
发明内容
本发明实施例提供了一种用户识别方法、装置、存储介质和处理器,以至少解决传统机器学习算法在进行用户分类时特征提取困难、不准确,学习效率低下,且容易过拟合的技术问题。
根据本发明实施例的一个方面,提供了一种用户识别方法,包括:获取用户的多维特征信息;将所述多维特征信息转换为多维数组,其中,所述多维数组中的数值处于预定取值区间内;根据预定机器学习模型对所述多维数组进行分析,识别所述多维数组对应的用户类型,其中,所述预定机器学习模型为通过机器学习对至少一组训练数据进行训练得到的,每组所述训练数据包括:多维数组和多维数组对应的用户类型。
进一步地,所述多维特征信息包括:第一特征信息、第二特征信息和第三特征信息,将所述多维特征信息转换为多维数组包括:根据所述第一特征信息和所述第二特征信息确定所述多维数组的平面尺寸;根据所述第三特征信息确定所述多维数组的深度。
进一步地,获取用户的多维特征信息包括:获取所述用户的历史活跃数据,其中,所述历史活跃数据至少包括:时间信息、特征类型、和用户在不同时间,针对不同特征类型的多个特征参数;过滤所述历史活跃数据中的无效数据,并筛选所述特征参数,得到所述多维特征信息。
进一步地,获取所述用户的历史活跃数据之后,所述方法还包括:根据所述时间信息和所述特征参数的统计分布特征对所述历史活跃数据进行归一化处理,得到归一化数据,其中,所述归一化数据用于表示所述用户基于同一时间线,针对不同特征类型的特征参数。
根据本发明实施例的另一个方面,还提供了一种用户识别装置,包括:获取单元,用于获取用户的多维特征信息;转换单元,用于将所述多维特征信息转换为多维数组,其中,所述多维数组中的数值处于预定取值区间内;识别单元,用于根据预定机器学习模型对所述多维数组进行分析,识别所述多维数组对应的用户类型,其中,所述预定机器学习模型为通过机器学习对至少一组训练数据进行训练得到的,每组所述训练数据包括:多维数组和多维数组对应的用户类型。
进一步地,所述多维特征信息包括:第一特征信息、第二特征信息和第三特征信息,所述转换单元包括:第一确定模块,用于根据所述第一特征信息和所述第二特征信息确定所述多维数组的平面尺寸;第二确定模块,用于根据所述第三特征信息确定所述多维数组的深度。
进一步地,所述获取单元包括:第一获取模块,用于获取所述用户的历史活跃数据,其中,所述历史活跃数据至少包括:时间信息、特征类型、和用户在不同时间,针对不同特征类型的多个特征参数;过滤模块,用于过滤所述历史活跃数据中的无效数据,并筛选所述特征参数,得到所述多维特征信息。
进一步地,所述装置还包括:处理模块,用于在获取所述用户的历史活跃数据之后,根据所述时间信息和所述特征参数的统计分布特征对所述历史活跃数据进行归一化处理,得到归一化数据,其中,所述归一化数据用于表示所述用户基于同一时间线,针对不同特征类型的特征参数。
根据本发明实施例的另一个方面,还提供了一种存储介质,所述存储介质包括存储的程序,其中,在所述程序运行时控制所述存储介质所在设备执行上述所述的用户识别方法。
根据本发明实施例的另一个方面,还提供了一种处理器,所述处理器用于运行程序,其中,所述程序运行时执行上述所述的用户识别方法。
根据本发明实施例的另一个方面,还提供了一种存储介质,所述存储介质包括存储的程序,其中,在所述程序运行时控制所述存储介质所在设备执行上述所述的用户识别方法。
根据本发明实施例的另一个方面,还提供了一种处理器,所述处理器用于运行程序,其中,所述程序运行时执行上述所述的用户识别方法。
在本发明实施例中,从多个维度获取用户的多维特征信息,再对获取的多维特征信息进行复合处理,将多维特征信息转化为通过数值表示多维数组,且多为数组中的数值处于预定取值区间内,然后使用预先训练得到的预定机器学习模型对多维数组进行分析,识别多维数组对应的用户类型,从而实现了对用户类型进行准确识别的技术效果,进而解决了传统机器学习算法在进行用户分类时特征提取困难、不准确,学习效率低下,且容易过拟合的技术问题。
附图说明
此处所说明的附图用来提供对本发明的进一步理解,构成本申请的一部分,本发明的示意性实施例及其说明用于解释本发明,并不构成对本发明的不当限定。在附图中:
图1是根据本发明实施例的一种用户识别方法的流程图;
图2是根据本发明实施例的一种用户活跃时间段的示意图;
图3是根据本发明实施例的一种归一化用户时间线的示意图;
图4是根据本发明实施例的一种用户识别***的示意图;
图5是根据本发明实施例的一种数据特征评估组件的流程的示意图;
图6是根据本发明实施例的一种矩阵生成及可视化模块的流程的示意图;
图7是根据本发明实施例的一种三维数组的示意图;
图8是根据本发明实施例的一种用户识别装置的示意图。
具体实施方式
为了使本技术领域的人员更好地理解本发明方案,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分的实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都应当属于本发明保护的范围。
需要说明的是,本发明的说明书和权利要求书及上述附图中的术语“第一”、“第二”等是用于区别类似的对象,而不必用于描述特定的顺序或先后次序。应该理解这样使用的数据在适当情况下可以互换,以便这里描述的本发明的实施例能够以除了在这里图示或描述的那些以外的顺序实施。此外,术语“包括”和“具有”以及他们的任何变形,意图在于覆盖不排他的包含,例如,包含了一系列步骤或单元的过程、方法、***、产品或设备不必限于清楚地列出的那些步骤或单元,而是可包括没有清楚地列出的或对于这些过程、方法、产品或设备固有的其它步骤或单元。
根据本发明实施例,提供了一种用户识别方法实施例,需要说明的是,在附图的流程图示出的步骤可以在诸如一组计算机可执行指令的计算机***中执行,并且,虽然在流程图中示出了逻辑顺序,但是在某些情况下,可以以不同于此处的顺序执行所示出或描述的步骤。
图1是根据本发明实施例的一种用户识别方法的流程图,如图1所示,该方法包括如下步骤:
步骤S102,获取用户的多维特征信息;
步骤S104,将多维特征信息转换为多维数组,其中,多维数组中的数值处于预定取值区间内;
步骤S106,根据预定机器学习模型对多维数组进行分析,识别多维数组对应的用户类型,其中,预定机器学习模型为通过机器学习对至少一组训练数据进行训练得到的,每组训练数据包括:多维数组和多维数组对应的用户类型。
通过上述步骤,从多个维度获取用户的多维特征信息,再对获取的多维特征信息进行复合处理,将多维特征信息转化为通过数值表示多维数组,且多为数组中的数值处于预定取值区间内,然后使用预先训练得到的预定机器学习模型对多维数组进行分析,识别多维数组对应的用户类型,从而实现了对用户类型进行准确识别的技术效果,进而解决了传统机器学习算法在进行用户分类时特征提取困难、不准确,学习效率低下,且容易过拟合的技术问题。
可选地,在训练机器学习模型前,可以获取多组用户的历史数据样本,并为多组用户的历史数据样本添加用户类型的标签,然后对用户的历史数据样本进行预处理和筛选,在多组用户中筛选目标用户群体,过滤历史数据样本中的无效数据,并对历史数据样本进行用户特征的筛选,得到多组用户的多维特征信息,然后对多组用户的多维特征信息进行转换,得到多组用户对应的多维数组,从而根据多组用户的历史数据样本,可以得到多组用户已知的多维数组和多维数组对应的用户类型,并将多维数组和多维数组对应的用户类型作为训练数据进行训练,得到机器学习模型。
需要说明的是,机器学习模型可以基于卷积神经网络建立。
需要说明的是,卷积神经网络在图像识别领域的应用比较成熟,可以针对不同颜色模式的图像进行机器学习。
可选地,颜色模式至少包括:RGB模式、CMYK模式、HSB模式、Lab颜色模式、位图模式、灰度模式、索引颜色模式、双色调模式和多通道模式,其中,各种颜色模式通过对应的多维数组来描述图像。
例如,RGB模式可以通过红色R、绿色G和蓝色B三个维度来描述图像。
可选地,在将将多维特征信息转换为多维数组的过程中,可以将多维特征信息转换为上述颜色模式形式的多维数组,且多维数组中每个维度的取值符合该颜色模式的数值要求。
接下来以RGB颜色模式为例,将所述多维特征信息转换为RGB颜色模式对应的多维数组,进行详细说明:
需要说明的是,虽然在这里使用RGB颜色模式作为说明,应当理解,这是为了便于理解。本发明的实施例并不局限于采用RGB的三层通道的数据结构,理论上可以采用任意层数的数据结构(即任意的第三维度取值)。
其中,用于识别的图像可以通过RGB色彩模式表示。
作为一种可选的实施例,在多维特征信息转换的多维数组为RGB颜色模式的多维数组的情况下,多维数组中每个维度的预定取值区间为0-255的数值区间。
需要说明的是,RGB颜色模式,可以通过红色R、绿色G和蓝色B,以及三种颜色对应的亮度值(或强度值),表示图像中每个像素的颜色,其中,每种颜色的亮度值(或强度值)为0-255的数值区间。
本发明上述实施例,设置预定取值区间为0-255,在将用户的多维特征信息转换为多维数组的过程中,可以将多维特征信息转换成类似图像文件的单通道或多通道数组,分别通过第一数值、第二数值和第三数值表示的三维数组的各维度数值,然后可以基于图像识别技术对多维特征信息转换的多维数组进行机器学习,从而可以基于多个维度对用户类型进行准确识别。
可选地,在将多维特征信息转换成多维数组的情况下,若某一特征信息无法转换为数值形式(如某一特征信息缺失),则用-255填充该特征信息对应的数值。
作为一种可选的实施例,多维特征信息包括:第一特征信息、第二特征信息和第三特征信息,将多维特征信息转换为多维数组包括:根据第一特征信息和第二特征信息确定多维数组的平面尺寸;根据第三特征信息确定多维数组的深度。
例如,第一特征信息表示用户活跃的时间信息;第二特征信息可以表示用户活跃的特征类型(如服务或产品);第三特征信息可以表示用户的特征参数(如使用量、使用金额、使用时长等不同特征)。
作为一种可选的实施例,获取用户的多维特征信息包括:获取用户的历史活跃数据,其中,历史活跃数据至少包括:时间信息、特征类型、和用户在不同时间,针对不同特征类型的特征参数;过滤历史活跃数据中的无效数据,并筛选特征参数,得到多维特征信息。
可选地,可以根据数据分布情况和人为决策选择特征参数,同时通过人为决策或关联分析对特征参数进行排序。
本发明上述实施例,历史活跃数据至少包括:时间信息、特征类型、和用户在不同时间,针对不同特征类型的特征参数,在获取用户的历史活跃数据后,可以过滤历史活跃数据中的无效数据,并对历史数据中的多个特征参数进行筛选,可以得到该用户的多维特征信息。
作为一种可选的实施例,获取用户的历史活跃数据之后,方法还包括:根据时间信息和所述特征参数的统计分布特征对历史活跃数据进行归一化处理,得到归一化数据,其中,归一化数据用于表示用户基于同一时间线,针对不同特征类型的特征参数。
本发明还提供了一种优选实施例,该优选实施例提供了一种基于卷积神经网络的***识别方法。
本发明提供的技术方案,是基于卷积神经网络(深度学习)的用户分类技术,利用卷积特性在提取特征时考虑了不同特征间的连续性和相关性,区别于传统用户分类方法,是特定在为计算机视觉,自然语言处理等领域的一种分析和分类方法。
本发明提供的技术方案,用于多维平行特征用户的预测分析,将用户的历史数据转换为类似于图像文件的多维数组,从而以利用基于图像识别的深度学习方法进行***分类筛选,适用于为用户同时提供多种服务的电信,保险,银行,云服务等行业对用户进行分类或为某种关键业务寻找潜在客户。
可选地,用户的历史数据包括时序历史数据,可以将时序历史数据的时间从绝对时间转换为相对时间。
图2是根据本发明实施例的一种用户活跃时间段的示意图,如图2所示,用户A的活跃起止时间为2015年2月至2017年2月,用户B的活跃起止时间为2015年9月至2018年4月,用户C的活跃起止时间为2016年1月至2017年4月。
图3是根据本发明实施例的一种归一化用户时间线的示意图,如图3所示,对图2所示的用户活跃时间段进行归一化处理,可以确定用户A的活跃时间持续24个月,用户B的活跃时间持续32个月,用户C的活跃时间持续15个月。
图4是根据本发明实施例的一种用户识别***的示意图,如图4所示,包括:数据提取及预处理模块41,矩阵生成及可视化模块43,和训练模块45。
其中,数据提取及预处理模块41包括:数据特征评估组件411;矩阵生成及可视化模块43,包括:数据转化及可视化组件431;训练模块45包括:数据处理组件451和模型训练组件453。
图5是根据本发明实施例的一种数据特征评估组件的流程的示意图,如图5所示,包括如下步骤:
步骤S502,根据需求筛选目标用户,并根据数据分布情况和人为决策选择特征参数,同时通过人为决策或关联分析对特征参数进行排序,得到各用户不同时间点不同特征参数的值,并统一所有用户的时间线。
可选地,特征参数可以是服务使用单位,消费金额,优惠额度等。
步骤S504,对所选择的用户和特征参数的数据进行数据清洗和填充,并根据各个或者全部用户的数据分布进行数据一般化处理。
步骤S506,根据用户时序数据中预测对象(目标特征)出现点的统计情况决定提取有效历史数据的范围,排除无有效历史数据或无历史数据的用户。
需要说明的是,各用户的有效历史数据在标准化时间线上的范围和长度可不同,但须位于各自目标特征出现之前,且长度不得超过最大规定值。
图6是根据本发明实施例的一种矩阵生成及可视化模块的流程的示意图,如图6所示,包括如下步骤:
步骤S602,将用户历史数据的数值转换成数字格式,并规范化转换到0-255的数值区间;将经过处理的用户历史数据转换成类似于图像文件的多维数组。
例如,所采样用户分别在6-24个月内总共使用了100种不同的服务,则将归一化时间作为三维数组的x轴,将排序后的服务名称作为三维数组的y轴,将用量,消费额,折扣额等特征作为三维数组的z轴。
步骤S604,利用seaborn等工具对单个用户矩阵或所有用户矩阵叠加形成的矩阵进行可视化,从而对不同用户或不同特征的变化特征一目了然。
图7是根据本发明实施例的一种三维数组的示意图,如图7所示,以月份作为三维数组的x轴,以服务名称作为三维数组的y轴,以特征1-6中的任意一项特征作为z轴建立三维数组。
可选地,数据处理组件,用于将所得用户数据矩阵(即多维数组)按照目标特征的值添加标签,统计正负标签样本的数量及比例,若比例严重失衡,则适度调整训练集正负标签样本数量及比例,同时在测试集中保持原始数据比例,以确保训练结果的可靠性和实用性。
可选地,模型训练组件,可以在经过数据处理组件进行样本集合的训练集和测试集划分后建立卷积神经网络(即预定机器学习模型)对用户分类。
需要说明的是,卷积神经网络的主要用于空间领域上的特征挖掘,典型应用为图像识别和检索,人脸识别,物体检测等,而本发明考虑到用户使用产品或服务上可能存在的时间相关性以及不同产品或服务之间的固有关联性,利用卷积神经网络便于提取不同节点间所包含的隐藏信息这一优势高效提供了较为高效的用户预测与识别方案。其中所述的卷积神经网络模型包括输入层、卷积层、池化层、全连接层和输出层。其中池化层采用最大值池化或平均值池化来保留局部特征中的重要信息,全连层之间采用ReLU激活函数,输出层采用Softmax激活函数,用以表示二维输出取值的概率,即用户是否为***的概率,进而对输入用户是否为目标产品或服务的***进行二元分类,同时得到该神经网络的分类预测准确率,评价指标为预测结果相对样本标签的精确率和召回率。
需要说明的是,ReLU激活函数即为线性整流函数(线性整流单元),可以通过公式表示为:f(x)=max(0,x)。
需要说明的是,Softmax激活函数,即归一化指数函数,可以通过公式表示为:其中,i=1,...,K,z=(z1,…,zK)∈RK
本发明提供的技术方案,利用了卷积神经网络特征提取的优势,让复杂冗余的参数特征之间的关联性和隐藏关系得以充分利用。同时,由于卷积神经网络运用单一固定的滤波器(核心),模型参数及训练模型耗时大幅减小,相较全连接型神经网络具有效率上的优势。
本发明提供的技术方案,是对传统用户预测方法集的一个补充和创新,巧妙结合并运用了不同层面的多重用户历史数据,利于发掘数据在不同角度的关联性;在使用维度更高、信息量更大的数据进行预测的同时还能保证模型的高效性。此外,训练神经网络模型的输入数据矩阵便于可视化,能从视觉的角度上展现关键的息,方便高效。
根据本发明的又一个实施例,还提供了一种存储介质,存储介质包括存储的程序,其中,程序运行时执行上述任一项的方法。
根据本发明的又一个实施例,还提供了一种处理器,处理器用于运行程序,其中,程序运行时执行上述任一项的方法。
根据本发明实施例,还提供了一种用户识别装置实施例,需要说明的是,该用户识别装置可以用于执行本发明实施例中的用户识别方法,本发明实施例中的用户识别方法可以在该用户识别装置中执行。
图8是根据本发明实施例的一种用户识别装置的示意图,如图8所示,该装置可以包括:获取单元81,用于获取用户的多维特征信息;转换单元83,用于将多维特征信息转换为多维数组,其中,多维数组中的数值处于预定取值区间内;识别单元85,用于根据预定机器学习模型对多维数组进行分析,识别多维数组对应的用户类型,其中,预定机器学习模型为通过机器学习对至少一组训练数据进行训练得到的,每组训练数据包括:多维数组和多维数组对应的用户类型。
需要说明的是,该实施例中的获取单元81可以用于执行本申请实施例中的步骤S102,该实施例中的转换单元83可以用于执行本申请实施例中的步骤S104,该实施例中的识别单元85可以用于执行本申请实施例中的步骤S106。上述单元与对应的步骤所实现的示例和应用场景相同,但不限于上述实施例所公开的内容。
在本发明实施例中,从多个维度获取用户的多维特征信息,再对获取的多维特征信息进行复合处理,将多维特征信息转化为通过数值表示多维数组,且多为数组中的数值处于预定取值区间内,然后使用预先训练得到的预定机器学习模型对多维数组进行分析,识别多维数组对应的用户类型,从而实现了对用户类型进行准确识别的技术效果,进而解决了传统机器学习算法在进行用户分类时特征提取困难、不准确,学习效率低下,且容易过拟合的技术问题。
作为一种可选的实施例,预定取值区间为0-255的数值区间。
作为一种可选的实施例,多维特征信息包括:第一特征信息、第二特征信息和第三特征信息,转换单元包括:第一确定模块,用于根据第一特征信息和第二特征信息确定多维数组的平面尺寸;第二确定模块,用于根据第三特征信息确定多维数组的深度。
作为一种可选的实施例,获取单元包括:第一获取模块,用于获取用户的历史活跃数据,其中,历史活跃数据至少包括:时间信息、特征类型、和用户在不同时间,针对不同特征类型的多个特征参数;过滤模块,用于过滤历史活跃数据中的无效数据,并筛选特征参数,得到多维特征信息。
作为一种可选的实施例,装置还包括:处理模块,用于在获取用户的历史活跃数据之后,根据时间信息和所述特征参数的统计分布特征对历史活跃数据进行归一化处理,得到归一化数据,其中,归一化数据用于表示用户基于同一时间线,针对不同特征类型的特征参数。
上述本发明实施例序号仅仅为了描述,不代表实施例的优劣。
在本发明的上述实施例中,对各个实施例的描述都各有侧重,某个实施例中没有详述的部分,可以参见其他实施例的相关描述。
在本申请所提供的几个实施例中,应该理解到,所揭露的技术内容,可通过其它的方式实现。其中,以上所描述的装置实施例仅仅是示意性的,例如所述单元的划分,可以为一种逻辑功能划分,实际实现时可以有另外的划分方式,例如多个单元或组件可以结合或者可以集成到另一个***,或一些特征可以忽略,或不执行。
所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。
另外,在本发明各个实施例中的各功能单元可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中。上述集成的单元既可以采用硬件的形式实现,也可以采用软件功能单元的形式实现。
所述集成的单元如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的全部或部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可为个人计算机、服务器或者网络设备等)执行本发明各个实施例所述方法的全部或部分步骤。而前述的存储介质包括:U盘、只读存储器(ROM,Read-Only Memory)、随机存取存储器(RAM,Random Access Memory)、移动硬盘、磁碟或者光盘等各种可以存储程序代码的介质。
以上所述仅是本发明的优选实施方式,应当指出,对于本技术领域的普通技术人员来说,在不脱离本发明原理的前提下,还可以做出若干改进和润饰,这些改进和润饰也应视为本发明的保护范围。

Claims (10)

1.一种用户识别方法,其特征在于,包括:
获取用户的多维特征信息;
将所述多维特征信息转换为多维数组,其中,所述多维数组中的数值处于预定取值区间内;
根据预定机器学习模型对所述多维数组进行分析,识别所述多维数组对应的用户类型,其中,所述预定机器学习模型为通过机器学习对至少一组训练数据进行训练得到的,每组所述训练数据包括:多维数组和多维数组对应的用户类型。
2.根据权利要求1所述的方法,其特征在于,所述多维特征信息包括:第一特征信息、第二特征信息和第三特征信息,将所述多维特征信息转换为多维数组包括:
根据所述第一特征信息和所述第二特征信息确定所述多维数组的平面尺寸;
根据所述第三特征信息确定所述多维数组的深度。
3.根据权利要求1所述的方法,其特征在于,获取用户的多维特征信息包括:
获取所述用户的历史活跃数据,其中,所述历史活跃数据至少包括:时间信息、特征类型、和用户在不同时间,针对不同特征类型的多个特征参数;
过滤所述历史活跃数据中的无效数据,并筛选所述特征参数,得到所述多维特征信息。
4.根据权利要求3所述的方法,其特征在于,获取所述用户的历史活跃数据之后,所述方法还包括:
根据所述时间信息和所述特征参数的统计分布特征对所述历史活跃数据进行归一化处理,得到归一化数据,其中,所述归一化数据用于表示所述用户基于同一时间线,针对不同特征类型的特征参数。
5.一种用户识别装置,其特征在于,包括:
获取单元,用于获取用户的多维特征信息;
转换单元,用于将所述多维特征信息转换为多维数组,其中,所述多维数组中的数值处于预定取值区间内;
识别单元,用于根据预定机器学习模型对所述多维数组进行分析,识别所述多维数组对应的用户类型,其中,所述预定机器学习模型为通过机器学习对至少一组训练数据进行训练得到的,每组所述训练数据包括:多维数组和多维数组对应的用户类型。
6.根据权利要求5所述的装置,其特征在于,所述多维特征信息包括:第一特征信息、第二特征信息和第三特征信息,所述转换单元包括:
第一确定模块,用于根据所述第一特征信息和所述第二特征信息确定所述多维数组的平面尺寸;
第二确定模块,用于根据所述第三特征信息确定所述多维数组的深度。
7.根据权利要求5所述的装置,其特征在于,所述获取单元包括:
第一获取模块,用于获取所述用户的历史活跃数据,其中,所述历史活跃数据至少包括:时间信息、特征类型、和用户在不同时间,针对不同特征类型的多个特征参数;
过滤模块,用于过滤所述历史活跃数据中的无效数据,并筛选所述特征参数,得到所述多维特征信息。
8.根据权利要求7所述的装置,其特征在于,所述装置还包括:
处理模块,用于在获取所述用户的历史活跃数据之后,根据所述时间信息和所述特征参数的统计分布特征对所述历史活跃数据进行归一化处理,得到归一化数据,其中,所述归一化数据用于表示所述用户基于同一时间线,针对不同特征类型的特征参数。
9.一种存储介质,其特征在于,所述存储介质包括存储的程序,其中,所述程序执行权利要求1至4中任意一项所述的用户识别方法。
10.一种处理器,其特征在于,所述处理器用于运行程序,其中,所述程序运行时执行权利要求1至4中任意一项所述的用户识别方法。
CN201910339945.9A 2019-04-25 2019-04-25 用户识别方法、装置、存储介质和处理器 Pending CN110188796A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201910339945.9A CN110188796A (zh) 2019-04-25 2019-04-25 用户识别方法、装置、存储介质和处理器

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201910339945.9A CN110188796A (zh) 2019-04-25 2019-04-25 用户识别方法、装置、存储介质和处理器

Publications (1)

Publication Number Publication Date
CN110188796A true CN110188796A (zh) 2019-08-30

Family

ID=67715065

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201910339945.9A Pending CN110188796A (zh) 2019-04-25 2019-04-25 用户识别方法、装置、存储介质和处理器

Country Status (1)

Country Link
CN (1) CN110188796A (zh)

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111046739A (zh) * 2019-11-14 2020-04-21 京东数字科技控股有限公司 一种操作熟练度识别方法、装置及存储介质
CN111401433A (zh) * 2020-03-12 2020-07-10 腾讯科技(深圳)有限公司 用户信息获取方法、装置、电子设备及存储介质
CN111967971A (zh) * 2020-08-18 2020-11-20 中国银行股份有限公司 银行客户数据处理方法及装置
CN112580681A (zh) * 2019-09-30 2021-03-30 北京星选科技有限公司 用户分类方法、装置、电子设备及可读存储介质
WO2021135842A1 (zh) * 2020-01-02 2021-07-08 ***通信有限公司研究院 群体不满意用户识别方法、装置、设备及存储介质
WO2021164232A1 (zh) * 2020-02-17 2021-08-26 平安科技(深圳)有限公司 用户识别方法、装置、设备及存储介质

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105354277A (zh) * 2015-10-30 2016-02-24 中国船舶重工集团公司第七0九研究所 一种基于递归神经网络的推荐方法及***
CN106777024A (zh) * 2016-12-08 2017-05-31 北京小米移动软件有限公司 识别恶意用户的方法及装置
US20170230394A1 (en) * 2013-12-19 2017-08-10 Intel Corporation Protection system including machine learning snapshot evaluation
CN107437095A (zh) * 2017-07-24 2017-12-05 腾讯科技(深圳)有限公司 类别确定方法及装置
CN107705155A (zh) * 2017-10-11 2018-02-16 北京三快在线科技有限公司 一种消费能力预测方法、装置、电子设备及可读存储介质
CN108549685A (zh) * 2018-04-08 2018-09-18 武志学 行为分析方法、装置、***及可读存储介质

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20170230394A1 (en) * 2013-12-19 2017-08-10 Intel Corporation Protection system including machine learning snapshot evaluation
CN105354277A (zh) * 2015-10-30 2016-02-24 中国船舶重工集团公司第七0九研究所 一种基于递归神经网络的推荐方法及***
CN106777024A (zh) * 2016-12-08 2017-05-31 北京小米移动软件有限公司 识别恶意用户的方法及装置
CN107437095A (zh) * 2017-07-24 2017-12-05 腾讯科技(深圳)有限公司 类别确定方法及装置
CN107705155A (zh) * 2017-10-11 2018-02-16 北京三快在线科技有限公司 一种消费能力预测方法、装置、电子设备及可读存储介质
CN108549685A (zh) * 2018-04-08 2018-09-18 武志学 行为分析方法、装置、***及可读存储介质

Cited By (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112580681A (zh) * 2019-09-30 2021-03-30 北京星选科技有限公司 用户分类方法、装置、电子设备及可读存储介质
CN111046739A (zh) * 2019-11-14 2020-04-21 京东数字科技控股有限公司 一种操作熟练度识别方法、装置及存储介质
WO2021135842A1 (zh) * 2020-01-02 2021-07-08 ***通信有限公司研究院 群体不满意用户识别方法、装置、设备及存储介质
WO2021164232A1 (zh) * 2020-02-17 2021-08-26 平安科技(深圳)有限公司 用户识别方法、装置、设备及存储介质
CN111401433A (zh) * 2020-03-12 2020-07-10 腾讯科技(深圳)有限公司 用户信息获取方法、装置、电子设备及存储介质
CN111401433B (zh) * 2020-03-12 2023-10-17 腾讯科技(深圳)有限公司 用户信息获取方法、装置、电子设备及存储介质
CN111967971A (zh) * 2020-08-18 2020-11-20 中国银行股份有限公司 银行客户数据处理方法及装置
CN111967971B (zh) * 2020-08-18 2023-09-19 中国银行股份有限公司 银行客户数据处理方法及装置

Similar Documents

Publication Publication Date Title
CN110188796A (zh) 用户识别方法、装置、存储介质和处理器
CN111062757B (zh) 基于多路径寻优匹配的信息推荐方法及***
CN109447169A (zh) 图像处理方法及其模型的训练方法、装置和电子***
CN108875522A (zh) 人脸聚类方法、装置和***及存储介质
CN110070067A (zh) 视频分类方法及其模型的训练方法、装置和电子设备
CN108596277A (zh) 一种车辆身份识别方法、装置和存储介质
CN111597870B (zh) 一种基于注意力机制与多任务学习的人体属性识别方法
CN110399890A (zh) 图像识别方法、装置、电子设备及可读存储介质
CN105302911B (zh) 一种数据筛选引擎建立方法及数据筛选引擎
CN108875525A (zh) 行为预测方法、装置、***和存储介质
CN104933428B (zh) 一种基于张量描述的人脸识别方法及装置
CN106250431B (zh) 一种基于分类服装的颜色特征提取方法及服装检索***
CN111476319B (zh) 商品推荐方法、装置、存储介质和计算设备
CN104573640A (zh) 面部检测
CN103578098B (zh) 在商品图片中提取商品主体的方法和装置
CN109871780A (zh) 一种人脸质量判决方法、***及人脸识别方法、***
CN111709816A (zh) 基于图像识别的服务推荐方法、装置、设备及存储介质
CN109872335A (zh) 一种用于pd-l1抗体染色切片的自动读片方法及其***
US20080317353A1 (en) Method and system for searching images with figures and recording medium storing metadata of image
CN106898026A (zh) 一种图片的主色调提取方法和装置
CN108710916A (zh) 图片分类的方法及装置
CN108629373A (zh) 一种图像分类方法、***、设备及计算机可读存储介质
Umayaparvathi et al. Attribute selection and customer churn prediction in telecom industry
WO2020007989A1 (en) Method for co-clustering senders and receivers based on text or image data files
CN109993042A (zh) 一种人脸识别方法及其装置

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication

Application publication date: 20190830

RJ01 Rejection of invention patent application after publication