CN106682686A - 一种基于手机上网行为的用户性别预测方法 - Google Patents

一种基于手机上网行为的用户性别预测方法 Download PDF

Info

Publication number
CN106682686A
CN106682686A CN201611127122.2A CN201611127122A CN106682686A CN 106682686 A CN106682686 A CN 106682686A CN 201611127122 A CN201611127122 A CN 201611127122A CN 106682686 A CN106682686 A CN 106682686A
Authority
CN
China
Prior art keywords
user
data
accuracy
cell phone
prediction
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201611127122.2A
Other languages
English (en)
Inventor
刘玉华
马江民
张光辉
常青
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
BEIJING TUOMING COMMUNICATION TECHNOLOGY Co Ltd
Original Assignee
BEIJING TUOMING COMMUNICATION TECHNOLOGY Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by BEIJING TUOMING COMMUNICATION TECHNOLOGY Co Ltd filed Critical BEIJING TUOMING COMMUNICATION TECHNOLOGY Co Ltd
Priority to CN201611127122.2A priority Critical patent/CN106682686A/zh
Publication of CN106682686A publication Critical patent/CN106682686A/zh
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/24Classification techniques
    • G06F18/243Classification techniques relating to the number of classes
    • G06F18/24323Tree-organised classifiers
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/21Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
    • G06F18/214Generating training patterns; Bootstrap methods, e.g. bagging or boosting
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/953Querying, e.g. by the use of web search engines
    • G06F16/9535Search customisation based on user profiles and personalisation

Landscapes

  • Engineering & Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Theoretical Computer Science (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Artificial Intelligence (AREA)
  • Evolutionary Biology (AREA)
  • Evolutionary Computation (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明涉及一种基于手机上网行为的用户性别预测方法,该方法统计用户在一段时间内点击各APP的次数;将统计数据整理成矩阵形式;对所述矩阵进行降维处理;将处理后的数据分为训练数据集和测试数据集,用训练数据集来训练预测模型;用测试数据集来验证预测模型,并计算准确度。本发明简单易行,且准确率较高。根据用户使用的APP的次数来预测用户的性别,对后续根据不同性别用户的偏好进行相关的个性化服务推荐提供了支持。

Description

一种基于手机上网行为的用户性别预测方法
技术领域
本发明属于计算机、通信技术领域,具体涉及一种基于手机上网行为的用户性别预测方法。
背景技术
随着大数据的发展,许多的网络应用如电子商务网站、搜索引擎等,越来越关心用户的基础属性信息,通过构建用户的画像,为后续对用户进行个性化的服务提供了有力的支持。亚马逊的个性化商店就是个性化服务很好的例子。亚马逊购物商城可以根据用户的浏览记录和购买记录给用户推荐相应的商品促使用户消费,或者通过分析购买过相同或相似产品的其他用户的购买行为为用户推荐商品。
在互联网公司的广告业务不断增长的同时,许多的互联网公司也在为用户提供个性化的广告。百度推广会根据用户的搜索历史关键字给用户提供不同的广告业务。很多的公司会根据用户的历史行为分析用户的兴趣模型,以便提供更好的个性化服务。刻画用户画像包括刻画用户的人口统计信息,地理位置信息,搜索访问兴趣爱好等。刻画用户画像其中一个非常重要的部分就是用户特征识别。用户特征识别在个性化推荐、可疑用户辨识等方面都发挥着重要的作用。比如在营销方面,确定了用户的个人特征(如年龄、性别等),就可以针对该用户进行有目的的营销。相比于盲目的撒网式营销,精准营销的成功率将更高,能够创造更大的价值。同样,公共安全已经成为当今社会一个不容忽视的问题,一些犯罪分子往往会隐藏行踪,不在网络等地方留下任何痕迹,但手机作为不可或缺的工具,接打电话、基站切换时就能暴露用户的位置,同时用户使用的哪些APP以及上网习惯等信息也能帮助描绘该用户的特征,帮助相关执法机构缩小探查范围,锁定目标。然而用户的基础属性信息如性别、年龄、收入等在一般情况下是不容易得到的,因为这些信息对用户而言是很敏感的,人们不愿意公开这类个人隐私属性。因此,用户基础特征的识别是近几年研究的热点。
随着信息技术的发展和智能手机的普及,智能手机应用呈现指数增长,基于位置的服务也越来越多。这些基于位置的网络应用准许用户发布自己的地理位置信息、搜索附近的人、分享个人的经历等,与此同时网络应用会为用户推荐用户所在地的特色商店、用户感兴趣的人或物,这些需要结合用户的地理位置信息、兴趣爱好以及个人基础属性信息。然而这些信息一般被视作用户隐私信息,很多的网络应用公司很难获得。尽管一些网络应用在用户注册时要求用户填写性别、出生年月、教育程度等相关信息,但是这些信息对用户比较敏感,因此很多用户根本不会填写这些相关信息或者填写错误的信息,这些不真实的信息对个性化推荐会有负作用。实际情况是大部分用户在注册时都没有填写相关的基础属性信息。
对手机应用而言由于性别的差异,男性和女性使用的APP也不尽相同。不同属性的用户使用APP的频次不尽相同,但是,相同属性的用户偏爱的APP种类大致相同,因而同一属性的用户使用同一APP的频次大致相同。因此通过研究用户使用每一款APP的频次来预测用户的基础属性信息这个课题为预测用户未知信息提供了新的思路及方法。
通过对现有技术的文献检索发现,早期的用户基础属性主要基于用户文本数据和语音数据根据每个人的行为习惯、写作风格等进行年龄及性别的基础属性判别。Eckert等利用社会语言学,通过研究用户的语言特征来推断用户的性别;Koppel等根据用户性别对一些作者的文字进行文本分类,发现在语言风格和文字内容方面,不同性别和年龄的作者之间都有较大的差异,据此他提出了Multi-Class Real Winnow算法,根据作者的博客内容对作者的年龄和性别进行了分类,取得了较好的效果。
目前,面向移动端上网行为数据的用户基础属性识别的研究相对较少。预测用户基础属性的方法主要基于传统的分类器方法。
1、LR(逻辑回归)算法。该算法是一种分类方法,主要用于二分类。它的预测值只有两个,是或否。可以用它来做性别预测。该算法对自变量要求较严格,当模型中的自变量过多时,容易造成过拟合。
2、朴素贝叶斯算法,该方法常用于文本分类。一般在文本分类中,首先应用TF-IDF分词算法来调整词语的权重,得到关于词语权重的矩阵,然后应用朴素贝叶斯算法来分类。针对非文本数据,该方法不太适用。
中国专利申请201510027957.X公开了一种“基于智能手机流量数据的用户基础属性预测方法”,通过分析用户智能手机的流量数据,预测用户的年龄和性别等。其方法是分析用户手机上所有APP的流量精确使用情况,分析用户对每个APP流量的使用特征,并计算相应特征值。将所有APP流量特征值作为特征向量,通过用户ID将用户的基础属性和特征向量关联起来,分析智能手机流量数据与用户基础属性之间的关系,从而达到依据智能手机的流量数据预测用户基础属性的目的。采用SVM模型实现对用户的基础属性的分类预测。该方法由于要分析用户手机上所有APP的流量精确使用情况,分析数据量过大,将所有APP流量特征值作为特征向量会导致变量过多,从而造成特征不明显,分析预测的准确性低。
发明内容
本发明的目的在于针对现有技术所存在的问题,提供一种简单易行、准确率高的基于手机上网行为的用户性别预测方法。
本发明的技术方案如下:一种基于手机上网行为的用户性别预测方法,包括如下步骤:
(1)统计用户在一段时间内点击各APP的次数;
(2)将统计数据整理成矩阵形式;
(3)对所述矩阵进行降维处理;
(4)将处理后的数据分为训练数据集和测试数据集,用训练数据集来训练预测模型;
(5)用测试数据集来验证预测模型,并计算准确度。
进一步,如上所述的基于手机上网行为的用户性别预测方法,步骤(2)中所述矩阵的行表示每个用户的记录,列表示用户使用每个APP对应的次数。
进一步,如上所述的基于手机上网行为的用户性别预测方法,在步骤(3)中,由于所述矩阵为稀疏矩阵,先删除数据的缺失率大于99%的APP,然后再对所述矩阵进行降维处理;降维处理采用主成分分析法。
进一步,如上所述的基于手机上网行为的用户性别预测方法,步骤(4)中在划分训练数据集和测试数据集时,采取随机划分的方法并针对用户不同性别划分一定比例的数据作为训练数据集,以避免有些属性由于随机划分没有测试数据。
更进一步,随机划分数据过程中要保证男性和女性数据中分别有80%的数据作为训练数据集,20%的数据作为测试数据集。
进一步,如上所述的基于手机上网行为的用户性别预测方法,步骤(4)中采用RandomForest随机森林算法来建立预测模型;所述随机森林算法是一个包含多个决策树的组合分类器,其输出的类别由多个树输出的类别的众数决定;在模型建立的过程中,通过不断的调整算法参数(如调整CART树的数量)来提高模型预测结果的准确度。
进一步,如上所述的基于手机上网行为的用户性别预测方法,步骤(5)中所述的准确度可以由准确率、精确度、召回率来表示,所述准确率定义为正确预测的人数和实际预测人数的比例;所述精确度定义为该类别正确预测人数和预测为该类别人数的比例;召回率定义为该类别正确预测的人数和该类别实际人数的比例。
本发明的有益效果如下:本发明提供的一种根据用户手机上网数据来预测用户基础属性的方法,解决了由于变量过多,造成特征不明显的问题,并且可以有效的避免过拟合现象。同时,能够针对非文本数据来预测用户的基础属性,如性别、年龄。该方法简单易行,且准确率较高。根据用户使用的APP的次数来预测用户的性别,对后续根据不同性别用户的偏好进行相关的个性化服务推荐提供了支持。
附图说明
图1为本发明基于手机上网行为的用户性别预测方法流程图。
具体实施方式
下面结合附图和实施例对本发明进行详细的介绍。
本发明提出了一种基于手机端用户访问APP的次数数据的用户性别预测方法,可以有效的利用非文本数据即用户上网行为数据来预测用户的性别。
本发明研究了在移动网络环境下,用户访问APP产生的上网行为数据,利用数据挖掘算法来预测用户的性别。对用户使用的所有APP进行记录,当用户在移动网络下点击一次APP,则产生一条上网日志,统计用户在一段时间内点击每个APP的次数,接着对所有用户进行类似统计,然后对数据进行汇总,将数据写成矩阵形式,行表示每个用户在一段时间内点击各个APP的次数,列对应每个APP,由于APP的种类非常的多,因而该矩阵是个稀疏矩阵。
本方案所述的基于手机上网行为的用户性别预测方法主要包括两个部分:数据预处理部分和模型构建及预测部分;其中:
所述数据预处理部分,包括对上述的稀疏矩阵进行标准化处理,然后对数据进行降维,在该阶段主要采用主成分分析方法对数据进行降维。降低了数据的冗余度。
所述模型构建及预测部分,将经过预处理的数据作为训练数据来训练模型,得到用于预测用户性别的预测模型。然后利用真实数据来验证模型,并计算准确度。在该阶段主要利用RandomForest随机森林算法来训练模型,该算法是数据挖掘算法中的常见算法,属于公知技术,本领域的技术人员完全可以实现。再利用该模型来预测真实的用户数据,并计算准确度。当模型准确率通过时,可以利用该模型来预测用户的性别。
总的方法流程如图1所示,包括如下步骤:
(1)根据用户IMEI号统计用户在一段时间内点击各APP的次数;
(2)将统计数据整理成矩阵形式;
(3)对所述矩阵进行降维处理;
(4)将处理后的数据分为训练数据集和测试数据集,用训练数据集来训练预测模型;
(5)用测试数据集来验证预测模型,并计算准确度。
实施例
下面以具体的用户性别的预测为例,对本发明进行进一步的说明。
(一)数据预处理阶段
本阶段主要以数据预处理为主。
1、通过***中APP规则库的识别方法,对用户使用的APP进行识别。分析用户的上网日志,对数据进行清洗,删除不必要的字段。根据用户的上网日志,统计用户在一天内各时段使用APP的次数。
由于用户的性别属于隐私信息,有些用户愿意公开,有些不愿意公开,所以本发明就是要通过用户上网日志数据来预测相应用户的性别,对该信息进行补全。
2、将统计后的数据整理成矩阵形式,行表示用户,列为对应的APP的使用次数。相关形式如下:
微信 PopStar消 QQ QQ互联 QQ室间 QQ输入法 QQ同步助手
15 19 22 0 0 0 0
20 0 5 0 0 16 0
30 0 2 0 0 16 0
40 0 7 2 0 0 0
12 1 12 1 0 15 0
25 0 17 0 0 0 0
17 0 0 0 0 0 0
18 50 162 0 0 1 31
19 0 95 1 0 0 0
20 0 59 2 0 1 0
21 0 46 0 0 0 7
22 0 38 0 3 22 0
23 3 421 7 386 59 0
24 0 329 0 0 92 16
25 0 4 0 0 0 0
3、由于APP的种类非常的多,每人使用的APP也不尽相同,大众类的APP,如QQ、微信等基本上人们都会使用,而一些小众的APP使用的人数相对较少,因此上述处理的数据矩阵是一个稀疏矩阵,有超过80%的零值。由于APP的数目过多,删除缺失率大于99%的APP。
4、虽然删除了一些APP,数据的维度降低了一些,但是矩阵的维度仍然很大,如果将数据全部放进模型,则模型的准确率非常低,所以数据在进入模型之前需要对数据进行降维,降维的方法有很多,比如主成分分析、奇异值分析、因子分析等。在本实施例中采用了主成分分析的方法对数据进行降维。经过数据降维后的用户上网行为数据的维度为150。大大降低了计算的复杂度。
(二)模型训练及预测阶段
对于用户基础属性的预测问题被定义为一个分类问题,是有监督的机器学习问题。有监督学习是指利用一组已知类标的样本数据训练分类器,通过调整分类器的参数使其达到所要求的预测性能的过程。这里,我们根据已收集到的用户的性别的数据来训练模型。在训练模型开始时,首先需要将用户对应的性别添加到上面经过预处理的数据的最后一列,然后再对数据进行划分。对于数据的划分需要遵循以下原则:
1)将数据划分成两部分:训练集D1和测试集D2,其中训练集占80%,测试集占20%。
2)对于训练数据集D1和测试数据集D2应该满足D1+D2=D且D1∩D2=φ。
3)训练集作为模型的训练数据,测试集用来验证模型的准确性。
4)随机抽取数据过程中要保证男性和女性数据中分别要有80%的数据作为训练集,20%作为测试集。
根据上面划分好的训练数据来训练模型。该模型使用的算法为随机森林算法,在训练模型过程中,要不断地调整算法的参数,如调整分类器中CART树的数量,使模型能够更好的拟合数据。随机森林是一个包含多个决策树的分类器,并且其输出的类别是由多个树输出的类别的众数而定,采用该算法能够避免过拟合现象。
预测的准确度是评价分类算法的基本指标,在一定程度上能衡量算法的分类性能。本发明中用户基础属性预测问题是分类问题,目前最常用的分类准确度指标有准确率(Accuracy)、精确度(Precision)、召回率(Recall)。对于一个二分类***而言,预测的情况有4种,以用户的性别基础属性为例,即用户为男性且预测该用户性别为男,用户为男性但是预测该用户性别为女,用户性别为女但是预测该用户性别为男,用户性别为女且预测该用户性别为女。表1-1对这4种情况作了一个总结,其中f++,f+-,f-+,f--分别表示这4种情况的数目。M表示测试集中男性用户的数量,F表示测试数据集中女性用户的数量,显然M=f+++f+-,F=f-++f--
表1-1用户性别属性预测问题的混淆矩阵
对于用户的基础属性,其预测的准确率(Accuracy)定义为正确预测的人数和实际预测人数的比例。用户性别预测的准确率为:
对于用户基础属性的一个类别,其预测的精确度(Precision)定义为该类别正确预测人数和预测为该类别人数的比例,用户性别基础属性男性类别的预测精确度为:
对于用户基础属性的一个类别,其预测的召回率(Recall)定义为该类别正确预测的人数和该类别实际人数的比例,用户性别基础属性男性类别的预测召回率计算公式为:
本发明利用准确率来评价模型。
根据对已搜集到的2900个北京移动用户一天内的上网行为数据日志进行分析,经过数据清洗、降维处理后,来训练模型。在这里随机抽取80%的数据作为训练集,20%的数据作为测试集。预测结果为Acc=70%。
显然,本领域的技术人员可以对本发明进行各种改动和变型而不脱离本发明的精神和范围。这样,倘若对本发明的这些修改和变型属于本发明权利要求及其同等技术的范围之内,则本发明也意图包含这些改动和变型在内。

Claims (10)

1.一种基于手机上网行为的用户性别预测方法,包括如下步骤:
(1)统计用户在一段时间内点击各APP的次数;
(2)将统计数据整理成矩阵形式;
(3)对所述矩阵进行降维处理;
(4)将处理后的数据分为训练数据集和测试数据集,用训练数据集来训练预测模型;
(5)用测试数据集来验证预测模型,并计算准确度。
2.如权利要求1所述的基于手机上网行为的用户性别预测方法,其特征在于:步骤(2)中所述矩阵的行表示每个用户的记录,列表示用户使用每个APP对应的次数。
3.如权利要求1或2所述的基于手机上网行为的用户性别预测方法,其特征在于:在步骤(3)中,由于所述矩阵为稀疏矩阵,先删除数据的缺失率大于99%的APP,然后再对所述矩阵进行降维处理。
4.如权利要求3所述的基于手机上网行为的用户性别预测方法,其特征在于:降维处理采用主成分分析法。
5.如权利要求1所述的基于手机上网行为的用户性别预测方法,其特征在于:步骤(4)中在划分训练数据集和测试数据集时,采取随机划分的方法并针对用户不同性别划分一定比例的数据作为训练数据集,以避免有些属性由于随机划分没有测试数据。
6.如权利要求5所述的基于手机上网行为的用户性别预测方法,其特征在于:随机划分数据过程中要保证男性和女性数据中分别有80%的数据作为训练数据集,20%的数据作为测试数据集。
7.如权利要求1或5所述的基于手机上网行为的用户性别预测方法,其特征在于:步骤(4)中采用随机森林算法来建立预测模型;所述随机森林算法是一个包含多个决策树的组合分类器,其输出的类别由多个树输出的类别的众数决定。
8.如权利要求7所述的基于手机上网行为的用户性别预测方法,其特征在于:步骤(4)在模型建立的过程中,通过不断的调整算法参数来提高模型预测结果的准确度。
9.如权利要求8所述的基于手机上网行为的用户性别预测方法,其特征在于:通过调整算法模型中CART树的数量来提高模型预测结果的准确度。
10.如权利要求1所述的基于手机上网行为的用户性别预测方法,其特征在于:步骤(5)中所述的准确度可以由准确率、精确度、召回率来表示,所述准确率定义为正确预测的人数和实际预测人数的比例;所述精确度定义为该类别正确预测人数和预测为该类别人数的比例;召回率定义为该类别正确预测的人数和该类别实际人数的比例。
CN201611127122.2A 2016-12-09 2016-12-09 一种基于手机上网行为的用户性别预测方法 Pending CN106682686A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201611127122.2A CN106682686A (zh) 2016-12-09 2016-12-09 一种基于手机上网行为的用户性别预测方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201611127122.2A CN106682686A (zh) 2016-12-09 2016-12-09 一种基于手机上网行为的用户性别预测方法

Publications (1)

Publication Number Publication Date
CN106682686A true CN106682686A (zh) 2017-05-17

Family

ID=58868978

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201611127122.2A Pending CN106682686A (zh) 2016-12-09 2016-12-09 一种基于手机上网行为的用户性别预测方法

Country Status (1)

Country Link
CN (1) CN106682686A (zh)

Cited By (16)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107341200A (zh) * 2017-06-20 2017-11-10 北京微影时代科技有限公司 判断观影用户性别的方法及影片推荐方法
CN107704547A (zh) * 2017-09-26 2018-02-16 硕诺科技(深圳)有限公司 一种通过手机使用行为识别性别的方法
CN107886366A (zh) * 2017-11-22 2018-04-06 深圳市金立通信设备有限公司 性别分类模型的生成方法、性别填充方法、终端及存储介质
CN108564220A (zh) * 2018-04-19 2018-09-21 广州优视网络科技有限公司 用户性别预测方法、装置、存储介质和计算机设备
CN108596241A (zh) * 2018-04-20 2018-09-28 西北工业大学 一种基于多维感知数据的用户性别快速分类方法
CN109145932A (zh) * 2017-06-28 2019-01-04 中兴通讯股份有限公司 用户性别预测方法、装置及设备
WO2019120019A1 (zh) * 2017-12-20 2019-06-27 Oppo广东移动通信有限公司 用户性别预测方法、装置、存储介质及电子设备
CN110134722A (zh) * 2019-05-22 2019-08-16 北京小度信息科技有限公司 目标用户确定方法、装置、设备及存储介质
CN110570254A (zh) * 2019-09-12 2019-12-13 名创优品(横琴)企业管理有限公司 一种基于人脸识别数据的商品结构控制方法及***
WO2020082855A1 (zh) * 2018-10-25 2020-04-30 阿里巴巴集团控股有限公司 服务推荐方法、装置及设备
CN111178983A (zh) * 2020-01-03 2020-05-19 北京搜狐新媒体信息技术有限公司 用户性别预测方法、装置、设备及存储介质
CN111510422A (zh) * 2020-01-09 2020-08-07 中国石油大学(华东) 一种基于端信息扩展序列与随机森林模型的身份认证方法
CN112765479A (zh) * 2021-04-06 2021-05-07 北京神州泰岳智能数据技术有限公司 一种信息推荐的方法、装置、电子设备和可读存储介质
CN113268654A (zh) * 2020-02-17 2021-08-17 北京搜狗科技发展有限公司 一种用户性别识别方法、装置及电子设备
CN113657917A (zh) * 2020-05-12 2021-11-16 上海佳投互联网技术集团有限公司 一种基于user-agent的访客性别分析方法及***
US11468536B2 (en) 2018-05-18 2022-10-11 Beijing Didi Infinity Technology And Development Co., Ltd. Systems and methods for recommending a personalized pick-up location

Citations (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102279851A (zh) * 2010-06-12 2011-12-14 阿里巴巴集团控股有限公司 一种智能导航方法、装置和***
CN102289447A (zh) * 2011-06-16 2011-12-21 北京亿赞普网络技术有限公司 一种基于通讯网络报文的网站网页评价***
CN103020087A (zh) * 2011-09-26 2013-04-03 百度在线网络技术(北京)有限公司 点击日志的生成方法及装置,搜索结果调整方法及装置
CN104090886A (zh) * 2013-12-09 2014-10-08 深圳市腾讯计算机***有限公司 构建用户实时画像的方法及装置
CN104281634A (zh) * 2014-03-13 2015-01-14 电子科技大学 一种基于邻居关系的移动用户基础属性预测方法
CN105224681A (zh) * 2015-10-23 2016-01-06 武汉大学 基于家庭工作地上下文环境的用户需求获取方法及***
US20160048887A1 (en) * 2014-08-18 2016-02-18 Fuji Xerox Co., Ltd. Systems and methods for gaining knowledge about aspects of social life of a person using visual content associated with that person
CN105408894A (zh) * 2014-06-25 2016-03-16 华为技术有限公司 一种用户身份类别确定方法以及装置
CN106126597A (zh) * 2016-06-20 2016-11-16 乐视控股(北京)有限公司 用户属性预测方法及装置

Patent Citations (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102279851A (zh) * 2010-06-12 2011-12-14 阿里巴巴集团控股有限公司 一种智能导航方法、装置和***
CN102289447A (zh) * 2011-06-16 2011-12-21 北京亿赞普网络技术有限公司 一种基于通讯网络报文的网站网页评价***
CN103020087A (zh) * 2011-09-26 2013-04-03 百度在线网络技术(北京)有限公司 点击日志的生成方法及装置,搜索结果调整方法及装置
CN104090886A (zh) * 2013-12-09 2014-10-08 深圳市腾讯计算机***有限公司 构建用户实时画像的方法及装置
CN104281634A (zh) * 2014-03-13 2015-01-14 电子科技大学 一种基于邻居关系的移动用户基础属性预测方法
CN105408894A (zh) * 2014-06-25 2016-03-16 华为技术有限公司 一种用户身份类别确定方法以及装置
US20160048887A1 (en) * 2014-08-18 2016-02-18 Fuji Xerox Co., Ltd. Systems and methods for gaining knowledge about aspects of social life of a person using visual content associated with that person
CN105224681A (zh) * 2015-10-23 2016-01-06 武汉大学 基于家庭工作地上下文环境的用户需求获取方法及***
CN106126597A (zh) * 2016-06-20 2016-11-16 乐视控股(北京)有限公司 用户属性预测方法及装置

Cited By (21)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107341200A (zh) * 2017-06-20 2017-11-10 北京微影时代科技有限公司 判断观影用户性别的方法及影片推荐方法
CN109145932A (zh) * 2017-06-28 2019-01-04 中兴通讯股份有限公司 用户性别预测方法、装置及设备
CN107704547A (zh) * 2017-09-26 2018-02-16 硕诺科技(深圳)有限公司 一种通过手机使用行为识别性别的方法
CN107704547B (zh) * 2017-09-26 2022-01-14 英望科技(山东)有限公司 一种通过手机使用行为识别性别的方法
CN107886366A (zh) * 2017-11-22 2018-04-06 深圳市金立通信设备有限公司 性别分类模型的生成方法、性别填充方法、终端及存储介质
WO2019120019A1 (zh) * 2017-12-20 2019-06-27 Oppo广东移动通信有限公司 用户性别预测方法、装置、存储介质及电子设备
CN109948633A (zh) * 2017-12-20 2019-06-28 广东欧珀移动通信有限公司 用户性别预测方法、装置、存储介质及电子设备
CN108564220A (zh) * 2018-04-19 2018-09-21 广州优视网络科技有限公司 用户性别预测方法、装置、存储介质和计算机设备
CN108596241A (zh) * 2018-04-20 2018-09-28 西北工业大学 一种基于多维感知数据的用户性别快速分类方法
US11468536B2 (en) 2018-05-18 2022-10-11 Beijing Didi Infinity Technology And Development Co., Ltd. Systems and methods for recommending a personalized pick-up location
WO2020082855A1 (zh) * 2018-10-25 2020-04-30 阿里巴巴集团控股有限公司 服务推荐方法、装置及设备
CN110134722A (zh) * 2019-05-22 2019-08-16 北京小度信息科技有限公司 目标用户确定方法、装置、设备及存储介质
CN110570254A (zh) * 2019-09-12 2019-12-13 名创优品(横琴)企业管理有限公司 一种基于人脸识别数据的商品结构控制方法及***
CN110570254B (zh) * 2019-09-12 2023-04-07 创优数字科技(广东)有限公司 一种基于人脸识别数据的商品结构控制方法及***
CN111178983A (zh) * 2020-01-03 2020-05-19 北京搜狐新媒体信息技术有限公司 用户性别预测方法、装置、设备及存储介质
CN111178983B (zh) * 2020-01-03 2024-03-12 北京搜狐新媒体信息技术有限公司 用户性别预测方法、装置、设备及存储介质
CN111510422A (zh) * 2020-01-09 2020-08-07 中国石油大学(华东) 一种基于端信息扩展序列与随机森林模型的身份认证方法
CN111510422B (zh) * 2020-01-09 2021-07-09 中国石油大学(华东) 一种基于端信息扩展序列与随机森林模型的身份认证方法
CN113268654A (zh) * 2020-02-17 2021-08-17 北京搜狗科技发展有限公司 一种用户性别识别方法、装置及电子设备
CN113657917A (zh) * 2020-05-12 2021-11-16 上海佳投互联网技术集团有限公司 一种基于user-agent的访客性别分析方法及***
CN112765479A (zh) * 2021-04-06 2021-05-07 北京神州泰岳智能数据技术有限公司 一种信息推荐的方法、装置、电子设备和可读存储介质

Similar Documents

Publication Publication Date Title
CN106682686A (zh) 一种基于手机上网行为的用户性别预测方法
Di Clemente et al. Sequences of purchases in credit card data reveal lifestyles in urban populations
CN107862022B (zh) 文化资源推荐***
KR101871747B1 (ko) 유사성향 기반 사용자-관광상품 추천 방법 및 시스템
CN104573054B (zh) 一种信息推送方法和设备
WO2018223719A1 (zh) 用户投保行为预测的方法、装置、计算设备及介质
CN106168953B (zh) 面向弱关系社交网络的博文推荐方法
CN103235824A (zh) 根据浏览网页确定用户感兴趣的网页文本的方法和***
CN103235823A (zh) 根据相关网页和当前行为确定用户当前兴趣的方法和***
CN110110225B (zh) 基于用户行为数据分析的在线教育推荐模型及构建方法
CN111177559B (zh) 文旅服务推荐方法、装置、电子设备及存储介质
CN103246725A (zh) 一种基于无线网络的数据业务推送***和方法
CN103177129B (zh) 互联网实时信息推荐预测***
CN107291755B (zh) 一种终端推送方法及装置
US8838435B2 (en) Communication processing
CN107908616B (zh) 预测趋势词的方法和装置
CN104281634B (zh) 一种基于邻居关系的移动用户基础属性预测方法
WO2019242453A1 (zh) 信息处理方法及装置、存储介质、电子装置
CN107368499B (zh) 一种客户标签建模及推荐方法及装置
CN103854206B (zh) 一种分析人群特征的方法和设备
CN111447575A (zh) 短信息推送方法、装置、设备及存储介质
CN115098650A (zh) 基于历史数据模型的评论信息分析方法及相关装置
CN105389714B (zh) 一种从行为数据识别用户特性的方法
Ozdikis et al. Spatial statistics of term co-occurrences for location prediction of tweets
Li et al. Modeling and analysis of group user portrait through WeChat mini program

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication
RJ01 Rejection of invention patent application after publication

Application publication date: 20170517