CN108564220A - 用户性别预测方法、装置、存储介质和计算机设备 - Google Patents

用户性别预测方法、装置、存储介质和计算机设备 Download PDF

Info

Publication number
CN108564220A
CN108564220A CN201810354699.XA CN201810354699A CN108564220A CN 108564220 A CN108564220 A CN 108564220A CN 201810354699 A CN201810354699 A CN 201810354699A CN 108564220 A CN108564220 A CN 108564220A
Authority
CN
China
Prior art keywords
application
gender
user
target user
list
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201810354699.XA
Other languages
English (en)
Inventor
潘岸腾
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Alibaba China Co Ltd
Original Assignee
Guangzhou Youshi Network Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Guangzhou Youshi Network Technology Co Ltd filed Critical Guangzhou Youshi Network Technology Co Ltd
Priority to CN201810354699.XA priority Critical patent/CN108564220A/zh
Publication of CN108564220A publication Critical patent/CN108564220A/zh
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/04Forecasting or optimisation specially adapted for administrative or management purposes, e.g. linear programming or "cutting stock problem"
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/30Monitoring
    • G06F11/34Recording or statistical evaluation of computer activity, e.g. of down time, of input/output operation ; Recording or statistical evaluation of user activity, e.g. usability assessment
    • G06F11/3438Recording or statistical evaluation of computer activity, e.g. of down time, of input/output operation ; Recording or statistical evaluation of user activity, e.g. usability assessment monitoring of user actions

Landscapes

  • Engineering & Computer Science (AREA)
  • Business, Economics & Management (AREA)
  • Theoretical Computer Science (AREA)
  • Quality & Reliability (AREA)
  • General Engineering & Computer Science (AREA)
  • Economics (AREA)
  • Human Resources & Organizations (AREA)
  • Strategic Management (AREA)
  • General Physics & Mathematics (AREA)
  • Physics & Mathematics (AREA)
  • Game Theory and Decision Science (AREA)
  • Tourism & Hospitality (AREA)
  • Operations Research (AREA)
  • General Business, Economics & Management (AREA)
  • Marketing (AREA)
  • Entrepreneurship & Innovation (AREA)
  • Computer Hardware Design (AREA)
  • Development Economics (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明提供一种用户性别预测方法,该方法包括:获取应用池的应用;获取目标用户的应用列表;根据所述应用和所述应用列表,生成第一特征向量;把所述第一特征向量输入预置的性别预测模型,得到所述目标用户性别的预测值;性别预测模型用于表征第一特征向量与用户性别的关联关系;根据所述预测值,预测所述目标用户的性别。采用预先训练完成的性别预测模型来实现目标用户的性别预测,在用户在应用平台没有任何性别相关信息透露的情况下,也预测出目标用户的性别,进而为在应用场景中根据用户的性别进行定向应用投放、提高应用平台的应用投放安装转化率提供有力支持。

Description

用户性别预测方法、装置、存储介质和计算机设备
技术领域
本发明涉及计算机技术领域,具体而言,本发明涉及一种用户性别预测方法、装置、计算机可读存储介质和计算机设备。
背景技术
随着互联网技术的迅猛发展及智能终端的快速普及,各种各样的应用软件层出不穷。为了给用户集中展示应用软件并满足用户的应用下载安装需求,如应用商店或应用市场等可向用户推荐应用软件并提供应用软件下载渠道的应用平台应运而生。在应用平台的日常运营中,有许多场景需要根据用户的性别进行定向应用投放,例如:给女性用户定投“美颜相机类应用”,给男性用户定投“军事资讯类应用”等。
然而,由于应用平台通常并不强制登录,大部分用户不进行登录便直接访问应用平台,导致应用平台无法获知这些用户的性别,继而无法实现在应用场景中根据用户的性别进行定向应用投放,应用平台的应用投放安装转化率较低。
发明内容
为至少能解决上述的技术缺陷之一,本发明提供了以下技术方案的用户性别预测方法、应用推荐方法及对应的装置、计算机可读存储介质和计算机设备。
本发明的实施例根据一个方面,提供了一种用户性别预测方法,包括:
获取应用池的应用;获取目标用户的应用列表;
根据所述应用和所述应用列表,生成第一特征向量;
把所述第一特征向量输入预置的性别预测模型,得到所述目标用户性别的预测值;性别预测模型用于表征第一特征向量与目标用户性别的关联关系;
根据所述预测值,预测所述目标用户的性别。
优选地,所述获取目标用户的应用列表,包括:获取目标用户下载的应用;根据目标用户下载的应用生成所述目标用户的应用列表;和/或
获取目标用户已安装的应用;根据目标用户已安装的应用生成所述目标用户的应用列表。
优选地,所述性别预测模型通过以下步骤生成:
获取应用池的应用;获取历史用户的应用列表;
获取历史用户的性别信息;
根据所述应用和所述历史用户的应用列表,生成第二特征向量;
根据所述第二特征向量和对应的所述性别信息,生成训练样本;
根据所述训练样本,通过回归算法训练生成所述性别预测模型。
进一步地,所述获取历史用户的应用列表,包括:
获取历史用户下载的应用;根据历史用户下载的应用生成所述历史用户的应用列表;和/或
获取历史用户已安装的应用;根据历史用户已安装的应用生成所述历史用户的应用列表。
优选地,所述回归算法为逻辑回归算法。
优选地,所述获取历史用户的性别信息,包括:
获取历史用户的注册信息,从所述注册信息中提取性别信息;或
向历史用户发送获取性别信息的请求,从历史用户响应所述请求的反馈信息中提取性别信息。
优选地,所述根据所述应用和所述应用列表,生成第一特征向量,包括:
根据所述应用,生成包含元素为所述应用的第一集合;
根据所述应用列表,生成包含元素为所述应用列表中应用的第二集合;
根据所述第一集合和所述第二集合,采用独热编码生成第一特征向量。
优选地,所述根据所述预测值,预测所述目标用户的性别,包括:
判断所述预测值是否大于预置阈值;
若是,判定所述目标用户的性别为男性;
若否,判定所述目标用户的性别为女性。
本发明的实施例根据一个方面,还提供了一种应用推荐方法,包括:
根据上述的用户性别预测方法,预测目标用户的性别;
从应用池中获取预置的与所述性别匹配的待推荐应用;
向所述目标用户推荐所述待推荐应用。
此外,本发明的实施例根据另一个方面,提供了一种用户性别预测装置,包括:
应用获取模块,用于获取应用池的应用;获取目标用户的应用列表;
特征向量生成模块,用于根据所述应用和所述应用列表,生成第一特征向量;
预测值计算模块,用于把所述第一特征向量输入预置的性别预测模型,得到所述目标用户性别的预测值;
性别预测模块,用于根据所述预测值,预测所述目标用户的性别。
本发明的实施例根据另一个方面,还提供了一种应用推荐装置,包括:
性别预测模块,用于根据上述用户性别预测方法,预测目标用户的性别;
应用获取模块,用于从应用池中获取预置的与所述性别匹配的待推荐应用;
应用推荐模块,用于向所述目标用户推荐所述待推荐应用。
本发明的实施例根据又一个方面,提供了一种计算机可读存储介质,所述计算机可读存储介质上存储有计算机程序,所述计算机程序被处理器执行时实现上述的用户性别预测方法。
本发明的实施例根据又一个方面,还提供了一种计算机可读存储介质,所述计算机可读存储介质上存储有计算机程序,所述计算机程序被处理器执行时实现上述的应用推荐方法。
本发明的实施例根据再一个方面,提供了一种计算机设备,所述计算机包括一个或多个处理器;存储器;一个或多个计算机程序,其中所述一个或多个计算机程序被存储在所述存储器中并被配置为由所述一个或多个处理器执行,所述一个或多个计算机程序配置用于:执行上述的用户性别预测方法。
本发明的实施例根据再一个方面,还提供了一种计算机设备,所述计算机设备包括一个或多个处理器;存储器;一个或多个计算机程序,其中所述一个或多个计算机程序被存储在所述存储器中并被配置为由所述一个或多个处理器执行,所述一个或多个计算机程序配置用于:执行上述的应用推荐方法。
本发明与现有技术相比,具有以下有益效果:
本发明提供的用户性别预测方法、装置、存储介质和计算机设备,基于目标用户的应用信息,采用预先训练完成的性别预测模型来实现目标用户的性别预测,在用户在应用平台没有任何性别相关信息透露的情况下,也预测出目标用户的性别,进而为在应用场景中根据用户的性别进行定向应用投放、提高应用平台的应用投放安装转化率提供有力支持。
此外,本发明提供的应用推荐方法、装置、存储介质和计算机设备,通过本发明提供的性别预测方法来实现目标用户的性别预测,进而实现在应用场景中根据用户的性别进行定向应用投放,可显著提高应用平台的应用投放安装转化率。
本发明附加的方面和优点将在下面的描述中部分给出,这些将从下面的描述中变得明显,或通过本发明的实践了解到。
附图说明
本发明上述的和/或附加的方面和优点从下面结合附图对实施例的描述中将变得明显和容易理解,其中:
图1为本发明实施例提供的用户性别预测方法的方法流程图;
图2为本发明实施例提供的生成性别预测模型的方法流程图;
图3为本发明实施例提供的应用推荐方法的方法流程图;
图4为本发明实施例提供的用户性别预测装置的结构示意图;
图5为本发明实施例提供的应用推荐装置的结构示意图;
图6为本发明实施例提供的计算机设备的结构示意图。
具体实施方式
下面详细描述本发明的实施例,所述实施例的示例在附图中示出,其中自始至终相同或类似的标号表示相同或类似的元件或具有相同或类似功能的元件。下面通过参考附图描述的实施例是示例性的,仅用于解释本发明,而不能解释为对本发明的限制。
实施例一
本发明实施例提供了一种用户性别预测方法,如图1所示,该方法包括:
步骤S101:获取应用池的应用;获取目标用户的应用列表。
对于本实施例,在如应用商店或应用市场等可向用户推荐应用软件并提供应用软件下载渠道的应用平台上,包含有各种各样的应用软件,如购物类软件、音频播放类软件、游戏类软件等。
对于本实施例,所述应用池的应用为当前所述应用平台,如应用商店、应用市场中的所有应用软件。
其中,所述获取目标用户的应用列表,包括:获取目标用户下载的应用;根据目标用户下载的应用生成所述目标用户的应用列表;和/或,获取目标用户已安装的应用;根据目标用户已安装的应用生成所述目标用户的应用列表。
对于本实施例,获取目标用户记录有其下载的应用和已安装的应用的行为日志,从所述行为日志中获取目标用户下载的应用和/或已安装的应用。所述应用列表可以是目标用户的下载应用列表,也可以是目标用户的已安装应用列表,还可以是包含目标用户下载应用和已安装应用的应用列表,其中,所述下载应用列表为目标用户在应用平台上预置时间内下载的或累计下载的应用软件的列表,所述安装应用列表为目标用户当前已安装的应用软件的列表。在实际应用场景中,下载应用列表中用户已下载的应用可能会被用户卸载,故用户的安装应用列表并不包含此类已被卸载的应用。当所述应用列表为下载应用列表时,可通过获取目标用户下载的应用,根据目标用户下载的应用生成所述目标用户的应用列表;当所述应用列表为已安装应用列表时,可通过获取目标用户已安装的应用,根据目标用户已安装的应用生成所述目标用户的应用列表;当所述应用列表包含目标用户下载应用和已安装应用的应用列表时,可通过获取目标用户下载的应用和已安装的应用,对目标用户下载的应用和已安装的应用进行去重后生成所述目标用户的应用列表。
步骤S102:根据所述应用和所述应用列表,生成第一特征向量。
对于本实施例,根据应用池的应用和目标用户的应用列表,生成用于作为性别预测模型输入特征变量的第一特征向量,所述第一特征向量可体现目标用户的应用特征。其中,所述第一特征向量为一个n维向量,所述n与所述应用池的应用的个数相同。
步骤S103:把所述第一特征向量输入预置的性别预测模型,得到所述目标用户性别的预测值;性别预测模型用于表征第一特征向量与目标用户性别的关联关系。
对于本实施例,所述性别预测模型用于表征所述第一特征向量与目标用户性别的关联关系,即把作为输入特征变量的所述第一特征向量输入预先训练好的性别预测模型,能够得到依据所述第一特征向量计算出的所述目标用户的性别的预测值。
步骤S104:根据所述预测值,预测所述目标用户的性别。
对于本实施例,根据所述预测值,预测所述目标用户的性别是男性或是女性。具体地,当所述预测值满足判定所述目标用户为男性的条件时,则预测所述目标用户的性别为男性;当所述预测值满足判定所述目标用户为女性的条件时,则预测所述目标用户的性别为女性。
在本发明实施例提供的用户性别预测方法中,基于目标用户的应用信息,采用预先训练完成的性别预测模型来实现目标用户的性别预测,在用户在应用平台没有任何性别相关信息透露的情况下,也预测出目标用户的性别,进而为在应用场景中根据用户的性别进行定向应用投放、提高应用平台的应用投放安装转化率提供有力支持。
实施例二
本发明实施例的另一种可能的实现方式,在实施例一所示的基础上,还包括实施例二所示的步骤,其中,
如图2所示,所述步骤S103中所述的性别预测模型通过以下步骤生成:
步骤S201:获取应用池的应用;获取历史用户的应用列表。
对于本实施例,在如应用商店或应用市场等可向用户推荐应用软件并提供应用软件下载渠道的应用平台上,包含有各种各样的应用软件,如购物类软件、音频播放类软件、游戏类软件等。
对于本实施例,所述应用池的应用为当前所述应用平台,如应用商店、应用市场中的所有应用软件。
对于本实施例,所述历史用户表示预置时间内在应用平台上有或在应用平台上曾执行应用下载和/或应用安装行为的有效用户。其中,所述预置时间可以是一天、一周、30天等时间,本实施例对此不做限定。
其中,所述获取历史用户的应用列表,包括:获取历史用户下载的应用;根据历史用户下载的应用生成所述历史用户的应用列表;和/或,获取历史用户已安装的应用;根据历史用户已安装的应用生成所述历史用户的应用列表。
对于本实施例,获取历史用户记录有其下载的应用和已安装的应用的行为日志,从所述行为日志中获取历史用户下载的应用和/或已安装的应用。所述应用列表可以是历史用户的下载应用列表,也可以是历史用户的已安装应用列表,还可以是包含历史用户下载应用和已安装应用的应用列表,其中,所述下载应用列表为历史用户在应用平台上预置时间内下载的或累计下载的应用软件的列表,所述安装应用列表为历史用户当前已安装的应用软件的列表。在实际应用场景中,下载应用列表中用户已下载的应用可能会被用户卸载,故用户的安装应用列表并不包含此类已被卸载的应用。当所述应用列表为下载应用列表时,可通过获取历史用户下载的应用,根据历史用户下载的应用生成所述历史用户的应用列表;当所述应用列表为已安装应用列表时,可通过获取历史用户已安装的应用,根据历史用户已安装的应用生成所述历史用户的应用列表;当所述应用列表包含历史用户下载应用和已安装应用的应用列表时,可通过获取历史用户下载的应用和已安装的应用,对历史用户下载的应用和已安装的应用进行去重后生成所述历史用户的应用列表。
步骤S202:获取历史用户的性别信息。
对于本实施例,所述应用平台预先获知所述历史用户的性别信息,从记录有所述性别信息的数据信息中获取历史用户的性别信息。
具体地,可通过以下两种方式获取历史用户的性别信息。
方式一:获取历史用户的注册信息,从所述注册信息中提取性别信息。对于本方式,所述历史用户为在应用平台中有注册登录行为的用户,所述历史用户在应用平台注册时录入有其性别信息。通过获取历史用户的注册信息,可实现从所述注册信息中提取出历史用户的性别信息。
方式二:向历史用户发送获取性别信息的请求,从历史用户响应所述请求的反馈信息中提取性别信息。对于本方式,可以以如发送问卷等形式向用户发送获取性别信息的请求,对于有响应所述请求、向应用平台发送反馈信息的用户,从其反馈信息中提取出性别信息。
需明确指出的是,所述获取历史用户的性别信息的方式并不受本实施例的限制,还可以通过其他方式实现历史用户的性别信息获取。
步骤S203:根据所述应用和所述历史用户的应用列表,生成第二特征向量。
对于本实施例,根据应用池的应用和历史用户的应用列表,生成用于作为性别预测模型输入特征变量的第二特征向量,所述第二特征向量可体现历史用户的应用特征。其中,所述第二特征向量为一个n维向量,所述n与所述应用池的应用的个数相同。
步骤S204:根据所述第二特征向量和对应的所述性别信息,生成训练样本。
对于本实施例,获取所述性别信息之后,还需把所述性别信息转换成对应历史用户性别的预测值,所述预测值为1维向量。例如,预先设置1表示男性,0表示女性,由于获取的为用户已确定的性别信息,则当历史用户的性别为男性时,所述预测值为1,当历史用户的性别为女性时,所述预测值为0。
对于本实施例,根据用于作为性别预测模型的输入特征变量的第二特征向量,以及所述第二特征向量所属历史用户对应的性别信息的预测值,生成用于训练性别预测模型的训练样本。
对于本实施例,所述历史用户包括预置时间内在应用平台上有或在应用平台上曾执行应用下载和/或应用安装行为的多个有效用户。故根据本实施例上述步骤还可生成对应多个有效用户的多个训练样本。
步骤S205:根据所述训练样本,通过回归算法训练生成所述性别预测模型。
对于本实施例,作为一个优选实施方式,所述回归算法为逻辑回归算法。所述逻辑回归算法的标准公式为:
其中,x表示第二特征向量,所述第二特征向量是一个n维的向量;Y表示用于预测用户性别的预测值,是1维向量,预先设定当用户的性别为男性时,所述预测值为1,1表示男性,当用户的性别为女性时,所述预测值为0,0表示女性;w表示逻辑回归算法中不同特征对应的权重,是一个n维向量;b表示逻辑回归算法中的常数项。
对于本实施例,通过将多个包含所述第二特征向量和对应的所述预测值的训练样本输入至上述逻辑回归算法的标准公式中,并通过梯度下降法求解性别预测模型损失函数los(w,b)最小时对应解w,b,得到性别预测模型的参数w,b,进而训练生成所述性别预测模型。
需明确指出的是,上述采用逻辑回归算法训练生成所述性别预测模型仅仅为一种获取性别预测模型的方法,除采用上述逻辑回归算法以外,还可以采用其他算法训练生成性别预测模型。
在本发明实施例提供的用户性别预测方法中,基于历史用户的应用信息及其性别信息,训练生成了可用于实现目标用户性别预测的性别预测模型,为在应用场景中根据用户的性别进行定向应用投放、提高应用平台的应用投放安装转化率提供有力支持。
实施例三
本发明实施例的另一种可能的实现方式,在实施例一所示的基础上,还包括实施例三所示的步骤,其中,
所述步骤S102,包括:
根据所述应用,生成包含元素为所述应用的第一集合;根据所述应用列表,生成包含元素为所述应用列表中应用的第二集合;根据所述第一集合和所述第二集合,采用独热编码生成第一特征向量。
对于本实施例,在所述步骤S101中获取应用池的应用之后,根据所述应用,生成第一集合,即生成应用池的应用集合;其中,所述第一集合中的元素对应应用池中各应用,所述第一集合中的元素个数与所述应用池的应用个数相同。
对于本实施例,在所述步骤S101中获取目标用户的应用列表之后,根据所述应用列表,生成第二集合,即生成目标用户的应用集合。当所述应用列表为多个列表时,根据多个应用列表中的应用,按应用去重后生成所述第二集合。
对于本实施例,所述根据所述第一集合和所述第二集合,采用独热编码生成第一特征向量,具体为:首先,生成所述第一集合之后,给所述第一集合中的应用按其在集合中的排列顺序进行编号,若所述第一集合有n个元素,则所述第一集合中应用的序号在1至n之间;然后,对包含目标用户下载和/或安装应用的所述第二集合进行one-hot独热编码,初始化一个n维向量,将所述n维向量中所述第二集合中应用对应所述第一集合的序号位取值为1,其余位取值为0,最终得到采用独热编码生成的第一特征向量。
例如,根据目标用户的应用列表生成的第二集合为appList={A,B,C,D};其中,应用A、B、C、D分别与所述第一集合中序号为1、3、4、6的应用相对应,则所述n维向量序号为1、3、4、6位的取值为1,其余位取值为0,则根据所述第一集合和所述第二集合,采用独热编码生成的第一特征向量为X=(1,0,1,1,0,1,……,0)。
对于本实施例,根据应用池的应用和目标用户的应用列表,生成用于作为性别预测模型输入特征变量的第一特征向量,所述第一特征向量可体现目标用户的应用特征。其中,所述第一特征向量为一个n维向量,所述n与所述应用池的应用的个数相同。
实施例四
本发明实施例的另一种可能的实现方式,在实施例一所示的基础上,还包括实施例四所示的步骤,其中,
所述步骤S104,包括:
判断所述预测值是否大于预置阈值;若是,判定所述目标用户的性别为男性;若否,判定所述目标用户的性别为女性。
对于本实施例,通过预先设置阈值,将所述步骤S103中计算得到的所述预测值与所述预置阈值进行比较,进而判断目标用户的性别。
例如,预先设置1表示男性,0表示女性,所述预置阈值为0.5,当所述预测值大于所述预置阈值0.5时,判定所述目标用户的性别为男性;当所述预测值小于等于所述预置阈值0.5时,判定所述目标用户的性别为女性。
在本发明实施例提供的用户性别预测方法中,可实现通过计算得到的预测值来判断目标用户的性别,为在应用场景中根据用户的性别进行定向应用投放、提高应用平台的应用投放安装转化率提供有力支持。
此外,本发明实施例提供了一种应用推荐方法,如图3所示,该方法包括:
步骤S301:根据以上任意一实施例所述用户性别预测方法,预测目标用户的性别。
对于本实施例,可通过上述任意一个所述用户性别预测方法的方法实施例,实现目标用户的性别预测,具体实现方式参见以上方法实施例的说明,在此不再赘述。
步骤S302:从应用池中获取预置的与所述性别匹配的待推荐应用。
对于本实施例,所述应用平台中预置有与用户性别匹配的待推荐应用,例如,预置的所述与男性匹配的待推荐应用包含如军事资讯类、犯罪推理类等应用,预置的所述与女性匹配的待推荐应用包含有如美颜相机类、时尚买手类等应用。在所述步骤S301中预测得目标用户的性别之后,根据所述性别获取对应的一个或多个待推荐应用。
步骤S303:向所述目标用户推荐所述待推荐应用。
对于本实施例,向所述目标用户推荐所获取的一个或多个待推荐应用。
本发明提供的应用推荐方法,通过本发明提供的性别预测方法来实现目标用户的性别预测,进而实现在应用场景中根据用户的性别进行定向应用投放,可显著提高应用平台的应用投放安装转化率。
此外,本发明实施例提供了一种用户性别预测装置,如图4所示,所述装置包括:
应用获取模块401,用于获取应用池的应用;获取目标用户的应用列表。
特征向量生成模块402,用于根据所述应用和所述应用列表,生成第一特征向量。
预测值计算模块403,用于把所述第一特征向量输入预置的性别预测模型,得到所述目标用户性别的预测值。
性别预测模块404,用于根据所述预测值,预测所述目标用户的性别。
本发明提供的用户性别预测装置,可实现:基于目标用户的应用信息,采用预先训练完成的性别预测模型来实现目标用户的性别预测,在用户在应用平台没有任何性别相关信息透露的情况下,也预测出目标用户的性别,进而为在应用场景中根据用户的性别进行定向应用投放、提高应用平台的应用投放安装转化率提供有力支持。
本发明实施例提供的用户性别预测装置可以实现上述提供的方法实施例,具体功能实现请参见方法实施例中的说明,在此不再赘述。
此外,本发明实施例还提供了一种应用推荐装置,如图5所示,所述装置包括:
性别预测模块501,用于根据以上任一实施例所述用户性别预测方法,预测目标用户的性别;
应用获取模块502,用于从应用池中获取预置的与所述性别匹配的待推荐应用;
应用推荐模块503,用于向所述目标用户推荐所述待推荐应用。
本发明提供的应用推荐装置,可实现:通过本发明提供的性别预测方法来实现目标用户的性别预测,进而实现在应用场景中根据用户的性别进行定向应用投放,可显著提高应用平台的应用投放安装转化率。
本发明实施例提供的应用推荐装置可以实现上述提供的方法实施例,具体功能实现请参见方法实施例中的说明,在此不再赘述。
此外,本发明实施例提供了一种计算机可读存储介质,计算机可读存储介质上存储有计算机程序,所述计算机程序被处理器执行时实现以上实施例一至四所述的用户性别预测方法和上述应用推荐方法。其中,所述计算机可读存储介质包括但不限于任何类型的盘(包括软盘、硬盘、光盘、CD-ROM、和磁光盘)、ROM(Read-Only Memory,只读存储器)、RAM(Random AcceSS Memory,随即存储器)、EPROM(EraSable Programmable Read-OnlyMemory,可擦写可编程只读存储器)、EEPROM(Electrically EraSable ProgrammableRead-Only Memory,电可擦可编程只读存储器)、闪存、磁性卡片或光线卡片。也就是,存储设备包括由设备(例如,计算机、手机)以能够读的形式存储或传输信息的任何介质,可以是只读存储器,磁盘或光盘等。
本发明提供的计算机可读存储介质,可实现:基于目标用户的应用信息,采用预先训练完成的性别预测模型来实现目标用户的性别预测,在用户在应用平台没有任何性别相关信息透露的情况下,也预测出目标用户的性别,进而为在应用场景中根据用户的性别进行定向应用投放、提高应用平台的应用投放安装转化率提供有力支持。其还可实现:通过本发明提供的性别预测方法来实现目标用户的性别预测,进而实现在应用场景中根据用户的性别进行定向应用投放,可显著提高应用平台的应用投放安装转化率。
本发明实施例提供的计算机可读存储介质可以实现上述提供的方法实施例,具体功能实现请参见方法实施例中的说明,在此不再赘述。此外,本发明实施例还提供了一种计算机设备,如图6所示。本实施例所述的计算机设备可以是服务器、个人计算机以及网络设备等设备。所述计算机设备包括处理器602、存储器603、输入单元604以及显示单元605等器件。本领域技术人员可以理解,图6示出的设备结构器件并不构成对所有设备的限定,可以包括比图示更多或更少的部件,或者组合某些部件。存储器603可用于存储计算机程序601以及各功能模块,处理器602运行存储在存储器603的计算机程序601,从而执行设备的各种功能应用以及数据处理。存储器可以是内存储器或外存储器,或者包括内存储器和外存储器两者。内存储器可以包括只读存储器(ROM)、可编程ROM(PROM)、电可编程ROM(EPROM)、电可擦写可编程ROM(EEPROM)、快闪存储器、或者随机存储器。外存储器可以包括硬盘、软盘、ZIP盘、U盘、磁带等。本发明所公开的存储器包括但不限于这些类型的存储器。本发明所公开的存储器只作为例子而非作为限定。
输入单元604用于接收信号的输入,以及接收用户输入的关键字。输入单元604可包括触控面板以及其它输入设备。触控面板可收集用户在其上或附近的触摸操作(比如用户使用手指、触笔等任何适合的物体或附件在触控面板上或在触控面板附近的操作),并根据预先设定的程序驱动相应的连接装置;其它输入设备可以包括但不限于物理键盘、功能键(比如播放控制按键、开关按键等)、轨迹球、鼠标、操作杆等中的一种或多种。显示单元605可用于显示用户输入的信息或提供给用户的信息以及计算机设备的各种菜单。显示单元605可采用液晶显示器、有机发光二极管等形式。处理器602是计算机设备的控制中心,利用各种接口和线路连接整个电脑的各个部分,通过运行或执行存储在存储器602内的软件程序和/或模块,以及调用存储在存储器内的数据,执行各种功能和处理数据。
作为一个实施例,所述计算机设备包括:一个或多个处理器602,存储器603,一个或多个计算机程序601,其中所述一个或多个计算机程序601被存储在存储器603中并被配置为由所述一个或多个处理器602执行,所述一个或多个计算机程序601配置用于执行以上实施例一至四所述的用户性别预测方法。
作为另一个实施例,所述计算机设备包括:一个或多个处理器602,存储器603,一个或多个计算机程序601,其中所述一个或多个计算机程序601被存储在存储器603中并被配置为由所述一个或多个处理器602执行,所述一个或多个计算机程序601配置用于执行以上所述的应用推荐方法。
本发明提供的计算机设备,可实现:基于目标用户的应用信息,采用预先训练完成的性别预测模型来实现目标用户的性别预测,在用户在应用平台没有任何性别相关信息透露的情况下,也预测出目标用户的性别,进而为在应用场景中根据用户的性别进行定向应用投放、提高应用平台的应用投放安装转化率提供有力支持。其还可实现:通过本发明提供的性别预测方法来实现目标用户的性别预测,进而实现在应用场景中根据用户的性别进行定向应用投放,可显著提高应用平台的应用投放安装转化率。
本发明实施例提供的计算机设备可以实现上述提供的方法实施例,具体功能实现请参见方法实施例中的说明,在此不再赘述。
此外,在本发明各个实施例中的各功能单元可以集成在一个处理模块中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个模块中。上述集成的模块既可以采用硬件的形式实现,也可以采用软件功能模块的形式实现。所述集成的模块如果以软件功能模块的形式实现并作为独立的产品销售或使用时,也可以存储在一个计算机可读取存储介质中。
以上所述仅是本发明的部分实施方式,应当指出,对于本技术领域的普通技术人员来说,在不脱离本发明原理的前提下,还可以做出若干改进和润饰,这些改进和润饰也应视为本发明的保护范围。

Claims (15)

1.一种用户性别预测方法,其特征在于,包括如下步骤:
获取应用池的应用;获取目标用户的应用列表;
根据所述应用和所述应用列表,生成第一特征向量;
把所述第一特征向量输入预置的性别预测模型,得到所述目标用户性别的预测值;性别预测模型用于表征第一特征向量与目标用户性别的关联关系;
根据所述预测值,预测所述目标用户的性别。
2.根据权利要求1所述的用户性别预测方法,其特征在于,所述获取目标用户的应用列表,包括:
获取目标用户下载的应用;根据目标用户下载的应用生成所述目标用户的应用列表;和/或
获取目标用户已安装的应用;根据目标用户已安装的应用生成所述目标用户的应用列表。
3.根据权利要求1所述的用户性别预测方法,其特征在于,所述性别预测模型通过以下步骤生成:
获取应用池的应用;获取历史用户的应用列表;
获取历史用户的性别信息;
根据所述应用和所述历史用户的应用列表,生成第二特征向量;
根据所述第二特征向量和对应的所述性别信息,生成训练样本;
根据所述训练样本,通过回归算法训练生成所述性别预测模型。
4.根据权利要求3所述的用户性别预测方法,其特征在于,所述获取历史用户的应用列表,包括:
获取历史用户下载的应用;根据历史用户下载的应用生成所述历史用户的应用列表;和/或
获取历史用户已安装的应用;根据历史用户已安装的应用生成所述历史用户的应用列表。
5.根据权利要求3所述的用户性别预测方法,其特征在于,所述回归算法为逻辑回归算法。
6.根据权利要求3所述的用户性别预测方法,其特征在于,所述获取历史用户的性别信息,包括:
获取历史用户的注册信息,从所述注册信息中提取性别信息;或
向历史用户发送获取性别信息的请求,从历史用户响应所述请求的反馈信息中提取性别信息。
7.根据权利要求1所述的用户性别预测方法,其特征在于,所述根据所述应用和所述应用列表,生成第一特征向量,包括:
根据所述应用,生成包含元素为所述应用的第一集合;
根据所述应用列表,生成包含元素为所述应用列表中应用的第二集合;
根据所述第一集合和所述第二集合,采用独热编码生成第一特征向量。
8.根据权利要求1所述的用户性别预测方法,其特征在于,所述根据所述预测值,预测所述目标用户的性别,包括:
判断所述预测值是否大于预置阈值;
若是,判定所述目标用户的性别为男性;
若否,判定所述目标用户的性别为女性。
9.一种应用推荐方法,其特征在于,包括:
根据权利要求1至8任意一项所述用户性别预测方法,预测目标用户的性别;
从应用池中获取预置的与所述性别匹配的待推荐应用;
向所述目标用户推荐所述待推荐应用。
10.一种用户性别预测装置,其特征在于,包括:
应用获取模块,用于获取应用池的应用;获取目标用户的应用列表;
特征向量生成模块,用于根据所述应用和所述应用列表,生成第一特征向量;
预测值计算模块,用于把所述第一特征向量输入预置的性别预测模型,得到所述目标用户性别的预测值;
性别预测模块,用于根据所述预测值,预测所述目标用户的性别。
11.一种应用推荐装置,其特征在于,包括:
性别预测模块,用于根据权利要求1至8任意一项所述用户性别预测方法,预测目标用户的性别;
应用获取模块,用于从应用池中获取预置的与所述性别匹配的待推荐应用;
应用推荐模块,用于向所述目标用户推荐所述待推荐应用。
12.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质上存储有计算机程序,所述计算机程序被处理器执行时实现权利要求1至8任一项所述的用户性别预测方法。
13.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质上存储有计算机程序,所述计算机程序被处理器执行时实现权利要求9所述的应用推荐方法。
14.一种计算机设备,其特征在于,其包括:
一个或多个处理器;
存储器;
一个或多个计算机程序,其中所述一个或多个计算机程序被存储在所述存储器中并被配置为由所述一个或多个处理器执行,所述一个或多个计算机程序配置用于:执行根据权利要求1至8任一项所述的用户性别预测方法。
15.一种计算机设备,其特征在于,其包括:
一个或多个处理器;
存储器;
一个或多个计算机程序,其中所述一个或多个计算机程序被存储在所述存储器中并被配置为由所述一个或多个处理器执行,所述一个或多个计算机程序配置用于:执行根据权利要求9所述的应用推荐方法。
CN201810354699.XA 2018-04-19 2018-04-19 用户性别预测方法、装置、存储介质和计算机设备 Pending CN108564220A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201810354699.XA CN108564220A (zh) 2018-04-19 2018-04-19 用户性别预测方法、装置、存储介质和计算机设备

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201810354699.XA CN108564220A (zh) 2018-04-19 2018-04-19 用户性别预测方法、装置、存储介质和计算机设备

Publications (1)

Publication Number Publication Date
CN108564220A true CN108564220A (zh) 2018-09-21

Family

ID=63535967

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201810354699.XA Pending CN108564220A (zh) 2018-04-19 2018-04-19 用户性别预测方法、装置、存储介质和计算机设备

Country Status (1)

Country Link
CN (1) CN108564220A (zh)

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109241090A (zh) * 2018-09-29 2019-01-18 北京惠每云科技有限公司 一种用户确定方法和装置
CN109933727A (zh) * 2019-03-22 2019-06-25 北京博明信德科技有限公司 用户画像生成方法及***、用户画像应用方法及***
CN111178983A (zh) * 2020-01-03 2020-05-19 北京搜狐新媒体信息技术有限公司 用户性别预测方法、装置、设备及存储介质
CN112541010A (zh) * 2019-09-23 2021-03-23 银橙(上海)信息技术有限公司 一种基于逻辑回归的用户性别预测方法

Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104991899A (zh) * 2015-06-02 2015-10-21 广州酷狗计算机科技有限公司 用户属性的识别方法及装置
CN105069041A (zh) * 2015-07-23 2015-11-18 合一信息技术(北京)有限公司 基于视频用户性别分类的广告投放方法
CN105095401A (zh) * 2015-07-07 2015-11-25 北京嘀嘀无限科技发展有限公司 一种性别识别的方法及装置
CN105933425A (zh) * 2016-05-18 2016-09-07 北京奇虎科技有限公司 推荐应用的方法及装置
CN106682686A (zh) * 2016-12-09 2017-05-17 北京拓明科技有限公司 一种基于手机上网行为的用户性别预测方法
CN106778843A (zh) * 2016-11-30 2017-05-31 腾云天宇科技(北京)有限公司 一种预测移动终端用户性别的方法、服务器和***
CN107766891A (zh) * 2017-10-31 2018-03-06 广东欧珀移动通信有限公司 用户性别识别方法、装置、存储介质及电子设备

Patent Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104991899A (zh) * 2015-06-02 2015-10-21 广州酷狗计算机科技有限公司 用户属性的识别方法及装置
CN105095401A (zh) * 2015-07-07 2015-11-25 北京嘀嘀无限科技发展有限公司 一种性别识别的方法及装置
CN105069041A (zh) * 2015-07-23 2015-11-18 合一信息技术(北京)有限公司 基于视频用户性别分类的广告投放方法
CN105933425A (zh) * 2016-05-18 2016-09-07 北京奇虎科技有限公司 推荐应用的方法及装置
CN106778843A (zh) * 2016-11-30 2017-05-31 腾云天宇科技(北京)有限公司 一种预测移动终端用户性别的方法、服务器和***
CN106682686A (zh) * 2016-12-09 2017-05-17 北京拓明科技有限公司 一种基于手机上网行为的用户性别预测方法
CN107766891A (zh) * 2017-10-31 2018-03-06 广东欧珀移动通信有限公司 用户性别识别方法、装置、存储介质及电子设备

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109241090A (zh) * 2018-09-29 2019-01-18 北京惠每云科技有限公司 一种用户确定方法和装置
CN109933727A (zh) * 2019-03-22 2019-06-25 北京博明信德科技有限公司 用户画像生成方法及***、用户画像应用方法及***
CN112541010A (zh) * 2019-09-23 2021-03-23 银橙(上海)信息技术有限公司 一种基于逻辑回归的用户性别预测方法
CN112541010B (zh) * 2019-09-23 2023-05-23 银橙(上海)信息技术有限公司 一种基于逻辑回归的用户性别预测方法
CN111178983A (zh) * 2020-01-03 2020-05-19 北京搜狐新媒体信息技术有限公司 用户性别预测方法、装置、设备及存储介质
CN111178983B (zh) * 2020-01-03 2024-03-12 北京搜狐新媒体信息技术有限公司 用户性别预测方法、装置、设备及存储介质

Similar Documents

Publication Publication Date Title
US20220391773A1 (en) Method and system for artificial intelligence learning using messaging service and method and system for relaying answer using artificial intelligence
CN108564220A (zh) 用户性别预测方法、装置、存储介质和计算机设备
CN105630977B (zh) 应用程序推荐方法、装置及***
CN107103036B (zh) 应用下载概率的获取方法、设备及可编程设备
US20210019375A1 (en) Computing system including virtual agent bot providing semantic topic model-based response
CN111552880A (zh) 基于知识图谱的数据处理方法、装置、介质及电子设备
CN104641362A (zh) 管理一批电子装置
CN111429204A (zh) 酒店推荐方法、***、电子设备和存储介质
CN113220734A (zh) 课程推荐方法、装置、计算机设备及存储介质
CN107046498A (zh) 扩展通信会话中的消息功能的方法及***
CN107273979A (zh) 基于服务级别来执行机器学习预测的方法及***
CN111275205A (zh) 虚拟样本的生成方法、终端设备及存储介质
CN108512883A (zh) 一种信息推送方法、装置及可读介质
CN111460290A (zh) 信息的推荐方法、装置、设备和存储介质
CN112182281B (zh) 一种音频推荐方法、装置及存储介质
US20110302174A1 (en) Crowd-sourcing for gap filling in social networks
CN114040216A (zh) 直播间推荐方法、介质、装置和计算设备
CN113869377A (zh) 训练方法、装置及电子设备
CN117194772B (zh) 一种基于用户标签的内容推送方法及装置
Zhang et al. RetrievalQA: Assessing adaptive Retrieval-Augmented generation for short-form Open-Domain question answering
CN112418442A (zh) 联邦迁移学习的数据处理方法、装置、设备及存储介质
US20140178848A1 (en) Method and apparatus for administering learning contents
CN112269943A (zh) 一种信息推荐***及方法
CN106815285A (zh) 基于视频网站的视频推荐的方法、装置及电子设备
CN107741867B (zh) 应用程序管理方法、装置、存储介质及电子设备

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
TA01 Transfer of patent application right

Effective date of registration: 20200424

Address after: 310052 room 508, floor 5, building 4, No. 699, Wangshang Road, Changhe street, Binjiang District, Hangzhou City, Zhejiang Province

Applicant after: Alibaba (China) Co.,Ltd.

Address before: 510640 Guangdong city of Guangzhou province Whampoa Tianhe District Road No. 163 Xiping Yun Lu Yun Ping square B radio tower 15 layer self unit 02

Applicant before: GUANGZHOU UC NETWORK TECHNOLOGY Co.,Ltd.

TA01 Transfer of patent application right
WD01 Invention patent application deemed withdrawn after publication

Application publication date: 20180921

WD01 Invention patent application deemed withdrawn after publication