CN106897727A - 一种用户性别识别方法及装置 - Google Patents
一种用户性别识别方法及装置 Download PDFInfo
- Publication number
- CN106897727A CN106897727A CN201510965231.0A CN201510965231A CN106897727A CN 106897727 A CN106897727 A CN 106897727A CN 201510965231 A CN201510965231 A CN 201510965231A CN 106897727 A CN106897727 A CN 106897727A
- Authority
- CN
- China
- Prior art keywords
- sex
- user
- application program
- unknown
- feature data
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 title claims abstract description 38
- 238000013145 classification model Methods 0.000 claims abstract description 29
- 230000006399 behavior Effects 0.000 claims description 40
- 238000003066 decision tree Methods 0.000 claims description 22
- 238000007477 logistic regression Methods 0.000 claims description 14
- 239000000284 extract Substances 0.000 claims description 12
- 238000013075 data extraction Methods 0.000 claims description 7
- 238000005516 engineering process Methods 0.000 description 5
- 238000009434 installation Methods 0.000 description 4
- 240000007594 Oryza sativa Species 0.000 description 1
- 235000007164 Oryza sativa Nutrition 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 238000010276 construction Methods 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 230000001815 facial effect Effects 0.000 description 1
- 238000009499 grossing Methods 0.000 description 1
- 238000010801 machine learning Methods 0.000 description 1
- 235000009566 rice Nutrition 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V40/00—Recognition of biometric, human-related or animal-related patterns in image or video data
- G06V40/10—Human or animal bodies, e.g. vehicle occupants or pedestrians; Body parts, e.g. hands
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/21—Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
- G06F18/214—Generating training patterns; Bootstrap methods, e.g. bagging or boosting
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Multimedia (AREA)
- Human Computer Interaction (AREA)
- Data Mining & Analysis (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Evolutionary Computation (AREA)
- Evolutionary Biology (AREA)
- General Engineering & Computer Science (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Bioinformatics & Computational Biology (AREA)
- Artificial Intelligence (AREA)
- Life Sciences & Earth Sciences (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
本发明公开了一种用户性别识别方法和装置,其中,该方法包括:获取未知性别用户的应用程序使用数据,从所述未知性别用户的应用程序使用数据中提取具有性别识别性的特征数据,根据所述未知性别用户的特征数据,基于性别分类模型对未知性别用户进行性别识别,其中,所述性别分类模型为根据已知性别用户的应用程序使用数据的特征数据进行训练而确定。采用该方法,可以解决现有技术中用户性别识别时,可能涉及用户隐私或者成本较高的技术问题。
Description
技术领域
本发明涉及数据处理技术领域,尤其涉及一种用户性别识别方法及装置。
背景技术
随着移动设备的普及和移动宽带网络的建设,当前我们已进入移动互联网的新时代。移动应用分发作为移动互联网的入口之一,也决定了各个厂商在移动互联网上掌控能力的强弱。因此,越来越多的厂商向诸如手机、平板电脑、笔记本、台式机之类的终端设备提供了各种应用程序。为了个性化地给用户推荐应用程序,我们往往需要知道用户性别。
现有技术中用户性别识别主要基于以下几种方法:一种是根据用户注册时填写的资料直接识别;另一种是依据人脸识别技术,通过扫描用户面部特征,识别用户性别。
但是,通过用户填写注册信息或者人脸识别技术,可能涉及用户隐私;而面部识别技术,成本过高。
发明内容
有鉴于此,本发明实施例提供一种用户性别识别方法及装置,以解决现有技术中用户性别识别时,可能涉及用户隐私或者成本较高的技术问题。
第一方面,本发明实施例提供了一种用户性别识别方法,所述方法包括:
获取未知性别用户的应用程序使用数据;
从所述未知性别用户的应用程序使用数据中提取具有性别识别性的特征数据;
根据所述未知性别用户的特征数据,基于性别分类模型对未知性别用户进行性别识别,其中,所述性别分类模型为根据已知性别用户的应用程序使用数据的特征数据进行训练而确定。
第二方面,本发明实施例还提供了一种用户性别识别装置,所述装置包括:
第一使用数据获取模块,用于获取未知性别用户的应用程序使用数据;
第一特征数据提取模块,用于从所述未知性别用户的应用程序使用数据中提取具有性别识别性的特征数据;
性别识别模块,用于根据所述未知性别用户的特征数据,基于性别分类模型对未知性别用户进行性别识别,其中,所述性别分类模型为根据已知性别用户的应用程序使用数据的特征数据进行训练而确定。
本发明实施例提供的用户性别识别方法和装置,通过获取未知性别用户的应用程序使用数据,从中提取具有性别识别性的特征数据,并应用性别分类模型学习所述特征数据,进而判断用户性别,实现了仅通过用户应用程序使用数据识别用户性别的目的。由于用户应用程序使用数据比较丰富,因此性别识别过程中准确率较高,并且可以解决现有技术中用户性别识别时,可能涉及用户隐私或者成本较高的技术问题。
附图说明
通过阅读参照以下附图所作的对非限制性实施例所作的详细描述,本发明的其它特征、目的和优点将会变得更明显:
图1为本发明实施例一提供的一种用户性别识别方法的流程示意图;
图2为本发明实施例二提供的一种用户性别识别方法的流程示意图;
图3为本发明实施例三提供的一种用户性别识别装置的结构框图。
具体实施方式
下面结合附图和实施例对本发明作进一步的详细说明。可以理解的是,此处所描述的具体实施例仅仅用于解释本发明,而非对本发明的限定。另外还需要说明的是,为了便于描述,附图中仅示出了与本发明相关的部分而非全部内容。
实施例一
图1为本发明实施例一提供的一种用户性别识别方法的流程示意图。本实施例可适用于识别未知性别用户的性别的情况。该方法可以由用户性别识别装置来执行,其中该装置可以由软件和/或硬件来实现。如图1所示,本实施例提供的用户性别识别方法具体可以包括如下:
S110、获取未知性别用户的应用程序使用数据。
示例性的,获取未知性别用户的应用程序使用数据,该应用程序使用数据可以包括应用程序安装列表和应用程序使用行为中的至少一个。应用程序安装列表即用户的移动终端中安装的各种应用程序的一个集合,应用程序使用行为即用户对应用程序具体的操作行为,例如对应用程序的使用次数,或者使用频率,或者使用时间等。
S120、从所述未知性别用户的应用程序使用数据中提取具有性别识别性的特征数据。
示例性的,具有性别识别性的特征数据,即帮助识别未知性别用户的性别的特征数据,或者具有性别属性的特征数据。从未知性别用户的应用程序安装列表和/或应用程序使用行为中提取具有性别识别性的特征数据。
S130、根据所述未知性别用户的特征数据,基于性别分类模型对未知性别用户进行性别识别,其中,所述性别分类模型为根据已知性别用户的应用程序使用数据的特征数据进行训练而确定。
示例性的,基于性别分类模型,通过未知性别用户的特征数据,对未知性别用户进行性别识别,识别所述未知性别用于性别为男或者为女,以及对应的概率,其中,性别分类模型可以为根据已知性别用户的应用程序使用数据进行训练而确定的。
具体的,根据未知性别用户的特征数据,基于性别分类模型对未知性别用户进行性别识别,例如:具体识别结果可以是未知性别用户为男性的概率为80%,为女性的概率为20%。进一步的,当未知性别用户的特征数据发生改变时,更新所述概率。具体可以是未知性别用户的应用程序安装列表发生改变,例如用户新增或者删除某些应用程序时,更新所述概率,还可以是未知性别用户的应用程序使用行为发生改变时,更新所述概率。
本发明实施例一提供的用户性别识别方法,通过获取未知性别用户的应用程序使用数据,从中提取具有性别识别性的特征数据,并应用性别分类模型学习所述特征数据,进而判断用户性别,实现了仅通过用户应用程序使用数据识别用户性别的目的。由于用户应用程序使用数据比较丰富,因此性别识别过程中准确率较高,并且可以解决现有技术中用户性别识别时,可能涉及用户隐私或者成本较高的问题。
实施例二
本实施例以上述实施例为基础,提供一种用户性别识别方法。图2为本发明实施例二提供的一种用户性别识别方法的流程示意图。如图2所示,本实施例提供的用户性别识别方法可以包括如下:
S210、获取已知性别用户的应用程序使用数据。
示例性的,应用程序使用数据可以包括应用程序安装列表和应用程序使用行为中的至少一个。这里,由于已知性别用户的应用程序安装列表可能涉及用户的隐私,出于保护隐私的目的,部分已知性别用户的应用程序安装列表可能是加密存储的,这是将加密存储的应用程序安装列表进行必要的数据格式转换,通过转换解密为相应的已知性别用户的应用程序安装列表。
S220、从所述已知性别用户的应用程序使用数据中提取具有性别识别性的特征数据。
示例性的,从已知性别用户的应用程序使用数据中提取具有性别识别性的特征数据,可以包括下述至少一项:
根据所述应用程序安装列表,提取具有性别识别性的第一特征数据,所述第一特征数据为至少两个设定类别的应用程序的数量;
根据所述应用程序安装列表,提取具有性别识别性的第二特征数据,所述第二特征数据为至少两个应用程序安装人数之间的性别比例;
根据所述应用程序使用行为,提取具有性别识别性的第三特征数据,所述第三特征数据为应用程序中同类使用行为的统计数据。
具体的,根据所述应用程序安装列表,提取具有性别识别性的第一特征数据,所述第一特征数据为至少两个设定类别的应用程序的数量,即根据已知性别用户的应用程序安装列表,提取至少两个设定类别的应用程序的数量。由于应用程序在安装使用的时候已经规定了应用程序的类别,例如百度地图的类别为导航,百度糯米的类别为生活。这里,根据已知性别用户的应用程序安装列表,可以提取诸如导航、生活、娱乐、购物、社交、财务、天气、游戏等各个类别的应用程序的数量,将上述各个类别中至少两个设定类别的应用程序的数量作为第一特征数据。
具体的,根据所述应用程序安装列表,提取具有性别识别性的第二特征数据,所述第二特征数据为至少两个应用程序安装人数之间的性别比例,即根据已知性别用户的应用程序安装列表,提取至少两个应用程序安装人数之间的性别比例。这里,根据大量的已知性别用户的应用程序安装列表,可以提取诸如体育头条、美颜相机、美妆相机等应用程序安装人数之间的性别比例,将上述各个应用程序中至少两个应用程序安装人数之间的性别比例作为第二特征数据。这里,由于部分应用程序可能存在安装人数较少,或者某一性别用户安装人数为零的情况,这样计算出来的应用程序安装人数之间的比例就会存在过小或者过大的问题,此时可以利用拉普拉斯平滑方法,将应用程序的初始安装人数默认值由原先的0改为1。进一步的,当应用程序安装人数之间的性别比例数值过大时,还可以对所述数值进行进一步运算,例如取对数运算,以方便接来下的训练性别分类模型。
具体的,根据所述应用程序使用行为,提取具有性别识别性的第三特征数据,所述第三特征数据为应用程序中同类使用行为的统计数据,即根据已知性别用户的应用程序使用行为,提取应用程序中同类使用行为的统计数据。具体可以是将已知性别用户的各种使用行为进行聚类,形成同类使用行为,然后提取同类使用行为的统计数据。可选的,应用程序中同类使用行为的统计数据可以包括下述至少一项:消费应用程序的消费行为中对消费金额、消费频率和/或消费品分类的统计数量或比例;阅读器应用程序的阅读行为中对阅读内容分类的统计数量或比例;健身应用程序的健身训练行为中,对健身训练内容、健身训练强度和/或健身训练频率的统计数量或比例,将上述同类使用行为的统计数据中的至少一项作为第三特征数据。
S230、根据所述特征数据,训练性别分类模型。
示例性的,根据该特征数据,使用有监督的机器学习方法训练性别分类模型,具体可以是:
根据第一特征数据,基于迭代决策树学习算法和算法参数,生成已知性别用户配置信息,训练迭代决策树模型。
具体的,迭代决策树模型作为一种集成学习算法在特征维度较低时,训练效率高,且准确率较高,这里,根据至少两个设定类别的应用程序的数量,训练迭代决策树模型。
根据所述第一特征数据以及第二特征数据,基于稀疏逻辑回归学习算法和算法参数,生成已知性别用户稀疏逻辑回归配置信息,训练稀疏逻辑回归模型。具体的,由于第二特征数据比较稀疏,常规的逻辑回归可能导致模型过拟合,因此这里采用带L1惩罚项的稀疏逻辑回归模型,基于稀疏逻辑回归学习算法和算法参数,训练稀疏逻辑回归模型。示例性的,通过上述的模型训练,可以得到不同性别用户的模型特征,例如,男性的购物类别应用程序为1-2个,女性的购物类别应用程序为5-6个;男性的游戏类别应用程序为5-6个,女性的游戏类别的应用程序为1-2个。还可以得到典型应用程序安装人数之间的性别比例,例如,体育头条的安装人数男女之间的性别比例为8:1,美颜相机安装人数男女之间的性别比例为1:10。
进一步的,上述模型的特征可以单独用于性别识别,也可以结合用于性别识别。
S240、获取未知性别用户的应用程序使用数据。
S250、从所述未知性别用户的应用程序使用数据中提取具有性别识别性的特征数据。
S260、根据所述未知性别用户的特征数据,基于性别分类模型对未知性别用户进行性别识别,其中,所述性别分类模型为根据已知性别用户的应用程序使用数据的特征数据进行训练而确定。
本发明实施例二提供的用户性别识别方法,通过获取已知性别用户的应用程序使用数据,并从中提取具有性别识别性的特征数据,然后根据该特征数据,训练性别模型,最后通过性别分类模型识别未知性别用户的性别。采用该方法,从已知性别用户的应用程序使用数据中学习有效的性别分类模型,通过行别分类模型识别未知性别用户的性别,性别识别准确率更高。
实施例三
图3为本发明实施例三提供的一种用户性别识别装置的结构框图,该装置可由软件和/或硬件实现。本实施例可适用于想要识别未知性别用户的性别的情况,如图3所示,该装置包括:第一使用数据获取模块310第一特征数据提取模块320以及性别识别模块330。
其中,第一使用数据获取模块310,用于获取未知性别用户的应用程序使用数据;第一特征数据提取模块320,用于从所述未知性别用户的应用程序使用数据中提取具有性别识别性的特征数据;性别识别模块330,用于根据所述未知性别用户的特征数据,基于性别分类模型对未知性别用户进行性别识别,其中,所述性别分类模型为根据已知性别用户的应用程序使用数据的特征数据进行训练而确定。
进一步的,所述应用程序使用数据可以包括:
应用程序安装列表和应用程序使用行为中的至少一个。
进一步的,所述装置还可以包括:
第二使用数据获取模块,用于获取已知性别用户的应用程序使用数据;
第二特征数据提取模块,用于从所述已知性别用户的应用程序使用数据中提取具有性别识别性的特征数据;
模型训练模块,用于根据所述特征数据,训练性别分类模型。
进一步的,第二特征数据提取模块具体用于执行下述至少一项:
根据所述应用程序安装列表,提取具有性别识别性的第一特征数据,所述第一特征数据为至少两个设定类别的应用程序的数量;
根据所述应用程序安装列表,提取具有性别识别性的第二特征数据,所述第二特征数据为至少两个应用程序安装人数之间的性别比例;
根据所述应用程序使用行为,提取具有性别识别性的第三特征数据,所述第三特征数据为应用程序中同类使用行为的统计数据。
进一步的,所述模型训练模块,可以包括:
迭代决策树模型训练子模块,用于根据所述第一特征数据,基于迭代决策树学习算法和算法参数,生成已知性别用户迭代决策树配置信息,训练迭代决策树模型;
稀疏逻辑回归模型训练子模块,用于根据所述第一特征数据以及第二特征数据,基于稀疏逻辑回归学习算法和算法参数,生成已知性别用户稀疏逻辑回归配置信息,训练稀疏逻辑回归模型。
进一步的,所述应用程序中同类使用行为的统计数据可以包括下述至少一项:
消费应用程序的消费行为中对消费金额、消费频率和/或消费品分类的统计数量或比例;
阅读器应用程序的阅读行为中对阅读内容分类的统计数量或比例;
健身应用程序的健身训练行为中,对健身训练内容、健身训练强度和/或健身训练频率的统计数量或比例。
进一步的,所述性别识别模块,可以包括:
迭代决策树模型识别子模块,用于根据所述未知性别用户的第一特征数据,基于迭代决策树学习算法和算法参数,生成未知性别用户迭代决策树配置信息,应用所述迭代决策树模型,识别未知性别用户性别;
稀疏逻辑回归模型识别子模块,用于根据所述未知性别用户的第一特征数据以及第二特征数据,基于稀疏逻辑回归学习算法和算法参数,生成未知性别用户稀疏逻辑回归配置信息,应用稀疏逻辑回归模型,识别未知性别用户性别。
进一步的,所述性别识别模块,具体可以用于:根据所述未知性别用户的特征数据,基于性别分类模型识别所述未知性别用户性别为男或女,以及对应的概率。
本发明实施例三提供的用户性别识别装置,与本发明任意实施例所提供的用户性别识别方法属于同一发明构思,可执行本发明任意实施例所提供的用户性别识别方法,具备执行用户性别识别方法相应的功能模块和有益效果。未在本实施例中详尽描述的技术细节,可参见本发明任意实施例提供的用户性别识别方法。
注意,上述仅为本发明的较佳实施例及所运用技术原理。本领域技术人员会理解,本发明不限于这里所述的特定实施例,对本领域技术人员来说能够进行各种明显的变化、重新调整和替代而不会脱离本发明的保护范围。因此,虽然通过以上实施例对本发明进行了较为详细的说明,但是本发明不仅仅限于以上实施例,在不脱离本发明构思的情况下,还可以包括更多其他等效实施例,而本发明的范围由所附的权利要求范围决定。
Claims (16)
1.一种用户性别识别方法,其特征在于,包括:
获取未知性别用户的应用程序使用数据;
从所述未知性别用户的应用程序使用数据中提取具有性别识别性的特征数据;
根据所述未知性别用户的特征数据,基于性别分类模型对未知性别用户进行性别识别,其中,所述性别分类模型为根据已知性别用户的应用程序使用数据的特征数据进行训练而确定。
2.根据权利要求1所述的方法,其特征在于,所述应用程序使用数据包括:
应用程序安装列表和应用程序使用行为中的至少一个。
3.根据权利要求2所述的方法,其特征在于,还包括:
获取已知性别用户的应用程序使用数据;
从所述已知性别用户的应用程序使用数据中提取具有性别识别性的特征数据;
根据所述特征数据,训练性别分类模型。
4.根据权利要求3所述的方法,其特征在于,从所述已知性别用户的应用程序使用数据中提取具有性别识别性的特征数据,包括下述至少一项:
根据所述应用程序安装列表,提取具有性别识别性的第一特征数据,所述第一特征数据为至少两个设定类别的应用程序的数量;
根据所述应用程序安装列表,提取具有性别识别性的第二特征数据,所述第二特征数据为至少两个应用程序安装人数之间的性别比例;
根据所述应用程序使用行为,提取具有性别识别性的第三特征数据,所述第三特征数据为应用程序中同类使用行为的统计数据。
5.根据权利要求4所述的方法,其特征在于,根据所述特征数据,训练性别分类模型,包括:
根据所述第一特征数据,基于迭代决策树学习算法和算法参数,生成已知性别用户迭代决策树配置信息,训练迭代决策树模型;
根据所述第一特征数据以及第二特征数据,基于稀疏逻辑回归学习算法和算法参数,生成已知性别用户稀疏逻辑回归配置信息,训练稀疏逻辑回归模型。
6.根据权利要求4所述的方法,其特征在于,所述应用程序中同类使用行为的统计数据包括下述至少一项:
消费应用程序的消费行为中对消费金额、消费频率和/或消费品分类的统计数量或比例;
阅读器应用程序的阅读行为中对阅读内容分类的统计数量或比例;
健身应用程序的健身训练行为中,对健身训练内容、健身训练强度和/或健身训练频率的统计数量或比例。
7.根据权利要求5所述的方法,其特征在于,根据所述未知性别用户的特征数据,基于性别分类模型对未知性别用户进行性别识别,包括:
根据所述未知性别用户的第一特征数据,基于迭代决策树学习算法和算法参数,生成未知性别用户迭代决策树配置信息,应用所述迭代决策树模型,识别未知性别用户性别;或
根据所述未知性别用户的第一特征数据以及第二特征数据,基于稀疏逻辑回归学习算法和算法参数,生成未知性别用户稀疏逻辑回归配置信息,应用稀疏逻辑回归模型,识别未知性别用户性别。
8.根据权利要求1所述的方法,其特征在于,根据所述未知性别用户的特征数据,基于性别分类模型对未知性别用户进行性别识别,包括:
根据所述未知性别用户的特征数据,基于性别分类模型识别所述未知性别用户性别为男或女,以及对应的概率。
9.一种用户性别识别装置,其特征在于,包括:
第一使用数据获取模块,用于获取未知性别用户的应用程序使用数据;
第一特征数据提取模块,用于从所述未知性别用户的应用程序使用数据中提取具有性别识别性的特征数据;
性别识别模块,用于根据所述未知性别用户的特征数据,基于性别分类模型对未知性别用户进行性别识别,其中,所述性别分类模型为根据已知性别用户的应用程序使用数据的特征数据进行训练而确定。
10.根据权利要求9所述的装置,其特征在于,所述应用程序使用数据包括:
应用程序安装列表和应用程序使用行为中的至少一个。
11.根据权利要求10所述的装置,其特征在于,还包括:
第二使用数据获取模块,用于获取已知性别用户的应用程序使用数据;
第二特征数据提取模块,用于从所述已知性别用户的应用程序使用数据中提取具有性别识别性的特征数据;
模型训练模块,用于根据所述特征数据,训练性别分类模型。
12.根据权利要求11所述的装置,其特征在于,第二特征数据提取模块具体用于执行下述至少一项:
根据所述应用程序安装列表,提取具有性别识别性的第一特征数据,所述第一特征数据为至少两个设定类别的应用程序的数量;
根据所述应用程序安装列表,提取具有性别识别性的第二特征数据,所述第二特征数据为至少两个应用程序安装人数之间的性别比例;
根据所述应用程序使用行为,提取具有性别识别性的第三特征数据,所述第三特征数据为应用程序中同类使用行为的统计数据。
13.根据权利要求12所述的装置,其特征在于,所述模型训练模块,包括:
迭代决策树模型训练子模块,用于根据所述第一特征数据,基于迭代决策树学习算法和算法参数,生成已知性别用户迭代决策树配置信息,训练迭代决策树模型;
稀疏逻辑回归模型训练子模块,用于根据所述第一特征数据以及第二特征数据,基于稀疏逻辑回归学习算法和算法参数,生成已知性别用户稀疏逻辑回归配置信息,训练稀疏逻辑回归模型。
14.根据权利要求12所述的装置,其特征在于,所述应用程序中同类使用行为的统计数据包括下述至少一项:
消费应用程序的消费行为中对消费金额、消费频率和/或消费品分类的统计数量或比例;
阅读器应用程序的阅读行为中对阅读内容分类的统计数量或比例;
健身应用程序的健身训练行为中,对健身训练内容、健身训练强度和/或健身训练频率的统计数量或比例。
15.根据权利要求13所述的装置,其特征在于,所述性别识别模块,包括:
迭代决策树模型识别子模块,用于根据所述未知性别用户的第一特征数据,基于迭代决策树学习算法和算法参数,生成未知性别用户迭代决策树配置信息,应用所述迭代决策树模型,识别未知性别用户性别;
稀疏逻辑回归模型识别子模块,用于根据所述未知性别用户的第一特征数据以及第二特征数据,基于稀疏逻辑回归学习算法和算法参数,生成未知性别用户稀疏逻辑回归配置信息,应用稀疏逻辑回归模型,识别未知性别用户性别。
16.根据权利要求9所述的装置,其特征在于,所述性别识别模块具体用于:根据所述未知性别用户的特征数据,基于性别分类模型识别所述未知性别用户性别为男或女,以及对应的概率。
Priority Applications (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201510965231.0A CN106897727A (zh) | 2015-12-21 | 2015-12-21 | 一种用户性别识别方法及装置 |
PCT/CN2016/087685 WO2017107422A1 (zh) | 2015-12-21 | 2016-06-29 | 一种用户性别识别方法及装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201510965231.0A CN106897727A (zh) | 2015-12-21 | 2015-12-21 | 一种用户性别识别方法及装置 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN106897727A true CN106897727A (zh) | 2017-06-27 |
Family
ID=59088930
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201510965231.0A Pending CN106897727A (zh) | 2015-12-21 | 2015-12-21 | 一种用户性别识别方法及装置 |
Country Status (2)
Country | Link |
---|---|
CN (1) | CN106897727A (zh) |
WO (1) | WO2017107422A1 (zh) |
Cited By (12)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN107766891A (zh) * | 2017-10-31 | 2018-03-06 | 广东欧珀移动通信有限公司 | 用户性别识别方法、装置、存储介质及电子设备 |
CN107886366A (zh) * | 2017-11-22 | 2018-04-06 | 深圳市金立通信设备有限公司 | 性别分类模型的生成方法、性别填充方法、终端及存储介质 |
CN108564380A (zh) * | 2018-04-11 | 2018-09-21 | 重庆大学 | 一种基于迭代决策树的电信用户分类方法 |
CN108596241A (zh) * | 2018-04-20 | 2018-09-28 | 西北工业大学 | 一种基于多维感知数据的用户性别快速分类方法 |
CN109145932A (zh) * | 2017-06-28 | 2019-01-04 | 中兴通讯股份有限公司 | 用户性别预测方法、装置及设备 |
WO2019120023A1 (zh) * | 2017-12-22 | 2019-06-27 | Oppo广东移动通信有限公司 | 性别预测方法、装置、存储介质及电子设备 |
CN110020167A (zh) * | 2017-12-22 | 2019-07-16 | 广东欧珀移动通信有限公司 | 用户性别识别方法、装置、存储介质及电子设备 |
CN110287809A (zh) * | 2019-06-03 | 2019-09-27 | Oppo广东移动通信有限公司 | 图像处理方法及相关产品 |
CN110555451A (zh) * | 2018-05-31 | 2019-12-10 | 北京京东尚科信息技术有限公司 | 信息识别方法和装置 |
CN110851759A (zh) * | 2019-10-31 | 2020-02-28 | 上海连尚网络科技有限公司 | 一种识别新用户的性别的方法及设备 |
CN111078742A (zh) * | 2019-12-09 | 2020-04-28 | 秒针信息技术有限公司 | 用户分类模型训练方法、用户分类方法及装置 |
CN112541010A (zh) * | 2019-09-23 | 2021-03-23 | 银橙(上海)信息技术有限公司 | 一种基于逻辑回归的用户性别预测方法 |
Families Citing this family (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN107704547B (zh) * | 2017-09-26 | 2022-01-14 | 英望科技(山东)有限公司 | 一种通过手机使用行为识别性别的方法 |
CN110020155A (zh) * | 2017-12-06 | 2019-07-16 | 广东欧珀移动通信有限公司 | 用户性别识别方法及装置 |
Citations (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101968802A (zh) * | 2010-09-30 | 2011-02-09 | 百度在线网络技术(北京)有限公司 | 一种基于用户浏览行为进行互联网内容推荐的方法与设备 |
CN102541590A (zh) * | 2011-12-14 | 2012-07-04 | 奇智软件(北京)有限公司 | 一种软件推荐方法及推荐*** |
CN103164470A (zh) * | 2011-12-15 | 2013-06-19 | 盛大计算机(上海)有限公司 | 基于用户性别判别结果的定向应用方法及其*** |
CN104318255A (zh) * | 2014-11-17 | 2015-01-28 | 成都品果科技有限公司 | 一种移动拍照类app用户的性别识别方法及*** |
US20150074656A1 (en) * | 2013-09-11 | 2015-03-12 | David Eramian | Preconfigured Application Install |
CN104794115A (zh) * | 2014-01-16 | 2015-07-22 | 腾讯科技(深圳)有限公司 | 应用推荐方法和*** |
CN104933075A (zh) * | 2014-03-20 | 2015-09-23 | 百度在线网络技术(北京)有限公司 | 用户属性预测平台和方法 |
CN105160016A (zh) * | 2015-09-25 | 2015-12-16 | 百度在线网络技术(北京)有限公司 | 用户属性的获取方法及装置 |
Family Cites Families (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20060173556A1 (en) * | 2005-02-01 | 2006-08-03 | Outland Research,. Llc | Methods and apparatus for using user gender and/or age group to improve the organization of documents retrieved in response to a search query |
CN103838884B (zh) * | 2014-03-31 | 2017-03-01 | 联想(北京)有限公司 | 信息处理设备以及信息处理方法 |
CN104102819B (zh) * | 2014-06-27 | 2017-12-19 | 北京奇艺世纪科技有限公司 | 一种用户自然属性的确定方法和装置 |
-
2015
- 2015-12-21 CN CN201510965231.0A patent/CN106897727A/zh active Pending
-
2016
- 2016-06-29 WO PCT/CN2016/087685 patent/WO2017107422A1/zh active Application Filing
Patent Citations (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101968802A (zh) * | 2010-09-30 | 2011-02-09 | 百度在线网络技术(北京)有限公司 | 一种基于用户浏览行为进行互联网内容推荐的方法与设备 |
CN102541590A (zh) * | 2011-12-14 | 2012-07-04 | 奇智软件(北京)有限公司 | 一种软件推荐方法及推荐*** |
CN103164470A (zh) * | 2011-12-15 | 2013-06-19 | 盛大计算机(上海)有限公司 | 基于用户性别判别结果的定向应用方法及其*** |
US20150074656A1 (en) * | 2013-09-11 | 2015-03-12 | David Eramian | Preconfigured Application Install |
CN104794115A (zh) * | 2014-01-16 | 2015-07-22 | 腾讯科技(深圳)有限公司 | 应用推荐方法和*** |
CN104933075A (zh) * | 2014-03-20 | 2015-09-23 | 百度在线网络技术(北京)有限公司 | 用户属性预测平台和方法 |
CN104318255A (zh) * | 2014-11-17 | 2015-01-28 | 成都品果科技有限公司 | 一种移动拍照类app用户的性别识别方法及*** |
CN105160016A (zh) * | 2015-09-25 | 2015-12-16 | 百度在线网络技术(北京)有限公司 | 用户属性的获取方法及装置 |
Non-Patent Citations (5)
Title |
---|
中国海洋工程学会: "《第十五届中国海洋(岸)工程学术讨论会论文集》", 31 July 2011, 海洋出版社 * |
刘尊雄等: "基于内点法的稀疏逻辑回归财务预警模型", 《计算机工程与设计》 * |
庄城山等: "《计算机网络基础》", 31 January 2011, 安徽科学技术出版社 * |
王冲等: "《现代信息检索技术基础原理教程》", 30 November 2013, 西安电子科技大学出版社 * |
王忠珂等: "一种PE文件特征提取方法研究与实现", 《第十届中国通信学会学术年会》 * |
Cited By (19)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN109145932A (zh) * | 2017-06-28 | 2019-01-04 | 中兴通讯股份有限公司 | 用户性别预测方法、装置及设备 |
CN107766891B (zh) * | 2017-10-31 | 2020-05-12 | Oppo广东移动通信有限公司 | 用户性别识别方法、装置、存储介质及电子设备 |
CN107766891A (zh) * | 2017-10-31 | 2018-03-06 | 广东欧珀移动通信有限公司 | 用户性别识别方法、装置、存储介质及电子设备 |
WO2019085743A1 (zh) * | 2017-10-31 | 2019-05-09 | Oppo广东移动通信有限公司 | 用户性别识别方法、装置、存储介质及电子设备 |
CN107886366A (zh) * | 2017-11-22 | 2018-04-06 | 深圳市金立通信设备有限公司 | 性别分类模型的生成方法、性别填充方法、终端及存储介质 |
CN110020167B (zh) * | 2017-12-22 | 2022-01-07 | Oppo广东移动通信有限公司 | 用户性别识别方法、装置、存储介质及电子设备 |
WO2019120023A1 (zh) * | 2017-12-22 | 2019-06-27 | Oppo广东移动通信有限公司 | 性别预测方法、装置、存储介质及电子设备 |
CN110020167A (zh) * | 2017-12-22 | 2019-07-16 | 广东欧珀移动通信有限公司 | 用户性别识别方法、装置、存储介质及电子设备 |
CN108564380B (zh) * | 2018-04-11 | 2021-07-20 | 重庆大学 | 一种基于迭代决策树的电信用户分类方法 |
CN108564380A (zh) * | 2018-04-11 | 2018-09-21 | 重庆大学 | 一种基于迭代决策树的电信用户分类方法 |
CN108596241A (zh) * | 2018-04-20 | 2018-09-28 | 西北工业大学 | 一种基于多维感知数据的用户性别快速分类方法 |
CN108596241B (zh) * | 2018-04-20 | 2022-05-13 | 西北工业大学 | 一种基于多维感知数据的用户性别快速分类方法 |
CN110555451A (zh) * | 2018-05-31 | 2019-12-10 | 北京京东尚科信息技术有限公司 | 信息识别方法和装置 |
CN110287809A (zh) * | 2019-06-03 | 2019-09-27 | Oppo广东移动通信有限公司 | 图像处理方法及相关产品 |
CN110287809B (zh) * | 2019-06-03 | 2021-08-24 | Oppo广东移动通信有限公司 | 图像处理方法及相关产品 |
CN112541010B (zh) * | 2019-09-23 | 2023-05-23 | 银橙(上海)信息技术有限公司 | 一种基于逻辑回归的用户性别预测方法 |
CN112541010A (zh) * | 2019-09-23 | 2021-03-23 | 银橙(上海)信息技术有限公司 | 一种基于逻辑回归的用户性别预测方法 |
CN110851759A (zh) * | 2019-10-31 | 2020-02-28 | 上海连尚网络科技有限公司 | 一种识别新用户的性别的方法及设备 |
CN111078742A (zh) * | 2019-12-09 | 2020-04-28 | 秒针信息技术有限公司 | 用户分类模型训练方法、用户分类方法及装置 |
Also Published As
Publication number | Publication date |
---|---|
WO2017107422A1 (zh) | 2017-06-29 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN106897727A (zh) | 一种用户性别识别方法及装置 | |
CN107678845B (zh) | 应用程序管控方法、装置、存储介质及电子设备 | |
CN108595519A (zh) | 热点事件分类方法、装置及存储介质 | |
CN111475613A (zh) | 案件分类方法、装置、计算机设备及存储介质 | |
US11144800B2 (en) | Image disambiguation method and apparatus, storage medium, and electronic device | |
CN107679144A (zh) | 基于语义相似度的新闻语句聚类方法、装置及存储介质 | |
CN106295591A (zh) | 基于人脸图像的性别识别方法及装置 | |
CN110084610A (zh) | 一种基于孪生神经网络的网络交易欺诈检测*** | |
CN106682686A (zh) | 一种基于手机上网行为的用户性别预测方法 | |
CN104573048B (zh) | 一种基于智能手机流量数据的用户基础属性预测方法 | |
CN105389486B (zh) | 一种基于鼠标行为的认证方法 | |
CN109978033A (zh) | 同操作人识别模型的构建与同操作人识别的方法和装置 | |
Wang et al. | Interactive social recommendation | |
CN107517394A (zh) | 识别非法用户的方法、装置及计算机可读存储介质 | |
CN107424007A (zh) | 一种构建电子券敏感度识别模型的方法和装置 | |
CN103544486A (zh) | 基于自适应标记分布的人类年龄估计方法 | |
CN103631874B (zh) | 社交平台的ugc标签类别确定方法和装置 | |
CN109086794B (zh) | 一种基于t-lda主题模型的驾驶行为模式识方法 | |
CN103810162A (zh) | 推荐网络信息的方法和*** | |
CN110175851A (zh) | 一种作弊行为检测方法及装置 | |
CN109948735A (zh) | 一种多标签分类方法、***、装置及存储介质 | |
CN104126188A (zh) | 关键字检测装置、其控制方法及控制程序,以及显示设备 | |
US20130218876A1 (en) | Method and apparatus for enhancing context intelligence in random index based system | |
CN112348417A (zh) | 一种基于主成分分析算法的营销价值评估方法及装置 | |
CN111881901A (zh) | 截图内容检测方法、设备及计算机可读存储介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
RJ01 | Rejection of invention patent application after publication |
Application publication date: 20170627 |
|
RJ01 | Rejection of invention patent application after publication |