CN113268654A - 一种用户性别识别方法、装置及电子设备 - Google Patents

一种用户性别识别方法、装置及电子设备 Download PDF

Info

Publication number
CN113268654A
CN113268654A CN202010097122.2A CN202010097122A CN113268654A CN 113268654 A CN113268654 A CN 113268654A CN 202010097122 A CN202010097122 A CN 202010097122A CN 113268654 A CN113268654 A CN 113268654A
Authority
CN
China
Prior art keywords
user
browsing
gender
categories
category
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202010097122.2A
Other languages
English (en)
Inventor
唐靖
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing Sogou Technology Development Co Ltd
Original Assignee
Beijing Sogou Technology Development Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing Sogou Technology Development Co Ltd filed Critical Beijing Sogou Technology Development Co Ltd
Priority to CN202010097122.2A priority Critical patent/CN113268654A/zh
Publication of CN113268654A publication Critical patent/CN113268654A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/953Querying, e.g. by the use of web search engines
    • G06F16/9535Search customisation based on user profiles and personalisation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/906Clustering; Classification
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/24Classification techniques

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Databases & Information Systems (AREA)
  • Data Mining & Analysis (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • Artificial Intelligence (AREA)
  • Evolutionary Computation (AREA)
  • Evolutionary Biology (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本发明公开了一种用户性别识别方法、装置及电子设备,该方法包括:获取用户在预设时间段内的历史浏览行为数据;获取每条所述历史浏览行为数据对应的网页所属类目,其中,所述类目包括女性类目和男性类目;基于所述历史浏览行为数据和所述类目,获取用户对属于所述女性类目的网页的第一浏览次数和第一点击次数,以及用户对属于所述男性类目的网页的第二浏览次数和第二点击次数;基于所述第一浏览次数、所述第一点击次数、所述第二浏览次数以及所述第二点击次数,通过预先训练好的分类模型进行用户性别识别,获得用户性别识别结果,实现了用户性别识别的智能化,提高了用户性别识别的准确率。

Description

一种用户性别识别方法、装置及电子设备
技术领域
本发明涉及软件技术领域,特别涉及一种用户性别识别方法、装置及电子设备。
背景技术
用户性别一方面作为广告CTR(Click-Through-Rate,点击通过率)预估中的用户特征中的一种,对提升广告CTR预估的准确性起到非常重要的作用,尤其是针对电商平台以及信息流的广告CTR预估;另一方面,用户性别也是构建用户画像体系不可缺少的一项。
然而,目前大多数情况下,电子设备向用户提供个人基本信息详情页,由用户对其性别进行填写,由此获取用户性别,这种方式对用户的依赖性较大,并且,很多用户往往不愿意填写个人基本信息或者错填个人基本信息,导致电子设备无法获取或者无法准确获取全部用户的性别数据,亟需一种新的方法来获取用户性别。
发明内容
本发明实施例提供一种用户性别识别方法、装置及电子设备,用于实现用户性别的智能获取,提高用户性别获取的准确性。
第一方面,本发明实施例提供一种用户性别识别方法,所述方法包括:
获取用户在预设时间段内的历史浏览行为数据;
获取每条所述历史浏览行为数据对应的网页所属类目,其中,所述类目包括女性类目和男性类目;
基于所述历史浏览行为数据和所述类目,获取用户对属于所述女性类目的网页的第一浏览次数和第一点击次数,以及用户对属于所述男性类目的网页的第二浏览次数和第二点击次数;
基于所述第一浏览次数、所述第一点击次数、所述第二浏览次数以及所述第二点击次数,通过预先训练好的分类模型进行用户性别识别,获得用户性别识别结果。
可选的,基于所述第一浏览次数、所述第一点击次数、所述第二浏览次数以及所述第二点击次数,通过预先训练好的分类模型进行用户性别识别,获得用户性别识别结果,包括:
获得如下参数作为模型输入参数:
所述第一浏览次数与用户对所有网页的总浏览次数之间的第一比值、所述第一点击次数与用户对所有网页的总点击次数之间的第二比值、所述第二浏览次数与所述总浏览次数之间的第三比值以及所述第二点击次数与所述总点击次数之间的第四比值;
将所述模型输入参数输入所述分类模型进行用户性别识别,获得用户性别识别结果。
可选的,所述分类模型的训练方法包括:
获取训练样本集;
针对每个训练样本,根据用户对属于女性类目的网页的第一点击次数和对属于男性类目的网页的第二点击次数获得用户性别倾向权重;
根据所述用户性别倾向权重对所述每个训练样本进行性别标注,获得所述每个训练样本的性别标签;
根据所述训练样本集和每个训练样本的性别标签进行分类模型训练。
可选的,所述分类模型采用的分类算法为梯度提升决策树、随机森林或极端梯度提升。
可选的,所述方法还包括:
根据所述用户性别识别结果,在用户画像中增加用户性别特征;和/或,
根据所述用户性别识别结果,对用户进行网页推荐。
可选的,历史浏览行为数据为广告浏览行为数据;
所述获取每条所述历史浏览行为数据对应的网页所属类目,包括:
获取每条广告浏览行为数据对应的网页提供的广告商品和/或服务所属三级基础类目;
根据所述三级基础类目获得每条广告浏览行为数据对应的网页所属性别类目。
第二方面,本发明实施例提供一种用户性别识别装置,所述装置包括:
获取单元,用于获取用户在预设时间段内的历史浏览行为数据;
类目单元,用于获取每条所述历史浏览行为数据对应的网页所属类目,其中,所述类目包括女性类目和男性类目;
统计单元,用于基于所述历史浏览行为数据和所述类目,获取用户对属于所述女性类目的网页的第一浏览次数和第一点击次数,以及用户对属于所述男性类目的网页的第二浏览次数和第二点击次数;
识别单元,用于基于所述第一浏览次数、所述第一点击次数、所述第二浏览次数以及所述第二点击次数,通过预先训练好的分类模型进行用户性别识别,获得用户性别识别结果。
可选的,所述识别单元用于:
获得如下参数作为模型输入参数:
所述第一浏览次数与用户对所有网页的总浏览次数之间的第一比值、所述第一点击次数与用户对所有网页的总点击次数之间的第二比值、所述第二浏览次数与所述总浏览次数之间的第三比值以及所述第二点击次数与所述总点击次数之间的第四比值;
将所述模型输入参数输入所述分类模型进行用户性别识别,获得用户性别识别结果。
可选的,所述装置还包括训练单元,用于:
获取训练样本集;
针对每个训练样本,根据用户对属于女性类目的网页的第一点击次数和对属于男性类目的网页的第二点击次数获得用户性别倾向权重;
根据所述用户性别倾向权重对所述每个训练样本进行性别标注,获得所述每个训练样本的性别标签;
根据所述训练样本集和每个训练样本的性别标签进行分类模型训练。
可选的,所述分类模型采用的分类算法为梯度提升决策树、随机森林或极端梯度提升。
可选的,所述装置还包括:
应用单元,用于根据所述用户性别识别结果,在用户画像中增加用户性别特征;和/或,根据所述用户性别识别结果,对用户进行网页推荐。
可选的,历史浏览行为数据为广告浏览行为数据;
所述类目单元用于:
获取每条广告浏览行为数据对应的网页提供的广告商品和/或服务所属三级基础类目;根据所述三级基础类目获得每条广告浏览行为数据对应的网页所属性别类目。
第三方面,本发明实施例还提供一种电子设备,包括有存储器,以及一个或者一个以上的程序,其中一个或者一个以上的程序存储于存储器中,且经配置以由一个或者一个以上处理器执行所述一个或者一个以上的程序所包含的用于进行如第一方面任一所述的方法对应的操作指令。
第四方面,本发明实施例提供一种计算机可读存储介质,其上存储有计算机程序,该程序被处理器执行时实现如权利要1~6任一所述的方法的步骤。
本申请实施例中的上述一个或多个技术方案,至少具有如下技术效果:
本申请实施例提供一种用户性别识别方法,通过获取用户在预设时间段内的历史浏览行为数据;以及获取每条历史浏览行为数据对应的网页所属类目,其中,所述类目包括女性类目和男性类目;基于历史浏览行为数据和所述类目,获取用户对属于女性类目的网页的第一浏览次数和第一点击次数,以及用户对属于所述男性类目的网页的第二浏览次数和第二点击次数;基于第一浏览次数、第一点击次数、第二浏览次数以及第二点击次数,通过预先训练好的分类模型进行用户性别识别,获得用户性别识别结果,从而实现用户性别的智能获取,减少了用户性别获取对人工设置的依赖性,并且,通过对用户浏览和点击的网页所属的男性类目、女性类目进行获取,获得用户的真实性别倾向来进行用户性别识别,提高了用户性别识别的准确性。
附图说明
图1为本申请实施例提供的一种用户性别识别方法的流程示意图;
图2为本申请实施例提供的一种用户性别识别装置的方框图;
图3为本申请实施例提供的一种电子设备的结构示意图。
具体实施方式
在本申请实施例提供的技术方案中,提供一种用户性别识别方法,通过获取用户在男性类目网页和女性类目网页上的浏览和点击参数,由预先训练好的分类模型进行用户性别识别,从而实现用户性别的智能获取,提高用户性别识别的准确性。
下面结合附图对本申请实施例技术方案的主要实现原理、具体实施方式及其对应能够达到的有益效果进行详细的阐述。
实施例
本申请实施例提供一种用户性别识别方法,可应用于浏览器、电商平台等需要使用用户性别信息的平台,基于广告浏览行为或在电商平台上的商品浏览行为进行用户性别识别。请参考图1,该用户性别识别方法包括:
S10、获取用户在预设时间段内的历史浏览行为数据;
S12、获取每条历史浏览行为数据对应的网页所属类目,其中,所述类目包括女性类目和男性类目;
S14、基于历史浏览行为数据和所述类目,获取用户对属于女性类目的网页的第一浏览次数和第一点击次数,以及用户对属于男性类目的网页的第二浏览次数和第二点击次数;
S16、基于第一浏览次数、第一点击次数、第二浏览次数以及第二点击次数,通过预先训练好的分类模型进行用户性别识别,获得用户性别识别结果。
具体实施过程中,S10中预设时间段可以是最近一个周、一个月、三个月等。历史浏览行为数据可以是广告浏览行为数据或电商平台上的商品浏览行为数据。每条历史浏览行为数据中包括浏览时间、浏览过的网页以及点击过的网页等,浏览过的网页是指被电子设备展现过的网页,包括网页标题、网页链接或网页关键字的展现,点击过的网页是指用户点击网页链接并打开过的网页。例如:用户搜索关键字“高领毛衣”,电子设备搜索获得搜索结果并展现了其中5个网页结果A1~A5,用户点击打开了网页A1,那么用户浏览过的网页为A1~A5,用户点击过的网页为A1。
针对历史浏览行为数据中包含的每一个网页,执行S12获取该网页所属的类目。每个网页根据其所提供的商品、内容或服务,被划分到不同的三级基础类目下,例如:一个口红推荐网页,根据其提供的商品“口红”,该网页被划分到“彩妆”类目下。很多三级基础类目都具有性别倾向,如类目“彩妆”、“女鞋”、“孕妇装”等,关注这些类目的用户大部分为女性,因此又将具有女性倾向的网页划分到女性类目下,将具有男性倾向的网页划分到男性类目下。在获取历史浏览行为记录对应的网页所属类目时,可以先获得网页所属的三级基础类目,再根据其所属的三级基础类目来获得其所属的性别类目。如针对广告浏览行为数据,可以先获取每条广告浏览行为数据对应的网页提供的广告商品和/或服务所属三级基础类目;再根据其所属三级基础类目获得每条广告浏览行为数据对应的网页所属性别类目。
在S12获得网页所属类目之后,执行S14对用户浏览、点击过的网页分类目统计。其中,基于历史浏览行为数据和历史行为数据对应的网页所属的类目,可以统计获取用户对属于女性类目的网页的第一浏览次数N11和第一点击次数C11,以及用户对属于男性类目的网页的第二浏览次数N21和第二点击次数C21。进一步的,S12还可以基于历史浏览行为数据,统计获得用户对所有网页的总浏览次数Ns和总点击次数Cs
分类目统计获得的参数第一浏览次数N11、第一点击次数C11、第二浏览次数N21及第二点击次数C21,能够真实的反映用户的性别倾向,据此执行S16基于参数N11、C11、N21及C21,通过预先训练好的分类模型进行用户性别识别,获得用户性别识别结果,以实现用户性别的智能之别。具体的,可以直接将参数N11、C11、N21及C21作为模型输入参数输入预先训练好的分类模型进行用户性别识别,也可以基于参数N11、C11、N21及C21获得如下参数作为模型输入参数:
浏览女性类目次数/总浏览类目次数,即第一浏览次数N11与用户对所有网页的总浏览次数Ns之间的第一比值N11/Ns
点击女性类目次数/总点击类目次数,即所述第一点击次数C11与用户对所有网页的总点击次数Cs之间的第二比值C11/Cs
浏览男性类目次数/总浏览类目次数,即所述第二浏览次数N21与所述总浏览次数Ns之间的第三比值N21/Ns;以及
点击女性类目次数/总点击类目次数,即所述第二点击次数C21与所述总点击次数Cs之间的第四比值C21/Cs
将获得的模型输入参数输入预先训练好的分类模型进行用户性别识别,获得用户性别识别结果。为了增加用户性别识别的准确性,还可以将用户对所有网页的总浏览次数Ns、总点击次数Cs、第一浏览次数N11、第一点击次数C11、第二浏览次数N21及第二点击次数C21、第一比值N11/Ns、第二比值C11/Cs、第三比值N21/Ns以及第四比值C21/Cs作为模型输入参数输入分类识别模型进行用户性别识别。需要说明的是,用于用户性别识别的参数不限于上述形式,只要是基于参数N11、C11、N21及C21的变化能够真实反映用户性别倾向,与分类模型训练时的模式参数一致即可。
预先训练好的分类模型可以是通过如下方法训练获得:
①、获取训练样本集。
获取大量用户的历史浏览行为数据即历史浏览行为日志,基于该历史浏览行为日志获取每个用户浏览及点击过的网页所属的三级基础类目,并分别获得个三级基础类目的浏览及点击次数。
针对每个用户的历史浏览行为日志,获得用户历史浏览及点击网页的如下参数:总浏览次数、总点击次数、浏览属于女性类目的网页第一浏览次数、浏览属于男性类目网页的第二浏览次数、第一浏览次数/总浏览次数、第二浏览次数/总浏览次数、点击属于女性类目的网页的第一点击次数、点击属于男性类目的网页的第二点击次数、第一点击次数/总点击次数,第二点击次数/总点击次数等。从每个用户的上述参数中选取模型输入参数作为一个训练样本。其中,模型输入参数可以是第一浏览次数、第二浏览次数、第一点击次数以及第二点击次数,也可以是总浏览次数、总点击次数、第一浏览次数/总浏览次数、第二浏览次数/总浏览次数、第一点击次数/总点击次数,第二点击次数/总点击次数;还可以是上述所有参数。
②、给每个用户打上性别标签。
针对每个训练样本,根据用户对属于女性类目的网页的点击次数和对属于男性类目的网页的点击次数获得用户性别倾向权重。具体的,针对每个训练样本,获得用户浏览并点击网页的总次数Cs,获得用户点击属于女性类目的网页的点击次数即第一点击次数C11、用户浏览属于女性类目的网页的浏览次数即第一浏览次数N11;获得用户点击属于男性类目的网页的点击次数即第二点击次数C21、用户浏览属于男性类目的网页的浏览次数即第二浏览次数N21;分别计算C11/Cs、C21/Cs的比值作为用户性别倾向权重即女性倾向权重和男性倾向权重,或者,分别计算C11/(N11+N21)、C21/(N11+N21)的比值作为用户性别倾向权重。
根据获得的用户性别倾向权重对每个训练样本进行性别标注,获得每个训练样本的性别标签。具体的,若用户性别倾向权重中女性倾向权重大于男性倾向权重,对该训练样本进行女性标注,获得该训练样本的性别标签为女性;若用户性别倾向权重中女性倾向权重小于男性倾向权重,对该训练样本进行男性标注,获得该训练样本的性别标签为男性;若用户性别倾向权重中女性倾向权重等于男性倾向权重,丢弃该训练样本。通过上述方法对训练样本进行标注,实现了样本标注的智能化,减少了人工标注的工作量,提高了标注效率,降低了模型训练成本。
③、根据①获得的训练样本集和②获得的每个训练样本的性别标签进行分类模型训练。其中,分类模型采用的分类算法可以为梯度提升决策树(Gradient BoostingDecision Tree,GBDT)、随机森林或极端梯度提升(eXtreme Gradient Boosting,XGBOOST)等。
基于预先训练好的分类模型,S16将获得模型输入参数输入该分类模型中,即可获得用户性别识别结果。根据获得的用户性别识别结果,可以在用户画像中增加用户性别特征。若用户性别识别结果表明用户性别为“男”的概率更大,那么在用户画像特征中增加性别特征“男”;相应的,若用户性别识别结果表明用户性别为“女”的概率更大,那么在用户画像特征中增加性别特征“女”,以完善用户画像,以便为用户提供有针对性的服务。进一步的,还可以根据用户性别识别结果,对用户进行网页推荐,选择与用户性别相符的女性类目或男性类目网页进行推荐,以提高广告、电商等网页推荐的CTR预估的准确性。
在上述实施例中,通过对用户浏览及点击的网页进行类目划分,获得表征用户性别倾向的行为参数,包括:对女性类目、男性类目网页的浏览次数及点击次数,据此通过预先训练好的分类模型进行用户性别识别,获得用户性别识别结果,从而实现用户性别的智能获取,减少了用户性别获取对人工设置的依赖性,并且,通过对用户浏览和点击的网页所属的男性类目、女性类目进行获取,获得用户的真实性别倾向来进行用户性别识别,提高了用户性别识别的准确性。另外,本实施例还通过用户对女性类目、男性类目网页的浏览次数及点击次数来对用户性别识别的训练样本进行标注,大大减少模型训练时样本标注的人工和时间成本,提高了模型训练的效率。
针对上述实施例提供一种用户性别识别方法,本申请实施例还对应提供一种用户性别识别装置,请参考图2,该装置包括:
获取单元21,用于获取用户在预设时间段内的历史浏览行为数据;
类目单元22,用于获取每条所述历史浏览行为数据对应的网页所属类目,其中,所述类目包括女性类目和男性类目;
统计单元23,用于基于所述历史浏览行为数据和所述类目,获取用户对属于所述女性类目的网页的第一浏览次数和第一点击次数,以及用户对属于所述男性类目的网页的第二浏览次数和第二点击次数;
识别单元24,用于基于所述第一浏览次数、所述第一点击次数、所述第二浏览次数以及所述第二点击次数,通过预先训练好的分类模型进行用户性别识别,获得用户性别识别结果。
作为一种可选的实施方式,所述识别单元24用于:获得如下参数作为模型输入参数:所述第一浏览次数与用户对所有网页的总浏览次数之间的第一比值、所述第一点击次数与用户对所有网页的总点击次数之间的第二比值、所述第二浏览次数与所述总浏览次数之间的第三比值以及所述第二点击次数与所述总点击次数之间的第四比值;将所述模型输入参数输入所述分类模型进行用户性别识别,获得用户性别识别结果。
作为一种可选的实施方式,所述装置还包括训练单元25,用于获取训练样本集;针对每个训练样本,根据用户对属于女性类目的网页的第一点击次数和对属于男性类目的网页的第二点击次数获得用户性别倾向权重;根据所述用户性别倾向权重对所述每个训练样本进行性别标注,获得所述每个训练样本的性别标签;根据所述训练样本集和每个训练样本的性别标签进行分类模型训练。
作为一种可选的实施方式,所述分类模型采用的分类算法为梯度提升决策树、随机森林或极端梯度提升。
作为一种可选的实施方式,所述装置还包括:应用单元26,用于根据所述用户性别识别结果,在用户画像中增加用户性别特征;和/或,根据所述用户性别识别结果,对用户进行网页推荐。
作为一种可选的实施方式,历史浏览行为数据为广告浏览行为数据;
所述类目单元22用于:获取每条广告浏览行为数据对应的网页提供的广告商品和/或服务所属三级基础类目;根据所述三级基础类目获得每条广告浏览行为数据对应的网页所属性别类目。
关于上述实施例中的装置,其中各个模块执行操作的具体方式已经在有关该方法的实施例中进行了详细描述,此处将不做详细阐述说明。
图3是根据一示例性实施例示出的一种用于实现用户性别识别方法的电子设备800的框图。例如,电子设备800可以是移动电话,计算机,数字广播终端,消息收发设备,游戏控制台,平板设备,医疗设备,健身设备,个人数字助理等。
参照图3,电子设备800可以包括以下一个或多个组件:处理组件802,存储器804,电源组件806,多媒体组件808,音频组件810,输入/展现(I/O)的接口812,传感器组件814,以及通信组件816。
处理组件802通常控制电子设备800的整体操作,诸如与显示,电话呼叫,数据通信,相机操作和记录操作相关联的操作。处理元件802可以包括一个或多个处理器820来执行指令,以完成上述的方法的全部或部分步骤。此外,处理组件802可以包括一个或多个模块,便于处理组件802和其他组件之间的交互。例如,处理部件802可以包括多媒体模块,以方便多媒体组件808和处理组件802之间的交互。
存储器804被配置为存储各种类型的数据以支持在设备800的操作。这些数据的示例包括用于在电子设备800上操作的任何应用程序或方法的指令,联系人数据,电话簿数据,消息,图片,视频等。存储器804可以由任何类型的易失性或非易失性存储设备或者它们的组合实现,如静态随机存取存储器(SRAM),电可擦除可编程只读存储器(EEPROM),可擦除可编程只读存储器(EPROM),可编程只读存储器(PROM),只读存储器(ROM),磁存储器,快闪存储器,磁盘或光盘。
电源组件806为电子设备800的各种组件提供电力。电源组件806可以包括电源管理***,一个或多个电源,及其他与为电子设备800生成、管理和分配电力相关联的组件。
多媒体组件808包括在所述电子设备800和用户之间的提供一个展现接口的屏幕。在一些实施例中,屏幕可以包括液晶显示器(LCD)和触摸面板(TP)。如果屏幕包括触摸面板,屏幕可以被实现为触摸屏,以接收来自用户的输入信号。触摸面板包括一个或多个触摸传感器以感测触摸、滑动和触摸面板上的手势。所述触摸传感器可以不仅感测触摸或滑动动作的边界,而且还检测与所述触摸或滑动操作相关的持续时间和压力。在一些实施例中,多媒体组件808包括一个前置摄像头和/或后置摄像头。当设备800处于操作模式,如拍摄模式或视频模式时,前置摄像头和/或后置摄像头可以接收外部的多媒体数据。每个前置摄像头和后置摄像头可以是一个固定的光学透镜***或具有焦距和光学变焦能力。
音频组件810被配置为展现和/或输入音频信号。例如,音频组件810包括一个麦克风(MIC),当电子设备800处于操作模式,如呼叫模式、记录模式和语音识别模式时,麦克风被配置为接收外部音频信号。所接收的音频信号可以被进一步存储在存储器804或经由通信组件816发送。在一些实施例中,音频组件810还包括一个扬声器,用于展现音频信号。
I/O接口812为处理组件802和***接口模块之间提供接口,上述***接口模块可以是键盘,点击轮,按钮等。这些按钮可包括但不限于:主页按钮、音量按钮、启动按钮和锁定按钮。
传感器组件814包括一个或多个传感器,用于为电子设备800提供各个方面的状态评估。例如,传感器组件814可以检测到设备800的打开/关闭状态,组件的相对定位,例如所述组件为电子设备800的显示器和小键盘,传感器组件814还可以检测电子设备800或电子设备800一个组件的位置改变,用户与电子设备800接触的存在或不存在,电子设备800方位或加速/减速和电子设备800的温度变化。传感器组件814可以包括接近传感器,被配置用来在没有任何的物理接触时检测附近物体的存在。传感器组件814还可以包括光传感器,如CMOS或CCD图像传感器,用于在成像应用中使用。在一些实施例中,该传感器组件814还可以包括加速度传感器,陀螺仪传感器,磁传感器,压力传感器或温度传感器。
通信组件816被配置为便于电子设备800和其他设备之间有线或无线方式的通信。电子设备800可以接入基于通信标准的无线网络,如WiFi,2G或3G,或它们的组合。在一个示例性实施例中,通信部件816经由广播信道接收来自外部广播管理***的广播信号或广播相关信息。在一个示例性实施例中,所述通信部件816还包括近场通信(NFC)模块,以促进短程通信。例如,在NFC模块可基于射频识别(RFID)技术,红外数据协会(IrDA)技术,超宽带(UWB)技术,蓝牙(BT)技术和其他技术来实现。
在示例性实施例中,电子设备800可以被一个或多个应用专用集成电路(ASIC)、数字信号处理器(DSP)、数字信号处理设备(DSPD)、可编程逻辑器件(PLD)、现场可编程门阵列(FPGA)、控制器、微控制器、微处理器或其他电子元件实现,用于执行上述方法。
在示例性实施例中,还提供了一种包括指令的非临时性计算机可读存储介质,例如包括指令的存储器804,上述指令可由电子设备800的处理器820执行以完成上述方法。例如,所述非临时性计算机可读存储介质可以是ROM、随机存取存储器(RAM)、CD-ROM、磁带、软盘和光数据存储设备等。
一种非临时性计算机可读存储介质,当所述存储介质中的指令由移动终端的处理器执行时,使得移动终端能够执行一种用户性别识别方法,所述方法包括:获取用户在预设时间段内的历史浏览行为数据;获取每条所述历史浏览行为数据对应的网页所属类目,其中,所述类目包括女性类目和男性类目;基于所述历史浏览行为数据和所述类目,获取用户对属于所述女性类目的网页的第一浏览次数和第一点击次数,以及用户对属于所述男性类目的网页的第二浏览次数和第二点击次数;基于所述第一浏览次数、所述第一点击次数、所述第二浏览次数以及所述第二点击次数,通过预先训练好的分类模型进行用户性别识别,获得用户性别识别结果。
应当理解的是,本发明并不局限于上面已经描述并在附图中示出的精确结构,并且可以在不脱离其范围进行各种修改和改变。本发明的范围仅由所附的权利要求来限制
以上所述仅为本发明的较佳实施例,并不用以限制本发明,凡在本发明的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。

Claims (10)

1.一种用户性别识别方法,其特征在于,包括:
获取用户在预设时间段内的历史浏览行为数据;
获取每条所述历史浏览行为数据对应的网页所属类目,其中,所述类目包括女性类目和男性类目;
基于所述历史浏览行为数据和所述类目,获取用户对属于所述女性类目的网页的第一浏览次数和第一点击次数,以及用户对属于所述男性类目的网页的第二浏览次数和第二点击次数;
基于所述第一浏览次数、所述第一点击次数、所述第二浏览次数以及所述第二点击次数,通过预先训练好的分类模型进行用户性别识别,获得用户性别识别结果。
2.如权利要求1所述的方法,其特征在于,基于所述第一浏览次数、所述第一点击次数、所述第二浏览次数以及所述第二点击次数,通过预先训练好的分类模型进行用户性别识别,获得用户性别识别结果,包括:
获得如下参数作为模型输入参数:
所述第一浏览次数与用户对所有网页的总浏览次数之间的第一比值、所述第一点击次数与用户对所有网页的总点击次数之间的第二比值、所述第二浏览次数与所述总浏览次数之间的第三比值以及所述第二点击次数与所述总点击次数之间的第四比值;
将所述模型输入参数输入所述分类模型进行用户性别识别,获得用户性别识别结果。
3.如权利要求1所述的方法,其特征在于,所述分类模型的训练方法包括:
获取训练样本集;
针对每个训练样本,根据用户对属于女性类目的网页的第一点击次数和对属于男性类目的网页的第二点击次数获得用户性别倾向权重;
根据所述用户性别倾向权重对所述每个训练样本进行性别标注,获得所述每个训练样本的性别标签;
根据所述训练样本集和每个训练样本的性别标签进行分类模型训练。
4.如权利要求1所述的方法,其特征在于,所述分类模型采用的分类算法为梯度提升决策树、随机森林或极端梯度提升。
5.如权利要求1~4任一所述的方法,其特征在于,所述方法还包括:
根据所述用户性别识别结果,在用户画像中增加用户性别特征;和/或,
根据所述用户性别识别结果,对用户进行网页推荐。
6.如权利要求1~4任一所述的方法,其特征在于,历史浏览行为数据为广告浏览行为数据;
所述获取每条所述历史浏览行为数据对应的网页所属类目,包括:
获取每条广告浏览行为数据对应的网页提供的广告商品和/或服务所属三级基础类目;
根据所述三级基础类目获得每条广告浏览行为数据对应的网页所属性别类目。
7.一种用户性别识别装置,其特征在于,包括:
获取单元,用于获取用户在预设时间段内的历史浏览行为数据;
类目单元,用于获取每条所述历史浏览行为数据对应的网页所属类目,其中,所述类目包括女性类目和男性类目;
统计单元,用于基于所述历史浏览行为数据和所述类目,获取用户对属于所述女性类目的网页的第一浏览次数和第一点击次数,以及用户对属于所述男性类目的网页的第二浏览次数和第二点击次数;
识别单元,用于基于所述第一浏览次数、所述第一点击次数、所述第二浏览次数以及所述第二点击次数,通过预先训练好的分类模型进行用户性别识别,获得用户性别识别结果。
8.如权利要求7所述的装置,其特征在于,所述识别单元用于:
获得如下参数作为模型输入参数:
所述第一浏览次数与用户对所有网页的总浏览次数之间的第一比值、所述第一点击次数与用户对所有网页的总点击次数之间的第二比值、所述第二浏览次数与所述总浏览次数之间的第三比值以及所述第二点击次数与所述总点击次数之间的第四比值;
将所述模型输入参数输入所述分类模型进行用户性别识别,获得用户性别识别结果。
9.一种电子设备,其特征在于,包括有存储器,以及一个或者一个以上的程序,其中一个或者一个以上的程序存储于存储器中,且经配置以由一个或者一个以上处理器执行所述一个或者一个以上的程序所包含的用于进行如权利要1~6任一所述的方法对应的操作指令。
10.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,该程序被处理器执行时实现如权利要1~6任一所述的方法的步骤。
CN202010097122.2A 2020-02-17 2020-02-17 一种用户性别识别方法、装置及电子设备 Pending CN113268654A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202010097122.2A CN113268654A (zh) 2020-02-17 2020-02-17 一种用户性别识别方法、装置及电子设备

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202010097122.2A CN113268654A (zh) 2020-02-17 2020-02-17 一种用户性别识别方法、装置及电子设备

Publications (1)

Publication Number Publication Date
CN113268654A true CN113268654A (zh) 2021-08-17

Family

ID=77227576

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202010097122.2A Pending CN113268654A (zh) 2020-02-17 2020-02-17 一种用户性别识别方法、装置及电子设备

Country Status (1)

Country Link
CN (1) CN113268654A (zh)

Citations (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105550892A (zh) * 2014-10-29 2016-05-04 苏宁云商集团股份有限公司 一种线上会员性别识别方法、***及信息推荐***
US20160283976A1 (en) * 2015-03-26 2016-09-29 Appier Inc. Method of enhancing the accuracy of predicting the gender of network users
CN106484762A (zh) * 2015-08-27 2017-03-08 优像数位媒体科技股份有限公司 利用网页浏览行为来进行性别预测的方法
CN106682686A (zh) * 2016-12-09 2017-05-17 北京拓明科技有限公司 一种基于手机上网行为的用户性别预测方法
CN107766891A (zh) * 2017-10-31 2018-03-06 广东欧珀移动通信有限公司 用户性别识别方法、装置、存储介质及电子设备
CN108256537A (zh) * 2016-12-28 2018-07-06 北京酷我科技有限公司 一种用户性别预测方法和***
CN109034868A (zh) * 2018-06-21 2018-12-18 上海二三四五网络科技有限公司 一种基于用户浏览信息确定用户性别的控制方法及控制装置
CN109948633A (zh) * 2017-12-20 2019-06-28 广东欧珀移动通信有限公司 用户性别预测方法、装置、存储介质及电子设备
CN109961077A (zh) * 2017-12-22 2019-07-02 广东欧珀移动通信有限公司 性别预测方法、装置、存储介质及电子设备
CN109961163A (zh) * 2017-12-22 2019-07-02 广东欧珀移动通信有限公司 性别预测方法、装置、存储介质及电子设备

Patent Citations (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105550892A (zh) * 2014-10-29 2016-05-04 苏宁云商集团股份有限公司 一种线上会员性别识别方法、***及信息推荐***
US20160283976A1 (en) * 2015-03-26 2016-09-29 Appier Inc. Method of enhancing the accuracy of predicting the gender of network users
CN106484762A (zh) * 2015-08-27 2017-03-08 优像数位媒体科技股份有限公司 利用网页浏览行为来进行性别预测的方法
CN106682686A (zh) * 2016-12-09 2017-05-17 北京拓明科技有限公司 一种基于手机上网行为的用户性别预测方法
CN108256537A (zh) * 2016-12-28 2018-07-06 北京酷我科技有限公司 一种用户性别预测方法和***
CN107766891A (zh) * 2017-10-31 2018-03-06 广东欧珀移动通信有限公司 用户性别识别方法、装置、存储介质及电子设备
CN109948633A (zh) * 2017-12-20 2019-06-28 广东欧珀移动通信有限公司 用户性别预测方法、装置、存储介质及电子设备
CN109961077A (zh) * 2017-12-22 2019-07-02 广东欧珀移动通信有限公司 性别预测方法、装置、存储介质及电子设备
CN109961163A (zh) * 2017-12-22 2019-07-02 广东欧珀移动通信有限公司 性别预测方法、装置、存储介质及电子设备
CN109034868A (zh) * 2018-06-21 2018-12-18 上海二三四五网络科技有限公司 一种基于用户浏览信息确定用户性别的控制方法及控制装置

Similar Documents

Publication Publication Date Title
CN109800325B (zh) 视频推荐方法、装置和计算机可读存储介质
CN111638832A (zh) 信息展示方法、装置、***、电子设备及存储介质
CN109308334B (zh) 信息推荐方法及装置、搜索引擎***
CN111556366A (zh) 一种多媒体资源的展示方法、装置、终端、服务器及***
CN110222256B (zh) 一种信息推荐方法、装置和用于信息推荐的装置
CN112508612B (zh) 训练广告创意生成模型、生成广告创意的方法及相关装置
CN109918565B (zh) 一种搜索数据的处理方法、装置及电子设备
CN111127053B (zh) 页面内容推荐方法、装置及电子设备
CN110766456A (zh) 商品推荐方法及装置
CN111369271A (zh) 一种广告的排序方法、装置、电子设备及存储介质
CN109670077A (zh) 视频推荐方法、装置和计算机可读存储介质
CN108717403B (zh) 一种处理方法、装置和用于处理的装置
CN112148980B (zh) 基于用户点击的物品推荐方法、装置、设备和存储介质
CN105373580A (zh) 主题显示方法及装置
CN107506441B (zh) 一种数据排列方法、装置、电子设备以及存储介质
CN112612949B (zh) 推荐数据集合的建立方法及装置
CN112000266B (zh) 页面展示方法、装置、电子设备及存储介质
CN112000840B (zh) 一种业务对象的展示方法和装置
CN112767053A (zh) 信息处理方法、装置、电子设备及存储介质
CN112784151A (zh) 一种确定推荐信息的方法及相关装置
CN108205534B (zh) 一种皮肤资源展示方法、装置及电子设备
CN114202380A (zh) 金融产品的推荐方法、装置和设备
CN115203573A (zh) 画像标签生成方法、模型训练方法、装置、介质及芯片
CN113268654A (zh) 一种用户性别识别方法、装置及电子设备
CN112036247A (zh) 表情包文字生成方法、装置及存储介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination