CN105550892A - 一种线上会员性别识别方法、***及信息推荐*** - Google Patents

一种线上会员性别识别方法、***及信息推荐*** Download PDF

Info

Publication number
CN105550892A
CN105550892A CN201410594933.8A CN201410594933A CN105550892A CN 105550892 A CN105550892 A CN 105550892A CN 201410594933 A CN201410594933 A CN 201410594933A CN 105550892 A CN105550892 A CN 105550892A
Authority
CN
China
Prior art keywords
sex
commodity
gender
name
judge
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201410594933.8A
Other languages
English (en)
Inventor
罗琨
阙开伟
罗俊如
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Suning Commerce Group Co Ltd
Original Assignee
Suning Commerce Group Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Suning Commerce Group Co Ltd filed Critical Suning Commerce Group Co Ltd
Priority to CN201410594933.8A priority Critical patent/CN105550892A/zh
Publication of CN105550892A publication Critical patent/CN105550892A/zh
Pending legal-status Critical Current

Links

Landscapes

  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本发明提供一种线上会员性别识别方法和***,属于电子商务技术领域。该方法包括:根据有效身份证判断出会员性别;若根据身份证不能判断出会员性别,则通过会员填写的性别信息判断出会员性别;若通过会员填写的性别信息不能判断出会员性别,则通过姓名字段判断出会员性别;若通过姓名字段不能判断出会员性别,则通过收货人姓名判断出会员性别;若通过收货人姓名不能判断出会员性别,则通过购买和/或浏览行为判断出会员性别;判断出会员性别后,填写记录会员的性别。本发明的技术方案通过补全会员的性别信息,从而完善会员的性别信息,为精准营销提供支持。

Description

一种线上会员性别识别方法、***及信息推荐***
技术领域
本发明涉及电子商务技术领域,特别涉及一种线上会员性别识别方法、***及信息推荐***。
背景技术
随着大数据时代的到来,精准营销成为可能和主流。现有技术中,电子商务网站上的线上交易的会员信息存在不够全面完善,会员有性别的覆盖率较低,从而不能为精准营销提供支持。若能够准确识别出会员的性别,根据性别,进行特定信息推送将会大大提高营销效果。
发明内容
针对现有技术的上述缺陷,本发明所要解决的技术问题是如何实现通过补全会员的性别信息,从而完善会员的基本性别,为精准营销提供支持。
为实现上述目的,一方面,本发明提供一种线上会员性别识别方法,该方法包括步骤:
根据有效身份证判断出会员性别;
若根据身份证不能判断出会员性别,则通过会员填写的性别信息判断出会员性别;
若通过会员填写的性别信息不能判断出会员性别,则通过姓名字段判断出会员性别;
若通过姓名字段不能判断出会员性别,则通过收货人姓名判断出会员性别;
若通过收货人姓名不能判断出会员性别,则通过购买和/或浏览行为判断出会员性别。
优选地,所述通过姓名字段判断出会员性别具体包括:
通过百家姓判断会员的姓,获取会员的名字部分,将名字部分拆分成单字;
通过关联规则,生成性别有关的单字和/或词;
通过在姓名中判断是否含有与性别有关的单字和/或词来判断会员的性别。
优选地,所述通过行为判断出会员性别具体包括:
筛选出有性别倾向的商品;
统计会员购买和/或浏览行为中对有性别倾向的商品的购买和/或浏览的占比;
设定第一阈值,当会员购买和/或浏览的有性别倾向的商品的单品占比大于或者小于第一阈值时,则判断出会员对应的性别。
优选地,所述筛选出有性别倾向的商品具体包括:
统计一段时间内,一个商品在购买和/或浏览行为中男性和女性的占比;
设定第二阈值,当男性占比大于或者小于第二阈值时判定为男性商品,以及当女性会员占比大于或者小于第二阈值时判定为女性商品。
优选地,在所述筛选出有性别倾向的商品之后还包括:
选出购买和/或浏览行为与业务常识一致的商品,过滤购买和/或浏览行为与业务常识不一致的商品。
另一方面,本发明还同时提供一种线上会员性别识别***,包括:
第一会员判断单元,用于根据有效身份证判断出会员性别;
第二会员判断单元,用于若根据身份证不能判断出会员性别,则通过会员填写的性别信息判断出会员性别;
第三会员判断单元,用于若通过会员填写的性别信息不能判断出会员性别,则通过姓名字段判断出会员性别;
第四会员判断单元,用于若通过姓名字段不能判断出会员性别,则通过收货人姓名判断出会员性别;
第五会员判断单元,用于若通过收货人姓名不能判断出会员性别,则通过购买和/或浏览行为判断出会员性别;
会员识别单元,用于识别根据所述会员判断单元判断出的会员性别。
优选地,所述第五会员判断单元具体包括:
筛选单元,用于筛选出有性别倾向的商品;
统计单元,用于统计会员购买和/或浏览行为中对有性别倾向的商品的购买和/或浏览的占比;
设定单元,用于设定第一阈值,当会员购买和/或浏览的有性别倾向的商品的单品占比大于或者小于第一阈值时,判断出会员对应的性别。
优选地,所述筛选单元具体包括:
计算单元,用于计算一段时间内,一个商品在购买和/或浏览行为中男性和女性的占比;
判定单元,用于设定第二阈值,在当男性占比大于或者小于第二阈值时判定为男性商品,以及在当女性会员占比大于或者小于第二阈值时判定为女性商品。
优选地,所述判定单元进一步选出购买和/或浏览行为与业务常识一致的商品,过滤购买和/或浏览行为与业务常识不一致的商品。
另一方面,本发明还同时提供一种信息推荐***,所述信息推荐***包括上述的线上会员性别识别***,所述线上会员识别***识别出会员性别,所述信息推荐***根据会员性别进行特定信息推送。
本发明的技术方案通过补全会员的性别信息,从而完善会员的性别信息,为精准营销提供支持。通过对会员性别信息的补充,提高线上会员性别的覆盖率。
附图说明
图1是本发明一个实施例中的线上会员性别识别方法的流程示意图;
图2是本发明另一个实施例中的线上会员性别识别***的结构示意图;
图3是本发明另一个实施例中的信息推荐***的结构示意图。
具体实施方式
为使本领域技术人员更好地理解本发明的技术方案,下面结合附图和具体实施方式对本发明作进一步详细描述。
图1是本发明一个实施例中的线上会员性别识别方法的流程示意图,如图1所示,该方法包括步骤:
步骤S1、根据有效身份证判断出会员性别;
步骤S2、若根据身份证不能判断出会员性别,则通过会员填写的性别信息判断出会员性别;
步骤S3、若通过会员填写的性别信息不能判断出会员性别,则通过姓名字段判断出会员性别;
步骤S4、若通过姓名字段不能判断出会员性别,则通过收货人姓名判断出会员性别;
步骤S5、若通过收货人姓名不能判断出会员性别,则通过行为判断出会员性别。
优选地,通过姓名字段判断出会员性别具体包括:通过百家姓判断会员的姓,获取会员的名字部分,将名字部分拆分成单字;通过关联规则,生成性别有关的单字和/或词;通过在姓名中判断是否含有与性别有关的单字和/或词来判断会员的性别。
优选地,通过行为判断出会员性别具体包括:筛选出有性别倾向的商品;统计会员购买和/或浏览行为中对有性别倾向的商品的购买和/或浏览的占比;设定第一阈值,当会员购买和/或浏览的有性别倾向的商品的单品占比大于或者小于第一阈值时,则判断出会员对应的性别。
优选地,筛选出有性别倾向的商品具体包括:统计一段时间内,一个商品在购买和/或浏览行为中男性和女性的占比;设定第二阈值,当男性占比大于或者小于第二阈值时判定为男性商品,以及当女性会员占比大于或者小于第二阈值时判定为女性商品。
优选地,在筛选出有性别倾向的商品之后还包括:选出购买和/或浏览行为与业务常识一致的商品,过滤购买和/或浏览行为与业务常识不一致的商品。
本领域相关技术人员应能理解,与本发明的方法相对应的,本发明还同时包括一种线上会员性别识别***,与上述方法步骤一一对应地,如图2所示,该***包括:第一会员判断单元201,用于根据有效身份证判断出会员性别;第二会员判断单元202,用于若根据身份证不能判断出会员性别,则通过会员填写的性别信息判断出会员性别;第三会员判断单元203,用于若通过会员填写的性别信息不能判断出会员性别,则通过姓名字段判断出会员性别;第四会员判断单元204,用于若通过姓名字段不能判断出会员性别,则通过收货人姓名判断出会员性别;第五会员判断单元205,用于若通过收货人姓名不能判断出会员性别,则通过行为判断出会员性别;会员识别单元206,用于识别根据所述会员判断单元判断出的会员性别。
优选地,第三会员判断单元203具体包括:获取单元2031,用于通过百家姓判断会员的姓,获取会员的名字部分,将名字部分拆分成单字;生成单元2032,用于通过关联规则,生成性别有关的单字和/或词;补充单元2033,用于通过在姓名中判断是否含有与性别有关的单字和/或词来判断会员的性别,作为会员生理性别的补充。
优选地,第五会员判断单元205具体包括:筛选单元2051,用于筛选出有性别倾向的商品;统计单元2052,用于统计会员购买和/或浏览行为中对有性别倾向的商品的购买和/或浏览的占比;设定单元2053,用于设定第一阈值,当会员购买和/或浏览的有性别倾向的商品的单品占比大于或者小于占比阈值时,则判断出会员对应的性别。
优选地,筛选单元2051具体包括:计算单元20511,用于计算一段时间内,一个商品在购买和/或浏览行为中男性和女性的占比;判定单元20512,用于设定第二阈值,在当男性占比大于或者小于设定阈值时判定为男性商品,以及在当女性会员占比大于或者小于设定阈值时判定为女性商品;且进一步选出购买和/或浏览行为与业务常识一致的商品,过来购买和/或浏览行为与业务常识不一致的商品。
本发明的技术方案通过生理性别和行为性别两种方式补全会员的性别信息,从而完善会员的性别信息,为精准营销提供支持。通过对会员性别信息的补充,提高线上会员性别的覆盖率。
在实际应用中,本发明的技术方案通过包括生理性别或者行为性别两种方式来判断会员的性别,当然,也可通过结合生理性别和行为性别两种方式来判断会员的性别。
具体地,通过生理性别判断会员的性别具体包括如下五种方式:
(1)通过身份证去验证:首先通过我国特有的身份证的生成规则去校验,对于有效的身份证,获取判断性别的字段,奇数为男性,偶数为女性。
(2)通过会员在公司填写的个人信息中填写的性别作为补充。
(3)通过姓名字段进行补充;姓名字段规则,首先通过百家姓判断会员的姓,然后获取会员的名字部分,将名字部分拆成单字,然后通过关联规则,设定一定的支持度与置信度,生成与性别有关的一些单字或词,然后通过姓名中,是否含有与性别有关的单字或词来判断会员的性别,作为会员的生理性别的补充。
(4)通过统计会员对应收货人的姓名,选择对应收货人姓名中订单量最大的一个。
(5)通过行为判断,补充会员生理性别具体包括如下步骤:
首先,找出有性别倾向的商品,按以下的步骤优先级从高到底:
a.首先通过手动的对一些商品打标签,找出有性别倾向的商品;
b.通过商品名称中的一些关键字去打标签,找出有性别倾向的商品;
c.通过购买行为,找出有性别倾向的商品;
具体地,通过购买行为找出有性别倾向的商品具体包括步骤:统计一段时间范围内,一个商品的购买人次,以及购买人次中男性女性的占比,设定一定的阈值,选出有性别倾向的商品;
d.通过浏览行为,找出有性别倾向的商品。
具体地,通过浏览行为找出有性别倾向的商品具体包括步骤:统计一段时间范围内,一个商品的浏览人次,以及浏览人次中男性女性的占比,设定一定的阈值,选出有性别倾向的商品。
选出有性别倾向的商品后,选出行为与业务常识一致的商品;当行为为常识不符时,则过滤这些商品。例如:通过手动打标签的商品,该商品从常识性上为女性商品,但在行为上表现出来的是男性购买的多,此时出现行为与常识不符,则该商品会被过滤掉。
通过a、b、c、d以上的步骤,会生成两张中间表:购买行为与商品性别一致的表和浏览行为与商品性别一致的表。
确定生理性别包括如下步骤:
通过浏览男性或者女性商品的单品占比确定生理性别。其中,会员浏览男性商品的单品数/会员浏览商品的总的单品数,这里的男性商品取自浏览行为与商品性别一致表;会员浏览女性商品的单品数/会员浏览商品的总的单品数,这里的女性商品取自浏览行为与商品性别一致表。
通过设定占比阀值,当浏览男性或者女性商品的单品大于设定占比阀值即可判定为对应性别,或者当浏览男性或者女性商品的单品小于设定占比阀值即可判定为对应性别。优选地,占比阀值的设定根据被打标签商品占总商品的比率可调。
具体地,通过行为性别判断会员的性别与通过生理性别中的第五种方式通过行为判断,补充会员生理性别相似。其中,行为性别与生理性别中通过行为去判断会员的性别的区别在于:在结果上,通过行为去补全的生理性别有两种结果:“男”、“女”;而通过行为性别有三种结果:“男”、“女”、“男女”。其中,“男女”的业务意义为:男性行为特征和女性行为特征都非常显著。需要说明的是,根据购买行为判定方式与根据浏览行为判定方式类似,亦可两种行为综合进行判定。
图3是本发明另一个实施例中的信息推荐***的结构示意图,如图3所示,信息推荐***采用实施例一中的线上会员性别识别方法或者实施例二中的线上会员性别识别***。
线上会员性别识别方法包括:根据有效身份证判断出会员性别;若根据身份证不能判断出会员性别,则通过会员填写的性别信息判断出会员性别;若通过会员填写的性别信息不能判断出会员性别,则通过姓名字段判断出会员性别;若通过姓名字段不能判断出会员性别,则通过收货人姓名判断出会员性别;若通过收货人姓名不能判断出会员性别,则通过行为判断出会员性别;线上会员识别***识别出会员性别,推荐***根据会员性别进行特定信息推送。
本发明的技术方案通过生理性别和行为性别两种方式补全会员的性别信息,从而完善会员的性别信息,为精准营销提供支持。通过对会员性别信息的补充,提高线上会员性别的覆盖率。
可以理解的是,以上实施方式仅仅是为了说明本发明的原理而采用的示例性实施方式,然而本发明并不局限于此。对于本领域内的普通技术人员而言,在不脱离本发明的精神和实质的情况下,可以做出各种变型和改进,这些变型和改进也视为本发明的保护范围。

Claims (10)

1.一种线上会员性别识别方法,其特征在于,所述方法包括步骤:
根据有效身份证判断出会员性别;
若根据身份证不能判断出会员性别,则通过会员填写的性别信息判断出会员性别;
若通过会员填写的性别信息不能判断出会员性别,则通过姓名字段判断出会员性别;
若通过姓名字段不能判断出会员性别,则通过收货人姓名判断出会员性别;
若通过收货人姓名不能判断出会员性别,则通过行为判断出会员性别。
2.根据权利要求1所述的线上会员性别识别方法,其特征在于,所述通过姓名字段判断出会员性别具体包括:
通过百家姓判断会员的姓,获取会员的名字部分,将名字部分拆分成单字;
通过关联规则,生成性别有关的单字和/或词;
通过在姓名中判断是否含有与性别有关的单字和/或词来判断会员的性别。
3.根据权利要求1所述的线上会员性别识别方法,其特征在于,所述通过行为判断出会员性别具体包括:
筛选出有性别倾向的商品;
统计会员购买和/或浏览行为中对有性别倾向的商品的购买和/或浏览的占比;
设定第一阈值,当会员购买和/或浏览的有性别倾向的商品的单品占比大于或者小于第一阈值时,则判断出会员对应的性别。
4.根据权利要求3所述的线上会员性别识别方法,其特征在于,所述筛选出有性别倾向的商品具体包括:
统计一段时间内,一个商品在购买和/或浏览行为中男性和女性的占比;
设定第二阈值,当男性占比大于或者小于第二阈值时判定为男性商品,以及当女性会员占比大于或者小于第二阈值时判定为女性商品。
5.根据权利要求4所述的线上会员性别识别方法,其特征在于,在所述筛选出有性别倾向的商品之后还包括:
选出购买和/或浏览行为与业务常识一致的商品,过滤购买和/或浏览行为与业务常识不一致的商品。
6.一种线上会员性别识别***,其特征在于,包括:
第一会员判断单元,用于根据有效身份证判断出会员性别;
第二会员判断单元,用于若根据身份证不能判断出会员性别,则通过会员填写的性别信息判断出会员性别;
第三会员判断单元,用于若通过会员填写的性别信息不能判断出会员性别,则通过姓名字段判断出会员性别;
第四会员判断单元,用于若通过姓名字段不能判断出会员性别,则通过收货人姓名判断出会员性别;
第五会员判断单元,用于若通过收货人姓名不能判断出会员性别,则通过行为判断出会员性别;
会员识别单元,用于识别根据所述会员判断单元判断出的会员性别。
7.根据权利要求6所述的线上会员性别识别***,其特征在于,所述第五会员判断单元具体包括:
筛选单元,用于筛选出有性别倾向的商品;
统计单元,用于统计会员购买和/或浏览行为中对有性别倾向的商品的购买和/或浏览的占比;
设定单元,用于设定第一阈值,当会员购买和/或浏览的有性别倾向的商品的单品占比大于或者小于第一阈值时,则判断出会员对应的性别。
8.根据权利要求7所述的线上会员性别识别***,其特征在于,所述筛选单元具体包括:
计算单元,用于计算一段时间内,一个商品在购买和/或浏览行为中男性和女性的占比;
判定单元,用于设定第二阈值,在当男性占比大于或者小于第二阈值时判定为男性商品,以及在当女性会员占比大于或者小于第二阈值时判定为女性商品。
9.根据权利要求8所述的线上会员性别识别***,其特征在于,
所述判定单元进一步选出购买和/或浏览行为与业务常识一致的商品,过滤购买和/或浏览行为与业务常识不一致的商品。
10.一种信息推荐***,其特征在于,所述信息推荐***包括如权利要求6、7、8或9中的线上会员性别识别***,所述线上会员识别***识别出会员性别,所述信息推荐***根据会员性别进行特定信息推送。
CN201410594933.8A 2014-10-29 2014-10-29 一种线上会员性别识别方法、***及信息推荐*** Pending CN105550892A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201410594933.8A CN105550892A (zh) 2014-10-29 2014-10-29 一种线上会员性别识别方法、***及信息推荐***

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201410594933.8A CN105550892A (zh) 2014-10-29 2014-10-29 一种线上会员性别识别方法、***及信息推荐***

Publications (1)

Publication Number Publication Date
CN105550892A true CN105550892A (zh) 2016-05-04

Family

ID=55830071

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201410594933.8A Pending CN105550892A (zh) 2014-10-29 2014-10-29 一种线上会员性别识别方法、***及信息推荐***

Country Status (1)

Country Link
CN (1) CN105550892A (zh)

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108388851A (zh) * 2018-02-09 2018-08-10 北京京东金融科技控股有限公司 信息统计方法、装置、存储介质及电子设备
CN108664973A (zh) * 2018-03-28 2018-10-16 北京捷通华声科技股份有限公司 文本处理方法和装置
CN109766955A (zh) * 2019-02-12 2019-05-17 深圳乐信软件技术有限公司 性别识别方法、装置、设备及存储介质
CN110100276A (zh) * 2016-12-22 2019-08-06 大众汽车有限公司 语音操作***的语音输出声音
CN113268654A (zh) * 2020-02-17 2021-08-17 北京搜狗科技发展有限公司 一种用户性别识别方法、装置及电子设备

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110100276A (zh) * 2016-12-22 2019-08-06 大众汽车有限公司 语音操作***的语音输出声音
CN108388851A (zh) * 2018-02-09 2018-08-10 北京京东金融科技控股有限公司 信息统计方法、装置、存储介质及电子设备
CN108664973A (zh) * 2018-03-28 2018-10-16 北京捷通华声科技股份有限公司 文本处理方法和装置
CN109766955A (zh) * 2019-02-12 2019-05-17 深圳乐信软件技术有限公司 性别识别方法、装置、设备及存储介质
CN113268654A (zh) * 2020-02-17 2021-08-17 北京搜狗科技发展有限公司 一种用户性别识别方法、装置及电子设备

Similar Documents

Publication Publication Date Title
CN109299994B (zh) 推荐方法、装置、设备及可读存储介质
CN107369075B (zh) 商品的展示方法、装置和电子设备
US10963912B2 (en) Method and system for filtering goods review information
CN109493199A (zh) 产品推荐方法、装置、计算机设备和存储介质
US10664888B2 (en) Method and system for attribute extraction from product titles using sequence labeling algorithms
US20180053234A1 (en) Description information generation and presentation systems, methods, and devices
CN108805598B (zh) 相似度信息确定方法、服务器及计算机可读存储介质
CN105550892A (zh) 一种线上会员性别识别方法、***及信息推荐***
CN104077417A (zh) 社交网络中的人物标签推荐方法和***
CN110263248A (zh) 一种信息推送方法、装置、存储介质和服务器
CN103246980A (zh) 信息输出方法及服务器
CA2869888C (en) Discovering spam merchants using product feed similarity
CN109325179A (zh) 一种内容推广的方法及装置
CN105468649B (zh) 一种待展示对象匹配的判断方法及其装置
CN103377249A (zh) 关键词投放方法及***
CN110503459A (zh) 基于大数据的用户信用度评估方法、装置及存储介质
CN110503497A (zh) 一种基于客户的消费***台商品推荐方法
CN112465598B (zh) 一种用户画像生成方法、装置、设备及计算机存储介质
CN110807669B (zh) 一种跨平台的用户信息管理方法和装置
CN106294676B (zh) 一种电子商务政务***的数据检索方法
CN111967970B (zh) 基于spark平台的银行产品推荐方法及装置
CN104615721A (zh) 用于基于退货关联信息推荐商品的方法和***
CN110955690A (zh) 一种基于大数据技术的自助数据标签平台及自助数据标签方法
CN110717097A (zh) 业务推荐方法、装置、计算机设备和存储介质
CN105574480B (zh) 一种信息处理方法、装置以及终端

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication

Application publication date: 20160504

RJ01 Rejection of invention patent application after publication