CN110503482B - 一种物品处理方法、装置、终端及存储介质 - Google Patents

一种物品处理方法、装置、终端及存储介质 Download PDF

Info

Publication number
CN110503482B
CN110503482B CN201910792539.8A CN201910792539A CN110503482B CN 110503482 B CN110503482 B CN 110503482B CN 201910792539 A CN201910792539 A CN 201910792539A CN 110503482 B CN110503482 B CN 110503482B
Authority
CN
China
Prior art keywords
probability
article
registered user
item
class
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201910792539.8A
Other languages
English (en)
Other versions
CN110503482A (zh
Inventor
谢翀
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Shenzhen Lexin Software Technology Co Ltd
Original Assignee
Shenzhen Lexin Software Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Shenzhen Lexin Software Technology Co Ltd filed Critical Shenzhen Lexin Software Technology Co Ltd
Priority to CN201910792539.8A priority Critical patent/CN110503482B/zh
Publication of CN110503482A publication Critical patent/CN110503482A/zh
Application granted granted Critical
Publication of CN110503482B publication Critical patent/CN110503482B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/24Classification techniques
    • G06F18/241Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/045Combinations of networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q30/00Commerce
    • G06Q30/02Marketing; Price estimation or determination; Fundraising
    • G06Q30/0201Market modelling; Market analysis; Collecting market data
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q30/00Commerce
    • G06Q30/02Marketing; Price estimation or determination; Fundraising
    • G06Q30/0201Market modelling; Market analysis; Collecting market data
    • G06Q30/0203Market surveys; Market polls

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Business, Economics & Management (AREA)
  • Physics & Mathematics (AREA)
  • Development Economics (AREA)
  • Strategic Management (AREA)
  • Finance (AREA)
  • Data Mining & Analysis (AREA)
  • Accounting & Taxation (AREA)
  • General Physics & Mathematics (AREA)
  • Entrepreneurship & Innovation (AREA)
  • Artificial Intelligence (AREA)
  • Evolutionary Computation (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • General Engineering & Computer Science (AREA)
  • Computing Systems (AREA)
  • Game Theory and Decision Science (AREA)
  • Mathematical Physics (AREA)
  • General Business, Economics & Management (AREA)
  • Marketing (AREA)
  • Economics (AREA)
  • Software Systems (AREA)
  • Biomedical Technology (AREA)
  • Molecular Biology (AREA)
  • Health & Medical Sciences (AREA)
  • General Health & Medical Sciences (AREA)
  • Computational Linguistics (AREA)
  • Biophysics (AREA)
  • Evolutionary Biology (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本发明实施例公开一种物品处理方法、装置、终端及存储介质。该方法包括:获取候选物品的物品特征数据、注册用户的第一特征数据以及第二特征数据,根据物品特征数据预测对应候选物品被点击下单的下单概率,根据第一特征数据预测对应注册用户登录当前平台的登录概率,根据第二特征数据预测对应注册用户点击当前平台所曝光物品品类的品类点击概率,当登录概率满足第一条件时,根据下单概率和品类点击概率,确定与注册用户对应的目标物品,并展示给注册用户。本发明实施例当登录概率满足第一条件时,根据预测的下单概率和品类点击概率确定符合注册用户需求的目标物品,提供了一种统一的物品处理方式,无需针对场景和需求等单独开发,节省了资源。

Description

一种物品处理方法、装置、终端及存储介质
技术领域
本发明实施例涉及数据处理技术领域,尤其涉及一种物品处理方法、装置、终端及存储介质。
背景技术
互联网电商如今存在上架物品越来越多的情况,后台数据库需要存储几百甚至上千万的物品数据,这些物品品类繁多,规格多样,维度不统一。如何从这些物品中确定质量较高的物品,满足用户的需求,是电商平台需要解决的关键问题之一。
目前的电商平台主要是根据不同的场景和需求,单独开发物品处理的方式,这种单独开发物品处理的方式容易造成极大的重复劳动,不仅浪费了资源,而且精确度较低,确定的物品无法满足用户的需求。
发明内容
本发明实施例提供一种物品处理方法、装置、终端及存储介质,以提供一种统一的物品处理方式,节省资源。
第一方面,本发明实施例提供一种物品处理方法,包括:
获取候选物品集合中候选物品的物品特征数据、注册用户集合中注册用户的第一特征数据以及第二特征数据;
根据所述物品特征数据预测所对应候选物品被点击下单的下单概率;
根据所述第一特征数据预测所对应注册用户登录当前平台的登录概率;
根据所述第二特征数据预测所对应注册用户点击所述当前平台所曝光物品品类的品类点击概率;
当所述登录概率满足第一条件时,根据所述下单概率和品类点击概率,确定与所述注册用户对应的目标物品,并展示给所述注册用户。
第二方面,本发明实施例还提供一种物品处理装置,包括:
数据获取模块,用于获取候选物品集合中候选物品的物品特征数据、注册用户集合中注册用户的第一特征数据以及第二特征数据;
下单概率预测模块,用于根据所述物品特征数据预测所对应候选物品被点击下单的下单概率;
登录概率预测模块,用于根据所述第一特征数据预测所对应注册用户登录当前平台的登录概率;
品类点击概率预测模块,用于根据所述第二特征数据预测所对应注册用户点击所述当前平台所曝光物品品类的品类点击概率;
第一确定模块,用于当所述登录概率满足第一条件时,根据所述下单概率和品类点击概率,确定与所述注册用户对应的目标物品,并展示给所述注册用户。
第三方面,本发明实施例还提供一种终端,包括:
一个或多个处理器;
存储器,用于存储一个或多个程序;
当所述一个或多个程序被所述一个或多个处理器执行,使得所述一个或多个处理器实现如第一方面所述的物品处理方法。
第四方面,本发明实施例还提供一种存储介质,其上存储有计算机程序,该程序被处理器执行时实现如第一方面所述的物品处理方法。
本发明实施例提供一种物品处理方法、装置、终端及存储介质,通过获取候选物品集合中候选物品的物品特征数据、注册用户集合中注册用户的第一特征数据以及第二特征数据,根据所述物品特征数据预测所对应候选物品被点击下单的下单概率,根据所述第一特征数据预测所对应注册用户登录当前平台的登录概率,根据所述第二特征数据预测所对应注册用户点击所述当前平台所曝光物品品类的品类点击概率,当所述登录概率满足第一条件时,根据所述下单概率和品类点击概率,确定与所述注册用户对应的目标物品,并展示给所述注册用户。与现有技术相比,本发明实施例当预测出的注册用户登录当前平台的登录概率满足第一条件时,根据预测出的下单概率和品类点击概率确定符合注册用户需求的目标物品,即提供了一种统一的物品处理方式,无需针对场景和需求等单独开发,节省了资源。
附图说明
图1为本发明实施例一提供的一种物品处理方法的流程图;
图2为本发明实施例二提供的一种物品处理方法的流程图;
图3为本发明实施例二提供的一种物品处理方法的实现流程图;
图4为本发明实施例三提供的一种物品处理装置的结构图;
图5为本发明实施例四提供的一种终端的结构图。
具体实施方式
下面结合附图和实施例对本发明作进一步的详细说明。可以理解的是,此处所描述的具体实施例仅仅用于解释本发明,而非对本发明的限定。另外还需要说明的是,为了便于描述,附图中仅示出了与本发明相关的部分而非全部结构。此外,在不冲突的情况下,本发明中的实施例及实施例中的特征可以相互组合。
实施例一
图1为本发明实施例一提供的一种物品处理方法的流程图,本实施例可适用于对大量物品进行处理以确定符合用户需求的物品的情况,该方法可以由物品处理装置来执行,该装置可以采用软件和/或硬件的方式实现,该装置可配置于终端中,该终端可以为智能手机、电脑或平板电脑等。具体的,该方法可以包括如下步骤:
S110、获取候选物品集合中候选物品的物品特征数据、注册用户集合中注册用户的第一特征数据以及第二特征数据。
物品数据库中所存储的部分或全部物品称为候选物品,为了满足用户的需求,实施例将无皮数据库中所包含的全部物品作为候选物品,并将候选物品以集合的形式存储,即本实施所述的候选物品集合。候选物品是符合用户需求的物品,例如服饰、鞋子以及数码类物品等,候选物品的种类可以包含多种,实施例不进行限定。物品特征数据是与候选物品相关的特征数据,例如可以包括物品的基本特征、统计特征、时间特征和评价特征等,其中,物品的基本特征可以是物品的价格、所属品类、品牌以及库存等,物品的统计特征可以是物品的曝光、点击和下单等,物品的时间特征可以是物品的上架时间、发布时间、降价持续时间和活动持续时间等,评价特征可以是设定时间段内物品的下单率、增长趋势和好评指数等。
注册用户是注册候选物品所对应平台的用户,根据用户的注册信息可以确定注册该平台的用户的数量,同时还可以根据注册用户在本平台的操作记录了解注册用户的行为等信息。与候选物品集合类似,注册用户集合用于存储注册本平台的用户的注册信息。第一特征数据是注册用户在不同维度的特征数据,例如可以包括注册用户的基本信息类特征、统计信息类特征、时间类特征和关联类特征等,其中,基本信息类特征可以是注册用户的年龄、教育等级和授信额度等,统计信息类特征可以是设定时间段内登录本平台的次数和登录频率等,时间类特征可以是近期的节日数量、是否为还款日、是否为周末以及是否出发工资日等,关联类特征可以是对特定品类的点击次数等,特定品类可以根据需要设定,例如可以是3C品类,计算机(Computer)、通信(Communication)和消费类电子产品(ConsumerElectronics)等。
第二特征数据可以包含注册用户的基本信息类特征、统计信息类特征和画像类特征等,其中基本信息类型特征与第一特征数据中的基本信息类特征相同,第二特征数据的统计类信息特征可以是注册用户近期点击的品类、点击最多的品类、下单最多的品类以及搜索最多的品类等,画像类特征可以是注册用户所属的收入群体、所属的年龄阶层以及所属的工作阶层等。注册用户的第一特征数据和第二特征数据可以根据注册用户的注册信息以及登录本平台后的行为数据确定。
S120、根据所述物品特征数据预测所对应候选物品被点击下单的下单概率。
针对每一个候选物品,当该候选物品被点击时,可能被下单也可能不被下单,本实施例根据候选物品对应的物品特征数据预测候选物品集合中每一个候选物品被点击下单的下单概率,下单概率越高,表明该候选物品越受欢迎,也可以认为质量越好,需要说明的是,本实施例所说的质量越好仅以下单概率作为判断依据,在一定程度上可以认为下单概率越高,质量越好。由于候选物品的数量较多,可选的,可以利用深度学习方法确定每个候选物品被点击下单的下单概率,其中,深度学习方法可以是神经网络方法、决策树方法或回归树方法等,通过将批量候选物品对应的物品特征数据输入深度学习方法对应的模型中,根据模型的输出结果确定候选物品对应的下单概率。可选的,还可以利用训练样本预先对所采用的深度学习方法进行训练,得到下单概率对应的模型,利用训练后的模型确定下单概率,可以提高下单概率预测的准确度。
S130、根据所述第一特征数据预测所对应注册用户登录当前平台的登录概率。
登录概率的大小可以直接反应对应注册用户的活跃程度,登录概率越大,表示注册用户越活跃,用户的活跃等级越高,注册用户的活跃等级在一定程度上可以为目标物品的确定提供依据,目标物品是满足注册用户需求的候选物品。第一特征数据中包含了注册用户的基本信息类特征、统计信息类特征、时间类特征和关联类特征等信息,根据这些特征可以预测每一个注册用户登录该平台的登录概率,其预测方法可以与下单概率的预测方法类似,例如也可以对深度学习方法进行训练,将注册用户的第一特征数据输入训练后的模型,根据模型的输出结果确定注册用户的登录概率,这种预测方式都是批量进行的,提高了预测效率,节省了时间。
S140、根据所述第二特征数据预测所对应注册用户点击所述当前平台所曝光物品品类的品类点击概率。
候选物品集合中候选物品的数量有很多,甚至达到百万级别或更高,为了尽可能满足不同注册用户的需求,可以根据候选物品所属的种类对候选物品进行分类,即本实施例所述的物品品类,例如衣服、帽子和鞋等可以归属于服饰类,牙膏、香皂和生活用纸等可以归属于生活用品类,手机、电脑等可以归属于3C类,将这些物品品类可以展示平台的首页,供注册用户的选择。平台所曝光的物品品类可以根据需要选择,本实施例以曝光所有物品品类为例,以尽可能满足不同注册用户的需求,其中,当候选物品所对应的物品品类数量较多时,可以将相似的物品品类进行合并。品类点击概率是注册用户点击平台所曝光物品品类的概率,由于第二特征数据中包含注册用户点击相关物品品类的统计类信息特征等,根据第二特征数据即可预测注册用户点击当前平台所曝光物品品类的品类点击概率,其中预测方法可以与下单概率的预测方法类似,此处不再赘述。
S150、当所述登录概率满足第一条件时,根据所述下单概率和品类点击概率,确定与所述注册用户对应的目标物品,并展示给所述注册用户。
第一条件可以是登录概率的概率阈值,考虑到不同时间段注册用户的登录情况不同,对应的登录概率不同,因此可以根据注册用户前一天的登录情况确定概率阈值,所确定的概率阈值可以在前一天登录情况的基础上增加或减少一定的数值,以提高用户活跃度的判定。当登录概率大于或等于概率阈值时,可以认为该注册用户的活跃等级较高,结合下单概率和品类点击概率可以确定与活跃等级较高的注册用户的目标物品。
可选的,可以根据下单概率选择下单概率最高的候选物品,针对每一个候选物品确定其所属不同物品品类的概率,然后结合品类点击概率确定注册用户与该候选物品的相似度,当相似度大于相似度阈值时,可以将这部分获选物品作为目标物品展示给对应的注册用户。需要说明的是,相似度计算中所对应的物品品类相同,即注册用户点击的物品品类与下单概率最高的候选物品所属的物品品类的数量和名称相同。实施例对相似度计算所采用的方式不进行限定。
本发明实施例一提供一种物品处理方法,通过获取候选物品集合中候选物品的物品特征数据、注册用户集合中注册用户的第一特征数据以及第二特征数据,根据所述物品特征数据预测所对应候选物品被点击下单的下单概率,根据所述第一特征数据预测所对应注册用户登录当前平台的登录概率,根据所述第二特征数据预测所对应注册用户点击所述当前平台所曝光物品品类的品类点击概率,当所述登录概率满足第一条件时,根据所述下单概率和品类点击概率,确定与所述注册用户对应的目标物品,并展示给所述注册用户。与现有技术相比,本发明实施例当预测出的注册用户登录当前平台的登录概率满足第一条件时,根据预测出的下单概率和品类点击概率确定符合注册用户需求的目标物品,即提供了一种统一的物品处理方式,无需针对场景和需求等单独开发,节省了资源。
实施例二
图2为本发明实施例二提供的一种物品处理方法的流程图,本实施例是在上述实施例的基础上进行优化,具体的,该方法可以包括如下步骤:
S210、构建下单预测模型、登录预测模型和品类点击预测模型。
可选的,本实施例以极限梯度提升树(XGBoot)模型为例,通过训练样本对XGBoot模型训练,得到下单预测模型、登录预测模型和品类点击预测模型,不同的预测模型对应的训练样本不同。
具体的,可以通过如下方式构建下单预测模型:
根据设定时间段内所述当前平台所曝光候选物品的被点击记录和被下单记录,形成包含正样本和负样本的样本训练集,所述正样本为所曝光候选物品被点击后被下单,所述负样本为所曝光候选物品被点击后未被下单;
利用所述样本训练集所包含的候选物品和对应的物品特征数据训练极限梯度提升树模型,得到下单预测模型。
由于平台上曝光的物品的数量很多,但注册用户点击的物品通常很少,一般为个位数或十位数,若以曝光物品是否被点击区分正负样本容易导致正负样本比例超过1:100,造成失衡,而且曝光物品是否被点击还和注册用户的兴趣关联,为了客观评价物品的好坏程度,需要排除注册用户兴趣的影响。为此,本实施例以曝光物品被点击后是否被下单来区分正负样本,如果曝光物品被点击后也被下单,则作为正样本,如果曝光物品被点击后未被下单,则作为负样本,由此确定的训练样本均为注册用户感兴趣的物品,其中,如果注册用户点击某曝光物品,则称该注册用户对该曝光物品感兴趣。
考虑到候选物品的时效性中等,即既存在热点发布的候选物品,也存在持久热销的物品,注册用户对实时曝光的物品的点击下单也可以及时反映该物品的好坏,因此,采样时间可以选择7天,即根据所曝光候选物品7天内的被点击记录和被下单记录确定正负样本,作为样本训练集,当然也可以选择其他天数,实施例不进行限定。其中,如果7天内有多个同一候选物品的样本,则取最新样本。
样本确定后,将样本以及样本对应的物品特征数据作为输入,训练XGBoot模型,调整XGBoot模型中每一棵决策树的决策点,可选的,可以将所曝光候选物品的上线时间7天作为决策点,将上线时间大于7天的划分为一个物品集,小于等于7天的作为另一个物品集,这两个物品集会作为后续进一步分割的初始数据集。经过训练,最终会得到一个最优的分割决策树集合,即下单率预测模型。后续应用时,只要将候选物品和对应的物品特征数据输入下单率预测模型,即可得到候选物品被点击下单的概率。
登录预测模型和品类点击预测模型的构建过程与下单预测模型类似,主要是样本和时间周期不同。其中,登录预测模型的构建是以注册用户是否登录确定正负样本,登录则为正样本,不登录则为负样本,考虑到注册用户是否在平台进行交互和消费,除了硬性刚需之外,和时间又很大的关系,因此,实施例以采样时间为一个月为例,每天抽样一定的比例作为样本训练集,具体比例可以根据需要选择,例如每天可以抽样10%作为训练样本。训练样本确定后即可对XGBoot模型训练,得到登录预测模型,训练过程与下单预测模型类似。后续应用时,将注册用户以及对应的第一特征数据作为输入,即可得到对应的登录概率。
登录预测模型的构建是以曝光的物品品类为基准,如果该物品品类被点击,则将该物品品类作为正样本,如果未被点击作为负样本,考虑到注册用户的品类偏好与当前需求有关,因此采样时间可以设置的短一些,例如可以设置为3天。训练样本确定后即可对XGBoot模型训练,得到品类点击预测模型,训练过程与下单预测模型类似。后续应用时,将注册用户以及对应的第二特征数据作为输入,即可得到对应的品类点击概率。
S220、获取候选物品集合中候选物品的物品特征数据、注册用户集合中注册用户的第一特征数据以及第二特征数据。
S230、将所述物品特征数据输入所述下单预测模型,获得所述物品特征数据所对应候选物品被点击下单的下单概率。
下单预测模型确定后,输入候选物品和候选物品对应的物品特征数据即可得到该候选物品被点击下单的下单概率。
S240、将所述第一特征数据输入所述登录预测模型,获得所对应注册用户登录当前平台的登录概率。
与下单概率的确定方式类似,登录预测模型确定后,输入注册用户和对应的第一特征数据即可得到该注册用户登录当前平台的登录概率。
S250、将所述第二特征数据输入所述品类点击预测模型,获得所对应注册用户点击所述当前平台所曝光物品品类的品类点击概率。
与下单概率的确定方式类似,品类点击预测模型确定后,输入注册用户和对应的第二特征数据即可得到该注册用户点击当前平台所曝光物品品类的品类点击概率。
S260、当所述登录概率大于或等于第一概率阈值时,获取所述注册用户对所曝光物品品类的品类点击概率和下单概率符合设定条件的各候选物品所属所曝光品类的品类概率。
注册用户对所曝光物品品类的品类点击概率和候选物品被点击下单的下单概率可以分别根据品类点击预测模型和下单预测模型得到。候选物品所属所曝光品类的品类概率可以根据统计学知识确定,可以理解的是,对于同一候选物品,其可以归属于不同物品品类,例如手机可以归属于3C类,也可以归属于数码类或通信类,所归属的每一类对应一个概率即本实施例所述的品类概率,该品类概率可以根据统计学知识确定,本实施例不进行限定,其中,品类概率的和为1。
概率阈值可以根据前一天注册用户的登录情况确定,例如,注册用户的数量有1000W,登录用户有100W,多次浏览点击并下单的有30W,则可以将这30W/1000W=3%的注册用户作为高活跃度用户,70W/1000W=7%的注册用户作为中活跃度用户,900W/1000W=90%的注册用户作为低活跃度用户,根据登录情况和登录概率可以确定概率阈值,例如当登录概率大于或等于第一概率阈值时,认为是高活跃度用户,当登录概率大于或等于第二概率阈值小于第一概率阈值时,认为是中活跃度用户,当登录概率小于第二概率阈值时,认为是低活跃度用户。根据登录概率可以采用不同的方式确定目标物品,以充分满足用户的需求。
在确定符合高活跃度用户需求的目标物品时,本实施例以下单概率最大为例,选取下单概率最大的候选物品,结合品类点击概率确定合适的目标物品。
S261、针对每一个下单概率符合设定条件的候选物品,根据预设相似度算法,结合所述注册用户对所曝光物品品类的品类点击概率和所述候选物品所属所曝光品类的品类概率,确定所述注册用户和所述候选物品的相似度。
相似度算法可以根据需要选择,本实施例以皮尔逊(person)相似度算法为例。具体的,基于每一个注册用户对所曝光物品品类的品类点击概率,形成一个向量,可选的,可以选择部分所曝光的物品品类,假定选择了36个品类,则该向量中包含的品类点击概率有36个,每一个向量代表一个注册用户。对于下单概率最高的候选物品,还可以所记录的注册用户的信息进一步筛选,针对少选出的每一个候选物品,可以分别确定该候选物品归属于所选择的36个品类的概率,形成一个向量,每一个向量对应一个候选物品。将这两个向量输入person算法,即可得到该注册用户与该候选物品的相似度,从而得到注册用户与筛选出的每一个候选物品的相似度。
S262、当所述相似度大于相似度阈值时,将对应的候选物品确定为目标物品,展示给所述注册用户。
将得到的相似度进行排序,当相似度大于相似度阈值时,将对应的候选物品作为目标物品展示给注册用户,相似度阈值可以根据需要设定,当相似度大于相似度阈值对应的候选物品较多时,可以选择部分展示给注册用户。
S270、当所述登录概率满足第二条件时,将品类点击概率大于或等于品类点击概率阈值所对应的候选物品确定为目标物品,展示给所述注册用户。
第二条件可以是大于或等于第二概率阈值,小于第一概率阈值。可以理解的是,当登录概率满足第二条件时,表明该注册用户的活跃度不高,其对应的行为信息不足,无法准确反映注册用户全部的兴趣信息,为此,本实施例对于这部分注册用户,将品类点击概率大于或等于品类点击概率阈值所对应的候选物品确定为目标物品,展示给所述注册用户,其中,品类点击概率阈值可以根据需要设定。
S280、当所述登录概率满足第三条件时,将下单概率大于或等于下单概率阈值所对应的候选商品确定为目标物品,展示给所述注册用户。
第三条件可以是小于第二概率阈值。可以理解的是,当登录概率满足第三条件时,表明该注册用户的活跃度较低,可以将下单概率大于或等于下单概率阈值所对应的候选商品确定为目标物品,展示给所述注册用户,其中,下单概率阈值可以根据需要设定。本实施例提供的物品处理方式可以根据注册用户的活跃等级确定合适的目标物品,从而满足不同等级注册用户的需求。
示例性的,参考图3,图3为本发明实施例二提供的一种物品处理方法的实现流程图。
首先构建下单预测模型、登录预测模型和品类点击预测模型,然后根据登录预测模型确定注册用户的登录概率,并基于登录概率确定注册用户的活跃度等级,根据下单预测模型确定候选物品被点击下单的下单概率,根据品类点击预测模型确定注册用户点击所述当前平台所曝光物品品类的品类点击概率,最后根据注册用户的活跃度等级,结合下单概率和/或品类点击概率确定对应的目标物品,并进行展示。其中,当注册用户的活跃度等级为高等级即登录概率大于或等于第一概率阈值时,通过计算注册用户和下单概率符合设定条件的候选物品的相似度确定对应的目标物品,当注册用户的活跃度等级为中等级即登录概率大于或等于第二概率阈值,小于第一概率阈值时,将品类点击概率大于或等于品类点击概率阈值所对应的候选物品确定为目标物品,展示给所述注册用户,当当注册用户的活跃度等级为低等级即登录概率小于第二概率阈值时,将下单概率大于或等于下单概率阈值所对应的候选商品确定为目标物品,展示给所述注册用户,满足了不同等级的注册用户的需求。其中,第一目标物品对应于高等级,第二目标物品对应于中等级,第三目标物品对应于低等级。
本发明实施例二提供一种物品处理方法,在上述实施例的基础上,分别选用不同的训练样本对XGBoot模型训练得到对应的下单预测模型、登录预测模型和品类点击预测模型,从而得到对应的下单概率、登录概率和品类点击概率,进而根据登录概率采用不同的方式得到注册用户对应的目标物品,既节省了资源,还可以根据注册用户的活跃等级确定不同的目标物品,满足用户需求。
实施例三
图4为本发明实施例三提供的一种物品处理装置的结构图,本实施例提供的物品处理装置可以执行上述实施例所述的物品处理方法,具体的,参考图4,该装置包括:
数据获取模块310,用于获取候选物品集合中候选物品的物品特征数据、注册用户集合中注册用户的第一特征数据以及第二特征数据;
下单概率预测模块320,用于根据所述物品特征数据预测所对应候选物品被点击下单的下单概率;
登录概率预测模块330,用于根据所述第一特征数据预测所对应注册用户登录当前平台的登录概率;
品类点击概率预测模块340,用于根据所述第二特征数据预测所对应注册用户点击所述当前平台所曝光物品品类的品类点击概率;
第一确定模块350,用于当所述登录概率满足第一条件时,根据所述下单概率和品类点击概率,确定与所述注册用户对应的目标物品,并展示给所述注册用户。
本发明实施例三提供的物品处理装置,通过获取候选物品集合中候选物品的物品特征数据、注册用户集合中注册用户的第一特征数据以及第二特征数据,根据所述物品特征数据预测所对应候选物品被点击下单的下单概率,根据所述第一特征数据预测所对应注册用户登录当前平台的登录概率,根据所述第二特征数据预测所对应注册用户点击所述当前平台所曝光物品品类的品类点击概率,当所述登录概率满足第一条件时,根据所述下单概率和品类点击概率,确定与所述注册用户对应的目标物品,并展示给所述注册用户。与现有技术相比,本发明实施例当预测出的注册用户登录当前平台的登录概率满足第一条件时,根据预测出的下单概率和品类点击概率确定符合注册用户需求的目标物品,即提供了一种统一的物品处理方式,无需针对场景和需求等单独开发,节省了资源。
在上述实施例的基础上,该装置还包括:
模型构建模块,用于在获取候选物品集合中候选物品的物品特征数据、注册用户集合中注册用户的第一特征数据以及第二特征数据之前,构建下单预测模型、登录预测模型和品类点击预测模型。
在上述实施例的基础上,所述模型构建模块,具体用于根据设定时间段内所述当前平台所曝光候选物品的被点击记录和被下单记录,形成包含正样本和负样本的样本训练集,所述正样本为所曝光候选物品被点击后被下单,所述负样本为所曝光候选物品被点击后未被下单;
利用所述样本训练集所包含的候选物品和对应的物品特征数据训练极限梯度提升树模型,得到下单预测模型。
在上述实施例的基础上,下单概率预测模块320,具体用于将所述物品特征数据输入所述下单预测模型,获得所述物品特征数据所对应候选物品被点击下单的下单概率。
在上述实施例的基础上,登录概率预测模块330,具体用于将所述第一特征数据输入所述登录预测模型,获得所对应注册用户登录当前平台的登录概率。
在上述实施例的基础上,品类点击概率预测模块340,具体用于将所述第二特征数据输入所述品类点击预测模型,获得所对应注册用户点击所述当前平台所曝光物品品类的品类点击概率。
在上述实施例的基础上,第一确定模块350,具体用于当所述登录概率大于或等于第一概率阈值时,获取所述注册用户对所曝光物品品类的品类点击概率和下单概率符合设定条件的各候选物品所属所曝光品类的品类概率;
针对每一个下单概率符合设定条件的候选物品,根据预设相似度算法,结合所述注册用户对所曝光物品品类的品类点击概率和所述候选物品所属所曝光品类的品类概率,确定所述注册用户和所述候选物品的相似度;
当所述相似度大于相似度阈值时,将对应的候选物品确定为目标物品,展示给所述注册用户。
在上述实施例的基础上,该装置还包括:
第二确定模块,用于当所述登录概率满足第二条件时,将品类点击概率大于或等于品类点击概率阈值所对应的候选物品确定为目标物品,展示给所述注册用户。
在上述实施例的基础上,该装置还包括:
第三确定模块,用于当所述登录概率满足第三条件时,将下单概率大于或等于下单概率阈值所对应的候选商品确定为目标物品,展示给所述注册用户。
本发明实施例所提供的物品处理装置可执行本发明上述实施例所提供的物品处理方法,具备执行方法相应的功能模块和有益效果。
实施例四
图5为本发明实施例四提供的一种终端的结构图,图5显示的终端只是一种示例,不应对本发明实施例的功能和使用范围带来任何限制。具体的,参考图5,该终端包括:处理器410、存储器420、输入装置430和输出装置440,终端中处理器410的数量可以是一个或多个,图5中以一个处理器410为例,终端中的处理器410、存储器420、输入装置430和输出装置440可以通过总线或其他方式连接,图5中以通过总线连接为例。
存储器420作为一种计算机可读存储介质,可用于存储软件程序、计算机可执行程序以及模块,如本发明实施例中的物品处理方法对应的程序指令/模块。处理器410通过运行存储在存储器420中的软件程序、指令以及模块,从而执行终端的各种功能应用以及数据处理,即实现上述实施例的物品处理方法。
存储器420主要包括存储程序区和存储数据区,其中,存储程序区可存储操作***、至少一个功能所需的应用程序;存储数据区可存储根据终端的使用所创建的数据等。此外,存储器420可以包括高速随机存取存储器,还可以包括非易失性存储器,例如至少一个磁盘存储器件、闪存器件、或其他非易失性固态存储器件。在一些实例中,存储器420可进一步包括相对于处理器410远程设置的存储器,这些远程存储器可以通过网络连接至终端。上述网络的实例包括但不限于互联网、企业内部网、局域网、移动通信网及其组合。
输入装置430可用于接收输入的数字或字符信息,以及产生与终端的用户设置以及功能控制有关的键信号输入。输出装置440可包括显示屏等显示设备、扬声器以及蜂鸣器等音频设备。
本发明实施例四提供的终端与上述实施例提供的物品处理方法属于同一发明构思,未在本实施例中详尽描述的技术细节可参见上述实施例,并且本实施例具备执行物品处理方法相同的有益效果。
实施例五
本发明实施例五还提供一种存储介质,其上存储有计算机程序,该程序被处理器执行时实现如本发明上述实施例所述的物品处理方法。
当然,本发明实施例所提供的一种包含计算机可执行指令的存储介质,其计算机可执行指令不限于如上所述的物品处理方法中的操作,还可以执行本发明任意实施例所提供的物品处理方法中的相关操作,且具备相应的功能和有益效果。
通过以上关于实施方式的描述,所属领域的技术人员可以清楚地了解到,本发明可借助软件及必需的通用硬件来实现,当然也可以通过硬件实现,但很多情况下前者是更佳的实施方式。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品可以存储在计算机可读存储介质中,如计算机的软盘、只读存储器(Read-Only Memory,ROM)、随机存取存储器(RandomAccess Memory,RAM)、闪存(FLASH)、硬盘或光盘等,包括若干指令用以使得一台计算机设备(可以是机器人,个人计算机,服务器,或者网络设备等)执行本发明各个实施例所述的物品处理方法。
注意,上述仅为本发明的较佳实施例及所运用技术原理。本领域技术人员会理解,本发明不限于这里所述的特定实施例,对本领域技术人员来说能够进行各种明显的变化、重新调整和替代而不会脱离本发明的保护范围。因此,虽然通过以上实施例对本发明进行了较为详细的说明,但是本发明不仅仅限于以上实施例,在不脱离本发明构思的情况下,还可以包括更多其他等效实施例,而本发明的范围由所附的权利要求范围决定。

Claims (7)

1.一种物品处理方法,其特征在于,包括:
获取候选物品集合中候选物品的物品特征数据、注册用户集合中注册用户的第一特征数据以及第二特征数据;
根据所述物品特征数据预测所对应候选物品被点击下单的下单概率;
根据所述第一特征数据预测所对应注册用户登录当前平台的登录概率;
根据所述第二特征数据预测所对应注册用户点击所述当前平台所曝光物品品类的品类点击概率;
当所述登录概率满足第一条件时,根据所述下单概率和品类点击概率,确定与所述注册用户对应的目标物品,并展示给所述注册用户;
其中,所述登录概率满足第一条件时,根据所述下单概率和品类点击概率,确定与所述注册用户对应的目标物品,包括:
当所述登录概率大于或等于第一概率阈值时,获取所述注册用户对所曝光物品品类的品类点击概率和下单概率符合设定条件的各候选物品所属所曝光品类的品类概率;
针对每一个下单概率符合设定条件的候选物品,根据预设相似度算法,结合所述注册用户对所曝光物品品类的品类点击概率和所述候选物品所属所曝光品类的品类概率,确定所述注册用户和所述候选物品的相似度;
当所述相似度大于相似度阈值时,将对应的候选物品确定为目标物品,展示给所述注册用户;
当所述登录概率满足第二条件时,将品类点击概率大于或等于品类点击概率阈值所对应的候选物品确定为目标物品,展示给所述注册用户;
当所述登录概率满足第三条件时,将下单概率大于或等于下单概率阈值所对应的候选商品确定为目标物品,展示给所述注册用户。
2.根据权利要求1所述的方法,其特征在于,在获取候选物品集合中候选物品的物品特征数据、注册用户集合中注册用户的第一特征数据以及第二特征数据之前,还包括:
构建下单预测模型、登录预测模型和品类点击预测模型。
3.根据权利要求2所述的方法,其特征在于,所述构建下单预测模型,包括:
根据设定时间段内所述当前平台所曝光候选物品的被点击记录和被下单记录,形成包含正样本和负样本的样本训练集,所述正样本为所曝光候选物品被点击后被下单,所述负样本为所曝光候选物品被点击后未被下单;
利用所述样本训练集所包含的候选物品和对应的物品特征数据训练极限梯度提升树模型,得到下单预测模型。
4.根据权利要求3所述的方法,其特征在于,所述根据所述物品特征数据预测所对应候选物品被点击下单的下单概率,包括:
将所述物品特征数据输入所述下单预测模型,获得所述物品特征数据所对应候选物品被点击下单的下单概率;
所述根据所述第一特征数据预测所对应注册用户登录当前平台的登录概率,包括:
将所述第一特征数据输入所述登录预测模型,获得所对应注册用户登录当前平台的登录概率;
所述根据所述第二特征数据预测所对应注册用户点击所述当前平台所曝光物品品类的品类点击概率,包括:
将所述第二特征数据输入所述品类点击预测模型,获得所对应注册用户点击所述当前平台所曝光物品品类的品类点击概率。
5.一种物品处理装置,其特征在于,包括:
数据获取模块,用于获取候选物品集合中候选物品的物品特征数据、注册用户集合中注册用户的第一特征数据以及第二特征数据;
下单概率预测模块,用于根据所述物品特征数据预测所对应候选物品被点击下单的下单概率;
登录概率预测模块,用于根据所述第一特征数据预测所对应注册用户登录当前平台的登录概率;
品类点击概率预测模块,用于根据所述第二特征数据预测所对应注册用户点击所述当前平台所曝光物品品类的品类点击概率;
第一确定模块,用于当所述登录概率满足第一条件时,根据所述下单概率和品类点击概率,确定与所述注册用户对应的目标物品,并展示给所述注册用户;
其中,所述登录概率满足第一条件时,根据所述下单概率和品类点击概率,确定与所述注册用户对应的目标物品,包括:
当所述登录概率大于或等于第一概率阈值时,获取所述注册用户对所曝光物品品类的品类点击概率和下单概率符合设定条件的各候选物品所属所曝光品类的品类概率;
针对每一个下单概率符合设定条件的候选物品,根据预设相似度算法,结合所述注册用户对所曝光物品品类的品类点击概率和所述候选物品所属所曝光品类的品类概率,确定所述注册用户和所述候选物品的相似度;
当所述相似度大于相似度阈值时,将对应的候选物品确定为目标物品,展示给所述注册用户;
当所述登录概率满足第二条件时,将品类点击概率大于或等于品类点击概率阈值所对应的候选物品确定为目标物品,展示给所述注册用户;
当所述登录概率满足第三条件时,将下单概率大于或等于下单概率阈值所对应的候选商品确定为目标物品,展示给所述注册用户。
6.一种终端,其特征在于,包括:
一个或多个处理器;
存储器,用于存储一个或多个程序;
当所述一个或多个程序被所述一个或多个处理器执行,使得所述一个或多个处理器实现如权利要求1-4中任一项所述的物品处理方法。
7.一种存储介质,其上存储有计算机程序,其特征在于,该程序被处理器执行时实现如权利要求1-4中任一项所述的物品处理方法。
CN201910792539.8A 2019-08-26 2019-08-26 一种物品处理方法、装置、终端及存储介质 Active CN110503482B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201910792539.8A CN110503482B (zh) 2019-08-26 2019-08-26 一种物品处理方法、装置、终端及存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201910792539.8A CN110503482B (zh) 2019-08-26 2019-08-26 一种物品处理方法、装置、终端及存储介质

Publications (2)

Publication Number Publication Date
CN110503482A CN110503482A (zh) 2019-11-26
CN110503482B true CN110503482B (zh) 2022-04-22

Family

ID=68589727

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201910792539.8A Active CN110503482B (zh) 2019-08-26 2019-08-26 一种物品处理方法、装置、终端及存储介质

Country Status (1)

Country Link
CN (1) CN110503482B (zh)

Family Cites Families (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105528374A (zh) * 2014-10-21 2016-04-27 苏宁云商集团股份有限公司 一种电子商务中的商品推荐方法及其***
CN107105031A (zh) * 2017-04-20 2017-08-29 北京京东尚科信息技术有限公司 信息推送方法和装置
CN109165974A (zh) * 2018-08-06 2019-01-08 深圳乐信软件技术有限公司 一种商品推荐模型训练方法、装置、设备及存储介质
CN109961357B (zh) * 2019-03-25 2021-09-03 上海拉扎斯信息科技有限公司 用户数据处理方法、装置、电子设备及存储介质
CN110148022A (zh) * 2019-05-14 2019-08-20 达疆网络科技(上海)有限公司 一种实时预测更新用户下单概率的方法

Also Published As

Publication number Publication date
CN110503482A (zh) 2019-11-26

Similar Documents

Publication Publication Date Title
CN104951428B (zh) 用户意图识别方法及装置
CN111080413A (zh) 电商平台商品的推荐方法、装置、服务器和存储介质
CN109816483B (zh) 信息推荐方法及装置、可读存储介质
CN105160545B (zh) 投放信息样式确定方法及装置
CN110647683B (zh) 一种信息推荐方法、装置
CN111435482A (zh) 一种外呼模型的构建方法、外呼方法、装置和存储介质
WO2020258773A1 (zh) 确定推送用户群的方法、装置、设备及存储介质
CN106779926A (zh) 关联规则生成方法、装置及终端
US20210357553A1 (en) Apparatus and method for option data object performance prediction and modeling
CN111582448B (zh) 一种权重训练方法、装置、计算机设备和存储介质
CN116501979A (zh) 信息推荐方法、装置、计算机设备及计算机可读存储介质
CN110503482B (zh) 一种物品处理方法、装置、终端及存储介质
CN115600818A (zh) 多维评分方法、装置、电子设备和存储介质
CN113656702A (zh) 用户行为的预测方法及装置
CN114266601A (zh) 营销策略确定方法、装置、终端设备及存储介质
CN112905892A (zh) 应用于用户画像挖掘的大数据处理方法及大数据服务器
CN112307319A (zh) 一种页面生成方法及装置
CN112380419B (zh) 一种竞品数据查询方法、***及电子设备
CN113821722B (zh) 数据处理方法、推荐方法、装置、电子设备以及介质
CN117217852B (zh) 一种基于行为识别购买意愿度预测方法及装置
CN114417944B (zh) 识别模型训练方法及装置、用户异常行为识别方法及装置
CN117454215A (zh) 回馈资源的配置方法、装置和计算机设备
CN112052903A (zh) 多标签处理任务训练样本构建方法、设备及介质
CN108319449B (zh) 一种应用程序架构确定方法及装置
CN116910604A (zh) 用户分类方法、装置、计算机设备、存储介质和程序产品

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant