CN107451832B - 推送信息的方法和装置 - Google Patents

推送信息的方法和装置 Download PDF

Info

Publication number
CN107451832B
CN107451832B CN201610371042.5A CN201610371042A CN107451832B CN 107451832 B CN107451832 B CN 107451832B CN 201610371042 A CN201610371042 A CN 201610371042A CN 107451832 B CN107451832 B CN 107451832B
Authority
CN
China
Prior art keywords
data
user
period
pushing information
feature data
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201610371042.5A
Other languages
English (en)
Other versions
CN107451832A (zh
Inventor
黄靖锋
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing Jingdong Century Trading Co Ltd
Beijing Jingdong Shangke Information Technology Co Ltd
Original Assignee
Beijing Jingdong Century Trading Co Ltd
Beijing Jingdong Shangke Information Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing Jingdong Century Trading Co Ltd, Beijing Jingdong Shangke Information Technology Co Ltd filed Critical Beijing Jingdong Century Trading Co Ltd
Priority to CN201610371042.5A priority Critical patent/CN107451832B/zh
Publication of CN107451832A publication Critical patent/CN107451832A/zh
Application granted granted Critical
Publication of CN107451832B publication Critical patent/CN107451832B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q30/00Commerce
    • G06Q30/02Marketing; Price estimation or determination; Fundraising
    • G06Q30/0241Advertisements
    • G06Q30/0251Targeted advertisements
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q30/00Commerce
    • G06Q30/02Marketing; Price estimation or determination; Fundraising
    • G06Q30/0241Advertisements
    • G06Q30/0251Targeted advertisements
    • G06Q30/0253During e-commerce, i.e. online transactions
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q30/00Commerce
    • G06Q30/02Marketing; Price estimation or determination; Fundraising
    • G06Q30/0241Advertisements
    • G06Q30/0251Targeted advertisements
    • G06Q30/0255Targeted advertisements based on user history
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02DCLIMATE CHANGE MITIGATION TECHNOLOGIES IN INFORMATION AND COMMUNICATION TECHNOLOGIES [ICT], I.E. INFORMATION AND COMMUNICATION TECHNOLOGIES AIMING AT THE REDUCTION OF THEIR OWN ENERGY USE
    • Y02D10/00Energy efficient computing, e.g. low power processors, power management or thermal management

Landscapes

  • Business, Economics & Management (AREA)
  • Accounting & Taxation (AREA)
  • Finance (AREA)
  • Engineering & Computer Science (AREA)
  • Development Economics (AREA)
  • Strategic Management (AREA)
  • Game Theory and Decision Science (AREA)
  • Entrepreneurship & Innovation (AREA)
  • Economics (AREA)
  • Marketing (AREA)
  • Physics & Mathematics (AREA)
  • General Business, Economics & Management (AREA)
  • General Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本申请公开了推送信息的方法和装置。所述方法的一具体实施方式包括:基于优先维度数据库中的优先维度,获取预定时间段内用户的多维度的特征数据;将多维度的特征数据划分至多个周期;获取每个周期的用户活跃度值;在预定的周期内,计算两两周期的用户活跃度值之间的欧式距离;根据欧式距离,聚类用户群体数据;根据用户群体数据,向用户端推送信息。该实施方式提高了对用户数据的利用率和聚类用户群体的准确度,从而使得向用户推送的信息更具针对性。

Description

推送信息的方法和装置
技术领域
本申请涉及计算机技术领域,具体涉及互联网技术领域,尤其涉及生成推送信息的方法和装置。
背景技术
推送信息的方法,是指基于客观数据向用户推送信息。目前较为常见的推送信息的方法,是基于用户画像向用户推送信息。这里的用户画像,是真实用户的虚拟代表,是建立在一系列真实数据(订单数据和有用数据等)之上的目标用户模型。用户画像包括了用户的基础数据(如年龄、性别等)、兴趣(如图书、服饰等)和消费习惯(如时间、数量和金额)等,因此,商家可以根据用户画像提供更具针对性的服务。
目前的推送信息的方法,首先通过对现有用户数据进行人工的分析,确定用户群体的规律,进而构建用户画像模型的规则,然后人工进行用户画像的建模,生成模型后,再生成执行语句,最后在大数据平台执行并获取用户群体数据。
然而,目前的推送信息的方法,需要通过人工分析确定用户群体的规律且用户基础数据的利用率较低,因此获取用户群体数据的效率较低且向用户推送信息的准确度较低。
发明内容
本申请的目的在于提出一种改进的推送信息的方法和装置,来解决以上背景技术部分提到的技术问题。
第一方面,本申请提供了一种推送信息的方法,所述方法包括:基于优先维度数据库中的优先维度,获取预定时间段内用户的多维度的特征数据;将所述多维度的特征数据划分至多个周期;获取每个周期的用户活跃度值;在预定的周期内,计算两两周期的用户活跃度值之间的欧式距离;根据所述欧式距离,聚类用户群体数据;根据所述用户群体数据,向用户端推送信息。
第二方面,本申请提供了一种推送信息的装置,所述装置包括:所述装置包括:第一获取单元,用于基于优先维度数据库中的优先维度,获取预定时间段内用户的多维度的特征数据;划分单元,用于将所述多维度的特征数据划分至多个周期;第二获取单元,用于获取每个周期的用户活跃度值;计算单元,用于在预定的周期内,计算两两周期的用户活跃度值之间的欧式距离;聚类单元,用于根据所述欧式距离,聚类用户群体数据;推送单元,用于根据所述用户群体数据,向用户端推送信息。
本申请提供的推送信息的方法和装置,通过基于优先维度数据库中的优先维度,获取预定时间段内用户的多维度的特征数据,而后将多维度的特征数据划分至多个周期,之后获取每个周期的用户活跃度值,之后在预定的周期内,计算两两周期的用户活跃度值之间的欧式距离,之后根据欧式距离,聚类用户群体数据,之后根据用户群体数据,向用户端推送信息,从而通过计算机确定了用户群体的规律,提高了确定用户群体的效率,并且提高了用户基础数据的利用率,使得向用户推送的信息更具针对性。
附图说明
通过阅读参照以下附图所作的对非限制性实施例所作的详细描述,本申请的其它特征、目的和优点将会变得更明显:
图1是本申请可以应用于其中的示例性***架构图;
图2是根据本申请的推送信息的方法的一个实施例的流程图;
图3是根据本申请的推送信息的方法的又一个实施例的流程图;
图4是根据本申请的推送信息的方法的一个应用场景的示意图;
图5是根据本申请的推送信息的装置的一个实施例的结构示意图;
图6是根据本申请的推送信息的装置的又一个实施例的结构示意图;
图7是适于用来实现本申请实施例的终端设备或服务器的计算机***的结构示意图。
具体实施方式
下面结合附图和实施例对本申请作进一步的详细说明。可以理解的是,此处所描述的具体实施例仅仅用于解释相关发明,而非对该发明的限定。另外还需要说明的是,为了便于描述,附图中仅示出了与有关发明相关的部分。
需要说明的是,在不冲突的情况下,本申请中的实施例及实施例中的特征可以相互组合。下面将参考附图并结合实施例来详细说明本申请。
图1示出了可以应用本申请的推送信息的方法或推送信息的装置的实施例的示例性***架构100。
如图1所示,***架构100可以包括终端设备101、102、103,网络104和服务器105、106。网络104用以在终端设备101、102、103和服务器105、106之间提供通信链路的介质。网络104可以包括各种连接类型,例如有线、无线通信链路或者光纤电缆等等。
用户110可以使用终端设备101、102、103通过网络104与服务器105、106交互,以接收或发送消息等。终端设备101、102、103上可以安装有各种通讯客户端应用,例如网页浏览器应用、购物类应用、搜索类应用、即时通信工具、邮箱客户端、社交平台软件等。
终端设备101、102、103可以是具有显示屏并且支持人机交互的各种电子设备,包括但不限于智能手机、平板电脑、MP3播放器(Moving Picture Experts Group AudioLayer III,动态影像专家压缩标准音频层面3)、MP4(Moving Picture Experts GroupAudio Layer IV,动态影像专家压缩标准音频层面4)播放器、膝上型便携计算机和台式计算机等等。
服务器105、106可以是提供各种服务的服务器,例如对终端设备101、102、103上显示的信息提供支持的后台服务器。后台服务器可以对接收到的用户的多维度的特征数据进行分析等处理,并将处理结果(例如推送信息)反馈给终端设备。
需要说明的是,本申请实施例所提供的推送信息的方法一般由服务器105、106执行,相应地,推送信息的装置一般设置于服务器105、106中。
应该理解,图1中的终端设备、网络和服务器的数目仅仅是示意性的。根据实现需要,可以具有任意数目的终端设备、网络和服务器。
继续参考图2,示出了根据本申请的推送信息的方法的一个实施例的流程200。所述的推送信息的方法,包括以下步骤:
步骤201,基于优先维度数据库中的优先维度,获取预定时间段内用户的多维度的特征数据。
在本实施例中,推送信息的方法运行于其上的电子设备(例如图1所示的服务器)可以通过有线连接方式或者无线连接方式向用户终端推送信息。需要指出的是,上述无线连接方式可以包括但不限于3G/4G连接、WiFi连接、蓝牙连接、WiMAX连接、Zigbee连接、UWB(ultra wideband)连接、以及其他现在已知或将来开发的无线连接方式。通常,用户利用终端上安装的网页浏览器应用、购物类应用、搜索类应用、即时通信工具等来浏览网页或购物。
应当理解,在上述的优先维度数据库中,可以包括技术开发人员预设的优先维度及优先维度的数量。例如,技术开发人员可以预设优先维度为订单数据和购物车数据这两个维度,则在基于优先维度数据库中的优先维度,获取预定时间段内用户的多维度的特征数据时,可以优先获取用户的订单数据和购物车数据。
这里的多维度的特征数据,可以包括以下维度中的多项:订单数据、购物车数据、收藏数据、咨询数据、评论数据、关注数据、转发数据、浏览记录数据、搜索记录数据、发表数据、性别数据、年龄数据、收入数据、职业数据、心理特征数据、价值观数据、消费行为偏好数据、态度数据和习惯数据。例如,可以选取订单数据和浏览数据这两个维度作为准备获取的维度,之后获取每一个用户这两个维度的特征数据。
这里的预定时间段是指根据实际需要预先设定的时间维度。例如,可以根据需要设定选取推送信息之前1年内的数据作为预定时间段内用户的多维度的特征数据。
步骤202,将多维度的特征数据划分至多个周期。
在本实施例中,基于步骤201中获取的多维度的特征数据,可以按照需要将多维度的特征数据划分至多个周期。例如,若需要获取用户在10日内的特征数据,则可以将每个周期设定为10日,从而将上述获取的1年内的多维度的特征数据划分至37个周期。
步骤203,获取每个周期的用户活跃度值。
在本实施例中,在获取每个周期的用户活跃度值时,可以对每个周期的多维度的特征数据进行分析处理,并根据预设的用户活跃度计算规则将每个周期的多维度的特征数据转换为用户活跃度值。这里的用户活跃度规则可以为现有技术中或未来发展的技术中的用户活跃度计算规则,本申请对此不作限定。
在本实施例的可选实现方式中,获取每个周期的用户活跃度值可以包括:在每个周期中获取多维度的特征数据的加权平均值;归一化加权平均值,得到归一化后的特征数据;拟合归一化后的特征数据,得到用户活跃度曲线;根据用户活跃度曲线,获取每个周期的用户活跃度值。
在本实现方式中,预先对应不同维度的特征数据设定了权重,这里的权重是指该维度的特征数据在多维度的特征数据中的相对重要程度,因此在每个周期可以根据权重获取多维度的特征数据的加权平均值;之后对加权平均值进行归一化处理,使得加权平均值的绝对值转换为同一区间内的相对值关系,从而得到归一化后的特征数据;之后拟合归一化后的特征数据,得到用户活跃度曲线,这里的拟合是指已知某函数的若干离散函数值{f1,f2,…,fn},通过调整该函数中若干待定系数f(λ1,λ2,…,λn),使得该函数与已知点集的差别(例如最小二乘意义的差别)最小;最后根据用户活跃度曲线,获取每个周期的用户活跃度值,应当理解,此时的用户活跃度值是与各周期相对应的用户活跃度曲线上的值。
应当理解,这里的拟合方法可以采用现有技术或未来发展的技术中的拟合方法,本申请对此不作限定。示例性的,拟合归一化后的特征数据,得到用户活跃度曲线可以包括:将归一化后的特征数据输入支持向量回归模型(SVR)进行拟合,从而得到用户活跃度曲线。在使用支持向量回归模型拟合归一化后的特征数据时,上述的推送信息的方法还可以包括:使用归一化后的特征数据,训练支持向量回归模型。这里的训练支持向量回归模型的方法可以采用现有技术中或未来发展的技术中已有的训练方法,在此不再赘述。
步骤204,在预定的周期内,计算两两周期的用户活跃度值之间的欧式距离。
在本实施例中,欧氏距离也即欧几里得度量(euclidean metric),是一个通常采用的距离定义,指在m维空间中两个点之间的真实距离,或者向量的自然长度(即该点到原点的距离)。在本申请的二维空间中的欧氏距离就是两点之间的实际距离,因此,在预定的周期内,也即在按照预先设定的重点关注的周期内,计算两两周期的用户活跃度值之间的欧式距离,也即计算两两周期的用户活跃度值之间的实际距离。
步骤205,根据欧式距离,聚类用户群体数据。
在本实施例中,在步骤204得到的欧式距离的基础上,可以根据欧式距离,对欧式距离相近的用户群体数据进行聚类,也即得到在重点关注的周期内用户活跃度值的变化趋势类似的用户群体。这里的聚类,是指将用户群体数据分成由类似的欧式距离组成的多个类的过程。
步骤206,根据用户群体数据,向用户端推送信息。
在本实施例中,基于步骤205中得到的用户群体数据,可以向在重点关注的周期内活跃度值的变化趋势类似的用户群体推送信息。
本申请的上述实施例提供的推送信息的方法,可以向确定了用户群体规律的用户推送信息,提高了对用户数据的利用率和聚类用户群体的准确度,从而使得向用户推送的信息更具针对性。
进一步参考图3,示出了根据本申请的推送信息的方法的又一个实施例的流程300。所述的推送信息的方法,包括以下步骤:
在步骤301中,基于优先维度数据库中的优先维度,获取预定时间段内用户的多维度的特征数据,之后执行步骤302;
在步骤302中,将多维度的特征数据划分至多个周期,之后执行步骤303;
在步骤303中,获取每个周期的用户活跃度值,之后执行步骤304;
在步骤304中,在预定的周期内,计算两两周期的用户活跃度值之间的欧式距离,之后执行步骤305;
在步骤305中,根据欧式距离,聚类用户群体数据,之后执行步骤306;
在步骤306中,检测用户群体数据中与历史用户订单数据相符的用户个体数据,之后执行步骤307;
在步骤307中,获取用户个体数据所获取的特征数据的维度以及每一个所获取的特征数据的维度的数量,之后执行步骤308;
在步骤308中,根据数量从大到小,获取预设数量所获取的特征数据的维度,之后执行步骤309;
在步骤309中,将预设数量所获取的特征数据的维度作为优先维度,更新优先维度数据库,之后执行步骤301。
应当理解,上述步骤301至步骤305与上述图2中的步骤201至步骤205一一对应,因此,步骤201至步骤205中的描述的操作和步骤同样适用于步骤301至步骤305,在此不再赘述。
在步骤306至步骤309中,用户群体数据为根据多维度的特征数据分析处理后得到的聚类数据,而历史用户订单数据为真实发生过的订单的数据,根据真实发生过的订单数据,可以检测用户群体数据中正确购买的用户的特征数据,获取正确购买的用户的特征数据的维度(也即上述的用户个体数据所获取的特征数据的维度)。具体地,可以通过递归查找的方式找到历史用户订单数据对应的用户群体数据的类别,查找完毕后,将用户自身所包含的特征数据的维度进行统计并排序,找出预设数量的特征数据的维度,将预设数量的特征数据的维度作为优先维度更新至优先维度数据库,若优先维度数据库中已包括该维度,则跳过该更新步骤,若优先维度数据库中未包括该维度,则将该维度更新至优先维度数据库,之后执行步骤301。
本申请的上述实施例提供的推送信息的方法,可以获取预定时间段内用户的优先维度的特征数据作为用户基础数据进行分析,提高了对用户基础数据的利用率,并且提高了聚类用户群体的效率和准确度,从而使得向用户推送的信息更具针对性。
继续参见图4,图4是根据本实施例的推送信息的方法的应用场景的一个示意性流程图。
如图4所示,在该推送信息的方法的应用场景中,设计了以下四个模块来实现推送信息的方法:数据提取模块410、模型分类模块420、强化学习模块430和推送信息模块440。
其中,数据提取模块410的主要功能是在大数据平台提取时间维度的全部数据,并经过时间周期变换和数据量级的归一化变化后,使得用户杂乱的数据,变成可以使用模型进行计算统一的数据格式。
数据提取模块可以通过以下步骤得到统一的数据格式:
首先,在步骤411中,提取多维度的特征数据。
在建立模型之前,需要提取用户的基础信息,首先在大数据平台按照时间格式提取预定时间段内用户的历史订单数据、历史浏览数据等多维度的特征数据(注意:特征数据的维度最开始时是凭经验选取(例如订单,浏览等),当强化学习模块430中的优先维度数据库的优先维度不断增加后,就会自动被特征提取模块调用,保证优先维度被优先选取),假定按如下格式数据提取1年以内的多维度的特征数据:
之后,在步骤412中,变换多维度的特征数据的时间周期。
在选取了指定的按时间排列的多维度的特征数据以后,需要根据不同的周期采用时间周期变换,并且还需要将每个用户不同维度(订单数据、浏览数据)的特征数据都放到一个统一的时间生命周期(以10天为一个周期为例)里。变化后的格式为:
testname 0.0 0.0 4 6 6 0.0 0.0 4 0.0 0.0 0.0 0.0 0.0 0.0 0.0 0.0 0.00.0 0.0 0.0 0.0 0.0 0.0 0.0 0.0 0.0 0.0 0.0 0.0 0.0 0.0 0.0 0.0 0.0 0.0 0.00.0
说明:其中的testname为测试所用的用户名称,这里的4=(4×0.9+0.1×4),是指其中一个周期里订单数的总数为4,浏览数总数为4,订单的权重为0.9,浏览的权重为0.1,从而得到订单数据、浏览数据两个维度的特征数据的加权平均值为4,同理,其它周期中的数值也是订单数据、浏览数据两个维度的特征数据的加权平均值。
之后,在步骤413中,将变换时间周期后的特征数据归一化。
在得到变换时间周期后的特征数据之后,不同的用户之间的数据,可能存在数量级的差别,假设A用户,在一个月内,订单数为10个有效单,浏览次数1次,B用户,在一个月内,订单数为100个有效订单,浏览次数为10,如果这时直接进行周期变换,B用户最后计算出来的活跃值肯定比A用户高,但这样其实是不准确的,需要进行数学上的变化,将A用户的数据和B用户的数据都划分到同一个区间,比如[0,4]之间,下面假定随机从数据池里取的一个数据:
testname 0.0 0.0 0.5 1.0 1.0 0.0 0.0 0.5 0.0 0.0 0.0 0.0 0.0 0.0 0.00.0 0.0 0.0 0.0 0.0 0.0 0.0 0.0 0.0 0.0 0.0 0.0 0.0 0.0 0.0 0.0 0.0 0.0 0.00.0 0.0 0.0
到此,一个时间周期的用户画像就被这样刻画出来了,是用一组统一格式的数据表示。
模型分类模块420的主要功能是通过数据提取模块输入的数据,通过SVR算法来建立模型,并计算出基于时间生命周期的用户活跃度,并按照用户活跃度来聚类用户群体。
模型分类模块420通过以下步骤聚类用户群体:
在得到了从数据提取模块输入的归一化的数据后,在步骤421中,开始建立SVR模型并根据建立好的SVR模型生成拟合曲线,之后在步骤422中,计算每个用户在各个周期的活跃度的值,之后在步骤423中,根据每个用户在各个周期的活跃度的值,聚类用户群体。
当前采用的方法是:训练获取的周期数据,来计算SVR回归(和已有值对比)后和SVR预测(未知数据对比)的周期值,例如,testname用户现在的有37个15天的周期值如下:
Testname 0.00.0 0.5 1.0 1.0 0.0 0.0 0.5 0.0 0.0 0.0 0.0 0.0 0.0 0.00.0 0.0 0.0 0.0 0.0 0.0 0.0 0.0 0.0 0.0 0.0 0.0 0.0 0.0 0.0 0.0 0.0 0.0 0.00.0 0.0 0.0
最早的提取时间是2014-1-1,最晚的时间是2015-1-1,那么我们想知道2015年1月1日至1月14日周期的值时,通过SVR计算后对应的值为:
其中,0.0996304954031为当前用户所处的状态,0.156469039467为下个周期可能所处的状态。
而目前在对所有数据进行统计后,对数据出现的频率进行排序,取频率出现最高的5个区间,所以活跃期划分如下:
小于0.11:无活跃
0.11到0.5:低活跃
0.5到1.5:正常活跃
1.5到2.5:高活跃
大于2.5:超高活跃
到此,获得了所有用户的活跃度值。
接下来,开始计入用户群体分类子模块,这个模块的输入如下:
举例:
然后根据划定的周期,找到对应的时间序列,例如最后4个15天的周期:
0.0999411429443 0.100038003852 0.0996304954031 0.156469039467,计算两两之间的差值,得到三个差值,同理,计算所有用户最后4个周期的值,最后再两两计算他们之间的欧式距离,直到计算停止,输出用户群体。
强化学习模块430的主要功能是通过输入模型分类模块分类好的用户群体数据和输入真实营销周期里的真实用户购物订单数据来进行比对评价,找出正确购买的用户的特征数据的维度,统计所有这些正确用户的特征数据的维度,传入独立的优先维度数据库,并在数据提取模块使用提取多维度的特征数据时,提供优先维度给特征提取模块使用。
强化学习模块430通过以下步骤生成优先维度数据库:
在步骤S431中,评估聚类的用户群体的效果,使用递归查找的方式找到对应真实用户购物订单数据的用户群体所在的类别,之后,在查找完毕后的步骤S432中,将这部分用户自身所包含的特征数据的维度进行数量统计并进行排序,找出前三个数据特征的维度,之后,在步骤S433中,将这三个维度更新至优先维度数据库中,如果优先维度数据库中已经有这个维度了,则跳过,没有更新。使得下次建模能够自动化完成,而不是人工的进行数据的分析和建模。
推送信息模块440的主要功能是根据模型分类模块420输出的聚类用户群体向用户推送信息。
推送信息模块440通过步骤S441推送用户信息。在步骤S441中,使用查询的方式在向用户推送的信息中查询符合聚类后的用户群体的类别的信息,之后向用户推送符合聚类后的用户群体的类别的信息。
在本申请的上述实施例的应用场景中,推送信息的方法通过向聚类后的用户群体推送信息,并获取预定时间段内用户的优先维度的特征数据作为用户基础数据进行分析,提高了对用户数据的利用率和聚类用户群体的准确度,从而使得向用户推送的信息更具针对性。
进一步参考图5,作为对上述各图所示方法的实现,本申请提供了一种推送信息的装置的一个实施例,该装置实施例与图2所示的方法实施例相对应,该装置具体可以应用于各种电子设备中。
如图5所示,本实施例所述的推送信息的装置500包括:第一获取单元510、划分单元520、第二获取单元530、计算单元540、聚类单元550和推送单元560。
第一获取单元510,用于基于优先维度数据库中的优先维度,获取预定时间段内用户的多维度的特征数据。
划分单元520,用于将多维度的特征数据划分至多个周期。
第二获取单元530,用于获取每个周期的用户活跃度值。
计算单元540,用于在预定的周期内,计算两两周期的用户活跃度值之间的欧式距离。
聚类单元550,用于根据欧式距离,聚类用户群体数据。
推送单元560,用于根据用户群体数据,向用户端推送信息。
本领域技术人员可以理解,上述推送信息的装置500还包括一些其他公知结构,例如处理器、存储器等,为了不必要地模糊本公开的实施例,这些公知的结构在图5中未示出。
应当理解,装置500中记载的诸单元与参考图2描述的方法中的各个步骤相对应。由此,上文针对推送信息的方法描述的操作和特征同样适用于装置500及其中包含的单元,在此不再赘述。装置500中的相应单元可以与终端设备和/或服务器中的单元相互配合以实现本申请实施例的方案。
进一步参考图6,作为对上述各图所示方法的实现,本申请提供了一种推送信息的装置的一个实施例,该装置实施例与图2所示的方法实施例相对应,该装置具体可以应用于各种电子设备中。
如图6所示,本实施例所述的推送信息的装置600包括:第一获取单元610、划分单元620、第二获取单元630、计算单元640、聚类单元660和推送单元660。
第一获取单元610,用于基于优先维度数据库中的优先维度,获取预定时间段内用户的多维度的特征数据。
划分单元620,用于将多维度的特征数据划分至多个周期。
第二获取单元630,用于获取每个周期的用户活跃度值。
计算单元640,用于在预定的周期内,计算两两周期的用户活跃度值之间的欧式距离。
聚类单元650,用于根据欧式距离,聚类用户群体数据。
检测单元660,用于检测用户群体数据中与用户的历史订单数据相符的用户个体数据。
第三获取单元670,用于获取用户个体数据所获取的特征数据的维度以及每一个所获取的特征数据的维度的数量。
第四获取单元680,用于根据数量从大到小,获取预设数量所获取的特征数据的维度。
设定单元690,用于将预设数量所获取的特征数据的维度作为优先维度,更新优先维度数据库。
本领域技术人员可以理解,上述推送信息的装置600还包括一些其他公知结构,例如处理器、存储器等,为了不必要地模糊本公开的实施例,这些公知的结构在图6中未示出。
应当理解,装置600中记载的诸单元与参考图3描述的方法中的各个步骤相对应。由此,上文针对推送信息的方法描述的操作和特征同样适用于装置600及其中包含的单元,在此不再赘述。装置600中的相应单元可以与终端设备和/或服务器中的单元相互配合以实现本申请实施例的方案。
在本申请的上述实施例中,第一获取单元、第二获取单元、第三获取单元及第四获取单元仅代表获取对象各不相同的四个单元。本领域技术人员应当理解,其中的第一、第二、第三或第四并不构成对获取单元的特殊限定。
同理,第一获取子单元、第二获取子单元仅代表获取对象各不相同的两个子单元。本领域技术人员应当理解,其中的第一或第二并不构成对获取子单元的特殊限定。
下面参考图7,其示出了适于用来实现本申请实施例的终端设备或服务器的计算机***700的结构示意图。
如图7所示,计算机***700包括中央处理单元(CPU)701,其可以根据存储在只读存储器(ROM)702中的程序或者从存储部分708加载到随机访问存储器(RAM)703中的程序而执行各种适当的动作和处理。在RAM 703中,还存储有***700操作所需的各种程序和数据。CPU 701、ROM 702以及RAM 703通过总线704彼此相连。输入/输出(I/O)接口705也连接至总线704。
以下部件连接至I/O接口705:包括键盘、鼠标等的输入部分706;包括诸如阴极射线管(CRT)、液晶显示器(LCD)等以及扬声器等的输出部分707;包括硬盘等的存储部分708;以及包括诸如LAN卡、调制解调器等的网络接口卡的通信部分709。通信部分709经由诸如因特网的网络执行通信处理。驱动器710也根据需要连接至I/O接口705。可拆卸介质711,诸如磁盘、光盘、磁光盘、半导体存储器等等,根据需要安装在驱动器710上,以便于从其上读出的计算机程序根据需要被安装入存储部分708。
特别地,根据本公开的实施例,上文参考流程图描述的过程可以被实现为计算机软件程序。例如,本公开的实施例包括一种计算机程序产品,其包括有形地包含在机器可读介质上的计算机程序,所述计算机程序包含用于执行流程图所示的方法的程序代码。在这样的实施例中,该计算机程序可以通过通信部分709从网络上被下载和安装,和/或从可拆卸介质711被安装。
附图中的流程图和框图,图示了按照本申请各种实施例的***、方法和计算机程序产品的可能实现的体系架构、功能和操作。在这点上,流程图或框图中的每个方框可以代表一个单元、程序段、或代码的一部分,所述单元、程序段、或代码的一部分包含一个或多个用于实现规定的逻辑功能的可执行指令。也应当注意,在有些作为替换的实现中,方框中所标注的功能也可以以不同于附图中所标注的顺序发生。例如,两个接连地表示的方框实际上可以基本并行地执行,它们有时也可以按相反的顺序执行,这依所涉及的功能而定。也要注意的是,框图和/或流程图中的每个方框、以及框图和/或流程图中的方框的组合,可以用执行规定的功能或操作的专用的基于硬件的***来实现,或者可以用专用硬件与计算机指令的组合来实现。
描述于本申请实施例中所涉及到的单元可以通过软件的方式实现,也可以通过硬件的方式来实现。所描述的单元也可以设置在处理器中,例如,可以描述为:一种处理器包括第一获取单元、划分单元、第二获取单元、计算单元、聚类单元和推送单元。其中,这些单元的名称在某种情况下并不构成对该单元本身的限定,例如,语义接收单元还可以被描述为“基于优先维度数据库中的优先维度,获取预定时间段内用户的多维度的特征数据的单元”。
作为另一方面,本申请还提供了一种非易失性计算机存储介质,该非易失性计算机存储介质可以是上述实施例中所述装置中所包含的非易失性计算机存储介质;也可以是单独存在,未装配入终端中的非易失性计算机存储介质。上述非易失性计算机存储介质存储有一个或者多个程序,当所述一个或者多个程序被一个设备执行时,使得所述设备:基于优先维度数据库中的优先维度,获取预定时间段内用户的多维度的特征数据;将多维度的特征数据划分至多个周期;获取每个周期的用户活跃度值;在预定的周期内,计算两两周期的用户活跃度值之间的欧式距离;根据欧式距离,聚类用户群体数据;根据用户群体数据,向用户端推送信息。
以上描述仅为本申请的较佳实施例以及对所运用技术原理的说明。本领域技术人员应当理解,本申请中所涉及的发明范围,并不限于上述技术特征的特定组合而成的技术方案,同时也应涵盖在不脱离所述发明构思的情况下,由上述技术特征或其等同特征进行任意组合而形成的其它技术方案。例如上述特征与本申请中公开的(但不限于)具有类似功能的技术特征进行互相替换而形成的技术方案。

Claims (11)

1.一种推送信息的方法,其特征在于,所述方法包括:
基于优先维度数据库中的优先维度,获取预定时间段内每个用户的多维度的特征数据;
将所述每个用户的多维度的特征数据划分至多个周期,其中,所述多个周期通过对所述预定时间段进行划分得到;
获取每个用户在每个周期的用户活跃度值;
在预定的周期内,计算每个用户的两两周期的用户活跃度值之间的欧式距离;
根据所述欧式距离,聚类用户群体数据,以将在所述预定的周期内活跃度值的变化趋势类似的用户组成用户群体;
根据所述用户群体数据,向用户端推送信息;
其中,所述获取每个用户在每个周期的用户活跃度值,包括:根据预设的用户活跃度计算规则将所述多个周期中每个周期的多维度的特征数据转换为用户活跃度值;具体包括:
在每个周期中获取多维度的特征数据的加权平均值;归一化所述加权平均值,得到归一化后的特征数据;拟合所述归一化后的特征数据,得到用户活跃度曲线;根据所述用户活跃度曲线,获取每个周期的用户活跃度值。
2.根据权利要求1所述的推送信息的方法,其特征在于,所述拟合所述归一化后的特征数据,得到用户活跃度曲线包括:
将所述归一化后的特征数据输入支持向量回归模型进行拟合,得到用户活跃度曲线。
3.根据权利要求2所述的推送信息的方法,其特征在于,所述获取每个用户在每个周期的用户活跃度值还包括:
采用所述归一化后的特征数据,训练所述支持向量回归模型。
4.根据权利要求1所述的推送信息的方法,其特征在于,所述方法还包括:
检测所述用户群体数据中与用户的历史订单数据相符的用户个体数据;
获取所述用户个体数据所获取的特征数据的维度以及每一个所获取的特征数据的维度的数量;
根据所述数量从大到小,获取预设数量所获取的特征数据的维度;
将所述预设数量所获取的特征数据的维度作为优先维度,更新所述优先维度数据库。
5.根据权利要求1所述的推送信息的方法,其特征在于,所述特征数据包括以下维度中的多项:订单数据、购物车数据、收藏数据、咨询数据、评论数据、关注数据、转发数据、浏览记录数据、搜索记录数据、发表数据、性别数据、年龄数据、收入数据、职业数据、心理特征数据、价值观数据、消费行为偏好数据、态度数据和习惯数据。
6.一种推送信息的装置,其特征在于,所述装置包括:
第一获取单元,用于基于优先维度数据库中的优先维度,获取预定时间段内每个用户的多维度的特征数据;
划分单元,用于将所述每个用户的多维度的特征数据划分至多个周期,其中,所述多个周期通过对所述预定时间段进行划分得到;
第二获取单元,用于获取每个用户在每个周期的用户活跃度值;
计算单元,用于在预定的周期内,计算每个用户的两两周期的用户活跃度值之间的欧式距离;
聚类单元,用于根据所述欧式距离,聚类用户群体数据,以将在所述预定的周期内活跃度值的变化趋势类似的用户组成用户群体;
推送单元,用于根据所述用户群体数据,向用户端推送信息;
所述第二获取单元,进一步用于:根据预设的用户活跃度计算规则将所述多个周期中每个周期的多维度的特征数据转换为用户活跃度值;
其中,所述第二获取单元包括:第一获取子单元,用于在每个周期中获取多维度的特征数据的加权平均值;归一化子单元,用于归一化所述加权平均值,得到归一化后的特征数据;拟合子单元,用于拟合所述归一化后的特征数据,得到用户活跃度曲线;第二获取子单元,用于根据所述用户活跃度曲线,获取每个周期的用户活跃度值。
7.根据权利要求6所述的推送信息的装置,其特征在于,所述拟合子单元进一步用于:将所述归一化后的特征数据输入支持向量回归模型进行拟合,得到用户活跃度曲线。
8.根据权利要求7所述的推送信息的装置,其特征在于,所述第二获取单元还包括:
训练子单元,用于采用所述归一化后的特征数据,训练所述支持向量回归模型。
9.根据权利要求6所述的推送信息的装置,其特征在于,所述装置还包括:
检测单元,用于检测所述用户群体数据中与用户的历史订单数据相符的用户个体数据;
第三获取单元,用于获取所述用户个体数据所获取的特征数据的维度以及每一个所获取的特征数据的维度的数量;
第四获取单元,用于根据所述数量从大到小,获取预设数量所获取的特征数据的维度;以及
设定单元,用于将所述预设数量所获取的特征数据的维度作为优先维度,更新所述优先维度数据库。
10.一种推送信息的装置,其特征在于,包括:
存储器;以及耦接至所述存储器的处理器,所述处理器被配置为基于存储在所述存储器中的指令,执行如权利要求1至5中任一项所述的推送信息的方法。
11.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质存储有计算机指令,所述指令被处理器执行时实现如权利要求1至5中任一项所述的推送信息的方法。
CN201610371042.5A 2016-05-30 2016-05-30 推送信息的方法和装置 Active CN107451832B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201610371042.5A CN107451832B (zh) 2016-05-30 2016-05-30 推送信息的方法和装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201610371042.5A CN107451832B (zh) 2016-05-30 2016-05-30 推送信息的方法和装置

Publications (2)

Publication Number Publication Date
CN107451832A CN107451832A (zh) 2017-12-08
CN107451832B true CN107451832B (zh) 2023-09-05

Family

ID=60485643

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201610371042.5A Active CN107451832B (zh) 2016-05-30 2016-05-30 推送信息的方法和装置

Country Status (1)

Country Link
CN (1) CN107451832B (zh)

Families Citing this family (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108492194A (zh) * 2018-03-06 2018-09-04 平安科技(深圳)有限公司 产品推荐方法、装置及存储介质
CN108648000B (zh) * 2018-04-24 2022-10-28 腾讯科技(深圳)有限公司 对用户留存生命周期进行评估的方法及装置、电子设备
CN109241133A (zh) * 2018-08-14 2019-01-18 北京粉笔未来科技有限公司 数据监测方法、装置、计算设备及存储介质
CN109711871B (zh) * 2018-12-13 2021-03-12 北京达佳互联信息技术有限公司 一种潜在客户确定方法、装置、服务器及可读存储介质
CN111797848B (zh) * 2019-04-09 2023-10-24 成都鼎桥通信技术有限公司 用户分类方法、装置、设备及存储介质
CN112150179B (zh) * 2019-06-28 2024-04-09 京东科技控股股份有限公司 一种信息推送方法和装置
CN111062824B (zh) * 2019-12-04 2023-08-18 腾讯科技(深圳)有限公司 群组成员处理方法、装置、计算机设备及存储介质
CN111400764B (zh) * 2020-03-25 2021-05-07 支付宝(杭州)信息技术有限公司 个人信息保护的风控模型训练方法、风险识别方法及硬件
CN111612499B (zh) * 2020-04-03 2023-07-28 浙江口碑网络技术有限公司 信息的推送方法及装置、存储介质、终端
CN112053212A (zh) * 2020-09-30 2020-12-08 杭州拼便宜网络科技有限公司 一种商品团购方法、商品团购***和电子设备
CN117808473B (zh) * 2024-03-01 2024-05-31 深圳迅策科技股份有限公司 一种交易数据的隐私计算方法及***

Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102339296A (zh) * 2010-07-26 2012-02-01 阿里巴巴集团控股有限公司 一种查询结果的排序方法和装置
CN102346894A (zh) * 2010-08-03 2012-02-08 阿里巴巴集团控股有限公司 推荐信息的输出方法、***及服务器
CN102411596A (zh) * 2010-09-21 2012-04-11 阿里巴巴集团控股有限公司 一种信息推荐方法及***
US8533144B1 (en) * 2012-11-12 2013-09-10 State Farm Mutual Automobile Insurance Company Automation and security application store suggestions based on usage data
CN103377242A (zh) * 2012-04-25 2013-10-30 Tcl集团股份有限公司 用户行为分析方法、分析预测方法及电视节目推送***
CN104077332A (zh) * 2013-03-29 2014-10-01 上海城际互通通信有限公司 一种基于计费信息的用户行为分析方法
CN104111946A (zh) * 2013-04-19 2014-10-22 腾讯科技(深圳)有限公司 基于用户兴趣的聚类方法和装置
CN104866540A (zh) * 2015-05-04 2015-08-26 华中科技大学 一种基于群体用户行为分析的个性化推荐方法

Patent Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102339296A (zh) * 2010-07-26 2012-02-01 阿里巴巴集团控股有限公司 一种查询结果的排序方法和装置
CN102346894A (zh) * 2010-08-03 2012-02-08 阿里巴巴集团控股有限公司 推荐信息的输出方法、***及服务器
CN102411596A (zh) * 2010-09-21 2012-04-11 阿里巴巴集团控股有限公司 一种信息推荐方法及***
CN103377242A (zh) * 2012-04-25 2013-10-30 Tcl集团股份有限公司 用户行为分析方法、分析预测方法及电视节目推送***
US8533144B1 (en) * 2012-11-12 2013-09-10 State Farm Mutual Automobile Insurance Company Automation and security application store suggestions based on usage data
CN104077332A (zh) * 2013-03-29 2014-10-01 上海城际互通通信有限公司 一种基于计费信息的用户行为分析方法
CN104111946A (zh) * 2013-04-19 2014-10-22 腾讯科技(深圳)有限公司 基于用户兴趣的聚类方法和装置
CN104866540A (zh) * 2015-05-04 2015-08-26 华中科技大学 一种基于群体用户行为分析的个性化推荐方法

Also Published As

Publication number Publication date
CN107451832A (zh) 2017-12-08

Similar Documents

Publication Publication Date Title
CN107451832B (zh) 推送信息的方法和装置
CN109460514B (zh) 用于推送信息的方法和装置
WO2018103718A1 (zh) 应用推荐的方法、装置及服务器
JP6404106B2 (ja) コンテント及び関係距離に基づいて人々をつなげるコンピューティング装置及び方法
CN106951527B (zh) 一种歌曲推荐方法及装置
CN113688310B (zh) 一种内容推荐方法、装置、设备及存储介质
US20170235726A1 (en) Information identification and extraction
CN112100396B (zh) 一种数据处理方法和装置
US10262041B2 (en) Scoring mechanism for discovery of extremist content
US20150278907A1 (en) User Inactivity Aware Recommendation System
CN108512674B (zh) 用于输出信息的方法、装置和设备
CN110968802B (zh) 一种用户特征的分析方法、分析装置及可读存储介质
WO2017201905A1 (zh) 资料分发方法、装置和存储介质
CN108959289B (zh) 网站类别获取方法和装置
CN116186395A (zh) 一种资源推荐、模型训练方法及装置、设备及存储介质
CN110852078A (zh) 生成标题的方法和装置
CN113516524B (zh) 用于推送信息的方法和装置
TW201508509A (zh) 文檔推薦系統及方法
CN112487276B (zh) 一种对象获取方法、装置、设备及存储介质
CN113704617A (zh) 物品推荐方法、***、电子设备及存储介质
CN113792952A (zh) 用于生成模型的方法和装置
JP2017004493A (ja) データ分析方法、データ分析装置およびプログラム
CN113010788A (zh) 信息推送方法及装置、电子设备、计算机可读存储介质
CN114564653A (zh) 信息推荐方法、装置、服务器及存储介质
JP6990757B1 (ja) 生成装置、生成方法及び生成プログラム

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant