CN105631538A - 一种用户活跃度的预测方法、装置及其应用方法和*** - Google Patents

一种用户活跃度的预测方法、装置及其应用方法和*** Download PDF

Info

Publication number
CN105631538A
CN105631538A CN201510982910.9A CN201510982910A CN105631538A CN 105631538 A CN105631538 A CN 105631538A CN 201510982910 A CN201510982910 A CN 201510982910A CN 105631538 A CN105631538 A CN 105631538A
Authority
CN
China
Prior art keywords
user
sample
predetermined network
liveness
preset time
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201510982910.9A
Other languages
English (en)
Inventor
张金晶
***
常富洋
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing Qihoo Technology Co Ltd
Qizhi Software Beijing Co Ltd
Original Assignee
Beijing Qihoo Technology Co Ltd
Qizhi Software Beijing Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing Qihoo Technology Co Ltd, Qizhi Software Beijing Co Ltd filed Critical Beijing Qihoo Technology Co Ltd
Priority to CN201510982910.9A priority Critical patent/CN105631538A/zh
Publication of CN105631538A publication Critical patent/CN105631538A/zh
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/04Forecasting or optimisation specially adapted for administrative or management purposes, e.g. linear programming or "cutting stock problem"
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/958Organisation or management of web site content, e.g. publishing, maintaining pages or automatic linking

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Business, Economics & Management (AREA)
  • Economics (AREA)
  • Databases & Information Systems (AREA)
  • Strategic Management (AREA)
  • Physics & Mathematics (AREA)
  • Human Resources & Organizations (AREA)
  • General Physics & Mathematics (AREA)
  • Game Theory and Decision Science (AREA)
  • Development Economics (AREA)
  • General Engineering & Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Entrepreneurship & Innovation (AREA)
  • Marketing (AREA)
  • Operations Research (AREA)
  • Quality & Reliability (AREA)
  • Tourism & Hospitality (AREA)
  • General Business, Economics & Management (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Information Transfer Between Computers (AREA)

Abstract

本发明涉及互联网领域,公开了一种用户活跃度的预测方法、装置及其应用方法和***,以解决现有技术中无法对用户将来的活跃情况进行预测的技术问题。该方法包括:获得终端采集的用户预设时间内的M种特征数据,M为正整数;基于M种特征数据中每种特征数据的特征参数,生成用户的用户向量;将用户向量输入逻辑回归模型,获得逻辑回归模型的输出结果作为在预设时间段之后用户对预定网络访问对象的用户活跃度值。达到了能够对用户的用户活跃度值进行预测的技术效果。

Description

一种用户活跃度的预测方法、装置及其应用方法和***
技术领域
本发明涉及互联网技术领域,尤其涉及一种用户活跃度的预测方法、装置及其应用方法和***。
背景技术
随着科学技术的不断发展,电子技术也得到了飞速的发展,电子产品的种类也越来越多,人们也享受到了科技发展带来的各种便利。现在人们可以通过各种类型的移动终端,享受随着科技发展带来的舒适生活。例如,智能手机、平板电脑等移动终端已经成为人们生活中一个重要的组成部分,用户可以使用智能手机、平板电脑等移动终端来听音乐、玩游戏等等,以减轻现代快节奏生活所带来的压力。
通常情况下,电子设备都具备网络访问功能,电子设备通过和网络服务器的交互实现网络访问,并接收网络服务器提供的各种数据,其中,基于用户访问各个网站或者APP,各个网站或者APP能从中获得相关收益。故而,活跃用户对于网站或者APP而言至关重要,现有技术中往往只能对当前时间内用户是否活跃或者流失进行统计,存在着无法对用户将来的活跃情况进行预测的技术问题。
发明内容
鉴于上述问题,提出了本发明以便提供一种克服上述问题或者至少部分地解决上述问题的用户活跃度的预测方法、装置及其应用方法和***。
第一方面,本发明实施例提供一种用户活跃度的预测方法,包括:
获得终端采集的用户预设时间内的M种特征数据,M为正整数;
基于所述M种特征数据中每种特征数据的特征参数,生成所述用户的用户向量;
将所述用户向量输入逻辑回归模型,获得所述逻辑回归模型的输出结果作为在所述预设时间段之后所述用户对预定网络访问对象的用户活跃度值;
其中,所述逻辑回归模型基于多组采样样本进行逻辑回归训练获得,所述多组采样样本中的每组采样样本包含采样用户的所述M种特征数据;所述多组采样样本包含正样本和负样本,在采样时间之后的预设时间段内,所述正样本中的采样用户在所述预定网络访问对象的用户活跃度满足第一预设活跃度条件;在所述采样时间之后的预设时间段内,所述负样本中的采样用户在所述预定网络访问对象的用户活跃度值不满足所述第一预设活跃度条件。
可选的,所述逻辑回归模型通过以下方式获得:
获得多组采样样本,所述多组采样样本中的每组采样样本包含采样用户以及所述采样用户的所述M种特征数据;
从所述多组采样样本中分别确定出正样本和负样本;
采用所述正样本和所述负样本进行逻辑回归训练,进而获得所述逻辑回归模型。
可选的,所述M种特征数据包括:用户行为特征类别、终端特征类别、用户个人特征类别中至少一个类别下的特征数据。
可选的,所述用户行为特征类别包括:清理行为数据、访问应用程序的行为数据、下载应用程序的行为数据、点击应用程序的行为数据中的至少一种行为数据。
可选的,所述终端特征类别包括:安装应用程序的数量、安装应用程序的名称、安装应用程序的版本、***版本、内存参数、流量参数中的至少一种终端特征。
可选的,所述用户个人特征类别包括:性别、年龄、职业、所在地、教育背景中的至少一种用户个人特征。
可选的,所述预定网络访问对象包括:预定应用程序或者预定网站。
第二方面,本发明实施例提供一种用户活跃度的预测方法,包括:
获得终端采集的用户预设时间内的M种特征数据,M为正整数;
将所述M种特征数据发送至网络服务器,以供所述网络服务器基于所述M特征数据确定出所述用户的用户向量并将所述用户向量输入逻辑回归模型,进而获得所述逻辑回归模型的输出结果作为在所述预设时间段之后所述用户对预定网络访问对象的用户活跃度值;
其中,所述逻辑回归模型基于多组采样样本进行逻辑回归训练获得,所述多组采样样本中的每组采样样本包含采样用户的所述M种特征数据;所述多组采样样本包含正样本和负样本,在采样时间之后的预设时间段内,所述正样本中的采样用户在所述预定网络访问对象的用户活跃度满足第一预设活跃度条件;在所述采样时间之后的预设时间段内,所述负样本中的采样用户在所述预定网络访问对象的用户活跃度值不满足所述第一预设活跃度条件。
可选的,所述M种特征数据包括:用户行为特征类别、终端特征类别、用户个人特征类别中至少一个类别下的特征数据。
可选的,所述用户行为特征类别包括:清理行为数据、访问应用程序的行为数据、下载应用程序的行为数据、点击应用程序的行为数据中的至少一种行为数据。
可选的,所述终端特征类别包括:安装应用程序的数量、安装应用程序的名称、安装应用程序的版本、***版本、内存参数、流量参数中的至少一种终端特征。
可选的,所述用户个人特征类别包括:性别、年龄、职业、所在地、教育背景中的至少一种用户个人特征。
可选的,所述预定网络访问对象包括:预定应用程序或者预定网站。
第三方面,本发明实施例提供一种基于用户活跃度的信息推送方法,包括:
基于本发明任一实施例所介绍的用户活跃度的预测方法,确定出第一用户针对所述预定网络访问对象的所述用户活跃度值;
基于所述第一用户的所述用户活跃度值,判断所述预设时间段后所述第一用户是否成为所述预定网络访问对象的流失用户;
如果所述第一用户将成为所述流失用户,通过所述第一用户的终端向所述第一用户产生第一推送信息。
可选的,在所述向所述第一用户产生第一推送信息之前,所述方法还包括:
获取所述第一用户访问网络过程中的历史访问记录;
基于所述历史访问记录确定出所述第一用户的兴趣特征;
基于所述第一用户的兴趣特征确定出所述第一推送信息。
可选的,所述历史访问记录为所述用户基于所述预定网络访问对象访问网络所获得历史访问记录。
可选的,在所述向所述第一用户产生第一推送信息之前,所述方法还包括:
基于所述第一用户与其他用户的所述M种特征数据确定出与所述第一用户的用户相似度值大于预设相似度值的推荐用户;
确定所述推荐用户的兴趣特征;
基于所述推荐用户的兴趣特征确定出所述第一推送信息。
可选的,所述基于所述第一用户的所述活跃度值,判断所述预设时间段后所述第一用户是否成为所述预定网络访问对象的流失用户,包括:
判断所述用户活跃度值是否小于预设阈值;
在所述用户活跃度值小于所述预设阈值时,确定在所述预定时间段后所述第一用户将成为所述预定网络访问对象的流失用户。
第四方面,本发明实施例提供一种基于用户活跃度的信息推送方法,包括:
基于本发明任一实施例所介绍的用户活跃度的预测方法,确定出第二用户针对所述预定网络访问对象的所述用户活跃度值;
基于所述第二用户的所述用户活跃度值,判断所述预设时间段后所述第一用户是否为所述预定网络访问对象的活跃用户;
如果所述预设时间段后所述第二用户是否为所述预定网络访问对象的活跃用户,确定所述预设时间段内所述第二用户针对所述预定网络访问对象的活跃数据;
基于所述活跃数据,判断所述第二用户针对所述预定网络访问对象的持续活跃时长是否大于预设持续活跃时长;
在所述持续活跃时长大于所述预设活跃时长时,通过所述第二用户的终端向所述第二用户发送第二推送信息。
可选的,所述活跃数据包括以下数据中的至少一种数据:
所述第二用户访问所述预定网络访问对象的连续访问天数;或者
所述第二用户访问预设时间段内访问所述网络访问对象的访问总次数;或者
所述第二用户访问预设时间段内访问所述网络访问对象的访问总时长。
可选的,所述判断所述第二用户针对所述预定网络访问对象的持续活跃时长是否大于预设持续活跃时长,包括:
判断所述第二用户访问所述预定网络访问对象的持续访问天数是否大于预设天数;或者
判断所述第二用户访问所述预定网络访问对象的访问总次数是否大于预设次数;或者
判断所述第二用户访问所述预定网络访问对象的访问总时长是否大于预设时长。
第五方面,本发明实施例提供一种用户活跃度的预测装置,包括:
第一获得模块,用于获得终端采集的用户预设时间内的M种特征数据,M为正整数;
生成模块,用于基于所述M种特征数据中每种特征数据的特征参数,生成所述用户的用户向量;
第二获得模块,用于将所述用户向量输入逻辑回归模型,获得所述逻辑回归模型的输出结果作为在所述预设时间段之后所述用户对预定网络访问对象的用户活跃度值;
其中,所述逻辑回归模型基于多组采样样本进行逻辑回归训练获得,所述多组采样样本中的每组采样样本包含采样用户的所述M种特征数据;所述多组采样样本包含正样本和负样本,在采样时间之后的预设时间段内,所述正样本中的采样用户在所述预定网络访问对象的用户活跃度满足第一预设活跃度条件;在所述采样时间之后的预设时间段内,所述负样本中的采样用户在所述预定网络访问对象的用户活跃度值不满足所述第一预设活跃度条件。
可选的,所述装置还包括:
第三获得模块,用于获得多组采样样本,所述多组采样样本中的每组采样样本包含采样用户以及所述采样用户的所述M种特征数据;
第一确定模块,用于从所述多组采样样本中分别确定出正样本和负样本;
训练模块,用于采用所述正样本和所述负样本进行逻辑回归训练,进而获得所述逻辑回归模型。
可选的,所述M种特征数据包括:用户行为特征类别、终端特征类别、用户个人特征类别中至少一个类别下的特征数据。
可选的,所述用户行为特征类别包括:清理行为数据、访问应用程序的行为数据、下载应用程序的行为数据、点击应用程序的行为数据中的至少一种行为数据。
可选的,所述终端特征类别包括:安装应用程序的数量、安装应用程序的名称、安装应用程序的版本、***版本、内存参数、流量参数中的至少一种终端特征。
可选的,所述用户个人特征类别包括:性别、年龄、职业、所在地、教育背景中的至少一种用户个人特征。
可选的,所述预定网络访问对象包括:预定应用程序或者预定网站。
第六方面,本发明实施例提供一种用户活跃度的预测装置,包括:
第四获得模块,用于获得终端采集的用户预设时间内的M种特征数据,M为正整数;
发送模块,用于将所述M种特征数据发送至网络服务器,以供所述网络服务器基于所述M特征数据确定出所述用户的用户向量并将所述用户向量输入逻辑回归模型,进而获得所述逻辑回归模型的输出结果作为在所述预设时间段之后所述用户对预定网络访问对象的用户活跃度值;
其中,所述逻辑回归模型基于多组采样样本进行逻辑回归训练获得,所述多组采样样本中的每组采样样本包含采样用户的所述M种特征数据;所述多组采样样本包含正样本和负样本,在采样时间之后的预设时间段内,所述正样本中的采样用户在所述预定网络访问对象的用户活跃度满足第一预设活跃度条件;在所述采样时间之后的预设时间段内,所述负样本中的采样用户在所述预定网络访问对象的用户活跃度值不满足所述第一预设活跃度条件。
可选的,所述M种特征数据包括:用户行为特征类别、终端特征类别、用户个人特征类别中至少一个类别下的特征数据。
可选的,所述用户行为特征类别包括:清理行为数据、访问应用程序的行为数据、下载应用程序的行为数据、点击应用程序的行为数据中的至少一种行为数据。
可选的,所述终端特征类别包括:安装应用程序的数量、安装应用程序的名称、安装应用程序的版本、***版本、内存参数、流量参数中的至少一种终端特征。
可选的,所述用户个人特征类别包括:性别、年龄、职业、所在地、教育背景中的至少一种用户个人特征。
可选的,所述预定网络访问对象包括:预定应用程序或者预定网站。
第七方面,本发明实施例提供一种基于用户活跃度的信息推送***,包括:
第二确定模块,用于基于本发明任一实施例所介绍的用户活跃度的预测装置,确定出第一用户针对所述预定网络访问对象的所述用户活跃度值;
第一判断模块,用于基于所述第一用户的所述用户活跃度值,判断所述预设时间段后所述第一用户是否成为所述预定网络访问对象的流失用户;
第一推送模块,用于如果所述第一用户将成为所述流失用户,通过所述第一用户的终端向所述第一用户产生第一推送信息。
可选的,所述***还包括:
获取模块,用于获取所述第一用户访问网络过程中的历史访问记录;
第三确定模块,用于基于所述历史访问记录确定出所述第一用户的兴趣特征;
第四确定模块,用于基于所述第一用户的兴趣特征确定出所述第一推送信息。
可选的,所述历史访问记录为所述用户基于所述预定网络访问对象访问网络所获得历史访问记录。
可选的,所述***还包括:
第五确定模块,用于基于所述第一用户与其他用户的所述M种特征数据确定出与所述第一用户的用户相似度值大于预设相似度值的推荐用户;
第六确定模块,用于确定所述推荐用户的兴趣特征;
第七确定模块,用于基于所述推荐用户的兴趣特征确定出所述第一推送信息。
可选的,所述第一判断模块,包括:
判断单元,用于判断所述用户活跃度值是否小于预设阈值;
确定单元,用于在所述用户活跃度值小于所述预设阈值时,确定在所述预定时间段后所述第一用户将成为所述预定网络访问对象的流失用户。
第八方面,本发明实施例提供一种基于用户活跃度的信息推送***,,包括:
第八确定模块,用于基于本发明任一实施例所介绍的用户活跃度的预测装置,确定出第二用户针对所述预定网络访问对象的所述用户活跃度值;
第二判断模块,用于基于所述第二用户的所述用户活跃度值,判断所述预设时间段后所述第一用户是否为所述预定网络访问对象的活跃用户;
第九确定模块,用于如果所述预设时间段后所述第二用户是否为所述预定网络访问对象的活跃用户,确定所述预设时间段内所述第二用户针对所述预定网络访问对象的活跃数据;
第三判断模块,用于基于所述活跃数据,判断所述第二用户针对所述预定网络访问对象的持续活跃时长是否大于预设持续活跃时长;
第二推送模块,用于在所述持续活跃时长大于所述预设活跃时长时,通过所述第二用户的终端向所述第二用户发送第二推送信息。
可选的,所述活跃数据包括以下数据中的至少一种数据:
所述第二用户访问所述预定网络访问对象的连续访问天数;或者
所述第二用户访问预设时间段内访问所述网络访问对象的访问总次数;或者
所述第二用户访问预设时间段内访问所述网络访问对象的访问总时长。
可选的,所述第三判断模块,用于:
判断所述第二用户访问所述预定网络访问对象的持续访问天数是否大于预设天数;或者
判断所述第二用户访问所述预定网络访问对象的访问总次数是否大于预设次数;或者
判断所述第二用户访问所述预定网络访问对象的访问总时长是否大于预设时长。
本申请实施例中提供的技术方案,至少具有如下技术效果或优点:
由于在本发明实施例中,预先基于多组采样样本进行逻辑回归训练获得逻辑回归模型,多组采样样本中每组采样样本包含一组采样用户的M种特征数据,并且多组采样样本包含正样本和负样本,其中正样本为采样时间之后的预设时间段内采样用户的活跃度较高的采样样本,负样本为采样时间之后的预设时间段内采样用户的活跃度较低的采样样本;在预先训练出逻辑回归模型之后,针对某特定用户,可以采集获得该用户预设时间内的M种特征数据;然后基于M种特征数据中每种特征数据的特征参数,生成用户的用户向量,最后将用户向量输入预先训练出的逻辑回归模型,就可以确定出预设时间段之后用户对预定网络访问对象的用户活跃度值,进而达到了能够对用户的用户活跃度值进行预测的技术效果。
上述说明仅是本发明技术方案的概述,为了能够更清楚了解本发明的技术手段,而可依照说明书的内容予以实施,并且为了让本发明的上述和其它目的、特征和优点能够更明显易懂,以下特举本发明的具体实施方式。
附图说明
通过阅读下文优选实施方式的详细描述,各种其他的优点和益处对于本领域普通技术人员将变得清楚明了。附图仅用于示出优选实施方式的目的,而并不认为是对本发明的限制。而且在整个附图中,用相同的参考符号表示相同的部件。在附图中:
图1示出了根据本发明一个实施例的一种用户活跃度的预测方法的流程图;
图2示出了根据本发明一个实施例的一种用户活跃度的预测方法中训练逻辑回归模型的流程图;
图3示出了根据本发明一个实施例的一种用户活跃度的预测方法的流程图;
图4示出了根据本发明一个实施例的一种基于用户活跃度的信息推送方法的流程图;
图5示出了根据本发明一个实施例的另一种基于用户活跃度的信息推送方法的流程图;
图6示出了根据本发明一个实施例的一种用户活跃度的预测装置的结构图;
图7示出了根据本发明一个实施例的一种用户活跃度的预测装置的结构图;
图8示出了根据本发明一个实施例的一种基于用户活跃度的信息推送***的结构图;
图9示出了根据本发明一个实施例的另一种基于用户活跃度的信息推送***的结构图。
具体实施方式
本发明实施例中的方案总体思路如下:
预先基于多组采样样本进行逻辑回归训练获得逻辑回归模型,多组采样样本中每组采样样本包含一组采样用户的M种特征数据,并且多组采样样本包含正样本和负样本,其中正样本为采样时间之后的预设时间段内采样用户的活跃度较高的采样样本,负样本为采样时间之后的预设时间段内采样用户的活跃度较低的采样样本;在预先训练出逻辑回归模型之后,针对某特定用户,可以采集获得该用户预设时间内的M种特征数据;然后基于M种特征数据中每种特征数据的特征参数,生成用户的用户向量,最后将用户向量输入预先训练出的逻辑回归模型,就可以确定出预设时间段之后用户对预定网络访问对象的用户活跃度值,进而达到了能够对用户的用户活跃度值进行预测的技术效果。
下面将参照附图更详细地描述本公开的示例性实施例。虽然附图中显示了本公开的示例性实施例,然而应当理解,可以以各种形式实现本公开而不应被这里阐述的实施例所限制。相反,提供这些实施例是为了能够更透彻地理解本公开,并且能够将本公开的范围完整的传达给本领域的技术人员。
第一方面,本发明实施例提供一种用户活跃度预测方法,请参考图1,包括:
步骤S101:获得终端采集的用户预设时间内的M种特征数据,M为正整数;
步骤S102:基于M种特征数据中每种特征数据的特征参数,生成用户的用户向量;
步骤S103:将用户向量输入逻辑回归模型,获得逻辑回归模型的输出结果作为在预设时间段之后用户对预定网络访问对象的用户活跃度值;
其中,逻辑回归模型基于多组采样样本进行逻辑回归训练获得,多组采样样本中的每组采样样本包含一组采样用户的M种特征数据;多组采样样本包含正样本和负样本,在采样时间之后的预设时间段内,正样本中的采样用户在预定网络访问对象的用户活跃度满足第一预设活跃度条件;在采样时间之后的预设时间段内,负样本中的采样用户在预定网络访问对象的用户活跃度值不满足第一预设活跃度条件。
步骤S101中,可以根据实际需求设置不同的预设时间段,预设时间段例如为:半个月、1周等等,M种特征数据可以包含多种类别下的特征数据,下面列举其中的三种进行介绍,当然,在具体实施过程中,不限于以下几种情况。
第一种,M种特征数据包括:用户行为特征类别下的特征数据。
举例来说,用户行为特征类别包括①清理行为数据,清理行为例如为通过***清理软件对***进行清理的行为、对网络访问记录进行清理的行为等等;②访问应用程序的行为数据,其中,访问应用程序的行为数据例如为访问整个网络中的应用程序的行为数据、或者访问预定网络访问对象所提供的应用程序的行为数据等等,预定网络访问对象例如为预定网站或者预定应用程序等等;③下载应用程序的行为数据,其中,下载的应用程序可以为整个网络所提供的应用程序,也可以为预定网络访问对象所提供的应用程序等等;④点击应用程序的行为数据,其中,点击的应用程序可以为整个网络中的应用程序,也可以为预定网络访问对象提供的应用程序等等。其中,用户行为特征类别中所包含的特征数据可以为上述一种或多种特征数据,另外,还可以包含其他特征数据,本发明实施例不作限制。
第二种,M种特征数据包括:终端特征类别下的特征数据。
举例来说,终端特征类别包括:安装应用程序的数量、安装应用程序的名称、安装应用程序的版本、***版本、内存参数、流量参数中的至少一种终端特征。
第三种,M种特征数据包括:用户个人特征类别下的特征数据。
举例来说,用户个人特征类别包括:性别、年龄、职业、所在地、教育背景中的至少一种用户个人特征。
步骤S102中,可以基于M种特征数据中每种特征数据的特征参数不同,针对该特征数据赋予不同的取值,进而获得用户向量。以特征数据为性别为例,针对性别为男,可以赋值为0,针对性别为女,可以赋值为1;以特征数据为年龄为例,用户的年龄可以直接对应特征向量中该特征数据的取值;以特征数据为安装应用程序的数量为例,则直接将该数量作为特征数据:安装应用程序对应的取值等等。对于其他特征数据,确定出其在用户向量中的取值的方式类似,故而在此不再赘述。
其中,如果采集获得用户的一组特征数据的话,则直接基于各个特征数据的特征参数的不同,为其赋予不同的取值,进而获得用户向量;而如果采集获得用户的多组特征数据的话,针对某个特征数据可以首先获取其在每组特征数据中的取值,然后对多组取值进行加权求和,进而获得对应特征数据在用户向量中的取值。
例如:假设预设时间段为7天,这7天中用户所安装的应用程序数量如表1所示:
表1
则可以确定出在用户向量中,特征数据:安装应用程序的数量所对应的取值为:6*1+7*0.9+10*0.8+13*0.7+15*0.6+7*0.5+14*0.4=47.5
当然,上述特征数据在用户向量中的取值仅仅作为一个举例,还可以基于其他方式确定其他形式的取值,本发明实施例不再详细列举,并且不作限制。
在基于步骤S103将用户向量输入逻辑回归模型之前,需要首先获得多个采样样本进行逻辑回归训练,进而获得逻辑回归模型,请参考图2,可以通过以下方式进行逻辑回归训练:
步骤S201:获得多组采样样本,多组采样样本中的每组采样样本包含采样用户以及采样用户的M种特征数据;
步骤S202:从多组采样样本中分别确定出正样本和负样本;
步骤S203:采用正样本和负样本进行逻辑回归训练,进而获得逻辑回归模型。
步骤S201中,采样样本中的采样用户通常为已知活跃程度的用户,例如:假设当前时间为2015年12月15号,各个采用用户在当前是否活跃为已知,则可以获取当前时间之前的预设时间段(例如:半个月、1周)内的多个用户以及各个用户的M种特征数据作为多组采样样本。
步骤S202中,正样本指的是样本内的采样用户在采样时间之后的预设时间段内为活跃用户;负样本指的是样本内的采样用户在采样时间之后的预设时间段内为流失用户,其中可以通过多种方式确定出正样本和负样本,下面列举其中的两种进行介绍,当然,在具体实施过程中,不限于以下两种情况。
第一种,通过人工标记的方式确定出正样本和负样本,例如:标记人员认为某样本的用户在采样时间之后的预设时间段内(例如:1天、1周之内)处于活跃状态,则将该样本标记为正样本;标记人员认为某样本的用户在采样时间之后的预设时间段内处于不活跃状态,则将该样本标记为负样本。
在这种情况下,满足第一预设活跃度条件例如为被标记为正样本(也即被标记为活跃用户),不满足第一预设活跃度条件例如为被标记为负样本(也即被标记为不活跃用户)。
第二种,采集获得各个采样用户访问预定网络访问对象的访问数据,基于访问数据确定出每个采样用户是否满足第一预设活跃度条件。例如:获得采样时间之后的预设时间段内每个采样用户访问预定网络访问对象的访问时长,判断访问时长是否大于预设持续活跃时长,如果大于预设持续活跃时长,则确定该采样用户满足第一预设活跃度条件,该采样样本为正样本,如果不大于预设持续活跃时长,则确定该采样用户不满足第一预设活跃度条件,采样样本为负样本;又或者,判断采样时间之后的预设时间段内,各个采样用户访问预定网络访问对象的访问次数是否大于预设次数,如果大于预设次数,则确定对应采样用户满足第一预设活跃度条件,采样样本为正样本;如果不大于预设次数,确定该采样用户不满足第一预设活跃度条件,采样样本为负样本等等,当然,还可以通过其他方式确定出正样本和负样本,本发明实施例不再详细列举,并且不作限制。
步骤S103中,在采用正样本和负样本进行逻辑回顾训练时,可以训练多种形式的逻辑回归公式,下面列举其中的两种进行介绍,当然,在具体实施过程中,不限于以下两种情况。
逻辑回归公式①: p ( 1 | x , θ ) = 1 1 + e - θ T x ... [ 1 ]
其中,x表示用户向量,p(1|x,θ)表示某用户为满足第一活跃度条件的用户的概率;
逻辑回归公式②: p ( 0 | x , θ ) = 1 1 + e θ T x ... [ 2 ]
其中,x表示用户向量,p(0|x,θ)表示某用户为不满足第一活跃度条件的用户的概率。
通过将多个采样样本的用户特征代入逻辑回归模型就可以确定出向量θ,基于向量θ就可以得到用于确定用户活跃度值的逻辑回归模型。
其中,如果所获得的逻辑回归公式为公式①,则直接将用户向量代入公式①就可以确定出用户对预定网络访问对象的用户活跃度值;如果所获得逻辑回归公式为公式②,首先将用户向量代入该公式②,获得一个计算结果,然后通过1减去该计算结果,就可以获得用户活跃度值。
以上用户活跃度的预测方法既可以应用于网络服务器,也可以应用于终端,本发明实施例不作限制。
基于同一发明构思,本发明实施例还提供另一种用户活跃度的预测方法,请参考图3,包括:
步骤S301:获得终端采集的用户预设时间内的M种特征数据,M为正整数;
步骤S302:将M种特征数据发送至网络服务器,以供网络服务器基于M特征数据确定出用户的用户向量并将用户向量输入逻辑回归模型,进而获得逻辑回归模型的输出结果作为在预设时间段之后用户对预定网络访问对象的用户活跃度值;
其中,逻辑回归模型基于多组采样样本进行逻辑回归训练获得,多组采样样本中的每组采样样本包含采样用户的M种特征数据;多组采样样本包含正样本和负样本,在采样时间之后的预设时间段内,正样本中的采样用户在预定网络访问对象的用户活跃度满足第一预设活跃度条件;在采样时间之后的预设时间段内,负样本中的采样用户在预定网络访问对象的用户活跃度值不满足第一预设活跃度条件。
举例来说,M种特征数据例如包括以下几种特征类别中至少一特征类别下的特征数据:
①用户行为特征类别,用户行为特征类别包括:清理行为数据、访问应用程序的行为数据、下载应用程序的行为数据、点击应用程序的行为数据中的至少一种行为数据。
②终端特征类别,终端特征类别包括:安装应用程序的数量、安装应用程序的名称、安装应用程序的版本、***版本、内存参数、流量参数中的至少一种终端特征。
③用户个人特征类别包括:性别、年龄、职业、所在地、教育背景中的至少一种用户个人特征。
基于同一发明构思,本发明实施例还提供一种基于用户活跃度的信息推送方法,该方法为对本发明实施例所介绍的用户活跃度的预测方法的进一步应用,请参考图4,包括:
步骤S401:基于本发明任一实施例所介绍的用户活跃度的预测方法,确定出第一用户针对预定网络访问对象的用户活跃度值;
步骤S402:基于第一用户的用户活跃度值,判断预设时间段后第一用户是否成为预定网络访问对象的流失用户;
步骤S403:如果第一用户将成为流失用户,通过第一用户的终端向第一用户产生第一推送信息。
步骤S402中,举例来说,可以针对用户活跃度值设置一个预设阈值(例如:0.5、0.6等等);然后判断计算出的用户活跃度值是否不小于该预设阈值,如果不小于该预设阈值,则说明预设时间段之后,用户依然为活跃用户;如果小于该预设阈值,则说明预设时间段后,该用户不再为活跃用户,而是成为流失用户,为了防止这些用户成为流失用户,则可以针对这些用户产生第一推送信息,基于第一推送信息可以提高预定网络访问对象对对应用户的吸引力,从而防止这些用户成为流失用户。
在具体实施过程中,在通过第一用户的终端向第一用户产生第一推送信息之前,可以通过多种方式确定出第一推送信息,下面列举其中的两种进行介绍,当然,在具体实施过程中,不限于以下两种情况。
产生第一推送信息的方式一:获取用户访问网络过程中的历史访问记录;基于历史访问记录确定出用户的兴趣特征;基于用户的兴趣特征确定出第一推送信息。
举例来说,用户访问网络过程中的历史访问记录可以为用户访问整个网络的历史访问记录、也可以为用户基于预定网络访问对象访问网络所获得历史访问记录,另外,还可以为其他方式获得的历史访问记录,本发明实施例不再详细列举,并且不作限制。
可以收集预设时间段(例如:1周、半个月)内用户的历史访问记录,该历史访问记录包括:网络搜索记录、网络点击记录、网络浏览记录等等,然后,从历史访问记录中提取出用户访问网络所包含的关键词信息,并从关键词信息中获取排序位于前几位(例如:5位、10位等等)的关键词作为该用户的兴趣特征。然后通过该兴趣特征在网络进行搜索获得对应的搜索结果,并将对应的搜索结果作为第一推送信息提供给用户,又或者通过该兴趣特征在该预定网络访问对象中进行搜索,获得预定网络访问对象中用户所感兴趣的内容提供给用户。进而,提高预定网络访问对象对用户的吸引力,防止用户成为预定网络访问对象的流失用户。
确定第一推送信息的方式二:基于用户与其他用户的M种特征数据确定出与用户的用户相似度值大于预设相似度值的推荐用户;确定推荐用户的兴趣特征;基于推荐用户的兴趣特征确定出第一推送信息。
在具体实施过程中,通过用户与其他用户的M种特征数据确定出与用户的相似度值大于预设相似度值的推荐用户,包括:通过用户的M种特征数据确定出用户的用户向量;通过其他用户的M种特征数据确定出其他用户的用户向量;通过当前用户的用户向量和其他用户的用户向量确定出当前用户与对应用户的用户相似度值。
其中,通过当前用户的用户向量与其他用户的用户向量确定出当前用户与对应用户的用户相似度值时,又可以采用多种方式,下面列举其中的两种进行介绍,当然,在具体实施例过程中,不限于以下两种情况。
确定用户相似度值的方式①:计算当前用户的用户向量与对应用户的用户向量的第一距离值;通过第一距离值确定出用户相似度值,第一距离值与用户相似度值呈反相关关系。
在具体实施过程中,可以计算当前用户的用户向量与对应用户的用户向量的多种形式的第一距离值,下面列举其中的几种进行介绍,当然,在具体实施过程中,不限于以下几种情况。
①欧几里得距离(EuclideanDistance),其计算公式如下:
d i s t ( X , Y ) = Σ i = 1 n ( x i - y i ) 2 ... [ 3 ]
其中,X表示当前用户的用户向量,Y表示对应用户的用户向量。
②明可夫斯基距离(MinkowskiDistance)
其中,明氏距离是欧氏距离的推广,是对多个距离度量公式的概括性的表述。其计算公式如下:
d i s t ( X , Y ) = ( Σ i = 1 n | x i - y i | p ) 1 / p ... [ 4 ]
其中,X表示当前用户的用户向量,Y表示对应用户的用户向量,这里的p值是一个变量,当p=2的时候就得到了公式[3]。
③曼哈顿距离(ManhattanDistance)
其中,曼哈顿距离来源于城市区块距离,是将多个维度上的距离进行求和后的结果,即当上面的公式[4]中p=1时得到的距离度量公式,具体如下:
d i s t ( X , Y ) = Σ i = 1 n | x i - y i | ... [ 5 ]
其中,X表示当前用户的用户向量,Y表示对应用户的用户向量。
其中,由于用户相似度值与第一距离值呈反向关关系,故而可以将第一距离值的倒数,作为对应的用户相似度值;又或者,给该倒数乘上一个特定系数(该特定系数可以为任意值,例如:10、20等等)之后作为对应的用户相似度值。
确定用户相似度值的方式②:计算当前用户的用户向量与对应用户的用户向量的第一相似度值;通过第一相似度值确定出用户相似度值,第一相似度值与用户相似度值呈正相关关系。
在具体实施过程中,可以计算当前用户的用户向量与对应用户的用户向量的多种形式的第一相似度值,下面列举其中的几种进行介绍,当然,在具体实施过程中,不限于以下几种情况。
①余弦相似度(CosineSimilarity)
余弦相似度用向量空间中两个向量夹角的余弦值作为衡量两个个体间差异的大小。相比距离度量,余弦相似度更加注重两个向量在方向上的差异,而非距离或长度上。公式如下:
s i m ( X , Y ) = cos θ = x → , y → | | x | | · | | y | | ... [ 6 ]
其中,X表示当前用户的用户向量,Y表示对应用户的用户向量。
②皮尔森相关系数(PearsonCorrelationCoefficient)
即相关分析中的相关系数r,分别对X和Y基于自身总体标准化后计算空间向量的余弦夹角,公式如下:
r ( X , Y ) = n Σ x y - Σ x Σ y nΣx 2 - ( Σ x ) 2 · nΣy 2 - ( Σ y ) 2 ... [ 7 ]
其中,X表示当前用户的用户向量,Y表示对应用户的用户向量。
③调整余弦相似度(AdjustedCosineSimilarity)
虽然余弦相似度对个体间存在的偏见可以进行一定的修正,但是因为只能分辨个体在维之间的差异,没法衡量每个维数值的差异,会导致这样一个情况:比如用户对内容评分,5分制,X和Y两个用户对两个内容的评分分别为(1,2)和(4,5),使用余弦相似度得出的结果是0.98,两者极为相似,但从评分上看X似乎不喜欢这2个内容,而Y比较喜欢,余弦相似度对数值的不敏感导致了结果的误差,需要修正这种不合理性,就出现了调整余弦相似度,即所有维度上的数值都减去一个均值,比如X和Y的评分均值都是3,那么调整后为(-2,-1)和(1,2),再用余弦相似度计算,得到-0.8,相似度为负值并且差异不小,但显然更加符合现实。
其中,由于用户相似度值与第一相似度值呈正向关关系,故而可以直接将第一相似度作为用户相似度值,又或者将第一相似度值乘上一个特定系数(该特定系数可以为任意值,例如:10、100等等)之后作为对应的用户相似度值。
在确定出用户与各个其他用户的用户相似度值之后,可以判断用户与每个用户的用户相似度值是否大于预设用户相似度值,如果大于预设用户相似度值,则确定对应用户与当前用户为相似用户,两者有着相似的兴趣特征,进而可以将对应用户的兴趣特征作为当前用户的兴趣特征,基于对应用户的兴趣特征给当前用户产生第一推送信息。其中,其他用户的兴趣特征可以由其他用户手动设置,也可以通过对其他用户的历史访问记录进行分析确定,本发明实施例不作限制。
另外,在具体实施过程中,第一推送信息还可以为通过预定网络访问对象为用户推送的红包。例如:在确定用户即将成为流失用户时,为了防止用户流失,故而及时弹出用户界面给该用户所在的终端派发红包,以促进该用户使用该预定网络访问对象的积极性。
基于同一发明构思,本发明实施例还提供了另一种基于用户活跃度的信息推送方法,该方法为对本发明实施例所介绍的用户活跃度的预测方法的进一步利用,请参考图5,包括:
步骤S501:基于本发明任一实施例所介绍的用户活跃度的预测方法,确定出第二用户针对预定网络访问对象的用户活跃度值;
步骤S502:基于第二用户的用户活跃度值,判断预设时间段后第一用户是否为预定网络访问对象的活跃用户;
步骤S503:如果预设时间段后第二用户是否为预定网络访问对象的活跃用户,确定预设时间段内第二用户针对预定网络访问对象的活跃数据;
步骤S504:基于活跃数据,判断第二用户针对预定网络访问对象的持续活跃时长是否大于预设持续活跃时长;
步骤S505:在持续活跃时长大于预设活跃时长时,通过第二用户的终端向第二用户发送第二推送信息。
步骤S502中,对于具体如何判断预设时间段后第一用户是否为预定网络访问对象的活跃用户,由于在前面已作介绍,故而在此不再赘述。
步骤S503和步骤S504中,预定时间段之前用户针对预定网络访问对象的活跃数据例如为:用户访问预定网络访问对象的访问数据,然后判断预定时间段内用户每天访问预定网络访问对象的访问次数是否大于预设次数,如果每天访问次数都大于预设次数,且访问天数大于预设天数(例如:7天、10天等等),则说明用户针对预定网络访问对象的持续活跃时长大于预设持续活跃时长;又或者,确定预定时间段内用户每天访问预定网络访问对象的访问时长是否大于预设时长,如果每次访问时长都大于预设时长且访问天数大于预设天数,则说明用户针对预定网络访问对象的持续活跃时长大于预设持续活跃时长,当然,还可以通过其他方式判断用户针对预定网络访问对象的持续活跃时长是否大于预设持续活跃时长,本发明实施例不再详细列举,并且不作限制。
步骤S505中,如果用户针对预定网络访问对象的持续活跃时长大于预设持续活跃时长,则说明用户针对该预定网络访问对象为稳定活跃用户,在这种情况下,则可以向用户产生第二推送信息,以对用户访问预定网络访问对象的积极性进行激励。第二推送信息例如为向用户派发红包、向用户派发积分等等。
基于同一发明构思,本发明实施例还提供一种用户活跃度的预测装置,请参考图6,包括:
第一获得模块60,用于获得终端采集的用户预设时间内的M种特征数据,M为正整数;
生成模块61,用于基于M种特征数据中每种特征数据的特征参数,生成用户的用户向量;
第二获得模块62,用于将用户向量输入逻辑回归模型,获得逻辑回归模型的输出结果作为在预设时间段之后用户对预定网络访问对象的用户活跃度值;
其中,逻辑回归模型基于多组采样样本进行逻辑回归训练获得,多组采样样本中的每组采样样本包含采样用户的M种特征数据;多组采样样本包含正样本和负样本,在采样时间之后的预设时间段内,正样本中的采样用户在预定网络访问对象的用户活跃度满足第一预设活跃度条件;在采样时间之后的预设时间段内,负样本中的采样用户在预定网络访问对象的用户活跃度值不满足第一预设活跃度条件。
可选的,装置还包括:第三获得模块,用于获得多组采样样本,多组采样样本中的每组采样样本包含采样用户以及采样用户的M种特征数据;第一确定模块,用于从多组采样样本中分别确定出正样本和负样本;训练模块,用于采用正样本和负样本进行逻辑回归训练,进而获得逻辑回归模型。
可选的,M种特征数据包括:用户行为特征类别、终端特征类别、用户个人特征类别中至少一个类别下的特征数据。
可选的,用户行为特征类别包括:清理行为数据、访问应用程序的行为数据、下载应用程序的行为数据、点击应用程序的行为数据中的至少一种行为数据。
可选的,终端特征类别包括:安装应用程序的数量、安装应用程序的名称、安装应用程序的版本、***版本、内存参数、流量参数中的至少一种终端特征。
可选的,用户个人特征类别包括:性别、年龄、职业、所在地、教育背景中的至少一种用户个人特征。
可选的,预定网络访问对象包括:预定应用程序或者预定网站。
基于同一发明构思,本发明实施例还提供一种用户活跃度的预测装置,请参考图7,包括:
第四获得模块70,用于获得终端采集的用户预设时间内的M种特征数据,M为正整数;
发送模块71,用于将M种特征数据发送至网络服务器,以供网络服务器基于M特征数据确定出用户的用户向量并将用户向量输入逻辑回归模型,进而获得逻辑回归模型的输出结果作为在预设时间段之后用户对预定网络访问对象的用户活跃度值;
其中,逻辑回归模型基于多组采样样本进行逻辑回归训练获得,多组采样样本中的每组采样样本包含采样用户的M种特征数据;多组采样样本包含正样本和负样本,在采样时间之后的预设时间段内,正样本中的采样用户在预定网络访问对象的用户活跃度满足第一预设活跃度条件;在采样时间之后的预设时间段内,负样本中的采样用户在预定网络访问对象的用户活跃度值不满足第一预设活跃度条件。
可选的,M种特征数据包括:用户行为特征类别、终端特征类别、用户个人特征类别中至少一个类别下的特征数据。
可选的,用户行为特征类别包括:清理行为数据、访问应用程序的行为数据、下载应用程序的行为数据、点击应用程序的行为数据中的至少一种行为数据。
可选的,终端特征类别包括:安装应用程序的数量、安装应用程序的名称、安装应用程序的版本、***版本、内存参数、流量参数中的至少一种终端特征。
可选的,用户个人特征类别包括:性别、年龄、职业、所在地、教育背景中的至少一种用户个人特征。
可选的,预定网络访问对象包括:预定应用程序或者预定网站。
基于同一发明构思,本发明实施例还提供一种基于用户活跃度的信息推送***,请参考图8,包括:
第二确定模块80,用于基于本发明任一实施例所介绍的用户活跃度的预测装置,确定出第一用户针对预定网络访问对象的用户活跃度值;
第一判断模块81,用于基于第一用户的用户活跃度值,判断预设时间段后第一用户是否成为预定网络访问对象的流失用户;
第一推送模块82,用于如果第一用户将成为流失用户,通过第一用户的终端向第一用户产生第一推送信息。
可选的,***还包括:获取模块,用于获取第一用户访问网络过程中的历史访问记录;第三确定模块,用于基于历史访问记录确定出第一用户的兴趣特征;第四确定模块,用于基于第一用户的兴趣特征确定出第一推送信息。
可选的,历史访问记录为用户基于预定网络访问对象访问网络所获得历史访问记录。
可选的,***还包括:第五确定模块,用于基于第一用户与其他用户的M种特征数据确定出与第一用户的用户相似度值大于预设相似度值的推荐用户;第六确定模块,用于确定推荐用户的兴趣特征;第七确定模块,用于基于推荐用户的兴趣特征确定出第一推送信息。
可选的,第一判断模块82,包括:判断单元,用于判断用户活跃度值是否小于预设阈值;确定单元,用于在用户活跃度值小于预设阈值时,确定在预定时间段后第一用户将成为预定网络访问对象的流失用户。
基于同一发明构思,本发明实施例还提供一种基于用户活跃度的信息推送***,请参考图9,包括:
第八确定模块90,用于基于本发明任一实施例所介绍的用户活跃度的预测装置,确定出第二用户针对预定网络访问对象的用户活跃度值;
第二判断模块91,用于基于第二用户的用户活跃度值,判断预设时间段后第一用户是否为预定网络访问对象的活跃用户;
第九确定模块92,用于如果预设时间段后第二用户是否为预定网络访问对象的活跃用户,确定预设时间段内第二用户针对预定网络访问对象的活跃数据;
第三判断模块93,用于基于活跃数据,判断第二用户针对预定网络访问对象的持续活跃时长是否大于预设持续活跃时长;
第二推送模块94,用于在持续活跃时长大于预设活跃时长时,通过第二用户的终端向第二用户发送第二推送信息。
可选的,活跃数据包括以下数据中的至少一种数据:第二用户访问预定网络访问对象的连续访问天数;或者第二用户访问预设时间段内访问网络访问对象的访问总次数;或者第二用户访问预设时间段内访问网络访问对象的访问总时长。
可选的,第三判断模块04,用于判断第二用户访问预定网络访问对象的持续访问天数是否大于预设天数;或者判断第二用户访问预定网络访问对象的访问总次数是否大于预设次数;或者判断第二用户访问预定网络访问对象的访问总时长是否大于预设时长。
本申请实施例中提供的技术方案,至少具有如下技术效果或优点:
由于在本发明实施例中,预先基于多组采样样本进行逻辑回归训练获得逻辑回归模型,多组采样样本中每组采样样本包含一组采样用户的M种特征数据,并且多组采样样本包含正样本和负样本,其中正样本为采样时间之后的预设时间段内采样用户的活跃度较高的采样样本,负样本为采样时间之后的预设时间段内采样用户的活跃度较低的采样样本;在预先训练出逻辑回归模型之后,针对某特定用户,可以采集获得该用户预设时间内的M种特征数据;然后基于M种特征数据中每种特征数据的特征参数,生成用户的用户向量,最后将用户向量输入预先训练出的逻辑回归模型,就可以确定出预设时间段之后用户对预定网络访问对象的用户活跃度值,进而达到了能够对用户的用户活跃度值进行预测的技术效果。
在此提供的算法和显示不与任何特定计算机、虚拟***或者其它设备固有相关。各种通用***也可以与基于在此的示教一起使用。根据上面的描述,构造这类***所要求的结构是显而易见的。此外,本发明也不针对任何特定编程语言。应当明白,可以利用各种编程语言实现在此描述的本发明的内容,并且上面对特定语言所做的描述是为了披露本发明的最佳实施方式。
在此处所提供的说明书中,说明了大量具体细节。然而,能够理解,本发明的实施例可以在没有这些具体细节的情况下实践。在一些实例中,并未详细示出公知的方法、结构和技术,以便不模糊对本说明书的理解。
类似地,应当理解,为了精简本公开并帮助理解各个发明方面中的一个或多个,在上面对本发明的示例性实施例的描述中,本发明的各个特征有时被一起分组到单个实施例、图、或者对其的描述中。然而,并不应将该公开的方法解释成反映如下意图:即所要求保护的本发明要求比在每个权利要求中所明确记载的特征更多的特征。更确切地说,如下面的权利要求书所反映的那样,发明方面在于少于前面公开的单个实施例的所有特征。因此,遵循具体实施方式的权利要求书由此明确地并入该具体实施方式,其中每个权利要求本身都作为本发明的单独实施例。
本领域那些技术人员可以理解,可以对实施例中的设备中的模块进行自适应性地改变并且把它们设置在与该实施例不同的一个或多个设备中。可以把实施例中的模块或单元或组件组合成一个模块或单元或组件,以及此外可以把它们分成多个子模块或子单元或子组件。除了这样的特征和/或过程或者单元中的至少一些是相互排斥之外,可以采用任何组合对本说明书(包括伴随的权利要求、摘要和附图)中公开的所有特征以及如此公开的任何方法或者设备的所有过程或单元进行组合。除非另外明确陈述,本说明书(包括伴随的权利要求、摘要和附图)中公开的每个特征可以由提供相同、等同或相似目的的替代特征来代替。
此外,本领域的技术人员能够理解,尽管在此的一些实施例包括其它实施例中所包括的某些特征而不是其它特征,但是不同实施例的特征的组合意味着处于本发明的范围之内并且形成不同的实施例。例如,在下面的权利要求书中,所要求保护的实施例的任意之一都可以以任意的组合方式来使用。
本发明的各个部件实施例可以以硬件实现,或者以在一个或者多个处理器上运行的软件模块实现,或者以它们的组合实现。本领域的技术人员应当理解,可以在实践中使用微处理器或者数字信号处理器(DSP)来实现根据本发明实施例的***中的一些或者全部部件的一些或者全部功能。本发明还可以实现为用于执行这里所描述的方法的一部分或者全部的设备或者装置程序(例如,计算机程序和计算机程序产品)。这样的实现本发明的程序可以存储在计算机可读介质上,或者可以具有一个或者多个信号的形式。这样的信号可以从因特网网站上下载得到,或者在载体信号上提供,或者以任何其他形式提供。
应该注意的是上述实施例对本发明进行说明而不是对本发明进行限制,并且本领域技术人员在不脱离所附权利要求的范围的情况下可设计出替换实施例。在权利要求中,不应将位于括号之间的任何参考符号构造成对权利要求的限制。单词“包含”不排除存在未列在权利要求中的元件或步骤。位于元件之前的单词“一”或“一个”不排除存在多个这样的元件。本发明可以借助于包括有若干不同元件的硬件以及借助于适当编程的计算机来实现。在列举了若干装置的单元权利要求中,这些装置中的若干个可以是通过同一个硬件项来具体体现。单词第一、第二、以及第三等的使用不表示任何顺序。可将这些单词解释为名称。
本发明公开了,A1、一种用户活跃度的预测方法,包括:
获得终端采集的用户预设时间内的M种特征数据,M为正整数;
基于所述M种特征数据中每种特征数据的特征参数,生成所述用户的用户向量;
将所述用户向量输入逻辑回归模型,获得所述逻辑回归模型的输出结果作为在所述预设时间段之后所述用户对预定网络访问对象的用户活跃度值;
其中,所述逻辑回归模型基于多组采样样本进行逻辑回归训练获得,所述多组采样样本中的每组采样样本包含采样用户的所述M种特征数据;所述多组采样样本包含正样本和负样本,在采样时间之后的预设时间段内,所述正样本中的采样用户在所述预定网络访问对象的用户活跃度满足第一预设活跃度条件;在所述采样时间之后的预设时间段内,所述负样本中的采样用户在所述预定网络访问对象的用户活跃度值不满足所述第一预设活跃度条件。
A2、如A1所述的方法,其特征在于,所述逻辑回归模型通过以下方式获得:
获得多组采样样本,所述多组采样样本中的每组采样样本包含采样用户以及所述采样用户的所述M种特征数据;
从所述多组采样样本中分别确定出正样本和负样本;
采用所述正样本和所述负样本进行逻辑回归训练,进而获得所述逻辑回归模型。
A3、如A1所述的方法,其特征在于,所述M种特征数据包括:用户行为特征类别、终端特征类别、用户个人特征类别中至少一个类别下的特征数据。
A4、如A3所述的方法,其特征在于,所述用户行为特征类别包括:清理行为数据、访问应用程序的行为数据、下载应用程序的行为数据、点击应用程序的行为数据中的至少一种行为数据。
A5、如A3所述的方法,其特征在于,所述终端特征类别包括:安装应用程序的数量、安装应用程序的名称、安装应用程序的版本、***版本、内存参数、流量参数中的至少一种终端特征。
A6、如A3所述的方法,其特征在于,所述用户个人特征类别包括:性别、年龄、职业、所在地、教育背景中的至少一种用户个人特征。
A7、如A1-A6任一所述的方法,其特征在于,所述预定网络访问对象包括:预定应用程序或者预定网站。
B8、一种用户活跃度的预测方法,包括:
获得终端采集的用户预设时间内的M种特征数据,M为正整数;
将所述M种特征数据发送至网络服务器,以供所述网络服务器基于所述M特征数据确定出所述用户的用户向量并将所述用户向量输入逻辑回归模型,进而获得所述逻辑回归模型的输出结果作为在所述预设时间段之后所述用户对预定网络访问对象的用户活跃度值;
其中,所述逻辑回归模型基于多组采样样本进行逻辑回归训练获得,所述多组采样样本中的每组采样样本包含采样用户的所述M种特征数据;所述多组采样样本包含正样本和负样本,在采样时间之后的预设时间段内,所述正样本中的采样用户在所述预定网络访问对象的用户活跃度满足第一预设活跃度条件;在所述采样时间之后的预设时间段内,所述负样本中的采样用户在所述预定网络访问对象的用户活跃度值不满足所述第一预设活跃度条件。
B9、如B8所述的方法,其特征在于,所述M种特征数据包括:用户行为特征类别、终端特征类别、用户个人特征类别中至少一个类别下的特征数据。
B10、如B9所述的方法,其特征在于,所述用户行为特征类别包括:清理行为数据、访问应用程序的行为数据、下载应用程序的行为数据、点击应用程序的行为数据中的至少一种行为数据。
B11、如B9所述的方法,其特征在于,所述终端特征类别包括:安装应用程序的数量、安装应用程序的名称、安装应用程序的版本、***版本、内存参数、流量参数中的至少一种终端特征。
B12、如B9所述的方法,其特征在于,所述用户个人特征类别包括:性别、年龄、职业、所在地、教育背景中的至少一种用户个人特征。
B13、如B8-B12任一所述的方法,其特征在于,所述预定网络访问对象包括:预定应用程序或者预定网站。
C14、一种基于用户活跃度的信息推送方法,包括:
基于A1-A7、B8-B13任一所述的用户活跃度的预测方法,确定出第一用户针对所述预定网络访问对象的所述用户活跃度值;
基于所述第一用户的所述用户活跃度值,判断所述预设时间段后所述第一用户是否成为所述预定网络访问对象的流失用户;
如果所述第一用户将成为所述流失用户,通过所述第一用户的终端向所述第一用户产生第一推送信息。
C15、如C14所述的方法,其特征在于,在所述向所述第一用户产生第一推送信息之前,所述方法还包括:
获取所述第一用户访问网络过程中的历史访问记录;
基于所述历史访问记录确定出所述第一用户的兴趣特征;
基于所述第一用户的兴趣特征确定出所述第一推送信息。
C16、如C15所述的方法,其特征在于,所述历史访问记录为所述用户基于所述预定网络访问对象访问网络所获得历史访问记录。
C17、如C14所述的方法,其特征在于,在所述向所述第一用户产生第一推送信息之前,所述方法还包括:
基于所述第一用户与其他用户的所述M种特征数据确定出与所述第一用户的用户相似度值大于预设相似度值的推荐用户;
确定所述推荐用户的兴趣特征;
基于所述推荐用户的兴趣特征确定出所述第一推送信息。
C18、如C14-C17任一所述的方法,其特征在于,所述基于所述第一用户的所述活跃度值,判断所述预设时间段后所述第一用户是否成为所述预定网络访问对象的流失用户,包括:
判断所述用户活跃度值是否小于预设阈值;
在所述用户活跃度值小于所述预设阈值时,确定在所述预定时间段后所述第一用户将成为所述预定网络访问对象的流失用户。
D19、一种基于用户活跃度的信息推送方法,包括:
基于A1-A7、B8-B13任一所述的用户活跃度的预测方法,确定出第二用户针对所述预定网络访问对象的所述用户活跃度值;
基于所述第二用户的所述用户活跃度值,判断所述预设时间段后所述第一用户是否为所述预定网络访问对象的活跃用户;
如果所述预设时间段后所述第二用户是否为所述预定网络访问对象的活跃用户,确定所述预设时间段内所述第二用户针对所述预定网络访问对象的活跃数据;
基于所述活跃数据,判断所述第二用户针对所述预定网络访问对象的持续活跃时长是否大于预设持续活跃时长;
在所述持续活跃时长大于所述预设活跃时长时,通过所述第二用户的终端向所述第二用户发送第二推送信息。
D20、如D19所述的方法,其特征在于,所述活跃数据包括以下数据中的至少一种数据:
所述第二用户访问所述预定网络访问对象的连续访问天数;或者
所述第二用户访问预设时间段内访问所述网络访问对象的访问总次数;或者
所述第二用户访问预设时间段内访问所述网络访问对象的访问总时长。
D21、如D19所述的方法,其特征在于,所述判断所述第二用户针对所述预定网络访问对象的持续活跃时长是否大于预设持续活跃时长,包括:
判断所述第二用户访问所述预定网络访问对象的持续访问天数是否大于预设天数;或者
判断所述第二用户访问所述预定网络访问对象的访问总次数是否大于预设次数;或者
判断所述第二用户访问所述预定网络访问对象的访问总时长是否大于预设时长。
E22、一种用户活跃度的预测装置,包括:
第一获得模块,用于获得终端采集的用户预设时间内的M种特征数据,M为正整数;
生成模块,用于基于所述M种特征数据中每种特征数据的特征参数,生成所述用户的用户向量;
第二获得模块,用于将所述用户向量输入逻辑回归模型,获得所述逻辑回归模型的输出结果作为在所述预设时间段之后所述用户对预定网络访问对象的用户活跃度值;
其中,所述逻辑回归模型基于多组采样样本进行逻辑回归训练获得,所述多组采样样本中的每组采样样本包含采样用户的所述M种特征数据;所述多组采样样本包含正样本和负样本,在采样时间之后的预设时间段内,所述正样本中的采样用户在所述预定网络访问对象的用户活跃度满足第一预设活跃度条件;在所述采样时间之后的预设时间段内,所述负样本中的采样用户在所述预定网络访问对象的用户活跃度值不满足所述第一预设活跃度条件。
E23、如E22所述的装置,其特征在于,所述装置还包括:
第三获得模块,用于获得多组采样样本,所述多组采样样本中的每组采样样本包含采样用户以及所述采样用户的所述M种特征数据;
第一确定模块,用于从所述多组采样样本中分别确定出正样本和负样本;
训练模块,用于采用所述正样本和所述负样本进行逻辑回归训练,进而获得所述逻辑回归模型。
E24、如E22所述的装置,其特征在于,所述M种特征数据包括:用户行为特征类别、终端特征类别、用户个人特征类别中至少一个类别下的特征数据。
E25、如E24所述的装置,其特征在于,所述用户行为特征类别包括:清理行为数据、访问应用程序的行为数据、下载应用程序的行为数据、点击应用程序的行为数据中的至少一种行为数据。
E26、如E24所述的装置,其特征在于,所述终端特征类别包括:安装应用程序的数量、安装应用程序的名称、安装应用程序的版本、***版本、内存参数、流量参数中的至少一种终端特征。
E27、如E24所述的装置,其特征在于,所述用户个人特征类别包括:性别、年龄、职业、所在地、教育背景中的至少一种用户个人特征。
E28、如E22-E327任一所述的装置,其特征在于,所述预定网络访问对象包括:预定应用程序或者预定网站。
F29、一种用户活跃度的预测装置,包括:
第四获得模块,用于获得终端采集的用户预设时间内的M种特征数据,M为正整数;
发送模块,用于将所述M种特征数据发送至网络服务器,以供所述网络服务器基于所述M特征数据确定出所述用户的用户向量并将所述用户向量输入逻辑回归模型,进而获得所述逻辑回归模型的输出结果作为在所述预设时间段之后所述用户对预定网络访问对象的用户活跃度值;
其中,所述逻辑回归模型基于多组采样样本进行逻辑回归训练获得,所述多组采样样本中的每组采样样本包含采样用户的所述M种特征数据;所述多组采样样本包含正样本和负样本,在采样时间之后的预设时间段内,所述正样本中的采样用户在所述预定网络访问对象的用户活跃度满足第一预设活跃度条件;在所述采样时间之后的预设时间段内,所述负样本中的采样用户在所述预定网络访问对象的用户活跃度值不满足所述第一预设活跃度条件。
F30、如F29所述的装置,其特征在于,所述M种特征数据包括:用户行为特征类别、终端特征类别、用户个人特征类别中至少一个类别下的特征数据。
F31、如F30所述的装置,其特征在于,所述用户行为特征类别包括:清理行为数据、访问应用程序的行为数据、下载应用程序的行为数据、点击应用程序的行为数据中的至少一种行为数据。
F32、如F30所述的装置,其特征在于,所述终端特征类别包括:安装应用程序的数量、安装应用程序的名称、安装应用程序的版本、***版本、内存参数、流量参数中的至少一种终端特征。
F33、如F30所述的装置,其特征在于,所述用户个人特征类别包括:性别、年龄、职业、所在地、教育背景中的至少一种用户个人特征。
F34、如F30-33任一所述的装置,其特征在于,所述预定网络访问对象包括:预定应用程序或者预定网站。
G35、一种基于用户活跃度的信息推送***,包括:
第二确定模块,用于基于GE22-E28、F29-F34任一所述的用户活跃度的预测装置,确定出第一用户针对所述预定网络访问对象的所述用户活跃度值;
第一判断模块,用于基于所述第一用户的所述用户活跃度值,判断所述预设时间段后所述第一用户是否成为所述预定网络访问对象的流失用户;
第一推送模块,用于如果所述第一用户将成为所述流失用户,通过所述第一用户的终端向所述第一用户产生第一推送信息。
G36、如G35所述的***,其特征在于,所述***还包括:
获取模块,用于获取所述第一用户访问网络过程中的历史访问记录;
第三确定模块,用于基于所述历史访问记录确定出所述第一用户的兴趣特征;
第四确定模块,用于基于所述第一用户的兴趣特征确定出所述第一推送信息。
G37、如G36所述的***,其特征在于,所述历史访问记录为所述用户基于所述预定网络访问对象访问网络所获得历史访问记录。
G38、如G35所述的***,其特征在于,所述***还包括:
第五确定模块,用于基于所述第一用户与其他用户的所述M种特征数据确定出与所述第一用户的用户相似度值大于预设相似度值的推荐用户;
第六确定模块,用于确定所述推荐用户的兴趣特征;
第七确定模块,用于基于所述推荐用户的兴趣特征确定出所述第一推送信息。
G39、如G35-G38任一所述的***,其特征在于,所述第一判断模块,包括:
判断单元,用于判断所述用户活跃度值是否小于预设阈值;
确定单元,用于在所述用户活跃度值小于所述预设阈值时,确定在所述预定时间段后所述第一用户将成为所述预定网络访问对象的流失用户。
H40、一种基于用户活跃度的信息推送***,包括:
第八确定模块,用于基于GE22-E28、F29-F34任一所述的用户活跃度的预测装置,确定出第二用户针对所述预定网络访问对象的所述用户活跃度值;
第二判断模块,用于基于所述第二用户的所述用户活跃度值,判断所述预设时间段后所述第一用户是否为所述预定网络访问对象的活跃用户;
第九确定模块,用于如果所述预设时间段后所述第二用户是否为所述预定网络访问对象的活跃用户,确定所述预设时间段内所述第二用户针对所述预定网络访问对象的活跃数据;
第三判断模块,用于基于所述活跃数据,判断所述第二用户针对所述预定网络访问对象的持续活跃时长是否大于预设持续活跃时长;
第二推送模块,用于在所述持续活跃时长大于所述预设活跃时长时,通过所述第二用户的终端向所述第二用户发送第二推送信息。
H41、如H40所述的***,其特征在于,所述活跃数据包括以下数据中的至少一种数据:
所述第二用户访问所述预定网络访问对象的连续访问天数;或者
所述第二用户访问预设时间段内访问所述网络访问对象的访问总次数;或者
所述第二用户访问预设时间段内访问所述网络访问对象的访问总时长。
H42、如H40所述的***,其特征在于,所述第三判断模块,用于:
判断所述第二用户访问所述预定网络访问对象的持续访问天数是否大于预设天数;或者
判断所述第二用户访问所述预定网络访问对象的访问总次数是否大于预设次数;或者
判断所述第二用户访问所述预定网络访问对象的访问总时长是否大于预设时长。

Claims (10)

1.一种用户活跃度的预测方法,其特征在于,包括:
获得终端采集的用户预设时间内的M种特征数据,M为正整数;
基于所述M种特征数据中每种特征数据的特征参数,生成所述用户的用户向量;
将所述用户向量输入逻辑回归模型,获得所述逻辑回归模型的输出结果作为在所述预设时间段之后所述用户对预定网络访问对象的用户活跃度值;
其中,所述逻辑回归模型基于多组采样样本进行逻辑回归训练获得,所述多组采样样本中的每组采样样本包含采样用户的所述M种特征数据;所述多组采样样本包含正样本和负样本,在采样时间之后的预设时间段内,所述正样本中的采样用户在所述预定网络访问对象的用户活跃度满足第一预设活跃度条件;在所述采样时间之后的预设时间段内,所述负样本中的采样用户在所述预定网络访问对象的用户活跃度值不满足所述第一预设活跃度条件。
2.如权利要求1所述的方法,其特征在于,所述逻辑回归模型通过以下方式获得:
获得多组采样样本,所述多组采样样本中的每组采样样本包含采样用户以及所述采样用户的所述M种特征数据;
从所述多组采样样本中分别确定出正样本和负样本;
采用所述正样本和所述负样本进行逻辑回归训练,进而获得所述逻辑回归模型。
3.如权利要求1所述的方法,其特征在于,所述M种特征数据包括:用户行为特征类别、终端特征类别、用户个人特征类别中至少一个类别下的特征数据。
4.一种用户活跃度的预测方法,其特征在于,包括:
获得终端采集的用户预设时间内的M种特征数据,M为正整数;
将所述M种特征数据发送至网络服务器,以供所述网络服务器基于所述M特征数据确定出所述用户的用户向量并将所述用户向量输入逻辑回归模型,进而获得所述逻辑回归模型的输出结果作为在所述预设时间段之后所述用户对预定网络访问对象的用户活跃度值;
其中,所述逻辑回归模型基于多组采样样本进行逻辑回归训练获得,所述多组采样样本中的每组采样样本包含采样用户的所述M种特征数据;所述多组采样样本包含正样本和负样本,在采样时间之后的预设时间段内,所述正样本中的采样用户在所述预定网络访问对象的用户活跃度满足第一预设活跃度条件;在所述采样时间之后的预设时间段内,所述负样本中的采样用户在所述预定网络访问对象的用户活跃度值不满足所述第一预设活跃度条件。
5.一种基于用户活跃度的信息推送方法,其特征在于,包括:
基于权利要求1-4任一权利要求所述的用户活跃度的预测方法,确定出第一用户针对所述预定网络访问对象的所述用户活跃度值;
基于所述第一用户的所述用户活跃度值,判断所述预设时间段后所述第一用户是否成为所述预定网络访问对象的流失用户;
如果所述第一用户将成为所述流失用户,通过所述第一用户的终端向所述第一用户产生第一推送信息。
6.一种基于用户活跃度的信息推送方法,其特征在于,包括:
基于权利要求1-4任一权利要求所述的用户活跃度的预测方法,确定出第二用户针对所述预定网络访问对象的所述用户活跃度值;
基于所述第二用户的所述用户活跃度值,判断所述预设时间段后所述第一用户是否为所述预定网络访问对象的活跃用户;
如果所述预设时间段后所述第二用户是否为所述预定网络访问对象的活跃用户,确定所述预设时间段内所述第二用户针对所述预定网络访问对象的活跃数据;
基于所述活跃数据,判断所述第二用户针对所述预定网络访问对象的持续活跃时长是否大于预设持续活跃时长;
在所述持续活跃时长大于所述预设活跃时长时,通过所述第二用户的终端向所述第二用户发送第二推送信息。
7.一种用户活跃度的预测装置,其特征在于,包括:
第一获得模块,用于获得终端采集的用户预设时间内的M种特征数据,M为正整数;
生成模块,用于基于所述M种特征数据中每种特征数据的特征参数,生成所述用户的用户向量;
第二获得模块,用于将所述用户向量输入逻辑回归模型,获得所述逻辑回归模型的输出结果作为在所述预设时间段之后所述用户对预定网络访问对象的用户活跃度值;
其中,所述逻辑回归模型基于多组采样样本进行逻辑回归训练获得,所述多组采样样本中的每组采样样本包含采样用户的所述M种特征数据;所述多组采样样本包含正样本和负样本,在采样时间之后的预设时间段内,所述正样本中的采样用户在所述预定网络访问对象的用户活跃度满足第一预设活跃度条件;在所述采样时间之后的预设时间段内,所述负样本中的采样用户在所述预定网络访问对象的用户活跃度值不满足所述第一预设活跃度条件。
8.一种用户活跃度的预测装置,其特征在于,包括:
第四获得模块,用于获得终端采集的用户预设时间内的M种特征数据,M为正整数;
发送模块,用于将所述M种特征数据发送至网络服务器,以供所述网络服务器基于所述M特征数据确定出所述用户的用户向量并将所述用户向量输入逻辑回归模型,进而获得所述逻辑回归模型的输出结果作为在所述预设时间段之后所述用户对预定网络访问对象的用户活跃度值;
其中,所述逻辑回归模型基于多组采样样本进行逻辑回归训练获得,所述多组采样样本中的每组采样样本包含采样用户的所述M种特征数据;所述多组采样样本包含正样本和负样本,在采样时间之后的预设时间段内,所述正样本中的采样用户在所述预定网络访问对象的用户活跃度满足第一预设活跃度条件;在所述采样时间之后的预设时间段内,所述负样本中的采样用户在所述预定网络访问对象的用户活跃度值不满足所述第一预设活跃度条件。
9.一种基于用户活跃度的信息推送***,其特征在于,包括:
第二确定模块,用于基于权利要求7或8所述的用户活跃度的预测装置,确定出第一用户针对所述预定网络访问对象的所述用户活跃度值;
第一判断模块,用于基于所述第一用户的所述用户活跃度值,判断所述预设时间段后所述第一用户是否成为所述预定网络访问对象的流失用户;
第一推送模块,用于如果所述第一用户将成为所述流失用户,通过所述第一用户的终端向所述第一用户产生第一推送信息。
10.一种基于用户活跃度的信息推送***,其特征在于,包括:
第八确定模块,用于基于权利要求7或8所述的用户活跃度的预测装置,确定出第二用户针对所述预定网络访问对象的所述用户活跃度值;
第二判断模块,用于基于所述第二用户的所述用户活跃度值,判断所述预设时间段后所述第一用户是否为所述预定网络访问对象的活跃用户;
第九确定模块,用于如果所述预设时间段后所述第二用户是否为所述预定网络访问对象的活跃用户,确定所述预设时间段内所述第二用户针对所述预定网络访问对象的活跃数据;
第三判断模块,用于基于所述活跃数据,判断所述第二用户针对所述预定网络访问对象的持续活跃时长是否大于预设持续活跃时长;
第二推送模块,用于在所述持续活跃时长大于所述预设活跃时长时,通过所述第二用户的终端向所述第二用户发送第二推送信息。
CN201510982910.9A 2015-12-23 2015-12-23 一种用户活跃度的预测方法、装置及其应用方法和*** Pending CN105631538A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201510982910.9A CN105631538A (zh) 2015-12-23 2015-12-23 一种用户活跃度的预测方法、装置及其应用方法和***

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201510982910.9A CN105631538A (zh) 2015-12-23 2015-12-23 一种用户活跃度的预测方法、装置及其应用方法和***

Publications (1)

Publication Number Publication Date
CN105631538A true CN105631538A (zh) 2016-06-01

Family

ID=56046445

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201510982910.9A Pending CN105631538A (zh) 2015-12-23 2015-12-23 一种用户活跃度的预测方法、装置及其应用方法和***

Country Status (1)

Country Link
CN (1) CN105631538A (zh)

Cited By (27)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106126544A (zh) * 2016-06-15 2016-11-16 晶赞广告(上海)有限公司 一种互联网内容的投放方法及装置
CN106709755A (zh) * 2016-11-28 2017-05-24 加和(北京)信息科技有限公司 一种预测用户频次的方法及装置
CN106998274A (zh) * 2016-12-12 2017-08-01 深圳大宇无限科技有限公司 应用消息推送方法和装置
CN107729225A (zh) * 2017-10-27 2018-02-23 上海斐讯数据通信技术有限公司 一种终端设备心率采集方法及***
CN108322783A (zh) * 2018-01-25 2018-07-24 广州虎牙信息科技有限公司 视频网站用户规模推测方法、存储介质和终端
CN108460629A (zh) * 2018-02-10 2018-08-28 深圳壹账通智能科技有限公司 用户营销推荐方法、装置、终端设备及存储介质
CN108510298A (zh) * 2017-02-28 2018-09-07 阿里巴巴集团控股有限公司 目标用户的识别方法及装置
CN108683949A (zh) * 2018-05-18 2018-10-19 北京奇艺世纪科技有限公司 一种直播平台***的提取方法及装置
CN109063900A (zh) * 2018-07-16 2018-12-21 广州视源电子科技股份有限公司 用户转化率预测模型的训练及用户转化率预测方法和装置
CN109146549A (zh) * 2018-07-26 2019-01-04 云数信息科技(深圳)有限公司 彩票用户产品参与度预测方法、***及设备、存储介质
CN109360629A (zh) * 2018-09-30 2019-02-19 深圳个人数据管理服务有限公司 基于机器学习的情绪预测方法、装置、设备和存储介质
CN109636047A (zh) * 2018-12-17 2019-04-16 江苏满运软件科技有限公司 用户活跃度预测模型训练方法、***、设备及存储介质
CN109685255A (zh) * 2018-12-13 2019-04-26 麒麟合盛网络技术股份有限公司 一种预测用户流失的方法和装置
CN109727070A (zh) * 2018-12-28 2019-05-07 中国银行股份有限公司 一种潜在活跃用户的确定方法及装置
CN110191460A (zh) * 2019-05-29 2019-08-30 中国联合网络通信集团有限公司 一种新入网用户监测方法及平台
CN110740193A (zh) * 2019-10-30 2020-01-31 江苏满运软件科技有限公司 一种平台活跃度的预测方法、装置、存储介质及电子设备
CN111047338A (zh) * 2018-10-12 2020-04-21 北大方正集团有限公司 用户活跃度预测方法、预测***及介质
CN111695680A (zh) * 2020-06-15 2020-09-22 北京百度网讯科技有限公司 成绩预测方法、成绩预测模型训练方法、装置及电子设备
CN111967521A (zh) * 2020-08-18 2020-11-20 中国银行股份有限公司 跨境活跃用户识别方法及装置
CN112612826A (zh) * 2020-12-21 2021-04-06 北京达佳互联信息技术有限公司 数据处理方法和装置
CN112633573A (zh) * 2020-12-21 2021-04-09 北京达佳互联信息技术有限公司 活跃状态的预测方法以及活跃度阈值的确定方法
CN112686690A (zh) * 2020-12-21 2021-04-20 北京达佳互联信息技术有限公司 数据处理方法、装置、电子设备及计算机可读存储介质
WO2021196639A1 (zh) * 2020-03-31 2021-10-07 汉海信息技术(上海)有限公司 消息推送方法、装置、计算机设备及存储介质
CN113656275A (zh) * 2021-08-24 2021-11-16 广州虎牙科技有限公司 用户活跃度预测方法、装置、电子设备和存储介质
CN113648659A (zh) * 2021-08-20 2021-11-16 腾讯科技(深圳)有限公司 一种确定用户活跃度的方法和相关装置
CN115034338A (zh) * 2022-08-11 2022-09-09 江苏布罗信息技术有限公司 一种基于电数字数据处理的鳜鱼生长监测方法及***
CN115134407A (zh) * 2022-06-27 2022-09-30 平安银行股份有限公司 活跃区域确定方法、装置、计算机设备及存储介质

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102982466A (zh) * 2012-07-17 2013-03-20 华东师范大学 一种基于用户活跃度的评分预测方法
CN104636406A (zh) * 2013-11-15 2015-05-20 华为技术有限公司 一种根据用户行为推送信息的方法和装置
CN104679969A (zh) * 2013-11-29 2015-06-03 腾讯科技(深圳)有限公司 防止用户流失的方法及装置
CN105005909A (zh) * 2015-06-17 2015-10-28 深圳市腾讯计算机***有限公司 预测流失用户的方法及装置

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102982466A (zh) * 2012-07-17 2013-03-20 华东师范大学 一种基于用户活跃度的评分预测方法
CN104636406A (zh) * 2013-11-15 2015-05-20 华为技术有限公司 一种根据用户行为推送信息的方法和装置
CN104679969A (zh) * 2013-11-29 2015-06-03 腾讯科技(深圳)有限公司 防止用户流失的方法及装置
CN105005909A (zh) * 2015-06-17 2015-10-28 深圳市腾讯计算机***有限公司 预测流失用户的方法及装置

Cited By (39)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106126544A (zh) * 2016-06-15 2016-11-16 晶赞广告(上海)有限公司 一种互联网内容的投放方法及装置
CN106709755A (zh) * 2016-11-28 2017-05-24 加和(北京)信息科技有限公司 一种预测用户频次的方法及装置
CN106998274A (zh) * 2016-12-12 2017-08-01 深圳大宇无限科技有限公司 应用消息推送方法和装置
CN108510298A (zh) * 2017-02-28 2018-09-07 阿里巴巴集团控股有限公司 目标用户的识别方法及装置
CN108510298B (zh) * 2017-02-28 2021-09-21 创新先进技术有限公司 目标用户的识别方法及装置
CN107729225A (zh) * 2017-10-27 2018-02-23 上海斐讯数据通信技术有限公司 一种终端设备心率采集方法及***
CN107729225B (zh) * 2017-10-27 2020-12-22 何雄英 一种终端设备心率采集方法及***
CN108322783A (zh) * 2018-01-25 2018-07-24 广州虎牙信息科技有限公司 视频网站用户规模推测方法、存储介质和终端
CN108322783B (zh) * 2018-01-25 2021-08-17 广州虎牙信息科技有限公司 视频网站用户规模推测方法、存储介质和终端
CN108460629A (zh) * 2018-02-10 2018-08-28 深圳壹账通智能科技有限公司 用户营销推荐方法、装置、终端设备及存储介质
CN108683949A (zh) * 2018-05-18 2018-10-19 北京奇艺世纪科技有限公司 一种直播平台***的提取方法及装置
CN109063900A (zh) * 2018-07-16 2018-12-21 广州视源电子科技股份有限公司 用户转化率预测模型的训练及用户转化率预测方法和装置
CN109146549A (zh) * 2018-07-26 2019-01-04 云数信息科技(深圳)有限公司 彩票用户产品参与度预测方法、***及设备、存储介质
CN109360629A (zh) * 2018-09-30 2019-02-19 深圳个人数据管理服务有限公司 基于机器学习的情绪预测方法、装置、设备和存储介质
CN111047338A (zh) * 2018-10-12 2020-04-21 北大方正集团有限公司 用户活跃度预测方法、预测***及介质
CN109685255A (zh) * 2018-12-13 2019-04-26 麒麟合盛网络技术股份有限公司 一种预测用户流失的方法和装置
CN109636047A (zh) * 2018-12-17 2019-04-16 江苏满运软件科技有限公司 用户活跃度预测模型训练方法、***、设备及存储介质
CN109727070A (zh) * 2018-12-28 2019-05-07 中国银行股份有限公司 一种潜在活跃用户的确定方法及装置
CN109727070B (zh) * 2018-12-28 2021-11-19 中国银行股份有限公司 一种潜在活跃用户的确定方法及装置
CN110191460A (zh) * 2019-05-29 2019-08-30 中国联合网络通信集团有限公司 一种新入网用户监测方法及平台
CN110191460B (zh) * 2019-05-29 2021-11-19 中国联合网络通信集团有限公司 一种新入网用户监测方法及平台
CN110740193A (zh) * 2019-10-30 2020-01-31 江苏满运软件科技有限公司 一种平台活跃度的预测方法、装置、存储介质及电子设备
WO2021196639A1 (zh) * 2020-03-31 2021-10-07 汉海信息技术(上海)有限公司 消息推送方法、装置、计算机设备及存储介质
CN111695680A (zh) * 2020-06-15 2020-09-22 北京百度网讯科技有限公司 成绩预测方法、成绩预测模型训练方法、装置及电子设备
CN111695680B (zh) * 2020-06-15 2023-11-10 北京百度网讯科技有限公司 成绩预测方法、成绩预测模型训练方法、装置及电子设备
CN111967521A (zh) * 2020-08-18 2020-11-20 中国银行股份有限公司 跨境活跃用户识别方法及装置
CN111967521B (zh) * 2020-08-18 2023-09-19 中国银行股份有限公司 跨境活跃用户识别方法及装置
CN112633573A (zh) * 2020-12-21 2021-04-09 北京达佳互联信息技术有限公司 活跃状态的预测方法以及活跃度阈值的确定方法
CN112686690A (zh) * 2020-12-21 2021-04-20 北京达佳互联信息技术有限公司 数据处理方法、装置、电子设备及计算机可读存储介质
CN112612826A (zh) * 2020-12-21 2021-04-06 北京达佳互联信息技术有限公司 数据处理方法和装置
CN112612826B (zh) * 2020-12-21 2024-02-06 北京达佳互联信息技术有限公司 数据处理方法和装置
CN112686690B (zh) * 2020-12-21 2024-03-15 北京达佳互联信息技术有限公司 数据处理方法、装置、电子设备及计算机可读存储介质
CN113648659A (zh) * 2021-08-20 2021-11-16 腾讯科技(深圳)有限公司 一种确定用户活跃度的方法和相关装置
CN113648659B (zh) * 2021-08-20 2023-09-26 腾讯科技(深圳)有限公司 一种确定用户活跃度的方法和相关装置
CN113656275A (zh) * 2021-08-24 2021-11-16 广州虎牙科技有限公司 用户活跃度预测方法、装置、电子设备和存储介质
CN113656275B (zh) * 2021-08-24 2024-03-26 广州虎牙科技有限公司 用户活跃度预测方法、装置、电子设备和存储介质
CN115134407A (zh) * 2022-06-27 2022-09-30 平安银行股份有限公司 活跃区域确定方法、装置、计算机设备及存储介质
CN115134407B (zh) * 2022-06-27 2024-04-26 平安银行股份有限公司 活跃区域确定方法、装置、计算机设备及存储介质
CN115034338A (zh) * 2022-08-11 2022-09-09 江苏布罗信息技术有限公司 一种基于电数字数据处理的鳜鱼生长监测方法及***

Similar Documents

Publication Publication Date Title
CN105631538A (zh) 一种用户活跃度的预测方法、装置及其应用方法和***
CN110276446B (zh) 模型训练和选择推荐信息的方法和装置
EP3893154A1 (en) Recommendation model training method and related apparatus
US9817893B2 (en) Tracking changes in user-generated textual content on social media computing platforms
CN102208086B (zh) 面向领域的个性化智能推荐***及实现方法
CN103763361A (zh) 一种基于用户行为推荐应用的方法、***及推荐服务器
US20160162467A1 (en) Methods and systems for language-agnostic machine learning in natural language processing using feature extraction
CN107220094A (zh) 页面加载方法、装置和电子设备
US20150095267A1 (en) Techniques to dynamically generate real time frequently asked questions from forum data
CA3029215A1 (en) Extrapolating probabilistic predictions for skills using unanswered questions and determining corresponding instructional content
US9697204B2 (en) Automatic placement of hyperlinks on words and phrases in documents
CN107992595A (zh) 一种学习内容推荐方法、装置及智能设备
CN102937976B (zh) 一种基于输入前缀的下拉提示方法和装置
CN103970796A (zh) 查询偏好排序方法和装置
US11748452B2 (en) Method for data processing by performing different non-linear combination processing
CN106610932A (zh) 一种语料处理方法和装置及语料分析方法和装置
CN106777354A (zh) 推广信息新鲜度确定方法及装置
CN106326297A (zh) 一种应用程序推荐方法及装置
CN114996486A (zh) 一种数据推荐方法、装置、服务器以及存储介质
CN116701791B (zh) 基于人工智能的课程推荐方法及***
CN109993562B (zh) 一种满意度仿真方法、装置及终端设备
EP3139327A1 (en) Random index pattern matching based email relations finder system
CN112950038A (zh) 一种基于学情数据的个性化作业布置方法
CN108563648A (zh) 数据显示方法和装置、存储介质及电子装置
CN107918922A (zh) 业务推荐方法及业务推荐装置

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication
RJ01 Rejection of invention patent application after publication

Application publication date: 20160601