CN117236999A - 一种活跃度确定方法、装置、电子设备及存储介质 - Google Patents

一种活跃度确定方法、装置、电子设备及存储介质 Download PDF

Info

Publication number
CN117236999A
CN117236999A CN202311212216.XA CN202311212216A CN117236999A CN 117236999 A CN117236999 A CN 117236999A CN 202311212216 A CN202311212216 A CN 202311212216A CN 117236999 A CN117236999 A CN 117236999A
Authority
CN
China
Prior art keywords
user
target application
liveness
users
condition
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202311212216.XA
Other languages
English (en)
Inventor
何锐明
林志鹏
赵金阳
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
China United Network Communications Group Co Ltd
Original Assignee
China United Network Communications Group Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by China United Network Communications Group Co Ltd filed Critical China United Network Communications Group Co Ltd
Priority to CN202311212216.XA priority Critical patent/CN117236999A/zh
Publication of CN117236999A publication Critical patent/CN117236999A/zh
Pending legal-status Critical Current

Links

Landscapes

  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本申请提供一种活跃度确定方法、装置、电子设备及存储介质,涉及数据处理技术领域,用于提高活跃度划分的精确度。该方法包括:获取第一预设时间段内目标应用的用户行为数据和用户属性数据;根据目标应用的用户行为数据和用户属性数据聚类得到活跃频次阈值N;N为大于或等于1的整数;根据活跃频次阈值N和目标应用的用户行为数据,对目标应用的用户进行活跃度划分。

Description

一种活跃度确定方法、装置、电子设备及存储介质
技术领域
本申请涉及数据处理技术领域,尤其涉及一种活跃度确定方法、装置、电子设备及存储介质。
背景技术
随着计算机和互联网技术的发展,相应诞生了多种多样的互联网产品,互联网产品的设计、研发、生产过程中,用户画像是产品面临的至关重要的问题,在整个流程里,用户画像解决的是互联网产品生成的所有过程都要面向同一个群体。在互联网产品的运营过程里,用户画像为运营策略提供细分视角,面向不同群体推出针对性的运营活动。用户活跃度作为用户画像中重要的一个特征,具有覆盖度广、时效性强、真实性高等优点,是重要的用户特征,是互联网产品的重要指标。
相关技术中,衡量用户活跃度时,一般会通过互联网产品的访问次数、访问时长、收藏指数等来判断,这些都是基于产品总体的统计,而并不关注每个用户的活跃情况,导致衡量出的用户活跃度的准确率较低,无法作为用户个体层面的人工干预的指导,实用性较差。
发明内容
本申请提供一种活跃度确定方法、装置、电子设备及存储介质,用于提高活跃度划分的准确度。
第一方面,本申请提供了一种活跃度确定方法,该方法包括:获取第一预设时间段内目标应用的用户行为数据和用户属性数据;根据目标应用的用户行为数据和用户属性数据聚类得到活跃频次阈值N;N为大于或等于1的整数;根据活跃频次阈值N和目标应用的用户行为数据,对目标应用的用户进行活跃度划分。
本申请提供的技术方案至少可带来以下有益效果:首先根据预设时间段内目标应用的用户的行为数据和属性数据聚类得到活跃频次阈值N;然后根据活跃频次阈值N和目标应用的用户行为数据对用户进行活跃度划分。可以理解的是,相比于相关技术中采用预设固定值来划分活跃度的方法,本申请可以根据目标应用的用户特征(包括行为特征和用户属性特征)聚类得到活跃频次阈值,使得确定的活跃频次阈值N更贴合使用场景,进而能够提升活跃度划分的精确度。
作为一种可能的实现方式,上述根据活跃频次阈值N和目标应用的用户行为数据,对目标应用的用户进行活跃度划分,包括:将预设时间段划分多个时间单元;根据目标应用的用户行为数据,确定目标应用的用户在多个时间单元的活跃情况;其中,活跃情况包括活跃或不活跃;根据目标应用的用户在多个时间单元的活跃情况,和活跃频次阈值N,对目标应用的用户进行活跃度划分。
作为另一种可能的实现方式,上述根据目标应用的用户在多个时间单元的活跃情况,和活跃频次阈值N,对目标应用的用户进行活跃度划分,包括:将目标应用的用户中,满足第一条件的用户划分为第一活跃度用户;其中,第一条件为用户在第一时间单元处于活跃状态,且包括第一时间单元在内的连续N个时间单元均处于活跃状态;第一时间单元为多个时间单元中结束时刻最晚的时间单元;将目标应用的用户中,满足第二条件的用户划分为第二活跃度用户;其中,第二条件为用户在第一时间单元处于活跃状态,但在包括第一时间单元在内的连续N个时间单元中,处于活跃的时间单元的个数小于N;将目标应用的用户中,满足第三条件的用户划分为第三活跃度用户;其中,第三条件为用户在第一时间单元未处于活跃状态,但在第一时间单元之前的连续N个时间单元中,处于活跃的时间单元的个数小于N。
作为另一种可能的实现方式,上述根据目标应用的用户在多个时间单元的活跃情况,和活跃频次阈值N,对目标应用的用户进行活跃度划分,还包括:根据第一活跃度用户和第二活跃度用户的用户数据,分析目标应用的***。
作为另一种可能的实现方式,上述根据目标应用的用户在多个时间单元的活跃情况,和活跃频次阈值N,对目标应用的用户进行活跃度划分,包括:将目标应用的用户中,满足第四条件的用户划分为回流用户;其中,第四条件为用户在第一时间单元处于活跃状态,且第一时间单元距离上一次处于活跃状态的时间单元相隔M个时间单元;第一时间单元为多个时间单元中结束时刻最晚的时间单元;M为大于或等于N的整数;将目标应用的用户中,满足第五条件的用户划分为新增用户;其中,第五条件为用户在第一时间单元处于活跃状态,但在第一时间单元之前的时间单元中均未处于活跃状态;将目标应用的用户中,满足第六条件的用户划分为流失用户;其中,第六条件为在用户在包括第一时间单元在内的连续N个时间单元均未处于活跃状态。
作为另一种可能的实现方式,上述根据目标应用的用户行为数据和用户属性数据聚类得到活跃频次阈值N,包括:根据目标应用的用户行为数据,确定目标应用的用户在k个时间单元的活跃度;其中,k为大于或等于1的整数;由目标应用的用户在k个时间单元的活跃度和第一时间单元中的用户的属性数据,构成数据对象集合;确定数据对象集合的P个聚类中心;P为大于或等于1的整数;分别计算数据对象集合中的每一个数据对象与P个聚类中心之间的距离;根据数据对象集合中的每一个数据对象与P个聚类中心之间的距离,获得至少一个聚类簇;其中,一个聚类簇对应活跃频次阈值N的一个取值。
作为另一种可能的实现方式,一种活跃度确定方法还包括:获取第二预设时间段内目标应用的用户的活跃度划分情况;其中,第二预设时间段早于第一预设时间段;基于第二预设时间段内目标应用的用户的活跃度划分情况与第一预设时间段内目标应用的用户的活跃度划分情况,确定目标应用的用户的活跃度的波动情况。
第二方面,本申请提供了一种活跃度确定装置,该装置包括:获取模块,用于获取第一预设时间段内目标应用的用户行为数据和用户属性数据;聚类模块,用于根据目标应用的用户行为数据和用户属性数据聚类得到活跃频次阈值N;N为大于或等于1的整数;确定模块,用于根据活跃频次阈值N和目标应用的用户行为数据,对目标应用的用户进行活跃度划分。
作为一种可能的实现方式,上述确定模块,具体用于将预设时间段划分多个时间单元;根据目标应用的用户行为数据,确定目标应用的用户在多个时间单元的活跃情况;其中,活跃情况包括活跃或不活跃;根据目标应用的用户在多个时间单元的活跃情况,和活跃频次阈值N,对目标应用的用户进行活跃度划分。
作为另一种可能的实现方式,上述确定模块,具体用于将目标应用的用户中,满足第一条件的用户划分为第一活跃度用户;其中,第一条件为用户在第一时间单元处于活跃状态,且包括第一时间单元在内的连续N个时间单元均处于活跃状态;第一时间单元为多个时间单元中结束时刻最晚的时间单元;将目标应用的用户中,满足第二条件的用户划分为第二活跃度用户;其中,第二条件为用户在第一时间单元处于活跃状态,但在包括第一时间单元在内的连续N个时间单元中,处于活跃状态的时间单元的个数小于N;将目标应用的用户中,满足第三条件的用户划分为第三活跃度用户;其中,第三条件为用户在第一时间单元未处于活跃状态,但在第一时间单元之前的连续N个时间单元中,处于活跃状态的时间单元的个数小于N。
作为另一种可能的实现方式,上述确定模块,还用于根据第一活跃度用户和第二活跃度用户的用户数据,分析目标应用的***。
作为另一种可能的实现方式,上述确定模块,具体用于将目标应用的用户中,满足第四条件的用户划分为回流用户;其中,第四条件为用户在第一时间单元处于活跃状态,且第一时间单元距离上一次处于活跃状态的时间单元相隔M个时间单元;第一时间单元为多个时间单元中结束时刻最晚的时间单元;M为大于或等于N的整数;将目标应用的用户中,满足第五条件的用户划分为新增用户;其中,第五条件为用户在第一时间单元处于活跃状态,但在第一时间单元之前的时间单元中均未处于活跃状态;将目标应用的用户中,满足第六条件的用户划分为流失用户;其中,第六条件为在用户在包括第一时间单元在内的连续N个时间单元均未处于活跃状态。
作为另一种可能的实现方式,上述聚类模块,具体用于根据目标应用的用户行为数据,确定目标应用的用户在k个时间单元的活跃情况;其中,k为大于或等于1的整数;由目标应用的用户在k个时间单元的活跃情况和第一时间单元中的用户的属性数据,构成数据对象集合;确定数据对象集合的P个聚类中心;P为大于或等于1的整数;分别计算数据对象集合中的每一个数据对象与P个聚类中心之间的相似度;根据数据对象集合中的每一个数据对象与P个聚类中心之间的相似度,获得至少一个聚类簇;其中,一个聚类簇对应活跃频次阈值N的一个取值。
作为另一种可能的实现方式,获取模块,还用于获取第二预设时间段内目标应用的用户活跃度划分情况;其中,第二预设时间段早于第一预设时间段;确定模块,还用于基于第二预设时间段内目标应用的用户的活跃度划分情况与第一预设时间段内目标应用的用户的活跃度划分情况,确定目标应用的用户的活跃度的波动情况。
第三方面,本申请提供一种电子设备,该电子设备包括处理器和存储器,处理器与存储器耦合;存储器用于存储计算机指令,计算机指令由处理器加载并执行以使计算机设备实现上述第一方面及其任一种可能的实现方式中提供的活跃度确定方法。
第四方面,本申请提供一种计算机可读存储介质,该计算机可读存储介质包括计算机执行指令,当计算机执行指令在计算机上运行时,使得计算机执行上述第一方面及其任一种可能的实现方式中提供的活跃度确定方法。
本申请中第二方面至第四方面的描述,可以参考第一方面的详细描述;并且,第二方面至第四方面的描述的有益效果,可以参考第一方面的有益效果分析,此处不再赘述。
附图说明
图1为根据一些实施例的一种活跃度确定装置***架构示意图;
图2为根据一些实施例的一种活跃度确定方法流程图一;
图3为根据一些实施例的一种活跃度确定方法流程图二;
图4为根据一些实施例的一种活跃度划分示意图;
图5为根据一些实施例的一种波动分析示意图;
图6为根据一些实施例的一种活跃度确定装置结构示意图一;
图7为根据一些实施例的一种活跃度确定装置结构示意图二。
具体实施方式
下面将结合附图对本申请提供的一种活跃度确定方法的详细描述。
本文中术语“和/或”,仅仅是一种描述关联对象的关联关系,表示可以存在三种关系,例如,A和/或B,可以表示:单独存在A,同时存在A和B,单独存在B这三种情况。
本申请的说明书以及附图中的术语“第一”和“第二”等是用于区别不同的对象,或者用于区别对同一对象的不同处理,而不是用于描述对象的特定顺序。
此外,本申请的描述中所提到的术语“包括”和“具有”以及它们的任何变形,意图在于覆盖不排他的包含。例如包含了一系列步骤或单元的过程、方法、***、产品或设备没有限定于已列出的步骤或单元,而是可选的还包括其他没有列出的步骤或单元,或可选的还包括对于这些过程、方法、产品或设备固有的其它步骤或单元。
需要说明的是,本申请实施例中,“示例性的”或者“例如”等词用于表示作例子、例证或说明。本申请实施例中被描述为“示例性的”或者“例如”的任何实施例或设计方案不应被解释为比其它实施例或设计方案更优选或更具优势。确切而言,使用“示例性的”或者“例如”等词旨在以具体方式呈现相关概念。
在本申请的描述中,除非另有说明,“多个”的含义是指两个或两个以上。
如背景技术所述,相关技术中,衡量用户活跃度时,一般会通过互联网产品的访问次数、访问时长、收藏指数等来判断,这些都是基于产品总体的统计,而并不关注每个用户的活跃情况,导致衡量出的用户活跃度的准确率较低,无法作为用户个体层面的人工干预的指导,实用性较差。
针对上述技术问题,本申请实施例提供了一种活跃度确定方法,具体包括:首先根据预设时间段内目标应用的用户的行为数据和属性数据聚类得到活跃频次阈值N;然后根据活跃频次阈值N和目标应用的用户行为数据对用户进行活跃度划分。可以理解的是,相比于相关技术中采用预设固定值来划分活跃度的方法,本申请实施例可以根据目标应用的用户特征(包括行为特征和用户属性特征)聚类得到活跃频次阈值,使得确定的活跃频次阈值N更贴合使用场景,进而能够提升活跃度划分的精确度。
参见图1,为本申请实施例提供的一种活跃度确定装置***架构示意图,该***包括:服务器100和终端设备200。其中,服务器和终端设备之间可以通过无线的方式进行连接。例如,处理器和终端设备之间通过无线局域网连接。
其中,服务器100,用于通过网络对外提供服务(例如,计算机服务、管理服务或存储服务等)。
在一些实施例中,服务器100可以用于获取目标应用的用户行为数据和用户属性数据,并根据用户行为数据和用户属性数据确定目标应用的用户的活跃情况。
示例性的,服务器可以是一个单独的服务器,或者,也可以是由多个服务器构成的服务器集群。部分实施方式中,服务器集群还可以是分布式集群。
终端设备200,是与用户进行人机交互的设备,用户在与终端设备进行人机交互的过程中产生用户行为数据。
示例性的,终端设备可以是手机、平板电脑、桌面型、膝上型、手持计算机、笔记本电脑、超级移动个人计算机(ultra-mobile personal computer,UMPC)、上网本,以及蜂窝电话、个人数字助理(personal digital assistant,PDA)、增强现实(augmented reality,AR)\虚拟现实(virtual reality,VR)设备等。本申请实施例对该终端设备200的具体形态不作特殊限制。其可以与用户通过键盘、触摸板、触摸屏、遥控器、语音交互或手写设备等一种或多种方式进行人机交互。
需要说明的,本申请实施例描述的***架构是为了更加清楚的说明本申请实施例的技术方案,并不构成对于本申请实施例提供的技术方案的限定,本领域普通技术人员可知,随着***架构的演变,本申请实施例提供的技术方案对于类似的技术问题,同样适用。
下面结合说明书附图,对本申请提供的实施例进行具体介绍。
如图2所示,本申请实施例提供了一种活跃度确定方法流程图一,该方法应用于图1所示的服务器,该方法包括:
S101、获取第一预设时间段内目标应用的用户行为数据和用户属性数据。
其中,第一预设时间段是针对不同的业务需求,分析人员自行设定的时间区间。示例性的,第一预设时间段可以为一天、一周或者一个月等,本申请实施例对此不进行限定。
目标应用可以是应用程序(application,APP),网页或者小程序等,例如,微信、QQ、微博、美团等,本申请实施例对此不进行限定。
需要说明的是,本申请实施例中的“目标应用的用户行为数据”指的是使用目标应用的用户产生的用户行为数据,“目标应用的用户属性数据”指的是使用目标应用的用户对应的用户属性数据。
可以理解的是,由于用户的需求在不断的变化,以及不同用户对目标应用的认可程度可能不高(认可程度较低的用户可能使用一段时间后会停止使用目标应用,该用户流失),因此,在不同的预设时间段内,目标应用的用户可能不相同。
在一些实施例中,上述用户行为数据为能够反映用户活跃情况的行为数据。示例性的,能够反映用户活跃情况的行为可以包括以下至少一项:登录,页面浏览,点击行为,注册行为,关注行为,收藏行为等。
示例性的,用户行为数据可以表示为以下表1所示的形式:
表1
数据日期 用户id 业务 最近一次操作日期 总操作次数
2023-1-21 AE1256 登录 2023-1-21 1357
2023-1-21 AE1312 登录 2023-1-21 3145
2023-1-21 AB1122 浏览页面A 2023-1-20 2478
2022-12-15 AB1122 点击控件F 2022-5-10 123
从表1中可以看出,用户行为数据可以包括用户行为发生的时间以及次数等,如此,可以根据用户行为数据来确定用户在某一段时间的活跃情况。可以理解的是,可以根据以上表1对全部或部分用户行为进行记录,进行根据用户需求进行更新和调整。
在一些实施例中,用户属性数据为能够反映用户基本信息的数据。示例性的,用户属性数据可以包括以下至少一项:性别、年龄、手机型号、省份、行业、渠道来源等。
S102、根据目标应用的用户行为数据和用户属性数据聚类得到活跃频次阈值N。
其中,N为大于或等于1的整数。
示例性的,步骤S102可以实现为K均值(k-means clustering algorithm,K-Means)聚类算法,根据目标应用的用户行为数据和用户属性数据,聚类得到活跃频次阈值N。可以理解的是,聚类是将一组N个样本的特征矩阵划分为K个无交集的簇(直观上看来,簇是一组聚集在一起的数据),每个簇中的数据可以认为是同一类数据。簇就是聚类的结果表现。在K-Means算法中,簇的个数K是一个超参数,K-Means的核心任务就是根据设定好的K,找出K个最优质的质心。
在一些实施例中,上述步骤S102具体实现步骤为:
步骤a1、根据目标应用的用户行为数据,确定目标应用的用户在k个时间单元的每一个时间单元的活跃情况。
其中,k为大于或等于1的整数。
时间单元是根据业务需求设定的,示例性的,一个时间单元的长度可以为日、周、月等,本申请实施例对此不进行限定。
示例性的,活跃情况包括:活跃和不活跃。
示例性的,若目标应用的用户在时间单元1中产生了行为数据(例如,用户有登录、浏览、点赞等行为),则确定目标应用的用户在时间单元1处于活跃状态;若目标应用的用户在时间单元1中未产生行为数据,则确定目标应用的用户在时间单元1未处于活跃状态,即不活跃。
步骤a2、由目标应用的用户在每一个时间单元的活跃情况和每一个时间单元中的用户属性数据,构成数据对象集合。
在一些实施例中,目标应用可以包括多个用户,将一个用户在一个时间单元的活跃情况,与该用户的用户属性数据作为一个数据对象。由多个用户在每一个时间单元的活跃情况,与该多个用户的用户属性数据,得到的多个数据对象构成数据对象集合。
示例性的,用户1在时间单元1的活跃情况,与用户1的用户属性数据可以作为一个数据对象。
步骤a3、确定数据对象集合的P个聚类中心。
其中,P为大于或等于1的整数。
作为一种可能的实现方式,可以基于Python语言的机器学习工具(Scikit-Learn,Sklearn)中的随机数种子(random_state)参数来确定聚类中心。其中,random_state参数可以保证每次生成迭代生成的初始质心都在相同位置。示例性的,可以通过绘制学习曲线的方式来确定最优的random_state参数。
作为另一种可能的实现方式,还可以基于Sklearn中的参数n_init(n_init用于表征每个随机数种子对应的运行的次数)来确定聚类中心来确定聚类中心。
作为另一种可能的实现方式,还可以基于Sklearn中k-means++算法来确定聚类中心。
步骤a4、分别计算数据对象集合中的每一个数据对象与P个聚类中心之间的相似度。
其中,相似度计算函数包括以下至少之一:余弦距离、欧式距离、明可夫斯基距离和曼哈顿距离。
步骤a5、根据数据对象集合中的每一个数据对象与P个聚类中心之间的相似度,获得至少一个聚类簇;其中,一个聚类簇对应活跃频次阈值N的一个取值。
示例性的,以P个聚类中心中的聚类中心1为例,由数据对象集合中与聚类中心1之间的相似度大于或等于预设阈值的数据对象,构成聚类中心1的聚类簇。
示例性的,可以根据聚类簇中的每一个数据对象确定活跃频次阈值N的一个取值。
S103、根据活跃频次阈值N和目标应用的用户行为数据,对目标应用的用户进行活跃度划分。
在一些实施例中,如图3所示一种活跃度确定方法流程图二,上述步骤S103可以实现为以下步骤:
S1031、将第一预设时间段划分多个时间单元。
示例性的,一个时间单元的长度可以为日、周、月等。
示例性的,假设第一预设时间段为1个月(31天),时间单元的长度为日,则第一预设时间段可以划分为31个时间单元。
S1032、根据目标应用的用户行为数据,确定目标应用的用户在多个时间单元的活跃情况。
其中,活跃情况包括活跃或和不活跃。
示例性的,若目标应用的用户在时间单元1中产生了行为数据(例如,用户有登录、浏览、点赞等行为),则确定目标应用的用户在时间单元1处于活跃状态;若目标应用的用户在时间单元1中未产生行为数据,则确定目标应用的用户在时间单元1未处于活跃状态,即不活跃。
S1033、根据目标应用的用户在多个时间单元的活跃情况,和活跃频次阈值N,对目标应用的用户进行活跃度划分。
在一些实施例中,上述步骤S1033可以实现为以下步骤:
步骤b1、将目标应用的用户中,满足第一条件的用户确定为第一活跃度用户。其中,第一条件为用户在第一时间单元处于活跃状态,且包括第一时间单元在内的连续N个时间单元均处于活跃状态;第一时间单元为多个时间单元中结束时刻最晚的时间单元。
步骤b2、将目标应用的用户中,满足第二条件的用户确定为第二活跃度用户。其中,第二条件为用户在第一时间单元处于活跃状态,但在包括第一时间单元在内的连续N个时间单元中,处于活跃的时间单元的个数小于N。
步骤b3、将目标应用的用户中,满足第三条件的用户确定为第三活跃度用户。其中,第三条件为用户在第一时间单元未处于活跃状态,但在第一时间单元之前的连续N个时间单元中,处于活跃的时间单元的个数小于N。
在一些实施例中,根据第一活跃度用户和第二活跃度用户的用户数据,分析目标应用的***。
其中,***可划分为高价值***和低价值***。
具体的,高价值***是未曾活跃过的用户,但其属性和重度活跃用户或普通活跃用户相似。
低价值***是未曾活跃过的用户,其属性和重度活跃用户差距较大。
在一些实施例中,上述步骤S1033还可以实现为以下步骤:
步骤c1、将目标应用的用户中,满足第四条件的用户确定为回流用户。其中,第四条件为用户在第一时间单元处于活跃状态,且第一时间单元距离上一次处于活跃状态的时间单元相隔M个时间单元;第一时间单元为多个时间单元中结束时刻最晚的时间单元;M为大于或等于N的整数。
步骤c2、将目标应用的用户中,满足第五条件的用户确定为新增活跃用户。其中,第五条件为用户在第一时间单元处于活跃状态,但在第一时间单元之前的时间单元中均未处于活跃状态。
步骤c3、将目标应用的用户中,满足第六条件的用户确定为流失用户。其中,第六条件为在用户在包括第一时间单元在内的连续N个时间单元均未处于活跃状态。
为便于理解,下面以示例的形式对本申请实施例提供的活跃度确定方法进行说明。
示例性的,假设单位时间的长度为周,第一预设时间段可以划分为8周,活跃频次阈值N为4。则如图4所示,目标应用的用户可以划分为以下类别:
第一活跃度用户:当前周活跃,且包括当前周在内的连续4周活跃的用户。其中,当前周为第一预设时间段中结束时间最晚的一周。
第二活跃度用户:当前周活跃,且包括当前周在内的连续4周中处于活跃状态的周数小于4的用户。
第三活跃度用户:当前周不活跃,且包括当前周在内的连续4周中处于活跃状态的周数小于4的用户。
新增用户:当前周活跃,且在当前周之前的周中均未处于活跃状态的用户。
回流用户:当前周活跃,且包括当前周在内的连续4周中不活跃,但历史上活跃过的用户。
流失用户:当前周不活跃,且包括当前周在内的连续4周中不活跃的用户。
***:未曾活跃过,且其属性于第一活跃度用户和第二活跃度用户相关的用户。
在一些实施例中,上述方法还包括:确定用户活跃度的波动情况。示例性的,可以实现为以下步骤:
步骤d1、获取第二预设时间段内目标应用的用户的活跃度划分情况;其中,第二预设时间段早于第一预设时间段。
步骤d2、基于第二预设时间段内目标应用的用户的活跃度划分情况与第一预设时间段内目标应用的用户的活跃度划分情况,确定目标应用的用户活跃度的波动情况。
示例性的,假设目标应用为微信,若第二预设时间段内微信用户中第一活跃度用户为30人,第一预设时间段内微信用户中第一活跃度用户为20人,则确定发生波动的类别为第一活跃度用户;发生波动的对象为从第一活跃度用户中流失的10个人。因此,本申请实施例提供的方法可以精准的确定发生波动的对象,然后针对发生波动的对象分析波动原因,从而精准的确定下一步运营策略。
在一些实施例中,上述方法还包括:对目标应用的用户活跃度的波动情况进行分析,确定波动原因。示例性的,首先通过分析用户活跃度的波动情况,快速定位到波动幅度较大的几类用户,进而对影响这类用户产生波动的因素进行多维度的分析。示例性的,这些维度可以包括:用户性别、年龄、手机型号、省份、时间节假日、行业、渠道来源等。
示例性的,如图5所示,假设波动幅度较大的用户包括:第一类活跃度用户、新增活跃用户以及流失用户。其中,第一类活跃度用户人数下降50%,引起下降的原因之一是相关行业的业务下降,该原因占总下降原因的80%。新增活跃用户人数下降20%,引起下降的原因中,广告下降占比为10%,占比最重。流失用户增长5%,引起增长的原因中,使用安卓手机的用户流失占总流失的3%。
可以看出,上述主要从方法的角度对本申请实施例提供的方案进行了介绍。为了实现上述功能,本申请实施例提供了执行各个功能相应的硬件结构和/或软件模块。本领域技术人员应该很容易意识到,结合本文中所公开的实施例描述的各示例的模块及算法步骤,本申请实施例能够以硬件或硬件和计算机软件的结合形式来实现。某个功能究竟以硬件还是计算机软件驱动硬件的方式来执行,取决于技术方案的特定应用和设计约束条件。专业技术人员可以对每个特定的应用来使用不同方法来实现所描述的功能,但是这种实现不应认为超出本发明的范围。
本申请实施例可以根据上述方法示例对网络节点进行功能模块的划分,例如,可以对应各个功能划分各个功能模块,也可以将两个或两个以上的功能集成在一个处理模块中。上述集成的模块既可以采用硬件的形式实现,也可以采用软件功能模块的形式实现。可选的,本申请实施例中对模块的划分是示意性的,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式。
如图6所示,为本申请实施例提供的一种活跃度确定装置的结构示意图。图6所示装置中各模块具有实现图2中各个步骤的功能,并能达到其相应技术效果。如图6所示,该活跃度确定装置600可以包括:获取模块601、聚类模块602和确定模块603。
获取模块601,用于获取第一预设时间段内目标应用的用户行为数据和用户属性数据。
聚类模块602,用于根据目标应用的用户行为数据,确定目标应用的用户在k个时间单元的活跃情况。其中,k为大于或等于1的整数。
确定模块603,用于根据活跃频次阈值N和目标应用的用户行为数据,对目标应用的用户进行活跃度划分。
在一些实施例中,确定模块603,具体用于将预设时间段划分多个时间单元;根据目标应用的用户行为数据,确定目标应用的用户在多个时间单元的活跃情况;其中,活跃情况包括活跃或不活跃;根据目标应用的用户在多个时间单元的活跃情况,和活跃频次阈值N,对目标应用的用户进行活跃度划分。
在一些实施例中,确定模块603,具体用于将目标应用的用户中,满足第一条件的用户划分为第一活跃度用户;其中,第一条件为用户在第一时间单元处于活跃状态,且包括第一时间单元在内的连续N个时间单元均处于活跃状态;第一时间单元为多个时间单元中结束时刻最晚的时间单元;将目标应用的用户中,满足第二条件的用户划分为第二活跃度用户;其中,第二条件为用户在第一时间单元处于活跃状态,但在包括第一时间单元在内的连续N个时间单元中,处于活跃状态的时间单元的个数小于N;将目标应用的用户中,满足第三条件的用户划分为第三活跃度用户;其中,第三条件为用户在第一时间单元未处于活跃状态,但在第一时间单元之前的连续N个时间单元中,处于活跃状态的时间单元的个数小于N。
在一些实施例中,确定模块603,还用于根据第一活跃度用户和第二活跃度用户的用户数据,分析目标应用的***。
在一些实施例中,确定模块603,具体用于将目标应用的用户中,满足第四条件的用户划分为回流用户;其中,第四条件为用户在第一时间单元处于活跃状态,且第一时间单元距离上一次处于活跃状态的时间单元相隔M个时间单元;第一时间单元为多个时间单元中结束时刻最晚的时间单元;M为大于或等于N的整数;将目标应用的用户中,满足第五条件的用户划分为新增用户;其中,第五条件为用户在第一时间单元处于活跃状态,但在第一时间单元之前的时间单元中均未处于活跃状态;将目标应用的用户中,满足第六条件的用户划分为流失用户;其中,第六条件为在用户在包括第一时间单元在内的连续N个时间单元均未处于活跃状态。
在一些实施例中,聚类模块603,具体用于根据目标应用的用户行为数据,确定目标应用的用户在k个时间单元的活跃情况;其中,k为大于或等于1的整数;由目标应用的用户在k个时间单元的活跃情况和第一时间单元中的用户的属性数据,构成数据对象集合;确定数据对象集合的P个聚类中心;P为大于或等于1的整数;分别计算数据对象集合中的每一个数据对象与P个聚类中心之间的相似度;根据数据对象集合中的每一个数据对象与P个聚类中心之间的相似度,获得至少一个聚类簇;其中,一个聚类簇对应活跃频次阈值N的一个取值。
在一些实施例中,获取模块601,还用于获取第二预设时间段内目标应用的用户活跃度划分情况;其中,第二预设时间段早于第一预设时间段;确定模块603,还用于基于第二预设时间段内目标应用的用户的活跃度划分情况与第一预设时间段内目标应用的用户的活跃度划分情况,确定目标应用的用户的活跃度的波动情况。
在采用硬件的形式实现上述集成的模块的功能的情况下,本发明实施例提供了上述实施例中所涉及的一种活跃度确定装置的另一种可能的结构示意图。如图7所示,该活跃度确定装置700包括:处理器702,通信接口703,总线704。可选的,该活跃度确定装置700还可以包括存储器701。
处理器702,可以是实现或执行结合本申请公开内容所描述的各种示例性的逻辑方框,模块和电路。该处理器702可以是中央处理器,通用处理器,数字信号处理器,专用集成电路,现场可编程门阵列或者其他可编程逻辑器件、晶体管逻辑器件、硬件部件或者其任意组合。其可以实现或执行结合本申请公开内容所描述的各种示例性的逻辑方框,模块和电路。处理器702也可以是实现计算功能的组合,例如包含一个或多个微处理器组合,DSP和微处理器的组合等。
通信接口703,用于与其他设备通过通信网络连接。该通信网络可以是以太网,无线接入网,无线局域网(wireless local area networks,WLAN)等。
存储器701,可以是只读存储器(read-only memory,ROM)或可存储静态信息和指令的其他类型的静态存储设备,随机存取存储器(random access memory,RAM)或者可存储信息和指令的其他类型的动态存储设备,也可以是电可擦可编程只读存储器(electrically erasable programmable read-only memory,EEPROM)、磁盘存储介质或者其他磁存储设备、或者能够用于携带或存储具有指令或数据结构形式的期望的程序代码并能够由计算机存取的任何其他介质,但不限于此。
作为一种可能的实现方式,存储器701可以独立于处理器702存在,存储器701可以通过总线704与处理器702相连接,用于存储指令或者程序代码。处理器702调用并执行存储器701中存储的指令或程序代码时,能够实现本发明实施例提供的活跃度确定方法。
另一种可能的实现方式中,存储器701也可以和处理器702集成在一起。
总线704,可以是扩展工业标准结构(extended industry standardarchitecture,EISA)总线等。总线704可以分为地址总线、数据总线、控制总线等。为便于表示,图7中仅用一条粗线表示,但并不表示仅有一根总线或一种类型的总线。
通过以上的实施方式的描述,所属领域的技术人员可以清楚地了解到,为描述的方便和简洁,仅以上述各功能模块的划分进行举例说明,实际应用中,可以根据需要而将上述功能分配由不同的功能模块完成,即将活跃度确定装置的内部结构划分成不同的功能模块,以完成以上描述的全部或者部分功能。
本申请实施例还提供了一种计算机可读存储介质。上述方法实施例中的全部或者部分流程可以由计算机指令来指示相关的硬件完成,该程序可存储于上述计算机可读存储介质中,该程序在执行时,可包括如上述各方法实施例的流程。计算机可读存储介质可以是前述任一实施例的或内存。上述计算机可读存储介质也可以是上述活跃度确定装置的外部存储设备,例如上述活跃度确定装置上配备的插接式硬盘,智能存储卡(smart mediacard,SMC),安全数字(secure digital,SD)卡,闪存卡(flash card)等。进一步地,上述计算机可读存储介质还可以既包括上述活跃度确定装置的内部存储单元也包括外部存储设备。上述计算机可读存储介质用于存储上述计算机程序以及上述活跃度确定装置所需的其他程序和数据。上述计算机可读存储介质还可以用于暂时地存储已经输出或者将要输出的数据。
本申请实施例还提供一种计算机程序产品,该计算机产品包含计算机程序,当该计算机程序产品在计算机上运行时,使得该计算机执行上述实施例中所提供的任一项活跃度确定方法。
以上所述,仅为本申请的具体实施方式,但本申请的保护范围并不局限于此,任何在本申请揭露的技术范围内的变化或替换,都应涵盖在本申请的保护范围之内。因此,本申请的保护范围应该以权利要求的保护范围为准。

Claims (10)

1.一种活跃度确定方法,其特征在于,包括:
获取第一预设时间段内目标应用的用户行为数据和用户属性数据;
根据所述目标应用的用户行为数据和用户属性数据聚类得到活跃频次阈值N;所述N为大于或等于1的整数;
根据所述活跃频次阈值N和所述目标应用的用户行为数据,对所述目标应用的用户进行活跃度划分。
2.根据权利要求1所述的方法,其特征在于,所述根据所述活跃频次阈值N和所述目标应用的用户行为数据,对所述目标应用的用户进行活跃度划分,包括:
将所述预设时间段划分多个时间单元;
根据所述目标应用的用户行为数据,确定所述目标应用的用户在所述多个时间单元的活跃情况;其中,所述活跃情况包括活跃或不活跃;
根据所述目标应用的用户在所述多个时间单元的活跃情况,和所述活跃频次阈值N,对所述目标应用的用户进行活跃度划分。
3.根据权利要求2所述的方法,其特征在于,所述根据所述目标应用的用户在所述多个时间单元的活跃情况,和所述活跃频次阈值N,对所述目标应用的用户进行活跃度划分,包括:
将所述目标应用的用户中,满足第一条件的用户划分为第一活跃度用户;其中,所述第一条件为用户在第一时间单元处于活跃状态,且包括所述第一时间单元在内的连续N个时间单元均处于活跃状态;所述第一时间单元为所述多个时间单元中结束时刻最晚的时间单元;
将所述目标应用的用户中,满足第二条件的用户划分为第二活跃度用户;其中,所述第二条件为用户在所述第一时间单元处于活跃状态,但在包括所述第一时间单元在内的连续N个时间单元中,处于活跃的时间单元的个数小于N;
将所述目标应用的用户中,满足第三条件的用户划分为第三活跃度用户;其中,所述第三条件为用户在所述第一时间单元未处于活跃状态,但在所述第一时间单元之前的连续N个时间单元中,处于活跃的时间单元的个数小于N。
4.根据权利要求3所述的方法,其特征在于,所述方法还包括:根据所述第一活跃度用户和所述第二活跃度用户的用户数据,分析所述目标应用的***。
5.根据权利要求2所述的方法,其特征在于,所述根据所述目标应用的用户在所述多个时间单元的活跃情况,和所述活跃频次阈值N,对所述目标应用的用户进行活跃度划分,包括:
将所述目标应用的用户中,满足第四条件的用户划分为回流用户;其中,所述第四条件为用户在第一时间单元处于活跃状态,且所述第一时间单元距离上一次处于活跃状态的时间单元相隔M个时间单元;所述第一时间单元为所述多个时间单元中结束时刻最晚的时间单元;所述M为大于或等于N的整数;
将所述目标应用的用户中,满足第五条件的用户划分为新增用户;其中,所述第五条件为用户在所述第一时间单元处于活跃状态,但在所述第一时间单元之前的时间单元中均未处于活跃状态;
将所述目标应用的用户中,满足第六条件的用户划分为流失用户;其中,所述第六条件为在用户在包括所述第一时间单元在内的连续N个时间单元均未处于活跃状态。
6.根据权利要求1所述的方法,其特征在于,所述根据所述目标应用的用户行为数据和用户属性数据聚类得到活跃频次阈值N,包括:
根据所述目标应用的用户行为数据,确定所述目标应用的用户在k个时间单元的活跃情况;其中,所述k为大于或等于1的整数;
由所述目标应用的用户在k个时间单元的活跃情况和所述第一时间单元中的用户的属性数据,构成数据对象集合;
确定所述数据对象集合的P个聚类中心;所述P为大于或等于1的整数;
分别计算所述数据对象集合中的每一个数据对象与所述P个聚类中心之间的相似度;
根据所述数据对象集合中的每一个数据对象与所述P个聚类中心之间的相似度,获得至少一个聚类簇;其中,一个聚类簇对应所述活跃频次阈值N的一个取值。
7.根据权利要求1所述的方法,其特征在于,所述方法还包括:
获取第二预设时间段内所述目标应用的用户活跃度划分情况;其中,所述第二预设时间段早于所述第一预设时间段;
基于所述第二预设时间段内所述目标应用的用户的活跃度划分情况与所述第一预设时间段内所述目标应用的用户的活跃度划分情况,确定所述目标应用的用户的活跃度的波动情况。
8.一种活跃度确定装置,其特征在于,所述装置包括:
获取模块,用于获取第一预设时间段内目标应用的用户行为数据和用户属性数据;
聚类模块,用于根据所述目标应用的用户行为数据和用户属性数据聚类得到活跃频次阈值N;所述N为大于或等于1的整数;
确定模块,用于根据所述活跃频次阈值N和所述目标应用的用户行为数据,对所述目标应用的用户进行活跃度划分。
9.一种电子设备,其特征在于,包括处理器和存储器,所述处理器与所述存储器耦合;所述存储器用于存储计算机指令,所述计算机指令由所述处理器加载并执行以使计算机设备实现如权利要求1至7中任一项所述的活跃度确定方法。
10.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质包括计算机执行指令,当所述计算机执行指令在计算机上运行时,使得所述计算机执行权利要求1至7任一项所述的活跃度确定方法。
CN202311212216.XA 2023-09-19 2023-09-19 一种活跃度确定方法、装置、电子设备及存储介质 Pending CN117236999A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202311212216.XA CN117236999A (zh) 2023-09-19 2023-09-19 一种活跃度确定方法、装置、电子设备及存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202311212216.XA CN117236999A (zh) 2023-09-19 2023-09-19 一种活跃度确定方法、装置、电子设备及存储介质

Publications (1)

Publication Number Publication Date
CN117236999A true CN117236999A (zh) 2023-12-15

Family

ID=89083958

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202311212216.XA Pending CN117236999A (zh) 2023-09-19 2023-09-19 一种活跃度确定方法、装置、电子设备及存储介质

Country Status (1)

Country Link
CN (1) CN117236999A (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN117729189A (zh) * 2024-02-08 2024-03-19 睿云联(厦门)网络通讯技术有限公司 基于云端分布式活跃度的sip注册限流方法及设备介质

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN117729189A (zh) * 2024-02-08 2024-03-19 睿云联(厦门)网络通讯技术有限公司 基于云端分布式活跃度的sip注册限流方法及设备介质

Similar Documents

Publication Publication Date Title
WO2022126971A1 (zh) 基于密度的文本聚类方法、装置、设备及存储介质
KR101939554B1 (ko) 일시적 거래 한도 결정
CN109634698B (zh) 菜单显示方法、装置、计算机设备及存储介质
CN117236999A (zh) 一种活跃度确定方法、装置、电子设备及存储介质
CN113627566A (zh) 一种网络诈骗的预警方法、装置和计算机设备
CN111598360A (zh) 服务策略确定方法、装置及电子设备
CN114692978A (zh) 一种基于大数据的社交媒体用户行为预测方法及***
CN117422182A (zh) 数据预测方法、装置及存储介质
CN112016797B (zh) 基于knn的资源配额调整方法、装置和电子设备
CN113609409A (zh) 一种推荐浏览信息的方法及其***、电子设备、存储介质
CN113472860A (zh) 大数据和数字化环境下的业务资源分配方法及服务器
CN113052666A (zh) 理财产品推荐方法及装置
WO2018044955A1 (en) Systems and methods for measuring collected content significance
CN112287111A (zh) 一种文本处理方法和相关装置
CN111160614A (zh) 资源转移预测模型的训练方法、装置及计算设备
CN115689708A (zh) 训练数据的筛选方法、风险评估方法、装置、设备和介质
CN113486933B (zh) 模型训练方法、用户身份信息预测方法及装置
CN114268625B (zh) 特征选择方法、装置、设备及存储介质
CN114925275A (zh) 产品推荐方法、装置、计算机设备及存储介质
CN111222739B (zh) 核电站的任务分配方法及核电站的任务分配***
CN109919811B (zh) 基于大数据的保险代理人培养方案生成方法及相关设备
CN114520773A (zh) 一种服务请求的响应方法、装置、服务器及存储介质
CN114363082A (zh) 网络攻击检测方法、装置、设备及计算机可读存储介质
CN115147117A (zh) 资源使用异常的账户群组识别方法、装置及设备
CN112767027A (zh) 一种基于业务感知的云成本预测方法和***

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination