CN109783686A - 行为数据处理方法、装置、终端设备和存储介质 - Google Patents

行为数据处理方法、装置、终端设备和存储介质 Download PDF

Info

Publication number
CN109783686A
CN109783686A CN201910054776.4A CN201910054776A CN109783686A CN 109783686 A CN109783686 A CN 109783686A CN 201910054776 A CN201910054776 A CN 201910054776A CN 109783686 A CN109783686 A CN 109783686A
Authority
CN
China
Prior art keywords
data
user
goal behavior
prediction
predicted
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201910054776.4A
Other languages
English (en)
Inventor
林永傍
廖卓杰
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Guangzhou Huya Information Technology Co Ltd
Original Assignee
Guangzhou Huya Information Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Guangzhou Huya Information Technology Co Ltd filed Critical Guangzhou Huya Information Technology Co Ltd
Priority to CN201910054776.4A priority Critical patent/CN109783686A/zh
Publication of CN109783686A publication Critical patent/CN109783686A/zh
Pending legal-status Critical Current

Links

Landscapes

  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本申请实施例公开了一种行为数据处理方法、装置、终端设备和存储介质,该方法包括:获取待预测用户在目标时间区间的用户使用数据;其中,所述待预测用户为直播平台的观众用户,用户使用数据为观众用户在直播平台的使用数据;根据所述待预测用户在目标时间区间的用户使用数据确定目标数据;将所述目标数据输入至目标行为预测模型,以确定预测的目标行为类型。通过上述技术方案可以将用户使用数据输入到目标行为预测模型中,通过目标行为预测模型对用户的目标行为类型进行预测,进而可以根据用户的目标行为类型确定是否向用户进行推送推荐内容,可以提高推送的利用率。

Description

行为数据处理方法、装置、终端设备和存储介质
技术领域
本申请实施例涉及计算机技术,尤其涉及一种行为数据处理方法、装置、终端设备和存储介质。
背景技术
直播一般指的是媒体文件的生成与播出同时进行的播放方式,直播包括在网络直播平台上播放的网络直播,网络直播的用户包括主播和观众。随着直播平台的热度逐渐升高,主播数量与日俱增,直播的节目数量也越来越多。
现有技术中直播平台一般会向用户推送一些特定的推荐内容,而由于各个用户的偏好不同,如果给所有用户都推送相同的推荐内容,会导致推送的利用率低下。
发明内容
本申请实施例提供一种行为数据处理方法、装置、终端设备和存储介质,可以提高推送的利用率。
第一方面,本申请实施例提供了一种行为数据处理方法,包括:
获取待预测用户在目标时间区间的用户使用数据;其中,所述待预测用户为直播平台的观众用户,用户使用数据为观众用户在直播平台的使用数据;
根据所述待预测用户在目标时间区间的用户使用数据确定目标数据;
将所述目标数据输入至目标行为预测模型,以确定预测的目标行为类型,其中,所述目标行为类型为所述待预测用户在预测时间区间内的目标行为数据的类型,目标行为数据为观众用户向主播用户发送目标数据的行为数据。
进一步地,所述将所述目标数据输入至目标行为预测模型,以确定预测的目标行为类型之后,还包括:
将目标行为类型为预设类型的待预测用户确定为目标用户;
确定和所述预设类型对应的推荐内容;
将所述推荐内容推送至所述目标用户。
进一步地,所述获取待预测用户在目标时间区间的用户使用数据之前,还包括:
获取样本用户在第一时间区间的用户使用数据,以及在第二时间区间的目标行为数据,其中,所述样本用户为直播平台的观众用户,用户使用数据为观众用户在直播平台的使用数据,目标行为数据为观众用户向主播用户发送目标数据的行为数据;
根据所述第一时间区间的用户使用数据确定样本数据;
根据所述第二时间区间的目标行为数据确定目标行为类型,并根据所述目标行为类型确定标签数据;
将所述样本数据和所述标签数据输入至预设模型进行训练,得到目标行为预测模型。
进一步地,所述将所述样本数据和所述标签数据输入至预设模型进行训练,得到目标行为预测模型,包括:
通过所述预设模型根据样本数据生成预测数据,其中,所述预设模型为线性回归模型,所述预设模型依据回归系数生成预测数据;
确定根据所述预测数据和标签数据的预测误差;
如果所述预测误差不符合预设条件,则调整所述预设模型的回归系数,并返回执行所述通过所述预设模型根据样本数据生成预测数据的操作;
如果所述预测误差符合预设条件,则将预设模型确定为目标行为预测模型。
进一步地,根据所述第一时间区间的用户使用数据确定样本数据之前,还包括:
对所述用户使用数据进行数据预处理,以清除用户使用数据中的空值和异常值;
将所述数据预处理后的用户使用数据的格式转换为数字类型。
进一步地,根据所述第二时间区间的目标行为数据确定目标行为类型包括:
如果所述第二时间区间的目标行为数据中包括第一目标行为,则确定所述目标行为类型为第一类型;
如果所述第二时间区间的目标行为数据中不包括第一目标行为,则确定所述目标行为类型为第二类型。
进一步地,所述用户使用数据包括人脉关系数据,获取样本用户在第一时间区间的人脉关系数据包括:
确定所述样本用户关联的好友用户;
对于每个好友用户,确定所述好友用户在第一时间区间的目标行为数据;
根据所述第一时间区间的目标行为数据确定所述好友用户的目标行为类型;
将所述好友用户和对应的目标行为类型确定为所述第一时间区间的人脉关系数据。
进一步地,所述用户使用数据包括:用户身份数据、主播互动数据、人脉关系数据和播放记录数据中的至少一个。
第二方面,本申请实施例还提供了另一种行为数据处理装置,包括:
预测数据获取模块,用于获取待预测用户在目标时间区间的用户使用数据;其中,所述待预测用户为直播平台的观众用户,用户使用数据为观众用户在直播平台的使用数据;
目标数据确定模块,用于根据所述待预测用户在目标时间区间的用户使用数据确定目标数据;
行为预测模块,用于将所述目标数据输入至目标行为预测模型,以确定预测的目标行为类型,其中,所述目标行为类型为所述待预测用户在预测时间区间内的目标行为数据的类型,目标行为数据为观众用户向主播用户发送目标数据的行为数据。
第三方面,本申请实施例还提供了一种终端设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述程序时实现本申请任意实施例所述的行为数据处理方法。
第四方面,本申请实施例还提供了一种计算机可读存储介质,其上存储有计算机程序,该程序被处理器执行时实现本申请任意实施例所述的行为数据处理方法。
本申请实施例公开了一种行为数据处理方案,通过获取待预测用户在目标时间区间的用户使用数据;其中,所述待预测用户为直播平台的观众用户,用户使用数据为观众用户在直播平台的使用数据;根据所述待预测用户在目标时间区间的用户使用数据确定目标数据;将所述目标数据输入至目标行为预测模型,以确定预测的目标行为类型。通过上述技术方案可以将用户使用数据输入到目标行为预测模型中,通过目标行为预测模型对用户的目标行为类型进行预测,进而可以根据用户的目标行为类型确定是否向用户进行推送推荐内容,可以提高推送的利用率。
附图说明
图1是本申请实施例一提供的一种行为数据处理方法的流程图;
图2是本申请实施例一提供的另一种行为数据处理方法的流程图;
图3是本申请实施例二提供的一种行为数据处理方法的流程图;
图4是本申请实施例二提供的另一种行为数据处理方法的流程图;
图5是本申请实施例二提供的另一种行为数据处理方法的流程图
图6是本申请实施例三中的另一种行为数据处理装置的结构示意图;
图7是本申请实施例五中的一种终端设备的硬件结构示意图。
具体实施方式
下面结合附图和实施例对本申请作进一步的详细说明。可以理解的是,此处所描述的具体实施例仅仅用于解释本申请,而非对本申请的限定。另外还需要说明的是,为了便于描述,附图中仅示出了与本申请相关的部分而非全部结构。
实施例一
图1为本申请实施例一提供的行为数据处理方法的流程图,该方法可以由行为数据处理装置来执行,其中,该装置可以由软件和/或硬件实现,一般可以集成在硬件平台上,具体包括如下步骤:
S110、获取待预测用户在目标时间区间的用户使用数据;其中,所述待预测用户为直播平台的观众用户,用户使用数据为观众用户在直播平台的使用数据。
其中,直播平台可以是直播应用程序或直播网页端,用户可以通过终端设备进入直播平台,终端设备可以是智能手机、平板电脑或其他具有相应操作***的电子设备。直播平台可以是直播应用程序或直播网页端。
直播平台的用户一般包括观众用户和主播用户,主播用户为直播内容提供的用户,观众用户为观看直播内容的用户。待预测用户可以是直播平台上的任意观众用户。用户使用数据为观众用户在直播平台的使用数据,即观众用户在直播平台所执行的操作的关联数据,可以包括观众用户和直播平台的服务器的交互数据,观众用户在本地用户端的操作数据等。
可选地,所述用户使用数据包括:用户身份数据、主播互动数据、人脉关系数据和播放记录数据中的至少一个。
目标时间区间可以是历史时间里面的预设时间区间,示例性地,可以是过去的一个月,或过去的一个星期。获取目标时间区间内,待预测用户的用户使用数据,通过用户使用数据来预测待预测用户的目标行为类型。
S111、根据所述待预测用户在目标时间区间的用户使用数据确定目标数据。
可以根据目标行为预测模型的数据规则将所述待预测用户在目标时间区间的用户使用数据确定为目标数据,进而可以输入到目标行为预测模型进行处理。
S112、将所述目标数据输入至目标行为预测模型,以确定预测的目标行为类型,其中,所述目标行为类型为所述待预测用户在预测时间区间内的目标行为数据的类型,目标行为数据为观众用户向主播用户发送目标数据的行为数据。
其中,所述目标行为预测模型可以是已经训练好的预设模型,所述预设模型可以是监督型机器学习模型。目标行为预测模型可以根据输入的目标数据,对待预测用户的目标行为数据的类型进行预测。
如果预设模型在训练时所采用的标签数据包括第一类型和第二类型,相应地,目标行为预测模型可以根据输入的目标数据,输出待预测用户的目标行为类型为第一类型的概率,和/或目标行为类型为第一类型的概率,再根据概率确定待预测用户的目标行为类型。具体的目标行为预测模型的工作原理可以参考现有技术,在此不再赘述。
预测时间区间可以是还未发生的预设的时间区间,示例性地,可以是未来的一个月或未来的一个星期,预测时间区间在时间轴上可以和目标时间区间保持连续性,也可以不与目标时间区间保持连续性,但是预测时间区间在时间轴上一般是处于目标时间区间之后。目标行为预测模型即根据已经发生的历史时间里面的用户使用数据来预测出未来的一个时间区间内用户的目标行为数据。
可选地,根据所述待预测用户在目标时间区间的用户使用数据确定目标数据之前,还包括如下操作:
对所述用户使用数据进行数据预处理,以清除用户使用数据中的空值和异常值;将所述数据预处理后的用户使用数据的格式转换为数字类型。
可选地,如图2所示,将所述目标数据输入至目标行为预测模型,以确定预测的目标行为类型之后,还包括如下操作:
S113、将目标行为类型为预设类型的待预测用户确定为目标用户。
S114、确定和所述预设类型对应的推荐内容。
S115、将所述推荐内容推送至所述目标用户。
其中,在确定了待预测用户的目标行为类型之后,即可以对观众用户进行分类。目标行为类型为预设类型则表示该观众用户执行预设类型对应的操作的概率比较大,可以确定和所述预设类型对应的推荐内容,并将所述推荐内容推送给所述目标用户,目标用户可以得到自己感兴趣的推荐内容,而服务器执行推送的利用率也可以提高。
本申请实施例公开了一种行为数据处理方法,通过获取待预测用户在目标时间区间的用户使用数据;其中,所述待预测用户为直播平台的观众用户,用户使用数据为观众用户在直播平台的使用数据;根据所述待预测用户在目标时间区间的用户使用数据确定目标数据;将所述目标数据输入至目标行为预测模型,以确定预测的目标行为类型,其中,所述目标行为类型为所述待预测用户在预测时间区间内的目标行为数据的类型,目标行为数据为观众用户向主播用户发送目标数据的行为数据。通过上述技术方案可以获取用户在目标时间区间的用户使用数据,并根据目标行为预测模型对用户的目标行为类型进行预测,进而可以根据用户的目标行为类型确定是否向用户进行推送推荐内容,可以提高推送的利用率。
实施例二
图3为本申请实施例二提供的行为数据处理方法的流程图,该方法可以由行为数据处理装置来执行,其中,该装置可以由软件和/或硬件实现,一般可以集成在硬件平台上,在上述实施例的基础上,该方法包括如下步骤:
S120、获取样本用户在第一时间区间的用户使用数据,以及在第二时间区间的目标行为数据,其中,所述样本用户为直播平台的观众用户,用户使用数据为观众用户在直播平台的使用数据,目标行为数据为观众用户向主播用户发送目标数据的行为数据。
其中,直播平台可以是直播应用程序或直播网页端,用户可以通过终端设备进入直播平台,终端设备可以是智能手机、平板电脑或其他具有相应操作***的电子设备。直播平台可以是直播应用程序或直播网页端。
直播平台的用户一般包括观众用户和主播用户,主播用户为直播内容提供的用户,观众用户为观看直播内容的用户。用户使用数据为观众用户在直播平台的使用数据,即观众用户在直播平台所执行的操作的关联数据,可以包括观众用户和直播平台的服务器的交互数据,观众用户在本地用户端的操作数据等。
目标行为数据为观众用户向主播用户发送目标数据的行为数据,其中,所述目标数据可以对应观众用户和主播用户的互动中的特定操作,示例性地,观众用户在观看主播用户的直播内容时,可以通过发送评论、弹幕和虚拟礼物的形式来和主播用户进行互动,所述目标数据可以是互动数据中的特定的数据,例如,目标数据可以是在观众用户向主播用户发送特定的虚拟礼物。将观众向主播用户发送的目标数据的行为数据确定为目标行为数据,目标行为数据可以包括目标数据、目标数据的发送频率和目标数据的发送时间等,只要能体现用户向主播用户发送目标数据的行为即可。
所述第一时间区间可以是预设的时间区间,示例性地可以是一个月或一个星期,第二时间区间也可以是预设的时间区间。第二时间区间在时间轴上可以和第一时间区间保持连续性,第二时间区间也可以不与第一时间区间保持连续性,但是第二时间区间在时间轴上一般是处于第一时间区间之后。示例性地,第一时间区间是8月1号到8月31号的时间区间,第二时间区间可以是9月1号到9月30号的时间区间,第二时间区间也可以是9月8号到9月14号的时间区间。第一时间区间和第二时间区间的具体时长,以及间隔时长可以根据实际应用的需求进行设置,在此不作限定。
其中,样本用户可以是从直播平台的多个观众用户中随机抽取出来的观众用户,也可以是针对目标特征,抽取包括目标特征的观众用户作为样本用户。
可选地,所述用户使用数据包括:用户身份数据、主播互动数据、人脉关系数据和播放记录数据中的至少一个。
其中,用户身份数据为所述样本用户在直播平台注册的资料数据,可以是用户主动输入的资料数据,也可以是通过数据接口从第三方平台获取的用户的资料数据,示例性地,用户身份数据包括用户输入的用户地区、用户职业、用户联络方式、用户的账号性质等。主播互动数据为所述样本用户在直播间和对应的主播用户的互动数据,可以包括样本用户在直播间向主播用户发送的评论数据、弹幕数据、虚拟礼物数据等。需要说明的是主播互动数据包括了目标行为数据,目标行为数据是属于主播互动数据中的一种。人脉关系数据为样本用户在直播平台上的好友用户数据,播放记录数据为所述样本用户所播放过的直播间的使用记录数据。
S121、根据所述第一时间区间的用户使用数据确定样本数据。
所述样本数据为监督型机器学习模型进行训练时所依据的输入变量。可以根据监督型机器学习模型的训练规则将第一时间区间的用户使用数据确定为样本数据,即将第一时间区间的用户使用数据作为输入数据输入到预设模型中进行训练。
S122、根据所述第二时间区间的目标行为数据确定目标行为类型,并根据所述目标行为类型确定标签数据。
其中,根据观众用户的目标行为数据的不同可以将目标行为数据分为不同的目标行为类型,示例性地,可以根据观众用户向主播用户发送目标数据的行为数据的数量或频率进行分类,将发送数量或频率高于预设数量或预设频率的目标行为数据确定为第一类型,其他的确定为第二类型。所述标签数据为监督型机器学习模型进行训练时所依据的输出变量,将目标行为类型作为标签数据输入到预设模型中进行训练,可以建立第一时间区间的目标行为类型和第二时间区间的用户使用数据之间的映射关系。
可选地,根据所述第二时间区间的目标行为数据确定目标行为类型包括:
如果所述第二时间区间的目标行为数据中包括第一目标行为,则确定所述目标行为类型为第一类型;
如果所述第二时间区间的目标行为数据中不包括第一目标行为,则确定所述目标行为类型为第二类型。
其中,所述第一目标行为可以是用于确定区分观众用户的特定行为,由于观众用户在直播平台上的操作习惯不同,向主播用户发送目标数据的行为也有所不同,可以根据用户的目标行为数据中是否包括第一目标行为来区分观众用户。对于目标行为数据中包括第一目标行为的确定为第一类型,不包括第一目标行为的确定为第二类型,对样本用户标定了标签数据后,将样本用户的用户使用数据和标签数据输入到预设模型进行训练。
S123、将所述样本数据和所述标签数据输入至预设模型进行训练,得到目标行为预测模型。
其中,所述预设模型为监督型机器学习模型,将所述样本数据和标签数据输入至预设模型进行训练,以使预设模型建立样本数据和标签数据之间的映射关系。训练得到的目标行为预测模型可以依据输入的一个观众用户在第一时间区间的用户使用数据预测该观众用户在第二时间区间的目标行为类型。
S124、获取待预测用户在目标时间区间的用户使用数据;其中,所述待预测用户为直播平台的观众用户,用户使用数据为观众用户在直播平台的使用数据。
S125、根据所述待预测用户在目标时间区间的用户使用数据确定目标数据。
S126、将所述目标数据输入至目标行为预测模型,以确定预测的目标行为类型,其中,所述目标行为类型为所述待预测用户在预测时间区间内的目标行为数据的类型,目标行为数据为观众用户向主播用户发送目标数据的行为数据。
上述操作的具体实施方式可以参考上文的相关描述,在此不再赘述。
本申请实施例公开了一种行为数据处理方法,通过获取样本用户在第一时间区间的用户使用数据,以及在第二时间区间的目标行为数据,其中,所述样本用户为直播平台的观众用户,用户使用数据为观众用户在直播平台的使用数据,目标行为数据为观众用户向主播用户发送目标数据的行为数据;根据所述第一时间区间的用户使用数据确定样本数据;根据所述第二时间区间的目标行为数据确定目标行为类型,并根据所述目标行为类型确定标签数据;将所述样本数据和所述标签数据输入至预设模型进行训练,得到目标行为预测模型。通过上述技术方案可以根据样本用户的用户使用数据和目标行为数据训练生成目标行为预测模型,目标行为预测模型建立了用户使用数据和目标行为数据的映射关系,进而可以根据目标行为预测模型对用户的目标行为类型进行预测,进而可以根据用户的目标行为类型确定是否向用户进行推送推荐内容,可以提高推送的利用率。
可选地,如图4所示,所述将所述样本数据和所述标签数据输入至预设模型进行训练,得到目标行为预测模型可以通过如下方式实施:
S1231、通过所述预设模型根据样本数据生成预测数据,其中,所述预设模型为线性回归模型,所述预设模型依据回归系数生成预测数据。
其中,线性回归模型为两个变量之间的映射关系的模型,两个变量包括因变量和自变量,本申请的样本数据可以作为自变量,标签数据可以作为因变量。所述线性回归模型可以是:y=w*x+b,其中x是自变量,y是因变量,w是一组调整参数,b是偏移量,回归系数包括调整参数w和偏移量b。根据调整参数w乘上样本数据,再加上偏移量b计算得到的就是预测数据。
根据样本数据中的不同的特征项,生成对应的预测数据。例如,用户使用数据包括:用户身份数据、主播互动数据、人脉关系数据和播放记录数据中的至少一个。用户身份数据可以作为一个特征项,根据用户身份数据可以生成对应的预测数据,主播互动数据也可以作为一个特征项,根据主播互动数据也可以生成对应的预测数据。而如果用户身份数据中还包括多种数据,例如包括用户的地区数据和用户的年龄数据,可以将用户的地区数据作为特征项,并生成对应的预测数据,以及将用户的年龄数据作为特征项,并生成对应的预测数据。具体的实施方式可以根据实际应用情况中样本数据的特征项的划分来确定。
S1232、确定根据所述预测数据和标签数据的预测误差。
因为最终生成的目标行为预测模型的目的在于建立样本数据和标签数据的映射关系。每个样本数据有对应的标签数据,根据样本数据所生成的预测数据和标签数据的预测误差就表示了预设模型所建立的映射关系的准确性,预测误差越小的则表示预测数据越接近标签数据,相应的预设模型的回归系数也就越准确,预设模型的所建立的映射关系的准确性也就越高。
S1233、如果所述预测误差不符合预设条件,则调整所述预设模型的回归系数,并返回执行所述通过所述预设模型根据样本数据生成预测数据的操作。
S1234、如果所述预测误差符合预设条件,则将预设模型确定为目标行为预测模型。
所述预设条件可以是用于判断预测数据足够接近标签数据的判断条件,示例性地,如果所述预测误差小于预设误差,则可以确定所述预测误差符合预设条件;还可以如果多次计算得到的预测误差均小于预设误差,则确定所述预测误差符合预设条件,具体次数可以根据实际情况进行设置。
如果预测误差不符合预设条件,则表示预测误差和标签数据的差距较大,预设模型的回归系数仍不够准确,需要调整预设模型的回归系数,并返回执行所述通过所述预设模型根据样本数据生成预测数据的操作,再次根据样本数据和标签数据对预设模型进行训练。所述回归系数的调整规则可以根据预设模型的预设规则进行调整,在此不作限定。
直到所述预测误差符合预设条件,则可以确定预设模型的回归系数足够准确,预设模型所建立的映射关系的准确性足够高,如此可以将训练到此的预设模型作为目标行为预测模型。进而可以使用目标行为预测模型来预测用户的目标行为类型。
可选地,如图5所示,所述用户使用数据包括人脉关系数据时,获取样本用户在第一时间区间的人脉关系数据可以通过如下方式实施:
S1201、确定所述样本用户关联的好友用户。
样本用户在直播平台上可以进行社交,所述好友用户为和样本用户建立了直播平台的好友关系的其他用户,好友用户可以是观众用户。
S1202、对于每个好友用户,确定所述好友用户在第一时间区间的目标行为数据。
其他好友用户作为观众用户,在直播平台也会有目标行为数据,而由于好友用户和样本用户之间有好友关系,好友用户执行的向主播用户发送目标数据的行为可能会对样本用户形成影响。
S1203、根据所述第一时间区间的目标行为数据确定所述好友用户的目标行为类型。
S1204、将所述好友用户和对应的目标行为类型确定为所述第一时间区间的人脉关系数据。
在获取了样本用户的好友用户的目标行为数据后,分别再确定好友用户的目标行为类型。再将确定的样本用户的好友用户以及好友用户的目标行为类型作为人脉关系数据输入到预设模型中进行训练。
可选地,根据所述第一时间区间的用户使用数据确定样本数据之前,还包括如下操作:
对所述用户使用数据进行数据预处理,以清除用户使用数据中的空值和异常值;将所述数据预处理后的用户使用数据的格式转换为数字类型。
获取到样本用户的用户使用数据中可能包括空值和异常值,异常值为用户使用数据中与其他值存储较大差异的数据,将空值和异常值进行处理,以便可以提高后续确定样本数据的操作效率。数字类型包括整数类型、浮点数类型和附属类型,获取到的用户使用数据一般是字符串的格式,将用户使用数据的格式转换为数字类型,可以提高后续的运算效率。
实施例三
图6为本申请实施例三提供的一种行为数据处理装置的结构示意图,该装置可以由软件和/或硬件实现,一般可以集成在硬件平台上。如图6所示,所述行为数据处理装置包括:
预测数据获取模块210,用于获取待预测用户在目标时间区间的用户使用数据;其中,所述待预测用户为直播平台的观众用户,用户使用数据为观众用户在直播平台的使用数据;
目标数据确定模块211,用于根据所述待预测用户在目标时间区间的用户使用数据确定目标数据;
行为预测模块212,用于将所述目标数据输入至目标行为预测模型,以确定预测的目标行为类型,其中,所述目标行为类型为所述待预测用户在预测时间区间内的目标行为数据的类型,目标行为数据为观众用户向主播用户发送目标数据的行为数据。
本申请实施例公开了一种行为数据处理装置,通过获取待预测用户在目标时间区间的用户使用数据;其中,所述待预测用户为直播平台的观众用户,用户使用数据为观众用户在直播平台的使用数据;根据所述待预测用户在目标时间区间的用户使用数据确定目标数据;将所述目标数据输入至目标行为预测模型,以确定预测的目标行为类型,其中,所述目标行为类型为所述待预测用户在预测时间区间内的目标行为数据的类型,目标行为数据为观众用户向主播用户发送目标数据的行为数据。通过上述技术方案可以获取用户在目标时间区间的用户使用数据,并根据目标行为预测模型对用户的目标行为类型进行预测,进而可以根据用户的目标行为类型确定是否向用户进行推送推荐内容,可以提高推送的利用率。
可选地,还包括:
目标用户确定模块,用于在将所述目标数据输入至目标行为预测模型,以确定预测的目标行为类型之后,将目标行为类型为预设类型的待预测用户确定为目标用户;
推荐内容确定模块,用于确定和所述预设类型对应的推荐内容;
推送模块,用于将所述推荐内容推送至所述目标用户。
可选地,还包括:
第一数据获取模块,用于在所述获取待预测用户在目标时间区间的用户使用数据之前,获取样本用户在第一时间区间的用户使用数据,以及在第二时间区间的目标行为数据,其中,所述样本用户为直播平台的观众用户,用户使用数据为观众用户在直播平台的使用数据,目标行为数据为观众用户向主播用户发送目标数据的行为数据;
样本数据确定模块,用于根据所述第一时间区间的用户使用数据确定样本数据;
标签数据确定模块,用于根据所述第二时间区间的目标行为数据确定目标行为类型,并根据所述目标行为类型确定标签数据;
模型训练模块,用于将所述样本数据和所述标签数据输入至预设模型进行训练,得到目标行为预测模型。
可选地,所述模型训练模块具体用于:
通过所述预设模型根据样本数据生成预测数据,其中,所述预设模型为线性回归模型,所述预设模型依据回归系数生成预测数据;
确定根据所述预测数据和标签数据的预测误差;
如果所述预测误差不符合预设条件,则调整所述预设模型的回归系数,并返回执行所述通过所述预设模型根据样本数据生成预测数据的操作;
如果所述预测误差符合预设条件,则将预设模型确定为目标行为预测模型。
可选地,还包括:
数据预处理模块,用于在根据所述第一时间区间的用户使用数据确定样本数据之前,对所述用户使用数据进行数据预处理,以清除用户使用数据中的空值和异常值;将所述数据预处理后的用户使用数据的格式转换为数字类型。
可选地,标签数据确定模块具体用于:
如果所述第二时间区间的目标行为数据中包括第一目标行为,则确定所述目标行为类型为第一类型;
如果所述第二时间区间的目标行为数据中不包括第一目标行为,则确定所述目标行为类型为第二类型。
可选地,第一数据获取模块具体用于:
确定所述样本用户关联的好友用户;
对于每个好友用户,确定所述好友用户在第一时间区间的目标行为数据;
根据所述第一时间区间的目标行为数据确定所述好友用户的目标行为类型;
将所述好友用户和对应的目标行为类型确定为所述第一时间区间的人脉关系数据。
可选地,所述用户使用数据包括:用户身份数据、主播互动数据、人脉关系数据和播放记录数据中的至少一个。
实施例四
本申请实施例还提供一种包含计算机可执行指令的存储介质,所述计算机可执行指令在由计算机处理器执行时用于执行行为数据处理方法,该方法包括:
获取待预测用户在目标时间区间的用户使用数据;其中,所述待预测用户为直播平台的观众用户,用户使用数据为观众用户在直播平台的使用数据;
根据所述待预测用户在目标时间区间的用户使用数据确定目标数据;
将所述目标数据输入至目标行为预测模型,以确定预测的目标行为类型,其中,所述目标行为类型为所述待预测用户在预测时间区间内的目标行为数据的类型,目标行为数据为观众用户向主播用户发送目标数据的行为数据。
可选的,该计算机可执行指令在由计算机处理器执行时还可以用于执行本申请任意实施例所提供的行为数据处理方法。
通过以上关于实施方式的描述,所属领域的技术人员可以清楚地了解到,本申请可借助软件及必需的通用硬件来实现,当然也可以通过硬件实现,但很多情况下前者是更佳的实施方式。基于这样的理解,本申请的技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品可以存储在计算机可读存储介质中,如计算机的软盘、只读存储器(Read-Only Memory,ROM)、随机存取存储器(RandomAccess Memory,RAM)、闪存(FLASH)、硬盘或光盘等,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本申请各个实施例所述的方法。
实施例五
如图7所示,为本申请实施例五提供的一种终端设备的硬件结构示意图,如图7所示,该终端设备包括:
一个或多个处理器410,图7中以一个处理器410为例;
存储器420;
所述终端设备还可以包括:输入装置430和输出装置440。
所述终端设备中的处理器410、存储器420、输入装置430和输出装置440可以通过总线或者其他方式连接,图7中以通过总线连接为例。
存储器420作为一种非暂态计算机可读存储介质,可用于存储软件程序、计算机可执行程序以及模块,如本申请实施例中的一种行为数据处理方法对应的程序指令/模块(例如,图5所示的预测数据获取模块210、目标数据确定模块211和行为预测模块212)。处理器410通过运行存储在存储器420中的软件程序、指令以及模块,从而执行终端设备的各种功能应用以及数据处理,即实现上述方法实施例的一种行为数据处理方法。
存储器420可以包括存储程序区和存储数据区,其中,存储程序区可存储操作***、至少一个功能所需要的应用程序;存储数据区可存储根据终端设备的使用所创建的数据等。此外,存储器420可以包括高速随机存取存储器,还可以包括非暂态性存储器,例如至少一个磁盘存储器件、闪存器件、或其他非暂态性固态存储器件。在一些实施例中,存储器420可选包括相对于处理器410远程设置的存储器,这些远程存储器可以通过网络连接至终端设备。上述网络的实例包括但不限于互联网、企业内部网、局域网、移动通信网及其组合。
输入装置430可用于接收输入的数字或字符信息,以及产生与终端设备的用户设置以及功能控制有关的键信号输入。输出装置440可包括显示屏等显示设备。
注意,上述仅为本申请的较佳实施例及所运用技术原理。本领域技术人员会理解,本申请不限于这里所述的特定实施例,对本领域技术人员来说能够进行各种明显的变化、重新调整和替代而不会脱离本申请的保护范围。因此,虽然通过以上实施例对本申请进行了较为详细的说明,但是本申请不仅仅限于以上实施例,在不脱离本申请构思的情况下,还可以包括更多其他等效实施例,而本申请的范围由所附的权利要求范围决定。

Claims (11)

1.一种行为数据处理方法,其特征在于,包括:
获取待预测用户在目标时间区间的用户使用数据;其中,所述待预测用户为直播平台的观众用户,用户使用数据为观众用户在直播平台的使用数据;
根据所述待预测用户在目标时间区间的用户使用数据确定目标数据;
将所述目标数据输入至目标行为预测模型,以确定预测的目标行为类型,其中,所述目标行为类型为所述待预测用户在预测时间区间内的目标行为数据的类型,目标行为数据为观众用户向主播用户发送目标数据的行为数据。
2.根据权利要求1所述的方法,其特征在于,所述将所述目标数据输入至目标行为预测模型,以确定预测的目标行为类型之后,还包括:
将目标行为类型为预设类型的待预测用户确定为目标用户;
确定和所述预设类型对应的推荐内容;
将所述推荐内容推送至所述目标用户。
3.根据权利要求1所述的方法,其特征在于,所述获取待预测用户在目标时间区间的用户使用数据之前,还包括:
获取样本用户在第一时间区间的用户使用数据,以及在第二时间区间的目标行为数据,其中,所述样本用户为直播平台的观众用户;
根据所述第一时间区间的用户使用数据确定样本数据;
根据所述第二时间区间的目标行为数据确定目标行为类型,并根据所述目标行为类型确定标签数据;
将所述样本数据和所述标签数据输入至预设模型进行训练,得到目标行为预测模型。
4.根据权利要求3所述的方法,其特征在于,所述将所述样本数据和所述标签数据输入至预设模型进行训练,得到目标行为预测模型,包括:
通过所述预设模型根据样本数据生成预测数据,其中,所述预设模型为线性回归模型,所述预设模型依据回归系数生成预测数据;
确定根据所述预测数据和标签数据的预测误差;
如果所述预测误差不符合预设条件,则调整所述预设模型的回归系数,并返回执行所述通过所述预设模型根据样本数据生成预测数据的操作;
如果所述预测误差符合预设条件,则将预设模型确定为目标行为预测模型。
5.根据权利要求3所述的方法,其特征在于,根据所述第一时间区间的用户使用数据确定样本数据之前,还包括:
对所述用户使用数据进行数据预处理,以清除用户使用数据中的空值和异常值;
将所述数据预处理后的用户使用数据的格式转换为数字类型。
6.根据权利要求3所述的方法,其特征在于,根据所述第二时间区间的目标行为数据确定目标行为类型包括:
如果所述第二时间区间的目标行为数据中包括第一目标行为,则确定所述目标行为类型为第一类型;
如果所述第二时间区间的目标行为数据中不包括第一目标行为,则确定所述目标行为类型为第二类型。
7.根据权利要求3-6任一项所述的方法,其特征在于,所述用户使用数据包括人脉关系数据,获取样本用户在第一时间区间的人脉关系数据包括:
确定所述样本用户关联的好友用户;
对于每个好友用户,确定所述好友用户在第一时间区间的目标行为数据;
根据所述第一时间区间的目标行为数据确定所述好友用户的目标行为类型;
将所述好友用户和对应的目标行为类型确定为所述第一时间区间的人脉关系数据。
8.根据权利要求1-6任一项所述的方法,其特征在于,所述用户使用数据包括:用户身份数据、主播互动数据、人脉关系数据和播放记录数据中的至少一个。
9.一种行为数据处理装置,其特征在于,包括:
预测数据获取模块,用于获取待预测用户在目标时间区间的用户使用数据;其中,所述待预测用户为直播平台的观众用户,用户使用数据为观众用户在直播平台的使用数据;
目标数据确定模块,用于根据所述待预测用户在目标时间区间的用户使用数据确定目标数据;
行为预测模块,用于将所述目标数据输入至目标行为预测模型,以确定预测的目标行为类型,其中,所述目标行为类型为所述待预测用户在预测时间区间内的目标行为数据的类型,目标行为数据为观众用户向主播用户发送目标数据的行为数据。
10.一种终端设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,其特征在于,所述处理器执行所述程序时实现如权利要求1-8所述的行为数据处理方法。
11.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,该程序被处理器执行时实现如权利要求1-8所述的行为数据处理方法。
CN201910054776.4A 2019-01-21 2019-01-21 行为数据处理方法、装置、终端设备和存储介质 Pending CN109783686A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201910054776.4A CN109783686A (zh) 2019-01-21 2019-01-21 行为数据处理方法、装置、终端设备和存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201910054776.4A CN109783686A (zh) 2019-01-21 2019-01-21 行为数据处理方法、装置、终端设备和存储介质

Publications (1)

Publication Number Publication Date
CN109783686A true CN109783686A (zh) 2019-05-21

Family

ID=66501792

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201910054776.4A Pending CN109783686A (zh) 2019-01-21 2019-01-21 行为数据处理方法、装置、终端设备和存储介质

Country Status (1)

Country Link
CN (1) CN109783686A (zh)

Cited By (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110502015A (zh) * 2019-08-29 2019-11-26 南京智慧光信息科技研究院有限公司 基于大数据和人工智能的速度控制方法和机器人***
CN111031362A (zh) * 2019-11-13 2020-04-17 广州荔支网络技术有限公司 一种声音直播用户的年龄预测方法
CN111711828A (zh) * 2020-05-18 2020-09-25 北京字节跳动网络技术有限公司 一种信息处理方法、装置和电子设备
CN112150177A (zh) * 2019-06-27 2020-12-29 百度在线网络技术(北京)有限公司 意图预测方法和装置
CN112418896A (zh) * 2019-08-20 2021-02-26 北京国双科技有限公司 数据挖掘方法,装置、存储介质及电子设备
CN112749332A (zh) * 2020-07-10 2021-05-04 腾讯科技(深圳)有限公司 数据处理方法、装置以及计算机可读介质
CN112836874A (zh) * 2021-02-02 2021-05-25 北京嘀嘀无限科技发展有限公司 行为预测方法、装置、电子设备、存储介质和程序产品
CN112990284A (zh) * 2021-03-04 2021-06-18 安徽大学 一种基于XGBoost算法的个体出行行为预测方法、***及终端
CN113542779A (zh) * 2021-06-04 2021-10-22 广州虎牙科技有限公司 用户数据的预测方法、计算机设备及存储装置
CN113965805A (zh) * 2021-10-22 2022-01-21 北京达佳互联信息技术有限公司 预测模型的训练方法及装置和目标视频剪辑方法及装置
CN116828265A (zh) * 2023-08-28 2023-09-29 湖南快乐阳光互动娱乐传媒有限公司 一种视频控制方法、***、电子设备及可读存储介质

Citations (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103514369A (zh) * 2013-09-18 2014-01-15 上海交通大学 一种基于主动学习的回归分析***及方法
CN103714130A (zh) * 2013-12-12 2014-04-09 深圳先进技术研究院 视频推荐***及方法
CN106021609A (zh) * 2016-06-24 2016-10-12 武汉斗鱼网络科技有限公司 一种实现网站视频智能推荐的方法及装置
CN107608990A (zh) * 2016-07-12 2018-01-19 上海视畅信息科技有限公司 一种直播个性化推荐方法
CN107666540A (zh) * 2017-10-17 2018-02-06 北京小米移动软件有限公司 终端控制方法、装置及存储介质
US20180060363A1 (en) * 2016-08-30 2018-03-01 Salesforce.Com, Inc. Rate limiting in a moderation framework of a database system
EP3320454A1 (en) * 2015-08-11 2018-05-16 Piksel, Inc. Metadata of partial content
CN108090107A (zh) * 2017-05-22 2018-05-29 北京市商汤科技开发有限公司 业务对象推荐方法、装置、电子设备和存储介质
CN108121795A (zh) * 2017-12-20 2018-06-05 北京奇虎科技有限公司 用户行为预测方法及装置
CN108388629A (zh) * 2018-02-13 2018-08-10 北京奇虎科技有限公司 一种多媒体信息推送方法、装置及电子设备

Patent Citations (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103514369A (zh) * 2013-09-18 2014-01-15 上海交通大学 一种基于主动学习的回归分析***及方法
CN103714130A (zh) * 2013-12-12 2014-04-09 深圳先进技术研究院 视频推荐***及方法
EP3320454A1 (en) * 2015-08-11 2018-05-16 Piksel, Inc. Metadata of partial content
CN106021609A (zh) * 2016-06-24 2016-10-12 武汉斗鱼网络科技有限公司 一种实现网站视频智能推荐的方法及装置
CN107608990A (zh) * 2016-07-12 2018-01-19 上海视畅信息科技有限公司 一种直播个性化推荐方法
US20180060363A1 (en) * 2016-08-30 2018-03-01 Salesforce.Com, Inc. Rate limiting in a moderation framework of a database system
CN108090107A (zh) * 2017-05-22 2018-05-29 北京市商汤科技开发有限公司 业务对象推荐方法、装置、电子设备和存储介质
CN107666540A (zh) * 2017-10-17 2018-02-06 北京小米移动软件有限公司 终端控制方法、装置及存储介质
CN108121795A (zh) * 2017-12-20 2018-06-05 北京奇虎科技有限公司 用户行为预测方法及装置
CN108388629A (zh) * 2018-02-13 2018-08-10 北京奇虎科技有限公司 一种多媒体信息推送方法、装置及电子设备

Cited By (17)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112150177A (zh) * 2019-06-27 2020-12-29 百度在线网络技术(北京)有限公司 意图预测方法和装置
CN112418896A (zh) * 2019-08-20 2021-02-26 北京国双科技有限公司 数据挖掘方法,装置、存储介质及电子设备
CN110502015A (zh) * 2019-08-29 2019-11-26 南京智慧光信息科技研究院有限公司 基于大数据和人工智能的速度控制方法和机器人***
CN111031362B (zh) * 2019-11-13 2022-01-25 广州荔支网络技术有限公司 一种声音直播用户的年龄预测方法
CN111031362A (zh) * 2019-11-13 2020-04-17 广州荔支网络技术有限公司 一种声音直播用户的年龄预测方法
CN111711828A (zh) * 2020-05-18 2020-09-25 北京字节跳动网络技术有限公司 一种信息处理方法、装置和电子设备
CN111711828B (zh) * 2020-05-18 2022-04-05 北京字节跳动网络技术有限公司 一种信息处理方法、装置和电子设备
CN112749332A (zh) * 2020-07-10 2021-05-04 腾讯科技(深圳)有限公司 数据处理方法、装置以及计算机可读介质
CN112749332B (zh) * 2020-07-10 2023-12-15 腾讯科技(深圳)有限公司 数据处理方法、装置以及计算机可读介质
CN112836874A (zh) * 2021-02-02 2021-05-25 北京嘀嘀无限科技发展有限公司 行为预测方法、装置、电子设备、存储介质和程序产品
CN112990284B (zh) * 2021-03-04 2022-11-22 安徽大学 一种基于XGBoost算法的个体出行行为预测方法、***及终端
CN112990284A (zh) * 2021-03-04 2021-06-18 安徽大学 一种基于XGBoost算法的个体出行行为预测方法、***及终端
CN113542779A (zh) * 2021-06-04 2021-10-22 广州虎牙科技有限公司 用户数据的预测方法、计算机设备及存储装置
CN113542779B (zh) * 2021-06-04 2023-07-28 广州虎牙科技有限公司 用户数据的预测方法、计算机设备及存储装置
CN113965805A (zh) * 2021-10-22 2022-01-21 北京达佳互联信息技术有限公司 预测模型的训练方法及装置和目标视频剪辑方法及装置
CN116828265A (zh) * 2023-08-28 2023-09-29 湖南快乐阳光互动娱乐传媒有限公司 一种视频控制方法、***、电子设备及可读存储介质
CN116828265B (zh) * 2023-08-28 2023-11-28 湖南快乐阳光互动娱乐传媒有限公司 一种视频控制方法、***、电子设备及可读存储介质

Similar Documents

Publication Publication Date Title
CN109783686A (zh) 行为数据处理方法、装置、终端设备和存储介质
US11714876B1 (en) Real-time event transcription system and method
US11128582B2 (en) Emoji recommendation method and apparatus
CN103718166B (zh) 信息处理设备、信息处理方法
Sheffer et al. Paradigm shift or passing fad? Twitter and sports journalism
US10664872B2 (en) Systems and methods for generating network intelligence through real-time analytics
US20150081723A1 (en) System and Method for Analyzing and Synthesizing Social Communication Data
CN108235102A (zh) 业务处理方法、装置及存储介质
US20200201493A1 (en) Systems and methods for analyzing visual content items
WO2021160119A1 (zh) 一种信息展示方法及装置
CN110139162A (zh) 媒体内容的共享方法和装置、存储介质、电子装置
US11620825B2 (en) Computerized system and method for in-video modification
CN110347781B (zh) 文章倒排方法、文章推荐方法、装置、设备及存储介质
US20170351769A1 (en) System and Method for a Platform to Identify and Connect Like-Minded Individuals Based on Interaction
US20200074481A1 (en) System, method, and device for analyzing media asset data
CN109829064A (zh) 媒体资源分享及播放方法和装置、存储介质及电子装置
CN107197355A (zh) 弹幕显示方法及装置
CN109587530A (zh) 一种数据处理方法、装置、终端设备和存储介质
CN103488529B (zh) 一种用于视频资源访问控制的方法与设备
CN104954824A (zh) 一种用于进行视频设置的方法、设备与***
CN104537011A (zh) 歌唱排名方法及装置
JP6823170B2 (ja) コンテンツストリームにおける中断期間の予測
US20220360836A1 (en) User defined content summary channel
CN114969493A (zh) 一种内容推荐方法和相关装置
EP3607723B1 (en) Systems and methods for improving accuracy of device maps using media viewing data

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication
RJ01 Rejection of invention patent application after publication

Application publication date: 20190521