CN114399355A - 基于用户转化率的信息推送方法、装置和电子设备 - Google Patents
基于用户转化率的信息推送方法、装置和电子设备 Download PDFInfo
- Publication number
- CN114399355A CN114399355A CN202111585306.4A CN202111585306A CN114399355A CN 114399355 A CN114399355 A CN 114399355A CN 202111585306 A CN202111585306 A CN 202111585306A CN 114399355 A CN114399355 A CN 114399355A
- Authority
- CN
- China
- Prior art keywords
- user
- mature
- tested
- users
- behavior
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000006243 chemical reaction Methods 0.000 title claims abstract description 71
- 238000000034 method Methods 0.000 title claims abstract description 47
- 239000013598 vector Substances 0.000 claims abstract description 106
- 238000001514 detection method Methods 0.000 claims abstract description 35
- 230000006399 behavior Effects 0.000 claims description 165
- 230000000694 effects Effects 0.000 claims description 44
- 238000013528 artificial neural network Methods 0.000 claims description 18
- 238000012549 training Methods 0.000 claims description 12
- 239000011159 matrix material Substances 0.000 claims description 10
- 238000004590 computer program Methods 0.000 claims description 8
- 238000003062 neural network model Methods 0.000 claims description 7
- 238000010801 machine learning Methods 0.000 claims description 6
- 238000001914 filtration Methods 0.000 claims description 5
- 238000012360 testing method Methods 0.000 claims description 3
- 230000003542 behavioural effect Effects 0.000 claims 1
- 230000006870 function Effects 0.000 description 25
- 238000010586 diagram Methods 0.000 description 10
- 238000012545 processing Methods 0.000 description 8
- 238000004364 calculation method Methods 0.000 description 6
- 238000004891 communication Methods 0.000 description 6
- 230000003287 optical effect Effects 0.000 description 4
- 238000005516 engineering process Methods 0.000 description 2
- 230000000644 propagated effect Effects 0.000 description 2
- 238000003491 array Methods 0.000 description 1
- 238000013527 convolutional neural network Methods 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 238000011156 evaluation Methods 0.000 description 1
- 238000002372 labelling Methods 0.000 description 1
- 239000004973 liquid crystal related substance Substances 0.000 description 1
- 239000013307 optical fiber Substances 0.000 description 1
- 239000004065 semiconductor Substances 0.000 description 1
- 238000012546 transfer Methods 0.000 description 1
- 238000012795 verification Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q30/00—Commerce
- G06Q30/06—Buying, selling or leasing transactions
- G06Q30/0601—Electronic shopping [e-shopping]
- G06Q30/0631—Item recommendations
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q30/00—Commerce
- G06Q30/02—Marketing; Price estimation or determination; Fundraising
- G06Q30/0201—Market modelling; Market analysis; Collecting market data
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q50/00—Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
- G06Q50/40—Business processes related to the transportation industry
Landscapes
- Business, Economics & Management (AREA)
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- Strategic Management (AREA)
- Finance (AREA)
- Accounting & Taxation (AREA)
- Development Economics (AREA)
- General Physics & Mathematics (AREA)
- Marketing (AREA)
- Economics (AREA)
- General Business, Economics & Management (AREA)
- General Health & Medical Sciences (AREA)
- Entrepreneurship & Innovation (AREA)
- Data Mining & Analysis (AREA)
- Health & Medical Sciences (AREA)
- Software Systems (AREA)
- Biomedical Technology (AREA)
- General Engineering & Computer Science (AREA)
- Computing Systems (AREA)
- Molecular Biology (AREA)
- Evolutionary Computation (AREA)
- Computational Linguistics (AREA)
- Biophysics (AREA)
- Game Theory and Decision Science (AREA)
- Mathematical Physics (AREA)
- Artificial Intelligence (AREA)
- Life Sciences & Earth Sciences (AREA)
- Human Resources & Organizations (AREA)
- Primary Health Care (AREA)
- Tourism & Hospitality (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
本申请实施例公开了基于用户转化率的信息推送方法、装置和电子设备。该方法的实施例包括:获取待测用户集中各待测用户的行为序列,并将各待测用户的行为序列转换为待测向量;基于各待测用户的待测向量、成熟用户集中各成熟用户的行为序列对应的样本向量以及预先训练的行为相似度检测模型,确定各待测用户与成熟用户群体的行为相似度;基于所确定出的行为相似度,预测待测用户集的用户转化率,用户转化率为待测用户集中待测用户转化为成熟用户的比例;基于用户转化率和/或行为相似度,对待测用户集中的待测用户进行信息推送。该实施方式提高了所推送信息对于不同用户的针对性和有效性。
Description
技术领域
本申请实施例涉及计算机技术领域,具体涉及基于用户转化率的信息推送方法、装置和电子设备。
背景技术
随着计算机技术的发展,各类客户端所提供的功能和服务越来越多。通常,不同用户对客户端的使用程度不同。活跃度高的用户通常更易全面了解客户端的功能和业务,从而获取到所需信息。活跃度低的用户通常不太了解客户端的功能和业务,导致无法获取所需信息。
现有技术中,在客户端所展示或推送的信息通常与用户对客户端的使用情况无关。对于活跃度较高的用户,部分已知信息可能会其造成干扰。对于活跃度低的用户,相似信息仍存在无法使其了解功能和业务的问题。由此,现有方式客户端中信息的有效性和针对性较低。
发明内容
本申请实施例提出了基于用户转化率的信息推送方法、装置和电子设备,以解决现有技术中客户端中信息的有效性和针对性较低的技术问题。
第一方面,本申请实施例提供了一种基于用户转化率的信息推送方法,包括:获取待测用户集中各待测用户的行为序列,并将各待测用户的行为序列转换为待测向量;基于各待测用户的待测向量、成熟用户集中各成熟用户的行为序列对应的样本向量以及预先训练的行为相似度检测模型,确定各待测用户与成熟用户群体的行为相似度;基于所确定出的行为相似度,预测所述待测用户集的用户转化率,所述用户转化率为所述待测用户集中待测用户转化为成熟用户的比例;基于所述用户转化率和/或所述行为相似度,对所述待测用户集中的待测用户进行信息推送。
第二方面,本申请实施例提供了一种基于用户转化率的信息推送装置,获取单元,用于获取待测用户集中各待测用户的行为序列,并将各待测用户的行为序列转换为待测向量;确定单元,用于基于各待测用户的待测向量、成熟用户集中各成熟用户的行为序列对应的样本向量以及预先训练的行为相似度检测模型,确定各待测用户与成熟用户群体的行为相似度;预测单元,用于基于所确定出的行为相似度,预测所述待测用户集的用户转化率,所述用户转化率为所述待测用户集中待测用户转化为成熟用户的比例;推送单元,用于基于所述用户转化率和/或所述行为相似度,对所述待测用户集中的待测用户进行信息推送。
第三方面,本申请实施例提供了一种电子设备,包括:一个或多个处理器;存储装置,其上存储有一个或多个程序,当所述一个或多个程序被所述一个或多个处理器执行,使得所述一个或多个处理器实现如第一方面中所描述的方法。
第四方面,本申请实施例提供了一种计算机可读介质,其上存储有计算机程序,该程序被处理器执行时实现如第一方面中所描述的方法。
本申请实施例提供的基于用户转化率的信息推送方法、装置和电子设备,通过获取待测用户集中各待测用户的行为序列,并将各待测用户的行为序列转换为待测向量;而后基于各待测用户的待测向量、成熟用户集中各成熟用户的行为序列对应的样本向量以及预先训练的行为相似度检测模型,确定各待测用户与成熟用户群体的行为相似度;之后基于所确定出的行为相似度,预测上述待测用户集的用户转化率,上述用户转化率为上述待测用户集中待测用户转化为成熟用户的比例;最后基于上述用户转化率和/或上述行为相似度,对上述待测用户集中的待测用户进行信息推送。由此,可以通过分析用户行为序列以及所在用户集的转化率,来用户进行针对性的信息推送,避免了对部分用户推送其已知信息的情况以及推送对用户无帮助的信息的情况,提高了所推送信息对于不同用户的针对性和有效性,使得用户能够更加便利地享受客户端应用所提供的功能和服务。
附图说明
通过阅读参照以下附图所作的对非限制性实施例所作的详细描述,本申请的其它特征、目的和优点将会变得更明显:
图1是根据本申请的基于用户转化率的信息推送方法的一个实施例的流程图;
图2是根据本申请的基于用户转化率的信息推送方法的又一个实施例的流程图;
图3是根据本申请的基于用户转化率的信息推送装置的一个实施例的结构示意图;
图4是用于实现本申请实施例的电子设备的计算机***的结构示意图。
具体实施方式
下面结合附图和实施例对本申请作进一步的详细说明。可以理解的是,此处所描述的具体实施例仅仅用于解释相关发明,而非对该发明的限定。另外还需要说明的是,为了便于描述,附图中仅示出了与有关发明相关的部分。
需要说明的是,在不冲突的情况下,本申请中的实施例及实施例中的特征可以相互组合。下面将参考附图并结合实施例来详细说明本申请。
请参考图1,其示出了根据本申请的基于用户转化率的信息推送方法的一个实施例的流程100。该基于用户转化率的信息推送方法,包括以下步骤:
步骤101,获取待测用户集中各待测用户的行为序列,并将各待测用户的行为序列转换为待测向量。
在本实施例中,基于用户转化率的信息推送方法的执行主体(如服务器等电子设备)可以获取待测用户集中各待测用户的行为序列,并将各待测用户的行为序列转换为待测向量。其中,待测用户集中可包括多个待测用户,待测用户可以是尚未转换为成熟用户的用户。
在本实施例中,成熟用户的评价方式可以根据需要进行设定,此处不作具体限定。例如,可基于注册时长、活跃度等进行设定。其中,活跃度可以包括但不限于登录活跃度、行为活跃度、社交活跃度等。
在本实施例中,行为序列可以通过行为数据获得。例如{登录,查看推送信息A,查看推送信息B,查看产品1,查看新闻2,点击产品1,查看评论,下单}。待测向量可以是行为序列的向量表示,例如上例中的行为序列可转换成行为向量{a,ga,ga,r,r,gb,v,b}。其中,行为向量中的a、ga、ga、r、r、gb、v、b均为具体的数值,且取值各不相同。
在本实施例的一些可选的实现方式中,待测用户集和成熟用户集通过如下步骤生成:首先,确定预设用户集中各用户的注册活跃度(可记为RA)和注册时长(可记为rt)。之后,将注册时长大于第一阈值且注册活跃度大于第二阈值的用户作为待测用户,汇总得到待测用户集。最后,将注册时长大于第一阈值且注册活跃度小于或等于第二阈值的用户作为待测用户,汇总得到成熟用户集。其中,第一阈值和第二阈值的具体取值可根据需要进行设定,此处不作限定。
在本实施例的一些可选的实现方式中,注册活跃度和注册时长可通过如下步骤确定:首先,基于预设用户集中各用户的行为数据,确定各用户的登录活跃度(可记为lt)、行为活跃度(可记为bt)、社交活跃度(可记为st)和注册时长,并获取***上线时间(可记为RN);而后,基于登录活跃度、行为活跃度、社交活跃度、注册时长和***上线时间,确定各用户的注册活跃度。作为示例,可参见如下公式:
在本实施例的一些可选的实现方式中,在将各待测用户的行为序列转换为待测向量之后,上述执行主体还可以确定各待测用户的行为序列与成熟用户的行为序列的相似度。例如,可采用欧氏距离等相似度计算方式,对行为序列对应的待测向量进行相似度计算。再例如,可以对待测向量进一步划分成子向量,并汇总为矩阵,采用欧氏距离等相似度计算方式对矩阵进行相似度计算,以降低向量长度,从而提高计算效率。之后,滤除相似度低于第三阈值的待测用户的待测数据。由此,可以对待测用户进行初步筛选,以提高整体的数据处理效率。
步骤102,基于各待测用户的待测向量、成熟用户集中各成熟用户的行为序列对应的样本向量以及预先训练的行为相似度检测模型,确定各待测用户与成熟用户群体的行为相似度。
在本实施例中,上述执行主体中可以部署有预先训练的相似度检测模型,用于检测某用户与其他用户群体的行为相似度。上述相似度检测模型可以通过机器学习方法(如有监督学习方法)预先训练得到。此处,成熟用户集中的成熟用户可构成成熟用户群体。对于每个待测用户,上述执行主体可以将该待测用户的待测向量以及成熟用户集中各成熟用户的行为序列对应的样本向量输入至该相似度检测模型,得到该待测用户与成熟用户群体的行为相似度。
在本实施例的一些可选的实现方式中,相似度检测模型可以通过如下步骤生成:首先,获取成熟用户集中的各成熟用户的行为序列,并将各成熟用户的行为序列转换为样本向量。样本向量的获取过程与待测向量的获取过程相似,此处不再赘述。而后,对于每个成熟用户,确定该成熟用户的样本向量与其他成熟用户的样本向量的真实相似度(该真实相似度对于其他成熟用户所构成的群体的整体的相似度),将该成熟用户与其他成熟用户的样本向量作为神经网络模型的输入,基于神经网络输出的预测相似度以及所得到的真实相似度,采用机器学习方法对神经网络进行训练,得到行为相似度检测模型。其中,真实相似度可同时借助其他已训练完成的神经网络模型以及经验丰富的技术人员来确定。例如,可以借助其他已训练完成的神经网络模型(如特征处理模型)进行特征处理,而后由经验丰富的技术人员人工计算(如采用欧氏距离等相似度计算方式),此处不作限定。
在本实施例的一些可选的实现方式中,对于每个成熟用户,还可以将该成熟用户的样本向量划分为多个子向量(对应多个子行为序列),得到该成熟用户对应的样本矩阵。而后,将其他成熟用户的样本向量划分为多个子向量,得到其他成熟用户对应的样本矩阵。最后,确定该成熟用户对应的样本矩阵与其他成熟用户对应的样本矩阵的真实相似度。由此,可以提高数据处理效率。
在本实施例的一些可选的实现方式中,在得到行为相似度检测模型之后,对于成熟用户集中的每一个成熟用户,上述执行主体还可以确定该成熟用户的行为序列与其他各成熟用户的行为序列的相似度。而后,按照相似度从大到小的次序,从其他成熟用户中选取预设数量(如100个)的目标成熟用户。最后,基于该成熟用户的行为序列的与目标成熟用户的行为序列,对相似度检测模型进行验证或再训练。由此,可以进一步提高相似度检测模型的性能。
步骤103,基于所确定出的行为相似度,预测待测用户集的用户转化率。
在本实施例中,上述执行主体可以将所确定出的每个待测用户与成熟用户群体的行为相似度,预测该待测用户是否会转化为成熟用户。例如,若行为相似度大于预设的阈值,则可以确定待测用户会转化为成熟用户。反之,若行为相似度小于或等于预设的阈值,则可以确定待测用户不会转化为成熟用户。上述执行主体可以将会转化为成熟用户的待测用户在待测用户集中的比例确定为用户转化率。
步骤104,基于用户转化率和/或行为相似度,对待测用户集中的待测用户进行信息推送。
在本实施例中,上述执行主体可以基于用户转化率和/或行为相似度,对待测用户集中的待测用户进行信息推送。此处,信息推送的对象可以是待测用户集中的部分待测用户或者全部待测用户。信息推送的内容可以基于用户转化率和/或相位相似度确定。
在本实施例的一些可选的实现方式中,上述执行主体可以基于所确定出的行为相似度,选取待测用户集中的目标用户,向目标用户推送信息。此处,目标用户既可以指会转化成成熟用户的用户,也可以指不会转化成成成用户的用户。作为示例,当目标用户为会转化成成熟用户的用户时,可以向目标用户推送成熟用户点击率高的信息,以便于使所推送的信息更符合目标用户的需求和偏好。作为又一示例,当目标用户为不会转化成成熟用户的用户时,则可以向目标用户推送客户端的基础功能类信息,以便于这些用户能够进一步了解客户端功能,从而使其能够便捷地使用客户端功能。
在本实施例的一些可选的实现方式中,上述执行主体还可以在用户转化率满足预设条件时(例如转化率小于80%时),向待测用户集中的待测用户推送信息。当用户转化率满足预设条件时,意味着待测用户集对应的待测用户群体中的大部分对客户端功能的利用率较低,此时可以向待测用户群体推送一些客户端功能介绍信息、业务介绍信息等,以使其能够便捷地使用客户端功能。
本申请的上述实施例提供的方法,通过获取待测用户集中各待测用户的行为序列,并将各待测用户的行为序列转换为待测向量;而后基于各待测用户的待测向量、成熟用户集中各成熟用户的行为序列对应的样本向量以及预先训练的行为相似度检测模型,确定各待测用户与成熟用户群体的行为相似度;之后基于所确定出的行为相似度,预测待测用户集的用户转化率,用户转化率为待测用户集中待测用户转化为成熟用户的比例;最后基于用户转化率和/或行为相似度,对待测用户集中的待测用户进行信息推送。由此,可以通过分析用户行为序列以及所在用户集的转化率,来用户进行针对性的信息推送,避免了对部分用户推送其已知信息的情况以及推送对用户无帮助的信息的情况,提高了所推送信息对于不同用户的针对性和有效性,使得用户能够更加便利地享受客户端应用所提供的功能和服务。
进一步参考图2,其示出了基于用户转化率的信息推送方法的又一个实施例的流程200。该基于用户转化率的信息推送方法的流程200,包括以下步骤:
步骤201,获取成熟用户集中的各成熟用户的行为序列,并将各成熟用户的行为序列转换为样本向量。
在本实施例中,基于用户转化率的信息推送方法的执行主体(如服务器等电子设备)可以首先获取成熟用户集中的各成熟用户的行为序列,并将各成熟用户的行为序列转换为样本向量。
其中,行为序列可以通过行为数据获得。例如{登录,查看推送信息A,查看推送信息B,查看产品1,查看新闻2,点击产品1,查看评论,下单}。样本向量可以是行为序列的向量表示,例如上例中的行为序列可转换成行为向量{a,ga,ga,r,r,gb,v,b}。其中,行为向量中的a、ga、ga、r、r、gb、v、b均为具体的数值,且取值各不相同。
步骤202,对于每个成熟用户,确定该成熟用户的样本向量与其他成熟用户的样本向量的真实相似度,将该成熟用户与其他成熟用户的样本向量作为神经网络模型的输入,基于神经网络输出的预测相似度以及所得到的真实相似度,采用机器学习方法对神经网络进行训练,得到行为相似度检测模型。
在本实施例中,对于每个成熟用户,确定该成熟用户的样本向量与其他成熟用户的样本向量的真实相似度,将该成熟用户与其他成熟用户的样本向量作为神经网络模型的输入,基于神经网络输出的预测相似度以及所得到的真实相似度,采用机器学习方法对神经网络进行训练,得到行为相似度检测模型。此处,可以将每一个成熟用户的样本向量以及其他成熟用户的样本向量作为一个样本,将该成熟用户的样本向量与其他成熟用户的样本向量的真实相似度作为该样本的标注。其中,神经网络可以采用DenseBox、VGGNet、ResNet、SegNet等卷积神经网络等网络结构,此处不作具体限定。
在训练过程中,可以逐一地将样本输入至神经网络,得到神经网络输出的预测相似度。而后,可以基于预测相似度与所输入的样本对应的标注信息(即真实相似度),确定损失值。上述损失值为损失函数(loss function)的值,损失函数是一个非负实值函数,可以用于表征预测相似度与真实结果的差异。一般情况下,损失值越小,模型的鲁棒性就越好。损失函数可以根据实际需求来设置,例如可采用交叉熵损失函数。之后,可以利用该损失值,更新神经网络的参数。由此,每输入一次样本,可以基于该样本对应的损失值,对神经网络的参数进行一次更新,直至训练完成。
实践中,可以通过多种方式确定是否训练完成。作为示例,当神经网络输出的检测结果的准确性达到预设值时(例如99%),可确定训练完成。作为又一示例,若神经网络的训练次数等于预设次数时,可以确定训练完成。此处,若初始模型训练完成,即可将训练后的神经网络确定为相似度检测模型。
在本实施例的一些可选的实现方式中,上述对于每个成熟用户,确定该成熟用户的样本向量与其他成熟用户的样本向量的真实相似度,包括:对于每个成熟用户,将该成熟用户的样本向量划分为多个子向量,得到该成熟用户对应的样本矩阵;将其他成熟用户的样本向量划分为多个子向量,得到其他成熟用户对应的样本矩阵;确定该成熟用户对应的样本矩阵与其他成熟用户对应的样本矩阵的真实相似度。
在本实施例的一些可选的实现方式中,在得到行为相似度检测模型之后,还可以执行如下步骤:对于成熟用户集中的每一个成熟用户,确定该成熟用户的行为序列与其他各成熟用户的行为序列的相似度;按照相似度从大到小的次序,从其他成熟用户中选取预设数量的目标成熟用户;基于该成熟用户的行为序列的与上述目标成熟用户的行为序列,对上述相似度检测模型进行验证或再训练。
步骤203,获取待测用户集中各待测用户的行为序列,并将各待测用户的行为序列转换为待测向量。
本实施例的步骤203可参见上述实施例的步骤101,此处不再赘述。
在本实施例的一些可选的实现方式中,上述待测用户集和上述成熟用户集通过如下步骤生成:确定预设用户集中各用户的注册活跃度和注册时长;将注册时长大于第一阈值且注册活跃度大于第二阈值的用户作为待测用户,汇总得到待测用户集;将注册时长大于第一阈值且注册活跃度小于或等于第二阈值的用户作为待测用户,汇总得到成熟用户集。
在本实施例的一些可选的实现方式中,上述确定各用户的注册活跃度和注册时长,包括:基于预设用户集中各用户的行为数据,确定各用户的登录活跃度、行为活跃度、社交活跃度和注册时长,并获取***上线时间;基于上述登录活跃度、行为活跃度、社交活跃度、注册时长和上述***上线时间,确定各用户的注册活跃度。
在本实施例的一些可选的实现方式中,在将各待测用户的行为序列转换为待测向量之后,还可以执行如下步骤:确定各待测用户的行为序列与成熟用户的行为序列的相似度;滤除相似度低于第三阈值的待测用户的待测数据。
步骤204,基于各待测用户的待测向量、成熟用户集中各成熟用户的行为序列对应的样本向量以及预先训练的行为相似度检测模型,确定各待测用户与成熟用户群体的行为相似度。
本实施例的步骤204可参见上述实施例的步骤102,此处不再赘述。
步骤205,基于所确定出的行为相似度,预测待测用户集的用户转化率,用户转化率为待测用户集中待测用户转化为成熟用户的比例。
本实施例的步骤205可参见上述实施例的步骤103,此处不再赘述。
步骤206,基于用户转化率和/或行为相似度,对待测用户集中的待测用户进行信息推送。
本实施例的步骤206可参见上述实施例的步骤104,此处不再赘述。
在本实施例的一些可选的实现方式中,上述基于上述用户转化率和/或上述行为相似度,对上述待测用户集中的待测用户进行信息推送,包括:基于所确定出的行为相似度,选取上述待测用户集中的目标用户,向上述目标用户推送信息;或者,在上述用户转化率满足预设条件时,向上述待测用户集中的待测用户推送信息。
本申请的上述实施例提供的方法,通过以成熟用户群体的真实相似度作为标签进行相似度检测模型的训练,并基于训练后的相似度检测模型进行确定待测用户与成熟用户群体的行为相似度,从而基于行为相似度确定用户转化率,进而进行信息推送,相较于直接基于单一行为序列比对确定待测用户是否会转化为成熟用户的方式,可提高检测的准确性以及用户转化率的准确性,从而进一步提高了所推送信息对于不同用户的针对性和有效性,使得用户能够更加便利地享受客户端应用所提供的功能和服务。
进一步参考图3,作为对上述各图所示方法的实现,本申请提供了一种基于用户转化率的信息推送装置的一个实施例,该装置实施例与图1所示的方法实施例相对应,该装置具体可以应用于各种电子设备中。
如图3所示,本实施例的基于用户转化率的信息推送装置300包括:获取单元301,用于获取待测用户集中各待测用户的行为序列,并将各待测用户的行为序列转换为待测向量;确定单元302,用于基于各待测用户的待测向量、成熟用户集中各成熟用户的行为序列对应的样本向量以及预先训练的行为相似度检测模型,确定各待测用户与成熟用户群体的行为相似度;预测单元304,用于基于所确定出的行为相似度,预测上述待测用户集的用户转化率,上述用户转化率为上述待测用户集中待测用户转化为成熟用户的比例;推送单元304,用于基于上述用户转化率和/或上述行为相似度,对上述待测用户集中的待测用户进行信息推送。
在本实施例的一些可选的实现方式中,上述相似度检测模型通过如下步骤生成:获取成熟用户集中的各成熟用户的行为序列,并将各成熟用户的行为序列转换为样本向量;对于每个成熟用户,确定该成熟用户的样本向量与其他成熟用户的样本向量的真实相似度,将该成熟用户与其他成熟用户的样本向量作为神经网络模型的输入,基于上述神经网络输出的预测相似度以及所得到的真实相似度,采用机器学习方法对上述神经网络进行训练,得到行为相似度检测模型。
在本实施例的一些可选的实现方式中,上述待测用户集和上述成熟用户集通过如下步骤生成:确定预设用户集中各用户的注册活跃度和注册时长;将注册时长大于第一阈值且注册活跃度大于第二阈值的用户作为待测用户,汇总得到待测用户集;将注册时长大于第一阈值且注册活跃度小于或等于第二阈值的用户作为待测用户,汇总得到成熟用户集。
在本实施例的一些可选的实现方式中,上述确定各用户的注册活跃度和注册时长,包括:基于预设用户集中各用户的行为数据,确定各用户的登录活跃度、行为活跃度、社交活跃度和注册时长,并获取***上线时间;基于上述登录活跃度、行为活跃度、社交活跃度、注册时长和上述***上线时间,确定各用户的注册活跃度。
在本实施例的一些可选的实现方式中,上述装置还包括滤除单元,用于:确定各待测用户的行为序列与成熟用户的行为序列的相似度;滤除相似度低于第三阈值的待测用户的待测数据。
在本实施例的一些可选的实现方式中,上述装置还包括验证单元,用于:对于成熟用户集中的每一个成熟用户,确定该成熟用户的行为序列与其他各成熟用户的行为序列的相似度;按照相似度从大到小的次序,从其他成熟用户中选取预设数量的目标成熟用户;基于该成熟用户的行为序列的与上述目标成熟用户的行为序列,对上述相似度检测模型进行验证或再训练。
在本实施例的一些可选的实现方式中,上述对于每个成熟用户,确定该成熟用户的样本向量与其他成熟用户的样本向量的真实相似度,包括:对于每个成熟用户,将该成熟用户的样本向量划分为多个子向量,得到该成熟用户对应的样本矩阵;将其他成熟用户的样本向量划分为多个子向量,得到其他成熟用户对应的样本矩阵;确定该成熟用户对应的样本矩阵与其他成熟用户对应的样本矩阵的真实相似度。
在本实施例的一些可选的实现方式中,上述推送单元304,还用于基于所确定出的行为相似度,选取上述待测用户集中的目标用户,向上述目标用户推送信息;或者,在上述用户转化率满足预设条件时,向上述待测用户集中的待测用户推送信息。
本申请的上述实施例提供的装置,通过获取待测用户集中各待测用户的行为序列,并将各待测用户的行为序列转换为待测向量;而后基于各待测用户的待测向量、成熟用户集中各成熟用户的行为序列对应的样本向量以及预先训练的行为相似度检测模型,确定各待测用户与成熟用户群体的行为相似度;之后基于所确定出的行为相似度,预测待测用户集的用户转化率,用户转化率为待测用户集中待测用户转化为成熟用户的比例;最后基于用户转化率和/或行为相似度,对待测用户集中的待测用户进行信息推送。由此,可以通过分析用户行为序列以及所在用户集的转化率,来用户进行针对性的信息推送,避免了对部分用户推送其已知信息的情况以及推送对用户无帮助的信息的情况,提高了所推送信息对于不同用户的针对性和有效性,使得用户能够更加便利地享受客户端应用所提供的功能和服务。
下面参考图4,其示出了用于实现本申请的一些实施例的电子设备的结构示意图。图4示出的电子设备仅仅是一个示例,不应对本申请的实施例的功能和使用范围带来任何限制。
如图4所示,电子设备400可以包括处理装置(例如中央处理器、图形处理器等)401,其可以根据存储在只读存储器(ROM)402中的程序或者从存储装置408加载到随机访问存储器(RAM)403中的程序而执行各种适当的动作和处理。在RAM 403中,还存储有电子设备400操作所需的各种程序和数据。处理装置401、ROM 402以及RAM403通过总线404彼此相连。输入/输出(I/O)接口405也连接至总线404。
通常,以下装置可以连接至I/O接口405:包括例如触摸屏、触摸板、键盘、鼠标、摄像头、麦克风、加速度计、陀螺仪等的输入装置406;包括例如液晶显示器(LCD)、扬声器、振动器等的输出装置407;包括例如磁盘、硬盘等的存储装置408;以及通信装置409。通信装置409可以允许电子设备400与其他设备进行无线或有线通信以交换数据。虽然图4示出了具有各种装置的电子设备400,但是应理解的是,并不要求实施或具备所有示出的装置。可以替代地实施或具备更多或更少的装置。图4中示出的每个方框可以代表一个装置,也可以根据需要代表多个装置。
特别地,根据本申请的一些实施例,上文参考流程图描述的过程可以被实现为计算机软件程序。例如,本申请的一些实施例包括一种计算机程序产品,其包括承载在计算机可读介质上的计算机程序,该计算机程序包含用于执行流程图所示的方法的程序代码。在这样的一些实施例中,该计算机程序可以通过通信装置409从网络上被下载和安装,或者从存储装置408被安装,或者从ROM 402被安装。在该计算机程序被处理装置401执行时,执行本申请的一些实施例的方法中限定的上述功能。
需要说明的是,本申请的一些实施例所述的计算机可读介质可以是计算机可读信号介质或者计算机可读存储介质或者是上述两者的任意组合。计算机可读存储介质例如可以是——但不限于——电、磁、光、电磁、红外线、或半导体的***、装置或器件,或者任意以上的组合。计算机可读存储介质的更具体的例子可以包括但不限于:具有一个或多个导线的电连接、便携式计算机磁盘、硬盘、随机访问存储器(RAM)、只读存储器(ROM)、可擦式可编程只读存储器(EPROM或闪存)、光纤、便携式紧凑磁盘只读存储器(CD-ROM)、光存储器件、磁存储器件、或者上述的任意合适的组合。在本申请的一些实施例中,计算机可读存储介质可以是任何包含或存储程序的有形介质,该程序可以被指令执行***、装置或者器件使用或者与其结合使用。而在本申请的一些实施例中,计算机可读信号介质可以包括在基带中或者作为载波一部分传播的数据信号,其中承载了计算机可读的程序代码。这种传播的数据信号可以采用多种形式,包括但不限于电磁信号、光信号或上述的任意合适的组合。计算机可读信号介质还可以是计算机可读存储介质以外的任何计算机可读介质,该计算机可读信号介质可以发送、传播或者传输用于由指令执行***、装置或者器件使用或者与其结合使用的程序。计算机可读介质上包含的程序代码可以用任何适当的介质传输,包括但不限于:电线、光缆、RF(射频)等等,或者上述的任意合适的组合。
在一些实施方式中,客户端、服务器可以利用诸如HTTP(HyperTextTransferProtocol,超文本传输协议)之类的任何当前已知或未来研发的网络协议进行通信,并且可以与任意形式或介质的数字数据通信(例如,通信网络)互连。通信网络的示例包括局域网(“LAN”),广域网(“WAN”),网际网(例如,互联网)以及端对端网络(例如,ad hoc端对端网络),以及任何当前已知或未来研发的网络。
上述计算机可读介质可以是上述电子设备中所包含的;也可以是单独存在,而未装配入该电子设备中。上述计算机可读介质承载有一个或者多个程序,当上述一个或者多个程序被该电子设备执行时,使得该电子设备:取待测用户集中各待测用户的行为序列,并将各待测用户的行为序列转换为待测向量;基于各待测用户的待测向量、成熟用户集中各成熟用户的行为序列对应的样本向量以及预先训练的行为相似度检测模型,确定各待测用户与成熟用户群体的行为相似度;基于所确定出的行为相似度,预测待测用户集的用户转化率,用户转化率为待测用户集中待测用户转化为成熟用户的比例;基于用户转化率和/或行为相似度,对待测用户集中的待测用户进行信息推送。
可以以一种或多种程序设计语言或其组合来编写用于执行本申请的一些实施例的操作的计算机程序代码,所述程序设计语言包括面向对象的程序设计语言,诸如Java、Smalltalk、C++;还包括常规的过程式程序设计语言,诸如“C”语言或类似的程序设计语言。程序代码可以完全地在用户计算机上执行、部分地在用户计算机上执行、作为一个独立的软件包执行、部分在用户计算机上部分在远程计算机上执行、或者完全在远程计算机或服务器上执行。在涉及远程计算机的情形中,远程计算机可以通过任意种类的网络连接到用户计算机,或者,可以连接到外部计算机(例如利用因特网服务提供商来通过因特网连接),上述网络包括局域网(LAN)或广域网(WAN)。
附图中的流程图和框图,图示了按照本申请各种实施例的***、方法和计算机程序产品的可能实现的体系架构、功能和操作。在这点上,流程图或框图中的每个方框可以代表一个模块、程序段、或代码的一部分,该模块、程序段、或代码的一部分包含一个或多个用于实现规定的逻辑功能的可执行指令。也应当注意,在有些作为替换的实现中,方框中所标注的功能也可以以不同于附图中所标注的顺序发生。例如,两个接连地表示的方框实际上可以基本并行地执行,它们有时也可以按相反的顺序执行,这依所涉及的功能而定。也要注意的是,框图和/或流程图中的每个方框、以及框图和/或流程图中的方框的组合,可以用执行规定的功能或操作的专用的基于硬件的***来实现,或者可以用专用硬件与计算机指令的组合来实现。
描述于本申请的一些实施例中的单元可以通过软件的方式实现,也可以通过硬件的方式来实现。所描述的单元也可以设置在处理器中,例如,可以描述为:一种处理器包括第一确定单元、第二确定单元、选取单元和第三确定单元。其中,这些单元的名称在某种情况下并不构成对该单元本身的限定。
本文中以上描述的功能可以至少部分地由一个或多个硬件逻辑部件来执行。例如,非限制性地,可以使用的示范类型的硬件逻辑部件包括:现场可编程门阵列(FPGA)、专用集成电路(ASIC)、专用标准产品(ASSP)、片上***(SOC)、复杂可编程逻辑设备(CPLD)等等。
以上描述仅为本申请的一些较佳实施例以及对所运用技术原理的说明。本领域技术人员应当理解,本申请的实施例中所涉及的发明范围,并不限于上述技术特征的特定组合而成的技术方案,同时也应涵盖在不脱离上述发明构思的情况下,由上述技术特征或其等同特征进行任意组合而形成的其它技术方案。例如上述特征与本申请的实施例中公开的(但不限于)具有类似功能的技术特征进行互相替换而形成的技术方案。
Claims (11)
1.一种基于用户转化率的信息推送方法,其特征在于,包括:
获取待测用户集中各待测用户的行为序列,并将各待测用户的行为序列转换为待测向量;
基于各待测用户的待测向量、成熟用户集中各成熟用户的行为序列对应的样本向量以及预先训练的行为相似度检测模型,确定各待测用户与成熟用户群体的行为相似度;
基于所确定出的行为相似度,预测所述待测用户集的用户转化率,所述用户转化率为所述待测用户集中待测用户转化为成熟用户的比例;
基于所述用户转化率和/或所述行为相似度,对所述待测用户集中的待测用户进行信息推送。
2.根据权利要求1所述的方法,其特征在于,所述相似度检测模型通过如下步骤生成:
获取成熟用户集中的各成熟用户的行为序列,并将各成熟用户的行为序列转换为样本向量;
对于每个成熟用户,确定该成熟用户的样本向量与其他成熟用户的样本向量的真实相似度,将该成熟用户与其他成熟用户的样本向量作为神经网络模型的输入,基于所述神经网络输出的预测相似度以及所得到的真实相似度,采用机器学习方法对所述神经网络进行训练,得到行为相似度检测模型。
3.根据权利要求1所述的方法,其特征在于,所述待测用户集和所述成熟用户集通过如下步骤生成:
确定预设用户集中各用户的注册活跃度和注册时长;
将注册时长大于第一阈值且注册活跃度大于第二阈值的用户作为待测用户,汇总得到待测用户集;
将注册时长大于第一阈值且注册活跃度小于或等于第二阈值的用户作为待测用户,汇总得到成熟用户集。
4.根据权利要求3所述的方法,其特征在于,所述确定各用户的注册活跃度和注册时长,包括:
基于预设用户集中各用户的行为数据,确定各用户的登录活跃度、行为活跃度、社交活跃度和注册时长,并获取***上线时间;
基于所述登录活跃度、行为活跃度、社交活跃度、注册时长和所述***上线时间,确定各用户的注册活跃度。
5.根据权利要求1所述的方法,其特征在于,在将各待测用户的行为序列转换为待测向量之后,所述方法还包括:
确定各待测用户的行为序列与成熟用户的行为序列的相似度;
滤除相似度低于第三阈值的待测用户的待测数据。
6.根据权利要求2所述的方法,其特征在于,在得到行为相似度检测模型之后,所述方法还包括:
对于成熟用户集中的每一个成熟用户,确定该成熟用户的行为序列与其他各成熟用户的行为序列的相似度;按照相似度从大到小的次序,从其他成熟用户中选取预设数量的目标成熟用户;基于该成熟用户的行为序列的与所述目标成熟用户的行为序列,对所述相似度检测模型进行验证或再训练。
7.根据权利要求2所述的方法,其特征在于,所述对于每个成熟用户,确定该成熟用户的样本向量与其他成熟用户的样本向量的真实相似度,包括:
对于每个成熟用户,将该成熟用户的样本向量划分为多个子向量,得到该成熟用户对应的样本矩阵;将其他成熟用户的样本向量划分为多个子向量,得到其他成熟用户对应的样本矩阵;确定该成熟用户对应的样本矩阵与其他成熟用户对应的样本矩阵的真实相似度。
8.根据权利要求1所述的方法,其特征在于,所述基于所述用户转化率和/或所述行为相似度,对所述待测用户集中的待测用户进行信息推送,包括:
基于所确定出的行为相似度,选取所述待测用户集中的目标用户,向所述目标用户推送信息;或者,
在所述用户转化率满足预设条件时,向所述待测用户集中的待测用户推送信息。
9.一种基于用户转化率的信息推送方法,其特征在于,包括:
获取单元,用于获取待测用户集中各待测用户的行为序列,并将各待测用户的行为序列转换为待测向量;
确定单元,用于基于各待测用户的待测向量、成熟用户集中各成熟用户的行为序列对应的样本向量以及预先训练的行为相似度检测模型,确定各待测用户与成熟用户群体的行为相似度;
预测单元,用于基于所确定出的行为相似度,预测所述待测用户集的用户转化率,所述用户转化率为所述待测用户集中待测用户转化为成熟用户的比例;
推送单元,用于基于所述用户转化率和/或所述行为相似度,对所述待测用户集中的待测用户进行信息推送。
10.一种电子设备,其特征在于,包括:
一个或多个处理器;
存储装置,其上存储有一个或多个程序,
当所述一个或多个程序被所述一个或多个处理器执行,使得所述一个或多个处理器实现如权利要求1-8中任一所述的方法。
11.一种计算机可读介质,其上存储有计算机程序,其特征在于,该程序被处理器执行时实现如权利要求1-8中任一所述的方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202111585306.4A CN114399355B (zh) | 2021-12-22 | 2021-12-22 | 基于用户转化率的信息推送方法、装置和电子设备 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202111585306.4A CN114399355B (zh) | 2021-12-22 | 2021-12-22 | 基于用户转化率的信息推送方法、装置和电子设备 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN114399355A true CN114399355A (zh) | 2022-04-26 |
CN114399355B CN114399355B (zh) | 2023-10-10 |
Family
ID=81226776
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202111585306.4A Active CN114399355B (zh) | 2021-12-22 | 2021-12-22 | 基于用户转化率的信息推送方法、装置和电子设备 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN114399355B (zh) |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN109063900A (zh) * | 2018-07-16 | 2018-12-21 | 广州视源电子科技股份有限公司 | 用户转化率预测模型的训练及用户转化率预测方法和装置 |
CN109460514A (zh) * | 2018-11-02 | 2019-03-12 | 北京京东尚科信息技术有限公司 | 用于推送信息的方法和装置 |
US20200042686A1 (en) * | 2017-07-27 | 2020-02-06 | Alibaba Group Holding Limited | Method and apparatus for user authentication based on feature information |
CN113378067A (zh) * | 2021-07-13 | 2021-09-10 | 深圳前海微众银行股份有限公司 | 基于用户挖掘的消息推荐方法、设备、介质及程序产品 |
-
2021
- 2021-12-22 CN CN202111585306.4A patent/CN114399355B/zh active Active
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20200042686A1 (en) * | 2017-07-27 | 2020-02-06 | Alibaba Group Holding Limited | Method and apparatus for user authentication based on feature information |
CN109063900A (zh) * | 2018-07-16 | 2018-12-21 | 广州视源电子科技股份有限公司 | 用户转化率预测模型的训练及用户转化率预测方法和装置 |
CN109460514A (zh) * | 2018-11-02 | 2019-03-12 | 北京京东尚科信息技术有限公司 | 用于推送信息的方法和装置 |
CN113378067A (zh) * | 2021-07-13 | 2021-09-10 | 深圳前海微众银行股份有限公司 | 基于用户挖掘的消息推荐方法、设备、介质及程序产品 |
Also Published As
Publication number | Publication date |
---|---|
CN114399355B (zh) | 2023-10-10 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN112966712B (zh) | 语言模型训练方法、装置、电子设备和计算机可读介质 | |
CN108520220B (zh) | 模型生成方法和装置 | |
CN111860573B (zh) | 模型训练方法、图像类别检测方法、装置和电子设备 | |
CN108427939B (zh) | 模型生成方法和装置 | |
WO2020155907A1 (zh) | 用于生成漫画风格转换模型的方法和装置 | |
CN109447156B (zh) | 用于生成模型的方法和装置 | |
CN111523640B (zh) | 神经网络模型的训练方法和装置 | |
CN109376267B (zh) | 用于生成模型的方法和装置 | |
CN109740018B (zh) | 用于生成视频标签模型的方法和装置 | |
CN109976997B (zh) | 测试方法和装置 | |
WO2022116322A1 (zh) | 异常检测模型生成方法和装置、异常事件检测方法和装置 | |
CN111314733A (zh) | 用于评估视频清晰度的方法和装置 | |
CN111526119B (zh) | 异常流量检测方法、装置、电子设备和计算机可读介质 | |
CN109902446B (zh) | 用于生成信息预测模型的方法和装置 | |
CN111368973B (zh) | 用于训练超网络的方法和装置 | |
CN111046027A (zh) | 时间序列数据的缺失值填充方法和装置 | |
CN114945817A (zh) | 基于缺陷检测的任务处理方法、装置及设备及存储介质 | |
CN116932919B (zh) | 信息推送方法、装置、电子设备和计算机可读介质 | |
CN115277261B (zh) | 基于工控网络病毒的异常机器智能识别方法、装置、设备 | |
CN111738010A (zh) | 用于生成语义匹配模型的方法和装置 | |
CN111915086A (zh) | 异常用户预测方法和设备 | |
CN115357470A (zh) | 信息生成方法、装置、电子设备和计算机可读介质 | |
CN113592033A (zh) | 油罐图像识别模型训练方法、油罐图像识别方法和装置 | |
CN111353039B (zh) | 文件类别检测方法和装置 | |
CN114399355B (zh) | 基于用户转化率的信息推送方法、装置和电子设备 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |