CN117454010A - 信息推荐方法、装置及电子设备 - Google Patents
信息推荐方法、装置及电子设备 Download PDFInfo
- Publication number
- CN117454010A CN117454010A CN202311506775.1A CN202311506775A CN117454010A CN 117454010 A CN117454010 A CN 117454010A CN 202311506775 A CN202311506775 A CN 202311506775A CN 117454010 A CN117454010 A CN 117454010A
- Authority
- CN
- China
- Prior art keywords
- application
- target
- information
- verification
- conversion
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 title claims abstract description 78
- 238000006243 chemical reaction Methods 0.000 claims abstract description 221
- 238000012546 transfer Methods 0.000 claims abstract description 67
- 238000012549 training Methods 0.000 claims description 148
- 238000012795 verification Methods 0.000 claims description 133
- 238000012937 correction Methods 0.000 claims description 38
- 238000003066 decision tree Methods 0.000 claims description 32
- 230000006870 function Effects 0.000 claims description 30
- 230000009466 transformation Effects 0.000 claims description 8
- 238000004422 calculation algorithm Methods 0.000 claims description 5
- 230000000694 effects Effects 0.000 description 27
- 230000008569 process Effects 0.000 description 18
- 238000010586 diagram Methods 0.000 description 16
- 238000004590 computer program Methods 0.000 description 15
- 238000004043 dyeing Methods 0.000 description 9
- 230000007704 transition Effects 0.000 description 4
- 230000002354 daily effect Effects 0.000 description 3
- 239000000975 dye Substances 0.000 description 3
- 238000005516 engineering process Methods 0.000 description 3
- 238000011156 evaluation Methods 0.000 description 3
- 239000000654 additive Substances 0.000 description 2
- 230000000996 additive effect Effects 0.000 description 2
- 238000004364 calculation method Methods 0.000 description 2
- 238000004891 communication Methods 0.000 description 2
- 238000010801 machine learning Methods 0.000 description 2
- 238000012545 processing Methods 0.000 description 2
- 230000001360 synchronised effect Effects 0.000 description 2
- 230000003442 weekly effect Effects 0.000 description 2
- 229920002430 Fibre-reinforced plastic Polymers 0.000 description 1
- 230000006978 adaptation Effects 0.000 description 1
- 238000013473 artificial intelligence Methods 0.000 description 1
- 239000002131 composite material Substances 0.000 description 1
- 230000001351 cycling effect Effects 0.000 description 1
- 230000003203 everyday effect Effects 0.000 description 1
- 239000011151 fibre-reinforced plastic Substances 0.000 description 1
- 230000006872 improvement Effects 0.000 description 1
- 239000004973 liquid crystal related substance Substances 0.000 description 1
- 238000004519 manufacturing process Methods 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000012552 review Methods 0.000 description 1
- 238000012216 screening Methods 0.000 description 1
- 230000003068 static effect Effects 0.000 description 1
- 238000012360 testing method Methods 0.000 description 1
- XLYOFNOQVPJJNP-UHFFFAOYSA-N water Substances O XLYOFNOQVPJJNP-UHFFFAOYSA-N 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/90—Details of database functions independent of the retrieved data types
- G06F16/95—Retrieval from the web
- G06F16/953—Querying, e.g. by the use of web search engines
- G06F16/9535—Search customisation based on user profiles and personalisation
-
- A—HUMAN NECESSITIES
- A63—SPORTS; GAMES; AMUSEMENTS
- A63F—CARD, BOARD, OR ROULETTE GAMES; INDOOR GAMES USING SMALL MOVING PLAYING BODIES; VIDEO GAMES; GAMES NOT OTHERWISE PROVIDED FOR
- A63F13/00—Video games, i.e. games using an electronically generated display having two or more dimensions
- A63F13/70—Game security or game management aspects
- A63F13/77—Game security or game management aspects involving data related to game devices or game servers, e.g. configuration data, software version or amount of memory
-
- A—HUMAN NECESSITIES
- A63—SPORTS; GAMES; AMUSEMENTS
- A63F—CARD, BOARD, OR ROULETTE GAMES; INDOOR GAMES USING SMALL MOVING PLAYING BODIES; VIDEO GAMES; GAMES NOT OTHERWISE PROVIDED FOR
- A63F13/00—Video games, i.e. games using an electronically generated display having two or more dimensions
- A63F13/70—Game security or game management aspects
- A63F13/79—Game security or game management aspects involving player-related data, e.g. identities, accounts, preferences or play histories
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/21—Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
- G06F18/213—Feature extraction, e.g. by transforming the feature space; Summarisation; Mappings, e.g. subspace methods
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/21—Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
- G06F18/214—Generating training patterns; Bootstrap methods, e.g. bagging or boosting
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/24—Classification techniques
- G06F18/241—Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches
- G06F18/2415—Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches based on parametric or probabilistic models, e.g. based on likelihood ratio or false acceptance rate versus a false rejection rate
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/24—Classification techniques
- G06F18/243—Classification techniques relating to the number of classes
- G06F18/24323—Tree-organised classifiers
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02D—CLIMATE CHANGE MITIGATION TECHNOLOGIES IN INFORMATION AND COMMUNICATION TECHNOLOGIES [ICT], I.E. INFORMATION AND COMMUNICATION TECHNOLOGIES AIMING AT THE REDUCTION OF THEIR OWN ENERGY USE
- Y02D10/00—Energy efficient computing, e.g. low power processors, power management or thermal management
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Data Mining & Analysis (AREA)
- Physics & Mathematics (AREA)
- Computer Vision & Pattern Recognition (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Life Sciences & Earth Sciences (AREA)
- Artificial Intelligence (AREA)
- Bioinformatics & Computational Biology (AREA)
- Evolutionary Biology (AREA)
- Evolutionary Computation (AREA)
- Multimedia (AREA)
- Databases & Information Systems (AREA)
- Business, Economics & Management (AREA)
- Computer Security & Cryptography (AREA)
- General Business, Economics & Management (AREA)
- Probability & Statistics with Applications (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
本说明书实施例公开了一种信息推荐方法、装置及电子设备,该方法包括:在目标应用有目标信息上线时,获取目标应用中各个应用使用对象在目标应用中的应用内特征数据;将应用使用对象的应用内特征数据输入转化概率预测模型,利用转化概率预测模型确定应用使用对象对目标信息的转化概率;根据应用使用对象在目标应用中的历史虚拟资源转移特征和历史信息使用特征,分别对各个应用使用对象对目标信息的转化概率进行修正,获得对应的修正转化概率;将修正转化概率大于预设阈值的应用使用对象作为目标对象,并将目标信息推送给所述目标对象。利用本说明书提供的技术方案,实现了目标应用中目标信息上线时,目标信息的准确投放,提升了信息的转化率。
Description
技术领域
本申请涉及计算机技术领域,尤其涉及一种信息推荐方法、装置及电子设备。
背景技术
随着科技的进步,信息的种类和数量也越来越多,对于有用的信息人们回去浏览或、使用,这样才能实现信息的转化。因此,需要给用户推荐其感兴趣的信息,才能提升信息的转化率。
一般的,可能会基于经验规则来进行信息推荐,但是,基于经验规则方案受人的主观经验影响较大,准确率较低,且缺乏逻辑完整性和说服力。
因此,如何提供一种信息推荐方案,能够提升信息推荐的准确性,进而提升信息的转化率,是本领域亟需解决的技术问题。
发明内容
本说明书实施例提供了一种信息推荐方法、装置、设备、存储介质、计算机程序产品,实现了目标应用中目标信息上线时,目标信息的准确投放,提升了信息的转化率和信息投放效果。
一方面,本说明书实施例提供了一种信息推荐方法,所述方法包括:
在目标应用有目标信息上线时,获取所述目标应用中各个应用使用对象在所述目标应用中的应用内特征数据;
将各个所述应用使用对象的应用内特征数据输入预先训练好的转化概率预测模型,利用所述转化概率预测模型确定各个所述应用使用对象对所述目标信息的转化概率;所述转化率预测模型基于所述目标应用中的历史应用使用对象的历史应用内特征数据以及所述历史应用使用对象对所述目标应用中上线的历史信息的转化数据训练获得;
根据各个所述应用使用对象在所述目标应用中的历史虚拟资源转移特征和历史信息使用特征,分别对各个所述应用使用对象对所述目标信息的转化概率进行修正,获得各个所述应用使用对象对应的修正转化概率;
将所述修正转化概率大于预设阈值的应用使用对象作为目标对象,并将所述目标信息推送给所述目标对象。
另一方面提供了一种信息推荐装置,所述装置包括:
特征获取模块,用于在目标应用有目标信息上线时,获取所述目标应用中各个应用使用对象在所述目标应用中的应用内特征数据;
转化率预测模块,用于将各个所述应用使用对象的应用内特征数据输入预先训练好的转化概率预测模型,利用所述转化概率预测模型确定各个所述应用使用对象对所述目标信息的转化概率;所述转化率预测模型基于所述目标应用中的历史应用使用对象的历史应用内特征数据以及所述历史应用使用对象对所述目标应用中上线的历史信息的转化数据训练获得;
转化率修正模块,用于根据各个所述应用使用对象在所述目标应用中的历史虚拟资源转移特征和历史信息使用特征,分别对各个所述应用使用对象对所述目标信息的转化概率进行修正,获得各个所述应用使用对象对应的修正转化概率;
信息推荐模块,用于将所述修正转化概率大于预设阈值的应用使用对象作为目标对象,并将所述目标信息推送给所述目标对象。
另一方面提供了一种电子设备,包括:处理器;
用于存储所述处理器可执行指令的存储器;
其中,所述处理器被配置为执行所述指令,以实现上述任一项所述的信息推荐方法。
另一方面提供了一种计算机可读存储介质,当所述存储介质中的指令由电子设备的处理器执行时,使得所述电子设备能够执行上述任一信息推荐方法。
另一方面提供了一种计算机程序产品或计算机程序,该计算机程序产品或计算机程序包括计算机指令,该计算机指令存储在计算机可读存储介质中。计算机设备的处理器从计算机可读存储介质读取该计算机指令,处理器执行该计算机指令,使得该计算机设备执行上述各种可选实现方式中提供的信息推荐方法。
本说明书实施例提供的信息推荐方法、装置、设备、存储介质、计算机程序产品,具有如下技术效果:
本说明书实施例提供的信息推荐方法,可以在目标应用要上线目标信息时,采集目标应用中应用使用对象在目标应用中的应用内特征数据,并利用训练好的转化率预测模型来对各个应用使用对象对目标信息的转化概率进行预测,获得各个应用使用对象对应的转化概率。再利用应用使用对象在目标应用中的历史虚拟资源转移特征以及历史信息使用特征等进一步对预测出的转化概率进行修正,基于修正后的修正转化概率来确定目标应用中对目标信息进行转化的概率比较高的目标对象,进而将目标信息推送给目标对象。本说明书实施例可以实现目标应用在上线新的目标信息时,自动识别目标应用内对该目标信息可能进行转化的概率比较高的应用使用对象,可以在开始进行信息投放就抓住很可能对该信息进行进一步转化的用户,提升信息转化率和信息转化效率。同时,考虑了应用使用对象在目标应用内的虚拟资源转移能力和应用内信息活跃能力对预测出的转化概率进行修正,提升了信息投放后信息的转化率和使用的频率,提升信息投放的效果。
附图说明
为了更清楚地说明本说明书实施例或现有技术中的技术方案和优点,下面将对实施例或现有技术描述中所需要使用的附图作简单的介绍,显而易见地,下面描述中的附图仅仅是本说明书的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其它附图。
图1是本说明书实施例提供的一种信息推荐方法的应用环境的示意图;
图2是本说明书一个实施例提供的信息推荐方法的流程示意图;
图3是一个场景示例中梯度提升决策树的结构示意图;
图4为样本在图3所示的场景示例中的模型中的叶节点的结构示意图;
图5是本说明书一个实施例中转化率预测模型的训练原理示意图;
图6是本说明书实施例提供的一种信息推荐装置的结构示意图;
图7是本说明书实施例提供的一种用于信息推荐电子设备的框图;
图8是本说明书实施例提供的另一种用于信息推荐电子设备的框图。
具体实施方式
下面将结合本说明书实施例中的附图,对本说明书实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本说明书一部分实施例,而不是全部的实施例。基于本说明书中的实施例,本领域普通技术人员在没有做出创造性劳动的前提下所获得的所有其他实施例,都属于本说明书保护的范围。
需要说明的是,本说明书实施例的说明书和权利要求书及上述附图中的术语“第一”、“第二”等是用于区别类似的对象,而不必用于描述特定的顺序或先后次序。应该理解这样使用的数据在适当情况下可以互换,以便这里描述的本说明书的实施例能够以除了在这里图示或描述的那些以外的顺序实施。此外,术语“包括”和“具有”以及他们的任何变形,意图在于覆盖不排他的包含,例如,包含了一系列步骤或单元的过程、方法、***、产品或服务器不必限于清楚地列出的那些步骤或单元,而是可包括没有清楚地列出的或对于这些过程、方法、产品或设备固有的其它步骤或单元。
请参阅图1,图1是本说明书实施例提供的一种信息推荐方法的应用环境的示意图,该应用环境至少可以包括服务器100和终端200。
在一个可选的实施例中,服务器100可以用于接收终端200发送的数据,基于接收到的数据来进行信息推荐。服务器100可以是独立的物理服务器,也可以是多个物理服务器构成的服务器集群或者分布式***,还可以是提供云服务、云数据库、云计算、云函数、云存储、网络服务、云通信、中间件服务、域名服务、安全服务、CDN、以及大数据和人工智能平台等基础云计算服务的云服务器。
在一个可选的实施例中,终端200可以是向服务器100发送数据的终端设备,如:可以是智能手机、台式计算机、平板电脑、笔记本电脑、智能穿戴设备、车载设备等类型的电子设备;也可以为运行于上述电子设备的软体,例如应用程序、小程序等。本说明书实施例中电子设备上运行的操作***可以包括但不限于安卓***、IOS***、linux、windows等。
此外,需要说明的是,图1所示的仅仅是一种信息推荐方法的应用环境的示意图,本说明书实施例并不以上述为限。
本说明书实施例中,上述服务器100和终端200可以通过有线或无线通信方式进行直接或间接地连接,本说明书实施例在此不做限制。
以下介绍本说明书实施例一种信息推荐方法,图2是本说明书一个实施例提供的信息推荐方法的流程示意图,本说明书提供了如实施例或流程图的方法操作步骤,但基于常规或者无创造性的劳动可以包括更多或者更少的操作步骤。实施例中列举的步骤顺序仅仅为众多步骤执行顺序中的一种方式,不代表唯一的执行顺序。在实际中的***或服务器产品执行时,可以按照实施例或者附图所示的方法顺序执行或者并行执行(例如并行处理器或者多线程处理的环境)。该方法可以应用于计算机、平板电脑、智能手机等终端设备上,当然,根据实际需要也可以应用在服务器中,本说明书实施例对此不做具体限定。具体的如图2所示,所述方法可以包括:
S202:在目标应用有目标信息上线时,获取目标应用中各个应用使用对象在目标应用中的应用内特征数据。
在具体的实施过程中,目标应用可以理解为能够提供指定服务的应用程序或小程序,如:购物APP(application,应用程序)、游戏APP、社交APP等,在目标应用上可以包含很多信息,用户可以在目标应用上查看或使用自己感兴趣的信息,如:若目标应用为游戏APP,该游戏APP上可以提供一种或多种游戏,用户可以根据自己的需要注册使用某种游戏,若目标应用为购物APP,该购物APP上可以包含多种商品信息,用户可以根据自己的需要浏览或购买感兴趣的商品。一般的,目标应用上会定时或不定时的更新一些信息,本说明书实施例中的目标信息可以理解为目标应用上新上线(可以理解为在目标应用内发布)或即将上线的信息,如:游戏APP上准备上线一种新游戏,该新游戏可以称为目标信息。当目标应用上有目标信息上线时,可以获取目标应用中各个应用使用对象在目标应用中的应用内特征数据,其中,应用使用对象可以理解为使用目标应用的用户或者在目标应用中注册过的用户,应用使用对象在目标应用中的应用内特征数据可以用于表征应用使用对象在目标应用中的活动特点,如:可以基于应用使用对象在目标应用中的信息使用情况来提取相关的特征数据。
本说明书一些实施例中,应用使用对象在目标应用中的应用内特征数据可以包括基础特征(如:在目标应用中的等级、是否留联系方式、是否预约过信息、历史预约信息数、操作***等)、虚拟资源转移特征(某些信息的使用或浏览可能需要购买,虚拟资源可以理解为应用使用对象在目标应用中购买信息或信息相关的产品时使用的虚拟资源,如:可以是积分或货币等)、信息活跃特征(即在一定时间内浏览或转化信息的特征)、在目标应用中的渠道特征(如:在目标应用中的注册时间、在目标应用中的活跃数据、在目标应用中是否担任特殊的角色等)、目标信息的同品类信息特征(如:是否浏览过目标信息的同品类信息等)。
本说明书一些实施例中,目标应用可以为社区游戏应用,目标信息为社区游戏应用中上线的目标游戏,获取目标应用中各个应用使用对象在目标应用中的应用内特征数据,包括:
获取社区游戏应用中各个应用使用对象在社区游戏应用中的基础特征、虚拟资源转移特征、游戏使用特征、社区游戏应用渠道特征、游戏注册特征以及目标游戏的同品类游戏特征。
在具体的实施过程中,本说明书实施例中的信息推荐方法可以应用于游戏类信息的推荐,在这种场景下,目标应用可以为一种社区游戏应用,社区游戏应用一般可以提供多种游戏服务,用户可以根据自己的需要选择注册一种或多种游戏。在游戏推荐场景时,可以在某款特定的社区游戏应用需要上线一款新游戏时,对该社区游戏应用内的用户进行分析,确定该社区游戏应用内哪些用户可能会注册使用新上线的游戏,从而将该新上线的游戏进行准确推送,提升新上线的游戏的转化率,同时可以提升社区游戏应用内的用户的注册率。当应用在游戏场景时,提取的应用内特征数据可以包括:
基础特征:应用使用对象在社区游戏应用中的等级、是否留联系方式、是否预约过某款游戏、历史预约游戏数、操作***等;
虚拟资源转移特征:(近1年、90天、30天等指定时间范围内)游戏活动期间的虚拟资源的转移数量、游戏活动期间的虚拟资源的转移天数、最近游戏活动期间的虚拟资源转移日期距今天的天数、近一年游戏活动期间的单日最高虚拟资源的转移数量、近4周每周虚拟资源的转移数量、主玩游戏的虚拟资源转移信息等;
游戏使用特征:如:近4周、2周或8周等每周使用游戏的数据、主玩游戏近1年、90天、30天等指定时间范围内的使用数据等;
社区游戏应用渠道特征:在社区游戏应用中注册距今天的天数、社区游戏应用是否月活跃、游戏专区活跃天数、领礼包次数、是否加入社团、是否关注公众号等;
游戏注册特征:如:近1年、90天、30天等指定时间范围内在舍弃游戏应用中首次注册其他游戏的次数等;
同品类游戏特征:目标游戏的同品类游戏的活跃特征、同品类游戏是否流失(最近登录时间距今天数)等。
本说明书实施例中的信息推荐可以应用于游戏推荐场景,并且,可以结合游戏场景,获取用户在特定的社区游戏应用中的相关特征,进而提升游戏推荐的准确性。
S204:将各个应用使用对象的应用内特征数据输入预先训练好的转化概率预测模型,利用转化概率预测模型确定各个应用使用对象对目标信息的转化概率;转化率预测模型基于目标应用中的历史应用使用对象的历史应用内特征数据以及历史应用使用对象对目标应用中上线的历史信息的转化数据训练获得。
在具体的实施过程中,本说明书实施例中可以预先获取目标应用中的历史应用使用对象对该目标应用中之前上线的历史信息的转化数据,以及目标应用中的历史应用使用对象的历史应用内特征数据,基于历史应用使用对象的历史应用内特征数据以及历史信息的转化数据训练构建转化率预测模型,该转化率预测模型可以用于预测目标应用内的用户对目标应用中的某个信息的转化概率,转化率预测模型的模型结构以及训练方式可以根据实际需要进行选择,本说明书实施例不做具体限定。其中,目标应用中的历史应用使用对象可以理解为在指定时间范围内使用目标应用的用户,可以与上述实施例中的应用使用对象相同,也可以不同。目标应用中上线的历史信息可以理解为在当前时间之前已经在目标应用中上线的历史信息,历史信息可以为一个或多个,具体可以根据实际需要设置。历史应用使用对象对目标应用中上线的历史信息的转化数据可以理解为历史应用使用对象是否使用历史信息的结果,如:若历史信息为一款商品,转化数据可以为是否在目标应用中购买该商品,若历史信息为一款游戏,转化数据可以为是否在目标应用中注册使用该游戏。
基于目标应用中的历史应用使用对象的相关数据训练构建出转化率预测模型,该转化率预测模型可以学习目标应用中的应用使用对象对目标应用中上线的信息进行转换的特点,从而能够准确的预测目标应用的应用使用对象对目标信息的转化概率。在目标应用需要上线一款新的目标信息时,获取到目标应用中各个应用使用对象在该目标应用中的应用内特征数据后,可以将获取到的应用内特征数据输入到训练好的转化率预测模型中,利用该转化率预测模型确定出各个应用使用对象对目标信息的转化概率。
在一些实施例中,转化概率预测模型的训练方法包括:
构建训练样本集,训练样本集中包括多个训练样本数据,每个训练样本数据包括真实信息转化结果;
利用训练样本集对初始转化概率预测模型进行训练,得到训练样本集中各个训练样本数据对应的模型预测结果;
计算各个训练样本数据的模型预测结果和各个训练样本数据之间的真实信息转化结果之间的差值,获得各个训练样本数据对应的残差;
若至少一个训练样本数据对应的残差大于预设残差,则提高残差大于预设残差的训练样本数据对应的权重,重新进行模型训练,直至各个训练样本数据对应的残差均小于预设残差,获得转化概率预测模型。
在具体的实施过程中,在训练转化率预测模型时,可以先采集样本数据,构建训练样本集,训练样本集中包括多个训练样本数据,训练样本数据可以包括目标应用中历史应用使用对象的应用内特征数据。此外,每个训练样本数据对应一个真实信息转化结果即该训练样本数据中的用户是否通过目标应用对某个信息进行信息转化,如:若信息为商品,则训练样本数据对应的真实信息转化结果可以为训练样本数据中的用户是否在目标应用中购买该商品。之后,可以构建一个初始转换率预测模型,设置模型参数等,再利用构建出的训练样本集中的训练样本数据对初始转化率预测模型进行训练,得到训练样本集中每个训练样本数据对应的模型预测结果。将各个训练样本数据的模型预测结果与其真实信息转化结果进行比较,计算模型预测结果和真实信息转化结果之间的差值,获得各个训练样本数据对应的残差。将各个训练样本数据对应的残差和预设残差进行比较,若至少一个残差大于预设残差,则提高残差大于预设残差的训练样本数据对应的权重,重新进行模型训练,重复上述模型训练过程,直至各个训练样本数据对应的残差均小于预设残差,完成模型训练构成,将各个训练样本数据对应的残差均小于预设残差时的初始转化率预测模型作为最终的转化率预测模型。
在模型训练过程中,通过比较各个训练样本数据对应的模型预测结果和真实信息转化结果,获得各个训练样本数据对应的残差,基于残差调整训练样本数据的权重,重复进行模型训练,对上一轮分类错误的训练样本数据提高权重,使得下一轮分类时重点对这些错误分类的样本进行训练,实质上利用训练样本数据的残差是对模型的一种优化训练,从而提升模型训练的准确性。
此外,本说明书一些实施例中,所述方法还包括:
构建验证样本集,验证样本集中包括多个验证样本数据,每个验证样本数据包括验证信息转化结果;
将验证样本集中的验证样本数据输入到所述转化概率预测模型,获得各个验证样本数据对应的验证预测结果;
基于各个验证样本数据的验证信息转化结果和验证预测结果,获得所述验证样本集中验证预测结果为真且验证信息转化结果为真的第一验证样本数量、验证信息转化结果为真的第二验证样本数量和验证预测结果与验证信息转化结果相同的第三验证样本数量;
计算第一验证样本数量和第二验证样本数量的比值,获得转化概率预测模型的第一验证指标;
计算第三验证样本数量与验证样本集中所有验证样本数据的数量的比值,获得转化概率预测模型的第二验证指标;
基于第一验证指标和第二验证指标,对转化概率预测模型进行准确性评估。
在具体的实施过程中,在转化率预测模型训练完成后,还可以利用验证样本数据对模型进行评估,具体的,可以先构建验证样本集,如:可以将模型训练时采集到的样本数据按照一定的比例分为训练样本数据和验证样本数据,将验证样本数据的集合作为验证样本集,验证样本集中可以包括多个验证样本数据,同样的,每个验证样本数据中可以包括验证信息转化结果即验证样本数据对应的用户是否对某个信息进行转化。在转化概率模型训练完成后,可以将验证样本集中的验证样本数据输入到训练好的转化概率预测模型,转化概率预测模型可以输出各个验证样本数据对应的验证预测结果。根据验证样本数据中验证信息转化结果以及验证预测结果,可以获得验证样本集中验证预测结果为真且验证信息转化结果为真的第一验证样本数量,以及验证信息转化结果为真的第二验证样本数量,以及验证预测结果与验证信息转化结果相同的第三验证样本数量。基于第一验证样本数量、第二验证样本数量以及第三验证样本数据,计算模型的评估指标,具体的,可以将第一验证样本数量和第二验证样本数量的比值作为第一验证指标,将第三验证样本数量与验证样本集中所有验证样本数据的数量的比值作为第二验证指标,基于第一验证指标和第二验证指标的具体取值来对转化概率预测模型进行准确性评估。例如:若第一验证指标和第二验证指标均满足预设的要求,则确定转化概率预测模型预测结果的准确性符合要求,或者若第一验证指标和第二验证指标中至少有一个满足预设的要求,则确定转化概率预测模型预测结果的准确性符合要求,具体的评估方式可以根据实际情况而定,本说明书实施例不做具体限定。
当然,若经过评估,确定训练好的转化率预测模型的准确性不符合要求,则可以对模型进行重新训练,确保后续信息推荐使用的模型的准确性,进而提升信息的转化率。
本说明书实施例利用验证样本集来对训练好转化率预测模型的准确性进行评估,进一步提升模型预测的准确性,为后续信息推荐奠定了准确的数据基础。
本说明书一些实施例中,转化概率预测模型采用梯度提升决策树算法(GBDT,Gradient Boosting Decision Tree)训练构建,转化概率预测模型中包括多个分类决策树,每个分类决策树分别用于训练不同的特征,利用训练样本集对初始转化概率预测模型进行训练,得到训练样本集中各个训练样本数据对应的模型预测结果,包括:
将训练样本集中的各个训练样本数据中的样本特征分别输入到对应的分类决策树中,基于各个分类决策树获得各个训练样本数据中的不同的样本特征对应的模型预测子结果;
基于各个训练样本数据中各个样本特征对应的模型预测子结果的和,分别获得各个训练样本数据对应的模型预测结果。
在具体的实施过程中,本说明书实施例中的转化概率预测模型可以采用GBDT算法来训练构建,其中,DT是指Decision Tree(即决策树),GB是指Gradient Boosting,是一种学习策略,GBDT的含义就是用Gradient Boosting的策略训练出来的DT模型。模型的结果是一组回归分类树组合(CART Tree Ensemble):T1…Tk,其中Tj学习的是之前j-1棵树预测结果的残差(残差指预测值和真实值之间的差异),这种思想就像准备考试前的复习,先做一遍习题册,然后把做错的题目挑出来,在做一次,然后把做错的题目挑出来在做一次,经过反复多轮训练,取得最好的成绩。而模型最后的输出,是一个样本在各个树中输出的结果的和。
表1
样本/特征 | age | is male | use computer daily | Like Computer Game |
用户1 | 5 | 1 | 1 | ? |
用户2 | 79 | 1 | 0 | ? |
用户3 | 75 | 0 | 0 | ? |
用户4 | 29 | 0 | 1 | ? |
用户5 | 8 | 0 | 0 | ? |
图3是一个场景示例中梯度提升决策树的结构示意图,如图3所示,下面结合图3介绍本说明书实施例中的梯度提升决策树模型的结构和原理,假设要预测一个人是否会喜欢电脑游戏,特征包括年龄,性别是否为男,是否每天使用电脑。标签(label)为是否喜欢电脑游戏,训练出如图3所示的决策树模型,该模型由两棵树组成,tree1使用age<15和is male(是否为男性)作为内节点,叶子节点是输出的分数。tree2使用use computer daily(是否每日使用电脑)作为根节点。假设测试样本如表1所示,其中,最后一列Like Computer Game(是否喜欢电脑游戏)即为样本标签。
图4为样本在图3所示的场景示例中的模型中的叶节点的结构示意图,如图4所示,最后对某样本累加它所在的叶子节点的输出值,例如:F(用户1)=2+0.9=2.9,F(用户2)=-1-0.9=-1.9。GBDT是一个加法模型,它串行地训练一组决策树,最终对所有决策树的预测结果加和,由此得到一个强学习器,每一颗新树都拟合当前损失函数的负梯度方向。
其中,加法模型的函数形式可以为:其中,T表示基学习器的数量,ft(x)表示第t个学习器模型。接下来,使用上述公式表示GBDT训练的模型。
假设已经有了t-1个学习器的组合,它们的输出结果是下一个基学习器模型表示为ft(x)。对于一个函数f(x),如果想得到一个更小的f(x),可以对x做一个负梯度的更新,也就是:/>
同理,对于损失函数如果想要得到一个更小的损失函数,可以对/>做一个如下的更新:
由于GBDT是一个加法模型,因此,下一轮的基模型应该去拟合:
最后可以通过sigmoid函数转换为预测转化概率值:
由以上内容可以看出,本说明书实施例中,梯度提升决策树中可以包括多个分类决策树,每个分类决策树可以用来训练不同的特征,每个训练样本数据中可以包括多个样本特征,多个样本特征可以分别由训练该类别的特征的分类决策树进行训练。具体的,图5是本说明书一个实施例中转化率预测模型的训练原理示意图,如图5所示,在转化率预测模型的训练过程中,可以将训练样本集中的各个训练样本数据中的样本特征(即图5中的D1、D2、......、Di)分别输入到训练该特征的分类决策树(即图5中的分类器C1、C2、......、Ci)中,分类决策树可以输出各个训练样本数据中不同样本特征的模型预测子结果,再将各个训练样本数据中各个样本特征对应的模型预测子结果的和作为各个训练样本数据的模型预测结果。
其中,在一个实施例中,转化率预测模型的具体训练过程可以参考如下:
a.特征离散化(一般是等频离散化),并将训练样本按7:3的比例随机划分训练样本集、验证样本集。
b.利用分类决策树对训练样本集中的训练样本数据进行训练,得到模型预测结果,计算模型预测结果和真实信息转化结果的差值,获得训练样本数据对应的残差。其中,模型训练的过程可以参见上述图5所示。
c.上一步学习的残差如果高于预设残差,就提高该训练样本数据的权重(提高权重就会使得更多分类决策树针对上一轮划分错误的训练样本数据进行训练,使得原来划分错误的样本数据趋向于划分正确),利用新生成的树重新进行训练。
d.循环上面步骤,直到所有训练样本数据的残差低于预设残差,获得转化率预测模型。
e.利用上述实施例中的第一验证指标和第二验证指标对训练好的转化率预测模型进行评估。
本说明书实施例采用GBDT算法训练构建转化率预测模型,利用GBDT中各个分类决策树分别学习不同的特征,可以提升模型训练的效率和准确性,进而提升信息推荐的速度和准确性。
此外,当本说明书实施例中的信息推荐应用于游戏推荐场景时,即目标应用为社区游戏应用时,转化概率预测模型确定出的各个应用使用对象对目标信息的转化概率为各个应用使用对象在社区游戏应用中注册使用目标游戏的概率。
在具体的实施过程中,参见上述实施例的记载,本说明书实施例中的信息推荐可以应用于游戏场景,即特定的社区游戏应用中有目标游戏要上线时,转化率预测模型预测出的各个应用使用对象对目标信息的转换概率可以表征各个应用使用对象在社区游戏应用中注册使用目标游戏的概率。目标游戏是该社区游戏应用中新上线的游戏,应用使用对象在社区游戏应用中注册使用目标游戏,则为在社区游戏应用中首次注册使用该目标游戏,通常情况下,首次在该一个渠道完成某款游戏注册,可以称为染色,因此,本说明书实施例中在游戏推荐场景中,信息的转化概率也可以理解为社区游戏应用中目标游戏的染色概率。在新游戏上线时,抓住有注册倾向且对渠道有偏好的用户,是实现渠道染色流水的重要一环,本说明书实施例中的信息推荐可以应用在游戏推荐场景,利用转化率预测模型,来识别社区游戏应用中哪些用户可能对新上线的目标游戏有染色偏好,从而进行目标游戏的投放,提升目标游戏在社区游戏应用投放时的染色率。
转化概率预测模型训练使用的样本数据,可以包括正样本和负样本,例如:信息推荐应用于游戏推荐场景时,转化概率预测模型训练使用的正样本可以为在社区游戏应用中有染色过的用户的应用内特征数据,负样本可以为在社区游戏应用中没有染色过的用户的应用内特征数据。此外,正样本和负样本的比例可以根据实际需要进行设置,本说明书实施例不做具体限定。
S206:根据各个应用使用对象在目标应用中的历史虚拟资源转移特征和历史信息使用特征,分别对各个应用使用对象对目标信息的转化概率进行修正,获得各个应用使用对象对应的修正转化概率。
在具体的实施过程中,在利用转化率预测模型预测出目标应用中各个应用使用对象对目标信息的转化概率后,还可以基于各个应用使用对像在目标应用中的历史虚拟资源转移特征以及历史信息使用特征,来对各个应用使用对像的转化概率进行修正,获得各个应用使用对像的修正转化概率。历史虚拟资源转移特征可以理解为在指定时间范围(如:1年内、1个月内等)内应用使用对像在目标应用中通过转移虚拟资源来使用其他的信息的数据,如:通过积分兑换的方式获取某个商品。历史信息使用特征可以理解为在指定时间范围内应用使用对像在目标应用中浏览或使用信息的次数或时长等,历史信息使用特征可以表征应用使用对像在目标应用中的信息活跃能力。利用应用使用对象在目标应用中的虚拟资源转移特征以及应用使用特征进一步对预测出的转化概率进行修正,使得信息投放时能够兼顾应用使用对象在目标应用内的虚拟资源的转移能力和信息活跃能力,提升信息投放后使用的频率。
其中,基于各个应用使用对像在目标应用中的历史虚拟资源转移特征以及历史信息使用特征,对各个应用使用对像的转化概率的具体修正方法可以根据实际需要而定,如:可以基于专家经验来确定历史虚拟资源转移特征以及历史信息使用特征与信息的转化概率之间的关系,从而对预测出的转化概率进行修正,或者利用机器学习模型学习历史虚拟资源转移特征以及历史信息使用特征与信息的转化概率之间的函数关系,基于机器学习模型来对预测出的转化概率进行修正。
S208:将修正转化概率大于预设阈值的应用使用对象作为目标对象,并将目标信息推送给目标对象。
在具体的实施过程中,在对转化率预测模型预测出的各个应用使用对象的转化概率进行修正后,可以将获得的各个应用使用对象的修正转化概率与预设阈值进行比较,将修正转化概率大于预设阈值的应用使用对象作为目标对象,目标对象可以认为在目标应用中对目标信息进行转化的概率比较高的用户,如:在游戏推荐场景中,目标对象可以理解为在特定的社区游戏应用中对目标游戏有比较高的染色倾向的用户。筛选出目标对象后,可以将目标信息推送给目标对象,如:将含有目标信息的链接或小程序等推送给目标对象的手机终端,或者将目标信息即将上线的信息推送到目标对象在目标应用的账号中,当然,也可以有其他的推送方式,本说明书实施例不做具体限定。
本说明书实施例提供了一种信息推荐方法,可以在目标应用要上线目标信息时,采集目标应用中应用使用对象在目标应用中的应用内特征数据,并利用训练好的转化率预测模型来对各个应用使用对象对目标信息的转化概率进行预测,获得各个应用使用对象对应的转化概率。再利用应用使用对象在目标应用中的虚拟资源的转移特征以及应用使用特征等进一步对预测出的转化概率进行修正,基于修正后获得的修正转化概率来确定目标应用中对目标信息进行转化的概率比较高的目标对象,进而将目标信息推送给目标对象。本说明书实施例可以实现目标应用在上线新的目标信息时,自动识别目标应用内对该目标信息可能进行转化的概率比较高的应用使用对象,可以在开始进行信息投放就抓住很可能对该信息进行进一步转化的用户,提升信息转化率和信息转化效率。同时,考虑了应用使用对象在目标应用内的虚拟资源的转移能力和应用内信息活跃能力对预测出的转化概率进行修正,提升了信息投放后信息的转化率和使用的频率,提升信息投放的效果。
本说明书一些实施例中,根据各个应用使用对象在目标应用中的历史虚拟资源转移特征和历史信息使用特征,分别对各个应用使用对象对目标信息的转化概率进行修正,获得各个应用使用对象对应的修正转化概率,包括:
分别计算各个应用使用对象在目标应用中的历史虚拟资源转移特征与历史信息使用特征的和的指数函数值;
将各个应用使用对象对应的指数函数值与预设修正数值相加,获得各个应用使用对象对应的修正参数;
计算各个应用使用对象对目标信息的转化概率分别与各个应用使用对象对应的修正参数的比值,获得各个应用使用对象对应的修正转化概率。
在具体的实施过程中,在对模型预测出的转化概率进行修正时,可以先计算应用使用对象在目标应用中的历史虚拟资源转移特征与历史信息使用特征的和的指数函数值,如:若应用使用对象A在目标应用中的历史虚拟资源转移特征为s、历史信息使用特征为h,则可以将历史虚拟资源转移特征s与历史信息使用特征h相加后进行指数函数计算,即可以将s+h作为某个底数的幂值,如:应用使用对象A对应的指数函数值可以表示为y=a(s+h),其中,y为应用使用对象A对应的指数函数值,a可以理解为指数函数的底数,a的具体取值可以根据实际需要进行设置,本说明书实施例不做具体限定。
获得各个应用使用对象在目标应用中的历史虚拟资源转移特征与历史信息使用特征的和的指数函数值后,可以将计算出的指数函数值与预设修正数值相加,获得各个应用使用对象对应的修正参数,其中,预设修正数值可以根据实际需要进行设置,如:可以为1或2或10等,本说明书实施例不做具体限定。再计算模型预测出的各个应用使用对象对应的转化概率分别与该应用使用对象对应的修正参数的比值,获得各个应用使用对应对应的修正转化概率。基于修正转化概率可以将目标信息准确的投放给目标应用中转化率高且虚拟资源的转移能力强、信息活跃能力强的目标对象,提升目标信息的转化率和投放后的使用频率,提升信息投放的效果。
本说明书实施例给出了基于应用使用对象在目标应用中的历史虚拟资源转移特征与历史信息使用特征进行转化概率修正的具体方式,充分考虑了用户在应用中的虚拟资源的转移能力和信息活跃能力对投放的信息的转化率和使用频率的影响,提升了目标信息的转化率和投放后的使用频率。
本说明书一些实施例中,分别计算各个应用使用对象在目标应用中的历史虚拟资源转移特征与历史信息使用特征的和的指数函数值,包括:
将各个应用使用对象在目标应用中的历史虚拟资源转移特征与预设的虚拟资源转移权重相乘,获得各个应用使用对象对应的资源转移参数;
将各个应用使用对象在目标应用中的历史信息使用特征与预设的活跃权重相乘,获得各个应用使用对象对应的活跃修正参数;
分别计算各个应用使用对象在目标应用中的资源转移参数与活跃修正参数的和的指数函数,获得各个所述应用使用对象对应的指数函数值。
在具体的实施过程中,虚拟资源的转移能力和信息活跃能力对用户对信息的转化概率的影响程度可能是不同的,可以根据实际情况分别设置虚拟资源转移权重和活跃权重,基于虚拟资源转移权重和活跃权重来计算各个应用使用对象在目标应用中的历史虚拟资源转移特征与历史信息使用特征的和的指数函数值。其中,虚拟资源转移权重和活跃权重的数值一般在0-1之间,具体的取值可以根据不同的目标应用或不同类别的目标信息进行设置,本说明书实施例不做具体限定。在计算指数函数值时,可以将各个应用使用对象在目标应用中的历史虚拟资源转移特征与预设的虚拟资源转移权重相乘,获得各个应用使用对象对应的资源转移参数,同样的,将各个应用使用对象在目标应用中的历史信息使用特征与预设的活跃权重相乘,获得各个应用使用对象对应的活跃修正参数。将资源转移参数和活跃修正参数相加后进行指数计算,获得应用使用对象对应的指数函数值。
以游戏场景为例,在将信息推荐应用到游戏场景时,在由上述实施例中记载的树模型得到社区游戏应用中各个用户的染色偏好预测概率(即模型预测出的转化概率)后,还需要考虑用户在游戏内的进行虚拟资源转移情况、游戏活跃情况,实现对模型预测概率进行修正。修正的目的是解决模型预测染色偏好高,但虚拟资源的转移能力、游戏活跃能力弱的情况。使得依据模型预测概率筛选染色偏好用户投放时,能兼顾用户的虚拟资源的转移能力、游戏活跃能力,提升新游戏上线后投放的准确性,以及投放后游戏的注册使用概率和使用频率,同时,提升游戏投放的ROI(return on investment,投资回报率)。
其中,在一些场景示例中,预测概率的修正公式可以参考如下:
其中,pi可以理解为修正转化概率,p可以理解为模型预测输出的转化概率,在游戏场景中,p可以理解为模型预测输出的染色偏好概率,ltv可以理解为用户在目标应用中的历史虚拟资源转移特征,如:在游戏内的通过虚拟资源购买信息,使用的虚拟资源,act可以理解为用户在目标应用内的历史信息使用特征,如:在游戏内的活跃信息,α可以理解为虚拟资源转移权重(取值介于0-1),β可以理解为活跃权重(取值介于0-1)。
本说明书实施例在对模型预测出的转化概率进行修正时,考虑了用户在目标应用内的虚拟资源的转移特征以及信息活跃特征,同时,还考虑了虚拟资源的转移特征和信息活跃特征对转化概率的影响程度的区别,提升了转化概率修正的准确性,进而能够提升信息投放后用户对投放的信息的转化概率和使用频率,提升信息投放的效果。
基于上述所述的信息推荐方法,本说明书一个或多个实施例还提供一种信息推荐处理的终端、服务端。所述终端、服务端可以包括使用了本说明书实施例所述方法的装置(包括分布式***)、软件(应用)、模块、组件、服务器、终端等并结合必要的实施硬件的装置。基于同一创新构思,本说明书实施例提供的一个或多个实施例中的装置如下面的实施例所述。由于装置解决问题的实现方案与方法相似,因此本说明书实施例具体的装置的实施可以参考前述方法的实施,重复之处不再赘述。以下所使用的,术语“单元”或者“模块”可以实现预定功能的软件和/或硬件的组合。尽管以下实施例所描述的装置较佳地以软件来实现,但是硬件,或者软件和硬件的组合的实现也是可能并被构想的。
由以上本说明书实施例提供的技术方案可见,本说明书本说明书实施例还提供了一种信息推荐装置,图6是本说明书实施例提供的一种信息推荐装置的结构示意图,如图6所示,上述装置包括:
特征获取模块610,用于在目标应用有目标信息上线时,获取所述目标应用中各个应用使用对象在所述目标应用中的应用内特征数据;
转化率预测模块620,用于将各个所述应用使用对象的应用内特征数据输入预先训练好的转化概率预测模型,利用所述转化概率预测模型确定各个所述应用使用对象对所述目标信息的转化概率;所述转化率预测模型基于所述目标应用中的历史应用使用对象的历史应用内特征数据以及所述历史应用使用对象对所述目标应用中上线的历史信息的转化数据训练获得;
转化率修正模块630,用于根据各个所述应用使用对象在所述目标应用中的历史虚拟资源转移特征和历史信息使用特征,分别对各个所述应用使用对象对所述目标信息的转化概率进行修正,获得各个所述应用使用对象对应的修正转化概率;
信息推荐模块640,用于将所述修正转化概率大于预设阈值的应用使用对象作为目标对象,并将所述目标信息推送给所述目标对象。
在一些实施例中,所述转化率修正模块630具体用于:
分别计算各个所述应用使用对象在所述目标应用中的历史虚拟资源转移特征与历史信息使用特征的和的指数函数值;
将各个所述应用使用对象对应的指数函数值与预设修正数值相加,获得各个所述应用使用对象对应的修正参数;
计算各个所述应用使用对象对所述目标信息的转化概率分别与各个所述应用使用对象对应的修正参数的比值,获得各个所述应用使用对象对应的修正转化概率。
在一些实施例中,所述转化率修正模块630具体用于:
将各个所述应用使用对象在所述目标应用中的历史虚拟资源转移特征与预设的虚拟资源转移权重相乘,获得各个所述应用使用对象对应的资源转移参数;
将各个所述应用使用对象在所述目标应用中的历史信息使用特征与预设的活跃权重相乘,获得各个所述应用使用对象对应的活跃修正参数;
分别计算各个所述应用使用对象在所述目标应用中的资源转移参数与活跃修正参数的和的指数函数,获得各个所述应用使用对象对应的指数函数值。
在一些实施例中,所述装置还包括模型训练模块,用于:
构建训练样本集,所述训练样本集中包括多个训练样本数据,每个训练样本数据包括真实信息转化结果;
利用训练样本集对初始转化概率预测模型进行训练,得到所述训练样本集中各个训练样本数据对应的模型预测结果;
计算各个训练样本数据的模型预测结果和各个训练样本数据之间的真实信息转化结果之间的差值,获得各个训练样本数据对应的残差;
若至少一个训练样本数据对应的残差大于预设残差,则提高残差大于预设残差的训练样本数据对应的权重,重新进行模型训练,直至各个训练样本数据对应的残差均小于所述预设残差,获得所述转化概率预测模型。
在一些实施例中,所述模型训练模块还用于:
构建验证样本集,所述验证样本集中包括多个验证样本数据,每个验证样本数据包括验证信息转化结果;
将验证样本集中的验证样本数据输入到所述转化概率预测模型,获得各个验证样本数据对应的验证预测结果;
基于各个验证样本数据的验证信息转化结果和验证预测结果,获得所述验证样本集中验证预测结果为真且验证信息转化结果为真的第一验证样本数量、验证信息转化结果为真的第二验证样本数量和验证预测结果与验证信息转化结果相同的第三验证样本数量;
计算所述第一验证样本数量和所述第二验证样本数量的比值,获得所述转化概率预测模型的第一验证指标;
计算所述第三验证样本数量与所述验证样本集中所有验证样本数据的数量的比值,获得所述转化概率预测模型的第二验证指标;
基于所述第一验证指标和所述第二验证指标,对所述转化概率预测模型进行准确性评估。
在一些实施例中,所述转化概率预测模型采用梯度提升决策树算法训练构建,所述转化概率预测模型中包括多个分类决策树,每个分类决策树分别用于训练不同的特征,所述模型训练模块具体用于:
将所述训练样本集中的各个训练样本数据中的样本特征分别输入到对应的分类决策树中,基于各个分类决策树获得各个训练样本数据中的不同的样本特征对应的模型预测子结果;
基于各个训练样本数据中各个样本特征对应的模型预测子结果的和,分别获得各个训练样本数据对应的模型预测结果。
在一些实施例中,所述目标应用为社区游戏应用,所述目标信息为所述社区游戏应用中上线的目标游戏,所述特征获取模块610具体用于:
获取所述社区游戏应用中各个应用使用对象在所述社区游戏应用中的基础特征、虚拟资源转移特征、游戏使用特征、社区游戏应用渠道特征、游戏注册特征以及所述目标游戏的同品类游戏特征;
所述转化率预测模块620利用所述转化概率预测模型确定出的各个所述应用使用对象对所述目标信息的转化概率为各个所述应用使用对象在所述社区游戏应用中注册使用所述目标游戏的概率。
关于上述实施例中的装置,其中各个模块执行操作的具体方式已经在有关该方法的实施例中进行了详细描述,此处将不做详细阐述说明。上述实施例中的装置根据方法实施例的描述还可以包括其他的实施方式,具体的实现方式可以参照相关方法实施例的描述,在此不作一一赘述。
图7是本说明书实施例提供的一种用于信息推荐电子设备的框图,该电子设备可以是终端,其内部结构图可以如图7所示。该电子设备包括通过***总线连接的处理器、存储器、网络接口、显示屏和输入装置。其中,该电子设备的处理器用于提供计算和控制能力。该电子设备的存储器包括非易失性存储介质、内存储器。该非易失性存储介质存储有操作***和计算机程序。该内存储器为非易失性存储介质中的操作***和计算机程序的运行提供环境。该电子设备的网络接口用于与外部的终端通过网络连接通信。该计算机程序被处理器执行时以实现一种信息推荐方法。该电子设备的显示屏可以是液晶显示屏或者电子墨水显示屏,该电子设备的输入装置可以是显示屏上覆盖的触摸层,也可以是电子设备外壳上设置的按键、轨迹球或触控板,还可以是外接的键盘、触控板或鼠标等。
图8是本说明书实施例提供的另一种用于信息推荐电子设备的框图,该电子设备可以是服务器,其内部结构图可以如图8所示。该电子设备包括通过***总线连接的处理器、存储器和网络接口。其中,该电子设备的处理器用于提供计算和控制能力。该电子设备的存储器包括非易失性存储介质、内存储器。该非易失性存储介质存储有操作***和计算机程序。该内存储器为非易失性存储介质中的操作***和计算机程序的运行提供环境。该电子设备的网络接口用于与外部的终端通过网络连接通信。该计算机程序被处理器执行时以实现一种信息推荐方法。
本领域技术人员可以理解,图7或图8中示出的结构,仅仅是与本说明书实施例方案相关的部分结构的框图,并不构成对本说明书实施例方案所应用于其上的电子设备的限定,具体的电子设备可以包括比图中所示更多或更少的部件,或者组合某些部件,或者具有不同的部件布置。
在示例性实施例中,还提供了一种电子设备,包括:处理器;用于存储该处理器可执行指令的存储器;其中,该处理器被配置为执行该指令,以实现如本说明书实施例中的信息推荐方法。
在示例性实施例中,还提供了一种计算机可读存储介质,当该存储介质中的指令由电子设备的处理器执行时,使得电子设备能够执行本说明书实施例中的信息推荐方法。
在示例性实施例中,还提供了一种计算机程序产品或计算机程序,该计算机程序产品或计算机程序包括计算机指令,该计算机指令存储在计算机可读存储介质中。计算机设备的处理器从计算机可读存储介质读取该计算机指令,处理器执行该计算机指令,使得该计算机设备执行上述各种可选实现方式中提供的信息推荐方法。
可以理解的是,在本说明书的具体实施方式中,涉及到用户相关的数据,当本说明书以上实施例运用到具体产品或技术中时,需要获得用户许可或者同意,且相关数据的收集、使用和处理需要遵守相关国家和地区的相关法律法规和标准。
本领域普通技术人员可以理解实现上述实施例方法中的全部或部分流程,是可以通过计算机程序来指令相关的硬件来完成,该计算机程序可存储于一非易失性计算机可读取存储介质中,该计算机程序在执行时,可包括如上述各方法的实施例的流程。其中,本说明书所提供的各实施例中所使用的对存储器、存储、数据库或其它介质的任何引用,均可包括非易失性和/或易失性存储器。非易失性存储器可包括只读存储器(ROM)、可编程ROM(PROM)、电可编程ROM(EPROM)、电可擦除可编程ROM(EEPROM)或闪存。易失性存储器可包括随机存取存储器(RAM)或者外部高速缓冲存储器。作为说明而非局限,RAM以多种形式可得,诸如静态RAM(SRAM)、动态RAM(DRAM)、同步DRAM(SDRAM)、双数据率SDRAM(DDRSDRAM)、增强型SDRAM(ESDRAM)、同步链路(Synchlink)DRAM(SLDRAM)、存储器总线(Rambus)直接RAM(RDRAM)、直接存储器总线动态RAM(DRDRAM)、以及存储器总线动态RAM(RDRAM)等。
本领域技术人员在考虑说明书及实践这里公开的发明后,将容易想到本说明书实施例的其它实施方案。本说明书旨在涵盖本说明书实施例的任何变型、用途或者适应性变化,这些变型、用途或者适应性变化遵循本说明书实施例的一般性原理并包括本说明书实施例未公开的本技术领域中的公知常识或惯用技术手段。说明书和实施例仅被视为示例性的,本说明书实施例的真正范围和精神由下面的权利要求指出。
应当理解的是,本说明书实施例并不局限于上面已经描述并在附图中示出的精确结构,并且可以在不脱离其范围进行各种修改和改变。本说明书实施例的范围仅由所附的权利要求来限制。
Claims (10)
1.一种信息推荐方法,其特征在于,所述方法包括:
在目标应用有目标信息上线时,获取所述目标应用中各个应用使用对象在所述目标应用中的应用内特征数据;
将各个所述应用使用对象的应用内特征数据输入预先训练好的转化概率预测模型,利用所述转化概率预测模型确定各个所述应用使用对象对所述目标信息的转化概率;所述转化率预测模型基于所述目标应用中的历史应用使用对象的历史应用内特征数据以及所述历史应用使用对象对所述目标应用中上线的历史信息的转化数据训练获得;
根据各个所述应用使用对象在所述目标应用中的历史虚拟资源转移特征和历史信息使用特征,分别对各个所述应用使用对象对所述目标信息的转化概率进行修正,获得各个所述应用使用对象对应的修正转化概率;
将所述修正转化概率大于预设阈值的应用使用对象作为目标对象,并将所述目标信息推送给所述目标对象。
2.根据权利要求1所述的方法,其特征在于,所述根据各个所述应用使用对象在所述目标应用中的历史虚拟资源转移特征和历史信息使用特征,分别对各个所述应用使用对象对所述目标信息的转化概率进行修正,获得各个所述应用使用对象对应的修正转化概率,包括:
分别计算各个所述应用使用对象在所述目标应用中的历史虚拟资源转移特征与历史信息使用特征的和的指数函数值;
将各个所述应用使用对象对应的指数函数值与预设修正数值相加,获得各个所述应用使用对象对应的修正参数;
计算各个所述应用使用对象对所述目标信息的转化概率分别与各个所述应用使用对象对应的修正参数的比值,获得各个所述应用使用对象对应的修正转化概率。
3.根据权利要求2所述的方法,其特征在于,所述分别计算各个所述应用使用对象在所述目标应用中的历史虚拟资源转移特征与历史信息使用特征的和的指数函数值,包括:
将各个所述应用使用对象在所述目标应用中的历史虚拟资源转移特征与预设的虚拟资源转移权重相乘,获得各个所述应用使用对象对应的资源转移参数;
将各个所述应用使用对象在所述目标应用中的历史信息使用特征与预设的活跃权重相乘,获得各个所述应用使用对象对应的活跃修正参数;
分别计算各个所述应用使用对象在所述目标应用中的资源转移参数与活跃修正参数的和的指数函数,获得各个所述应用使用对象对应的指数函数值。
4.根据权利要求1所述的方法,其特征在于,所述转化概率预测模型的训练方法包括:
构建训练样本集,所述训练样本集中包括多个训练样本数据,每个训练样本数据包括真实信息转化结果;
利用训练样本集对初始转化概率预测模型进行训练,得到所述训练样本集中各个训练样本数据对应的模型预测结果;
计算各个训练样本数据的模型预测结果和各个训练样本数据之间的真实信息转化结果之间的差值,获得各个训练样本数据对应的残差;
若至少一个训练样本数据对应的残差大于预设残差,则提高残差大于预设残差的训练样本数据对应的权重,重新进行模型训练,直至各个训练样本数据对应的残差均小于所述预设残差,获得所述转化概率预测模型。
5.根据权利要求4所述的方法,其特征在于,所述方法还包括:
构建验证样本集,所述验证样本集中包括多个验证样本数据,每个验证样本数据包括验证信息转化结果;
将验证样本集中的验证样本数据输入到所述转化概率预测模型,获得各个验证样本数据对应的验证预测结果;
基于各个验证样本数据的验证信息转化结果和验证预测结果,获得所述验证样本集中验证预测结果为真且验证信息转化结果为真的第一验证样本数量、验证信息转化结果为真的第二验证样本数量和验证预测结果与验证信息转化结果相同的第三验证样本数量;
计算所述第一验证样本数量和所述第二验证样本数量的比值,获得所述转化概率预测模型的第一验证指标;
计算所述第三验证样本数量与所述验证样本集中所有验证样本数据的数量的比值,获得所述转化概率预测模型的第二验证指标;
基于所述第一验证指标和所述第二验证指标,对所述转化概率预测模型进行准确性评估。
6.根据权利要求4所述的方法,其特征在于,所述转化概率预测模型采用梯度提升决策树算法训练构建,所述转化概率预测模型中包括多个分类决策树,每个分类决策树分别用于训练不同的特征,所述利用训练样本集对初始转化概率预测模型进行训练,得到所述训练样本集中各个训练样本数据对应的模型预测结果,包括:
将所述训练样本集中的各个训练样本数据中的样本特征分别输入到对应的分类决策树中,基于各个分类决策树获得各个训练样本数据中的不同的样本特征对应的模型预测子结果;
基于各个训练样本数据中各个样本特征对应的模型预测子结果的和,分别获得各个训练样本数据对应的模型预测结果。
7.根据权利要求1所述的方法,其特征在于,所述目标应用为社区游戏应用,所述目标信息为所述社区游戏应用中上线的目标游戏,所述获取所述目标应用中各个应用使用对象在所述目标应用中的应用内特征数据,包括:
获取所述社区游戏应用中各个应用使用对象在所述社区游戏应用中的基础特征、虚拟资源转移特征、游戏使用特征、社区游戏应用渠道特征、游戏注册特征以及所述目标游戏的同品类游戏特征;
所述转化概率预测模型确定出的各个所述应用使用对象对所述目标信息的转化概率为各个所述应用使用对象在所述社区游戏应用中注册使用所述目标游戏的概率。
8.一种信息推荐装置,其特征在于,所述装置包括:
特征获取模块,用于在目标应用有目标信息上线时,获取所述目标应用中各个应用使用对象在所述目标应用中的应用内特征数据;
转化率预测模块,用于将各个所述应用使用对象的应用内特征数据输入预先训练好的转化概率预测模型,利用所述转化概率预测模型确定各个所述应用使用对象对所述目标信息的转化概率;所述转化率预测模型基于所述目标应用中的历史应用使用对象的历史应用内特征数据以及所述历史应用使用对象对所述目标应用中上线的历史信息的转化数据训练获得;
转化率修正模块,用于根据各个所述应用使用对象在所述目标应用中的历史虚拟资源转移特征和历史信息使用特征,分别对各个所述应用使用对象对所述目标信息的转化概率进行修正,获得各个所述应用使用对象对应的修正转化概率;
信息推荐模块,用于将所述修正转化概率大于预设阈值的应用使用对象作为目标对象,并将所述目标信息推送给所述目标对象。
9.一种电子设备,其特征在于,包括:
处理器;
用于存储所述处理器可执行指令的存储器;
其中,所述处理器被配置为执行所述指令,以实现如权利要求1至7中任一项所述的信息推荐方法。
10.一种计算机可读存储介质,其特征在于,当所述存储介质中的指令由电子设备的处理器执行时,使得所述电子设备能够执行如权利要求1至7中任一项所述的信息推荐方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202311506775.1A CN117454010A (zh) | 2023-11-13 | 2023-11-13 | 信息推荐方法、装置及电子设备 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202311506775.1A CN117454010A (zh) | 2023-11-13 | 2023-11-13 | 信息推荐方法、装置及电子设备 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN117454010A true CN117454010A (zh) | 2024-01-26 |
Family
ID=89587269
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202311506775.1A Pending CN117454010A (zh) | 2023-11-13 | 2023-11-13 | 信息推荐方法、装置及电子设备 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN117454010A (zh) |
-
2023
- 2023-11-13 CN CN202311506775.1A patent/CN117454010A/zh active Pending
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN109902222B (zh) | 一种推荐方法及装置 | |
US10187490B2 (en) | Discovering signature of electronic social networks | |
CN110473083B (zh) | 树状风险账户识别方法、装置、服务器及存储介质 | |
CN106097043B (zh) | 一种信用数据的处理方法及服务器 | |
CN110246037B (zh) | 交易特征预测方法、装置、服务器及可读存储介质 | |
CN111274501B (zh) | 推送信息的方法、***和非暂时性存储介质 | |
CN112365007B (zh) | 模型参数确定方法、装置、设备及存储介质 | |
CN108133390A (zh) | 用于预测用户行为的方法和装置以及计算设备 | |
CN113190688A (zh) | 基于逻辑推理和图卷积的复杂网络链接预测方法及*** | |
CN111797320A (zh) | 数据处理方法、装置、设备及存储介质 | |
CN115049397A (zh) | 识别社交网络中的风险账户的方法及装置 | |
CN117999562A (zh) | 用于量化联邦学习中的客户端贡献的方法和*** | |
CN113850669A (zh) | 用户分群方法、装置、计算机设备及计算机可读存储介质 | |
CN113743594A (zh) | 网络流量预测模型建立方法、装置、电子设备及存储介质 | |
CN113011966A (zh) | 基于深度学习的信用评分方法及装置 | |
CN116976739A (zh) | 一种云计算产品需求优先级排序方法和*** | |
US20230351153A1 (en) | Knowledge graph reasoning model, system, and reasoning method based on bayesian few-shot learning | |
CN117454010A (zh) | 信息推荐方法、装置及电子设备 | |
CN113822464A (zh) | 用户信息的处理方法及装置、电子设备、存储介质 | |
CN114169906A (zh) | 电子券推送方法、装置 | |
CN117815674B (zh) | 游戏信息的推荐方法、装置、计算机可读介质及电子设备 | |
CN113282857B (zh) | 一种投放点位贡献度的确定方法、装置及可读存储介质 | |
CN110020334B (zh) | 一种用户人群扩散方法及装置 | |
CN117009827A (zh) | 一种基于sdne嵌入和深度学习的身份关联方法及装置 | |
CN115865642A (zh) | 一种招募可信节点完成计算任务的方法和装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication |