CN108038541B - Ctr预估的方法、装置、设备及计算机可读介质 - Google Patents

Ctr预估的方法、装置、设备及计算机可读介质 Download PDF

Info

Publication number
CN108038541B
CN108038541B CN201711288753.7A CN201711288753A CN108038541B CN 108038541 B CN108038541 B CN 108038541B CN 201711288753 A CN201711288753 A CN 201711288753A CN 108038541 B CN108038541 B CN 108038541B
Authority
CN
China
Prior art keywords
neural network
real
features
deep neural
time
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201711288753.7A
Other languages
English (en)
Other versions
CN108038541A (zh
Inventor
熊笑
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing Baidu Netcom Science and Technology Co Ltd
Original Assignee
Beijing Baidu Netcom Science and Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing Baidu Netcom Science and Technology Co Ltd filed Critical Beijing Baidu Netcom Science and Technology Co Ltd
Priority to CN201711288753.7A priority Critical patent/CN108038541B/zh
Publication of CN108038541A publication Critical patent/CN108038541A/zh
Application granted granted Critical
Publication of CN108038541B publication Critical patent/CN108038541B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Health & Medical Sciences (AREA)
  • Computing Systems (AREA)
  • Biomedical Technology (AREA)
  • Biophysics (AREA)
  • Computational Linguistics (AREA)
  • Data Mining & Analysis (AREA)
  • Evolutionary Computation (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Molecular Biology (AREA)
  • Artificial Intelligence (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Mathematical Physics (AREA)
  • Software Systems (AREA)
  • Health & Medical Sciences (AREA)
  • User Interface Of Digital Computer (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本发明提出一种CTR预估的方法,包括以下步骤:原始特征训练步骤:将当前对象的原始特征处理后输入至深度神经网络的输入层,由所述深度神经网络的多个隐含层进行训练;实时特征训练步骤:将当前对象的实时特征输入至所述深度神经网络的最后一个隐含层,与原始特征进行联合训练;预估点击率输出步骤:通过所述深度神经网络的输出层输出当前对象的预估点击率。通过先对原始特征单独训练,然后再结合实时特征进行联合训练,可以实时特征的信息可以有效地被模型进行学习,从而提高模型的时效性以及预估的准确性。

Description

CTR预估的方法、装置、设备及计算机可读介质
技术领域
本发明涉及大数据技术领域,尤其涉及一种CTR预估的方法及装置、设备和计算机可读介质。
背景技术
信息流推荐点击率(Click-Through-Rate,CTR)预估是指在信息流推荐平台根据用户兴趣习惯等,预估用户对所推荐内容的点击率。而实时深度模型是指在设计CTR预估模型时为了充分发挥实时特征的重要性,将深度模型与实时特征进行组合的一种技术。其中所述实时统计特征包括当前内容的历史CTR,过去一小时、一天的CTR,历史展现数目、点击数目等特征。
而传统设计方法包括以下几种:
(1)人工进行特征提取及设计高阶组合特征,在这其中将实时统计特征加入进去。特征工程的步骤可以大致分为:特征设计、获取、处理。
然而,由于特征的提取及组合直接影响着模型的最终效果,故这种依靠特征工程的模型对于特征方面工作所要求的人工成本以及计算成本较高,并且通常难以达到理想的效果。
(2)基于模型的特征提取方法,将需要进行组合的原始特征输入到GBDT等一类解释性高的模型中进行特征组合,得到高阶的特征,此种方法能一定程度的节省特征工作的人工成本,但同样需要面临大量计算的问题。
(3)深层神经网络(Deep Neural Networks,DNN),将原始特征或者简单组合的特征输入到DNN模型中学习,解决了线性模型无法进行特征交叉组合的问题,也避免了特征工程带来的大量人工与计算成本,有效的提升了模型的泛化能力。
然而,将实时统计特征与其他特征向量同时作为DNN网络的输入进行模型训练。经过深度模型的学习,这些实时特征会与原始特征有多重组合,且组合情况不可读、并不受设计者控制,这些实时特征其作用会被削弱。
发明内容
本发明实施例提供一种CTR预估的方法、装置、设备及计算机可读介质,以至少解决现有技术中的以上技术问题。
第一方面,本发明实施例提供了一种CTR预估的方法,包括以下步骤:
原始特征训练步骤:将当前对象的原始特征处理后输入至深度神经网络的输入层,由所述深度神经网络的多个隐含层进行训练;
实时特征训练步骤:将当前对象的实时特征输入至所述深度神经网络的最后一个隐含层,与原始特征进行联合训练;
预估点击率输出步骤:通过所述深度神经网络的输出层输出当前对象的预估点击率。
结合第一方面,本发明在第一方面的第一种实现方式中,所述原始特征训练步骤中具体包括:
对连续的原始特征进行离散化处理;
将离散化处理后的特征进行嵌入式处理后形成特征向量;
将特征向量输入所述深度神经网络模型的输入层。
结合第一方面,本发明在第一方面的第二种实现方式中,所述实时特征训练步骤具体为:将实时特征直接输入至所述深度神经网络的最后一个隐含层。
结合第一方面,本发明在第一方面的第三种实现方式中,所述实时特征训练步骤具体包括:
构建包含至少一层隐含层的浅层神经网络;
将实时特征输入至所述浅层神经网络的输入层;
通过所述浅层神经网络的输出层将结果输出至所述深度神经网络的最后一个隐含层。
第二方面,本发明实施例提供了一种CTR预估的装置,包括:
原始特征训练模块,用于将当前对象的原始特征处理后输入至深度神经网络的输入层,由所述深度神经网络的多个隐含层进行训练;
实时特征训练模块,用于将当前对象的实时特征处理后输入至所述深度神经网络的最后一个隐含层,与原始特征进行联合训练;
预估点击率输出模块,用于通过所述深度神经网络的输出层输出当前对象的预估点击率。
结合第二方面,本发明在第二方面的第一种实现方式中,所述原始特征训练模块具体包括:
离散化处理子模块,用于对连续的原始特征进行离散化处理;
向量化处理子模块,用于将离散化处理后的特征进行嵌入式处理后形成特征向量;
特征输入子模块,将特征向量输入所述深度神经网络模型。
结合第二方面,本发明在第二方面的第二种实现方式中,所述实时特征训练模块具体用于将实时特征直接输入至所述深度神经网络的最后一个隐含层。
结合第二方面,本发明在第二方面的第三种实现方式中,所述实时特征训练模块具体包括:
构建子模块,用于构建包含至少一层隐含层的浅层神经网络;
输入子模块,用于将实时特征输入至所述浅层神经网络的输入层;
输出子模块,用于通过所述浅层神经网络的输出层将结果输出至所述深度神经网络的最后一个隐含层。
所述装置的功能可以通过硬件实现,也可以通过硬件执行相应的软件实现。所述硬件或软件包括一个或多个与上述功能相对应的模块。
在一个可能的设计中,CTR预估的装置的结构中包括处理器和存储器,所述存储器用于存储支持CTR预估的装置执行上述第一方面中CTR预估的方法的程序,所述处理器被配置为用于执行所述存储器中存储的程序。所述CTR预估的装置还可以包括通信接口,用于CTR预估的装置与其他设备或通信网络通信。
第三方面,本发明实施例提供了一种计算机可读介质,用于存储CTR预估的装置所用的计算机软件指令,其包括用于执行上述第一方面的CTR预估的方法所涉及的程序。
上述技术方案中的一个技术方案具有如下优点或有益效果:通过先对原始特征单独训练,然后再结合实时特征进行联合训练,可以实时特征的信息可以有效地被模型进行学习,从而提高模型的时效性以及预估的准确性。
上述概述仅仅是为了说明书的目的,并不意图以任何方式进行限制。除上述描述的示意性的方面、实施方式和特征之外,通过参考附图和以下的详细描述,本发明进一步的方面、实施方式和特征将会是容易明白的。
附图说明
在附图中,除非另外规定,否则贯穿多个附图相同的附图标记表示相同或相似的部件或元素。这些附图不一定是按照比例绘制的。应该理解,这些附图仅描绘了根据本发明公开的一些实施方式,而不应将其视为是对本发明范围的限制。
图1为实施例一的CTR预估的模型示意图;
图2为实施例一的CTR预估方法的步骤流程图;
图3为实施例一的步骤S110的具体步骤流程图;
图4为实施例二的CTR预估的模型示意图;
图5为实施例二的CTR预估的方法流程图;
图6为实施例二的步骤S220的具体步骤流程图;
图7为实施例三的CTR预估的装置的连接框图;
图8为实施例四的CTR预估的装置的连接框图;
图9为实施例五的CTR预估的设备连接框图。
具体实施方式
在下文中,仅简单地描述了某些示例性实施例。正如本领域技术人员可认识到的那样,在不脱离本发明的精神或范围的情况下,可通过各种不同方式修改所描述的实施例。因此,附图和描述被认为本质上是示例性的而非限制性的。
本发明实施例旨在解决现有技术中当存在多个终端设备时,会同时对用户的语音信息进行响应的技术问题。本发明实施例主要分为两部分,先通过深度神经网络对原始特征进行单独训练,然后在神经深度模型的最后一个隐含层中,加入实时特征进行联合训练,最后再输出预估点击率CTR。下面分别通过以下实施例进行技术方案的展开描述。
实施例一
本实施例一提供了一种CTR的预估方法,其主要基于深度神经网络模型的基础上,将实时特征输入至所述神经网络模型中最后一个隐含层进行联合训练。具体如图1所示,其为实施例一的CTR预估的模型示意图。本实施例一的CTR预估的方法所采用的模型包括深度神经网络,所述深度神经网络包括输入层、多个隐含层和输出层。其中,所述输入层接收原始特征,然后在隐含层中对原始特征进行训练,然后将实时特征输入到所述深度神经网络的最后一个隐含层中,与原始特征进行联合训练。
具体的步骤流程如图2所示,其为本发明实施例一的CTR预估方法的步骤流程图,本实施例一的CTR预估方法包括以下步骤:
S110:原始特征训练步骤,将当前对象的原始特征处理后输入至深度神经网络的输入层,由所述深度神经网络的多个隐含层进行训练。
其中,所述当前对象可以为:文档、新闻资讯、视频、音乐等等。若当前对象为新闻资讯,则其原始特征包括:资讯的内容关键词、所述领域、标签等。
具体地,在将当前对象的原始特征输入深度神经网络时,还需要对原始特征进行处理,具体处理步骤如图3所示,包括:
S111:对连续的原始特征进行离散化处理。
在本步骤中,将连续的特征进行离散化处理,获取离散的特征值。
S112:将离散化处理后的特征进行嵌入式处理形成特征向量。
在本步骤中,将离散的特征值进行嵌入式处理,获得多个特征向量。
S113:将特征向量输入所述深度神经网络模型的输入层。
在本步骤中,将获得的特征向量值输入至深度神经网络的输入层,以对特征向量进行训练。在所述深度神经网络中采用全连接的方式进行学习各个特征之间的交叉组合特性。
S120:实时特征训练步骤,将当前对象的实时特征输入至所述深度神经网络的最后一个隐含层,与原始特征进行联合训练。
所述当前对象的实时特征结合当前时间段的特征信息。比如,若当前对象为新闻资讯,则所述实时特征可以包括:当前时间段中用户的点击数量、当前时间段历史用户的活跃度等。
具体地,在本实施例一中,将当前对象的实时特征直接输入至深度神经网络的最后一个隐含层中,进行联合训练。
S130:预估点击率输出步骤,通过所述深度神经网络的输出层输出当前对象的预估点击率。
最后,当所述深度神经网络完成对当前对象的训练后,输出最后的预测结果,即预估点击率CTR。
实施例二
与实施例一的区别在于:本实施例二在所述实时特征训练步骤中,先通过浅层神经网络对实时特征进行训练,再输入至深度神经网络的最后一个隐含层中,具体的方案如下:
如图4所示,其为实施例二的CTR预估的模型示意图。本实施例二的CTR预估的方法所采用的模型包括深度神经网络和浅层神经网络。所述深度神经网络包括输入层、多个隐含层和输出层。其中,所述输入层接收原始特征,然后在隐含层中对原始特征进行训练。所述浅层神经网络包括一个或两个隐含层,接收实时特征并进行训练后,输出到所述深度神经网络的最后一个隐含层中,与原始特征进行联合训练。
具体的步骤流程如图5所示,其为本实施例二的CTR预估的方法流程图。本发明实施例二提供了一种CTR预估的方法,包括以下步骤:
S210:原始特征训练步骤,将当前对象的原始特征处理后输入至深度神经网络的输入层,由所述深度神经网络的多个隐含层进行训练。
S220:实时特征训练步骤,将当前对象的实时特征输入浅层神经网络进行训练后输出至所述深度神经网络的最后一个隐含层,与原始特征进行联合训练。
在本步骤S220中,先对当前对象的实时特征进行处理,具体处理步骤如图6所述,包括:
S221:构建包含至少一层隐含层的浅层神经网络。
S222:将实时特征输入至所述浅层神经网络的输入层。
S223:通过所述浅层神经网络的输出层将结果输出至所述深度神经网络的最后一个隐含层。
在本步骤S220中,为所述实时特征单独设计一个浅层神经网络,所述浅层神经网络可以包括一个或两个隐含层。
S230:预估点击率输出步骤,通过所述深度神经网络的输出层输出当前对象的预估点击率。
通过加入的浅层神经网络后,可以使实时统计特征的输入采用全连接的方式,最后与深度神经网络的最后一个隐含层拼接,这样使得实时特征之间的有效交叉组合信息得以被模型学习到。
同时,还可以在特征设计中将认为需要与实时特征进行交叉组合的原始特征也可以加入到浅层神经网络之中。这样的设计既保证了实时特征的有效性,也能通过网络将实时特征之间的组合以及实时特征与其他不会削弱实时特征作用的特征之间的交叉组合特性学习出来。
实施例三
本实施例三对应于实施例一,提供了一种CTR预估的装置。请参阅图7,其为本实施例三的CTR预估的装置的连接框图。本发明实施例三提供了一种CTR预估的装置,具体包括:
原始特征训练模块110,用于将当前对象的原始特征处理后输入至深度神经网络的输入层,由所述深度神经网络的多个隐含层进行训练。
在本实施例三中,所述原始特征训练模块110具体包括:
离散化处理子模块111,用于对连续的原始特征进行离散化处理;
向量化处理子模块112,用于将离散化处理后的特征进行嵌入式处理后形成特征向量;
特征输入子模块113,将特征向量输入所述深度神经网络模型。
实时特征训练模块120,用于将当前对象的实时特征处理后输入至所述深度神经网络的最后一个隐含层,与原始特征进行联合训练。在本实施例三中,所述实时特征训练模块将实时特征直接输入至所述深度神经网络的最后一个隐含层。
预估点击率输出模块130,用于通过所述深度神经网络的输出层输出当前对象的预估点击率。
本实施例三与实施例一的原理相同,故不再赘述。
实施例四
本实施例四与实施例二对应,提供了一种CTR预估的装置,具体如下:
如图8所示,为本实施例四的CTR预估的装置的连接框图。本发明实施例四提供了一种CTR预估的装置,包括:
原始特征训练模块210,用于将当前对象的原始特征处理后输入至深度神经网络的输入层,由所述深度神经网络的多个隐含层进行训练。
实时特征训练模块220,用于将当前对象的实时特征输入浅层神经网络进行训练后输出至所述深度神经网络的最后一个隐含层,与原始特征进行联合训练。所述实时特征训练模块具体包括:
构建子模块221,用于构建包含至少一层隐含层的浅层神经网络。
输入子模块222,用于将实时特征输入至所述浅层神经网络的输入层。
输出子模块223,用于通过所述浅层神经网络的输出层将结果输出至所述深度神经网络的最后一个隐含层。
预估点击率输出模块230,用于通过所述深度神经网络的输出层输出当前对象的预估点击率。
本实施例四的应用方式与原理与实施例二相同,故不再赘述。
实施例五
本发明实施例五提供一种CTR预估的设备,如图9所示,该设备包括:存储器310和处理器320,存储器310内存储有可在处理器320上运行的计算机程序。所述处理器320执行所述计算机程序时实现上述实施例中的CTR预估的方法。所述存储器310和处理器320的数量可以为一个或多个。
该设备还包括:
通信接口330,用于与外界设备进行通信,进行数据交互传输。
存储器310可能包含高速RAM存储器,也可能还包括非易失性存储器(non-volatile memory),例如至少一个磁盘存储器。
如果存储器310、处理器320和通信接口330独立实现,则存储器310、处理器320和通信接口330可以通过总线相互连接并完成相互间的通信。所述总线可以是工业标准体系结构(ISA,Industry Standard Architecture)总线、外部设备互连(PCI,PeripheralComponent)总线或扩展工业标准体系结构(EISA,Extended Industry StandardComponent)总线等。所述总线可以分为地址总线、数据总线、控制总线等。为便于表示,图9中仅用一条粗线表示,但并不表示仅有一根总线或一种类型的总线。
可选的,在具体实现上,如果存储器310、处理器320及通信接口330集成在一块芯片上,则存储器310、处理器320及通信接口330可以通过内部接口完成相互间的通信。
在本说明书的描述中,参考术语“一个实施例”、“一些实施例”、“示例”、“具体示例”、或“一些示例”等的描述意指结合该实施例或示例描述的具体特征、结构、材料或者特点包含于本发明的至少一个实施例或示例中。而且,描述的具体特征、结构、材料或者特点可以在任一个或多个实施例或示例中以合适的方式结合。此外,在不相互矛盾的情况下,本领域的技术人员可以将本说明书中描述的不同实施例或示例以及不同实施例或示例的特征进行结合和组合。
此外,术语“第一”、“第二”仅用于描述目的,而不能理解为指示或暗示相对重要性或者隐含指明所指示的技术特征的数量。由此,限定有“第一”、“第二”的特征可以明示或隐含地包括至少一个该特征。在本发明的描述中,“多个”的含义是两个或两个以上,除非另有明确具体的限定。
流程图中或在此以其他方式描述的任何过程或方法描述可以被理解为,表示包括一个或更多个用于实现特定逻辑功能或过程的步骤的可执行指令的代码的模块、片段或部分,并且本发明的优选实施方式的范围包括另外的实现,其中可以不按所示出或讨论的顺序,包括根据所涉及的功能按基本同时的方式或按相反的顺序,来执行功能,这应被本发明的实施例所属技术领域的技术人员所理解。
在流程图中表示或在此以其他方式描述的逻辑和/或步骤,例如,可以被认为是用于实现逻辑功能的可执行指令的定序列表,可以具体实现在任何计算机可读介质中,以供指令执行***、装置或设备(如基于计算机的***、包括处理器的***或其他可以从指令执行***、装置或设备取指令并执行指令的***)使用,或结合这些指令执行***、装置或设备而使用。就本说明书而言,“计算机可读介质”可以是任何可以包含、存储、通信、传播或传输程序以供指令执行***、装置或设备或结合这些指令执行***、装置或设备而使用的装置。
本发明实施例所述的计算机可读介质可以是计算机可读信号介质或者计算机可读存储介质或者是上述两者的任意组合。计算机可读存储介质的更具体的示例至少(非穷尽性列表)包括以下:具有一个或多个布线的电连接部(电子装置),便携式计算机盘盒(磁装置),随机存取存储器(RAM),只读存储器(ROM),可擦除可编辑只读存储器(EPROM或闪速存储器),光纤装置,以及便携式只读存储器(CDROM)。另外,计算机可读存储介质甚至可以是可在其上打印所述程序的纸或其他合适的介质,因为可以例如通过对纸或其他介质进行光学扫描,接着进行编辑、解译或必要时以其他合适方式进行处理来以电子方式获得所述程序,然后将其存储在计算机存储器中。
在本发明实施例中,计算机可读信号介质可以包括在基带中或者作为载波一部分传播的数据信号,其中承载了计算机可读的程序代码。这种传播的数据信号可以采用多种形式,包括但不限于电磁信号、光信号或上述的任意合适的组合。计算机可读的信号介质还可以是计算机可读存储介质以外的任何计算机可读介质,该计算机可读介质可以发送、传播或者传输用于指令执行***、输入法或者器件使用或者与其结合使用的程序。计算机可读介质上包含的程序代码可以用任何适当的介质传输,包括但不限于:无线、电线、光缆、射频(Radio Frequency,RF)等等,或者上述的任意合适的组合。
应当理解,本发明的各部分可以用硬件、软件、固件或它们的组合来实现。在上述实施方式中,多个步骤或方法可以用存储在存储器中且由合适的指令执行***执行的软件或固件来实现。例如,如果用硬件来实现,和在另一实施方式中一样,可用本领域公知的下列技术中的任一项或他们的组合来实现:具有用于对数据信号实现逻辑功能的逻辑门电路的离散逻辑电路,具有合适的组合逻辑门电路的专用集成电路,可编程门阵列(PGA),现场可编程门阵列(FPGA)等。
本技术领域的普通技术人员可以理解实现上述实施例方法携带的全部或部分步骤是可以通过程序来指令相关的硬件完成,所述的程序可以存储于一种计算机可读存储介质中,该程序在执行时,包括方法实施例的步骤之一或其组合。
此外,在本发明各个实施例中的各功能单元可以集成在一个处理模块中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个模块中。上述集成的模块既可以采用硬件的形式实现,也可以采用软件功能模块的形式实现。所述集成的模块如果以软件功能模块的形式实现并作为独立的产品销售或使用时,也可以存储在一个计算机可读存储介质中。所述存储介质可以是只读存储器,磁盘或光盘等。
综上所述,本发明实施例通过先对原始特征单独训练,然后再结合实时特征进行联合训练,可以实时特征的信息可以有效地被模型进行学习,从而提高模型的时效性以及预估的准确性。
以上所述,仅为本发明的具体实施方式,但本发明的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本发明揭露的技术范围内,可轻易想到其各种变化或替换,这些都应涵盖在本发明的保护范围之内。因此,本发明的保护范围应以所述权利要求的保护范围为准。

Claims (8)

1.一种信息流推荐点击率CTR预估的方法,其特征在于,包括
原始特征训练步骤:将当前对象的原始特征处理后输入至深度神经网络的输入层,由所述深度神经网络的多个隐含层进行训练;
实时特征训练步骤:将当前对象的实时特征输入至所述深度神经网络的所述多个隐含层的最后一个隐含层,与原始特征进行联合训练,其中所述当前对象的实时特征结合当前时间段的特征信息;
预估点击率输出步骤:通过所述深度神经网络的输出层输出当前对象的预估点击率,
其中,所述实时特征训练步骤具体包括:
构建包含至少一层隐含层的浅层神经网络;
将实时特征输入至所述浅层神经网络的输入层;
通过所述浅层神经网络的输出层将结果输出至所述深度神经网络的最后一个隐含层。
2.根据权利要求1所述的CTR预估的方法,其特征在于,所述原始特征训练步骤中具体包括:
对连续的原始特征进行离散化处理;
将离散化处理后的特征进行嵌入式处理形成特征向量;
将特征向量输入所述深度神经网络的输入层。
3.根据权利要求1所述的CTR预估的方法,其特征在于,所述实时特征训练步骤具体为:将实时特征直接输入至所述深度神经网络的最后一个隐含层。
4.一种信息流推荐点击率CTR预估的装置,其特征在于,包括:
原始特征训练模块,用于将当前对象的原始特征处理后输入至深度神经网络的输入层,由所述深度神经网络的多个隐含层进行训练;
实时特征训练模块,用于将当前对象的实时特征处理后输入至所述深度神经网络的所述多个隐含层的最后一个隐含层,与原始特征进行联合训练,其中所述当前对象的实时特征结合当前时间段的特征信息;
预估点击率输出模块,用于通过所述深度神经网络的输出层输出当前对象的预估点击率,
其中,所述实时特征训练模块具体包括:
构建子模块,用于构建包含至少一层隐含层的浅层神经网络;
输入子模块,用于将实时特征输入至所述浅层神经网络的输入层;
输出子模块,用于通过所述浅层神经网络的输出层将结果输出至所述深度神经网络的最后一个隐含层。
5.根据权利要求4所述CTR预估的装置,其特征在于,所述原始特征训练模块具体包括:
离散化处理子模块,用于对连续的原始特征进行离散化处理;
向量化处理子模块,用于将离散化处理后的特征进行嵌入式处理后形成特征向量;
特征输入子模块,将特征向量输入所述深度神经网络的输入层。
6.根据权利要求4所述CTR预估的装置,其特征在于,所述实时特征训练模块具体用于将实时特征直接输入至所述深度神经网络的最后一个隐含层。
7.一种信息流推荐点击率CTR预估的设备,其特征在于,所述设备包括:
一个或多个处理器;
存储装置,用于存储一个或多个程序;
当所述一个或多个程序被所述一个或多个处理器执行时,使得所述一个或多个处理器实现如权利要求1-3中任一所述的CTR预估的方法。
8.一种计算机可读介质,其存储有计算机程序,其特征在于,该程序被处理器执行时实现如权利要求1-3中任一所述的CTR预估的方法。
CN201711288753.7A 2017-12-07 2017-12-07 Ctr预估的方法、装置、设备及计算机可读介质 Active CN108038541B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201711288753.7A CN108038541B (zh) 2017-12-07 2017-12-07 Ctr预估的方法、装置、设备及计算机可读介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201711288753.7A CN108038541B (zh) 2017-12-07 2017-12-07 Ctr预估的方法、装置、设备及计算机可读介质

Publications (2)

Publication Number Publication Date
CN108038541A CN108038541A (zh) 2018-05-15
CN108038541B true CN108038541B (zh) 2021-02-19

Family

ID=62095987

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201711288753.7A Active CN108038541B (zh) 2017-12-07 2017-12-07 Ctr预估的方法、装置、设备及计算机可读介质

Country Status (1)

Country Link
CN (1) CN108038541B (zh)

Families Citing this family (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109615060B (zh) * 2018-11-27 2023-06-30 深圳前海微众银行股份有限公司 Ctr预估方法、装置及计算机可读存储介质
CN110039537B (zh) * 2019-03-15 2021-07-13 北京精密机电控制设备研究所 一种基于神经网络的在线自学习多关节运动规划方法
CN110083688B (zh) * 2019-05-10 2022-03-25 北京百度网讯科技有限公司 搜索结果召回方法、装置、服务器及存储介质
CN110399979B (zh) * 2019-06-17 2022-05-13 深圳大学 一种基于现场可编程门阵列的点击率预估的***及方法

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105160548A (zh) * 2015-08-20 2015-12-16 北京奇虎科技有限公司 对广告点击率进行预测的方法及装置
CN107423430A (zh) * 2017-08-03 2017-12-01 北京京东尚科信息技术有限公司 数据处理方法、装置和计算机可读存储介质

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105160548A (zh) * 2015-08-20 2015-12-16 北京奇虎科技有限公司 对广告点击率进行预测的方法及装置
CN107423430A (zh) * 2017-08-03 2017-12-01 北京京东尚科信息技术有限公司 数据处理方法、装置和计算机可读存储介质

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
Deep Learning over Multi-field Categorical Data-A Case Study on User Response Prediction;Weinan Zhang等;《ECIR2016》;20160111;第45-57页 *

Also Published As

Publication number Publication date
CN108038541A (zh) 2018-05-15

Similar Documents

Publication Publication Date Title
CN108038541B (zh) Ctr预估的方法、装置、设备及计算机可读介质
CN108491529B (zh) 信息推荐方法及装置
CN111695674B (zh) 联邦学习方法、装置、计算机设备及可读存储介质
CN112164391A (zh) 语句处理方法、装置、电子设备及存储介质
CN111428520A (zh) 一种文本翻译方法及装置
KR102502985B1 (ko) 대상 추천 방법, 신경망 및 그 훈련 방법, 장치 및 매체
CN110990600B (zh) 多媒体文件推荐、参数调整方法、装置、介质及电子设备
CN110110139A (zh) 一种对推荐结果进行解释的方法、装置及电子设备
CN111324715B (zh) 问答机器人的生成方法和装置
CN109754072A (zh) 网络离线模型的处理方法、人工智能处理装置及相关产品
CN116129452A (zh) 文档理解模型的生成方法、应用方法、装置、设备及介质
CN110516162B (zh) 一种信息推荐方法、装置、设备及存储介质
CN111444335B (zh) 中心词的提取方法及装置
CN114464168A (zh) 语音处理模型的训练方法、语音数据的降噪方法及装置
CN113033707B (zh) 视频分类方法、装置、可读介质及电子设备
CN117235371A (zh) 视频推荐方法、模型训练方法及装置
CN116862580A (zh) 短信触达时间预测方法、装置、计算机设备及存储介质
CN114547308A (zh) 文本处理的方法、装置、电子设备及存储介质
CN115496734A (zh) 视频内容的质量评价方法、网络训练方法和装置
CN114064905A (zh) 网络攻击检测方法、装置、终端设备、芯片及存储介质
CN115186096A (zh) 针对特定类型分词的识别方法、装置、介质及电子设备
CN116629947B (zh) 流动站点处理信息生成方法、装置、设备和介质
CN117373121B (zh) 智能座舱环境下的手势交互方法及相关设备
CN116911304B (zh) 一种文本推荐方法及装置
CN111753080B (zh) 用于输出信息的方法和装置

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant