CN111339291B - 一种信息展示方法、装置和存储介质 - Google Patents
一种信息展示方法、装置和存储介质 Download PDFInfo
- Publication number
- CN111339291B CN111339291B CN201811549935.XA CN201811549935A CN111339291B CN 111339291 B CN111339291 B CN 111339291B CN 201811549935 A CN201811549935 A CN 201811549935A CN 111339291 B CN111339291 B CN 111339291B
- Authority
- CN
- China
- Prior art keywords
- information
- display
- sample
- display information
- probability
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Images
Landscapes
- User Interface Of Digital Computer (AREA)
Abstract
本发明公开了一种信息展示方法、装置和存储介质,用以提高信息展示的展示效果和用户体验。信息展示方法,包括:针对任一展示位置,获得所述展示位置与展示信息集合中各展示信息之间的匹配参考信息,所述匹配参考信息为根据匹配参数确定出的,所述匹配参数至少包括所述原生信息和所述展示信息之间的内容相似度;根据所述匹配参考信息,为所述展示位置分配满足限制条件的展示信息。
Description
技术领域
本发明涉及计算机网络技术领域,尤其涉及一种信息展示方法、装置和存储介质。
背景技术
信息流以机器算法来做新闻资讯的精准推荐和分发,让用户能看到自己喜欢的内容。这种推荐机制打破了传统的新闻页面的分类方式,而是以像瀑布一样实时流动的“信息流”的方式呈现。从展示形态上来说,信息流中的内容按类似的规格样式上下排布。在信息流中可以穿插特定展示信息,其与内容混排在一起。
现有技术中,在信息流中***特定的展示信息时,其整个过程可以看做是二部图G=(I∪J,E)上的分配问题,如图1a所示。I是Supply集合,表示各种限制条件下的展示位置集合,包含若干个展示位置节点,每个展示位置节点i对应不同的权重si,表示该限制条件下的展示位置总数,J是Demand集合,表示待展示信息集合,包含若干个展示信息节点,每个展示信息节点j对应不同的权重dj,表示该展示信息需求的展示次数。展示位置节点和展示信息节点之间的连线(i,j)∈E,表示该展示位置节点满足该展示信息节点的限制条件。
但是,在为展示位置节点分配展示信息节点的过程中,目前主要考虑展示位置节点与展示信息节点之间的最优匹配,使得待展示信息缺量最小化,这样,导致分配结果中,可能存在以下问题:待展示信息与当前信息流中的展示信息内容不匹配,例如,在两条体育类内容之间***一条金融类展示信息,一方面,降低了展示信息的展示效果,另一方面,也影响了用户体验。
发明内容
本发明实施例提供一种信息展示方法、装置和存储介质,用以提高信息展示的展示效果和用户体验。
第一方面,提供一种信息展示方法,包括:
针对任一展示位置,获得所述展示位置与展示信息集合中各展示信息之间的匹配参考信息,所述匹配参考信息为根据匹配参数确定出的,所述匹配参数至少包括所述原生信息和所述展示信息之间的内容相似度;
根据所述匹配参考信息,为所述展示位置分配的满足限制条件的展示信息。
第二方面,提供一种信息展示装置,包括:
获得单元,用于针对任一展示位置,获得所述展示位置与展示信息集合中各展示信息之间的匹配参考信息,所述匹配参考信息为根据匹配参数确定出的,所述匹配参数至少包括所述原生信息和所述展示信息之间的内容相似度;
分配单元,用于根据所述匹配参考信息,为所述展示位置分配满足限制条件的展示信息。
第三方面,提供一种计算装置,包括至少一个处理器、以及至少一个存储器,其中,所述存储器存储有计算机程序,当所述程序被所述处理器执行时,使得所述处理器执行上述的信息展示方法所述的步骤。
第四方面,提供一种计算机可读介质,其存储有可由计算装置执行的计算机程序,当所述程序在计算装置上运行时,使得所述计算装置执行上述的信息展示方法所述的步骤。
本发明实施例提供的信息展示方法、装置和存储介质,在为展示位置分配展示信息时,考虑了展示位置相邻的原生信息和展示信息之间的内容相似度,使得展示信息与展示位置相邻的原生信息之间的内容更加匹配,提高用户体验,而且增加了浏览原生信息的用户浏览展示信息的概率,从而提高了展示信息的展示效果。
本发明的其它特征和优点将在随后的说明书中阐述,并且,部分地从说明书中变得显而易见,或者通过实施本发明而了解。本发明的目的和其他优点可通过在所写的说明书、权利要求书、以及附图中所特别指出的结构来实现和获得。
附图说明
此处所说明的附图用来提供对本发明的进一步理解,构成本发明的一部分,本发明的示意性实施例及其说明用于解释本发明,并不构成对本发明的不当限定。在附图中:
图1a为现有技术中,为展示信息节点分配展示位置节点的过程示意图;
图1b为本发明实施例的应用场景示意图;
图2为根据本发明实施方式的确定原生信息与展示信息之间的内容相似度方法的实施流程示意图;
图3为根据本发明实施方式的信息分类模型的训练流程示意图;
图4为根据本发明实施例方式的信息展示方法的实施流程示意图;
图5为根据本发明实施方式的展示位置与展示信息之间的匹配示意图;
图6a为根据本发明实施方式的信息展示***结构示意图;
图6b为根据本发明实施方式的展示位置与展示信息匹配的实施流程示意图;
图6c为根据本发明实施方式的展示信息展示界面示意图;
图7为根据本发明实施方式的信息展示装置的结构示意图;
图8为根据本发明实施方式的计算装置的结构示意图。
具体实施方式
首先,对本发明实施例中涉及的部分用语进行说明,以便于本领域技术人员理解。
原生信息:为了与信息流中***的展示信息相区别,本发明实施例中,称信息流中原有的内容为原生信息,原生信息和展示信息的展现形态可以包括文本、图片或者视频等。
本发明实施例中涉及的终端设备可以是个人电脑(英文全称:PersonalComputer,PC)、平板电脑、个人数字助理(Personal Digita l Assistant,PDA)、个人通信业务(英文全称:Personal Communication Service,PCS)电话、笔记本和手机等终端设备,也可以是具有移动终端的计算机,例如,可以是便携式、袖珍式、手持式、计算机内置的或者车载的移动装置,它们能够向用户提供语音和/或数据连通性的设备,以及与无线接入网交换语言和/或数据。
需要说明的是,在本文中提及的“多个或者若干个”是指两个或两个以上。“和/或”,描述关联对象的关联关系,表示可以存在三种关系,例如,A和/或B,可以表示:单独存在A,同时存在A和B,单独存在B这三种情况。字符“/”一般表示前后关联对象是一种“或”的关系。
以下结合说明书附图对本发明的优选实施例进行说明,应当理解,此处所描述的优选实施例仅用于说明和解释本发明,并不用于限定本发明,并且在不冲突的情况下,本发明中的实施例及实施例中的特征可以相互组合。
如图1b所示,其为本发明实施例提供的信息展示方法的应用场景示意图。用户10通过终端设备11中安装的应用客户端访问信息展示服务器12,其中,应用客户端可以为网页的浏览器,也可以为安装于终端设备,如手机,平板电脑等中的应用程序客户端。信息展示服务器12可以为用户提供信息展示业务,应用服务器13可以提供信息展示位置,信息展示服务器12可以收集用户对于信息展示的需求和应用服务器13可以提供的信息展示位置,并据此从展示信息中选择相应的展示信息通过应用服务器13进行展示,应用服务器13可以为用户提供不同的互联网业务,例如,资讯浏览业务和视频观看业务等等。具体实施时,展示信息的类型应与应用服务器13提供的业务类型一致,例如,应用服务器13提供咨询浏览业务,则展示信息可以为文本信息和图片信息等;应用服务器13提供视频观看业务,则展示信息可以为视频信息等。
终端设备11与信息展示服务器12之间以及信息展示服务器12与应用服务器13之间通过网络进行通信连接,该网络可以为局域网、蜂窝网和广域网等。终端设备11可以为便携设备(例如:手机、平板、笔记本电脑等),也可以为个人电脑(PC,Personal Computer),信息展示服务器12和应用服务器13可以为任何能够提供互联网服务的设备。
本发明实施例提供的信息展示方法可以应用于信息展示服务器12中,由信息展示服务器12根据收集的信息展示需求和信息展示位置,并根据本发明是实施例提供的信息展示方法为信息展示位置分配相应的展示信息。
应当理解,具体实施时,信息展示服务器12和应用服务器13也可以合并设置。
为了使展示信息与展示位置相邻位置的原生信息内容匹配,提高用户体验和信息展示效果,本发明实施例中,可以通过从展示信息中选择信息内容与展示位置相邻的原生信息内容相似的展示信息进行展示。本发明实施例中,可以通过确定展示信息与原生信息之间的内容相似度来判断展示信息与原生信息是否相似。
具体实施时,对于原生信息和展示信息集合中的展示信息可以按照以下流程确定两者之间的内容相似度,如图2所示,包括以下步骤:
S21、利用信息分类模型分别确定展示信息和原生信息的特征向量。
其中,信息分类模型为利用带有标签的样本信息作为训练样本进行训练得到的。其中,标签表示样本信息对应的信息类型,信息类型可以包括娱乐类信息、体育类信息、科技类信息、金融类信息等等。在训练开始之前,对于每一训练样本信息需要标注其对应的标签,以标识该样本信息的信息类型,并初始化信息分类模型的模型参数,训练目标为确定样本信息对应于N类信息的概率,N为信息类型数量,其中,N可以根据直接需要进行设置,本发明实施例对此不进行限定,例如,可以设置N=10。
具体实施时,可以采用贝叶斯算法、决策树及其变种、支持向量机以及神经网络算法、最大熵算法、文档主题生成(LDA)算法、逻辑回归(LR)算法等对样本信息进行训练得到信息分类模型,为了便于理解,以下以神经网络算法为例,利用样本信息可以按照图3所示的流程进行训练得到信息训练模型,包括以下步骤:
S31、读取样本信息。
其中,样本信息可以为文本,也可以为图片和视频等。
S32、从读取的样本信息中提取样本特征。
其中,样本信息中包含有信息标题和/或信息内容。本发明实施例中,可以从信息标题和/或信息内容中提取样本特征。具体实施时,可以分别对所述信息标题和/或信息内容进行分词得到若干词语。本步骤中,对于样本信息中包含的样本信息和/或信息内容,利用分词工具进行分词得到若干的词语。
需要说明的是,对于文本类信息,样本信息可以包括信息标题和信息内容,而对于视频类信息,除了信息标题外,可以获取内容描述或者内容简介作为信息内容。
具体实施时,如果样本信息为图片或者视频,除了可以利用上述方法提取图片或者视频标题或者内容描述等中的文本特征以外,还可以利用卷积神经网络从图片或者视频帧中提取特征。
S33、将提取的样本特征转换为样本特征向量后输入所述信息分类模型中得到输出结果。
具体实施时,可以将步骤S32得到的词语转换为对应的词向量,例如,可以利用OneHot Representation将词语转换为其对应的向量,或者利用word2vec将词语转换为向量等等,本发明实施例对此不进行限定。
将词语转换为向量之后输入信息分给模型中得到输出结果,输出结果中包含有样本信息对应于每一预测标签的预测概率,样本信息对应于每一预测标签的预测概率组成该样本信息对应的特征向量。
例如,对于某一样本信息来说,其输出结果为{0.1,0,0.88,0,0,0,0,0.01,0.01,0},每一维度的向量分别对应于不同的标签,例如:如果概率最大对应的标签为体育标签,则可以确定该样本信息为体育类信息。
S34、根据样本信息对应的标签及其对应与每一预测标签的预测概率,判断信息分类模型的输出结果是否稳定,如果稳定,则结束训练,如果不稳定,则执行步骤S35。
本步骤中,判断样本信息对应的概率最大的预测标签是否与初始时为样本信息标注的标签一致,如果相同,则需要进一步判断信息分配模型输出结果准确率是否达到预设值,如果达到,则确定输出结果稳定,如果没有达到或者概率最大的预测标签与初始时为样本信息标注的标签不一致,则确定输出结果不稳定。
S35、调整模型参数,并执行步骤S31。
本步骤中,调整信息分类模型的参数,并重新开始训练,直至判断出信息分类模型输出结果稳定便可以得到信息分类模型。
为了减少信息分类模型训练的计算量,具体实施时,可以仅利用信息标题和信息内容中的其中一项作为模型训练的输入数据,当然为了提高模型训练结果的准确性,也可以同时利用信息标题和信息内容作为模型训练的输入数据。
利用训练好的信息分类模型从展示信息和原生信息中提取能够表征展示信息和原生信息特征的特征向量。以N=10为例,则提取的特征向量为一个10维的向量。
具体实施时,为了提高特征向量的准确性,本发明实施例中,还可以在提取的特征向量中加入经验规则,经验规则即为关键词语与其对应的信息类型之间的对应关系,例如,对于篮球比赛可以预先设定其对应的信息类型为体育类信息,这样,只要展示信息或者原生信息中包含有篮球比赛即可确定其为体育类信息;又如,可以预先设定词语周杰林对应的信息类型为娱乐信息,这样,只要展示信息或者原生信息中包含有周杰林即可确定其为娱乐类信息等等。其中,关键词语可以为信息中出现频率最高的词语,即词频最高的词语。基于此,根据信息分类模型的输出结果得到展示信息和原生信息对应的特征向量之后,进一步判断其关键词语是否有对应的信息类型,如果有,则更新特征向量中,关键词语对应的信息类型标签对应的概率为1,例如,上例中,体育类信息对应的概率为0.88,如果根据其中的关键词语判断出该信息为体育类信息,则可以将体育类信息对应的概率修改为1,更新后的特征向量如下:{0.1,0,1,0,0,0,0,0.01,0.01,0}。
S22、根据展示信息的特征向量和原生信息的特征向量,确定两者之间的内容相似度。
本步骤中,可以确定展示信息对应的特征向量与原生信息的特征向量的点乘结果进行归一化处理后得到的结果作为两者之间的内容相似度。
为了提高展示位置与展示信息的匹配速度,具体实施时,针对展示信息集合中包含的每一展示信息,可以预先确定其与当前信息流中每一原生信息之间的内容相似度,这样,在需要进行展示位置与展示信息匹配时,可以根据两者之间的相似度直接进行匹配即可。
如图4所示,本发明实施例中可以按照以下方法进行展示位置与展示信息的匹配:
S41、针对任一展示位置,获得展示位置与展示信息集合中的各展示信息之间的匹配参考信息。
其中,匹配参考信息为根据匹配参数确定出的,匹配参数至少包括与展示位置相邻的原生信息和展示信息之间的内容相似度。
如图5所示,其为展示位置与展示信息之间的匹配示意图,对于展示位置i来说,与其相邻的原生信息可以为内容i或者内容i+1,也可以为信息i和信息i+1。在后一种情况下,即与展示位置相邻的原生信息包括信息i和信息i+1时,在确定展示信息与原生信息之间的内容相似度时,可以为信息i和信息i+1预先设置其对应的权重,根据两者的加权确定出展示信息与原生信息之间的内容相似度。其中,信息i和信息i+1对应的权重可以相同,即分别为0.5,也可以不同,具体实施时,可以根据实际需要进行设置。以信息i和信息i+1对应的权重分别为0.1和0.9为例,则可以按照以下公式确定展示信息和原生信息之间的内容相似度:α*0.1+β*0.9,其中,α表示展示信息与信息i对应的特征向量的点乘结果,β表示展示信息与信息i+1对应的特征向量的点乘结果。
具体实施中,在得到原生信息和展示信息对应的特征向量之后,还可以采用余弦距离,皮尔森距离以及KL(相对熵)距离方法等确定原生信息和展示信息之间的相似度,本发明实施例对此不进行限定。
S42、根据所述匹配参考信息,为展示位置分配满足限制条件的展示信息。
在一个实施例中,可以根据展示信息集合中各展示信息与展示位置相邻的原生信息之间的内容相似度对展示信息进行排序,从展示信息集合中,依序选择为展示位置分配的满足限制条件的展示信息。
例如,可以为展示位置分配满足限制条件且匹配参考信息最大的展示信息进行展示。如果匹配参数仅包含内容相似度,则本步骤中选择对应的内容相似度最大的展示信息。
具体实施时,限制条件通常包括展示信息提供方预先限定的限制条件,还可以包括展示位置提供方预先限定的限制条件,例如,相邻展示信息之间的位置间隔、必须展示展示信息的位置和不能展示展示信息的位置等等。
具体实施时,匹配参数还可以包括以下至少一项:展示位置被展示的概率和展示信息被展示的概率。
其中,展示位置被展示的概率为根据包含展示位置的展示页面被浏览次数和展示位置被展示的次数确定出的。例如,包含展示位置的展示页面被浏览次数为10000次,而展示位置被展示的次数为500次,则可以确定展示位置被展示的概率为500/10000=5%。展示信息被展示的概率为根据展示信息需求展示次数与满足该展示信息对应的展示限制条件的展示位置数量确定出的,例如,展示信息的需求展示次数为100次,而满足该展示信息对应的展示限制条件的展示位置数量为200,则展示信息被展示的概率为100/200=50%,在信息展示过程中,可以根据展示信息被展示的概率来控制展示信息被展示的速度。
具体实施时,如果匹配参数包括内容相似度和展示位置被展示的概率和/或展示信息被展示的概率,则可以根据原生信息与展示信息之间的内容相似度和展示位置被展示的概率和/或展示信息被展示的概率确定匹配参考信息。在一个实施例中,可以根据原生信息与展示信息之间的内容相似度和展示位置被展示的概率和/或展示信息被展示的概率之间的乘积确定。以匹配参数包括内容相似度、展示位置被展示的概率和展示信息被展示的概率为例,具体实施,可以按照以下公式确定展示信息和原生信息之间的匹配参考信息:Simi(i,j)*LocationImpProb(i)*Theta(j),其中:
Simi(i,j)表示展示位置i与展示信息j之间的内容相似度;
LocationImpProb(i)表示展示位置被展示的概率;
Theta(j)表示展示信息j被展示的概率。
为了更好地理解本发明实施例,以下结合本发明实施例提供的信息展示***架构图,对本发明实施例的具体实施过程进行说明。如图6a所示,其为信息展示***架构示意图,其由三个部分组成:展示信息离线查询***、离线模型训练***和在线信息展示***,其中:
离线模型训练***,用于利用各种分类算法对样本信息进行训练,其中样本信息包括来源于在线信息展示***中的原生信息和展示信息集合中的展示信息,从原生信息和展示信息中提取原生信息特征和展示信息特征作为信息分类模型的输入,训练过程中可以使用贝叶斯算法、决策树及其变种、支持向量机以及神经网络算法、最大熵算法、文档主题生成(LDA)算法、逻辑回归(LR)算法等对样本信息进行训练,训练完成的信息分类模型输出模型参数可以用于离线提取展示信息或者在线提取原生信息特征,输出结果用于确定两者之间的内容相似度。
在线信息展示***,用于当存在展示位置需要匹配展示信息时,获取展示位置相邻位置的原生信息,利用离线模型训练***训练得到的信息分类模型输出的模型参数提取原生信息的信息特征,提取的特征用于计算原生信息与展示信息的内容相似度,确定出的内容相似度输出给展示信息投放引擎一匹配合适的展示信息的选择。其中,在线原生信息也可以作为样本信息用于对信息分类模型的训练。
展示信息离线查询***,用于查询在未来一段时间内的可用展示位置,根据展示信息提供方提供的展示信息,利用在线信息展示***输出的信息分类模型的模型参数提取展示信息的信息特征,并利用提取的信息特征在可用的展示位置中查询符合需求的展示位置,例如,根据提取的信息特征判断出展示信息提供方需要体育类相关的展示位置,以及需求数量为50个,假设可用的展示位置为100个,其中体育类相关的展示位置为80个,输出查询结果给提供方。具体实施时,展示信息提供方提供的展示信息同样可以用于信息分配模型的训练。
基于图6a所示的***架构图,本发明实施例提供的信息展示方法可以按照图6b所示的流程实施:
S61、展示信息离线查询***接收信息查询请求。
具体实施时,信息提供方在有展示信息需要展示时,可以通过向展示信息离线查询***提交信息查询请求,其中携带有需要展示的展示信息。
S62、展示信息离线查询***利用信息分类模型从展示信息中提取第一信息特征。
本步骤中,展示信息离线查询***利用离线模型训练***训练得到的信息分类模型从展示信息中提取第一信息特征。
S63、展示信息离线查询***根据提取的第一信息特征在可用的展示位置中查询符合需求的展示位置。
S64、展示信息离线查询***返回查询结果。
本步骤中,展示信息离线查询***向信息提供方返回可用展示位置的数量。
S65、离线模型训练***在接收展示位置预定请求。
具体实施时,信息提供方根据查询结果,如果确定预订可用展示位置进行信息展示,则通过信息展示订阅***提交展示位置预订请求,其中携带有待展示的信息。
S66、离线模型训练***利用信息分类模型提取展示信息的第二信息特征,并提交给在线信息展示***。
离线模型训练***将接收到的展示信息加入到展示信息集合中,并利用信息分类模型提取接收到的展示信息的第二信息特征。
另外,离线模型训练也可以将获得的展示信息加入到样本信息中,用于对信息分类模型的更新训练。
S67、当存在展示位置需要匹配展示信息时,在线展示***获取展示位置临近位置的原生信息。
S68、在线展示***利用信息分类模型提取原生信息的第三信息特征。
S69、在线展示***根据第二信息特征和第三信息特征确定展示信息和原生信息之间的内容相似度。
S610、在线展示***确定各展示信息对应的匹配参考信息。
具体实施时,在线展示***可以根据展示信息和原生信息之间的内容相似度、展示位置被展示的概率以及展示信息被展示的概率确定各展示信息对应的匹配参考信息。
S611、在线展示***根据各展示信息对应的匹配参考信息对各展示信息进行排序。
具体实施时,在线展示***可以根据匹配参考信息由大到小的顺序进行排序。
S612、在线展示***根据排序结果依序选择为展示位置分配的满足限制条件的展示信息。
具体实施时,在线展示***选择满足限制条件且匹配参考信息最大的展示信息分配给展示位置。
根据本发明实施例提供的信息展示方法,在信息流中***展示信息时,由于参考了原生信息与展示信息之间的内容相似度,使得两者在内容上存在相关性,如图6c所示,在数码类信息的信息流中***展示信息时,可以获取当前展示位置相邻位置的原生信息,确定原生信息与展示信息集合中各个展示信息的内容相似度,并据此选择内容相似度高且满足限定条件的展示信息***进行展示,例如,数码信息1和数码信息2为电脑产品评测内容,根据匹配结果,为数码信息1和数码信息2之间的展示位置分配手机类产品进行展示。
本发明实施例提供的信息展示方法可以应用于广告投放***中,展示信息离线查询部分用于筛选出满足限制条件的广告订单,模型训练部分用于利用广告文本和普通的文本,例如新闻文本等进行训练得到的信息分类模型,在线信息展示部分在需要为展示位置分配广告文本时,可以用于根据展示位置确定广告文本与信息流中的文本,例如新闻文本之间的匹配参考信息,并据此为展示位置分配满足限制条件且匹配参考信息最大的广告文本进行展示。
基于同一发明构思,本发明实施例中还提供了一种信息展示装置,由于上述装置解决问题的原理与信息展示方法相似,因此上述装置的实施可以参见方法的实施,重复之处不再赘述。
如图7所示,其为本发明实施例提供的信息展示装置的结构示意图,包括:
排序单元71,用于针对任一展示位置,根据所述展示位置与展示信息集合中各展示信息之间的匹配参考信息,对展示信息集合中的展示信息进行排序,所述匹配参考信息为根据匹配参数确定出的,所述匹配参数至少包括所述原生信息和所述展示信息之间的内容相似度;
分配单元72,用于从排序后的展示信息中,依序选择为所述展示位置分配的满足限制条件的展示信息。
可选地,所述匹配参数还包括以下至少一项:所述展示位置被展示的概率和展示信息被展示的概率,其中,所述展示位置被展示的概率为根据包含展示位置的展示页面被浏览次数和所述展示位置被展示的次数确定出的,所述展示信息被展示的概率为根据展示信息需求展示次数与预计可用于展示该展示信息的展示位置数量确定出的。
可选地,本发明实施例提供的信息展示装置,还包括:
第二确定单元,用于在所述排序单元针对任一展示位置,根据所述展示位置与展示信息集合中各展示信息之间的匹配参考信息,对展示信息集合中的展示信息进行排序之前,根据所述原生信息与展示信息之间的内容相似度和所述展示位置被展示的概率和/或展示信息被展示的概率之间的乘积确定所述匹配参考信息。
可选地,本发明实施例提供的信息展示装置,还包括:
第二确定单元,用于利用信息分类模型分别确定所述展示信息和所述原生信息的特征向量,其中,所述信息分类模型为利用带有标签的样本信息进行训练得到的;根据所述展示信息的特征向量和原生信息的特征向量,确定两者之间的内容相似度。
可选地,本发明实施例提供的信息展示装置,还包括:
模型训练单元,用于读取样本信息,所述样本信息包括信息标题和/或信息内容;分别对所述信息标题和/或信息内容进行分词得到若干词语;将分词得到的每一词语转换为词向量后输入所述信息分类模型中得到输出结果,所述输出结果中包含有所述样本信息对应于每一预测标签的预测概率;根据所述样本信息对应的标签及其对应与每一预测标签的预测概率,判断信息分类模型的输出结果是否稳定;如果不稳定,则调整模型参数继续训练,直至所述信息分类模型的输出结果稳定。
为了描述的方便,以上各部分按照功能划分为各模块(或单元)分别描述。当然,在实施本发明时可以把各模块(或单元)的功能在同一个或多个软件或硬件中实现。
在介绍了本发明示例性实施方式的信息展示方法和装置之后,接下来,介绍根据本发明的另一示例性实施方式的计算装置。
所属技术领域的技术人员能够理解,本发明的各个方面可以实现为***、方法或程序产品。因此,本发明的各个方面可以具体实现为以下形式,即:完全的硬件实施方式、完全的软件实施方式(包括固件、微代码等),或硬件和软件方面结合的实施方式,这里可以统称为“电路”、“模块”或“***”。
在一些可能的实施方式中,根据本发明的计算装置可以至少包括至少一个处理器、以及至少一个存储器。其中,所述存储器存储有程序代码,当所述程序代码被所述处理器执行时,使得所述处理器执行本说明书上述描述的根据本发明各种示例性实施方式的信息展示方法中的步骤。例如,所述处理器可以执行如图4中所示的步骤S41、针对任一展示位置,根据展示位置对应的匹配参考信息对展示信息集合中的展示信息进行排序;以及步骤S42、从排序后的展示信息中,依序选择为展示位置分配的满足限制条件的展示信息。
下面参照图8来描述根据本发明的这种实施方式的计算装置80。图8显示的计算装置80仅仅是一个示例,不应对本发明实施例的功能和使用范围带来任何限制。
如图8所示,计算装置80以通用计算设备的形式表现。计算装置80的组件可以包括但不限于:上述至少一个处理器81、上述至少一个存储器82、连接不同***组件(包括存储器82和处理器81)的总线83。
总线83表示几类总线结构中的一种或多种,包括存储器总线或者存储器控制器、***总线、处理器或者使用多种总线结构中的任意总线结构的局域总线。
存储器82可以包括易失性存储器形式的可读介质,例如随机存取存储器(RAM)821和/或高速缓存存储器822,还可以进一步包括只读存储器(ROM)823。
存储器82还可以包括具有一组(至少一个)程序模块824的程序/实用工具825,这样的程序模块824包括但不限于:操作***、一个或者多个应用程序、其它程序模块以及程序数据,这些示例中的每一个或某种组合中可能包括网络环境的实现。
计算装置80也可以与一个或多个外部设备84(例如键盘、指向设备等)通信,还可与一个或者多个使得用户能与计算装置80交互的设备通信,和/或与使得该计算装置80能与一个或多个其它计算设备进行通信的任何设备(例如路由器、调制解调器等等)通信。这种通信可以通过输入/输出(I/O)接口85进行。并且,计算装置80还可以通过网络适配器86与一个或者多个网络(例如局域网(LAN),广域网(WAN)和/或公共网络,例如因特网)通信。如图所示,网络适配器86通过总线83与用于计算装置80的其它模块通信。应当理解,尽管图中未示出,可以结合计算装置80使用其它硬件和/或软件模块,包括但不限于:微代码、设备驱动器、冗余处理器、外部磁盘驱动阵列、RAID***、磁带驱动器以及数据备份存储***等。
在一些可能的实施方式中,本发明提供的信息展示方法的各个方面还可以实现为一种程序产品的形式,其包括程序代码,当所述程序产品在计算机设备上运行时,所述程序代码用于使所述计算机设备执行本说明书上述描述的根据本发明各种示例性实施方式的信息展示方法中的步骤,例如,所述计算机设备可以执行如图4中所示的步骤S41、针对任一展示位置,根据展示位置对应的匹配参考信息对展示信息集合中的展示信息进行排序;以及步骤S42、从排序后的展示信息中,依序选择为展示位置分配的满足限制条件的展示信息。
所述程序产品可以采用一个或多个可读介质的任意组合。可读介质可以是可读信号介质或者可读存储介质。可读存储介质例如可以是——但不限于——电、磁、光、电磁、红外线、或半导体的***、装置或器件,或者任意以上的组合。可读存储介质的更具体的例子(非穷举的列表)包括:具有一个或多个导线的电连接、便携式盘、硬盘、随机存取存储器(RAM)、只读存储器(ROM)、可擦式可编程只读存储器(EPROM或闪存)、光纤、便携式紧凑盘只读存储器(CD-ROM)、光存储器件、磁存储器件、或者上述的任意合适的组合。
本发明的实施方式的用于信息展示的程序产品可以采用便携式紧凑盘只读存储器(CD-ROM)并包括程序代码,并可以在计算设备上运行。然而,本发明的程序产品不限于此,在本文件中,可读存储介质可以是任何包含或存储程序的有形介质,该程序可以被指令执行***、装置或者器件使用或者与其结合使用。
可读信号介质可以包括在基带中或者作为载波一部分传播的数据信号,其中承载了可读程序代码。这种传播的数据信号可以采用多种形式,包括——但不限于——电磁信号、光信号或上述的任意合适的组合。可读信号介质还可以是可读存储介质以外的任何可读介质,该可读介质可以发送、传播或者传输用于由指令执行***、装置或者器件使用或者与其结合使用的程序。
可读介质上包含的程序代码可以用任何适当的介质传输,包括——但不限于——无线、有线、光缆、RF等等,或者上述的任意合适的组合。
可以以一种或多种程序设计语言的任意组合来编写用于执行本发明操作的程序代码,所述程序设计语言包括面向对象的程序设计语言—诸如Java、C++等,还包括常规的过程式程序设计语言—诸如“C”语言或类似的程序设计语言。程序代码可以完全地在用户计算设备上执行、部分地在用户设备上执行、作为一个独立的软件包执行、部分在用户计算设备上部分在远程计算设备上执行、或者完全在远程计算设备或服务器上执行。在涉及远程计算设备的情形中,远程计算设备可以通过任意种类的网络——包括局域网(LAN)或广域网(WAN)—连接到用户计算设备,或者,可以连接到外部计算设备(例如利用因特网服务提供商来通过因特网连接)。
应当注意,尽管在上文详细描述中提及了装置的若干单元或子单元,但是这种划分仅仅是示例性的并非强制性的。实际上,根据本发明的实施方式,上文描述的两个或更多单元的特征和功能可以在一个单元中具体化。反之,上文描述的一个单元的特征和功能可以进一步划分为由多个单元来具体化。
此外,尽管在附图中以特定顺序描述了本发明方法的操作,但是,这并非要求或者暗示必须按照该特定顺序来执行这些操作,或是必须执行全部所示的操作才能实现期望的结果。附加地或备选地,可以省略某些步骤,将多个步骤合并为一个步骤执行,和/或将一个步骤分解为多个步骤执行。
本领域内的技术人员应明白,本发明的实施例可提供为方法、***、或计算机程序产品。因此,本发明可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。而且,本发明可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、CD-ROM、光学存储器等)上实施的计算机程序产品的形式。
本发明是参照根据本发明实施例的方法、设备(***)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器,使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。
这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读存储器中,使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品,该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。
这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上,使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理,从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。
尽管已描述了本发明的优选实施例,但本领域内的技术人员一旦得知了基本创造性概念,则可对这些实施例做出另外的变更和修改。所以,所附权利要求意欲解释为包括优选实施例以及落入本发明范围的所有变更和修改。
显然,本领域的技术人员可以对本发明进行各种改动和变型而不脱离本发明的精神和范围。这样,倘若本发明的这些修改和变型属于本发明权利要求及其等同技术的范围之内,则本发明也意图包含这些改动和变型在内。
Claims (14)
1.一种信息展示方法,其特征在于,包括:
针对任一展示位置,获得所述展示位置与展示信息集合中的各展示信息之间的匹配参考信息,所述匹配参考信息为根据匹配参数确定出的,所述匹配参数至少包括与所述展示位置相邻的原生信息和所述展示信息之间的内容相似度;
根据所述匹配参考信息,为所述展示位置分配满足限制条件的展示信息。
2.如权利要求1所述的方法,其特征在于,确定所述原生信息和所述展示信息之间的内容相似度,包括:
利用信息分类模型分别确定所述展示信息和所述原生信息的特征向量,其中,所述信息分类模型利用带有标签的样本信息进行训练而得到;
根据所述展示信息的特征向量和原生信息的特征向量,确定两者之间的内容相似度。
3.如权利要求1所述的方法,其特征在于,根据所述匹配参考信息,为所述展示位置分配满足限制条件的展示信息,具体包括:
根据所述匹配参考信息,对所述展示信息集合中的展示信息进行排序;
从所述展示信息集合中,依序选择为所述展示位置分配满足限制条件的展示信息。
4.如权利要求1所述的方法,其特征在于,所述匹配参数还包括以下至少一项:所述展示位置被展示的概率和展示信息被展示的概率,其中,所述展示位置被展示的概率根据包含展示位置的展示页面被浏览次数和所述展示位置被展示的次数确定,所述展示信息被展示的概率根据展示信息需求展示次数与满足该展示信息对应的展示限制条件的展示位置数量确定。
5.如权利要求4所述的方法,其特征在于,获得所述展示位置与展示信息集合中的展示信息之间的匹配参考信息,包括:
根据所述原生信息与展示信息之间的内容相似度和所述展示位置被展示的概率和/或展示信息被展示的概率确定所述匹配参考信息。
6.如权利要求2所述的方法,其特征在于,利用带有标签的样本信息进行训练得到所述信息分类模型,包括:
读取样本信息;
从读取的样本信息中提取样本特征;
将提取的样本特征转换为样本特征向量后输入所述信息分类模型中得到输出结果,所述输出结果中包含有所述样本信息对应于每一预测标签的预测概率;
根据所述样本信息对应的标签及其对应与每一预测标签的预测概率,判断信息分类模型的输出结果是否稳定;
如果不稳定,则调整模型参数继续训练,直至所述信息分类模型的输出结果稳定。
7.一种信息展示装置,其特征在于,包括:
获得单元,用于针对任一展示位置,获得所述展示位置与展示信息集合中各展示信息之间的匹配参考信息,所述匹配参考信息为根据匹配参数确定出的,所述匹配参数至少包括与所述展示位置相邻的原生信息和所述展示信息之间的内容相似度;
分配单元,用于根据所述匹配参考信息,为所述展示位置分配满足限制条件的展示信息。
8.如权利要求7所述的装置,其特征在于,还包括:
第一确定单元,用于利用信息分类模型分别确定所述展示信息和所述原生信息的特征向量,其中,所述信息分类模型利用带有标签的样本信息进行训练而得到;根据所述展示信息的特征向量和原生信息的特征向量,确定两者之间的内容相似度。
9.如权利要求7所述的装置,其特征在于,所述分配单元,具体用于:
根据所述匹配参考信息,对所述展示信息集合中的展示信息进行排序;
从所述展示信息集合中,依序选择为所述展示位置分配满足限制条件的展示信息。
10.如权利要求7所述的装置,其特征在于,所述匹配参数还包括以下至少一项:所述展示位置被展示的概率和展示信息被展示的概率,其中,所述展示位置被展示的概率为根据包含展示位置的展示页面被浏览次数和所述展示位置被展示的次数确定出的,所述展示信息被展示的概率为根据展示信息需求展示次数与满足该展示信息对应的展示限制条件展示位置数量确定出的。
11.如权利要求7所述的装置,其特征在于,
所述获得单元,用于根据所述原生信息与展示信息之间的内容相似度和所述展示位置被展示的概率和/或展示信息被展示的概率确定所述匹配参考信息。
12.如权利要求8所述的装置,其特征在于,还包括:
模型训练单元,用于读取样本信息,从读取的样本信息中提取样本特征;将提取的样本特征转换为样本特征向量后输入所述信息分类模型中得到输出结果,所述输出结果中包含有所述样本信息对应于每一预测标签的预测概率;根据所述样本信息对应的标签及其对应与每一预测标签的预测概率,判断信息分类模型的输出结果是否稳定;如果不稳定,则调整模型参数继续训练,直至所述信息分类模型的输出结果稳定。
13.一种计算装置,其特征在于,包括至少一个处理器、以及至少一个存储器,其中,所述存储器存储有计算机程序,当所述程序被所述处理器执行时,使得所述处理器执行权利要求1~6任一权利要求所述方法的步骤。
14.一种计算机可读介质,其特征在于,其存储有可由计算装置执行的计算机程序,当所述程序在计算装置上运行时,使得所述计算装置执行权利要求1~6任一所述方法的步骤。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201811549935.XA CN111339291B (zh) | 2018-12-18 | 2018-12-18 | 一种信息展示方法、装置和存储介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201811549935.XA CN111339291B (zh) | 2018-12-18 | 2018-12-18 | 一种信息展示方法、装置和存储介质 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN111339291A CN111339291A (zh) | 2020-06-26 |
CN111339291B true CN111339291B (zh) | 2022-12-30 |
Family
ID=71184985
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201811549935.XA Active CN111339291B (zh) | 2018-12-18 | 2018-12-18 | 一种信息展示方法、装置和存储介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN111339291B (zh) |
Families Citing this family (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN113763123A (zh) * | 2021-08-12 | 2021-12-07 | 阿里巴巴(中国)有限公司 | 商品推荐与搜索方法、设备及存储介质 |
Family Cites Families (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
GB2395808A (en) * | 2002-11-27 | 2004-06-02 | Sony Uk Ltd | Information retrieval |
CN102346778B (zh) * | 2011-10-11 | 2013-08-21 | 北京百度网讯科技有限公司 | 一种用于提供搜索结果的方法与设备 |
CN104112213B (zh) * | 2013-04-19 | 2018-09-04 | 腾讯科技(深圳)有限公司 | 推荐信息的方法及装置 |
JP6157205B2 (ja) * | 2013-05-10 | 2017-07-05 | 株式会社Nttドコモ | 情報処理システム及び情報処理装置 |
CN106257448A (zh) * | 2015-06-19 | 2016-12-28 | 阿里巴巴集团控股有限公司 | 一种关键词的展示方法和装置 |
CN105515956A (zh) * | 2015-12-31 | 2016-04-20 | 小米科技有限责任公司 | 一种展示通讯消息的方法和装置 |
CN105677880B (zh) * | 2016-01-12 | 2019-07-12 | 阿里巴巴集团控股有限公司 | 动态划分展示区域的实现方法和装置 |
CN108694211B (zh) * | 2017-04-11 | 2023-05-12 | 腾讯科技(深圳)有限公司 | 应用分发方法及装置 |
CN107577807B (zh) * | 2017-09-26 | 2020-11-10 | 百度在线网络技术(北京)有限公司 | 用于推送信息的方法和装置 |
-
2018
- 2018-12-18 CN CN201811549935.XA patent/CN111339291B/zh active Active
Also Published As
Publication number | Publication date |
---|---|
CN111339291A (zh) | 2020-06-26 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US9934515B1 (en) | Content recommendation system using a neural network language model | |
CN109086439B (zh) | 信息推荐方法及装置 | |
CN108319723B (zh) | 一种图片分享方法和装置、终端、存储介质 | |
CN109918662B (zh) | 一种电子资源的标签确定方法、装置和可读介质 | |
US10902077B2 (en) | Search result aggregation method and apparatus based on artificial intelligence and search engine | |
US11449553B2 (en) | Systems and methods for generating real-time recommendations | |
CN107256267A (zh) | 查询方法和装置 | |
CN102930054A (zh) | 数据搜索方法及*** | |
CN111241394B (zh) | 数据处理方法、装置、计算机可读存储介质及电子设备 | |
US10678831B2 (en) | Page journey determination from fingerprint information in web event journals | |
US10825071B2 (en) | Adaptive multi-perceptual similarity detection and resolution | |
CN111950593A (zh) | 一种推荐模型训练的方法及装置 | |
CN112989212B (zh) | 媒体内容推荐方法、装置和设备及计算机存储介质 | |
US20190065587A1 (en) | Page journey determination from web event journals | |
CN109977292B (zh) | 搜索方法、装置、计算设备和计算机可读存储介质 | |
CN112328889A (zh) | 推荐搜索词确定方法、装置、可读介质及电子设备 | |
CN112784157A (zh) | 行为预测模型的训练方法、行为预测方法及装置、设备 | |
CN103425767B (zh) | 一种提示数据的确定方法和*** | |
CN111339291B (zh) | 一种信息展示方法、装置和存储介质 | |
CN116956183A (zh) | 多媒体资源推荐方法、模型训练方法、装置及存储介质 | |
CN110083687A (zh) | 一种信息转换方法、设备及存储介质 | |
CN117132323A (zh) | 推荐内容的分析方法、装置、设备、介质及程序产品 | |
CN115329183A (zh) | 数据处理方法、装置、存储介质及设备 | |
CN112632962A (zh) | 人机交互***中实现自然语言理解方法和装置 | |
CN113743973A (zh) | 分析市场热点趋势的方法和装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
REG | Reference to a national code |
Ref country code: HK Ref legal event code: DE Ref document number: 40024224 Country of ref document: HK |
|
GR01 | Patent grant | ||
GR01 | Patent grant |