CN106339507A - 流媒体消息推送方法和装置 - Google Patents

流媒体消息推送方法和装置 Download PDF

Info

Publication number
CN106339507A
CN106339507A CN201610932458.XA CN201610932458A CN106339507A CN 106339507 A CN106339507 A CN 106339507A CN 201610932458 A CN201610932458 A CN 201610932458A CN 106339507 A CN106339507 A CN 106339507A
Authority
CN
China
Prior art keywords
streaming media
pushed
message
media message
user
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201610932458.XA
Other languages
English (en)
Other versions
CN106339507B (zh
Inventor
黄宙舒
黄嘉雯
汪景福
朱成芳
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Tencent Technology Shenzhen Co Ltd
Original Assignee
Tencent Technology Shenzhen Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Tencent Technology Shenzhen Co Ltd filed Critical Tencent Technology Shenzhen Co Ltd
Priority to CN201610932458.XA priority Critical patent/CN106339507B/zh
Publication of CN106339507A publication Critical patent/CN106339507A/zh
Application granted granted Critical
Publication of CN106339507B publication Critical patent/CN106339507B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/40Information retrieval; Database structures therefor; File system structures therefor of multimedia data, e.g. slideshows comprising image and additional audio data
    • G06F16/43Querying
    • G06F16/435Filtering based on additional data, e.g. user or group profiles
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/953Querying, e.g. by the use of web search engines
    • G06F16/9535Search customisation based on user profiles and personalisation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • G06F40/205Parsing

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Databases & Information Systems (AREA)
  • General Physics & Mathematics (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Multimedia (AREA)
  • Health & Medical Sciences (AREA)
  • Artificial Intelligence (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Computational Linguistics (AREA)
  • General Health & Medical Sciences (AREA)
  • Information Transfer Between Computers (AREA)

Abstract

本发明公开了一种流媒体消息推送方法和装置。该方法包括:接收流媒体消息推送请求,其中携带有待推送用户的用户标识;获取用户标识对应的用户向量模型,其中包括至少一个流媒体消息类别、每个流媒体消息类别的概率分布、每个流媒体消息类别的向量模型;根据每个流媒体消息类别的概率分布确定待推送的流媒体消息类别,并获取该类别下的待推送的流媒体消息以及待推送的流媒体消息的流媒体向量模型;根据待推送的流媒体消息类别的向量模型与待推送的流媒体消息的流媒体向量模型之间的向量相似度确定第一目标流媒体消息;并将其推送给待推送用户。本发明解决了相关技术中向用户推送的流媒体消息的丰富度较低的技术问题。

Description

流媒体消息推送方法和装置
技术领域
本发明涉及计算机领域,具体而言,涉及一种流媒体消息推送方法和装置。
背景技术
目前,用户在执行流媒体行为(例如浏览网页、观看视频等)过程中,为了提高用户的使用体验,增加流媒体消息的数据点击量,相关技术会向该用户推荐与其相关的流媒体消息。相关技术通常采用基于内容的流媒体消息推荐方法,该方法使用一条向量表示用户特征模型,一条向量表示流媒体消息特征模型,然后使用向量的相似度表示用户和流媒体消息之间的推荐程度,并按照推荐程度由高到低的顺序向用户推荐流媒体消息。但是,相关技术中的用户特征模型仅用于表示用户的基本属性参数(例如用户名称、年龄、性别等)以及用户历史操作行为(例如观看过的视频、观看视频的时间等),而流媒体消息特征模型也仅是用于表示该流媒体消息的内容描述信息。上述基于内容的流媒体消息推荐方法将会导致向用户推送的流媒体消息的丰富度较低、推荐面较窄、推荐无惊喜、而且容易陷入热门推荐。
针对上述的问题,目前尚未提出有效的解决方案。
发明内容
本发明实施例提供了一种流媒体消息推送方法和装置,以至少解决相关技术中向用户推送的流媒体消息的丰富度较低的技术问题。
根据本发明实施例的一个方面,提供了一种流媒体消息推送方法,包括:接收流媒体消息推送请求,其中,流媒体消息推送请求中携带有待推送用户的用户标识;获取用户标识对应的用户向量模型,其中,用户向量模型中包括:至少一个流媒体消息类别、每个流媒体消息类别的概率分布、每个流媒体消息类别的向量模型;根据每个流媒体消息类别的概率分布确定待推送的流媒体消息类别,并获取待推送的流媒体消息类别下的待推送的流媒体消息以及待推送的流媒体消息的流媒体向量模型;根据待推送的流媒体消息类别的向量模型与待推送的流媒体消息的流媒体向量模型之间的向量相似度确定第一目标流媒体消息;以及将第一目标流媒体消息推送给待推送用户。
根据本发明实施例的另一方面,还提供了一种流媒体消息推送装置,包括:接收单元,用于接收流媒体消息推送请求,其中,流媒体消息推送请求中携带有待推送用户的用户标识;第一获取单元,用于获取用户标识对应的用户向量模型,其中,用户向量模型中包括:至少一个流媒体消息类别、每个流媒体消息类别的概率分布、每个流媒体消息类别的向量模型;第一确定单元,用于根据每个流媒体消息类别的概率分布确定待推送的流媒体消息类别,并获取待推送的流媒体消息类别下的待推送的流媒体消息以及待推送的流媒体消息的流媒体向量模型;第二确定单元,用于根据待推送的流媒体消息类别的向量模型与待推送的流媒体消息的流媒体向量模型之间的向量相似度确定第一目标流媒体消息;以及推送单元,用于将第一目标流媒体消息推送给待推送用户。
在本发明实施例中,通过获取待推送用户对应的用户向量模型,利用该用户向量模型中的每个流媒体消息类别的概率分布确定待推送的流媒体消息类别,并获取该待推送的流媒体消息类别下的待推送的流媒体消息及其流媒体向量模型,最后再根据所述待推送的流媒体消息类别的向量模型与所述待推送的流媒体消息的流媒体向量模型之间的向量相似度确定第一目标流媒体消息推送给待推送用户,达到了从多个流媒体消息类别下选择流媒体消息向用户进行推送的目的,进而解决了相关技术中向用户推送的流媒体消息的丰富度较低的技术问题,从而实现了提高向用户推送的流媒体消息的丰富度和准确度的技术效果。
附图说明
此处所说明的附图用来提供对本发明的进一步理解,构成本申请的一部分,本发明的示意性实施例及其说明用于解释本发明,并不构成对本发明的不当限定。在附图中:
图1是根据本发明实施例的流媒体消息推送方法的硬件环境的示意图;
图2是根据本发明实施例的一种可选的流媒体消息推送方法的流程图;
图3是根据本发明实施例的一种可选的用户向量模型的示意图;
图4是根据本发明实施例的一种可选的流媒体向量模型的示意图;
图5是根据本发明实施例的另一种可选的用户向量模型的示意图;
图6是根据本发明实施例的另一种可选的流媒体向量模型的示意图;
图7是根据本发明优选实施例的分类效果的示意图;
图8是根据本发明实施例的一种可选的流媒体消息推送装置的示意图;
图9是根据本发明实施例的另一种可选的流媒体消息推送装置的示意图;
图10是根据本发明实施例的另一种可选的流媒体消息推送装置的示意图;
图11是根据本发明实施例的另一种可选的流媒体消息推送装置的示意图;
图12是根据本发明实施例的另一种可选的流媒体消息推送装置的示意图;
图13是根据本发明实施例的另一种可选的流媒体消息推送装置的示意图;
图14是根据本发明实施例的另一种可选的流媒体消息推送装置的示意图;
图15是根据本发明实施例的另一种可选的流媒体消息推送装置的示意图;
图16是根据本发明实施例的另一种可选的流媒体消息推送装置的示意图;以及
图17是根据本发明实施例的一种终端的结构框图。
具体实施方式
为了使本技术领域的人员更好地理解本发明方案,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分的实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都应当属于本发明保护的范围。
需要说明的是,本发明的说明书和权利要求书及上述附图中的术语“第一”、“第二”等是用于区别类似的对象,而不必用于描述特定的顺序或先后次序。应该理解这样使用的数据在适当情况下可以互换,以便这里描述的本发明的实施例能够以除了在这里图示或描述的那些以外的顺序实施。此外,术语“包括”和“具有”以及他们的任何变形,意图在于覆盖不排他的包含,例如,包含了一系列步骤或单元的过程、方法、***、产品或设备不必限于清楚地列出的那些步骤或单元,而是可包括没有清楚地列出的或对于这些过程、方法、产品或设备固有的其它步骤或单元。
首先,在对本发明实施例进行描述的过程中出现的部分名词或者术语适用于如下解释:
流媒体:是指采用流式传输的方式在Internet播放的媒体格式。它是指商家用一个视频传送服务器把节目当成数据包发出,传送到网络上,用户通过解压设备对这些数据进行解压后,节目就会向发送之前那样显示出来。
TF-IDF:是一种统计方法,用以评估一个字词对于一个文件集或一个语料库中的其中一份文件的重要程度,字词的重要性随着它在文件中出现的次数成正比增加,但同时会随着它在语料库中出现的频率成反比下降。
实施例1
根据本发明实施例,提供了一种流媒体消息推送方法的方法实施例。
可选地,在本实施例中,上述流媒体消息推送方法可以应用于如图1所示的由服务器102和终端104所构成的硬件环境中。如图1所示,服务器102通过网络与终端104进行连接,上述网络包括但不限于:广域网、城域网或局域网,终端104并不限定于PC、手机、平板电脑等。本发明实施例的流媒体消息推送方法可以由服务器102来执行,也可以由终端104来执行,还可以是由服务器102和终端104共同执行。其中,终端104执行本发明实施例的流媒体消息推送方法也可以是由安装在其上的客户端来执行。
图2是根据本发明实施例的一种可选的流媒体消息推送方法的流程图,如图2所示,该方法可以包括以下步骤:
步骤S202,接收流媒体消息推送请求,其中,流媒体消息推送请求中携带有待推送用户的用户标识;
步骤S204,获取用户标识对应的用户向量模型,其中,用户向量模型中包括:至少一个流媒体消息类别、每个流媒体消息类别的概率分布、每个流媒体消息类别的向量模型;
步骤S206,根据每个流媒体消息类别的概率分布确定待推送的流媒体消息类别,并获取待推送的流媒体消息类别下的待推送的流媒体消息以及待推送的流媒体消息的流媒体向量模型;
步骤S208,根据待推送的流媒体消息类别的向量模型与待推送的流媒体消息的流媒体向量模型之间的向量相似度确定第一目标流媒体消息;
步骤S210,将第一目标流媒体消息推送给待推送用户。
首先需要说明的是,上述步骤可以由服务器执行,也可以由安装在终端设备中的播放器客户端执行,其中,本发明实施例对播放器客户端的类型不做具体限定,其可以为网页播放器,也可以为客户端播放器。终端设备可以包括但并不限于PC、手机、平板电脑、智能电视等。
通过上述步骤S202至步骤S210,通过获取待推送用户对应的用户向量模型,利用该用户向量模型中的每个流媒体消息类别的概率分布确定待推送的流媒体消息类别,并获取该待推送的流媒体消息类别下的待推送的流媒体消息及其流媒体向量模型,最后再根据所述待推送的流媒体消息类别的向量模型与所述待推送的流媒体消息的流媒体向量模型之间的向量相似度确定第一目标流媒体消息推送给待推送用户,达到了从多个流媒体消息类别下选择流媒体消息向用户进行推送的目的,进而解决了相关技术中向用户推送的流媒体消息的丰富度较低的技术问题,从而实现了提高向用户推送的流媒体消息的丰富度和准确度的技术效果。
在步骤S202提供的技术方案中,本发明实施例中的流媒体消息可以是文字、图片、音频、视频等形式,流媒体消息可以为广告、音乐、电影等,本发明实施例对流媒体消息的形式和内容不做具体限定。流媒体消息推送请求可以用于指示向待推送用户推送流媒体消息,其中,流媒体消息推送请求中可以携带有待推送用户的用户标识,待推送用户的用户标识可以是用户ID、用户名称等信息。向待推送用户所推送的流媒体消息可以为与该待推送用户的用户标识相关联的流媒体消息。流媒体消息推送请求中还可以携带有待推送用户当前所使用的播放器客户端的信息,例如播放器客户端ID、IP地址等信息。
在实际应用场景中,流媒体消息推送请求可以通过以下任意一种方式触发生成,具体可以包括:待推送用户登录播放器客户端自动触发生成流媒体消息推送请求;待推送用户在播放器客户端中执行预定操作触发生成,此处的预定操作可以包括但并不限于:在播放器客户端中对任意一个流媒体消息所执行的播放、暂停等操作;在播放器客户端中对任意一个播放控制按钮所执行的点击、长按等操作;在播放器客户端中对任意一个网络链接所执行的点击操作等。需要说明的是,本发明实施例还可以使用其他方式触发生成流媒体消息推送请求,此处不再一一举例说明。
本发明实施例在接收到流媒体消息推送请求之后,可以首先对其进行解析,从中得到待推送用户的用户标识,其中,该用户标识可以是待推送用户登录播放器客户单的登录账号、手机号等,以便于通过相关计算获取到与该用户标识相关联的流媒体消息推送给该待推送用户。
在步骤S204提供的技术方案中,在接收到流媒体消息推送请求之后,该实施例可以对该流媒体消息推送请求进行响应,其响应过程可以包括先获取与该待推送用户的用户标识相对应的用户向量模型,该用户向量模型可以用于表示待推送用户的基本属性信息、历史操作行为信息、针对不同流媒体消息的兴趣分布等信息。此处需要说明的是,本发明实施例可以预先为登录过播放器客户端的多个用户建立与其对应的用户向量模型,并建立用户标识与用户向量模型的对应关系,当接收到流媒体消息推送请求之后,可以根据用户标识与用户向量模型的对应关系查找与该流媒体消息推送请求中所携带的用户标识相对应的用户向量模型,这种预先建立用户向量模型的方式能够缩短获取与待推送用户的用户标识相对应的用户向量模型的时间,进而提高向待推送用户推送与其相关联的流媒体消息的效率。
下面将详细说明用户向量模型的建立过程,具体可以包括以下步骤S2011至步骤S2013:
步骤S2011,对流媒体消息进行分类,得到至少一个流媒体消息类别。
在步骤S2011提供的技术方案中,此处的流媒体消息可以为预先存储的多个流媒体消息,该实施例可以按照流媒体消息的类型对多个流媒体消息进行分类,得到至少一个流媒体消息类别。此处需要说明的是,流媒体消息类别可以包括但并不限于:新闻、科技、娱乐、健康、女性等类别。该实施例在对多个流媒体消息进行分类后,可以为每个流媒体消息类别分配一个标识名称,例如“新闻”、“娱乐”等标识名称,以直观清楚地表示该流媒体消息类别。还需要说明的是,在对多个流媒体消息进行分类所采用的分类算法本发明实施例不做具体限定,其可以使用softmax多标签分类,也可以采用svm、gbdt等分类算法。
步骤S2012,计算待推送用户在至少一个流媒体消息类别中的每个流媒体消息类别的概率分布和向量模型。
在步骤S2012提供的技术方案中,在对流媒体消息进行分类后,该实施例可以计算每个流媒体消息类别的概率分布和每个流媒体消息类别的向量模型,其中,流媒体消息类别的概率分布可以用于表示待推送用户对该流媒体消息类别的兴趣分布,也即待推送用户对哪个类别的流媒体消息更感兴趣;流媒体消息类别的向量模型可以用于表示待推送用户在该流媒体消息类别下的向量模型,也即表示待推送用户在该类别下对流媒体消息的所执行的流媒体行为的信息。
作为一种可选的实施例,步骤S2012计算待推送用户在至少一个流媒体消息类别中的每个流媒体消息类别的概率分布和向量模型可以包括以下步骤:
步骤S20122,按照以下公式计算待推送用户在每个流媒体消息类别的概率分布:
P ( l | u s e r ) = Σ i ∈ u s e r , l r i Σ j ∈ u s e r r j
步骤S20124,按照以下公式计算待推送用户在每个流媒体消息类别的向量模型:
V u s e r , l = Σ i ∈ u s e r , l exp { λ - t i 2 σ 2 } · r i · V i
其中,user为待推送用户,l为至少一个流媒体消息类别中的第l个类别,j为至少一个流媒体消息类别中的第j个流媒体消息,i为第l个类别中的第i个流媒体消息,ri为待推送用户播放第i个流媒体消息的完成度,rj为待推送用户播放第j个流媒体消息的完成度,ti为待推送用户播放过第i个流媒体消息的时间,也即在多久之前播放过第i个流媒体消息,Vi为第i个流媒体消息的流媒体向量模型,P(l|user)为第l个类别的概率分布,Vuser,l为第l个类别的向量模型。
此处需要说明的是,每个流媒体消息可以对应一个流媒体向量模型,该流媒体向量模型可以用于标识该流媒体消息的相关特征。作为一种可选的实施例,流媒体消息的流媒体向量模型的具体建立过程可以包括以下步骤S2014至步骤S2016:
步骤S2014,对用于描述流媒体消息的语句进行分词,得到多个词语。
在步骤S2014提供的技术方案中,该实施例可以对用于描述流媒体消息的语句进行分词,得到多个词语。此处需要说明的是,该实施例可以使用conditional randomfields模型进行分词,也可以使用隐马尔科夫模型进行分词,此处不做具体限定。
步骤S2015,分别获取多个词语中的每个词语的词向量。
在步骤S2015提供的技术方案中,在分词得到多个词语之后,该实施例可以对分别获取每个词语的词向量。此处需要说明的是,该实施例可以使用word embedding方法提取每个词语的一个隐含分词表示词分布的向量,也即词向量,也可以使用Glove、recurrentneural network、deep learning等方法获取每个词语的词向量,此处不做具体限定。
步骤S2016,按照以下公式计算流媒体消息的流媒体向量模型:
V m e d i a = Σ v i ∈ V m e d i a p i · v i
其中,i为多个词语中的第i个词语,vi为第i个词语的词向量,pi为第i个词语的权重,其可以根据实际需求进行相应调整,Vmedia为流媒体消息的流媒体向量模型。
在步骤S2016提供的技术方案中,在获取到每个词语的词向量之后,利用步骤S2016中的公式可以获取到该流媒体消息的流媒体向量模型。
需要说明的是,针对每个流媒体消息应用上述步骤S2014至步骤S2016所示的计算方法,可以得到每个流媒体消息的流媒体向量模型。
在计算到每个流媒体消息的流媒体向量模型之后,利用步骤S20124中的公式可以计算到待推送用户在第l个类别的向量模型。针对每个流媒体消息类别均应用上述计算方法便可以计算得到每个流媒体消息类别的概率分布和向量模型。
步骤S2013,建立用户标识、流媒体消息类别、概率分布以及向量模型的对应关系,得到用户向量模型。
在步骤S2013提供的技术方案中,用户向量模型中可以包括用户标识、至少一个流媒体消息类别、每个流媒体消息类别的概率分布、每个流媒体消息的向量模型,具体对应关系可以参见图3所示的用户向量模型,在图3中,该用户标识对应三个流媒体消息类别,分别为新闻、科技、娱乐,其中,新闻类分支可以包括新闻类的概率分布、新闻类的向量模型,科技类分支可以包括科技类的概率分布、科技类的向量模型,娱乐类分支可以包括娱乐类的概率分布、娱乐类的向量模型。而流媒体消息的流媒体向量模型可以如图4所示,在图4中的流媒体消息属于新闻类,流媒体消息与流媒体向量模型具有对应关系。
至此,通过上述步骤可以计算得到多个流媒体消息的流媒体向量模型以及多个用户的用户向量模型。本发明实施例可以将计算得到的多个流媒体消息的流媒体向量模型以及多个用户的用户向量模型进行存储,以便于通过用户标识可以快速查找到与其对应的用户向量模型,通过流媒体消息标识可以快速查找到与其对应的流媒体向量模型。需要说明的是,本发明实施例中的流媒体向量模型和用户向量模型可以支持实时更新,随着流媒体消息的更新或者内容的调整,流媒体向量模型可以对应性进行更新,随着用户操作行为信息的变化或流媒体向量模型的更新,用户向量模型也可以对应性进行更新,这样能够提高所获取到的流媒体向量模型和用户向量模型的准确度。还需要说明的是,本发明实施例中用户向量模型中包括流媒体消息类别以及每个流媒体消息类别的概率分布和向量模型,相较于传统的用户向量模型准确度更高,且通过对流媒体消息进行分类并获取每个流媒体类别的概率分布,能够更加准确地获知用户的兴趣分布,对于流媒体消息的推送能够更加符合用户兴趣,进而提升向用户推送流媒体消息的准确度。
在步骤S206提供的技术方案中,在获取到待推送用户的用户标识所对应的用户向量模型之后,本发明实施例可以通过对该获取到的用户向量模型中的每个流媒体消息类别的概率分布进行分析,从中选择出概率最大的流媒体消息类别,并将该选择出的流媒体消息类别作为待推送的流媒体消息类别。例如,如图3所示的用户向量模型中三个类别的概率分布,假设新闻类流媒体消息的概率为0.3、科技类流媒体消息的概率为0.4、娱乐类流媒体消息的概率为0.3,则通过比较可以确定待推送的流媒体消息类别为科技。
在确定待推送的流媒体消息类别之后,根据用户向量模型中的对应关系可以获取到该待推送的流媒体消息类别的向量模型,例如,假设所确定的待推送的流媒体消息类别为新闻,则待推送的流媒体消息类别的向量模型为新闻类的向量模型。
在确定待推送的流媒体消息类别之后,还可以根据流媒体向量模型中的对应关系获取到属于该类别的所有的流媒体消息并将其作为待推送的流媒体消息,在确定待推送的流媒体消息之后,可以获取待推送的流媒体消息的流媒体向量模型。需要说明的是,待推送的流媒体消息类别下的待推送的流媒体消息可以为一个,也可以为多个,此处不做具体限定。
需要说明的是,本发明实施例根据用户向量模型中每个流媒体消息类别的概率分布确定待推送的流媒体消息类别,进而确定该待推送的流媒体消息类别下的待推送的流媒体消息,相较于传统的基于内容的流媒体消息推荐方法能够提高所推送的流媒体消息的丰富度,也能够使得所确定的流媒体消息更加符合用户兴趣分布,能够增加所确定的流媒体消息与待推送用户之间的关联度,进而达到提高向待推送用户推送流媒体消息的准确度的效果。
在步骤S208提供的技术方案中,在获取到待推送的流媒体消息类别的向量模型以及待推送的流媒体消息的流媒体向量模型之后,本发明实施例可以根据两者之间的向量相似度从待推送的流媒体消息中确定第一目标流媒体消息。根据待推送的流媒体消息类别的向量模型和待推送的流媒体消息的流媒体向量模型之间的向量相似度所确定的第一目标流媒体消息能够更加符合待推送用户的兴趣需求,进而能够提高待推送用户对所推送的第一目标流媒体消息的点击量。
作为一种可选的实施例,步骤S208根据待推送的流媒体消息类别的向量模型与待推送的流媒体消息的流媒体向量模型之间的向量相似度确定第一目标流媒体消息可以包括以下步骤:
步骤S2082,按照以下公式计算待推送的流媒体消息类别的向量模型与待推送的流媒体消息的流媒体向量模型之间的向量相似度:
v e c _ simi i = α V u s e r ⊥ V i V u s e r ⊥ V u s e r V i ⊥ V i + ( 1 - α ) ( V u s e r - V i ) ⊥ ( V u s e r - V i ) max ( ( V k - V l ) ⊥ ( V k - V l ) )
其中,Vi为第i个待推送的流媒体消息的流媒体向量模型,Vuser为待推送的流媒体消息类别的向量模型,Vk为第一用户的用户向量模型,此处的第一用户可以是任意一个用户,Vl为第一流媒体消息的流媒体向量模型,此处的第一流媒体消息可以是任意一个流媒体消息,vec_simii为待推送的流媒体消息类别的向量模型与第i个待推送的流媒体消息的流媒体向量模型之间的向量相似度。
步骤S2084,选取向量相似度大于第一预定阈值的流媒体消息确定为第一目标流媒体消息。
需要说明的是,针对每个待推送的流媒体消息,通过步骤S2082中的公式计算得到待推送的流媒体消息类别的向量模型与待推送的流媒体消息的流媒体向量模型之间的向量相似度之后,可以判断该向量相似度是否大于第一预定阈值,如果计算得到的向量相似度大于第一预定阈值,则可以将该待推送的流媒体消息确定为第一目标流媒体消息,可以将其推送给待推送用户;如果计算得到的向量相似度小于或等于第一预定阈值,则该待推送的流媒体消息不是第一目标流媒体消息,不可以将其推送给待推送用户。还需要说明的是,依据上述步骤所确定的第一目标流媒体可以为待推送的流媒体消息中的部分或者全部,第一目标流媒体消息的个数可以是一个,也可以是多个。
该实施例根据待推送的流媒体消息类别的向量模型与待推送的流媒体消息类别与待推送的流媒体消息的流媒体向量模型之间的向量相似度确定第一目标流媒体消息,能够提高所确定的第一目标流媒体消息与待推送用户之间的关联度,进而使得推送给待推送用户的第一目标流媒体消息更加符合待推送用户的兴趣需求,提高待推送用户对第一目标流媒体消息的点击量。
在步骤S210提供的技术方案中,在确定第一目标流媒体消息之后,本发明实施例可以将第一目标流媒体消息推送给待推送用户,此处需要说明的是,本发明实施例对第一目标流媒体消息的推送方式不做具体限定,例如第一目标流媒体消息可以以消息弹窗的形式推送给待推送用户。还需要说明的是,第一目标流媒体消息可以推送至播放器客户端的播放界面中,其中,本发明实施例对第一目标流媒体消息在播放界面中的显示位置和显示方式不做具体限定,例如,第一目标流媒体消息可以每隔预定时间便以提示消息的形式显示在播放界面右下角。
可选地,当第一目标流媒体消息为多个时,本发明实施例可以以消息列表的方式将这些第一目标流媒体消息推送给待推送用户。列表推送这些第一目标流媒体消息时,可以按照这些第一目标流媒体所属的类别进行排序,这样能够使得待推送用户可以直观清楚地查看列表中的第一目标流媒体消息。
该实施例根据预先建立的用户向量模型确定待推送的流媒体消息类别,并依据待推送的流媒体消息类别的向量模型与待推送的流媒体消息类别与待推送的流媒体消息的流媒体向量模型之间的向量相似度确定第一目标流媒体消息推送给待推送用户,能够达到从多个流媒体消息类别下选择流媒体消息向用户进行推送的目的,进而解决了相关技术中向用户推送的流媒体消息的丰富度较低的技术问题,从而实现了提高向用户推送的流媒体消息的丰富度和准确度的技术效果。
作为一种可选的实施例,流媒体消息的流媒体向量模型中还可以包括流媒体消息的标签,用户向量模型中也还可以包括每个流媒体消息类别的标签。此处需要说明的是,该实施例中的标签一个词语,也可以是一个标识符,此处对标签不做具体限定。
其中,用户向量模型中每个流媒体消息类别均具有一个标签集合或者一个标签,本发明实施例中的标签可以为标签集合,也可以为一个或者多个标签。此处以获取用户向量模型中待推送的流媒体消息类别的标签为例具体说明用户向量模型中每个流媒体消息类别的标签的获取过程,具体地,获取用户向量模型中待推送的流媒体消息类别的标签可以包括以下步骤:
步骤S2017,按照以下公式获取待推送的流媒体消息类别的标签:
{ tag k : Σ tag k ∈ M i exp { λ - t i 2 σ 2 } · r i > c u t o f f }
其中,tagk为待推送的流媒体消息类别下的第k个标签,Mi为待推送的流媒体消息类别下的第i个流媒体消息所包含的标签,cutoff为标签权重阈值,其可以根据实际需求设定或调整,ri为待推送用户播放待推送的流媒体消息类别下的第i个流媒体消息的完成度,ti为待推送用户播放过待推送的流媒体消息类别下的第i个流媒体消息的时间。
需要说明的是,针对用户向量模型中的任意一个流媒体消息类别均可以利用步骤S2017中的公式获取到该流媒体消息类别的标签,在获取到用户向量模型中的所有流媒体消息类别的标签后,将其对应添加至用户向量模型中。例如,如图3所示的用户向量模型,添加流媒体消息类别的标签后,得到的用户向量模型可以如图5所示。
该实施例中的用户向量模型中包括至少一个流媒体消息类别、每个流媒体消息类别的概率分布、每个流媒体消息类别的向量模型以及每个流媒体消息类别的标签,利用这样的用户向量模型所确定的待推送的流媒体消息的丰富度和准确度更高。
其中,流媒体消息的标签的计算过程可以包括以下步骤S2018至步骤S20110:
步骤S2018,对用于描述流媒体消息的语句进行分词,得到多个词语。
在步骤S2018提供的技术方案中,该实施例可以对用于描述流媒体消息的语句进行分词,得到多个词语。此处需要说明的是,该实施例可以使用conditional randomfields模型进行分词,也可以使用隐马尔科夫模型进行分词,此处不做具体限定。
步骤S2019,从多个词语中提取关键词。
在步骤S2019提供的技术方案中,在分词得到多个词语之后,该实施例可以从多个词语中提取关键词,可选地,该实施例可以利用TF-IDF作为权重依据提取关键词,将TF-IDF较大的词语作为关键词。此处需要说明的是,从多个词语中提取得到的关键词可以是一个,也可以是多个。
步骤S20110,从多个关键词中选取权重系数大于第三预定阈值且属于预设标签库的关键词作为流媒体消息的标签。
在步骤S20110提供的技术方案中,流媒体消息的标签可以为关键词中的一个或者多个。在提取得到多个关键词之后,该实施例可以从多个关键词中选取权重系数大于第三预定阈值的关键词作为流媒体消息的标签,需要说明的是,此处的权重系数可以为TF-IDF系数,此处的第三预定阈值可以根据实际需求设定或调整。在确定流媒体消息的标签时,除了计算关键词的权重系数之外,所选取的标签还要属于预设标签库,其中,预设标签库可以为预先建立并保存的标签库。对于属于该预设标签库且权重系数大于第三预定阈值的关键词可以作为流媒体消息的标签。
在获取到流媒体消息的标签后,将其对应添加至流媒体向量模型中。例如,如图4所示的流媒体向量模型,添加流媒体消息的标签后,得到的流媒体向量模型可以如图6所示。
该实施例中的流媒体向量模型中包括流媒体消息的标签,利用流媒体消息的标签对待推送的流媒体消息进行进一步过滤筛选,可以得到更为准确的流媒体消息,能够使得该流媒体消息更加符合用户兴趣需求。
需要说明的是,本发明实施例中可以利用获取到的用户向量模型中的流媒体消息类别的标签以及流媒体消息的标签对第一目标流媒体消息进行进一步过滤筛选,以达到使得推送给待推送用户的流媒体消息更加准确的目的。
作为一种可选的实施例,在步骤S208根据待推送的流媒体消息类别的向量模型与待推送的流媒体消息的流媒体向量模型之间的向量相似度确定第一目标流媒体消息之后,该实施例还可以包括以下步骤:
步骤S209,根据待推送的流媒体消息类别的标签与第一目标流媒体消息的标签之间的匹配度从第一目标流媒体消息中选择第二目标流媒体消息。
需要说明的是,在确定待推送的流媒体消息类别之后,可以根据用户向量模型中的对应关系获取到该待推送的流媒体消息类别的标签。在确定待推送的流媒体消息类别之后,也可以获取到属于该类别的所有的待推送的流媒体消息,在从待推送的流媒体消息中选择第一目标流媒体消息之后,可以根据流媒体向量模型中的对应关系获取该第一目标流媒体消息的标签。该实施例在确定第一目标流媒体消息之后,为了进一步地提高向待推送用户推送的流媒体消息的准确度,可以根据待推送的流媒体消息类别的标签与第一目标流媒体消息的标签之间的匹配度从第一目标流媒体消息中选择出第二目标流媒体消息推送给待推送用户,其中,第二目标流媒体消息可以为第一目标流媒体消息中的部分或者全部,第二目标流媒体消息可以为一个,也可以为多个。
作为一种可选的实施例,步骤S209根据待推送的流媒体消息类别的标签与第一目标流媒体消息的标签之间的匹配度从第一目标流媒体消息中选择第二目标流媒体消息可以包括以下步骤S2092至步骤S2094:
步骤S2092,按照以下公式计算待推送的流媒体消息类别的标签与第一目标流媒体消息的标签之间的匹配度:
t a g _ res i = exp { tag i ⊥ β } Σ j ∈ m e d i a exp { tag j ⊥ β }
其中,media为第一目标流媒体消息的总数量,tagi为第i个第一目标流媒体消息的标签与待推送的流媒体消息类别的标签中相同的标签,tagj为第j个第一目标流媒体消息的标签与待推送的流媒体消息类别的标签中相同的标签,β为权重系数,tag_resi为待推送的流媒体消息类别的标签与第i个第一目标流媒体消息的标签之间的匹配度。
步骤S2094,选取匹配度大于第二预定阈值的第一目标流媒体消息确定为第二目标流媒体消息。
需要说明的是,针对第一目标流媒体消息,通过步骤S2092中的公式计算得到待推送的流媒体消息类别的标签与第一目标流媒体消息的标签之间的匹配度之后,可以判断该匹配度是否大于第二预定阈值,如果计算得到的匹配度大于第二预定阈值,则可以将该第一目标流媒体消息确定为第二目标流媒体消息,并将其推送给待推送用户;如果计算得到的匹配度小于或等于第二预定阈值,则该第一目标流媒体消息不是第二目标流媒体消息,则将其过滤掉不会推送给待推送用户。此处的第二预定阈值可以根据实际需求设定或调整,该实施例对其不做具体限定。
相应地,步骤S210将第一目标流媒体消息推送给待推送用户可以包括:步骤S2102,将第二目标流媒体消息推送给待推送用户。
需要说明的是,在利用步骤S2092至步骤S2094根据待推送的流媒体消息类别的标签与第一目标流媒体消息的标签之间的匹配度从第一目标流媒体消息中选择第二目标流媒体消息之后,可以将第二目标推送消息推送给待推送用户。此处需要说明的是,第二目标推送消息的推送方式与第一目标推送消息的推送方式相同,此处不再赘述。
该实施例确定第一目标流媒体之后进一步根据待推送的流媒体消息类别的标签与第一目标流媒体消息的标签之间的匹配度从第一目标流媒体消息中选择第二目标流媒体消息,并将推送的第二目标流媒体消息推送给待推送用户,能够提高向待推送用户推送的流媒体消息的准确度,进而达到提高所推送的第二目标流媒体消息与待推送用户之间的关联度,使得推送的第二目标流媒体消息更加符合待推送用户的兴趣需求。
本发明还提供了一种优选实施例,该优选实施例提供了一种基于NLP(自然语言处理)以及文本分类的流媒体消息个性化推荐方案。在这套方案中分为离线和在线两部分处理过程,离线部分处理用户操作过的历史消息,并生成用户向量模型与流媒体向量模型;在线部分则是用户上线后匹配流媒体消息并将匹配到的流媒体消息推送给用户的过程。下面将具体介绍离线侧和在线侧的具体处理过程:
离线侧:
流线流程可以具体包括以下过程:
利用自然语言处理技术将流媒体文字描述、媒资等分词并提取关键词,分词技术可以使用以下公式所示的conditional random fields模型表示分词序列(采用softmax作为概率表示):
p ( y | x ) = exp { Σ j Σ i λ i f i ( y j , y j - i , x , j ) } Σ Y ∈ C exp { Σ j Σ i λ i f i ( y j , Y j - i , x , j ) }
其中,x是指观测序列,y是可能的状态序列,利用整体数据的最大似然估计,就可以求得模型解了。
将流媒体媒资分词后,利用TF-IDF作为权重依据提取关键词和tag标签,我们使用wi表示第i个词语,在文档Dj中的TF-IDF公式如下:
T F - I D F ( w i , j ) = c o u n t ( i , w i ∈ D j ) c o u n t ( i , w i ∈ D ) l o g c o u n t ( D ) c o u n t ( l , w i ∈ D l )
媒资分词后可以使用word embedding方法提取每个词的一个隐含分词表示,即一条词分布的向量,主要原理如下:
m a x w 1 , w 2 , w 3 ... p ( w i ∈ S | { w 1 , w 2 , w - i ... } ⋐ S )
其中,S是给定的句子或段落,wi是第i个词语。原理就是最大化同一句子中的词汇出现的概率。该方案使用vi表示第i个词语的词向量,使用交叉熵作为概率并使其最大化:
P ( w i ∈ S | { w 1 , w 2 , w - i ... } ⋐ S ) = Π w j ∈ S exp { v i ⊥ v j , - i } Σ w k ∈ S exp { v i ⊥ v k , - i }
使用stochastic gradient descent最优化后即可得到每个词语的embedding向量,即上面的vi。得到关键词、tag标签以及相应的词向量之后,该方案可以利用每个流媒体产生的分词向量汇总得到流媒体向量模型,相应的tag标签得到tag标签模型。流媒体向量模型生成如下:
V m e d i a = Σ v i ∈ V m e d i a p i · v i
针对上述公式的相关描述以及说明参见本发明上述实施例,此处不再赘述。
生成流媒体向量模型后可以利用向量的性质作为特征对流媒体消息进行分类,分类采用softmax多标签分类,公式如下:
m a x v k ∈ l ( exp { θ l ⊥ v k } Σ i ∈ l exp { θ i ⊥ v k } + λ m Σ i ∈ l θ i ⊥ θ i )
其中,θ就是分类参数,l指第l类别。流媒体分类后可以得到更加精确的内容聚集类别,并且依照类别生成用户向量模型以及tag标签。
如图7所示的在26万测试集上面的分类效果,分类准确率和召回率都达到了88%,效果不错。
用户在第l类别的向量模型与类别分布生成公式如下:
V u s e r , l = Σ i ∈ u s e r , l exp { λ - t i 2 σ 2 } · r i · V i
P ( l | u s e r ) = Σ i ∈ u s e r , l r i Σ j ∈ u s e r r j
其中l表示视频是被分在第l类别当中;i指用户在l类别中看过的第i个视频;ti是用户在多久之前观看过这个视频,利用平方指数衰减来表示兴趣的时间衰减度;ri是用户播放视频的完成度情况,最终得到了Vuser,l表示用户在l类别下的向量模型,p(l|user)表示用户在l类别下的概率分布,也即用户在l类别下的兴趣分布。针对上述两个公式的相关描述以及说明参见本发明上述实施例,此处不再赘述。
同样的,用户在类别l下的tag标签也是根据用户的不同行为生成的,生成如下:
{ tag k : Σ tag k ∈ M i exp { λ - t i 2 σ 2 } · r i > c u t o f f }
Mi表示用户看过的第i个视频中包含的所有tag集合,cutoff表示tag的权重阀值,只有针对这个tag有了一定的操作行为之后,权重高于cutoff才能将这个tag赋予给用户表示其兴趣。针对上述公式的相关描述以及说明参见本发明上述实施例,此处不再赘述。
最终,一个拥有新闻,科技,娱乐类别的用户向量模型如图5所示,一个新闻类流媒体向量模型如图6所示。
离线侧至此完毕。
在线侧:
在线侧是用户匹配策略,即如何使用生成好的用户向量模型和流媒体向量模型来选出符合用户兴趣的流媒体消息进行推送,具体可以描述为:
用户来临后可以使用采样技术,依据用户向量模型中的各个类别的概率分布选择待推送的用户类别,使得推送的内容分布丰富程度和P(l|user)保持一致。得到指定的类别后,可以利用向量相似度选择出用户喜欢的主题范围流媒体消息,最终使用tag标签的匹配度选择最佳的圈入流媒体消息推送给用户。其中,向量相似度和tag标签匹配度参见以下公式:
v e c _ simi i = α V u s e r ⊥ V i V u s e r ⊥ V u s e r V i ⊥ V i + ( 1 - α ) ( V u s e r - V i ) ⊥ ( V u s e r - V i ) max ( ( V k - V l ) ⊥ ( V k - V l ) )
t a g _ res i = exp { tag i ⊥ β } Σ j ∈ m e d i a exp { tag j ⊥ β }
针对上述两个公式的相关描述以及说明参见本发明上述实施例,此处不再赘述。
需要说明的是,消息的表示方式一般是利用文案描述的,该优选实施例将消息的文案拿出来分析,分词后利用word embedding方式将消息表示成指定维度的向量(每个分量是属于(-1,1)的浮点数),采用这种方式表示的消息,具有信息量足,计算处理方便,分类准确率高的优点。用户兴趣体系一般是通过用户的历史浏览记录,行为记录等数据产生,用户对流媒体消息所采取的行为都是可以加权反应到流媒体消息本身的内容主题方面。该优选实施例在处理用户行为的数据的时候,采取了不同行为不同权重、行为消息的分类、用户兴趣分类向量的建立等优化方案。
使用该优选实施例中的方案,可以对用户推送符合用户兴趣的个性化推荐视频流媒体消息,进而解决了基于内容的个性化推荐方案中产生的推荐面窄,推荐丰富度不够,推荐不精确等问题。使用该方案后,个性化推荐数据点击量和点击率得到了有效提高。
需要说明的是,对于前述的各方法实施例,为了简单描述,故将其都表述为一系列的动作组合,但是本领域技术人员应该知悉,本发明并不受所描述的动作顺序的限制,因为依据本发明,某些步骤可以采用其他顺序或者同时进行。其次,本领域技术人员也应该知悉,说明书中所描述的实施例均属于优选实施例,所涉及的动作和模块并不一定是本发明所必须的。
通过以上的实施方式的描述,本领域的技术人员可以清楚地了解到根据上述实施例的方法可借助软件加必需的通用硬件平台的方式来实现,当然也可以通过硬件,但很多情况下前者是更佳的实施方式。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质(如ROM/RAM、磁碟、光盘)中,包括若干指令用以使得一台终端设备(可以是手机,计算机,服务器,或者网络设备等)执行本发明各个实施例所述的方法。
实施例2
根据本发明实施例,还提供了一种用于实施上述流媒体消息推送方法的流媒体消息推送装置。图8是根据本发明实施例的一种可选的流媒体消息推送装置的示意图,如图8所示,该装置可以包括:
接收单元22,用于接收流媒体消息推送请求,其中,流媒体消息推送请求中携带有待推送用户的用户标识;第一获取单元24,用于获取用户标识对应的用户向量模型,其中,用户向量模型中包括:至少一个流媒体消息类别、每个流媒体消息类别的概率分布、每个流媒体消息类别的向量模型;第一确定单元26,用于根据每个流媒体消息类别的概率分布确定待推送的流媒体消息类别,并获取待推送的流媒体消息类别下的待推送的流媒体消息以及待推送的流媒体消息的流媒体向量模型;第二确定单元28,用于根据待推送的流媒体消息类别的向量模型与待推送的流媒体消息的流媒体向量模型之间的向量相似度确定第一目标流媒体消息;以及推送单元210,用于将第一目标流媒体消息推送给待推送用户。
需要说明的是,该实施例中的接收单元22可以用于执行本申请实施例1中的步骤S202,该实施例中的第一获取单元24可以用于执行本申请实施例1中的步骤S204,该实施例中的第一确定单元26可以用于执行本申请实施例1中的步骤S206,该实施例中的第二确定单元28可以用于执行本申请实施例1中的步骤S208,该实施例中的推送单元210可以用于执行本申请实施例1中的步骤S210。
此处需要说明的是,上述模块与对应的步骤所实现的示例和应用场景相同,但不限于上述实施例1所公开的内容。需要说明的是,上述模块作为装置的一部分可以运行在如图1所示的硬件环境中,可以通过软件实现,也可以通过硬件实现。
作为一种可选的实施例,如图9所示,该实施例还可以包括:分类单元211,用于在接收流媒体消息推送请求之前,对流媒体消息进行分类,得到至少一个流媒体消息类别;第一计算单元212,用于计算待推送用户在至少一个流媒体消息类别中的每个流媒体消息类别的概率分布和向量模型;建立单元213,用于建立用户标识、流媒体消息类别、概率分布以及向量模型的对应关系,得到用户向量模型。
需要说明的是,该实施例中的分类单元211可以用于执行本申请实施例1中的步骤S2011,该实施例中的第一计算单元212可以用于执行本申请实施例1中的步骤S2012,该实施例中的建立单元213可以用于执行本申请实施例1中的步骤S2013。
此处需要说明的是,上述模块与对应的步骤所实现的示例和应用场景相同,但不限于上述实施例1所公开的内容。需要说明的是,上述模块作为装置的一部分可以运行在如图1所示的硬件环境中,可以通过软件实现,也可以通过硬件实现。
作为一种可选的实施例,如图10所示,第一计算单元212可以包括:第一计算模块2122,用于按照以下公式计算待推送用户在每个流媒体消息类别的概率分布:第二计算模块2124,用于按照以下公式计算待推送用户在每个流媒体消息类别的向量模型:其中,user为待推送用户,l为至少一个流媒体消息类别中的第l个类别,j为至少一个流媒体消息类别中的第j个流媒体消息,i为第l个类别中的第i个流媒体消息,ri为待推送用户播放第i个流媒体消息的完成度,rj为待推送用户播放第j个流媒体消息的完成度,ti为待推送用户播放过第i个流媒体消息的时间,Vi为第i个流媒体消息的流媒体向量模型,P(l|user)为第l个类别的概率分布,Vuser,l为第l个类别的向量模型。
需要说明的是,该实施例中的第一计算模块2122,可以用于执行本申请实施例1中的步骤S20122,该实施例中的第二计算模块2124可以用于执行本申请实施例1中的步骤S20124。
此处需要说明的是,上述模块与对应的步骤所实现的示例和应用场景相同,但不限于上述实施例1所公开的内容。需要说明的是,上述模块作为装置的一部分可以运行在如图1所示的硬件环境中,可以通过软件实现,也可以通过硬件实现。
作为一种可选的实施例,如图11所示,该实施例还可以包括:第一分词单元214,用于在接收流媒体消息推送请求之前,对用于描述流媒体消息的语句进行分词,得到多个词语;第二获取单元215,用于分别获取多个词语中的每个词语的词向量;第二计算单元216,用于按照以下公式计算流媒体消息的流媒体向量模型:其中,i为多个词语中的第i个词语,vi为第i个词语的词向量,pi为第i个词语的权重,Vmedia为流媒体消息的流媒体向量模型。
需要说明的是,该实施例中的分词单元214可以用于执行本申请实施例1中的步骤S2014,该实施例中的第二获取单元215可以用于执行本申请实施例1中的步骤S2015,该实施例中的第二计算单元216可以用于执行本申请实施例1中的步骤S2016。
此处需要说明的是,上述模块与对应的步骤所实现的示例和应用场景相同,但不限于上述实施例1所公开的内容。需要说明的是,上述模块作为装置的一部分可以运行在如图1所示的硬件环境中,可以通过软件实现,也可以通过硬件实现。
作为一种可选的实施例,如图12所示,第二确定单元28可以包括:第三计算模块282,用于按照以下公式计算待推送的流媒体消息类别的向量模型与待推送的流媒体消息的流媒体向量模型之间的向量相似度:其中,Vi为第i个流媒体消息的流媒体向量模型,Vuser为待推送的流媒体消息类别的向量模型,Vk为第一用户的用户向量模型,Vl为第一流媒体消息的流媒体向量模型,vec_simii为待推送的流媒体消息类别的向量模型与第i个流媒体消息的流媒体向量模型之间的向量相似度;第一选取模块284,用于选取向量相似度大于第一预定阈值的流媒体消息确定为第一目标流媒体消息。
需要说明的是,该实施例中的第三计算模块282可以用于执行本申请实施例1中的步骤S2082,该实施例中的第一选取模块284可以用于执行本申请实施例1中的步骤S2084。
此处需要说明的是,上述模块与对应的步骤所实现的示例和应用场景相同,但不限于上述实施例1所公开的内容。需要说明的是,上述模块作为装置的一部分可以运行在如图1所示的硬件环境中,可以通过软件实现,也可以通过硬件实现。
作为一种可选的实施例,用户向量模型中还可以包括:每个流媒体消息类别的标签,其中,如图13所示,该实施例还可以包括:选择单元29,用于在根据待推送的流媒体消息类别的向量模型与待推送的流媒体消息的流媒体向量模型之间的向量相似度确定第一目标流媒体消息之后,根据待推送的流媒体消息类别的标签与第一目标流媒体消息的标签之间的匹配度从第一目标流媒体消息中选择第二目标流媒体消息。相应地,推送单元210可以包括:推送模块2102,用于将第二目标流媒体消息推送给待推送用户。
需要说明的是,该实施例中的选择单元29可以用于执行本申请实施例1中的步骤S209,该实施例中的推送模块2102可以用于执行本申请实施例1中的步骤S2102。
此处需要说明的是,上述模块与对应的步骤所实现的示例和应用场景相同,但不限于上述实施例1所公开的内容。需要说明的是,上述模块作为装置的一部分可以运行在如图1所示的硬件环境中,可以通过软件实现,也可以通过硬件实现。
作为一种可选的实施例,如图14所示,选择单元29可以包括:第四计算模块292,用于按照以下公式计算待推送的流媒体消息类别的标签与第一目标流媒体消息的标签之间的匹配度:其中,media为第一目标流媒体消息的总数量,tagi为第i个第一目标流媒体消息的标签与待推送的流媒体消息类别的标签中相同的标签,tagj为第j个第一目标流媒体消息的标签与待推送的流媒体消息类别的标签中相同的标签,β为权重系数,tag_resi为待推送的流媒体消息类别的标签与第i个第一目标流媒体消息的标签之间的匹配度;第二选取模块294,用于选取匹配度大于第二预定阈值的第一目标流媒体消息确定为第二目标流媒体消息。
需要说明的是,该实施例中的第四计算模块292可以用于执行本申请实施例1中的步骤S2092,该实施例中的第二选取模块294可以用于执行本申请实施例1中的步骤S2094。
此处需要说明的是,上述模块与对应的步骤所实现的示例和应用场景相同,但不限于上述实施例1所公开的内容。需要说明的是,上述模块作为装置的一部分可以运行在如图1所示的硬件环境中,可以通过软件实现,也可以通过硬件实现。
作为一种可选的实施例,如图15所示,该实施例还可以包括:第三获取单元217,用于在接收流媒体消息推送请求之前,按照以下公式获取待推送的流媒体消息类别的标签:其中,tagk为待推送的流媒体消息类别下的第k个标签,Mi为待推送的流媒体消息类别下的第i个流媒体消息所包含的标签,cutoff为标签权重阈值,ri为待推送用户播放待推送的流媒体消息类别下的第i个流媒体消息的完成度,ti为待推送用户播放过待推送的流媒体消息类别下的第i个流媒体消息的时间。
需要说明的是,该实施例中的第三获取单元217可以用于执行本申请实施例1中的步骤S2017。
此处需要说明的是,上述模块与对应的步骤所实现的示例和应用场景相同,但不限于上述实施例1所公开的内容。需要说明的是,上述模块作为装置的一部分可以运行在如图1所示的硬件环境中,可以通过软件实现,也可以通过硬件实现。
作为一种可选的实施例,如图16所示,该实施例还可以包括:第二分词单元218,用于在接收流媒体消息推送请求之前,对用于描述流媒体消息的语句进行分词,得到多个词语;提取单元219,用于从多个词语中提取关键词;第三确定单元2110,用于从多个关键词中选取权重系数大于第三预定阈值且属于预设标签库的关键词作为流媒体消息的标签。
需要说明的是,该实施例中的第二分词单元218可以用于执行本申请实施例1中的步骤S2018,该实施例中的提取单元219可以用于执行本申请实施例1中的步骤S2019,该实施例中的第三确定单元2110可以用于执行本申请实施例1中的步骤S20110。
此处需要说明的是,上述模块与对应的步骤所实现的示例和应用场景相同,但不限于上述实施例1所公开的内容。需要说明的是,上述模块作为装置的一部分可以运行在如图1所示的硬件环境中,可以通过软件实现,也可以通过硬件实现。
通过上述模块,达到了从多个流媒体消息类别下选择流媒体消息向用户进行推送的目的,进而解决了相关技术中向用户推送的流媒体消息的丰富度较低的技术问题,从而实现了提高向用户推送的流媒体消息的丰富度和准确度的技术效果。
实施例3
根据本发明实施例,还提供了一种用于实施上述流媒体消息推送方法的服务器或终端。
图17是根据本发明实施例的一种终端的结构框图,如图17所示,该终端可以包括:一个或多个(图中仅示出一个)处理器201、存储器203、以及传输装置205(如上述实施例中的发送装置),如图17所示,该终端还可以包括输入输出设备207。
其中,存储器203可用于存储软件程序以及模块,如本发明实施例中的流媒体消息推送方法和装置对应的程序指令/模块,处理器201通过运行存储在存储器203内的软件程序以及模块,从而执行各种功能应用以及数据处理,即实现上述的流媒体消息推送方法。存储器203可包括高速随机存储器,还可以包括非易失性存储器,如一个或者多个磁性存储装置、闪存、或者其他非易失性固态存储器。在一些实例中,存储器203可进一步包括相对于处理器201远程设置的存储器,这些远程存储器可以通过网络连接至终端。上述网络的实例包括但不限于互联网、企业内部网、局域网、移动通信网及其组合。
上述的传输装置205用于经由一个网络接收或者发送数据,还可以用于处理器与存储器之间的数据传输。上述的网络具体实例可包括有线网络及无线网络。在一个实例中,传输装置205包括一个网络适配器(Network Interface Controller,NIC),其可通过网线与其他网络设备与路由器相连从而可与互联网或局域网进行通讯。在一个实例中,传输装置205为射频(Radio Frequency,RF)模块,其用于通过无线方式与互联网进行通讯。
其中,具体地,存储器203用于存储应用程序。
处理器201可以通过传输装置205调用存储器203存储的应用程序,以执行下述步骤:接收流媒体消息推送请求,其中,流媒体消息推送请求中携带有待推送用户的用户标识;获取用户标识对应的用户向量模型,其中,用户向量模型中包括:至少一个流媒体消息类别、每个流媒体消息类别的概率分布、每个流媒体消息类别的向量模型;根据每个流媒体消息类别的概率分布确定待推送的流媒体消息类别,并获取待推送的流媒体消息类别下的待推送的流媒体消息以及待推送的流媒体消息的流媒体向量模型;根据待推送的流媒体消息类别的向量模型与待推送的流媒体消息的流媒体向量模型之间的向量相似度确定第一目标流媒体消息;以及将第一目标流媒体消息推送给待推送用户。
处理器201还用于执行下述步骤:在接收流媒体消息推送请求之前,对流媒体消息进行分类,得到至少一个流媒体消息类别;计算待推送用户在至少一个流媒体消息类别中的每个流媒体消息类别的概率分布和向量模型;建立用户标识、流媒体消息类别、概率分布以及向量模型的对应关系,得到用户向量模型。
处理器201还用于执行下述步骤:按照以下公式计算待推送用户在每个流媒体消息类别的概率分布:按照以下公式计算待推送用户在每个流媒体消息类别的向量模型:其中,user为待推送用户,l为至少一个流媒体消息类别中的第l个类别,j为至少一个流媒体消息类别中的第j个流媒体消息,i为第l个类别中的第i个流媒体消息,ri为待推送用户播放第i个流媒体消息的完成度,rj为待推送用户播放第j个流媒体消息的完成度,ti为待推送用户播放过第i个流媒体消息的时间,Vi为第i个流媒体消息的流媒体向量模型,P(l|user)为第l个类别的概率分布,Vuser,l为第l个类别的向量模型。
处理器201还用于执行下述步骤:在接收流媒体消息推送请求之前,对用于描述流媒体消息的语句进行分词,得到多个词语;分别获取多个词语中的每个词语的词向量;按照以下公式计算流媒体消息的流媒体向量模型:其中,i为多个词语中的第i个词语,vi为第i个词语的词向量,pi为第i个词语的权重,Vmedia为流媒体消息的流媒体向量模型。
处理器201还用于执行下述步骤:按照以下公式计算待推送的流媒体消息类别的向量模型与待推送的流媒体消息的流媒体向量模型之间的向量相似度:其中,Vi为第i个流媒体消息的流媒体向量模型,Vuser为待推送的流媒体消息类别的向量模型,Vk为第一用户的用户向量模型,Vl为第一流媒体消息的流媒体向量模型,vec_simii为待推送的流媒体消息类别的向量模型与第i个流媒体消息的流媒体向量模型之间的向量相似度;选取向量相似度大于第一预定阈值的流媒体消息确定为第一目标流媒体消息。
处理器201还用于执行下述步骤:在根据待推送的流媒体消息类别的向量模型与待推送的流媒体消息的流媒体向量模型之间的向量相似度确定第一目标流媒体消息之后,根据待推送的流媒体消息类别的标签与第一目标流媒体消息的标签之间的匹配度从第一目标流媒体消息中选择第二目标流媒体消息;将第二目标流媒体消息推送给待推送用户。
处理器201还用于执行下述步骤:按照以下公式计算待推送的流媒体消息类别的标签与第一目标流媒体消息的标签之间的匹配度:其中,media为第一目标流媒体消息的总数量,tagi为第i个第一目标流媒体消息的标签与待推送的流媒体消息类别的标签中相同的标签,tagj为第j个第一目标流媒体消息的标签与待推送的流媒体消息类别的标签中相同的标签,β为权重系数,tag_resi为待推送的流媒体消息类别的标签与第i个第一目标流媒体消息的标签之间的匹配度;选取匹配度大于第二预定阈值的第一目标流媒体消息确定为第二目标流媒体消息。
处理器201还用于执行下述步骤:在接收流媒体消息推送请求之前,按照以下公式获取待推送的流媒体消息类别的标签:其中,tagk为待推送的流媒体消息类别下的第k个标签,Mi为待推送的流媒体消息类别下的第i个流媒体消息所包含的标签,cutoff为标签权重阈值,ri为待推送用户播放待推送的流媒体消息类别下的第i个流媒体消息的完成度,ti为待推送用户播放过待推送的流媒体消息类别下的第i个流媒体消息的时间。
处理器201还用于执行下述步骤:在接收流媒体消息推送请求之前,方法还包括:对用于描述流媒体消息的语句进行分词,得到多个词语;从多个词语中提取关键词;从多个关键词中选取权重系数大于第三预定阈值且属于预设标签库的关键词作为流媒体消息的标签。
采用本发明实施例,提供了一种流媒体消息推送方案。通过获取待推送用户对应的用户向量模型,利用该用户向量模型中的每个流媒体消息类别的概率分布确定待推送的流媒体消息类别,并获取该待推送的流媒体消息类别下的待推送的流媒体消息及其流媒体向量模型,最后再根据所述待推送的流媒体消息类别的向量模型与所述待推送的流媒体消息的流媒体向量模型之间的向量相似度确定第一目标流媒体消息推送给待推送用户,达到了从多个流媒体消息类别下选择流媒体消息向用户进行推送的目的,进而解决了相关技术中向用户推送的流媒体消息的丰富度较低的技术问题,从而实现了提高向用户推送的流媒体消息的丰富度和准确度的技术效果。
可选地,本实施例中的具体示例可以参考上述实施例1和实施例2中所描述的示例,本实施例在此不再赘述。
本领域普通技术人员可以理解,图17所示的结构仅为示意,终端可以是智能手机(如Android手机、iOS手机等)、平板电脑、掌上电脑以及移动互联网设备(Mobile InternetDevices,MID)、PAD等终端设备。图17其并不对上述电子装置的结构造成限定。例如,终端还可包括比图17中所示更多或者更少的组件(如网络接口、显示装置等),或者具有与图17所示不同的配置。
本领域普通技术人员可以理解上述实施例的各种方法中的全部或部分步骤是可以通过程序来指令终端设备相关的硬件来完成,该程序可以存储于一计算机可读存储介质中,存储介质可以包括:闪存盘、只读存储器(Read-Only Memory,ROM)、随机存取器(RandomAccess Memory,RAM)、磁盘或光盘等。
实施例4
本发明的实施例还提供了一种存储介质。可选地,在本实施例中,上述存储介质可以用于执行流媒体消息推送方法的程序代码。
可选地,在本实施例中,上述存储介质可以位于上述实施例所示的网络中的多个网络设备中的至少一个网络设备上。
可选地,在本实施例中,存储介质被设置为存储用于执行以下步骤的程序代码:
S1,接收流媒体消息推送请求,其中,流媒体消息推送请求中携带有待推送用户的用户标识;
S2,获取用户标识对应的用户向量模型,其中,用户向量模型中包括:至少一个流媒体消息类别、每个流媒体消息类别的概率分布、每个流媒体消息类别的向量模型;
S3,根据每个流媒体消息类别的概率分布确定待推送的流媒体消息类别,并获取待推送的流媒体消息类别下的待推送的流媒体消息以及待推送的流媒体消息的流媒体向量模型;
S4,根据待推送的流媒体消息类别的向量模型与待推送的流媒体消息的流媒体向量模型之间的向量相似度确定第一目标流媒体消息;
S5,将第一目标流媒体消息推送给待推送用户。
可选地,存储介质还被设置为存储用于执行以下步骤的程序代码:在接收流媒体消息推送请求之前,对流媒体消息进行分类,得到至少一个流媒体消息类别;计算待推送用户在至少一个流媒体消息类别中的每个流媒体消息类别的概率分布和向量模型;建立用户标识、流媒体消息类别、概率分布以及向量模型的对应关系,得到用户向量模型。
可选地,存储介质还被设置为存储用于执行以下步骤的程序代码:按照以下公式计算待推送用户在每个流媒体消息类别的概率分布:按照以下公式计算待推送用户在每个流媒体消息类别的向量模型:其中,user为待推送用户,l为至少一个流媒体消息类别中的第l个类别,j为至少一个流媒体消息类别中的第j个流媒体消息,i为第l个类别中的第i个流媒体消息,ri为待推送用户播放第i个流媒体消息的完成度,rj为待推送用户播放第j个流媒体消息的完成度,ti为待推送用户播放过第i个流媒体消息的时间,Vi为第i个流媒体消息的流媒体向量模型,P(l|user)为第l个类别的概率分布,Vuser,l为第l个类别的向量模型。
可选地,存储介质还被设置为存储用于执行以下步骤的程序代码:在接收流媒体消息推送请求之前,对用于描述流媒体消息的语句进行分词,得到多个词语;分别获取多个词语中的每个词语的词向量;按照以下公式计算流媒体消息的流媒体向量模型:其中,i为多个词语中的第i个词语,vi为第i个词语的词向量,pi为第i个词语的权重,Vmedia为流媒体消息的流媒体向量模型。
可选地,存储介质还被设置为存储用于执行以下步骤的程序代码:按照以下公式计算待推送的流媒体消息类别的向量模型与待推送的流媒体消息的流媒体向量模型之间的向量相似度:其中,Vi为第i个流媒体消息的流媒体向量模型,Vuser为待推送的流媒体消息类别的向量模型,Vk为第一用户的用户向量模型,Vl为第一流媒体消息的流媒体向量模型,vec_simii为待推送的流媒体消息类别的向量模型与第i个流媒体消息的流媒体向量模型之间的向量相似度;选取向量相似度大于第一预定阈值的流媒体消息确定为第一目标流媒体消息。
可选地,存储介质还被设置为存储用于执行以下步骤的程序代码:在根据待推送的流媒体消息类别的向量模型与待推送的流媒体消息的流媒体向量模型之间的向量相似度确定第一目标流媒体消息之后,根据待推送的流媒体消息类别的标签与第一目标流媒体消息的标签之间的匹配度从第一目标流媒体消息中选择第二目标流媒体消息;将第二目标流媒体消息推送给待推送用户。
可选地,存储介质还被设置为存储用于执行以下步骤的程序代码:按照以下公式计算待推送的流媒体消息类别的标签与第一目标流媒体消息的标签之间的匹配度:其中,media为第一目标流媒体消息的总数量,tagi为第i个第一目标流媒体消息的标签与待推送的流媒体消息类别的标签中相同的标签,tagj为第j个第一目标流媒体消息的标签与待推送的流媒体消息类别的标签中相同的标签,β为权重系数,tag_resi为待推送的流媒体消息类别的标签与第i个第一目标流媒体消息的标签之间的匹配度;选取匹配度大于第二预定阈值的第一目标流媒体消息确定为第二目标流媒体消息。
可选地,存储介质还被设置为存储用于执行以下步骤的程序代码:在接收流媒体消息推送请求之前,按照以下公式获取待推送的流媒体消息类别的标签:其中,tagk为待推送的流媒体消息类别下的第k个标签,Mi为待推送的流媒体消息类别下的第i个流媒体消息所包含的标签,cutoff为标签权重阈值,ri为待推送用户播放待推送的流媒体消息类别下的第i个流媒体消息的完成度,ti为待推送用户播放过待推送的流媒体消息类别下的第i个流媒体消息的时间。
可选地,存储介质还被设置为存储用于执行以下步骤的程序代码:在接收流媒体消息推送请求之前,方法还包括:对用于描述流媒体消息的语句进行分词,得到多个词语;从多个词语中提取关键词;从多个关键词中选取权重系数大于第三预定阈值且属于预设标签库的关键词作为流媒体消息的标签。
可选地,本实施例中的具体示例可以参考上述实施例1和实施例2中所描述的示例,本实施例在此不再赘述。
可选地,在本实施例中,上述存储介质可以包括但不限于:U盘、只读存储器(ROM,Read-Only Memory)、随机存取存储器(RAM,Random Access Memory)、移动硬盘、磁碟或者光盘等各种可以存储程序代码的介质。
上述本发明实施例序号仅仅为了描述,不代表实施例的优劣。
上述实施例中的集成的单元如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在上述计算机可读取的存储介质中。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的全部或部分可以以软件产品的形式体现出来,该计算机软件产品存储在存储介质中,包括若干指令用以使得一台或多台计算机设备(可为个人计算机、服务器或者网络设备等)执行本发明各个实施例所述方法的全部或部分步骤。
在本发明的上述实施例中,对各个实施例的描述都各有侧重,某个实施例中没有详述的部分,可以参见其他实施例的相关描述。
在本申请所提供的几个实施例中,应该理解到,所揭露的客户端,可通过其它的方式实现。其中,以上所描述的装置实施例仅仅是示意性的,例如所述单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,例如多个单元或组件可以结合或者可以集成到另一个***,或一些特征可以忽略,或不执行。另一点,所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些接口,单元或模块的间接耦合或通信连接,可以是电性或其它的形式。
所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。
另外,在本发明各个实施例中的各功能单元可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中。上述集成的单元既可以采用硬件的形式实现,也可以采用软件功能单元的形式实现。
以上所述仅是本发明的优选实施方式,应当指出,对于本技术领域的普通技术人员来说,在不脱离本发明原理的前提下,还可以做出若干改进和润饰,这些改进和润饰也应视为本发明的保护范围。

Claims (18)

1.一种流媒体消息推送方法,其特征在于,包括:
接收流媒体消息推送请求,其中,所述流媒体消息推送请求中携带有待推送用户的用户标识;
获取所述用户标识对应的用户向量模型,其中,所述用户向量模型中包括:至少一个流媒体消息类别、每个流媒体消息类别的概率分布、每个流媒体消息类别的向量模型;
根据所述每个流媒体消息类别的概率分布确定待推送的流媒体消息类别,并获取所述待推送的流媒体消息类别下的待推送的流媒体消息以及所述待推送的流媒体消息的流媒体向量模型;
根据所述待推送的流媒体消息类别的向量模型与所述待推送的流媒体消息的流媒体向量模型之间的向量相似度确定第一目标流媒体消息;以及
将所述第一目标流媒体消息推送给所述待推送用户。
2.根据权利要求1所述的方法,其特征在于,在所述接收流媒体消息推送请求之前,所述方法还包括:
对流媒体消息进行分类,得到所述至少一个流媒体消息类别;
计算所述待推送用户在所述至少一个流媒体消息类别中的每个流媒体消息类别的概率分布和向量模型;
建立所述用户标识、流媒体消息类别、概率分布以及向量模型的对应关系,得到所述用户向量模型。
3.根据权利要求2所述的方法,其特征在于,所述计算所述待推送用户在所述至少一个流媒体消息类别中的每个流媒体消息类别的概率分布和向量模型包括:
按照以下公式计算所述待推送用户在每个流媒体消息类别的概率分布:
P ( l | u s e r ) = Σ i ∈ u s e r , l r i Σ j ∈ u s e r r j
按照以下公式计算所述待推送用户在每个流媒体消息类别的向量模型:
V u s e r , l = Σ i ∈ u s e r , l exp { λ - t i 2 σ 2 } · r i · V i
其中,user为所述待推送用户,l为所述至少一个流媒体消息类别中的第l个类别,j为所述至少一个流媒体消息类别中的第j个流媒体消息,i为第l个类别中的第i个流媒体消息,ri为所述待推送用户播放第i个流媒体消息的完成度,rj为所述待推送用户播放第j个流媒体消息的完成度,ti为所述待推送用户播放过第i个流媒体消息的时间,Vi为第i个流媒体消息的流媒体向量模型,P(l|user)为第l个类别的概率分布,Vuser,l为第l个类别的向量模型。
4.根据权利要求1所述的方法,其特征在于,在所述接收流媒体消息推送请求之前,所述方法还包括:
对用于描述流媒体消息的语句进行分词,得到多个词语;
分别获取所述多个词语中的每个词语的词向量;
按照以下公式计算所述流媒体消息的流媒体向量模型:
V m e d i a = Σ v i ∈ V m e d i a p i · v i
其中,i为所述多个词语中的第i个词语,vi为第i个词语的词向量,pi为第i个词语的权重,Vmedia为所述流媒体消息的流媒体向量模型。
5.根据权利要求1所述的方法,其特征在于,所述根据所述待推送的流媒体消息类别的向量模型与所述待推送的流媒体消息的流媒体向量模型之间的向量相似度确定第一目标流媒体消息包括:
按照以下公式计算所述待推送的流媒体消息类别的向量模型与所述待推送的流媒体消息的流媒体向量模型之间的向量相似度:
v e c _ simi i = α V u s e r ⊥ V i V u s e r ⊥ V u s e r V i ⊥ V i + ( 1 - α ) ( V u s e r - V i ) ⊥ ( V u s e r - V i ) max ( ( V k - V l ) ⊥ ( V k - V l ) )
其中,Vi为第i个流媒体消息的流媒体向量模型,Vuser为所述待推送的流媒体消息类别的向量模型,Vk为第一用户的用户向量模型,Vl为第一流媒体消息的流媒体向量模型,vec_simii为所述待推送的流媒体消息类别的向量模型与第i个流媒体消息的流媒体向量模型之间的向量相似度;
选取所述向量相似度大于第一预定阈值的流媒体消息确定为所述第一目标流媒体消息。
6.根据权利要求1所述的方法,其特征在于,所述用户向量模型中还包括:每个流媒体消息类别的标签,其中:
在所述根据所述待推送的流媒体消息类别的向量模型与所述待推送的流媒体消息的流媒体向量模型之间的向量相似度确定第一目标流媒体消息之后,所述方法还包括:根据所述待推送的流媒体消息类别的标签与所述第一目标流媒体消息的标签之间的匹配度从所述第一目标流媒体消息中选择第二目标流媒体消息;
所述将所述第一目标流媒体消息推送给所述待推送用户包括:将所述第二目标流媒体消息推送给所述待推送用户。
7.根据权利要求6所述的方法,其特征在于,所述根据所述待推送的流媒体消息类别的标签与所述第一目标流媒体消息的标签之间的匹配度从所述第一目标流媒体消息中选择第二目标流媒体消息包括:
按照以下公式计算所述待推送的流媒体消息类别的标签与所述第一目标流媒体消息的标签之间的匹配度:
t a g _ res i = exp { tag i ⊥ β } Σ j ∈ m e d i a exp { tag j ⊥ β }
其中,media为所述第一目标流媒体消息的总数量,tagi为第i个第一目标流媒体消息的标签与所述待推送的流媒体消息类别的标签中相同的标签,tagj为第j个第一目标流媒体消息的标签与所述待推送的流媒体消息类别的标签中相同的标签,β为权重系数,tag_resi为所述待推送的流媒体消息类别的标签与第i个第一目标流媒体消息的标签之间的匹配度;
选取所述匹配度大于第二预定阈值的第一目标流媒体消息确定为所述第二目标流媒体消息。
8.根据权利要求6所述的方法,其特征在于,在所述接收流媒体消息推送请求之前,所述方法还包括:
按照以下公式获取所述待推送的流媒体消息类别的标签:
{ tag k : Σ tag k ∈ M i exp { λ - t i 2 σ 2 } · r i > c u t o f f }
其中,tagk为所述待推送的流媒体消息类别下的第k个标签,Mi为所述待推送的流媒体消息类别下的第i个流媒体消息所包含的标签,cutoff为标签权重阈值,ri为所述待推送用户播放所述待推送的流媒体消息类别下的第i个流媒体消息的完成度,ti为所述待推送用户播放过所述待推送的流媒体消息类别下的第i个流媒体消息的时间。
9.根据权利要求6所述的方法,其特征在于,在所述接收流媒体消息推送请求之前,所述方法还包括:
对用于描述流媒体消息的语句进行分词,得到多个词语;
从多个词语中提取关键词;
从所述多个关键词中选取权重系数大于第三预定阈值且属于预设标签库的关键词作为所述流媒体消息的标签。
10.一种流媒体消息推送装置,其特征在于,包括:
接收单元,用于接收流媒体消息推送请求,其中,所述流媒体消息推送请求中携带有待推送用户的用户标识;
第一获取单元,用于获取所述用户标识对应的用户向量模型,其中,所述用户向量模型中包括:至少一个流媒体消息类别、每个流媒体消息类别的概率分布、每个流媒体消息类别的向量模型;
第一确定单元,用于根据所述每个流媒体消息类别的概率分布确定待推送的流媒体消息类别,并获取所述待推送的流媒体消息类别下的待推送的流媒体消息以及所述待推送的流媒体消息的流媒体向量模型;
第二确定单元,用于根据所述待推送的流媒体消息类别的向量模型与所述待推送的流媒体消息的流媒体向量模型之间的向量相似度确定第一目标流媒体消息;以及
推送单元,用于将所述第一目标流媒体消息推送给所述待推送用户。
11.根据权利要求10所述的装置,其特征在于,所述装置还包括:
分类单元,用于在所述接收流媒体消息推送请求之前,对流媒体消息进行分类,得到所述至少一个流媒体消息类别;
第一计算单元,用于计算所述待推送用户在所述至少一个流媒体消息类别中的每个流媒体消息类别的概率分布和向量模型;
建立单元,用于建立所述用户标识、流媒体消息类别、概率分布以及向量模型的对应关系,得到所述用户向量模型。
12.根据权利要求11所述的装置,其特征在于,所述第一计算单元包括:
第一计算模块,用于按照以下公式计算所述待推送用户在每个流媒体消息类别的概率分布:
P ( l | u s e r ) = Σ i ∈ u s e r , l r i Σ j ∈ u s e r r j
第二计算模块,用于按照以下公式计算所述待推送用户在每个流媒体消息类别的向量模型:
V u s e r , l = Σ i ∈ u s e r , l exp { λ - t i 2 σ 2 } · r i · V i
其中,user为所述待推送用户,l为所述至少一个流媒体消息类别中的第l个类别,j为所述至少一个流媒体消息类别中的第j个流媒体消息,i为第l个类别中的第i个流媒体消息,ri为所述待推送用户播放第i个流媒体消息的完成度,rj为所述待推送用户播放第j个流媒体消息的完成度,ti为所述待推送用户播放过第i个流媒体消息的时间,Vi为第i个流媒体消息的流媒体向量模型,P(l|user)为第l个类别的概率分布,Vuser,l为第l个类别的向量模型。
13.根据权利要求10所述的装置,其特征在于,所述装置还包括:
第一分词单元,用于在所述接收流媒体消息推送请求之前,对用于描述流媒体消息的语句进行分词,得到多个词语;
第二获取单元,用于分别获取所述多个词语中的每个词语的词向量;
第二计算单元,用于按照以下公式计算所述流媒体消息的流媒体向量模型:
V m e d i a = Σ v i ∈ V m e d i a p i · v i
其中,i为所述多个词语中的第i个词语,vi为第i个词语的词向量,pi为第i个词语的权重,Vmedia为所述流媒体消息的流媒体向量模型。
14.根据权利要求10所述的装置,其特征在于,所述第二确定单元包括:
第三计算模块,用于按照以下公式计算所述待推送的流媒体消息类别的向量模型与所述待推送的流媒体消息的流媒体向量模型之间的向量相似度:
v e c _ simi i = α V u s e r ⊥ V i V u s e r ⊥ V u s e r V i ⊥ V i + ( 1 - α ) ( V u s e r - V i ) ⊥ ( V u s e r - V i ) max ( ( V k - V l ) ⊥ ( V k - V l ) )
其中,Vi为第i个流媒体消息的流媒体向量模型,Vuser为所述待推送的流媒体消息类别的向量模型,Vk为第一用户的用户向量模型,Vl为第一流媒体消息的流媒体向量模型,vec_simii为所述待推送的流媒体消息类别的向量模型与第i个流媒体消息的流媒体向量模型之间的向量相似度;
第一选取模块,用于选取所述向量相似度大于第一预定阈值的流媒体消息确定为所述第一目标流媒体消息。
15.根据权利要求10所述的装置,其特征在于,所述用户向量模型中还包括:每个流媒体消息类别的标签,其中:
所述装置还包括:选择单元,用于在所述根据所述待推送的流媒体消息类别的向量模型与所述待推送的流媒体消息的流媒体向量模型之间的向量相似度确定第一目标流媒体消息之后,根据所述待推送的流媒体消息类别的标签与所述第一目标流媒体消息的标签之间的匹配度从所述第一目标流媒体消息中选择第二目标流媒体消息;
所述推送单元包括:推送模块,用于将所述第二目标流媒体消息推送给所述待推送用户。
16.根据权利要求15所述的装置,其特征在于,所述选择单元包括:
第四计算模块,用于按照以下公式计算所述待推送的流媒体消息类别的标签与所述第一目标流媒体消息的标签之间的匹配度:
t a g _ res i = exp { tag i ⊥ β } Σ j ∈ m e d i a exp { tag j ⊥ β }
其中,media为所述第一目标流媒体消息的总数量,tagi为第i个第一目标流媒体消息的标签与所述待推送的流媒体消息类别的标签中相同的标签,tagj为第j个第一目标流媒体消息的标签与所述待推送的流媒体消息类别的标签中相同的标签,β为权重系数,tag_resi为所述待推送的流媒体消息类别的标签与第i个第一目标流媒体消息的标签之间的匹配度;
第二选取模块,用于选取所述匹配度大于第二预定阈值的第一目标流媒体消息确定为所述第二目标流媒体消息。
17.根据权利要求15所述的装置,其特征在于,所述装置还包括:
第三获取单元,用于在所述接收流媒体消息推送请求之前,按照以下公式获取所述待推送的流媒体消息类别的标签:
{ tag k : Σ tag k ∈ M i exp { λ - t i 2 σ 2 } · r i > c u t o f f }
其中,tagk为所述待推送的流媒体消息类别下的第k个标签,Mi为所述待推送的流媒体消息类别下的第i个流媒体消息所包含的标签,cutoff为标签权重阈值,ri为所述待推送用户播放所述待推送的流媒体消息类别下的第i个流媒体消息的完成度,ti为所述待推送用户播放过所述待推送的流媒体消息类别下的第i个流媒体消息的时间。
18.根据权利要求15所述的装置,其特征在于,所述装置还包括:
第二分词单元,用于在所述接收流媒体消息推送请求之前,对用于描述流媒体消息的语句进行分词,得到多个词语;
提取单元,用于从多个词语中提取关键词;
第三确定单元,用于从所述多个关键词中选取权重系数大于第三预定阈值且属于预设标签库的关键词作为所述流媒体消息的标签。
CN201610932458.XA 2016-10-31 2016-10-31 流媒体消息推送方法和装置 Active CN106339507B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201610932458.XA CN106339507B (zh) 2016-10-31 2016-10-31 流媒体消息推送方法和装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201610932458.XA CN106339507B (zh) 2016-10-31 2016-10-31 流媒体消息推送方法和装置

Publications (2)

Publication Number Publication Date
CN106339507A true CN106339507A (zh) 2017-01-18
CN106339507B CN106339507B (zh) 2018-09-18

Family

ID=57840649

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201610932458.XA Active CN106339507B (zh) 2016-10-31 2016-10-31 流媒体消息推送方法和装置

Country Status (1)

Country Link
CN (1) CN106339507B (zh)

Cited By (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106982256A (zh) * 2017-03-31 2017-07-25 百度在线网络技术(北京)有限公司 信息推送方法、装置、设备及存储介质
CN107948271A (zh) * 2017-11-17 2018-04-20 亚信科技(中国)有限公司 一种确定待推送消息的方法、服务器及计算节点
CN108334601A (zh) * 2018-01-31 2018-07-27 腾讯音乐娱乐科技(深圳)有限公司 基于标签主题模型的歌曲推荐方法、装置及存储介质
CN108563670A (zh) * 2018-01-12 2018-09-21 武汉斗鱼网络科技有限公司 视频推荐方法、装置、服务器及计算机可读存储介质
CN108804718A (zh) * 2018-06-11 2018-11-13 线粒体(北京)科技有限公司 数据推送方法、装置、电子设备及计算机可读存储介质
CN109376307A (zh) * 2018-12-19 2019-02-22 百度在线网络技术(北京)有限公司 文章推荐方法、装置和终端
CN109992601A (zh) * 2019-03-12 2019-07-09 中国平安财产保险股份有限公司 待办事项信息的推送方法、装置和计算机设备
CN110809190A (zh) * 2018-08-06 2020-02-18 Tcl集团股份有限公司 一种基于智能电视的匹配用户角色的方法、装置及服务器
CN111010595A (zh) * 2019-12-25 2020-04-14 广州欢聊网络科技有限公司 一种新节目推荐的方法及装置
CN111831796A (zh) * 2019-04-15 2020-10-27 北京嘀嘀无限科技发展有限公司 一种用户请求的处理方法、装置、电子设备及存储介质
CN112948678A (zh) * 2021-02-26 2021-06-11 北京房江湖科技有限公司 文章召回方法及***、文章推荐方法及***
CN114205410A (zh) * 2020-08-31 2022-03-18 北京达佳互联信息技术有限公司 一种媒体流推送方法、装置、设备及存储介质

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102402594A (zh) * 2011-11-04 2012-04-04 电子科技大学 一种富媒体个性化推荐方法
CN102495872A (zh) * 2011-11-30 2012-06-13 中国科学技术大学 对移动设备用户进行个性化新闻推荐的方法和装置
CN103500212A (zh) * 2013-09-30 2014-01-08 乐视网信息技术(北京)股份有限公司 一种多媒体文件推荐方法及电子设备
CN104615779A (zh) * 2015-02-28 2015-05-13 云南大学 一种Web文本个性化推荐方法

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102402594A (zh) * 2011-11-04 2012-04-04 电子科技大学 一种富媒体个性化推荐方法
CN102495872A (zh) * 2011-11-30 2012-06-13 中国科学技术大学 对移动设备用户进行个性化新闻推荐的方法和装置
CN103500212A (zh) * 2013-09-30 2014-01-08 乐视网信息技术(北京)股份有限公司 一种多媒体文件推荐方法及电子设备
CN104615779A (zh) * 2015-02-28 2015-05-13 云南大学 一种Web文本个性化推荐方法

Cited By (18)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106982256B (zh) * 2017-03-31 2020-07-28 百度在线网络技术(北京)有限公司 信息推送方法、装置、设备及存储介质
CN106982256A (zh) * 2017-03-31 2017-07-25 百度在线网络技术(北京)有限公司 信息推送方法、装置、设备及存储介质
CN107948271A (zh) * 2017-11-17 2018-04-20 亚信科技(中国)有限公司 一种确定待推送消息的方法、服务器及计算节点
CN107948271B (zh) * 2017-11-17 2021-04-13 亚信科技(中国)有限公司 一种确定待推送消息的方法、服务器及计算节点
CN108563670A (zh) * 2018-01-12 2018-09-21 武汉斗鱼网络科技有限公司 视频推荐方法、装置、服务器及计算机可读存储介质
CN108334601A (zh) * 2018-01-31 2018-07-27 腾讯音乐娱乐科技(深圳)有限公司 基于标签主题模型的歌曲推荐方法、装置及存储介质
CN108334601B (zh) * 2018-01-31 2021-03-16 腾讯音乐娱乐科技(深圳)有限公司 基于标签主题模型的歌曲推荐方法、装置及存储介质
CN108804718A (zh) * 2018-06-11 2018-11-13 线粒体(北京)科技有限公司 数据推送方法、装置、电子设备及计算机可读存储介质
CN110809190A (zh) * 2018-08-06 2020-02-18 Tcl集团股份有限公司 一种基于智能电视的匹配用户角色的方法、装置及服务器
CN110809190B (zh) * 2018-08-06 2021-12-31 Tcl科技集团股份有限公司 一种基于智能电视的匹配用户角色的方法、装置及服务器
CN109376307A (zh) * 2018-12-19 2019-02-22 百度在线网络技术(北京)有限公司 文章推荐方法、装置和终端
CN109992601A (zh) * 2019-03-12 2019-07-09 中国平安财产保险股份有限公司 待办事项信息的推送方法、装置和计算机设备
CN109992601B (zh) * 2019-03-12 2023-10-27 中国平安财产保险股份有限公司 待办事项信息的推送方法、装置和计算机设备
CN111831796A (zh) * 2019-04-15 2020-10-27 北京嘀嘀无限科技发展有限公司 一种用户请求的处理方法、装置、电子设备及存储介质
CN111010595A (zh) * 2019-12-25 2020-04-14 广州欢聊网络科技有限公司 一种新节目推荐的方法及装置
CN114205410A (zh) * 2020-08-31 2022-03-18 北京达佳互联信息技术有限公司 一种媒体流推送方法、装置、设备及存储介质
CN112948678A (zh) * 2021-02-26 2021-06-11 北京房江湖科技有限公司 文章召回方法及***、文章推荐方法及***
CN112948678B (zh) * 2021-02-26 2023-07-21 北京房江湖科技有限公司 文章召回方法及***、文章推荐方法及***

Also Published As

Publication number Publication date
CN106339507B (zh) 2018-09-18

Similar Documents

Publication Publication Date Title
CN106339507A (zh) 流媒体消息推送方法和装置
CN110147711A (zh) 视频场景识别方法、装置、存储介质和电子装置
CN110364146B (zh) 语音识别方法、装置、语音识别设备及存储介质
CN110442790A (zh) 推荐多媒体数据的方法、装置、服务器和存储介质
CN109460514A (zh) 用于推送信息的方法和装置
CN108427708A (zh) 数据处理方法、装置、存储介质和电子装置
CN106326391A (zh) 多媒体资源推荐方法及装置
CN106407425A (zh) 基于人工智能的推送信息的方法和装置
CN106294830A (zh) 多媒体资源的推荐方法及装置
CN109508789A (zh) 预测手牌的方法、存储介质、处理器以及设备
CN109903103B (zh) 一种推荐物品的方法和装置
CN108875055A (zh) 一种***方法及设备
CN108595493A (zh) 媒体内容的推送方法和装置、存储介质、电子装置
CN110113634A (zh) 一种信息互动方法、装置、设备及存储介质
CN111400603A (zh) 一种信息推送方法、装置、设备及计算机可读存储介质
CN107766360A (zh) 一种视频热度预测方法和装置
CN110008397A (zh) 一种推荐模型训练方法及装置
CN112153426A (zh) 一种内容账号管理方法、装置、计算机设备及存储介质
CN106951471A (zh) 一种基于svm的标签发展趋势预测模型的构建方法
CN107864405A (zh) 一种收视行为类型的预测方法、装置及计算机可读介质
CN109816438A (zh) 信息推送方法及装置
WO2020135642A1 (zh) 一种基于生成对抗网络的模型训练方法及设备
CN109992781A (zh) 文本特征的处理、装置、存储介质和处理器
CN110032678A (zh) 业务资源推送方法和装置、存储介质和电子装置
CN107977678A (zh) 用于输出信息的方法和装置

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant