一种推送方法、装置、电子设备和存储介质
技术领域
本申请涉及计算机技术领域,具体而言,涉及一种推送方法、装置、电子设备和存储介质。
背景技术
随着应用程序种类的日益丰富,极大的丰富了人们的日常生活,人们打开应用程序后,可以浏览应用程序内的媒体素材,例如:小视频、文章、歌曲、照片等。在用户使用应用程序的过程中,通过该应用程序这个平台向用户推送一些媒体素材,例如:可以推送一些广告类的媒体素材,或者推送一些平台内新增的媒体素材。
在相关技术中,在为用户推送媒体素材时,一般都是全平台推送,即:该平台内的所有用户都能够接收推送的媒体素材,或者是按照年龄、性别或地理位置等单一的条件来进行推送,上述媒体素材的推送方式未结合用户自身的兴趣来进行推送,从而导致媒体素材的推送准确度较低。
发明内容
有鉴于此,本申请实施例提供了一种推送方法、装置、电子设备和存储介质,以提高媒体素材的推送准确度。
第一方面,本申请实施例提供了一种推送方法,包括:
从多个媒体素材中提取多种媒体内容类型下的媒体数据;
根据每个所述媒体素材中包括的每种媒体内容类型下的媒体数据,确定该媒体素材在多个类目层级中每个类目层级下所归属的类目;
根据目标用户针对各媒体素材的行为特征信息,确定所述目标用户和多个类目层级中每个类目层级下的各类目的匹配度;
根据所述匹配度,向所述目标用户的用户端推送待推送媒体素材,其中,所述待推送媒体素材携带有该待推送媒体素材的类目标签,所述类目标签为所述多个类目层级中的目标类目层级下的类目。
可选地,所述根据每个所述媒体素材中包括的每种媒体内容类型下的媒体数据,确定该媒体素材在多个类目层级中每个类目层级下所归属的类目,包括:
针对每个所述媒体素材,根据该媒体素材中的每种媒体内容类型下的媒体数据,得到用于表征该种媒体内容类型下的媒体数据的特征向量;
根据每种媒体内容类型下的媒体数据的特征向量,确定该媒体素材对应的融合特征向量;
对该媒体素材对应的融合特征向量和多个类目层级中每个类目层级下的各类目的特征向量进行相似度比较,以将多个类目层级中每个类目层级下的各类目中相似度最高的类目作为该媒体素材在多个类目层级中每个类目层级下所归属的类目。
可选地,所述媒体内容类型包括:
文本类型、音频类型、视频类型和图片类型。
可选地,所述针对每个所述媒体素材,根据该媒体素材中的每种媒体内容类型下的媒体数据,得到用于表征该种媒体内容类型下的媒体数据的特征向量,包括:
当所述媒体内容类型为所述文本类型时,获取与该媒体素材相关的文本信息;
根据所述文本信息,得到用于表征与该媒体素材相关的文本信息的特征向量,并将用于表征与该媒体素材相关的文本信息的特征向量作为所述文本类型下的媒体数据的特征向量;
其中,与该媒体素材相关的文本信息包括对该媒体素材进行描述的第一文本信息和/或该媒体素材中包括的第二文本信息。
可选地,所述针对每个所述媒体素材,根据该媒体素材中的每种媒体内容类型下的媒体数据,得到用于表征该种媒体内容类型下的媒体数据的特征向量,包括:
当所述媒体内容类型为所述音频类型时,获取该媒体素材中包括的音频数据;
对所述音频数据进行语音识别,得到所述音频数据对应的文本信息;
根据所述音频数据对应的文本信息,得到用于表征所述音频数据对应的文本信息的特征向量,并将用于表征所述音频数据对应的文本信息的特征向量作为所述音频类型下的媒体数据的特征向量。
可选地,所述针对每个所述媒体素材,根据该媒体素材中的每种媒体内容类型下的媒体数据,得到用于表征该种媒体内容类型下的媒体数据的特征向量,包括:
当所述媒体内容类型为所述图片类型时,获取该媒体素材中包括的图片数据;
对所述图片数据进行图片识别,得到所述图片数据中包括的文本信息;
根据所述图片数据中包括的文本信息,得到用于表征所述图片数据中包括的文本信息的特征向量;
利用深度学习模型,得到用于表征所述图片数据中包括的图像的特征向量;
对用于表征所述图片数据中包括的文本信息的特征向量和用于表征所述图片数据中包括的图像的特征向量进行拼接处理,得到用于表征所述图片类型下的媒体数据的特征向量。
可选地,所述针对每个所述媒体素材,根据该媒体素材中的每种媒体内容类型下的媒体数据,得到用于表征该种媒体内容类型下的媒体数据的特征向量,包括:
当所述媒体内容类型为所述视频类型时,获取该媒体素材中包括的视频数据;
针对所述视频数据中包括的每个关键帧,对该关键帧进行图片识别,得到该关键帧中包括的文本信息;
根据该关键帧中包括的文本信息,得到用于表征该关键帧中包括的文本信息的特征向量;
利用深度学习模型,得到用于表征该关键帧中包括的图像的特征向量;
对用于表征该关键帧中包括的文本信息的特征向量和用于表征该关键帧中包括的图像的特征向量进行拼接处理,得到该关键帧对应的媒体数据的特征向量;
对各关键帧对应的媒体数据的特征向量进行拼接处理,得到用于表征所述视频类型下的媒体数据的特征向量。
可选地,所述根据目标用户针对各媒体素材的行为特征信息,确定所述目标用户和多个类目层级中每个类目层级下的各类目的匹配度,包括:
根据预先为各行为特征分配的权重值和各所述行为特征信息,确定所述目标用户对该媒体素材的各行为特征信息的得分;
对所述目标用户对该媒体素材的各行为特征信息的得分进行求和计算,得到求和结果,并将所述求和结果作为该媒体素材在多个类目层级中每个类目层级下所归属的类目下所述目标用户和该类目的匹配度。
可选地,所述根据所述匹配度,向所述目标用户的用户端推送待推送媒体素材,包括:
根据所述类目标签,确定所述目标用户和多个类目层级中对应的类目的匹配度是否高于预设阈值;
如果高于所述预设阈值,向所述用户端推送所述待推送媒体素材。
第二方面,本申请实施例提供了一种推送装置,包括:
提取单元,用于从多个媒体素材中提取多种媒体内容类型下的媒体数据;
第一确定单元,用于根据每个所述媒体素材中包括的每种媒体内容类型下的媒体数据,确定该媒体素材在多个类目层级中每个类目层级下所归属的类目;
第二确定单元,用于根据目标用户针对各媒体素材的行为特征信息,确定所述目标用户和多个类目层级中每个类目层级下的各类目的匹配度;
推送单元,用于根据所述匹配度,向所述目标用户的用户端推送待推送媒体素材,其中,所述待推送媒体素材携带有该待推送媒体素材的类目标签,所述类目标签为所述多个类目层级中的目标类目层级下的类目。
可选地,所述第一确定单元的配置在用于根据每个所述媒体素材中包括的每种媒体内容类型下的媒体数据,确定该媒体素材在多个类目层级中每个类目层级下所归属的类目时,包括:
针对每个所述媒体素材,根据该媒体素材中的每种媒体内容类型下的媒体数据,得到用于表征该种媒体内容类型下的媒体数据的特征向量;
根据每种媒体内容类型下的媒体数据的特征向量,确定该媒体素材对应的融合特征向量;
对该媒体素材对应的融合特征向量和多个类目层级中每个类目层级下的各类目的特征向量进行相似度比较,以将多个类目层级中每个类目层级下的各类目中相似度最高的类目作为该媒体素材在多个类目层级中每个类目层级下所归属的类目。
可选地,所述媒体内容类型包括:
文本类型、音频类型、视频类型和图片类型。
可选地,所述第一确定单元的配置在用于针对每个所述媒体素材,根据该媒体素材中的每种媒体内容类型下的媒体数据,得到用于表征该种媒体内容类型下的媒体数据的特征向量时,包括:
当所述媒体内容类型为所述文本类型时,获取与该媒体素材相关的文本信息;
根据所述文本信息,得到用于表征与该媒体素材相关的文本信息的特征向量,并将用于表征与该媒体素材相关的文本信息的特征向量作为所述文本类型下的媒体数据的特征向量;
其中,与该媒体素材相关的文本信息包括对该媒体素材进行描述的第一文本信息和/或该媒体素材中包括的第二文本信息。
可选地,所述第一确定单元的配置在用于针对每个所述媒体素材,根据该媒体素材中的每种媒体内容类型下的媒体数据,得到用于表征该种媒体内容类型下的媒体数据的特征向量时,包括:
当所述媒体内容类型为所述音频类型时,获取该媒体素材中包括的音频数据;
对所述音频数据进行语音识别,得到所述音频数据对应的文本信息;
根据所述音频数据对应的文本信息,得到用于表征所述音频数据对应的文本信息的特征向量,并将用于表征所述音频数据对应的文本信息的特征向量作为所述音频类型下的媒体数据的特征向量。
可选地,所述第一确定单元的配置在用于针对每个所述媒体素材,根据该媒体素材中的每种媒体内容类型下的媒体数据,得到用于表征该种媒体内容类型下的媒体数据的特征向量时,包括:
当所述媒体内容类型为所述图片类型时,获取该媒体素材中包括的图片数据;
对所述图片数据进行图片识别,得到所述图片数据中包括的文本信息;
根据所述图片数据中包括的文本信息,得到用于表征所述图片数据中包括的文本信息的特征向量;
利用深度学习模型,得到用于表征所述图片数据中包括的图像的特征向量;
对用于表征所述图片数据中包括的文本信息的特征向量和用于表征所述图片数据中包括的图像的特征向量进行拼接处理,得到用于表征所述图片类型下的媒体数据的特征向量。
可选地,所述第一确定单元的配置在用于针对每个所述媒体素材,根据该媒体素材中的每种媒体内容类型下的媒体数据,得到用于表征该种媒体内容类型下的媒体数据的特征向量时,包括:
当所述媒体内容类型为所述视频类型时,获取该媒体素材中包括的视频数据;
针对所述视频数据中包括的每个关键帧,对该关键帧进行图片识别,得到该关键帧中包括的文本信息;
根据该关键帧中包括的文本信息,得到用于表征该关键帧中包括的文本信息的特征向量;
利用深度学习模型,得到用于表征该关键帧中包括的图像的特征向量;
对用于表征该关键帧中包括的文本信息的特征向量和用于表征该关键帧中包括的图像的特征向量进行拼接处理,得到该关键帧对应的媒体数据的特征向量;
对各关键帧对应的媒体数据的特征向量进行拼接处理,得到用于表征所述视频类型下的媒体数据的特征向量。
可选地,所述第二确定单元的配置在用于根据目标用户针对各媒体素材的行为特征信息,确定所述目标用户和多个类目层级中每个类目层级下的各类目的匹配度时,包括:
根据预先为各行为特征分配的权重值和各所述行为特征信息,确定所述目标用户对该媒体素材的各行为特征信息的得分;
对所述目标用户对该媒体素材的各行为特征信息的得分进行求和计算,得到求和结果,并将所述求和结果作为该媒体素材在多个类目层级中每个类目层级下所归属的类目下所述目标用户和该类目的匹配度。
可选地,所述推送单元的配置在用于根据所述匹配度,向所述目标用户的用户端推送待推送媒体素材时,包括:
根据所述类目标签,确定所述目标用户和多个类目层级中对应的类目的匹配度是否高于预设阈值;
如果高于所述预设阈值,向所述用户端推送所述待推送媒体素材。
第三方面,本公开实施例提供了一种电子设备,包括:处理器、存储介质和总线,所述存储介质存储有所述处理器可执行的机器可读指令,当电子设备运行时,所述处理器与所述存储介质之间通过总线通信,所述处理器执行所述机器可读指令,以执行如第一方面中任一所述的推送方法的步骤。
第四方面,本公开实施例提供了一种计算机可读存储介质,所述计算机可读存储介质上存储有计算机程序,所述计算机程序被处理器运行时执行如第一方面中任一所述的推送方法的步骤。
本公开的实施例提供的技术方案可以包括以下有益效果:
由于用户通过应用程序浏览媒体素材时,用户会针对被浏览的媒体素材留下一些行为特征信息,如:点赞、评论或者未对被浏览的媒体素材进行任何操作,这些都是用户针对被浏览的媒体素材留下的行为特征信息,根据该特征信息可以确定出用户的喜好,由于媒体素材是具有类目的,即:媒体属于足球还是属于篮球,通过将用户的喜好和媒体素材归属的类目可以确定用户所喜好的类目,通常情况下,用户在喜好一个类目时,该类目下的大多数媒体素材都会被用户喜好,因此基于用户喜好的类目为用户推送媒体素材有利于提高媒体素材的推送准确度,基于上述原因,在本申请中,先获取多个媒体素材中提取多种媒体内容类型下的媒体数据,然后根据每个媒体素材中包括的每种媒体内容类型下的媒体数据,确定该媒体素材在多个类目层级中每个类目层级下所归属的类目,此时可以确定出该媒体素材在各类目层级中所归属的类目,由此,可以得到媒体素材对应的类目层级表,然后再根据目标用户针对类目层级表中不同媒体素材的行为特征信息,确定目标用户和多个类目层级中每个类目层级下的各类目的匹配度,即:此步骤可以确定用户对各类目层级中的各类目的喜好程度,再根据匹配度,向目标用户的用户端推送待推送媒体素材,在上述方法中是根据用户喜好的类目来推送待推送媒体素材的,因此有利于提高媒体素材的推送准确度。另外,待推送媒体素材携带有该待推送媒体素材的类目标签,该类目标签可以是任一类目层级下的,推送方可以根据实际推送需求选择类目层级,比如当需要推送的用户面较广时,可以选择上层的类目层级,覆盖较多的用户,当需要进行精准推送时,可以选择下层的类目层级,覆盖较少的用户。
为使本申请的上述目的、特征和优点能更明显易懂,下文特举较佳实施例,并配合所附附图,作详细说明如下。
附图说明
为了更清楚地说明本申请实施例的技术方案,下面将对实施例中所需要使用的附图作简单地介绍,应当理解,以下附图仅示出了本申请的某些实施例,因此不应被看作是对范围的限定,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他相关的附图。
图1为本申请实施例一提供的一种推送方法的流程示意图;
图2为本申请实施例一提供的一种类目层级的示意图;
图3为本申请实施例一提供的另一种推送方法的流程示意图;
图4为本申请实施例一提供的另一种推送方法的流程示意图;
图5为本申请实施例一提供的另一种推送方法的流程示意图;
图6为本申请实施例一提供的另一种推送方法的流程示意图;
图7为本申请实施例一提供的另一种推送方法的流程示意图;
图8为本申请实施例一提供的另一种推送方法的流程示意图;
图9为本申请实施例一提供的另一种推送方法的流程示意图;
图10为本申请实施例二提供的一种推送装置的结构示意图;
图11为本公开实施例三提供的一种电子设备的结构示意图。
具体实施方式
为使本申请实施例的目的、技术方案和优点更加清楚,下面将结合本申请实施例中附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本申请一部分实施例,而不是全部的实施例。通常在此处附图中描述和示出的本申请实施例的组件可以以各种不同的配置来布置和设计。因此,以下对在附图中提供的本申请的实施例的详细描述并非旨在限制要求保护的本申请的范围,而是仅仅表示本申请的选定实施例。基于本申请的实施例,本领域技术人员在没有做出创造性劳动的前提下所获得的所有其他实施例,都属于本申请保护的范围。
在相关技术中,在为用户推送媒体素材时,一般都是全平台推送,即:该平台内的所有用户都能够接收推送的媒体素材,或者是按照年龄、性别或地理位置等单一的条件来进行推送,上述媒体素材的推送方式未结合用户自身的兴趣来进行推送,从而导致媒体素材的推送准确度较低。
由于用户通过应用程序浏览媒体素材时,用户会针对被浏览的媒体素材留下一些行为特征信息,如:点赞、评论或者未对被浏览的媒体素材进行任何操作,这些都是用户针对被浏览的媒体素材留下的行为特征信息,根据该特征信息可以确定出用户的喜好,由于媒体素材是具有类目的,即:媒体属于足球还是属于篮球,通过将用户的喜好和媒体素材归属的类目可以确定用户所喜好的类目,通常情况下,用户在喜好一个类目时,该类目下的大多数媒体素材都会被用户喜好,因此基于用户喜好的类目为用户推送媒体素材有利于提高媒体素材的推送准确度,基于上述原因,为了解决相关技术中的问题,本申请实施例提供了一种推送方法、装置、电子设备和存储介质,利用用户喜好的类目来推送待推送媒体素材,以便提高媒体素材的推送准确度,下面通过实施例进行描述。
需要提前说明的是,本申请中涉及的平台为应用程序对应的平台,一个平台可以对应一个应用程序,或者一个平台可以对应多个应用程序,本申请中涉及到的目标平台的数量可以为一个,或者也可以为多个,应用程序中包括的媒体素材可以作为对应平台的媒体素材,媒体素材可以包括视频、文章、歌曲、照片等。
实施例一
图1为本申请实施例一提供的一种推送方法的流程示意图,如图1所示,该推送方法包括以下步骤:
步骤101、从多个媒体素材中提取多种媒体内容类型下的媒体数据。
具体的,上述的多个媒体素材可以是一个目标平台上的媒体素材,通过对一个目标平台上的媒体素材进行分析,可以确定媒体素材在该目标平台对应的类目,以及用户在该平目标平台对应的喜好,有利于提高在对媒体素材进行分析时的针对性。
目标平台包括多个媒体素材,且目标平台包括多种媒体素材种类,例如:目标平台包括的媒体素材种类有视频、文章、歌曲、照片等,每种媒体素材种类下又包括多个媒体素材,对于每个媒体素材而言,其是由至少一种媒体内容类型下的媒体数据构成的,例如:当该媒体素材为文章时,其中,该文章中的媒体数据包括文字部分、图片部分、视频部分和音频部分,那么,该媒体素材包括四种媒体内容类型,进一步的,该媒体素材是由四种媒体内容类型下的媒体数据构成的。为了对各媒体素材进行充分分析,以确定各媒体素材具体为何种类型的内容,由于一个媒体素材中包括的每种媒体内容类型下的媒体数据都能够从一方面表征该媒体素材的内容类型,因此需要得到该媒体素材中包括的各媒体内容类型下的媒体数据,以便从各个方面来对该媒体素材进行分析,确定该媒体素材的内容类型。
在对一个媒体素材中的多种媒体内容类型下的媒体数据进行提取时,可以对该媒体素材中包括的各媒体内容类型下的媒体数据进行分类,例如:将该媒体素材包括的文字部分作为一种媒体内容类型下的媒体数据,将该媒体素材包括的视频部分作为一种媒体内容类型下的媒体数据等。
需要说明的是,关于具体的提取方法可以根据实际需要进行设置,在此不做具体限定。
步骤102、根据每个所述媒体素材中包括的每种媒体内容类型下的媒体数据,确定该媒体素材在多个类目层级中每个类目层级下所归属的类目。
具体的,根据一个媒体素材中包括的每种媒体内容类型下的媒体数据可以确定出该媒体素材的内容类型,而内容类型能够表示该媒体素材属于何种类目,例如:在确定出一个媒体素材的内容类型为足球视频时,可以确定该媒体素材属于的类目为足球,为了对类目进行统一,需要预先设置类目层级,每个类目层级下包括多个类目,例如:图2为本申请实施例一提供的一种类目层级的示意图,如图2所示,类目层级中可以包括一级类目层级、二级类目层级和三级类目层级,类目层级从上到下划分逐渐细致,当确定出一个媒体素材的内容类型为足球视频,则该媒体素材在一级类目层级中所归属的类目为体育,该媒体素材在二级类目层级中所归属的类目为球类,该媒体素材在三级类目层级中所归属的类目为足球,通过设置类目层级可以确定一个媒体素材所归属的大类内容和所归属的小类内容,从而对媒体素材实现了多层级的划分。
需要说明的是,图2所示的内容仅为示意性的说明,并不对本申请实施例形成限定,在实际的类目层级中,一级类目层级中包括多个一级类目,二级类目层级中包括多个二级类目,三级类目层级中包括多个三级类目,关于类目层级的具体划分方式,类目层级的层级数量和每个类目层级包括的类目都可以根据实际需要进行设定,在此不做具体限定。
步骤103、根据目标用户针对各媒体素材的行为特征信息,确定所述目标用户和多个类目层级中每个类目层级下的各类目的匹配度。
具体的,行为特征信息包括对一个媒体素材的点赞行为、转发行为、分享行为、评论行为等等,其中,未对该媒体素材进行任何操作也是一种行为特征,这些行为特征能够反映出目标用户对该媒体素材喜好程度。目标用户在浏览媒体素材时,会在其浏览的媒体素材下留下行为特征,未浏览的媒体素材下留下的行为特征可以为未对该媒体素材进行任何操作,通过目标用户对各媒体素材的行为特征,可以得到目标用户对各媒体素材的喜好程度,由于确定出来了各媒体素材在各类目层级中所归属的类目,那么此时可以得到目标用户对各类目层级中的各类目的喜好程度,从而根据该喜好程度可以确定目标用户和各类目层级中的各类目的匹配度,即:目标用户对各类目层级中某一类目的喜好程度越高,那么目标用户和各类目层级中的该类目的匹配度越高。
步骤104、根据所述匹配度,向所述目标用户的用户端推送待推送媒体素材,其中,所述待推送媒体素材携带有该待推送媒体素材的类目标签,所述类目标签为所述多个类目层级中的目标类目层级下的类目。
具体的,在确定出目标用户和多个类目层级中每个类目层级下的各类目的匹配度后,可以得到目标用户对多个类目层级中每个类目层级下的各类目喜好程度,在为目标用户推送待推送媒体素材之前,预先为该待推送媒体素材设定类目标签,其中,类目标签为多个类目层级中的目标类目层级下的类目,即:通过类目标签可以确定待推送媒体素材的类目,然后根据待推送媒体素材的类目和目标用户对该目标的匹配度来为目标用户进行推送,在上述方法中是根据用户喜好的类目来推送待推送媒体素材的,即:在推送待推送媒体素材时是基于用户是否喜好该类目的媒体素材而进行的推送,因此本申请中的推送方法有利于提高媒体素材的推送准确度,即:待推送媒体素材会推送给喜好该类目的用户,用户浏览且喜欢该待推送媒体素材的概率较高。
另外,待推送媒体素材携带有该待推送媒体素材的类目标签,该类目标签可以是任一类目层级下的,推送方可以根据实际推送需求选择类目层级,比如当需要推送的用户面较广时,可以选择上层的类目层级,覆盖较多的用户,当需要进行精准推送时,可以选择下层的类目层级,覆盖较少的用户。
在一个可行的实施方案中,图3为本申请实施例一提供的另一种推送方法的流程示意图,如图3所示,在执行步骤102时,可以通过以下步骤实现:
步骤301、针对每个所述媒体素材,根据该媒体素材中的每种媒体内容类型下的媒体数据,得到用于表征该种媒体内容类型下的媒体数据的特征向量。
步骤302、根据每种媒体内容类型下的媒体数据的特征向量,确定该媒体素材对应的融合特征向量。
步骤303、对该媒体素材对应的融合特征向量和多个类目层级中每个类目层级下的各类目的特征向量进行相似度比较,以将多个类目层级中每个类目层级下的各类目中相似度最高的类目作为该媒体素材在多个类目层级中每个类目层级下所归属的类目。
具体的,由于特征向量能够对媒体数据进行表征,因此需要得到用于表征该媒体素材中每种媒体内容类型下的媒体数据的特征向量,例如:对于一个媒体素材,该媒体素材包括二种媒体内容类型:媒体内容类型1和媒体内容类型2,那么需要根据媒体内容类型1下的媒体数据,得到媒体内容类型1下的媒体数据的特征向量,以及根据媒体内容类型2下的媒体数据,得到媒体内容类型2下的媒体数据的特征向量。
由于每种媒体内容类型下的媒体数据只能从一方面标识媒体素材的内容类型,为了得到该媒体素材整体上对应的内容类型,需要根据该媒体素材中的各媒体内容类型下的媒体数据的特征向量,得到该媒体素材对应的融合特征向量,同时预先为多个类目层级中每个类目层级下的各类目设置对应的特征向量,然后对该媒体素材对应的融合特征向量和多个类目层级中每个类目层级下的各类目的特征向量进行相似度比较,然后将多个类目层级中每个类目层级下的各类目中相似度最高的类目作为该媒体素材在多个类目层级中每个类目层级下所归属的类目,以图2为例,预先为图2中的各类目层级中的各类目设置特征向量,然后使用一个媒体素材对应的融合特征向量和各类目层级中的各类目的特征向量进行相似度比较,以二级类目层级为例,为球类设置的特征向量为A,为田径设置的特征向量为B,为健身设置的特征向量为C,媒体素材对应的融合特征向量为D,当融合特征向量为D和特征向量为A的相似度都高于融合特征向量为D和特征向量为B、融合特征向量为D和特征向量为C时,则将二级类目层级中的球类作为该媒体素材在二级类目层级中所归属的类目,以此类推可以得到该媒体素材在一级类目层级中所归属的类目和该媒体素材在三级类目层级中所归属的类目,从而得到了该媒体素材在各类目层级中每个类目层级下所归属的类目。
需要说明的是,关于得到媒体内容类型下的媒体数据的特征向量的具体方案,以及得到媒体内容类型下的媒体数据的特征向量的具体方案可以根据实际需要进行设置,在此不做具体限定。
需要说明的是,所述媒体内容类型包括:文本类型、音频类型、视频类型和图片类型。
需要说明的是,关于具体媒体内容类型可以根据实际需要进行设置,本申请中媒体内容类型的作用是为了对一个媒体素材中不同类型的媒体数据进行区分,因此所有满足上述要求的媒体内容类型的划分方式均属于本申请实施例的保护范围。
在一个可行的实施方案中,图4为本申请实施例一提供的另一种推送方法的流程示意图,如图4所示,当所述媒体内容类型为所述文本类型时,在执行步骤301时,可以通过以下步骤实现:
步骤401、获取与该媒体素材相关的文本信息。
步骤402、根据所述文本信息,得到用于表征与该媒体素材相关的文本信息的特征向量,并将用于表征与该媒体素材相关的文本信息的特征向量作为所述文本类型下的媒体数据的特征向量,其中,与该媒体素材相关的文本信息包括对该媒体素材进行描述的第一文本信息和/或该媒体素材中包括的第二文本信息。
具体的,对于一个媒体素材而言,当该媒体素材包括文章信息、广告标题和标题信息等内容时,标识该媒体素材包括文本类型的媒体数据,为了得到该媒体素材中文本类型的媒体数据的特征向量,需要先获取到与该媒体素材相关的文本信息,例如:对该媒体素材进行描述的标题信息和广告标题等,以及该媒体素材中包括的文章信息等,在得到文本信息后,可以得到用于表征与该媒体素材相关的文本信息的特征向量,此时可以将得到的特征向量作为文本类型下的媒体数据的特征向量。
需要说明的是,关于文本类型下的媒体数据的特征向量的具体得到方式可以根据实际需要进行设置,例如:可以对文本类型下的媒体数据进行切词处理,得到文本类型下的媒体数据包括的各个词语,然后利用向量词典查询每个词语的词向量,在对各个词向量进行拼接处理,从而得到文本类型下的媒体数据的特征向量,关于文本类型下的媒体数据的特征向量的具体得到方式在此不做具体限定。
在一个可行的实施方案中,图5为本申请实施例一提供的另一种推送方法的流程示意图,如图5所示,当所述媒体内容类型为所述音频类型时,在执行步骤301时,可以通过以下步骤实现:
步骤501、获取该媒体素材中包括的音频数据。
步骤502、对所述音频数据进行语音识别,得到所述音频数据对应的文本信息。
步骤503、根据所述音频数据对应的文本信息,得到用于表征所述音频数据对应的文本信息的特征向量,并将用于表征所述音频数据对应的文本信息的特征向量作为所述音频类型下的媒体数据的特征向量。
需要说明的是,关于获取媒体素材中包括的音频数据的具体实现方式可以根据实际需要进行设定,在此不做具体限定,关于得到音频数据对应的文本信息的特征向量的实现原理可参考图4所示的相关说明,在此不再详细说明。
在一个可行的实施方案中,图6为本申请实施例一提供的另一种推送方法的流程示意图,如图6所示,当所述媒体内容类型为所述图片类型时,在执行步骤301时,可以通过以下步骤实现:
步骤601、获取该媒体素材中包括的图片数据。
步骤602、对所述图片数据进行图片识别,得到所述图片数据中包括的文本信息。
步骤603、根据所述图片数据中包括的文本信息,得到用于表征所述图片数据中包括的文本信息的特征向量。
步骤604、利用深度学习模型,得到用于表征所述图片数据中包括的图像的特征向量。
步骤605、对用于表征所述图片数据中包括的文本信息的特征向量和用于表征所述图片数据中包括的图像的特征向量进行拼接处理,得到用于表征所述图片类型下的媒体数据的特征向量。
具体的,对于图片而言,图片中可能仅包括文字内容,或者仅包括图像,再或者二者都包括,为了得到用于表征该图片的特征向量,需要得到图片中的文字内容(文本信息)的特征向量和用于表征图片中的图像的特征向量,然后在对上述两个特征向量进行拼接处理,从而得到用于表征该图片的特征向量。
需要说明的是,关于得到图片数据中包括的文本信息的具体实现方式可以根据实际需要进行设定,在此不做具体限定,关于得到图片数据中包括的文本信息的特征向量的实现原理可参考图4所示的相关说明,在此不再详细说明,关于具体的深度学习模型可以根据实际需要进行设定,在此也不做具体限定,关于特征向量的具体拼接方案也可以根据实际需要进行设定,在此也不做具体限定。
在一个可行的实施方案中,图7为本申请实施例一提供的另一种推送方法的流程示意图,如图7所示,当所述媒体内容类型为所述视频类型时,在执行步骤301时,可以通过以下步骤实现:
步骤701、获取该媒体素材中包括的视频数据。
步骤702、针对所述视频数据中包括的每个关键帧,对该关键帧进行图片识别,得到该关键帧中包括的文本信息。
步骤703、根据该关键帧中包括的文本信息,得到用于表征该关键帧中包括的文本信息的特征向量。
步骤704、利用深度学习模型,得到用于表征该关键帧中包括的图像的特征向量。
步骤705、对用于表征该关键帧中包括的文本信息的特征向量和用于表征该关键帧中包括的图像的特征向量进行拼接处理,得到该关键帧对应的媒体数据的特征向量。
步骤706、对各关键帧对应的媒体数据的特征向量进行拼接处理,得到用于表征所述视频类型下的媒体数据的特征向量。
具体的,视频是有一帧一帧的图片构成中,其中,起重要作用的是视频中的关键帧,通过视频中包括的关键帧可以确定出该视频中的内容,因此需要先获取视频中的各关键帧,然后在根据各关键帧得到用于表征该视频的特征向量。
需要说明的是,关于获取媒体素材中的视频数据的实现方式可以根据实际需要进行设定,在此不做具体限定,对于每个关键帧,得到该关键帧对应的媒体数据的特征向量的具体实现原理可参考图6的相关说明,在此不做具体限定。
通过图4至图7所示的内容,可以得到某一媒体素材中各媒体内容类型下的媒体数据的特征向量。
在一个可行的实施方案中,图8为本申请实施例一提供的另一种推送方法的流程示意图,如图8所示,在执行步骤103时,可以通过以下步骤实现:
步骤801、根据预先为各行为特征分配的权重值和各所述行为特征信息,确定所述目标用户对该媒体素材的各行为特征信息的得分。
步骤802、对所述目标用户对该媒体素材的各行为特征信息的得分进行求和计算,得到求和结果,并将所述求和结果作为该媒体素材在多个类目层级中每个类目层级下所归属的类目下所述目标用户和该类目的匹配度。
具体的,预先为各行为特征分配的权重值,可以得到目标用户对该媒体素材的各行为特征信息的得分,然后对各得分进行求和计算,可以得到目标用户对该媒体素材的各行为特征信息的总得分,由于目标用户对该媒体素材的各行为特征能够表示该目标用户对该媒体素材的喜好程度,因此该总得分越高表示目标用户对该媒体素材的喜好程度也越高,进一步的,该总得分越高表示目标用户对该媒体素材在多个类目层级中每个类目层级下所归属的类目的喜好程度也越高,因此可以将总得分作为该媒体素材在多个类目层级中每个类目层级下所归属的类目下所述目标用户和该类目的匹配度。
需要说明的是,关于各行为特征对应的具体权重值的分配方式可以根据实际需要进行设定,在此不做具体限定。当然,对于一种行为特征而言,还可以对该行为特征下的具体行为分配不同的权重值,以行为特征为转发为例,转发数量在第一区间范围内时对应的权重值为1,转发数量在第二区间范围内时对应的权重值为2,转发数量在第三区间范围内时对应的权重值为3,其他行为特征下的具体行为的权重值的分配方式可以参考行为特征为转发时的分配原则,在此不再详细说明。并且行为特征的权重还可以通过其他方式体现,如:不同的行为特征分配不同的字母等方式,关于权重的具体形式也可以根据实际需要进行设定,在此也不做具体限定。
在一个可行的实施方案中,图9为本申请实施例一提供的另一种推送方法的流程示意图,如图9所示,在执行步骤104时,可以通过以下步骤实现:
步骤901、根据所述类目标签,确定所述目标用户和多个类目层级中对应的类目的匹配度是否高于预设阈值。
步骤902、如果高于所述预设阈值,向所述用户端推送所述待推送媒体素材。
具体的,在向目标用户推送待推送媒体素材时,可以预先与待推送媒体素材设置类目标签,并设置预设阈值,当目标用户与该类目标签向匹配时,标识目标用户为该待推送媒体素材的待推送用户,当该待推送用户和该类目标签对应的类目的匹配度高于预设阈值时,表示该待推送用户对该类目下的媒体素材的喜好程度较高,此时可以将该待推送媒体素材发送给目标用户的用户端,通过上述方法可以将待推送媒体素材推送给对该类目喜好程度较高的用户,用户在接收到该待推送媒体素材后,浏览且喜欢该待推送媒体素材的概率会较高,从而有利于提高媒体素材的推送准确度。
实施例二
图10为本申请实施例二提供的一种推送装置的结构示意图,如图10所示,该推送装置包括:
提取单元1001,用于从多个媒体素材中提取多种媒体内容类型下的媒体数据;
第一确定单元1002,用于根据每个所述媒体素材中包括的每种媒体内容类型下的媒体数据,确定该媒体素材在多个类目层级中每个类目层级下所归属的类目;
第二确定单元1003,用于根据目标用户针对各媒体素材的行为特征信息,确定所述目标用户和多个类目层级中每个类目层级下的各类目的匹配度;
推送单元1004,用于根据所述匹配度,向所述目标用户的用户端推送待推送媒体素材,其中,所述待推送媒体素材携带有该待推送媒体素材的类目标签,所述类目标签为所述多个类目层级中的目标类目层级下的类目。
在一个可行的实施方案中,所述第一确定单元1002的配置在用于根据每个所述媒体素材中包括的每种媒体内容类型下的媒体数据,确定该媒体素材在多个类目层级中每个类目层级下所归属的类目时,包括:
针对每个所述媒体素材,根据该媒体素材中的每种媒体内容类型下的媒体数据,得到用于表征该种媒体内容类型下的媒体数据的特征向量;
根据每种媒体内容类型下的媒体数据的特征向量,确定该媒体素材对应的融合特征向量;
对该媒体素材对应的融合特征向量和多个类目层级中每个类目层级下的各类目的特征向量进行相似度比较,以将多个类目层级中每个类目层级下的各类目中相似度最高的类目作为该媒体素材在多个类目层级中每个类目层级下所归属的类目。
在一个可行的实施方案中,所述媒体内容类型包括:
文本类型、音频类型、视频类型和图片类型。
在一个可行的实施方案中,所述第一确定单元1002的配置在用于针对每个所述媒体素材,根据该媒体素材中的每种媒体内容类型下的媒体数据,得到用于表征该种媒体内容类型下的媒体数据的特征向量时,包括:
当所述媒体内容类型为所述文本类型时,获取与该媒体素材相关的文本信息;
根据所述文本信息,得到用于表征与该媒体素材相关的文本信息的特征向量,并将用于表征与该媒体素材相关的文本信息的特征向量作为所述文本类型下的媒体数据的特征向量;
其中,与该媒体素材相关的文本信息包括对该媒体素材进行描述的第一文本信息和/或该媒体素材中包括的第二文本信息。
在一个可行的实施方案中,所述第一确定单元1002的配置在用于针对每个所述媒体素材,根据该媒体素材中的每种媒体内容类型下的媒体数据,得到用于表征该种媒体内容类型下的媒体数据的特征向量时,包括:
当所述媒体内容类型为所述音频类型时,获取该媒体素材中包括的音频数据;
对所述音频数据进行语音识别,得到所述音频数据对应的文本信息;
根据所述音频数据对应的文本信息,得到用于表征所述音频数据对应的文本信息的特征向量,并将用于表征所述音频数据对应的文本信息的特征向量作为所述音频类型下的媒体数据的特征向量。
在一个可行的实施方案中,所述第一确定单元1002的配置在用于针对每个所述媒体素材,根据该媒体素材中的每种媒体内容类型下的媒体数据,得到用于表征该种媒体内容类型下的媒体数据的特征向量时,包括:
当所述媒体内容类型为所述图片类型时,获取该媒体素材中包括的图片数据;
对所述图片数据进行图片识别,得到所述图片数据中包括的文本信息;
根据所述图片数据中包括的文本信息,得到用于表征所述图片数据中包括的文本信息的特征向量;
利用深度学习模型,得到用于表征所述图片数据中包括的图像的特征向量;
对用于表征所述图片数据中包括的文本信息的特征向量和用于表征所述图片数据中包括的图像的特征向量进行拼接处理,得到用于表征所述图片类型下的媒体数据的特征向量。
在一个可行的实施方案中,所述第一确定单元1002的配置在用于针对每个所述媒体素材,根据该媒体素材中的每种媒体内容类型下的媒体数据,得到用于表征该种媒体内容类型下的媒体数据的特征向量时,包括:
当所述媒体内容类型为所述视频类型时,获取该媒体素材中包括的视频数据;
针对所述视频数据中包括的每个关键帧,对该关键帧进行图片识别,得到该关键帧中包括的文本信息;
根据该关键帧中包括的文本信息,得到用于表征该关键帧中包括的文本信息的特征向量;
利用深度学习模型,得到用于表征该关键帧中包括的图像的特征向量;
对用于表征该关键帧中包括的文本信息的特征向量和用于表征该关键帧中包括的图像的特征向量进行拼接处理,得到该关键帧对应的媒体数据的特征向量;
对各关键帧对应的媒体数据的特征向量进行拼接处理,得到用于表征所述视频类型下的媒体数据的特征向量。
在一个可行的实施方案中,所述第二确定单元1003的配置在用于根据目标用户针对各媒体素材的行为特征信息,确定所述目标用户和多个类目层级中每个类目层级下的各类目的匹配度时,包括:
根据预先为各行为特征分配的权重值和各所述行为特征信息,确定所述目标用户对该媒体素材的各行为特征信息的得分;
对所述目标用户对该媒体素材的各行为特征信息的得分进行求和计算,得到求和结果,并将所述求和结果作为该媒体素材在多个类目层级中每个类目层级下所归属的类目下所述目标用户和该类目的匹配度。
在一个可行的实施方案中,所述推送单元1004的配置在用于根据所述匹配度,向所述目标用户的用户端推送待推送媒体素材时,包括:
根据所述类目标签,确定所述目标用户和多个类目层级中对应的类目的匹配度是否高于预设阈值;
如果高于所述预设阈值,向所述用户端推送所述待推送媒体素材。
关于实施例二的原理解释可参考实施例一的相关说明,在此不再详细说明。
由于目标平台包括很多媒体素材,这些媒体素材会被用户所浏览,用户会针对被浏览的媒体素材留下一些行为特征信息,如:点赞、评论或者未对被浏览的媒体素材进行任何操作,这些都是用户针对被浏览的媒体素材留下的行为特征信息,根据该特征信息可以确定出用户的喜好,由于媒体素材是具有类目的,即:媒体属于足球还是属于篮球,通过将用户的喜好和媒体素材归属的类目可以确定用户所喜好的类目,通常情况下,用户在喜好一个类目时,该类目下的大多数媒体素材都会被用户喜好,因此基于用户喜好的类目为用户推送媒体素材有利于提高媒体素材的推送准确度,基于上述原因,在本申请中,先获取目标平台上各媒体素材中提取多种媒体内容类型下的媒体数据,然后根据每个媒体素材中包括的每种媒体内容类型下的媒体数据,确定该媒体素材在多个类目层级中每个类目层级下所归属的类目,此时可以确定出该媒体素材在各类目层级中所归属的类目,进一步的,可以确定出媒体素材对应的类目,然后再根据目标用户针对各媒体素材的行为特征信息,确定目标用户和多个类目层级中每个类目层级下的各类目的匹配度,即:此步骤可以确定用户对各类目层级中的各类目的喜好程度,再根据匹配度,向目标用户的用户端推送待推送媒体素材,在上述方法中是根据用户喜好的类目来推送待推送媒体素材的,因此有利于提高媒体素材的推送准确度。另外,待推送媒体素材携带有该待推送媒体素材的类目标签,该类目标签可以是任一类目层级下的,推送方可以根据实际推送需求选择类目层级,比如当需要推送的用户面较广时,可以选择上层的类目层级,覆盖较多的用户,当需要进行精准推送时,可以选择下层的类目层级,覆盖较少的用户。
实施例三
图11为本公开实施例三提供的一种电子设备的结构示意图,包括:处理器1101、存储介质1102和总线1103,所述存储介质1102存储有所述处理器1101可执行的机器可读指令,当电子设备运行上述的推送方法时,所述处理器1101与所述存储介质1102之间通过总线1103通信,所述处理器1101执行所述机器可读指令,以执行以下步骤:
从多个媒体素材中提取多种媒体内容类型下的媒体数据;
根据每个所述媒体素材中包括的每种媒体内容类型下的媒体数据,确定该媒体素材在多个类目层级中每个类目层级下所归属的类目;
根据目标用户针对各媒体素材的行为特征信息,确定所述目标用户和多个类目层级中每个类目层级下的各类目的匹配度;
根据所述匹配度,向所述目标用户的用户端推送待推送媒体素材,其中,所述待推送媒体素材携带有该待推送媒体素材的类目标签,所述类目标签为所述多个类目层级中的目标类目层级下的类目。
在本公开实施例中,所述存储介质1102还可以存储其它机器可读指令,以执行如实施例一中其它所述的推送方法,关于具体执行的方法步骤和原理参见实施例一的说明,在此不再详细赘述。
实施例四
本公开实施例四还提供了一种计算机可读存储介质,该计算机可读存储介质上存储有计算机程序,该计算机程序被处理器运行时执行以下步骤:
从多个媒体素材中提取多种媒体内容类型下的媒体数据;
根据每个所述媒体素材中包括的每种媒体内容类型下的媒体数据,确定该媒体素材在多个类目层级中每个类目层级下所归属的类目;
根据目标用户针对各媒体素材的行为特征信息,确定所述目标用户和多个类目层级中每个类目层级下的各类目的匹配度;
根据所述匹配度,向所述目标用户的用户端推送待推送媒体素材,其中,所述待推送媒体素材携带有该待推送媒体素材的类目标签,所述类目标签为所述多个类目层级中的目标类目层级下的类目。
在本公开实施例中,该计算机程序被处理器运行时还可以执行其它机器可读指令,以执行如实施例一中其它所述的推送方法,关于具体执行的方法步骤和原理参见实施例一的说明,在此不再详细赘述。
在本公开所提供的实施例中,应该理解到,所揭露装置和方法,可以通过其它的方式实现。以上所描述的装置实施例仅仅是示意性的,例如,所述单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,又例如,多个单元或组件可以结合或者可以集成到另一个***,或一些特征可以忽略,或不执行。另一点,所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些通信接口,装置或单元的间接耦合或通信连接,可以是电性,机械或其它的形式。
所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。
另外,在本公开提供的实施例中的各功能单元可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中。
所述功能如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本公开的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本公开各个实施例所述方法的全部或部分步骤。而前述的存储介质包括:U盘、移动硬盘、只读存储器(Read-Only Memory,ROM)、随机存取存储器(Random Access Memory,RAM)、磁碟或者光盘等各种可以存储程序代码的介质。
最后应说明的是:以上所述实施例,仅为本公开的具体实施方式,用以说明本公开的技术方案,而非对其限制,本公开的保护范围并不局限于此,尽管参照前述实施例对本公开进行了详细的说明,本领域的普通技术人员应当理解:任何熟悉本技术领域的技术人员在本公开揭露的技术范围内,其依然可以对前述实施例所记载的技术方案进行修改或可轻易想到变化,或者对其中部分技术特征进行等同替换;而这些修改、变化或者替换,并不使相应技术方案的本质脱离本公开实施例技术方案的精神和范围。都应涵盖在本公开的保护范围之内。因此,本公开的保护范围应以所述权利要求的保护范围为准。