CN112612949B - 推荐数据集合的建立方法及装置 - Google Patents
推荐数据集合的建立方法及装置 Download PDFInfo
- Publication number
- CN112612949B CN112612949B CN202011477718.1A CN202011477718A CN112612949B CN 112612949 B CN112612949 B CN 112612949B CN 202011477718 A CN202011477718 A CN 202011477718A CN 112612949 B CN112612949 B CN 112612949B
- Authority
- CN
- China
- Prior art keywords
- author
- account
- author account
- sequence
- recommended
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000000034 method Methods 0.000 title claims abstract description 59
- 238000012163 sequencing technique Methods 0.000 claims abstract 2
- 238000004364 calculation method Methods 0.000 claims description 10
- 230000003993 interaction Effects 0.000 claims description 8
- 238000004590 computer program Methods 0.000 claims description 6
- 238000012545 processing Methods 0.000 description 12
- 238000004891 communication Methods 0.000 description 10
- 238000010586 diagram Methods 0.000 description 8
- 238000005516 engineering process Methods 0.000 description 7
- 238000004422 calculation algorithm Methods 0.000 description 6
- 230000003287 optical effect Effects 0.000 description 4
- 230000005236 sound signal Effects 0.000 description 4
- 230000008901 benefit Effects 0.000 description 3
- 238000007726 management method Methods 0.000 description 3
- 238000000513 principal component analysis Methods 0.000 description 3
- 230000001133 acceleration Effects 0.000 description 2
- 230000006978 adaptation Effects 0.000 description 2
- 230000008859 change Effects 0.000 description 2
- 238000010411 cooking Methods 0.000 description 2
- 238000011161 development Methods 0.000 description 2
- 238000004519 manufacturing process Methods 0.000 description 2
- 230000009467 reduction Effects 0.000 description 2
- 230000009471 action Effects 0.000 description 1
- 238000004458 analytical method Methods 0.000 description 1
- 238000003491 array Methods 0.000 description 1
- 238000013500 data storage Methods 0.000 description 1
- 238000013136 deep learning model Methods 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 238000001914 filtration Methods 0.000 description 1
- 238000003384 imaging method Methods 0.000 description 1
- 230000002452 interceptive effect Effects 0.000 description 1
- 239000004973 liquid crystal related substance Substances 0.000 description 1
- 238000010801 machine learning Methods 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 230000002093 peripheral effect Effects 0.000 description 1
- 230000008569 process Effects 0.000 description 1
- 230000003068 static effect Effects 0.000 description 1
- 238000012800 visualization Methods 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/90—Details of database functions independent of the retrieved data types
- G06F16/95—Retrieval from the web
- G06F16/953—Querying, e.g. by the use of web search engines
- G06F16/9535—Search customisation based on user profiles and personalisation
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/40—Information retrieval; Database structures therefor; File system structures therefor of multimedia data, e.g. slideshows comprising image and additional audio data
- G06F16/43—Querying
- G06F16/435—Filtering based on additional data, e.g. user or group profiles
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/40—Information retrieval; Database structures therefor; File system structures therefor of multimedia data, e.g. slideshows comprising image and additional audio data
- G06F16/45—Clustering; Classification
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/90—Details of database functions independent of the retrieved data types
- G06F16/95—Retrieval from the web
- G06F16/953—Querying, e.g. by the use of web search engines
- G06F16/9536—Search customisation based on social or collaborative filtering
Landscapes
- Engineering & Computer Science (AREA)
- Databases & Information Systems (AREA)
- Theoretical Computer Science (AREA)
- Data Mining & Analysis (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Multimedia (AREA)
- Information Transfer Between Computers (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
本公开提供了一种推荐数据集合的建立方法、装置、推荐方法、装置、电子设备及计算机存储介质,该方法包括:通过获取与作者帐户对应的已发布的多媒体内容的内容标签;根据内容标签,确定作者帐户对应的作者标签,对具有相同作者标签的作者帐户进行排序,得到每种作者标签对应的作者帐户序列,并根据作者标签与作者帐户序列的对应关系建立推荐数据集合。在本公开中,提高了推荐内容与被推荐的内容生产者之间的匹配度,因此能够为第一作者帐户对应的设备,更精准的提供同领域的可学习、可借鉴的优质作者的帐户,助力使用该设备的内容创作者成长。
Description
技术领域
本公开实施例涉及计算机技术领域,尤其涉及一种推荐数据集合的建立方法、建立装置、推荐方法、推荐装置、电子设备及计算机存储介质。
背景技术
随着互联网技术的不断发展,推荐***也在不断发展成熟,推荐***关注于如何给用户提供更精确的、更多样化的推荐内容。
目前,推荐***应用的广泛场景中,具有内容消费者和内容生产者两种角色,而推荐***往往聚焦于内容消费者,其通过对内容消费者产生的浏览、点击等记录,获取内容消费者的兴趣与需求,为内容消费者推荐个性化内容,提高内容消费者粘性。推荐***常用方法有基于内容推荐、协同过滤推荐、基于关联规则的推荐等等。
但是,目前方案中,在进行针对内容生产者的内容推荐时,会导致推荐内容与内容生产者的匹配度不高,降低了推荐精准度。
发明内容
本公开实施例提供一种推荐数据集合的建立方法、装置、推荐方法、装置、电子设备及计算机存储介质,以解决相关技术中推荐内容与内容生产者的匹配度不高,降低了推荐精准度的问题。
第一方面,本公开实施例提供了一种推荐数据集合的建立方法,该方法包括:
获取与作者帐户对应的已发布的多媒体内容的内容标签;内容标签用于反映所述已发布的多媒体内容所属的类别;
根据所述内容标签,确定所述作者帐户对应的作者标签,所述作者标签用于反映所述作者帐户所属的类别;
对具有相同作者标签的作者帐户进行排序,得到每种作者标签对应的作者帐户序列,并根据所述作者标签与所述作者帐户序列的对应关系,建立推荐数据集合。
在一种可选实施方式中,所述对具有相同作者标签的作者帐户进行排序,得到每种作者标签对应的作者帐户序列,包括:
获取所述作者帐户对应的已发布的多媒体内容的关联信息,所述关联信息为与所述多媒体内容相关联的交互信息;
根据所述关联信息,对具有相同作者标签的作者帐户进行排序,得到每种作者标签对应的作者帐户序列。
在一种可选实施方式中,所述根据所述关联信息,对具有相同作者标签的作者帐户进行排序,得到每种作者标签对应的作者帐户序列,包括:
针对具有相同作者标签的作者帐户,根据所述作者帐户对应的已发布的多媒体内容的关联信息,确定所述作者帐户对应的已发布的多媒体内容的第一得分;
根据所述作者帐户对应的已发布的多媒体内容的第一得分,确定所述作者帐户的第二得分;
根据所述第二得分,对每种作者标签对应的作者帐户进行排序,得到每种作者标签对应的作者帐户序列。
在一种可选实施方式中,所述关联信息包括所述多媒体内容的点赞数、评论数、转发数、粉丝数增长量中的一种或多种;
所述根据所述作者帐户对应的已发布的多媒体内容的关联信息,确定所述作者帐户对应的已发布的多媒体内容的第一得分,包括:
按照所述点赞数、评论数、转发数、粉丝数增长量各自对应的权重值,对所述多媒体内容的关联信息进行加权求和,得到所述多媒体内容的第一得分;
所述根据所述作者帐户对应的已发布的多媒体内容的第一得分,确定所述作者帐户的第二得分,包括:
将所述作者帐户对应的已发布的多媒体内容的第一得分的平均值,作为所述作者帐户的第二得分。
在一种可选实施方式中,所述作者帐户为在预设时间范围内发布所述多媒体内容的数量大于或等于预设阈值的作者帐户。
在一种可选实施方式中,所述根据所述内容标签,确定所述作者帐户对应的作者标签,包括:
确定所述内容标签对应的类别;
在树形结构的类别关系集合中,确定所述内容标签对应的类别的父类别;
根据所述父类别,确定所述作者帐户对应的作者标签。
第二方面,本公开实施例提供了一种推荐方法,所述方法包括:
获取第一作者帐户的作者标签;
在推荐数据集合中,确定与所述作者标签对应的待推荐作者帐户序列,并从所述待推荐作者帐户序列中选取第二作者帐户;其中,所述推荐数据集合包括作者标签与作者帐户序列的对应关系;
将所述第二作者帐户推荐给所述第一作者帐户对应的设备。
在一种可选实施方式中,所述从所述待推荐作者帐户序列中选取第二作者帐户,包括:
获取所述待推荐作者帐户序列中每个作者帐户的粉丝标识集合、以及所述第一作者帐户的粉丝标识集合;
根据第一作者帐户的粉丝标识集合、以及待推荐作者帐户序列中作者帐户的粉丝标识集合,确定所述待推荐作者帐户序列中每个作者帐户与所述第一作者帐户的关联度;
在所述待推荐作者帐户序列中,将关联度大于或等于预设关联度阈值的作者帐户作为所述第二作者帐户。
在一种可选实施方式中,所述根据第一作者帐户的粉丝标识集合、以及待推荐作者帐户序列中作者帐户的粉丝标识集合,确定所述待推荐作者帐户序列中每个作者帐户与所述第一作者帐户的关联度,包括:
对于所述待推荐作者帐户序列中的每个作者帐户,确定所述作者帐户的粉丝标识集合与所述第一作者帐户的粉丝标识集合之间的交集和并集;
将所述交集和所述并集的比值作为所述作者帐户与所述第一作者帐户的关联度。
在一种可选实施方式中,在所述推荐数据集合中,待推荐作者帐户序列包括的每个作者帐户具有对应的第二得分,且所述待推荐作者帐户序列包括的作者帐户按照所述第二得分进行排序;
所述从所述待推荐作者帐户序列中选取第二作者帐户,包括:
从所述待推荐作者帐户序列中,选取第二得分大于或等于预设得分值的作者帐户作为所述第二作者帐户。
第三方面,本公开实施例提供了一种推荐数据集合的建立装置,该装置包括:
第一获取模块,被配置为获取与作者帐户对应的已发布的多媒体内容的内容标签;内容标签用于反映所述已发布的多媒体内容所属的类别;
标签确定模块,被配置为根据所述内容标签,确定所述作者帐户对应的作者标签,所述作者标签用于反映所述作者帐户所属的类别;
建立模块,被配置为对具有相同作者标签的作者帐户进行排序,得到每种作者标签对应的作者帐户序列,并根据所述作者标签与所述作者帐户序列的对应关系,建立推荐数据集合。
在一种可选实施方式中,所述建立模块,包括:
第一获取子模块,被配置为获取所述作者帐户对应的已发布的多媒体内容的关联信息,所述关联信息为与所述多媒体内容相关联的交互信息;
排序子模块,被配置为根据所述关联信息,对具有相同作者标签的作者帐户进行排序,得到每种作者标签对应的作者帐户序列。
在一种可选实施方式中,所述排序子模块,包括:
第一得分单元,被配置为针对具有相同作者标签的作者帐户,根据所述作者帐户对应的已发布的多媒体内容的关联信息,确定所述作者帐户对应的已发布的多媒体内容的第一得分;
第二得分单元,被配置为根据所述作者帐户对应的已发布的多媒体内容的第一得分,确定所述作者帐户的第二得分;
排序单元,被配置为根据所述第二得分,对每种作者标签对应的作者帐户进行排序,得到每种作者标签对应的作者帐户序列。
在一种可选实施方式中,所述关联信息包括所述多媒体内容的点赞数、评论数、转发数、粉丝数增长量中的一种或多种;所述第一得分单元,包括:
加权计算子单元,被配置为按照所述点赞数、评论数、转发数、粉丝数增长量各自对应的权重值,对所述多媒体内容的关联信息进行加权求和,得到所述多媒体内容的第一得分;
所述第二得分单元,包括:
平均计算子单元,被配置为将所述作者帐户对应的已发布的多媒体内容的第一得分的平均值,作为所述作者帐户的第二得分。
在一种可选实施方式中,所述作者帐户为在预设时间范围内发布所述多媒体内容的数量大于或等于预设阈值的作者帐户。
在一种可选实施方式中,所述标签确定模块包括:
第一类别确定子模块,用于确定所述内容标签对应的类别;
第二类别确定子模块,用于在树形结构的类别关系集合中,确定所述内容标签对应的类别的父类别;
建立子模块,用于根据所述父类别,确定所述作者帐户对应的作者标签。
第四方面,本公开实施例还提供了一种推荐装置,所述装置包括:
第二获取模块,被配置为获取第一作者帐户的作者标签;
第二确定模块,被配置为在推荐数据集合中,确定与所述作者标签对应的待推荐作者帐户序列,并从所述待推荐作者帐户序列中选取第二作者帐户;其中,所述推荐数据集合包括作者标签与作者帐户序列的对应关系;
推荐模块,被配置为将所述第二作者帐户推荐给所述第一作者帐户对应的设备。
在一种可选实施方式中,所述第二确定模块,包括:
第二获取子模块,被配置为获取所述待推荐作者帐户序列中每个作者帐户的粉丝标识集合、以及所述第一作者帐户的粉丝标识集合;
关联度子模块,被配置为根据第一作者帐户的粉丝标识集合、以及待推荐作者帐户序列中作者帐户的粉丝标识集合,确定所述待推荐作者帐户序列中每个作者帐户与所述第一作者帐户的关联度;
选取子模块,被配置为在所述待推荐作者帐户序列中,将关联度大于或等于预设关联度阈值的作者帐户作为所述第二作者帐户。
在一种可选实施方式中,所述关联度子模块,包括:
集合计算单元,被配置为对于所述待推荐作者帐户序列中的每个作者帐户,确定所述作者帐户的粉丝标识集合与所述第一作者帐户的粉丝标识集合之间的交集和并集;
比值计算单元,被配置为将所述交集和所述并集的比值作为所述作者帐户与所述第一作者帐户的关联度。
在一种可选实施方式中,在所述推荐数据集合中,待推荐作者帐户序列包括的每个作者帐户具有对应的第二得分,且所述待推荐作者帐户序列包括的作者帐户按照所述第二得分进行排序;
所述选取子模块,包括:
选取子模块,被配置为从所述待推荐作者帐户序列中,选取第二得分大于或等于预设得分值的作者帐户作为所述第二作者帐户。
第五方面,本公开实施例还提供了一种电子设备,包括处理器;
用于存储所述处理器可执行指令的存储器;
其中,所述处理器被配置为执行所述指令,以实现本公开提供的推荐数据集合的建立方法以及推荐方法的步骤。
第六方面,本公开实施例还提供了一种计算机存储介质,当所述计算机可读存储介质中的指令由电子设备的处理器执行时,使得电子设备能够执行本公开提供的推荐数据集合的建立方法以及推荐方法。
第七方面,本公开实施例还提供了一种计算机程序产品,包括计算机程序/指令,所述计算机程序/指令被处理器执行时实现本公开提供的推荐数据集合的建立方法以及推荐方法的步骤。
在本公开实施例中,通过获取与作者帐户对应的已发布的多媒体内容的内容标签;根据内容标签,确定作者帐户对应的作者标签,作者标签用于反映作者帐户所属的类别;对具有相同作者标签的作者帐户进行排序,得到每种作者标签对应的作者帐户序列,并根据作者标签与作者帐户序列的对应关系,建立推荐数据集合。在本公开实施例中,可以将具有相同作者标签的作者帐户确定为属于相同领域,在具体进行推荐操作时,可以从推荐数据集合中选取与第一作者帐户属于同领域的第二作者帐户,并推荐给第一作者帐户对应的设备,由于第二作者帐户与第一作者帐户所属同一领域,从而提高了推荐内容与被推荐的内容生产者之间的匹配度,因此能够为第一作者帐户对应的设备,更精准的提供同领域的可学习、可借鉴的优质作者的帐户,助力使用该设备的内容创作者成长。
上述说明仅是本公开技术方案的概述,为了能够更清楚了解本公开的技术手段,而可依照说明书的内容予以实施,并且为了让本公开的上述和其它目的、特征和优点能够更明显易懂,以下特举本公开的具体实施方式。
附图说明
通过阅读下文优选实施方式的详细描述,各种其他的优点和益处对于本领域普通技术人员将变得清楚明了。附图仅用于示出优选实施方式的目的,而并不认为是对本公开的限制。而且在整个附图中,用相同的参考符号表示相同的部件。在附图中:
图1是本公开实施例提供的一种推荐数据集合的建立方法的步骤流程图;
图2是本公开实施例提供的一种推荐方法的步骤流程图;
图3是本公开实施例提供的一种推荐数据集合的建立方法的具体步骤流程图;
图4是本公开实施例提供的一种推荐方法的具体步骤流程图;
图5是本公开实施例提供的一种推荐数据集合的建立装置的框图;
图6是本公开实施例提供的一种推荐装置的框图;
图7是本公开一个实施例的电子设备的逻辑框图;
图8是本公开另一个实施例的电子设备的逻辑框图。
具体实施方式
为了使本领域普通人员更好地理解本公开的技术方案,下面将结合附图,对本公开实施例中的技术方案进行清楚、完整地描述。
需要说明的是,本公开的说明书和权利要求书及上述附图中的术语“第一”、“第二”等是用于区别类似的对象,而不必用于描述特定的顺序或先后次序。应该理解这样使用的数据在适当情况下可以互换,以便这里描述的本公开的实施例能够以除了在这里图示或描述的那些以外的顺序实施。以下示例性实施例中所描述的实施方式并不代表与本公开相一致的所有实施方式。相反,它们仅是与如所附权利要求书中所详述的、本公开的一些方面相一致的装置和方法的例子。
图1是本公开实施例提供的一种推荐数据集合的建立方法的步骤流程图,应用于执行推荐操作的推荐服务器,如图1所示,该方法可以包括步骤101-103。
步骤101,获取与作者帐户对应的已发布多媒体内容的内容标签;内容标签用于反映所述已发布的多媒体内容所属的类别。
在本公开实施例提供的一个应用场景中,内容创作者可以利用设备在多媒体内容运营平台创建对应的作者帐户,并通过登录该作者帐户的设备创作及发布多媒体内容,多媒体内容运营平台会将多媒体内容进行展示,以供内容消费者观看使用。
需要说明的是,多媒体内容包括但不限于图像、音频、视频、文本。
具体的,多媒体内容可以具有对应内容标签,内容标签用于反映多媒体内容的内容所属的类别。例如,一个视频的内容包括:跑步、踢足球、举哑铃,则可以为视频添加一个内容标签“运动”;另外,基于多媒体内容的多样性,也可以为一个多媒体内容添加多个内容标签,如,一个视频的内容包括:运动、烹饪、唱歌,则可以为视频分别添加内容标签“运动”、“烹饪”、“表演”。
进一步的,对多媒体内容的内容标签的确定,可以由人工进行实现,也可以利用机器学习进行实现,如,利用深度学习模型、分类器等模型可以实现将多媒体内容作为模型输入,将多媒体内容的内容标签作为模型输出。
步骤102,根据所述内容标签,确定所述作者帐户对应的作者标签,所述作者标签用于反映所述作者帐户所属的类别。
在本公开实施例中,登录作者帐户的设备可以发布一个或多个多媒体内容,为了更精确地反映该作者帐户的属性,可以基于该作者帐户对应的已发布的多媒体内容的内容标签,确定用于反映该作者帐户所属的类别的作者标签。
如,一个作者帐户发布了3个多媒体内容,这3个多媒体内容的内容标签分别为:“足球”、“篮球”、“马拉松”,则可以根据这3个标签对应的类别都所属于“运动”类别,为该作者帐户添加作者标签“运动”。
步骤103、对具有相同作者标签的作者帐户进行排序,得到每种作者标签对应的作者帐户序列,并根据所述作者标签与所述作者帐户序列的对应关系,建立推荐数据集合。
在本公开实施例中,在面对内容创作者的推荐场景下,需考虑推荐者的设备创作及发布的多媒体内容,与被推荐者的设备创作及发布的多媒体内容的领域一致性,因此,可以将具有相同作者标签的作者帐户确定为处于相同的领域。以短视频的内容创作者的推荐为例,一个经常发布运动领域短视频的内容创作者,为了保证对其的推荐效果,可以为其推荐同属运动领域的内容创作者。另外,推荐者的设备创作及发布的多媒体内容,与被推荐者的设备创作及发布的多媒体内容可以属于同垂类领域,垂类领域是指一个根据领域之间所属关系建立的领域树,如,一个经常发布足球领域短视频的内容创作者,与一个经常发布篮球领域短视频的内容创作者可以属于同垂类领域,因为篮球领域和足球领域都为运动领域的子领域,三个领域建立了一个领域树。
因此,本公开实施例可以将具有相同作者标签的作者帐户确定为属于相同领域,并划分至同一序列,从而得到作者标签与作者帐户序列的对应关系,基于这种对应关系,可以建立推荐数据集合。
在具体进行推荐操作时,可以从推荐数据集合中选取与第一作者帐户的作者标签对应的待推荐作者帐户序列,并从待推荐作者帐户序列中选取一个或多个作者帐户,将登陆了所述选取的作者帐户的设备发布的多媒体内容推荐给第一作者帐户对应的设备,由于待推荐作者帐户序列中的作者帐户与第一作者帐户所属同一领域,因此能够为第一作者帐户对应的设备,提供同领域的可学习、可借鉴的优质作者的帐户,助力使用该设备的内容创作者成长。其中,第一作者帐户对应的设备,可以为登录了该第一作者帐户的设备。另外,推荐服务器可以利用推荐数据集合,自动化地输出推荐结果给创作者的帐户对应的设备,极大地释放了人力,提高了推荐效率。
综上,在本公开实施例中,通过获取与作者帐户对应的已发布的多媒体内容的内容标签;根据内容标签,确定作者帐户对应的作者标签,作者标签用于反映作者帐户所属的类别;对具有相同作者标签的作者帐户进行排序,得到每种作者标签对应的作者帐户序列,并根据作者标签与作者帐户序列的对应关系,建立推荐数据集合。在本公开实施例中,可以将具有相同作者标签的作者帐户确定为属于相同领域,在具体进行推荐操作时,可以从推荐数据集合中选取与第一作者帐户属于同领域的第二作者帐户,并推荐给第一作者帐户对应的设备,由于第二作者帐户与第一作者帐户所属同一领域,从而提高了推荐内容与被推荐的内容生产者之间的匹配度,因此能够为第一作者帐户对应的设备,更精准的提供同领域的可学习、可借鉴的优质作者的帐户,助力使用该设备的内容创作者成长。
图2是本公开实施例提供的一种推荐方法的步骤流程图,如图2所示,应用于执行推荐操作的推荐服务器,该方法可以包括步骤201-203。
步骤201,获取第一作者帐户的作者标签。
在本公开实施例中,可以从推荐数据集合中选取对应的第二作者帐户推荐给第一作者帐户,且第二作者帐户与第一作者帐户应所属同一领域,以便于为登录有第一作者帐户的设备,提供同领域的可学习、可借鉴的优质作者的帐户,助力使用第一作者帐户的内容创作者成长。
具体的,在进行推荐操作时,首先可以获取第一作者帐户的作者标签,该作者标签确定用于反映该第一作者帐户所属的类别。
步骤202,在推荐数据集合中,确定与所述作者标签对应的待推荐作者帐户序列,并从所述待推荐作者帐户序列中选取第二作者帐户。
其中,所述推荐数据集合包括作者标签与作者帐户序列的对应关系。
步骤203,将所述第二作者帐户推荐给所述第一作者帐户对应的设备。
其中,第一作者帐户对应的设备,可以为登录了该第一作者帐户的设备,当存在多台设备都登陆了第一作者帐户时,这多台设备都可以称为第一作者帐户对应的设备。
在具体进行推荐操作时,可以从推荐数据集合中,选取与第一作者帐户的作者标签对应的待推荐作者帐户序列,并从待推荐作者帐户序列中选取一个或多个作者帐户,将选取的作者帐户,以及其发布的多媒体内容推荐给第一作者帐户对应的设备。其中,推荐数据集合的相关描述可以参照上述步骤101至103,此处不再赘述。
例如,假设推荐数据集合包括作者标签“运动”对应的作者帐户序列1、作者标签“电影”对应的作者帐户序列2、作者标签“旅游”对应的作者帐户序列3,在当前的第一作者帐户的作者标签为“旅游”的情况下,可以从作者帐户序列3中选取一个或多个作者帐户作为第二作者帐户,并推荐给第一作者帐户对应的设备。
需要说明的是,作者帐户序列中的多个作者帐户可以按照一定规则进行排序(如,重要度、优先级等),以便于按照排序顺序选取第二作者帐户。
综上,在本公开实施例中,获取第一作者帐户的作者标签;在推荐数据集合中,确定与该作者标签对应的待推荐作者帐户序列,并从待推荐作者帐户序列中选取第二作者帐户;将第二作者帐户推荐给第一作者帐户对应的设备。在本公开中,可以将具有相同作者标签的作者帐户确定为属于相同领域,在具体进行推荐操作时,可以从推荐数据集合中选取与第一作者帐户属于同领域的第二作者帐户,并推荐给第一作者帐户对应的设备,由于第二作者帐户与第一作者帐户所属同一领域,从而提高了推荐内容与被推荐的内容生产者之间的匹配度,因此能够为第一作者帐户对应的设备,更精准的提供同领域的可学习、可借鉴的优质作者的帐户,助力使用该设备的内容创作者成长。
图3是本公开实施例提供的一种推荐数据集合的建立方法的具体步骤流程图,应用于执行推荐操作的推荐服务器,该方法可以包括步骤301-306。
步骤301、获取与作者帐户对应的已发布的多媒体内容的内容标签;内容标签用于反映所述已发布的多媒体内容所属的类别。
本步骤的实现方式与上述步骤101的实现过程类似,本公开实施例在此不再详述。
步骤302、根据所述内容标签,确定所述作者帐户对应的作者标签,所述作者标签用于反映所述作者帐户所属的类别。
本步骤的实现方式与上述步骤102的实现过程类似,本公开实施例在此不再详述。
可选的,步骤302还可以包括步骤3021-3023。
步骤3021、确定所述内容标签对应的类别。
在该步骤中,由于内容标签用于反映所述已发布的多媒体内容所属的类别,则根据多媒体内容的内容标签,可以确定内容标签对应的类别。
步骤3022、在树形结构的类别关系集合中,确定所述内容标签对应的类别的父类别。
步骤3023、根据所述父类别,确定所述作者帐户对应的作者标签。
具体的,树形结构的类别关系集合中,具有类别与类别之间的所属关系,当一个第一类别所属于另一个第二类别时,可以认为第一类别为第二类别的子类别,即第二类别为第一类别的父类别。
对于类别关系集合中父类别和子类别所属关系的确定,可以参照知识图谱(Knowledge Graph/Vault),即将知识图谱中全部或部分类别的所属关系,添加进类别关系集合,知识图谱是显示知识发展进程与结构关系的一系列各种不同的图形,通过可视化技术描述知识资源对应的特征信息,挖掘、分析、构建、绘制和显示特征信息及它们之间的相互联系,知识图谱中包含了各个领域中对应的类别之间的关联。如,针对运动领域的推荐,可以选取知识图谱中运动领域的类别之间的类别关系,添加进类别关系集合。
根据知识图谱可以构建树形结构的类别关系集合,并确定所述内容标签对应的类别的父类别。
例如,一个作者帐户发布了3个多媒体内容,这3个多媒体内容的内容标签分别为:“足球”、“篮球”、“马拉松”,则可以在根据知识图谱构建的类别关系集合中,根据这3个标签对应的类别都所属于“运动”类别的关系,为该作者帐户添加作者标签“运动”。
步骤303、删除在预设时间范围内发布所述多媒体内容的数量小于预设阈值的作者帐户。
在本公开实施例中,作者帐户可以被限定为:在预设时间范围内发布所述多媒体内容的数量大于或等于预设阈值的作者帐户。
在实际生产中,登录有某帐户的设备长期且稳定的发布较多数量的多媒体内容,说明该帐户对应的设备的产出稳定,该帐户的被推荐价值也就更高,反之,登录有某帐户的设备不经常发布多媒体内容,且发布的多媒体内容的数量较少,则说明该帐户对应的设备的产出不稳定,该帐户的被推荐价值也就不高。
推荐数据集合中存储的作者帐户所对应的设备,须具有产出稳定的特性,具体为在一定时间段内该作者帐户所对应的设备经常发布多媒体内容,且发布的多媒体内容的数量较多,满足这种条件的作者帐户对应的设备具有稳定的多媒体内容产出,其多媒体内容的推荐价值也较高。
为此,可以将在预设的历史时间范围内发布多媒体内容的数量小于或等于预设阈值的作者帐户,确定为产出不稳定的作者帐户,并删除。可选的,在短视频平台中,可以设定上述预设时间范围为近14天内,上述预设阈值可以为4,即在近14天内,通过登录有作者帐户的设备发布的多媒体内容的数量小于或等于4个时,确定该作者帐户为产出不稳定,该作者帐户需要被删除。
步骤304、获取所述作者帐户对应的已发布的多媒体内容的关联信息。
其中,所述关联信息为与所述多媒体内容相关联的交互信息。
在本公开实施例中,推荐数据集合中存储的作者帐户还须具有作品内容优质的特性,在本公开实施例中,判断一个作者帐户是否具备作品内容优质的特性,可以通过分析该作者帐户对应的设备发布的多媒体内容的作品质量来确定。首先,可以获取该作者帐户对应的已发布的多媒体内容的关联信息,并根据对关联信息的分析来确定多媒体内容的作品质量,进而确定作者帐户是否具备作品内容优质的特性。
具体的,关联信息可以包括多媒体内容在多媒体运营平台发布后产生的后期数据,后期数据包括但不限于多媒体内容的点赞数、评论数、转发数、粉丝数增长量、观看数、下载数、收藏数。关联信息用于反映该多媒体内容的后验表现,后验表现即为:多媒体内容在多媒体运营平台发布后,该多媒体内容面向平台用户的被认可价值的高低,以及被推荐价值。通过对一个多媒体内容的这些关联数据进行综合分析,可以得到该多媒体内容的作品质量分。
步骤305、根据所述关联信息,对具有相同作者标签的作者帐户进行排序,得到每种作者标签对应的作者帐户序列。
在本公开实施例中,在通过利用每个作者帐户对应的已发布的多媒体内容的关联信息,确定了发布的每个多媒体内容的作品质量分后,再根据对作者帐户发布的多媒体内容的作品质量分进行综合分析,可以得到每个作者帐户的作者质量分。作者质量分可以反映一个作者帐户的被推荐价值以及面向平台用户的被认可价值,通过对具有相同作者标签的作者帐户按照作者质量分进行排序,可以得到每种作者标签对应的作者帐户序列。
可选的,步骤305可以包括:
步骤3051、针对具有相同作者标签的作者帐户,根据所述作者帐户对应的已发布的多媒体内容的关联信息,确定所述作者帐户对应的已发布的多媒体内容的第一得分。
在本公开实施例中,关联信息可以包括多媒体内容在多媒体运营平台发布后产生的后期数据,关联信息可以用于分析多媒体内容在多媒体运营平台发布后,该多媒体内容面向平台用户的被认可价值的高低,以及被推荐价值。通过对一个多媒体内容的这些关联信息进行综合分析,可以得到该多媒体内容的作品质量分。作品质量分即为第一得分,可以反映一个多媒体内容的被推荐价值。
可选的,所述关联信息包括所述多媒体内容的点赞数、评论数、转发数、粉丝数增长量中的一种或多种;
所述步骤3051可以包括:
步骤A1、按照所述点赞数、评论数、转发数、粉丝数增长量各自对应的权重值,对所述多媒体内容的关联信息进行加权求和,得到所述多媒体内容的第一得分。
在本公开实施例中,关联信息包括的点赞数、评论数、转发数、粉丝数增长量等各自具有对应的权重值,通过对多媒体内容的关联信息进行加权求和,可以得到多媒体内容的第一得分。
具体的,各个权重值可以根据实际需求自行进行设定,也可以利用主成分分析算法(PCA,Principal Component Analysis),PCA是一种无参数的数据降维方法,把多指标转化为少数几个综合指标,通过输入大量样本多媒体内容的点赞数、评论数、转发数、粉丝数增长量等关联信息,PCA可以实现对输入数据的降维和主成分分析,以获得各个关联信息的主成分,该主成分即可转换为关联信息的权重值。
步骤3052、根据所述作者帐户对应的已发布的多媒体内容的第一得分,确定所述作者帐户的第二得分。
在确定了发布的每个多媒体内容的作品质量分后,再根据对作者帐户对应的已发布的多媒体内容的作品质量进行综合分析,可以得到每个作者帐户的作者质量分。作者质量分即为第二得分,可以反映一个作者帐户的推荐价值。
可选的,步骤3052还可以通过将所述作者帐户对应的已发布的多媒体内容的第一得分的平均值,作为所述作者帐户的第二得分的方式进行实现。
在本公开实施例中,一种实现方式下,可以将作者帐户对应的已发布的多媒体内容的第一得分的平均值,作为作者帐户的第二得分。当然,也可以根据实际情况,为作者帐户对应的每个已发布的多媒体内容设定对应的权重值,从而将作者帐户对应的已发布的多媒体内容的第一得分的加权平均值,作为作者帐户的第二得分。例如,作者帐户对应的已发布的多媒体内容包括:多媒体内容1、多媒体内容2、多媒体内容3,多媒体内容1的权重值为0.4,第一得分为80、多媒体内容2的权重值为0.5,第一得分为70、多媒体内容3的权重值为0.2,第一得分为90,则作者帐户对应的已发布的多媒体内容的第一得分的加权平均值=0.4×80+0.5×70+0.2×90=85。
步骤3053、根据所述第二得分,对每种作者标签对应的作者帐户进行排序,得到每种作者标签对应的作者帐户序列。
在本公开实施例中,可以按照第二得分从低到高或从高到低的顺序,对每种作者标签对应的作者帐户进行排序,得到每种作者标签对应的作者帐户序列。
步骤306、根据所述作者标签与所述作者帐户序列的对应关系,建立推荐数据集合。
本步骤的实现方式与上述步骤103的实现过程类似,本公开实施例在此不再详述。
综上所述,本公开实施例提供的一种推荐数据集合的建立方法,通过获取与作者帐户对应的已发布的多媒体内容的内容标签;内容标签用于反映多媒体内容的内容所属的类别;根据内容标签,确定作者帐户对应的作者标签,作者标签用于反映作者帐户所属的类别;对具有相同作者标签的作者帐户进行排序,得到每种作者标签对应的作者帐户序列,并根据作者标签与作者帐户序列的对应关系,建立推荐数据集合。可以将具有相同作者标签的作者帐户确定为属于相同领域,在具体进行推荐操作时,可以从推荐数据集合中选取与第一作者帐户属于同领域的第二作者帐户,并推荐给第一作者帐户对应的设备,由于第二作者帐户与第一作者帐户所属同一领域,从而提高了推荐内容与被推荐的内容生产者之间的匹配度,因此能够为第一作者帐户对应的设备,更精准的提供同领域的可学习、可借鉴的优质作者的帐户,助力使用该设备的内容创作者成长。
图4是本公开实施例提供的一种推荐方法的具体步骤流程图,如图4所示,应用于执行推荐操作的推荐服务器,该方法可以包括步骤401-404。
步骤401、获取由第一作者帐户对应的已发布的多媒体内容的内容标签。
步骤402、根据所述内容标签,确定所述第一作者帐户对应的作者标签。
步骤401-402的实现方式与上述步骤101-102的实现过程类似,本公开实施例在此不再详述。
步骤403、在推荐数据集合中,确定与所述作者标签对应的待推荐作者帐户序列,并从所述待推荐作者帐户序列中选取第二作者帐户。
该步骤的实现方式与上述步骤202的实现过程类似,本公开实施例在此不再详述。
可选的,在一种具体实现方式中,步骤403可以包括:
步骤4031、获取所述待推荐作者帐户序列中每个作者帐户的粉丝标识集合、以及所述第一作者帐户的粉丝标识集合,所述粉丝标识集合包括至少一个粉丝标识。
在本公开实施例的一种实现方式中,推荐者的作者帐户的粉丝集合,与被推荐者的作者帐户的粉丝集合具有高度相似性,即推荐者和被推荐者的帐户均具有大量相同的粉丝,让被推荐者可以感知到自己的粉丝最近喜欢的其他作者有哪些。
为此,基于粉丝集合的高度相似性的特性,本公开实施例可以获取待推荐作者帐户序列中每个作者帐户的粉丝标识集合,并获取第一作者帐户的粉丝标识集合,粉丝标识集合包括了该作者帐户的所有粉丝的标识(ID,Identity document)。
具体的,可以将一个作者帐户的粉丝列表中的所有粉丝ID导入粉丝标识集合,建立粉丝标识集合。
步骤4032、根据第一作者帐户的粉丝标识集合、以及待推荐作者帐户序列中作者帐户的粉丝标识集合,确定所述待推荐作者帐户序列中每个作者帐户与所述第一作者帐户的关联度。
在获取了粉丝标识集合之后,可以通过计算待推荐作者帐户序列中每个作者帐户的粉丝标识集合,与第一作者帐户的粉丝标识集合之间的集合距离,得到待推荐作者帐户序列中每个作者帐户与所述第一作者帐户的粉丝关联度。
可选的,步骤4032可以包括:
步骤C1、对于所述待推荐作者帐户序列中的每个作者帐户,确定所述作者帐户的粉丝标识集合与所述第一作者帐户的粉丝标识集合之间的交集和并集。
步骤C2、将所述交集和所述并集的比值作为所述作者帐户与所述第一作者帐户的关联度。
具体的,可以将粉丝标识集合看做是一个字符串组,待推荐作者帐户序列中每个作者帐户的粉丝标识集合与第一作者帐户的粉丝标识集合之间的集合距离,可以通过计算两个粉丝标识集合与第一作者帐户的粉丝标识集合之间的字符串组距离来确定。
具体的,粉丝标识集合中的各个粉丝标识可以为字符串形式,本公开可以采用Jaccard(杰卡德)相似系数算法计算字符串距离,即确定待推荐作者帐户序列中作者帐户的粉丝标识集合,与所述第一作者帐户的粉丝标识集合之间的交集和并集,并将交集和并集的比值作为待推荐作者帐户序列中作者帐户与第一作者帐户的关联度。例如,待推荐作者帐户序列中一个作者帐户的粉丝标识集合为A,第一作者帐户的粉丝标识集合为B,则这其中,分子表示粉丝标识集合A与粉丝标识集合B求交集后的长度,分母表示粉丝标识集合A与粉丝标识集合B求并集后的长度。
需要说明的是,关联度的计算方法也不仅限于Jaccard相似系数算法,还可以采用如汉明距离计算算法、Dice距离计算算法、编辑距离计算算法等字符串组相似度计算方法。
步骤4033、在所述待推荐作者帐户序列中,将关联度大于或等于预设关联度阈值的作者帐户作为所述第二作者帐户。
在具体进行推荐时,可以根据实际需求,设定一个预设关联度阈值,并将待推荐作者帐户序列中,关联度大于或等于预设关联度阈值的作者帐户,确定为与第一作者帐户具有较高粉丝相似性的帐户,并将这些作者帐户作为所述第二作者帐户进行推荐。
可选的,在另一种具体实现方式中,在所述推荐数据集合中,作者帐户序列包括的每个作者帐户具有对应的第二得分,且所述作者帐户序列包括的作者帐户按照所述第二得分进行排序,步骤403还可以通过从所述待推荐作者帐户序列中,选取第二得分大于或等于预设得分值的作者帐户作为所述第二作者帐户的方式进行实现。
在本公开实施例的另一种实现方式中,在推荐数据集合中,作者帐户序列包括的每个作者帐户,具有对应的用于反映其作品内容质量的第二得分,且作者帐户序列包括的作者帐户按照所述第二得分进行排序,则在具体进行推荐时,可以根据实际需求,设定一个预设得分值,并在待推荐作者帐户序列中,将第二得分大于或等于预设得分值的作者帐户确定为与第一作者帐户具有较高质量的作品内容的帐户,将这些作者帐户作为所述第二作者帐户进行推荐。
步骤404、将所述第二作者帐户推荐给所述第一作者帐户对应的设备。
具体的,本公开实施例可以将第二作者帐户的ID、***、发布的多媒体内容等信息推荐给第一作者帐户对应的设备。
综上,在本公开实施例中,获取第一作者帐户的作者标签;在推荐数据集合中,确定与该作者标签对应的待推荐作者帐户序列,并从待推荐作者帐户序列中选取第二作者帐户;将第二作者帐户推荐给第一作者帐户对应的设备。本公开可以将具有相同作者标签的作者帐户确定为属于相同领域,在具体进行推荐操作时,可以从推荐数据集合中选取与第一作者帐户属于同领域的第二作者帐户,并推荐给第一作者帐户对应的设备,由于第二作者帐户与第一作者帐户所属同一领域,从而提高了推荐内容与被推荐的内容生产者之间的匹配度,因此能够为第一作者帐户对应的设备,更精准的提供同领域的可学习、可借鉴的优质作者的帐户,助力使用该设备的内容创作者成长。
图5是本公开实施例提供的一种推荐数据集合的建立装置的框图,如图5所示,包括:
第一获取模块501,被配置为获取与作者帐户对应的已发布的多媒体内容的内容标签;内容标签用于反映所述已发布的多媒体内容所属的类别;
标签确定模块502,被配置为根据所述内容标签,确定所述作者帐户对应的作者标签,所述作者标签用于反映所述作者帐户所属的类别;
建立模块503,被配置为对具有相同作者标签的作者帐户进行排序,得到每种作者标签对应的作者帐户序列,并根据所述作者标签与所述作者帐户序列的对应关系,建立推荐数据集合。
可选的,所述建立模块503,包括:
第一获取子模块,被配置为获取所述作者帐户对应的已发布的多媒体内容的关联信息,所述关联信息为与所述多媒体内容相关联的交互信息;
排序子模块,被配置为根据所述关联信息,对具有相同作者标签的作者帐户进行排序,得到每种作者标签对应的作者帐户序列。
可选的,所述排序子模块,包括:
第一得分单元,被配置为针对具有相同作者标签的作者帐户,根据所述作者帐户对应的已发布的多媒体内容的关联信息,确定所述作者帐户对应的已发布的多媒体内容的第一得分;
第二得分单元,被配置为根据所述作者帐户对应的已发布的多媒体内容的第一得分,确定所述作者帐户的第二得分;
可选的,所述关联信息包括所述多媒体内容的点赞数、评论数、转发数、粉丝数增长量中的一种或多种;所述第一得分单元,包括:
加权计算子单元,被配置为按照所述点赞数、评论数、转发数、粉丝数增长量各自对应的权重值,对所述多媒体内容的关联信息进行加权求和,得到所述多媒体内容的第一得分;
所述第二得分单元,包括:
平均计算子单元,被配置为将所述作者帐户对应的已发布的多媒体内容的第一得分的平均值,作为所述作者帐户的第二得分。
排序单元,被配置为根据所述第二得分,对每种作者标签对应的作者帐户进行排序,得到每种作者标签对应的作者帐户序列。
可选的,所述作者帐户为在预设时间范围内发布所述多媒体内容的数量大于或等于预设阈值的作者帐户。
可选的,标签确定模块包括:
第一类别确定子模块,用于确定所述内容标签对应的类别;
第二类别确定子模块,用于在树形结构的类别关系集合中,确定所述内容标签对应的类别的父类别;
建立子模块,用于根据所述父类别,确定所述作者帐户对应的作者标签。
综上所述,本公开实施例提供的一种推荐数据集合的建立装置,通过获取与作者帐户对应的已发布的多媒体内容的内容标签;根据内容标签,确定作者帐户对应的作者标签,作者标签用于反映作者帐户所属的类别;对具有相同作者标签的作者帐户进行排序,得到每种作者标签对应的作者帐户序列,并根据作者标签与作者帐户序列的对应关系,建立推荐数据集合。在本公开实施例中,可以将具有相同作者标签的作者帐户确定为属于相同领域,在具体进行推荐操作时,可以从推荐数据集合中选取与第一作者帐户属于同领域的第二作者帐户,并推荐给第一作者帐户对应的设备,由于第二作者帐户与第一作者帐户所属同一领域,从而提高了推荐内容与被推荐的内容生产者之间的匹配度,因此能够为第一作者帐户对应的设备,更精准的提供同领域的可学习、可借鉴的优质作者的帐户,助力使用该设备的内容创作者成长。
图6是本公开实施例提供的一种推荐装置的框图,如图6所示,包括:
第二获取模块601,被配置为获取第一作者帐户的目标作者标签;
第二确定模块602,被配置为在推荐数据集合中,确定与所述作者标签对应的待推荐作者帐户序列,并从所述待推荐作者帐户序列中选取第二作者帐户;其中,所述推荐数据集合包括作者标签与作者帐户序列的对应关系;
可选的,所述第二确定模块602,包括:
第二获取子模块,被配置为获取所述待推荐作者帐户序列中每个作者帐户的粉丝标识集合、以及所述第一作者帐户的粉丝标识集合;
关联度子模块,被配置为根据第一作者帐户的粉丝标识集合、以及待推荐作者帐户序列中作者帐户的粉丝标识集合,确定所述待推荐作者帐户序列中每个作者帐户与所述第一作者帐户的关联度;
可选的,所述关联度子模块,包括:
集合计算单元,被配置为对于所述待推荐作者帐户序列中的每个作者帐户,确定所述作者帐户的粉丝标识集合与所述第一作者帐户的粉丝标识集合之间的交集和并集;
比值计算单元,被配置为将所述交集和所述并集的比值作为所述作者帐户与所述第一作者帐户的关联度。
选取子模块,被配置为在所述待推荐作者帐户序列中,将关联度大于或等于预设关联度阈值的作者帐户作为所述第二作者帐户。
可选的,在所述推荐数据集合中,待推荐作者帐户序列包括的每个作者帐户具有对应的第二得分,且所述待推荐作者帐户序列包括的作者帐户按照所述第二得分进行排序;
所述选取子模块,包括:
选取子模块,被配置为从所述待推荐作者帐户序列中,选取第二得分大于或等于预设得分值的作者帐户作为所述第二作者帐户。
推荐模块603,被配置为将所述第二作者帐户推荐给所述第一作者帐户对应的设备。
综上所述,本公开实施例提供的一种推荐装置,获取第一作者帐户的作者标签;在推荐数据集合中,确定与该作者标签对应的待推荐作者帐户序列,并从待推荐作者帐户序列中选取第二作者帐户;将第二作者帐户推荐给第一作者帐户对应的设备。本公开可以将具有相同作者标签的作者帐户确定为属于相同领域,在具体进行推荐操作时,可以从推荐数据集合中选取与第一作者帐户属于同领域的第二作者帐户,并推荐给第一作者帐户对应的设备,由于第二作者帐户与第一作者帐户所属同一领域,从而提高了推荐内容与被推荐的内容生产者之间的匹配度,因此能够为第一作者帐户对应的设备,更精准的提供同领域的可学习、可借鉴的优质作者的帐户,助力使用该设备的内容创作者成长。
图7是根据一示例性实施例示出的一种电子设备700的框图。例如,电子设备700可以是移动电话,计算机,数字广播终端,消息收发设备,游戏控制台,平板设备,医疗设备,健身设备,个人数字助理等。
参照图7,电子设备700可以包括以下一个或多个组件:处理组件702,存储器704,电力组件706,多媒体组件708,音频组件710,输入/输出(I/O)的接口712,传感器组件714,以及通信组件716。
处理组件702通常控制电子设备700的整体操作,诸如与显示,电话呼叫,数据通信,相机操作和记录操作相关联的操作。处理组件702可以包括一个或多个处理器720来执行指令,以完成上述的方法的全部或部分步骤。此外,处理组件702可以包括一个或多个模块,便于处理组件702和其他组件之间的交互。例如,处理组件702可以包括多媒体模块,以方便多媒体组件708和处理组件702之间的交互。
存储器704用于存储各种类型的数据以支持在电子设备700的操作。这些数据的示例包括用于在电子设备700上操作的任何应用程序或方法的指令,联系人数据,电话簿数据,消息,图片,多媒体内容等。存储器704可以由任何类型的易失性或非易失性存储设备或者它们的组合实现,如静态随机存取存储器(SRAM),电可擦除可编程只读存储器(EEPROM),可擦除可编程只读存储器(EPROM),可编程只读存储器(PROM),只读存储器(ROM),磁存储器,快闪存储器,磁盘或光盘。
电源组件706为电子设备700的各种组件提供电力。电源组件706可以包括电源管理***,一个或多个电源,及其他与为电子设备700生成、管理和分配电力相关联的组件。
多媒体组件708包括在所述电子设备700和用户之间的提供一个输出接口的屏幕。在一些实施例中,屏幕可以包括液晶显示器(LCD)和触摸面板(TP)。如果屏幕包括触摸面板,屏幕可以被实现为触摸屏,以接收来自用户的输入信号。触摸面板包括一个或多个触摸传感器以感测触摸、滑动和触摸面板上的手势。所述触摸传感器可以不仅感测触摸或滑动动作的边界,而且还检测与所述触摸或滑动操作相关的持续时间和压力。在一些实施例中,多媒体组件708包括一个前置摄像头和/或后置摄像头。当电子设备700处于操作模式,如拍摄模式或多媒体内容模式时,前置摄像头和/或后置摄像头可以接收外部的多媒体数据。每个前置摄像头和后置摄像头可以是一个固定的光学透镜***或具有焦距和光学变焦能力。
音频组件710用于输出和/或输入音频信号。例如,音频组件710包括一个麦克风(MIC),当电子设备700处于操作模式,如呼叫模式、记录模式和语音识别模式时,麦克风用于接收外部音频信号。所接收的音频信号可以被进一步存储在存储器704或经由通信组件716发送。在一些实施例中,音频组件710还包括一个扬声器,用于输出音频信号。
I/O接口712为处理组件702和***接口模块之间提供接口,上述***接口模块可以是键盘,点击轮,按钮等。这些按钮可包括但不限于:主页按钮、音量按钮、启动按钮和锁定按钮。
传感器组件714包括一个或多个传感器,用于为电子设备700提供各个方面的状态评估。例如,传感器组件714可以检测到电子设备700的打开/关闭状态,组件的相对定位,例如所述组件为电子设备700的显示器和小键盘,传感器组件714还可以检测电子设备700或电子设备700一个组件的位置改变,用户与电子设备700接触的存在或不存在,电子设备700方位或加速/减速和电子设备700的温度变化。传感器组件714可以包括接近传感器,被配置用来在没有任何的物理接触时检测附近物体的存在。传感器组件714还可以包括光传感器,如CMOS或CCD图像传感器,用于在成像应用中使用。在一些实施例中,该传感器组件714还可以包括加速度传感器,陀螺仪传感器,磁传感器,压力传感器或温度传感器。
通信组件716用于便于电子设备700和其他设备之间有线或无线方式的通信。电子设备700可以接入基于通信标准的无线网络,如WiFi,运营商网络(如2G、3G、4G或5G),或它们的组合。在一个示例性实施例中,通信组件716经由广播信道接收来自外部广播管理***的广播信号或广播相关信息。在一个示例性实施例中,所述通信组件716还包括近场通信(NFC)模块,以促进短程通信。例如,在NFC模块可基于射频识别(RFID)技术,红外数据协会(IrDA)技术,超宽带(UWB)技术,蓝牙(BT)技术和其他技术来实现。
在示例性实施例中,电子设备700可以被一个或多个应用专用集成电路(ASIC)、数字信号处理器(DSP)、数字信号处理设备(DSPD)、可编程逻辑器件(PLD)、现场可编程门阵列(FPGA)、控制器、微控制器、微处理器或其他电子元件实现,用于实现本公开实施例提供的方法。
在示例性实施例中,还提供了一种包括指令的非临时性计算机存储介质,例如包括指令的存储器704,上述指令可由电子设备700的处理器720执行以完成上述方法。例如,所述非临时性计算机存储介质可以是ROM、随机存取存储器(RAM)、CD-ROM、磁带、软盘和光数据存储设备等。
图8是根据一示例性实施例示出的一种电子设备800的框图。例如,电子设备800可以被提供为一服务器。参照图8,电子设备800包括处理组件822,其进一步包括一个或多个处理器,以及由存储器832所代表的存储器资源,用于存储可由处理组件822的执行的指令,例如应用程序。存储器832中存储的应用程序可以包括一个或一个以上的每一个对应于一组指令的模块。此外,处理组件822被配置为执行指令,以执行本公开实施例提供的方法。
电子设备800还可以包括一个电源组件826被配置为执行电子设备800的电源管理,一个有线或无线网络接口850被配置为将电子设备800连接到网络,和一个输入输出(I/O)接口858。电子设备800可以操作基于存储在存储器832的操作***,例如WindowsServerTM,Mac OS XTM,UnixTM,LinuxTM,FreeBSDTM或类似。
本公开实施例还提供一种计算机程序产品,包括计算机程序/指令,所述计算机程序/指令被处理器执行时实现如本公开提供的方法。
本领域技术人员在考虑说明书及实践这里公开的公开后,将容易想到本公开的其它实施方案。本公开旨在涵盖本公开的任何变型、用途或者适应性变化,这些变型、用途或者适应性变化遵循本公开的一般性原理并包括本公开未公开的本技术领域中的公知常识或惯用技术手段。说明书和实施例仅被视为示例性的,本公开的真正范围和精神由下面的权利要求指出。
应当理解的是,本公开并不局限于上面已经描述并在附图中示出的精确结构,并且可以在不脱离其范围进行各种修改和改变。本公开的范围仅由所附的权利要求来限制。
Claims (15)
1.一种推荐数据集合的建立方法,其特征在于,所述方法包括:
获取与作者帐户对应的已发布的多媒体内容的内容标签;内容标签用于反映所述已发布的多媒体内容所属的类别;
根据所述内容标签,确定所述作者帐户对应的作者标签,所述作者标签用于反映所述作者帐户所属的类别;
对具有相同作者标签的作者帐户进行排序,得到每种作者标签对应的作者帐户序列,并根据所述作者标签与所述作者帐户序列的对应关系,建立推荐数据集合;
所述对具有相同作者标签的作者帐户进行排序,得到每种作者标签对应的作者帐户序列,包括:
获取所述作者帐户对应的已发布的多媒体内容的关联信息,所述关联信息为与所述多媒体内容相关联的交互信息;其中,所述关联信息包括所述多媒体内容在多媒体运营平台发布后产生的后期数据;所述关联信息包括所述多媒体内容的点赞数、评论数、转发数、粉丝数增长量中的一种或多种;
根据所述关联信息,对具有相同作者标签的作者帐户进行排序,得到每种作者标签对应的作者帐户序列;
所述根据所述关联信息,对具有相同作者标签的作者帐户进行排序,得到每种作者标签对应的作者帐户序列,包括:
针对具有相同作者标签的作者帐户,根据所述作者帐户对应的已发布的多媒体内容的关联信息,确定所述作者帐户对应的已发布的多媒体内容的第一得分;
根据所述作者帐户对应的已发布的多媒体内容的第一得分,确定所述作者帐户的第二得分;
根据所述第二得分,对每种作者标签对应的作者帐户进行排序,得到每种作者标签对应的作者帐户序列。
2.根据权利要求1所述的方法,其特征在于,所述根据所述作者帐户对应的已发布的多媒体内容的关联信息,确定所述作者帐户对应的已发布的多媒体内容的第一得分,包括:
按照所述点赞数、评论数、转发数、粉丝数增长量各自对应的权重值,对所述多媒体内容的关联信息进行加权求和,得到所述多媒体内容的第一得分;
所述根据所述作者帐户对应的已发布的多媒体内容的第一得分,确定所述作者帐户的第二得分,包括:
将所述作者帐户对应的已发布的多媒体内容的第一得分的平均值,作为所述作者帐户的第二得分。
3.根据权利要求1所述的方法,其特征在于,所述作者帐户为在预设时间范围内发布所述多媒体内容的数量大于或等于预设阈值的作者帐户。
4.根据权利要求1所述的方法,其特征在于,所述根据所述内容标签,确定所述作者帐户对应的作者标签,包括:
确定所述内容标签对应的类别;
在树形结构的类别关系集合中,确定所述内容标签对应的类别的父类别;
根据所述父类别,确定所述作者帐户对应的作者标签。
5.一种推荐方法,其特征在于,所述方法包括:
获取第一作者帐户的作者标签;
在推荐数据集合中,确定与所述作者标签对应的待推荐作者帐户序列,并从所述待推荐作者帐户序列中选取第二作者帐户;其中,所述推荐数据集合包括作者标签与作者帐户序列的对应关系;
将所述第二作者帐户推荐给所述第一作者帐户对应的设备;
所述从所述待推荐作者帐户序列中选取第二作者帐户,包括:
获取所述待推荐作者帐户序列中每个作者帐户的粉丝标识集合、以及所述第一作者帐户的粉丝标识集合;
根据第一作者帐户的粉丝标识集合、以及待推荐作者帐户序列中作者帐户的粉丝标识集合,确定所述待推荐作者帐户序列中每个作者帐户与所述第一作者帐户的关联度;
在所述待推荐作者帐户序列中,将关联度大于或等于预设关联度阈值的作者帐户作为所述第二作者帐户;
在所述推荐数据集合中,待推荐作者帐户序列包括的每个作者帐户具有对应的第二得分,且所述待推荐作者帐户序列包括的作者帐户按照所述第二得分进行排序;
所述待推荐作者帐户序列包括的作者帐户按照所述第二得分进行排序,包括:针对具有相同作者标签的作者帐户,根据所述作者帐户对应的已发布的多媒体内容的关联信息,确定所述作者帐户对应的已发布的多媒体内容的第一得分;根据所述作者帐户对应的已发布的多媒体内容的第一得分,确定所述作者帐户的第二得分;根据所述第二得分,对每种作者标签对应的作者帐户进行排序,得到每种作者标签对应的作者帐户序列;所述关联信息为与所述多媒体内容相关联的交互信息;其中,所述关联信息包括所述多媒体内容在多媒体运营平台发布后产生的后期数据;所述关联信息包括所述多媒体内容的点赞数、评论数、转发数、粉丝数增长量中的一种或多种;
所述从所述待推荐作者帐户序列中选取第二作者帐户,包括:
从所述待推荐作者帐户序列中,选取第二得分大于或等于预设得分值的作者帐户作为所述第二作者帐户。
6.根据权利要求5所述的方法,其特征在于,所述根据第一作者帐户的粉丝标识集合、以及待推荐作者帐户序列中作者帐户的粉丝标识集合,确定所述待推荐作者帐户序列中每个作者帐户与所述第一作者帐户的关联度,包括:
对于所述待推荐作者帐户序列中的每个作者帐户,确定所述作者帐户的粉丝标识集合与所述第一作者帐户的粉丝标识集合之间的交集和并集;
将所述交集和所述并集的比值作为所述作者帐户与所述第一作者帐户的关联度。
7.一种推荐数据集合的建立装置,其特征在于,所述装置包括:
第一获取模块,被配置为获取与作者帐户对应的已发布的多媒体内容的内容标签;内容标签用于反映所述已发布的多媒体内容所属的类别;
标签确定模块,被配置为根据所述内容标签,确定所述作者帐户对应的作者标签,所述作者标签用于反映所述作者帐户所属的类别;
建立模块,被配置为对具有相同作者标签的作者帐户进行排序,得到每种作者标签对应的作者帐户序列,并根据所述作者标签与所述作者帐户序列的对应关系,建立推荐数据集合;
包括:
第一获取子模块,被配置为获取所述作者帐户对应的已发布的多媒体内容的关联信息,所述关联信息为与所述多媒体内容相关联的交互信息;其中,所述关联信息包括所述多媒体内容的点赞数、评论数、转发数、粉丝数增长量中的一种或多种;
排序子模块,被配置为根据所述关联信息,对具有相同作者标签的作者帐户进行排序,得到每种作者标签对应的作者帐户序列;
所述排序子模块,包括:
第一得分单元,被配置为针对具有相同作者标签的作者帐户,根据所述作者帐户对应的已发布的多媒体内容的关联信息,确定所述作者帐户对应的已发布的多媒体内容的第一得分;
第二得分单元,被配置为根据所述作者帐户对应的已发布的多媒体内容的第一得分,确定所述作者帐户的第二得分;
排序单元,被配置为根据所述第二得分,对每种作者标签对应的作者帐户进行排序,得到每种作者标签对应的作者帐户序列。
8.根据权利要求7所述的装置,其特征在于,所述第一得分单元,包括:
加权计算子单元,被配置为按照所述点赞数、评论数、转发数、粉丝数增长量各自对应的权重值,对所述多媒体内容的关联信息进行加权求和,得到所述多媒体内容的第一得分;
所述第二得分单元,包括:
平均计算子单元,被配置为将所述作者帐户对应的已发布的多媒体内容的第一得分的平均值,作为所述作者帐户的第二得分。
9.根据权利要求7所述的装置,其特征在于,所述作者帐户为在预设时间范围内发布所述多媒体内容的数量大于或等于预设阈值的作者帐户。
10.根据权利要求7所述的装置,其特征在于,所述标签确定模块包括:
第一类别确定子模块,用于确定所述内容标签对应的类别;
第二类别确定子模块,用于在树形结构的类别关系集合中,确定所述内容标签对应的类别的父类别;
建立子模块,用于根据所述父类别,确定所述作者帐户对应的作者标签。
11.一种推荐装置,其特征在于,所述装置包括:
第二获取模块,被配置为获取第一作者帐户的作者标签;
第二确定模块,被配置为在推荐数据集合中,确定与所述作者标签对应的待推荐作者帐户序列,并从所述待推荐作者帐户序列中选取第二作者帐户;其中,所述推荐数据集合包括作者标签与作者帐户序列的对应关系;
推荐模块,被配置为将所述第二作者帐户推荐给所述第一作者帐户对应的设备;
所述第二确定模块,包括:
第二获取子模块,被配置为获取所述待推荐作者帐户序列中每个作者帐户的粉丝标识集合、以及所述第一作者帐户的粉丝标识集合;
关联度子模块,被配置为根据第一作者帐户的粉丝标识集合、以及待推荐作者帐户序列中作者帐户的粉丝标识集合,确定所述待推荐作者帐户序列中每个作者帐户与所述第一作者帐户的关联度;
选取子模块,被配置为在所述待推荐作者帐户序列中,将关联度大于或等于预设关联度阈值的作者帐户作为所述第二作者帐户;
在所述推荐数据集合中,待推荐作者帐户序列包括的每个作者帐户具有对应的第二得分,且所述待推荐作者帐户序列包括的作者帐户按照所述第二得分进行排序;
所述待推荐作者帐户序列包括的作者帐户按照所述第二得分进行排序;包括:第一得分单元,被配置为针对具有相同作者标签的作者帐户,根据所述作者帐户对应的已发布的多媒体内容的关联信息,确定所述作者帐户对应的已发布的多媒体内容的第一得分;
第二得分单元,被配置为根据所述作者帐户对应的已发布的多媒体内容的第一得分,确定所述作者帐户的第二得分;
排序单元,被配置为根据所述第二得分,对每种作者标签对应的作者帐户进行排序,得到每种作者标签对应的作者帐户序列;
所述选取子模块,包括:
选取子模块,被配置为从所述待推荐作者帐户序列中,选取第二得分大于或等于预设得分值的作者帐户作为所述第二作者帐户。
12.根据权利要求11所述的装置,其特征在于,所述关联度子模块,包括:
集合计算单元,被配置为对于所述待推荐作者帐户序列中的每个作者帐户,确定所述作者帐户的粉丝标识集合与所述第一作者帐户的粉丝标识集合之间的交集和并集;
比值计算单元,被配置为将所述交集和所述并集的比值作为所述作者帐户与所述第一作者帐户的关联度。
13.一种电子设备,其特征在于,包括:处理器;
用于存储所述处理器可执行指令的存储器;
其中,所述处理器被配置为执行所述指令,以实现如权利要求1至6中任一项所述的方法。
14.一种计算机存储介质,其特征在于,当所述计算机存储介质中的指令由电子设备的处理器执行时,使得电子设备能够执行如权利要求1至6中任一项所述的方法。
15.一种计算机程序产品,包括计算机程序/指令,其特征在于,所述计算机程序/指令被处理器执行时实现权利要求1-6任一项所述的方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202011477718.1A CN112612949B (zh) | 2020-12-15 | 2020-12-15 | 推荐数据集合的建立方法及装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202011477718.1A CN112612949B (zh) | 2020-12-15 | 2020-12-15 | 推荐数据集合的建立方法及装置 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN112612949A CN112612949A (zh) | 2021-04-06 |
CN112612949B true CN112612949B (zh) | 2024-06-11 |
Family
ID=75234160
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202011477718.1A Active CN112612949B (zh) | 2020-12-15 | 2020-12-15 | 推荐数据集合的建立方法及装置 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN112612949B (zh) |
Families Citing this family (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN111638832A (zh) * | 2020-04-23 | 2020-09-08 | 北京达佳互联信息技术有限公司 | 信息展示方法、装置、***、电子设备及存储介质 |
CN113724023B (zh) * | 2021-11-04 | 2022-04-01 | 北京达佳互联信息技术有限公司 | 媒介资源的推送方法、装置、电子设备及存储介质 |
Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN107688637A (zh) * | 2017-08-23 | 2018-02-13 | 广东欧珀移动通信有限公司 | 信息推送方法、装置、存储介质及电子终端 |
CN109299384A (zh) * | 2018-11-02 | 2019-02-01 | 北京小米智能科技有限公司 | 场景推荐方法、装置及***、存储介质 |
CN109729395A (zh) * | 2018-12-14 | 2019-05-07 | 广州市百果园信息技术有限公司 | 视频质量评估方法、装置、存储介质和计算机设备 |
CN111638832A (zh) * | 2020-04-23 | 2020-09-08 | 北京达佳互联信息技术有限公司 | 信息展示方法、装置、***、电子设备及存储介质 |
CN111897996A (zh) * | 2020-08-10 | 2020-11-06 | 北京达佳互联信息技术有限公司 | 话题标签推荐方法、装置、设备及存储介质 |
Family Cites Families (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US11163777B2 (en) * | 2018-10-18 | 2021-11-02 | Oracle International Corporation | Smart content recommendations for content authors |
-
2020
- 2020-12-15 CN CN202011477718.1A patent/CN112612949B/zh active Active
Patent Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN107688637A (zh) * | 2017-08-23 | 2018-02-13 | 广东欧珀移动通信有限公司 | 信息推送方法、装置、存储介质及电子终端 |
CN109299384A (zh) * | 2018-11-02 | 2019-02-01 | 北京小米智能科技有限公司 | 场景推荐方法、装置及***、存储介质 |
CN109729395A (zh) * | 2018-12-14 | 2019-05-07 | 广州市百果园信息技术有限公司 | 视频质量评估方法、装置、存储介质和计算机设备 |
CN111638832A (zh) * | 2020-04-23 | 2020-09-08 | 北京达佳互联信息技术有限公司 | 信息展示方法、装置、***、电子设备及存储介质 |
CN111897996A (zh) * | 2020-08-10 | 2020-11-06 | 北京达佳互联信息技术有限公司 | 话题标签推荐方法、装置、设备及存储介质 |
Non-Patent Citations (2)
Title |
---|
唐红涛.跨境电子商务实训教程.对外经贸大学出版社,2020,第274-276页. * |
李玉萍.云计算与大数据应用研究.电子科技大学出版社,2019,第74-85页. * |
Also Published As
Publication number | Publication date |
---|---|
CN112612949A (zh) | 2021-04-06 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN109800325B (zh) | 视频推荐方法、装置和计算机可读存储介质 | |
US11520824B2 (en) | Method for displaying information, electronic device and system | |
CN107992604B (zh) | 一种任务条目的分发方法及相关装置 | |
EP3852044A1 (en) | Method and device for commenting on multimedia resource | |
CN106355429A (zh) | 图像素材的推荐方法及装置 | |
CN110598098A (zh) | 一种信息推荐方法、装置和用于信息推荐的装置 | |
CN111859020A (zh) | 推荐方法、装置、电子设备及计算机可读存储介质 | |
CN112445970B (zh) | 一种信息推荐方法、装置、电子设备及存储介质 | |
US20200012701A1 (en) | Method and apparatus for recommending associated user based on interactions with multimedia processes | |
CN112612949B (zh) | 推荐数据集合的建立方法及装置 | |
CN111127053B (zh) | 页面内容推荐方法、装置及电子设备 | |
CN112148980B (zh) | 基于用户点击的物品推荐方法、装置、设备和存储介质 | |
US11546663B2 (en) | Video recommendation method and apparatus | |
CN112148923A (zh) | 搜索结果的排序方法、排序模型的生成方法、装置及设备 | |
CN111046927A (zh) | 标注数据的处理方法、装置、电子设备及存储介质 | |
CN108648031B (zh) | 产品推荐方法及装置 | |
CN112685641B (zh) | 一种信息处理方法及装置 | |
CN110650364B (zh) | 视频态度标签提取方法及基于视频的交互方法 | |
CN113609380A (zh) | 标签体系更新方法、搜索方法、装置以及电子设备 | |
CN110110046B (zh) | 同名实体推荐方法及装置 | |
CN112115341A (zh) | 内容展示方法、装置、终端、服务器、***及存储介质 | |
CN115994266A (zh) | 资源推荐方法、装置、电子设备和存储介质 | |
CN110730382B (zh) | 一种视频交互方法、装置、终端及存储介质 | |
CN111898028B (zh) | 一种实体对象推荐方法、装置及存储介质 | |
CN115484471B (zh) | 主播推荐方法及装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |