CN105005576B - 一种视频网站相似用户搜索***和方法 - Google Patents

一种视频网站相似用户搜索***和方法 Download PDF

Info

Publication number
CN105005576B
CN105005576B CN201510142618.6A CN201510142618A CN105005576B CN 105005576 B CN105005576 B CN 105005576B CN 201510142618 A CN201510142618 A CN 201510142618A CN 105005576 B CN105005576 B CN 105005576B
Authority
CN
China
Prior art keywords
user
label
video
viewing
msub
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201510142618.6A
Other languages
English (en)
Other versions
CN105005576A (zh
Inventor
房晓宇
江建博
朱凯泉
章岑
蒋子俊
潘柏宇
卢述奇
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Alibaba China Co Ltd
Original Assignee
Unification Infotech (beijing) Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Unification Infotech (beijing) Co Ltd filed Critical Unification Infotech (beijing) Co Ltd
Priority to CN201510142618.6A priority Critical patent/CN105005576B/zh
Publication of CN105005576A publication Critical patent/CN105005576A/zh
Application granted granted Critical
Publication of CN105005576B publication Critical patent/CN105005576B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Landscapes

  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Two-Way Televisions, Distribution Of Moving Picture Or The Like (AREA)

Abstract

本发明根据种子用户的情况,提出了一种基于视频内容的视频网站相似用户搜索***和方法。本发明将视频的描述词视为视频内容的描述,将用户的视频观看行为提炼为用户对视频内容的观看,从而利用对视频内容的索引,来搜索具有相似观看行为的用户群。本发明的***和方法可以搜索出更多的相似的视频用户,扩展相似的视频网站用户群,从而提升广告中产品的推广效果。

Description

一种视频网站相似用户搜索***和方法
技术领域
本发明涉及一种视频网站相似用户搜索***和方法。
背景技术
目前视频网站上的视频广告投放常常会遇到这样的问题:在某一广告投放中,某些用户对该广告表现出了兴趣,发生了点击或者消费行为。相似的视频用户,对于广告产品的兴趣具有一定程度的相似性,例如:两个同样观看了健身瑜伽视频的用户,可能都会对减肥产品、化妆品等感兴趣;而两个同样观看了刀塔游戏视频的用户,可能会对一些网页游戏产生兴趣。
相似的用户观看行为,可以为推测其兴趣爱好提供线索。在广告投放过程中,一些用户对投放的广告产生了积极的反馈(例如:点击、购买等),以这些用户作为种子用户,进行相似人群的扩展搜索,在未来的广告投放中就可以有的放矢地锁定这一类人群,从而使广告投放产生更大的效益。
因此,如何利用种子用户的观看行为,对视频网站进行有效的相似用户搜索,就成了一个非常重要的问题。
发明内容
本发明根据种子用户的情况,提出了一种基于视频内容的视频网站相似用户搜索***和方法。本发明将视频的描述词视为视频内容的描述,将用户的视频观看行为提炼为用户对视频内容的观看,从而利用对视频内容的索引,来搜索具有相似观看行为的用户群。
本发明的***和方法可以搜索出更多的相似的视频用户,扩展相似的视频网站用户群,从而提升广告中产品的推广效果,使得该广告的投放产生更大的效益,在广告投放领域有着重要的应用价值。
附图说明
本发明将参照附图来进一步详细说明,其中:
图1是本发明的视频网站相似用户搜索方法流程图;
图2是本发明的视频网站相似用户搜索***结构示意图。
具体实施方式
虽然将参照含有本发明的较佳实施例的附图充分描述本发明,但在此描述之前应了解,本领域的普通技术人员可修改本文中所描述的发明,同时获得本发明的技术效果。因此,须了解以下的描述对本领域的普通技术人员而言为一广泛的揭示,且其内容不在于限制本发明所描述的示例性实施例。
参考图1所示,本发明的视频网站相似用户搜索方法包括:
步骤1,对用户观看内容进行统计分析,统计一段时间内(例如一周)的用户视频观看记录,结合视频内容描述词得到每个用户在每一种视频内容上的观看次数和频率。其中,视频内容描述词主要通过视频标签、关键词以及视频标题分词来描述,视频标签、关键词以及视频标题分词都对视频内容进行了简短而抽象的描述,能够较为有效地刻画视频的内容信息,不同的视频可能含有相似的内容,表现在它们可能拥有相同的标签或关键词。利用用户的观看记录,结合视频内容描述词,统计用户在不同内容上的观看频率,可以有效地反映用户的兴趣偏好。
其中,步骤1进一步包括:
步骤1.1,利用视频用户的观看记录,统计用户一段时间内的视频观看次数,得到“用户标识---视频标识---观看次数”的视频观看列表;
步骤1.2,对于视频信息,提取视频信息列表“视频标识---标签1、标签2、…、标签i”,结合视频观看列表生成内容观看列表“用户标识---标签i---观看次数”;
步骤1.3,对具有相同用户标识的内容观看记录进行合并,利用标签i的内容观看次数计算得到标签i的观看频率,即每个用户一段时间内在标签i上的观看频率,计算方法为:
其中,tfi为标签i的频率,Ci、Cj为用户观看标签i、标签j的次数,T为该用户观看的所有标签的集合。
通过步骤1,可以得到每个用户最近一段时间内观看的视频内容以及每种视频内容的观看频率。
步骤2,建立用户的倒排索引,根据步骤1中统计分析得到的观看记录,基于视频内容描述词建立用户的倒排索引,该索引形式以视频内容的描述词作为索引关键字,以观看该描述词的所有用户标识及其观看频率作为索引值。
其中,步骤2进一步包括:
步骤2.1,以标签为索引关键字,统计观看过该标签的所有用户以及每个用户的观看频率,计算观看过该标签的用户总数;
步骤2.2,利用哈希方法,对标签进行哈希计算,对索引文件进行分块;
步骤2.3,将标签的观看信息存储至哈希值所对应的分块处。
步骤3,进行相似用户搜索并计算相似性,利用种子用户的视频观看记录,以视频内容描述词为搜索关键字,在索引文件上进行相似用户的搜索,同时计算相应用户的相似性,得到初步的搜索结果。
其中,步骤3进一步包括:
步骤3.1,对种子用户的观看记录进行分析,对种子用户的每一个标签进行搜索,得到观看过该标签的所有用户总数、用户标识以及相应的观看频率;
步骤3.2,对每一个搜索返回的用户计算相似性,其计算方法如下:
其中,Sui表示用户u在标签i上的相似性,tfui表示用户u观看标签i的频率,D表示所有用户总数,Pi表示观看标签i的用户总数;
步骤3.4,对所有种子用户的观看标签进行搜索返回的结果进行综合分析,计算每个返回用户的综合相似性,计算方法为:
其中,Scoreu表示用户u的综合相似性,Sui表示用户u在标签i上的相似性。
步骤4,进行搜索结果排序,利用相似性对初步搜索结果进行由大到小的排序,经过过滤处理得到最终的相似人群搜索结果。对于搜索返回的用户群以及每个用户的综合相似性,按照相似性进行由大到小的排序,可以采用适当的相似性阈值进行结果过滤,将排序过滤后的结果输出。
参考图2,本发明还提供一种视频网站相似用户搜索***,包括:
统计分析装置,对用户观看内容进行统计分析,统计一段时间内的用户视频观看记录,结合视频内容描述词得到每个用户对每一种视频内容的观看次数和频率,其中,上述视频内容描述词通过视频标签、关键词以及视频标题分词来描述。
其中,统计分析装置利用视频用户的观看记录,统计用户一段时间内的视频观看次数,得到“用户标识---视频标识---观看次数”视频观看列表;对于视频信息,提取视频信息列表“视频标识---标签1、标签2、…、标签i”,结合视频观看列表生成内容观看列表“用户标识---标签i---观看次数”;对具有相同用户标识的内容观看记录进行合并,利用标签i的观看次数计算标签i的观看频率,即每个用户一段时间内在标签i上的观看频率,计算方法为:
其中,tfi为标签i的频率,Ci、Cj为用户观看标签i、标签j的次数,T为该用户观看的所有标签的集合。
索引装置,建立用户的倒排索引,根据第一步中统计分析得到的观看记录,基于视频内容描述词建立用户的倒排索引,该索引形式以视频内容描述词作为索引关键字,以观看该描述词的所有用户标识及观看频率作为索引值。
其中,索引装置以标签为索引关键字,统计观看过该标签的所有用户以及每个用户的观看频率,计算观看过该标签的用户总数;利用哈希方法,对标签进行哈希计算,对索引文件进行分块;将标签的观看信息存储至哈希值所对应的分块处。
计算装置,进行相似用户搜索并计算相似性,利用种子用户的视频观看记录,以视频内容描述词为搜索关键字,在索引文件上进行相似用户的搜索,同时计算相应用户的相似性,得到初步的搜索结果。
其中,计算装置对种子用户的观看记录进行分析,对种子用户的每一个标签进行搜索,得到观看过该标签的所有用户总数、用户标识以及相应的观看频率;
对每一个搜索返回的用户计算相似性,其计算方法如下:
其中,Sui表示用户u在标签i上的相似性,tfui表示用户u观看标签i的频率,D表示所有用户总数,Pi表示观看标签i的用户总数;
对所有种子用户的观看标签进行搜索返回的结果进行综合分析,计算每个返回用户的综合相似性,计算方法为:
其中,Scoreu表示用户u的综合相似性,Sui表示用户u在标签i上的相似性。
排序装置,进行搜索结果排序,利用相似性对初步搜索结果进行由大到小的排序,经过过滤处理得到最终的相似人群搜索结果。
其中,排序装置对于搜索返回的用户群以及每个用户的综合相似性,按照相似性进行由大到小的排序,可以采用适当的相似性阈值进行结果过滤,将排序过滤后的结果输出。
下面,通过两个示例进一步详细说明本发明的***和方法。
示例一:某视频网站相似人群搜索。
某网站有视频集合S={V1,...,Vn},每个视频包含一组内容描述词(即标签),不同视频之间可能还有相同的描述词。同时该网站记录了最近一周内的用户观看记录R={U1---Vx---C1x,…,Un---Vy---Cny}。
步骤1,以标签作为视频内容的描述,根据每个视频的标签信息,统计每个用户一周内在每个标签上的观看次数,得到形如“用户标识---标签---观看次数”的观看记录;对于相同用户标识的观看记录进行合并计算,得到每个用户观看的所有标签,并且计算每个标签的观看频率,计算方法为:
其中,tfi为标签i的频率,Ci、Cj为用户观看标签i、标签j的次数,T为该用户观看的所有标签的集合。这样,就得到了每个用户在每个标签上的观看频率,部分观看记录示例如下:
表1用户观看内容记录示例
步骤2,以标签作为索引关键字,对观看信息建立倒排索引。对标签进行哈希,得到哈希值;对倒排索引文件进行适当分块,将哈希值与文件分块建立映射;将每个标签所对应的观看信息(包括:该标签观看的用户总数、观看该标签的所有用户标识和每个用户的观看频率)存储至该标签哈希值所对应的文件分块处。
步骤3,对于给定的种子用户观看记录,利用观看标签信息在倒排索引文件上进行搜索。对于种子用户观看的每个标签,采用相同的哈希函数计算哈希值,从而找到对应的倒排索引文件块,读取其中的观看信息,得到观看过该标签的用户总数、所有用户标识和观看频率,计算观看过该标签的每个用户的相似性,方法如下:
其中,Sui表示用户u在标签i上的相似性,tfui表示用户u观看标签i的频率,D表示所有用户总数,Pi表示观看标签i的用户总数。
对于所有种子用户观看标签搜索返回的结果进行综合分析,计算每个返回用户的综合相似性,其计算方法为:
其中,Scorei表示用户的综合相似性,Sui表示用户u在标签i上的相似性。
步骤4,根据综合相似性进行从大到小的排序,经过一定的过滤筛选,输出排序后的结果。
最终得到的种子文件及其搜索结果示例如下:
表2种子用户
用户标识 综合相似性
1414805406362bou 7.457061423316192
1411422657876HQS 7.457061423316192
1414897033491tst 6.188232499062661
1414225525441rHY 5.067268407706754
1376735750584cE7 4.97137438163828
1413197549819YYw 4.97137438163828
1414929307620uum 4.125488415218207
1401986230544u2n 4.125488415218207
1396228567787C4I 4.125488415218207
1413550544110F75 4.125488415218207
1414835997319Vst 4.125488415218207
14148266200180f2 4.125488415218207
1413333051347w4D 4.125488415218207
1403043694606LSF 4.125488415218207
表3部分搜索返回结果
表4部分相似用户的内容观看记录
示例二:某产品目标人群扩展
某一产品已经锁定了少量的目标人群U={U1,…,Um},期望在某视频网站进行产品推广,要求推广受众是与已经锁定的目标人群U中具有相似兴趣的用户群。同时该网站记录了最近一周内的用户观看记录R={U1---Vx---C1x,…,Un---Vy---Cny}。
步骤1,利用网站的观看记录,查找目标人群U中用户的视频观看记录,结合视频信息,得到目标人群基于视频标签的观看记录。结合该产品的信息,对目标人群的观看标签进行筛选,滤除无关标签。将过滤后的观看记录作为搜索的种子。之后,对于最近一周内的所有观看记录,以标签作为视频内容的描述,根据每个视频的标签信息,统计每个用户一周内在每个标签上的观看次数,得到形如“用户标识---标签---观看次数”的观看记录。
对于相同用户标识的观看记录进行合并计算,得到每个用户观看的所有标签,并且计算每个标签的观看频率。计算方法为:
其中,tfi为标签i的频率,Ci、Cj为用户观看标签i、标签j的次数,T为该用户观看的所有标签的集合。这样我们就得到了每个用户在每个标签上的观看频率。
步骤2,以标签作为索引关键字,对观看信息建立倒排索引。对标签进行哈希,得到哈希值;对倒排索引文件进行适当分块,将哈希值与文件分块建立映射;将每个标签所对应的观看信息(包括:该标签观看的用户总数、观看该标签的所有用户标识和每个用户的观看频率)存储至该标签哈希值所对应的文件分块处。
步骤3,对于给定的种子用户观看记录,利用观看标签信息在倒排索引文件上进行搜索。对于种子用户观看的每个标签,采用相同的哈希函数计算哈希值,从而找到对应的倒排索引文件块,读取其中的观看信息,得到观看过该标签的用户总数、所有用户标识和观看频率,计算观看过该标签的每个用户的相似性,计算方法如下:
其中,Sui表示用户u在标签i上的相似性,tfui表示用户u观看标签i的频率,D表示所有用户总数,Pi表示观看标签i的用户总数。
对所有种子用户观看标签搜索返回的结果进行综合分析,计算每个返回用户的综合相似性。其计算方法为:
其中,Scoreu表示用户u的综合相似性,Sui表示用户u在标签i上的相似性。
步骤4,根据综合相似性进行从大到小的排序,经过一定的过滤筛选,输出排序后的结果。
该产品目标用户的观看内容示例如下:
目标用户 目标客户观看的视频标签 目标客户关注的产品信息
客户一 华为荣耀3c 荣耀3c联通版
客户二 苹果手机5s iphone5s手壳
客户三 魅族.mx3 mx3
客户四 xplay发布会 步步高xplay3
表5客户观看内容示例
搜索到的部分结果示例如下:
用户标识 综合相似性
1403339995050JHU 6.344749147553775
1414920358781u4V 6.344749147553775
14046215115455ID 6.344749147553775
1414887141725RG9 6.344749147553775
1403888781082S88 6.344749147553775
1408775203633njo 6.344749147553775
1400511822703RkC 6.344749147553775
1414852321322EFa 6.007725367960162
1414934708013Eut 6.007725367960162
141126880285943L 6.007725367960162
1414923557154foW 6.007725367960162
1414856887921mCx 6.007725367960162
表6部分搜索返回结果
表7部分相似用户的观看记录
在详细说明本发明的较佳实施例之后,熟悉本领域的技术人员可清楚的了解,在不脱离随附权利要求的保护范围与精神下可进行各种变化与改变,且本发明亦不受限于说明书中所举示例性实施例的实施方式。

Claims (7)

1.一种视频网站相似用户搜索方法,包括:
步骤1,对用户观看内容进行统计分析,统计一段时间内的用户视频观看记录,结合视频内容描述词得到每个用户对每一种视频内容的观看次数和频率,其中,上述视频内容描述词通过视频标签、关键词以及视频标题分词来描述;
步骤2,建立用户的倒排索引,根据上述步骤1中统计分析得到的观看记录,基于视频内容描述词建立用户的倒排索引,该索引形式以视频内容描述词作为索引关键字,以观看该描述词的所有用户标识及观看频率作为索引值;
步骤3,进行相似用户搜索并计算相似性,利用种子用户的视频观看记录,以视频内容描述词为搜索关键字,在索引文件上进行相似用户的搜索,同时计算相应用户的相似性,得到初步的搜索结果;
步骤4,进行搜索结果排序,利用相似性对初步搜索结果进行由大到小的排序,经过过滤处理得到最终的相似人群搜索结果;
其中,步骤1进一步包括:
步骤1.1,利用视频用户的观看记录,统计用户一段时间内的视频观看次数,得到“用户标识---视频标识---观看次数”的视频观看列表;
步骤1.2,对于视频信息,提取视频信息列表“视频标识---标签1、标签2、…、标签i”,结合视频观看列表生成内容观看列表“用户标识---标签i---观看次数”;
步骤1.3,对具有相同用户标识的内容观看记录进行合并,利用标签i的观看次数计算得到标签i的观看频率,即每个用户一段时间内在该标签上的观看频率,计算方法为:
<mrow> <msub> <mi>tf</mi> <mi>i</mi> </msub> <mo>=</mo> <mfrac> <msub> <mi>C</mi> <mi>i</mi> </msub> <mrow> <msub> <mi>&amp;Sigma;</mi> <mrow> <mi>j</mi> <mo>&amp;Element;</mo> <mi>T</mi> </mrow> </msub> <msub> <mi>C</mi> <mi>j</mi> </msub> </mrow> </mfrac> </mrow>
其中,tfi为标签i的频率,Ci、Cj为用户观看标签i、标签j的次数,T为该用户观看的所有标签的集合。
2.根据权利要求1所述的方法,其中,步骤2进一步包括:
步骤2.1,以标签为索引关键字,统计观看过该标签的所有用户以及每个用户观看该标签的频率,计算得到观看过该标签的用户总数;
步骤2.2,利用哈希方法,对标签进行哈希计算,对索引文件进行分块;
步骤2.3,将标签的观看信息存储至哈希值所对应的位置。
3.根据权利要求1所述的方法,其中,步骤3进一步包括:
步骤3.1,对种子用户的观看记录进行分析,对种子用户的每一个标签进行搜索,得到观看过该标签的所有用户总数、用户标识以及相应的观看频率;
步骤3.2,对每一个搜索返回的用户计算相似性,其计算方法如下:
<mrow> <msub> <mi>S</mi> <mrow> <mi>u</mi> <mi>i</mi> </mrow> </msub> <mo>=</mo> <msub> <mi>tf</mi> <mrow> <mi>u</mi> <mi>i</mi> </mrow> </msub> <mo>*</mo> <mi>l</mi> <mi>o</mi> <mi>g</mi> <mrow> <mo>(</mo> <mfrac> <mi>D</mi> <msub> <mi>P</mi> <mi>i</mi> </msub> </mfrac> <mo>)</mo> </mrow> </mrow>
其中,Sui表示用户u在标签i上的相似性,tfui表示用户u观看标签i的频率,D表示所有用户总数,Pi表示观看标签i的用户总数;
步骤3.4,对所有种子用户的观看标签进行搜索返回的结果进行综合分析,计算每个返回用户的综合相似性,计算方法为:
<mrow> <msub> <mi>Score</mi> <mi>u</mi> </msub> <mo>=</mo> <munder> <mo>&amp;Sigma;</mo> <mi>i</mi> </munder> <msub> <mi>S</mi> <mrow> <mi>u</mi> <mi>i</mi> </mrow> </msub> </mrow>
其中,Scoreu表示用户u的综合相似性,Sui表示用户u在标签i上的相似性。
4.根据权利要求1所述的方法,其中,步骤4进一步包括:对于搜索返回的用户群以及每个用户的综合相似性,按照相似性进行由大到小的排序,可以采用适当的相似性阈值进行结果过滤,将排序过滤后的结果输出。
5.一种视频网站相似用户搜索***,包括:
统计分析装置,对用户观看内容进行统计分析,统计一段时间内的用户视频观看记录,结合视频内容描述词得到每个用户对每一种视频内容的观看次数和频率,其中,上述视频内容描述词通过视频标签、关键词以及视频标题分词来描述;索引装置,建立用户的倒排索引,根据统计分析装置中统计分析得到的观看记录,基于视频内容描述词建立用户的倒排索引,该索引形式以视频内容描述词作为索引关键字,以观看该描述词的所有用户标识及观看频率作为索引值;
计算装置,进行相似用户搜索并计算相似性,利用种子用户的视频观看记录,以视频内容描述词为搜索关键字,在索引文件上进行相似用户的搜索,同时计算相应用户的相似性,得到初步的搜索结果;
排序装置,进行搜索结果排序,利用相似性对初步搜索结果进行由大到小的排序,经过过滤处理得到最终的相似人群搜索结果;
其中,统计分析装置利用视频用户的观看记录,统计用户一段时间内的视频观看次数,得到“用户标识---视频标识---观看次数”视频观看列表;对于视频信息,提取视频信息列表“视频标识---标签1、标签2、…、标签i”,结合视频观看列表生成内容观看列表“用户标识---标签i---观看次数”;对具有相同用户标识的内容观看记录进行合并,利用标签的观看次数计算标签的观看频率,即每个用户一段时间内在该标签上的观看频率,计算方法为:
<mrow> <msub> <mi>tf</mi> <mi>i</mi> </msub> <mo>=</mo> <mfrac> <msub> <mi>C</mi> <mi>i</mi> </msub> <mrow> <msub> <mi>&amp;Sigma;</mi> <mrow> <mi>j</mi> <mo>&amp;Element;</mo> <mi>T</mi> </mrow> </msub> <msub> <mi>C</mi> <mi>j</mi> </msub> </mrow> </mfrac> </mrow>
其中,tfi为标签i的频率,Ci、Cj为用户观看标签i、标签j的次数,T为该用户观看的所有标签的集合。
6.根据权利要求5所述的***,其中,索引装置以标签为索引关键字,统计观看过该标签的所有用户以及每个用户观看该标签的频率,计算观看过该标签的用户总数;利用哈希方法,对标签进行哈希计算,对索引文件进行分块;将标签的观看信息存储至哈希值所对应的位置。
7.根据权利要求5所述的***,其中,计算装置对种子用户的观看记录进行分析,对种子用户的每一个标签进行搜索,得到观看过该标签的所有用户总数、用户标识以及相应的观看频率;
对每一个搜索返回的用户计算相似性,其计算方法如下:
<mrow> <msub> <mi>S</mi> <mrow> <mi>u</mi> <mi>i</mi> </mrow> </msub> <mo>=</mo> <msub> <mi>tf</mi> <mrow> <mi>u</mi> <mi>i</mi> </mrow> </msub> <mo>*</mo> <mi>l</mi> <mi>o</mi> <mi>g</mi> <mrow> <mo>(</mo> <mfrac> <mi>D</mi> <msub> <mi>P</mi> <mi>i</mi> </msub> </mfrac> <mo>)</mo> </mrow> </mrow>
其中,Sui表示用户u在标签i上的相似性,tfui表示用户u观看标签i的频率,D表示所有用户总数,Pi表示观看标签i的用户总数;
对所有种子用户的观看标签进行搜索返回的结果进行综合分析,计算每个返回用户的综合相似性,计算方法为:
<mrow> <msub> <mi>Score</mi> <mi>u</mi> </msub> <mo>=</mo> <munder> <mo>&amp;Sigma;</mo> <mi>i</mi> </munder> <msub> <mi>S</mi> <mrow> <mi>u</mi> <mi>i</mi> </mrow> </msub> </mrow>
其中,Scoreu表示用户u的综合相似性,Sui表示用户u在标签i上的相似性。
CN201510142618.6A 2015-03-27 2015-03-27 一种视频网站相似用户搜索***和方法 Active CN105005576B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201510142618.6A CN105005576B (zh) 2015-03-27 2015-03-27 一种视频网站相似用户搜索***和方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201510142618.6A CN105005576B (zh) 2015-03-27 2015-03-27 一种视频网站相似用户搜索***和方法

Publications (2)

Publication Number Publication Date
CN105005576A CN105005576A (zh) 2015-10-28
CN105005576B true CN105005576B (zh) 2018-03-09

Family

ID=54378252

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201510142618.6A Active CN105005576B (zh) 2015-03-27 2015-03-27 一种视频网站相似用户搜索***和方法

Country Status (1)

Country Link
CN (1) CN105005576B (zh)

Families Citing this family (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105893559A (zh) * 2016-03-31 2016-08-24 北京奇艺世纪科技有限公司 一种数据推送方法及装置
CN105956093B (zh) * 2016-04-29 2019-04-30 浙江大学 一种基于多视图锚点图哈希技术的个性化推荐方法
CN106202393B (zh) * 2016-07-08 2021-03-19 腾讯科技(深圳)有限公司 媒体信息推送方法及装置
CN110096614B (zh) * 2019-04-12 2022-09-20 腾讯科技(深圳)有限公司 信息推荐方法及装置、电子设备
CN112967100B (zh) * 2021-04-02 2024-03-15 杭州网易云音乐科技有限公司 相似人群扩展方法、装置、计算设备以及介质

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103186550A (zh) * 2011-12-27 2013-07-03 盛乐信息技术(上海)有限公司 一种视频的相关视频列表的生成方法及***
CN103440341A (zh) * 2013-09-09 2013-12-11 广州品唯软件有限公司 信息推荐方法及装置
CN103678694A (zh) * 2013-12-26 2014-03-26 乐视网信息技术(北京)股份有限公司 视频资源的倒排索引文件建立方法及其***

Family Cites Families (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8019777B2 (en) * 2006-03-16 2011-09-13 Nexify, Inc. Digital content personalization method and system
US9008489B2 (en) * 2012-02-17 2015-04-14 Kddi Corporation Keyword-tagging of scenes of interest within video content

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103186550A (zh) * 2011-12-27 2013-07-03 盛乐信息技术(上海)有限公司 一种视频的相关视频列表的生成方法及***
CN103440341A (zh) * 2013-09-09 2013-12-11 广州品唯软件有限公司 信息推荐方法及装置
CN103678694A (zh) * 2013-12-26 2014-03-26 乐视网信息技术(北京)股份有限公司 视频资源的倒排索引文件建立方法及其***

Also Published As

Publication number Publication date
CN105005576A (zh) 2015-10-28

Similar Documents

Publication Publication Date Title
CN105005576B (zh) 一种视频网站相似用户搜索***和方法
CN105095508B (zh) 一种多媒体内容推荐方法和多媒体内容推荐装置
US8719283B2 (en) Summarizing reviews
CN104317959B (zh) 基于社交平台的数据挖掘方法及装置
US20080294625A1 (en) Item recommendation system
US20170140058A1 (en) Systems and Methods for Identifying Influencers and Their Communities in a Social Data Network
CN106354872B (zh) 文本聚类的方法及***
CN104035927B (zh) 一种基于用户行为的搜索方法及***
CN105138670B (zh) 音频文件标签生成方法和***
CN103984741B (zh) 用户属性信息提取方法及其***
CN104751354B (zh) 一种广告人群筛选方法
CN103927309B (zh) 一种对业务对象标注信息标签的方法及装置
CN107124653A (zh) 电视用户画像的构建方法
CN106096609B (zh) 一种基于ocr的商品查询关键字自动生成方法
Kong et al. A tweet-centric approach for topic-specific author ranking in micro-blog
Farrahi et al. Impact of listening behavior on music recommendation
CN102428467A (zh) 用于分类的基于相似度的特征集补充
Katz et al. Using Wikipedia to boost collaborative filtering techniques
CN107341199A (zh) 一种基于文献信息共性模式的推荐方法
CN108629010A (zh) 一种基于主题和服务组合信息的web服务推荐方法
JP2010528351A (ja) 共通接辞を用いたキーワード順位を提供する方法およびシステム
CN110290403A (zh) 网络视频贴片广告播放方法和***
Dan et al. Filtering microblogging messages for social tv
Bulakh et al. Identifying fraudulently promoted online videos
CN106779080A (zh) 一种人物信息知识库自动构建方法

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant
CP01 Change in the name or title of a patent holder
CP01 Change in the name or title of a patent holder

Address after: 100080, No. 8 Haidian street, Beijing, Haidian District Steel International Plaza, 6 floor

Patentee after: YOUKU INFORMATION TECHNOLOGY (BEIJING) Co.,Ltd.

Address before: 100080, No. 8 Haidian street, Beijing, Haidian District Steel International Plaza, 6 floor

Patentee before: HEYI INFORMATION TECHNOLOGY (BEIJING) Co.,Ltd.

TR01 Transfer of patent right
TR01 Transfer of patent right

Effective date of registration: 20200416

Address after: 310052 room 508, floor 5, building 4, No. 699, Wangshang Road, Changhe street, Binjiang District, Hangzhou City, Zhejiang Province

Patentee after: Alibaba (China) Co.,Ltd.

Address before: 100080, No. 8 Haidian street, Beijing, Haidian District Steel International Plaza, 6 floor

Patentee before: YOUKU INFORMATION TECHNOLOGY (BEIJING) Co.,Ltd.