CN103714130B - 视频推荐***及方法 - Google Patents
视频推荐***及方法 Download PDFInfo
- Publication number
- CN103714130B CN103714130B CN201310684807.7A CN201310684807A CN103714130B CN 103714130 B CN103714130 B CN 103714130B CN 201310684807 A CN201310684807 A CN 201310684807A CN 103714130 B CN103714130 B CN 103714130B
- Authority
- CN
- China
- Prior art keywords
- user
- video
- friend
- data
- module
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/70—Information retrieval; Database structures therefor; File system structures therefor of video data
- G06F16/78—Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/90—Details of database functions independent of the retrieved data types
- G06F16/95—Retrieval from the web
- G06F16/953—Querying, e.g. by the use of web search engines
- G06F16/9535—Search customisation based on user profiles and personalisation
Landscapes
- Engineering & Computer Science (AREA)
- Databases & Information Systems (AREA)
- Theoretical Computer Science (AREA)
- Data Mining & Analysis (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Library & Information Science (AREA)
- Multimedia (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
本发明提供的视频推荐***和方法,通过信息获取模块获取包括用户个人信息、用户社交网络信息及视频类别信息的多源数据,由数据预处理模块对所述多源数据进行预处理,再经数据存储模块构建的用户数据库存储经预处理后的多源数据,再通过用户特点分析模块根据用户发送的微博数据获取用户的性格和情绪和社交网络分析模块对用户的好友聚类分析,获取所述用户的好友圈,视频推荐模块根据所述用户的性格、情绪和好友圈,选取所述用户喜好的视频并通过前端显示模块向所述用户显示选取的视频。
Description
技术领域
本发明涉及信息技术领域,尤其涉及一种视频推荐***及方法。
背景技术
当前已有的视频推荐方法和***主要有两种。一种是用户主动选择喜欢的视频类别,然后***根据用户选择来推荐相同类别的视频;另一种则是根据用户的观看历史记录,推荐与用户观看过的视频相同类别的其他视频。
这两种方法的共同特征都是利用用户的个人信息并且侧重于只利用其观看信息来进行视频推荐,忽略了用户性别、年龄、职业、国籍、地区等其他刻画用户特征的重要信息。这导致了其推荐结果过度集中于用户观看过的某一类电影,无法反映用户的真实兴趣,推荐的准确度、全面度偏低。
而且用户的亲人、朋友等社交网络的成员会直接影响用户的观看习惯,例如用户的好友向其推荐了某一电影,或者是该用户的多位好友都观看了同一部电影,那么该用户喜欢该电影的可能性极大。这些信息对于视频推荐具有极大参考价值,上述提到的方法却完全未使用这些社交信息。这导致了其推荐结果完全无法反应用户的社交特点,无法预测用户可能喜欢的潜在的视频类别,不具有适应性,灵活性较差。
因此现有技术还存在缺陷,有待于改进和发展。
发明内容
本发明提供一种视频推荐***,该视频推荐***能够提供给用户推荐准确、全面的视频。
一种视频推荐***,包括:
信息获取模块,用于获取包括用户个人信息、用户社交网络信息及视频类别信息的多源数据,所述用户个人信息包括年龄、性别、职业、国籍、所在地区、喜欢的视频类型、观看过的视频列表,所述用户社交网络信息包括用户的好友信息、用户推送的微博内容以及发送微博的时间和地点、用户观看过的视频列表、用户的视频打分信息,所述视频类别信息包括名称、导演、年代、类型、视频评分和视频标签;
数据预处理模块,用于对所述多源数据进行预处理,所述数据预处理模块包括:数据清洗子模块,用于剔除所述多源数据中不完整的数据,数据规约子模块,用于将来自不同平台的多源数据的格式进行统一,及数据集成子模块,用于将规约后的来自不同数据库的数据集成到相同的数据库中;
数据存储模块,构建用户数据库,并将经预处理后的多源数据存储于所述数据库中;
用户特点分析模块,用于根据用户发送的微博数据获取用户的性格和情绪;
社交网络分析模块,用于对用户的好友聚类分析,获取所述用户的好友圈;
视频推荐模块,用于根据所述用户的性格、情绪和好友圈,选取所述用户喜好的视频;
前端显示模块,用于向所述用户显示选取的视频;
所述社交网络分析模块针对用户社交网络数据进行分析,包括:
将用户的好友表示为一系列特征向量的集合,所述集合包括区域、年龄、性别、职业、喜欢的视频类型及观看过的视频列表;计算好友与好友之间的相似度,并且依据相似度将用户的好友分为若干类型;
计算用户与其好友的亲密程度,获取其密友圈子;
依据用户好友的微博发送数量和转发数量来计算用户的传播影响力:P=0.2S+0.8F,其中P是好友的传播影响力,S是微博发送数量,F是微博被转发的次数。
进一步地,所述信息获取模块包括:
用户个人信息获取子模块,通过网页版的用户注册模块,获取用户的个人信息;
社交网络信息获取子模块,通过交流平台获取用户社交网络信息;及
视频类别信息获取子模块,通过视频网站获取视频类别信息。
进一步地,所述数据存储模块用于将所述用户个人信息存储到Sqlserver或Mysql的关系型数据库中及将用户社交网络信息存储MongoDB的图关系数据库中。
进一步地,所述用户特点分析模块包括:
用户性格分析子模块,用于根据用户以往发送的微博数据分析用户的性格;及
用户情绪分析子模块,用于根据用户以往发送的微博数据分析用户的情绪。
进一步地,所述视频推荐模块包括:
用户个人信息推荐模块,用于根据用户的性格和情绪选取用户喜好的视频电影;及
社交网络信息推荐模块,用于根据用户的好友圈选取用户喜好的视频电影。
进一步地,还包括用户信息实时捕捉模块,用于实时获取用户的社交网络信息,并存入所述数据库中。
进一步地,还包括结果优化模块,用于对所述视频推荐模块根据好友圈选取的视频赋予权值,并根据所述权值进行排序生成推荐列表。
进一步地,所述前端显示模块包括网页形式、电视终端或手机终端。
另外,本发明还提供了一种的视频推荐方法,包括下述步骤:
获取包括用户个人信息、用户社交网络信息及视频类别信息的多源数据,所述用户个人信息包括年龄、性别、职业、国籍、所在地区、喜欢的视频类型、观看过的视频列表,所述用户社交网络信息包括用户的好友信息、用户推送的微博内容以及发送微博的时间和地点、用户观看过的视频列表、用户的视频打分信息,所述视频类别信息包括名称、导演、年代、类型、视频评分和视频标签;
对所述多源数据进行预处理,包括:提出所述多源数据中不完整的数据,将来自不同平台的多源数据的格式进行统一,将规约后的来自不同数据库的数据集成到相同的数据库中;
构建用户数据库,并将经预处理后的多源数据存储于所述数据库中;
根据用户发送的微博数据获取用户的性格和情绪;
对用户的好友聚类分析,获取所述用户的好友圈,所述好友圈包括密友圈子、好友圈子及最大传播影响力好友;
根据所述用户的性格、情绪和好友圈,选取所述用户喜好的视频;及
用于向所述用户显示选取的视频;
对用户的好友聚类分析,获取所述用户的好友圈,包括下述步骤:
将用户的好友表示为一系列特征向量的集合,所述集合包括区域、年龄、性别、职业、喜欢的视频类型及观看过的视频列表;
计算好友向量之间的距离来表征好友与好友之间的相似度,并依据相似度采用聚类算法KMeans将用户的好友自动聚类为若干类型;
选取相似度较高的前20位好友构成其密友圈子;
依据用户好友的微博发送数量和转发数量来计算用户好友的传播影响力,所述计算公式为P=0.2S+0.8F,其中P是好友的传播影响力,S是微博发送数量,F是微博被转发的次数。
进一步地,根据用户发送的微博数据获取用户的性格和情绪,包括下述步骤:
数学抽象为一个N维的向量空间,并且每个向量对应性格/情绪基本要素,其中性格基本要素为:内倾、外倾、稳定、不稳定,情绪基本要素为:喜悦、愤怒、悲伤、恐惧、厌恶、惊奇,所述N维的向量空间为Q=[x1、x2、……];
对所述微博数据进行分词,获取语义要素,定义为C=[c1、c2、……];
建立函数映射关系,Q=f(C),其中,Q是性格/情绪基本和要素的集合,C是微博数据分词后得到的语义要素集合,f是对应的映射函数;
从所述微博上搜集微博数据C,判定每项基本要素的得分,从而得到性格/情绪基本要素Q,构成训练数据集;
利用神经网络算法对于训练数据集进行学习得到拟合模型,然后根据得到的模型预测用户性格/情绪。
进一步地,根据所述用户的性格、情绪和好友圈,选取所述用户喜好的视频,包括下述步骤:
根据用户的性格和情绪选取用户喜好的视频电影;及
根据用户的好友圈选取用户喜好的视频电影。
进一步地,根据用户的性格和情绪选取用户喜好的视频电影,包括下述步骤:
将每部电影用区域、年代、主演、类型四个属性来描述;
根据用户的性格和情绪获取该用户对于具有某个属性的电影的偏好程度,并赋予权值;
对于任意一部电影,所述用户对应于所述电影属性的偏好程度进行加和,得到所述用户对所述电影的喜好程度;
对所有电影进行计算,并选取喜好程度最大的10部电影推荐给用户。
进一步地,根据用户的好友圈选取用户喜好的视频电影,包括下述步骤:
计算用户好友圈中各位好友共同观看较多的视频,提取前10个电影作为推荐结果;
找到用户的密友圈子中共同观看较多的视频,提取前10个电影作为推荐结果;
根据用户好友的传播影响力,提取出前10个电影作为推荐结果。
进一步地,还包括下述步骤:对所述视频推荐模块根据好友圈选取的视频赋予权值,并根据所述权值进行排序生成推荐列表。
进一步地,对所述视频推荐模块根据好友圈选取的视频赋予权值,并根据所述权值进行排序生成推荐列表,包括下述步骤:
分别对于密友圈子得出的推荐结果、传播影响力最大的好友的推荐结果及普通圈子的推荐结果赋予权值;
计算所有出现在推荐结果中的电影的权值之和;
并根据所述权值进行排序生成推荐列表,作为最终推荐结果。
本发明提供的视频推荐***和方法,通过信息获取模块获取包括用户个人信息、用户社交网络信息及视频类别信息的多源数据,由数据预处理模块对所述多源数据进行预处理,再经数据存储模块构建的用户数据库存储经预处理后的多源数据,再通过用户特点分析模块根据用户发送的微博数据获取用户的性格和情绪和社交网络分析模块对用户的好友聚类分析,获取所述用户的好友圈,视频推荐模块根据所述用户的性格、情绪和好友圈,选取所述用户喜好的视频并通过前端显示模块向所述用户显示选取的视频。
附图说明
图1为本发明提供的视频推荐***的组成示意图;
图2为本发明提供的信息获取模块的组成示意图;
图3为本发明提供的数据预处理模块的组成示意图;
图4为本发明提供的用户特点分析模块的组成示意图;
图5为本发明提供的视频推荐方法的步骤流程图;
图6为本发明提供的根据用户发送的微博数据获取用户的性格和情绪的步骤流程图;
图7为本发明提供的对用户的好友聚类分析,获取所述用户的好友圈的步骤流程图;
图8为本发明提供的根据用户的性格和情绪选取用户喜好的视频电影的步骤流程图;
图9为本发明提供的根据用户的好友圈选取用户喜好的视频电影的步骤流程图。
具体实施方式
为了使本发明的目的、技术方案及优点更加清晰,以下结合附图及实施例,对本发明进行进一步详细说明。应当理解,此处所描述的具体实施例仅仅用以解释本发明,并不用于限定本发明。
请参阅图1,图1为本发明提供的视频推荐***100的组成示意图,包括:信息获取模块110、数据预处理模块120、数据存储模块130、用户特点分析模块140、社交网络分析模块150、视频推荐模块160及前端显示模块170。
请参阅图2,信息获取模块110用于获取包括用户个人信息、用户社交网络信息及视频类别信息的多源数据。优选地,信息获取模块110包括:用户个人信息获取子模块111、社交网络信息获取子模块112及视频类别信息获取子模块113。用户个人信息获取子模块111通过网页版的用户注册模块,获取用户的个人信息,其中,个人信息包括年龄、性别、职业、国籍、所在地区、喜欢的视频类型、观看过的视频列表;社交网络信息获取子模块112通过交流平台获取用户社交网络信息,例如,可以利用新浪微博、腾讯微博、腾讯QQ、优酷网等平台提供的开放API接口来获取用户信息,其中,用户社交网络信息包括用户的好友信息、用户推送的微博内容以及发送微博的时间和地点、用户观看过的视频列表、用户的视频打分信息;视频类别信息获取子模块113通过视频网站获取视频类别信息,例如可以从豆瓣、优酷等主流视频网站中提取出所需要的信息,其中,视频类别信息包括名称、导演、年代、类型、视频评分、视频标签等。
请参阅图3,数据预处理模块120用于对多源数据进行预处理。优选地,数据预处理模块120包括:数据清洗子模块121、数据规约子模块122及数据集成子模块123。数据清洗子模块121用于剔除所述多源数据中不完整的数据,比如用户除了姓名之外没有填写任何个人信息的数据记录将不会被分析推荐模块使用;数据规约子模块122用于将来自不同平台的多源数据的格式进行统一,例如,将用户个人注册信息以及从微博、QQ等网站提出来的个人信息统一为如下格式:用户名、年龄、性别、职业、国籍、所在地区、喜欢的视频类型、观看过的视频列表,用户的视频打分信息;将来自微博、QQ的社交网络信息统一为如下格式:用户名、用户好友1,用户好友2,用户好友3等;将来自豆瓣、优酷等网络的视频信息规约为如下格式:视频名称、视频年代、导演、主演、区域、类型、评分、标签;数据集成子模块123用于将规约后的来自不同数据库的数据集成到相同的数据库中。
数据存储模块130构建用户数据库,并将经预处理后的多源数据存储于数据库中。优选地,数据存储模块130用于将用户个人信息存储到Sqlserver或Mysql的关系型数据库中及将用户社交网络信息存储MongoDB的图关系数据库中。可以理解,Sqlserver或Mysql或MongoDB数据库只是其中的一种优选方式,而实际中还可以采用其他的数据库。
请参阅图4,用户特点分析模块140用于根据用户发送的微博数据获取用户的性格和情绪。优选地,用户特点分析模块140包括用户性格分析子模块141和用户情绪分析子模块142,用户性格分析子模块141用于根据用户以往发送的微博数据分析用户的性格,用户情绪分析子模块142用于根据用户以往发送的微博数据分析用户的情绪。
具体地,用户性格分析子模块141用于根据用户以往发送的微博数据分析用户的性格,具体采用下述步骤对用户性格的分析:
数学抽象为一个N维的向量空间,并且每个向量对应性格基本要素,N维的向量空间为Q=[x1、x2、……];
对所述微博数据进行分词,获取语义要素,定义为C=[c1、c2、……];
建立函数映射关系,Q=f(C),其中,Q是性格基本和要素的集合,C是微博数据分词后得到的语义要素集合,f是对应的映射函数;
从所述微博上搜集微博数据C,人工分析其性格/情绪特点,解析为性格基本要素Q,通过人工标注数据得到训练数据集;
利用神经网络算法对于训练数据集进行学习得到拟合模型,然后根据得到的模型预测用户性格。
而采用用户情绪分析子模块142根据用户以往发送的微博数据分析用户的情绪与上述用户性格分析子模块141实现对用户性格分析完全一致,在此不再赘述。
社交网络分析模块150用于对用户的好友聚类分析,获取所述用户的好友圈。社交网络分析模块150该模块针对用户社交网络数据进行多种分析,主要包括下述分析:
其一、对用户的好友进行聚类,将其好友按照特点分为若干类别。将用户的好友表示为一系列特征向量的集合:区域,年龄,性别,职业,喜欢的视频类型,观看过的视频列表,并计算好友与好友之间的相似度,并且依据相似度将用户的好友分为若干类型。
其二、计算用户与其好友的亲密程度,获取其密友圈子。通过计算用户与好友之间的相似度,选择相似度最高的几个好友进入用户的密友圈子,在推荐时加大权重。
其三、计算其好友的传播影响力,进而决定其对于该用户的影响力大小。依据用户好友的微博发送数量和转发数量来计算用户的传播影响力:
P=0.2S+0.8F
其中P是好友的传播影响力,S是微博发送数量,F是微博被转发的次数。
并且依据其好友的传播影响力来决定其在分析推荐模块中所占的比重,影响力越大的好友在分析推荐模块中占的比重越大。
视频推荐模块160用于根据所述用户的性格、情绪和好友圈,选取用户喜好的视频;该模块依据以上所得到的各种数据给出初步的推荐结果,主要包括下述推荐结果:
其一,依据用户个人信息得出推荐结果的算法如下:
a)将每部视频用区域、年代、主演、类型四个属性来描述。
b)从用户的个人信息中获取该用户对于具有某个属性的电影的偏好程度,也用一个权值表示。
c)对于某一部电影,将该用户对应于这部电影属性的偏好值进行加和即可得到用户对这部电影的喜好程度。
d)对所有电影进行计算,并选取喜好程度较大的10部电影推荐给用户。
其二,依据用户的社交网络信息推荐视频信息,其算法如下:
a)在(6)社交网络分析模块中将用户的好友分为了若干类别,计算用户的个人信息与好友类别之间的相似度,从而确定用户更可能属于哪一类。
b)计算该类别中各位好友共同观看较多的视频,提取前10个作为推荐结果。
c)找到用户的密友圈子中共同观看较多的视频,提取前10个作为推荐结果。
d)找到更具有影响力的好友,提取出前10个作为推荐结果。
前端显示模块170用于向所述用户显示选取的视频。前端显示模块包括网页形式、电视终端或手机终端。
另外,上述视频推荐***100还包括用户信息实时捕捉模块180,用于实时获取用户的社交网络信息,并存入所述数据库中。可以理解,在用户通过网页等终端登录后,***在终端显示该用户的历史观看列表,并且记录用户实时观看的视频信息,进而更新数据库。同时对于微博、QQ等用户则通过数据获取模块追踪用户近一段时间内的社交信息,如推送的微博、个人好友数据的更新等,并且存入数据库。
另外,上述视频推荐***100还包括结果优化模块190,用于对所述视频推荐模块根据好友圈选取的视频赋予权值,并根据所述权值进行排序生成推荐列表。可以理解,对于视频推荐模块160得出的各个结果通过结果优化模块190优化后得出最终结果,具体包括:
a)对于密友圈子得出的推荐结果赋予权值1,对于影响力较大的好友得出的推荐结果赋予权值1.5,对于普通圈子得出的推荐结果赋予权值0.8;
b)计算所有出现在推荐结果中的电影的权值之和;
c)排序后选择出圈子最大的前20部视频,作为最终推荐结果。
请参阅图5,为本发明提供的视频推荐方法200,包括下述步骤:
步骤S210:获取包括用户个人信息、用户社交网络信息及视频类别信息的多源数据;
可以理解,可以通过网页版的用户注册模块,获取用户的个人信息,个人信息包括年龄、性别、职业、国籍、所在地区、喜欢的视频类型、观看过的视频列表;通过交流平台获取用户社交网络信息,例如,可以利用新浪微博、腾讯微博、腾讯QQ、优酷网等平台提供的开放API接口来获取用户信息,其中,用户社交网络信息包括用户的好友信息、用户推送的微博内容以及发送微博的时间和地点、用户观看过的视频列表、用户的视频打分信息;通过视频网站获取视频类别信息,例如可以从豆瓣、优酷等主流视频网站中提取出所需要的信息,其中,视频类别信息包括名称、导演、年代、类型等,视频评分、视频标签。
步骤S220:对多源数据进行预处理;
具体包括:剔除所述多源数据中不完整的数据,比如用户除了姓名之外没有填写任何个人信息的数据记录将不会被分析推荐模块使用;将来自不同平台的多源数据的格式进行统一,例如,将用户个人注册信息以及从微博、QQ等网站提出来的个人信息统一为如下格式:用户名、年龄、性别、职业、国籍、所在地区、喜欢的视频类型、观看过的视频列表,用户的视频打分信息;将来自微博、QQ的社交网络信息统一为如下格式:用户名、用户好友1,用户好友2,用户好友3等;将来自豆瓣、优酷等网络的视频信息规约为如下格式:视频名称、视频年代、导演、主演、区域、类型、评分、标签;及将规约后的来自不同数据库的数据集成到相同的数据库中。
步骤S230:构建用户数据库,并将经预处理后的多源数据存储于所述数据库中;
优选地,将用户个人信息存储到Sqlserver或Mysql的关系型数据库中及将用户社交网络信息存储MongoDB的图关系数据库中。可以理解,Sqlserver或Mysql或MongoDB数据库只是其中的一种优选方式,而实际中还可以采用其他的数据库。
步骤S240:根据用户发送的微博数据获取用户的性格和情绪;
请参阅图6,根据用户发送的微博数据获取用户的性格和情绪,包括下述步骤:
步骤S241:数学抽象为一个N维的向量空间,并且每个向量对应性格/情绪基本要素,其中性格基本要素为:内倾、外倾、稳定、不稳定,情绪基本要素为:喜悦、愤怒、悲伤、恐惧、厌恶、惊奇,所述N维的向量空间为Q=[x1、x2、……];
步骤S242:对所述微博数据进行分词,获取语义要素,定义为C=[c1、c2、……];
步骤S243:建立函数映射关系,Q=f(C),其中,Q是性格/情绪基本和要素的集合,C是微博数据分词后得到的语义要素集合,f是对应的映射函数;
步骤S244:从所述微博上搜集微博数据C,邀请具有心理咨询经验的专业人士阅读微博,判定每项基本要素的得分,从而得到性格/情绪基本要素Q,构成训练数据集;
步骤S245:利用神经网络算法对于训练数据集进行学习得到拟合模型,然后根据得到的模型预测用户性格/情绪。
步骤S250:对用户的好友聚类分析,获取所述用户的好友圈,所述好友圈包括密友圈子、好友圈子及最大传播影响力好友;
请参阅图7,对用户的好友聚类分析,获取所述用户的好友圈,包括下述步骤:
步骤S251:将用户的好友表示为一系列特征向量的集合,所述集合包括区域、年龄、性别、职业、喜欢的视频类型及观看过的视频列表;
步骤S252:计算好友向量之间的距离来表征好友与好友之间的相似度,并依据相似度采用聚类算法KMeans将用户的好友自动聚类为若干类型;
步骤S253:选取相似度较高的前20位好友构成其密友圈子;
步骤S254:依据用户好友的微博发送数量和转发数量来计算用户好友的传播影响力,所述计算公式为P=0.2S+0.8F,其中P是好友的传播影响力,S是微博发送数量,F是微博被转发的次数。可以理解,依据其好友的传播影响力来决定其在分析推荐模块中所占的比重,影响力越大的好友在分析推荐模块中占的比重越大。
步骤S260:根据所述用户的性格、情绪和好友圈,选取所述用户喜好的视频;
根据所述用户的性格、情绪和好友圈,选取所述用户喜好的视频的步骤流程图,包括下述步骤:
步骤S261:根据用户的性格和情绪选取用户喜好的视频电影;:
请参阅图8,根据用户的性格和情绪选取用户喜好的视频电影,包括下述步骤:
步骤S2611:将每部电影用区域、年代、主演、类型四个属性来描述;
步骤S2612:根据用户的性格和情绪获取该用户对于具有某个属性的电影的偏好程度,并赋予权值;
步骤S2613:对于任意一部电影,所述用户对应于所述电影属性的偏好程度进行加和,得到所述用户对所述电影的喜好程度;
步骤S2614:对所有电影进行计算,并选取喜好程度最大的10部电影推荐给用户。
可以理解,选取10部电影推荐给用户只是其中优选的一种方式,实际中还可以选取其他的电影数量给用户。
步骤S262:根据用户的好友圈选取用户喜好的视频电影。
请参阅图9,根据用户的好友圈选取用户喜好的视频电影,包括下述步骤:
步骤S2621:计算用户好友圈中各位好友共同观看较多的视频,提取前10个电影作为推荐结果;
步骤S2622:找到用户的密友圈子中共同观看较多的视频,提取前10个电影作为推荐结果;
步骤S2623:根据用户好友的传播影响力,提取出前10个电影作为推荐结果。
步骤S270:用于向用户显示选取的视频。
可以理解,通过上述步骤S210~S270可以实现对用户的视频推荐。上述视频推荐的方法还可以包括下述步骤:
对所述视频推荐模块根据好友圈选取的视频赋予权值,并根据所述权值进行排序生成推荐列表。具体地,分别对于密友圈子得出的推荐结果、传播影响力最大的好友的推荐结果及普通圈子的推荐结果赋予权值;计算所有出现在推荐结果中的电影的权值之和;并根据所述权值进行排序生成推荐列表,作为最终推荐结果。a)对于密友圈子得出的推荐结果赋予权值1,对于影响力较大的好友得出的推荐结果赋予权值1.5,对于普通圈子得出的推荐结果赋予权值0.8;再计算所有出现在推荐结果中的电影的权值之和;排序后选择出圈子最大的前20部视频,作为最终推荐结果。
本发明提供的视频推荐***和方法,通过信息获取模块获取包括用户个人信息、用户社交网络信息及视频类别信息的多源数据,由数据预处理模块对所述多源数据进行预处理,再经数据存储模块构建的用户数据库存储经预处理后的多源数据,再通过用户特点分析模块根据用户发送的微博数据获取用户的性格和情绪和社交网络分析模块对用户的好友聚类分析,获取所述用户的好友圈,视频推荐模块根据所述用户的性格、情绪和好友圈,选取所述用户喜好的视频并通过前端显示模块向所述用户显示选取的视频。
可以理解的是,对于本领域的普通技术人员来说,可以根据本发明的技术构思做出其他各种相应的改变与变形,而所有这些改变与变形都应属于本发明权利要求的保护范围。
Claims (15)
1.一种视频推荐***,其特征在于,包括:
信息获取模块,用于获取包括用户个人信息、用户社交网络信息及视频类别信息的多源数据,所述用户个人信息包括年龄、性别、职业、国籍、所在地区、喜欢的视频类型、观看过的视频列表,所述用户社交网络信息包括用户的好友信息、用户推送的微博内容以及发送微博的时间和地点、用户观看过的视频列表、用户的视频打分信息,所述视频类别信息包括名称、导演、年代、类型、视频评分和视频标签;
数据预处理模块,用于对所述多源数据进行预处理,所述数据预处理模块包括:数据清洗子模块,用于剔除所述多源数据中不完整的数据,数据规约子模块,用于将来自不同平台的多源数据的格式进行统一,及数据集成子模块,用于将规约后的来自不同数据库的数据集成到相同的数据库中;
数据存储模块,构建用户数据库,并将经预处理后的多源数据存储于所述数据库中;
用户特点分析模块,用于根据用户发送的微博数据获取用户的性格和情绪;
社交网络分析模块,用于对用户的好友聚类分析,获取所述用户的好友圈;
视频推荐模块,用于根据所述用户的性格、情绪和好友圈,选取所述用户喜好的视频;及
前端显示模块,用于向所述用户显示选取的视频;
所述社交网络分析模块针对用户社交网络数据进行分析,包括:
将用户的好友表示为一系列特征向量的集合,所述集合包括区域、年龄、性别、职业、喜欢的视频类型及观看过的视频列表;计算好友与好友之间的相似度,并且依据相似度将用户的好友分为若干类型;
计算用户与其好友的亲密程度,获取其密友圈子;
依据用户好友的微博发送数量和转发数量来计算用户的传播影响力:P=0.2S+0.8F,其中P是好友的传播影响力,S是微博发送数量,F是微博被转发的次数。
2.根据权利要求1所述的视频推荐***,其特征在于,所述信息获取模块包括:
用户个人信息获取子模块,通过网页版的用户注册模块,获取用户的个人信息;
社交网络信息获取子模块,通过交流平台获取用户社交网络信息;及
视频类别信息获取子模块,通过视频网站获取视频类别信息。
3.根据权利要求1所述的视频推荐***,其特征在于,所述数据存储模块用于将所述用户个人信息存储到Sqlserver或Mysql的关系型数据库中及将用户社交网络信息存储MongoDB的图关系数据库中。
4.根据权利要求1所述的视频推荐***,其特征在于,所述用户特点分析模块包括:
用户性格分析子模块,用于根据用户以往发送的微博数据分析用户的性格;及
用户情绪分析子模块,用于根据用户以往发送的微博数据分析用户的情绪。
5.根据权利要求1所述的视频推荐***,其特征在于,所述视频推荐模块包括:
用户个人信息推荐模块,用于根据用户的性格和情绪选取用户喜好的视频电影;及
社交网络信息推荐模块,用于根据用户的好友圈选取用户喜好的视频电影。
6.根据权利要求1所述的视频推荐***,其特征在于,还包括用户信息实时捕捉模块,用于实时获取用户的社交网络信息,并存入所述数据库中。
7.根据权利要求1所述的视频推荐***,其特征在于,还包括结果优化模块,用于对所述视频推荐模块根据好友圈选取的视频赋予权值,并根据所述权值进行排序生成推荐列表。
8.根据权利要求7所述的视频推荐***,其特征在于,所述前端显示模块包括网页形式、电视终端或手机终端。
9.一种视频推荐方法,其特征在于,包括下述步骤:
获取包括用户个人信息、用户社交网络信息及视频类别信息的多源数据,所述用户个人信息包括年龄、性别、职业、国籍、所在地区、喜欢的视频类型、观看过的视频列表,所述用户社交网络信息包括用户的好友信息、用户推送的微博内容以及发送微博的时间和地点、用户观看过的视频列表、用户的视频打分信息,所述视频类别信息包括名称、导演、年代、类型、视频评分和视频标签;
对所述多源数据进行预处理,包括:提出所述多源数据中不完整的数据,将来自不同平台的多源数据的格式进行统一,将规约后的来自不同数据库的数据集成到相同的数据库中;
构建用户数据库,并将经预处理后的多源数据存储于所述数据库中;
根据用户发送的微博数据获取用户的性格和情绪;
对用户的好友聚类分析,获取所述用户的好友圈,所述好友圈包括密友圈子、好友圈子及最大传播影响力好友;
根据所述用户的性格、情绪和好友圈,选取所述用户喜好的视频;及
用于向所述用户显示选取的视频;
对用户的好友聚类分析,获取所述用户的好友圈,包括下述步骤:
将用户的好友表示为一系列特征向量的集合,所述集合包括区域、年龄、性别、职业、喜欢的视频类型及观看过的视频列表;
计算好友向量之间的距离来表征好友与好友之间的相似度,并依据相似度采用聚类算法KMeans将用户的好友自动聚类为若干类型;
选取相似度较高的前20位好友构成其密友圈子;
依据用户好友的微博发送数量和转发数量来计算用户好友的传播影响力,所述计算公式为P=0.2S+0.8F,其中P是好友的传播影响力,S是微博发送数量,F是微博被转发的次数。
10.根据权利要求9所述的视频推荐方法,其特征在于,根据用户发送的微博数据获取用户的性格和情绪,包括下述步骤:
数学抽象为一个N维的向量空间,并且每个向量对应性格/情绪基本要素,其中性格基本要素为:内倾、外倾、稳定、不稳定,情绪基本要素为:喜悦、愤怒、悲伤、恐惧、厌恶、惊奇,所述N维的向量空间记为Q=[x1、x2、……];
对所述微博数据进行分词,获取语义要素,定义为C=[c1、c2、……];
建立函数映射关系,Q=f(C),其中,Q是性格/情绪基本要素的集合,C是微博数据分词后得到的语义要素集合,f是对应的映射函数;
从所述微博上搜集微博数据C,判定每项基本要素的得分,从而得到性格/情绪基本要素Q,构成训练数据集;
利用神经网络算法对于训练数据集进行学习得到拟合模型,然后根据得到的模型预测用户性格/情绪。
11.根据权利要求9所述的视频推荐方法,其特征在于,根据所述用户的性格、情绪和好友圈,选取所述用户喜好的视频,包括下述步骤:
根据用户的性格和情绪选取用户喜好的视频电影;及
根据用户的好友圈选取用户喜好的视频电影。
12.根据权利要求11所述的视频推荐方法,其特征在于,根据用户的性格和情绪选取用户喜好的视频电影,包括下述步骤:
将每部电影用区域、年代、主演、类型四个属性来描述;
根据用户的性格和情绪获取该用户对于具有某个属性的电影的偏好程度,并赋予权值;
对于任意一部电影,所述用户对应于所述电影属性的偏好程度进行加和,得到所述用户对所述电影的喜好程度;
对所有电影进行计算,并选取喜好程度最大的10部电影推荐给用户。
13.根据权利要求11所述的视频推荐方法,其特征在于,根据用户的好友圈选取用户喜好的视频电影,包括下述步骤:
计算用户好友圈中各位好友共同观看较多的视频,提取前10个电影作为推荐结果;
找到用户的密友圈子中共同观看较多的视频,提取前10个电影作为推荐结果;
根据用户好友的传播影响力,提取出前10个电影作为推荐结果。
14.根据权利要求9所述的视频推荐方法,其特征在于,还包括下述步骤:对所述视频推荐模块根据好友圈选取的视频赋予权值,并根据所述权值进行排序生成推荐列表。
15.根据权利要求14所述的视频推荐方法,其特征在于,对所述视频推荐模块根据好友圈选取的视频赋予权值,并根据所述权值进行排序生成推荐列表,包括下述步骤:
分别对于密友圈子得出的推荐结果、传播影响力最大的好友的推荐结果及普通圈子的推荐结果赋予权值;
计算所有出现在推荐结果中的电影的权值之和;
并根据所述权值进行排序生成推荐列表,作为最终推荐结果。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201310684807.7A CN103714130B (zh) | 2013-12-12 | 2013-12-12 | 视频推荐***及方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201310684807.7A CN103714130B (zh) | 2013-12-12 | 2013-12-12 | 视频推荐***及方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN103714130A CN103714130A (zh) | 2014-04-09 |
CN103714130B true CN103714130B (zh) | 2017-08-22 |
Family
ID=50407105
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201310684807.7A Active CN103714130B (zh) | 2013-12-12 | 2013-12-12 | 视频推荐***及方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN103714130B (zh) |
Families Citing this family (49)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN105224576A (zh) * | 2014-07-01 | 2016-01-06 | 上海视畅信息科技有限公司 | 一种影视智能推荐方法 |
CN106156030A (zh) | 2014-09-18 | 2016-11-23 | 华为技术有限公司 | 社交网络中预测信息传播的方法及设备 |
CN105824818A (zh) * | 2015-01-04 | 2016-08-03 | ***通信集团河北有限公司 | 一种信息化管理方法、平台及*** |
CN106034256B (zh) * | 2015-03-10 | 2019-11-05 | 腾讯科技(北京)有限公司 | 视频社交方法及装置 |
CN104765778A (zh) * | 2015-03-18 | 2015-07-08 | 百度在线网络技术(北京)有限公司 | 一种基于用户行为来提供待发送信息的方法及装置 |
CN104834969A (zh) * | 2015-05-05 | 2015-08-12 | 东南大学 | 一种电影评价预测方法及其*** |
CN106202103A (zh) * | 2015-05-06 | 2016-12-07 | 阿里巴巴集团控股有限公司 | 音乐推荐方法和装置 |
WO2016187768A1 (zh) * | 2015-05-25 | 2016-12-01 | 武克易 | 一种视频信息推送方法及装置 |
CN106339146A (zh) * | 2015-07-09 | 2017-01-18 | 华为终端(东莞)有限公司 | 一种推荐应用的方法及装置 |
CN105138551A (zh) * | 2015-07-14 | 2015-12-09 | 青岛海信传媒网络技术有限公司 | 一种获取用户兴趣标签的方法及装置 |
CN105022699B (zh) * | 2015-07-14 | 2018-04-24 | 惠龙易通国际物流股份有限公司 | 缓存区数据的预处理方法及*** |
CN105095516B (zh) * | 2015-09-16 | 2019-02-15 | 中国传媒大学 | 基于谱聚类集成的广播电视用户分群***及方法 |
CN105915954A (zh) * | 2015-10-30 | 2016-08-31 | 乐视移动智能信息技术(北京)有限公司 | 一种基于手机屏幕的视频推荐方法和*** |
CN105915957A (zh) * | 2015-12-15 | 2016-08-31 | 乐视致新电子科技(天津)有限公司 | 智能电视展示播放内容的方法、装置及*** |
US10824941B2 (en) * | 2015-12-23 | 2020-11-03 | The Toronto-Dominion Bank | End-to-end deep collaborative filtering |
CN106528584B (zh) * | 2016-02-15 | 2019-10-29 | 中山大学 | 一种基于组合学习的群组推荐方法 |
CN105740473B (zh) * | 2016-03-14 | 2021-03-02 | 腾讯科技(深圳)有限公司 | 用户生成内容展示方法和装置 |
CN105704231B (zh) * | 2016-03-17 | 2019-04-30 | 珠海格力电器股份有限公司 | 网络播放资源的信息推送方法和装置 |
CN105930425A (zh) * | 2016-04-18 | 2016-09-07 | 乐视控股(北京)有限公司 | 个性化视频推荐方法及装置 |
CN105930532B (zh) * | 2016-06-16 | 2019-08-02 | 上海聚力传媒技术有限公司 | 一种向用户推荐多媒体资源的方法和装置 |
CN106131684A (zh) * | 2016-06-24 | 2016-11-16 | 依偎科技(南昌)有限公司 | 一种内容推荐方法及终端 |
CN106201184A (zh) * | 2016-06-29 | 2016-12-07 | 腾讯科技(深圳)有限公司 | 一种sns消息的编辑方法、装置和终端 |
CN106202252A (zh) * | 2016-06-29 | 2016-12-07 | 厦门趣处网络科技有限公司 | 一种基于用户情绪分析的出行推荐方法、*** |
CN107896510A (zh) * | 2016-08-01 | 2018-04-10 | 邻客音公司 | 社交网络中与朋友的帖子混合的质量行业内容 |
CN106202570A (zh) * | 2016-08-11 | 2016-12-07 | 乐视控股(北京)有限公司 | 一种用户信息获取方法及装置 |
CN106649655A (zh) * | 2016-12-13 | 2017-05-10 | 宁夏宁信信息科技有限公司 | 视频app中个性化推荐方法及*** |
CN106909907A (zh) * | 2017-03-07 | 2017-06-30 | 佛山市融信通企业咨询服务有限公司 | 一种视频通讯情感分析辅助*** |
US10521482B2 (en) | 2017-04-24 | 2019-12-31 | Microsoft Technology Licensing, Llc | Finding members with similar data attributes of a user for recommending new social connections |
CN108959323B (zh) * | 2017-05-25 | 2021-12-07 | 腾讯科技(深圳)有限公司 | 视频分类方法和装置 |
CN107918652B (zh) * | 2017-11-15 | 2020-10-02 | 浙江大学 | 一种利用多模态网络学习进行基于社交关系的电影推荐的方法 |
CN107948732B (zh) * | 2017-12-04 | 2020-12-01 | 京东方科技集团股份有限公司 | 视频的播放方法、视频播放装置及*** |
CN108632671A (zh) * | 2018-03-29 | 2018-10-09 | 北京恒信彩虹信息技术有限公司 | 一种推荐方法及*** |
CN108681601B (zh) * | 2018-05-21 | 2020-12-11 | 北京奇艺世纪科技有限公司 | 一种视频分享的方法、装置及电子设备 |
CN108848152B (zh) * | 2018-06-05 | 2021-09-21 | 腾讯科技(深圳)有限公司 | 一种对象推荐的方法及服务器 |
CN109002490B (zh) * | 2018-06-26 | 2020-09-04 | 腾讯科技(北京)有限公司 | 用户画像生成方法、装置、服务器及存储介质 |
CN109104620B (zh) * | 2018-07-26 | 2020-05-19 | 腾讯科技(深圳)有限公司 | 一种短视频推荐方法、装置和可读介质 |
CN109245989A (zh) * | 2018-08-15 | 2019-01-18 | 咪咕动漫有限公司 | 一种基于信息分享的处理方法、装置及计算机可读存储介质 |
CN109698820A (zh) * | 2018-09-03 | 2019-04-30 | 长安通信科技有限责任公司 | 一种域名相似性计算及分类方法和*** |
CN109783686A (zh) * | 2019-01-21 | 2019-05-21 | 广州虎牙信息科技有限公司 | 行为数据处理方法、装置、终端设备和存储介质 |
CN109902753B (zh) * | 2019-03-06 | 2023-01-13 | 深圳市珍爱捷云信息技术有限公司 | 用户推荐模型训练方法、装置、计算机设备和存储介质 |
CN109933700A (zh) * | 2019-03-07 | 2019-06-25 | 王芃翰 | 基于大数据的学生阅读建议生成方法及相关设备 |
CN110096613B (zh) * | 2019-04-12 | 2021-07-20 | 北京奇艺世纪科技有限公司 | 一种视频推荐方法、装置、电子设备及存储介质 |
CN110647678B (zh) * | 2019-09-02 | 2022-11-15 | 杭州数理大数据技术有限公司 | 一种基于用户性格标签的推荐方法 |
CN110837598B (zh) * | 2019-11-11 | 2021-03-19 | 腾讯科技(深圳)有限公司 | 信息推荐方法、装置、设备及存储介质 |
CN111859102A (zh) * | 2020-02-17 | 2020-10-30 | 北京嘀嘀无限科技发展有限公司 | 一种提示信息确定方法、***、介质及存储介质 |
CN111680224A (zh) * | 2020-04-22 | 2020-09-18 | 威比网络科技(上海)有限公司 | 跨平台课程推送方法、装置、电子设备、存储介质 |
CN112365447B (zh) * | 2020-10-20 | 2022-08-19 | 四川长虹电器股份有限公司 | 一种多维度影视评分方法 |
CN113239041A (zh) * | 2021-05-13 | 2021-08-10 | 大连交通大学 | 一种计算机大数据处理的采集***及方法 |
CN116739814B (zh) * | 2023-04-23 | 2024-05-14 | 广州市疾病预防控制中心(广州市卫生检验中心、广州市食品安全风险监测与评估中心、广州医科大学公共卫生研究院) | 一种预防疾病传播的方法及社交平台 |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN102184235A (zh) * | 2011-05-13 | 2011-09-14 | 广州星海传媒有限公司 | 一种基于机顶盒的数字电视节目推荐方法及*** |
CN103327045A (zh) * | 2012-03-21 | 2013-09-25 | 腾讯科技(深圳)有限公司 | 社交网络中的用户推荐方法和*** |
CN103327400A (zh) * | 2012-03-22 | 2013-09-25 | 鸿富锦精密工业(深圳)有限公司 | 用户端设备及其创建社交视频频道的方法 |
Family Cites Families (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US8433670B2 (en) * | 2011-03-03 | 2013-04-30 | Xerox Corporation | System and method for recommending items in multi-relational environments |
CN102571978A (zh) * | 2012-02-10 | 2012-07-11 | 上海视畅信息科技有限公司 | 一种智能化视频观看*** |
-
2013
- 2013-12-12 CN CN201310684807.7A patent/CN103714130B/zh active Active
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN102184235A (zh) * | 2011-05-13 | 2011-09-14 | 广州星海传媒有限公司 | 一种基于机顶盒的数字电视节目推荐方法及*** |
CN103327045A (zh) * | 2012-03-21 | 2013-09-25 | 腾讯科技(深圳)有限公司 | 社交网络中的用户推荐方法和*** |
CN103327400A (zh) * | 2012-03-22 | 2013-09-25 | 鸿富锦精密工业(深圳)有限公司 | 用户端设备及其创建社交视频频道的方法 |
Also Published As
Publication number | Publication date |
---|---|
CN103714130A (zh) | 2014-04-09 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN103714130B (zh) | 视频推荐***及方法 | |
CN108959603B (zh) | 基于深度神经网络的个性化推荐***及方法 | |
CN110162706B (zh) | 一种基于交互数据聚类的个性化推荐方法及*** | |
Vargas-Govea et al. | Effects of relevant contextual features in the performance of a restaurant recommender system | |
CN104866474B (zh) | 个性化数据搜索方法及装置 | |
CN105426528B (zh) | 一种商品数据的检索排序方法及*** | |
WO2018041168A1 (zh) | 信息推送方法、存储介质和服务器 | |
Cufoglu | User profiling-a short review | |
KR101579376B1 (ko) | 주관성 분석을 이용한 사용자 분류와 그에 따른 개인화된 장소 추천 시스템 및 방법 | |
KR102227552B1 (ko) | 상황인지 알고리즘 기반 리뷰 카테고리를 이용한 음식점 노출 개인화 서비스 제공 시스템 | |
US20140288999A1 (en) | Social character recognition (scr) system | |
US20150160847A1 (en) | System and method for searching through a graphic user interface | |
CN111949887A (zh) | 物品推荐方法、装置及计算机可读存储介质 | |
CN110737834A (zh) | 业务对象的推荐方法、装置、存储介质和计算机设备 | |
CN112380451A (zh) | 一种基于大数据的喜好内容推荐方法 | |
CN115408618B (zh) | 一种基于社交关系融合位置动态流行度和地理特征的兴趣点推荐方法 | |
CN115878903B (zh) | 基于大数据的信息智能推荐方法 | |
Lee et al. | A hybrid collaborative filtering-based product recommender system using search keywords | |
CN113326432A (zh) | 一种基于决策树与推荐方法的模型优选方法 | |
CN106708871A (zh) | 一种社交业务特征用户的识别方法和装置 | |
CN115712780A (zh) | 一种基于云计算和大数据的信息推送方法及装置 | |
Ashraf et al. | Personalized news recommendation based on multi-agent framework using social media preferences | |
CN117670439A (zh) | 一种基于用户画像的餐饮推荐方法及*** | |
CN110083766B (zh) | 一种基于元路径引导嵌入的查询推荐方法及装置 | |
Won et al. | A hybrid collaborative filtering model using customer search keyword data for product recommendation |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |