CN112784172B - 一种在线的群组电影推荐方法 - Google Patents

一种在线的群组电影推荐方法 Download PDF

Info

Publication number
CN112784172B
CN112784172B CN202110092664.5A CN202110092664A CN112784172B CN 112784172 B CN112784172 B CN 112784172B CN 202110092664 A CN202110092664 A CN 202110092664A CN 112784172 B CN112784172 B CN 112784172B
Authority
CN
China
Prior art keywords
movie
audience
group
type
sampling
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202110092664.5A
Other languages
English (en)
Other versions
CN112784172A (zh
Inventor
徐建
李维
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Hangzhou Dianzi University
Original Assignee
Hangzhou Dianzi University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Hangzhou Dianzi University filed Critical Hangzhou Dianzi University
Priority to CN202110092664.5A priority Critical patent/CN112784172B/zh
Publication of CN112784172A publication Critical patent/CN112784172A/zh
Application granted granted Critical
Publication of CN112784172B publication Critical patent/CN112784172B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/953Querying, e.g. by the use of web search engines
    • G06F16/9536Search customisation based on social or collaborative filtering
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/70Information retrieval; Database structures therefor; File system structures therefor of video data
    • G06F16/73Querying
    • G06F16/735Filtering based on additional data, e.g. user or group profiles
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F17/00Digital computing or data processing equipment or methods, specially adapted for specific functions
    • G06F17/10Complex mathematical operations
    • G06F17/16Matrix or vector computation, e.g. matrix-matrix or matrix-vector multiplication, matrix factorization
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F17/00Digital computing or data processing equipment or methods, specially adapted for specific functions
    • G06F17/10Complex mathematical operations
    • G06F17/18Complex mathematical operations for evaluating statistical data, e.g. average values, frequency distributions, probability functions, regression analysis

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • Databases & Information Systems (AREA)
  • Mathematical Physics (AREA)
  • Computational Mathematics (AREA)
  • Mathematical Analysis (AREA)
  • Mathematical Optimization (AREA)
  • Pure & Applied Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • Software Systems (AREA)
  • Algebra (AREA)
  • Computing Systems (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Evolutionary Biology (AREA)
  • Operations Research (AREA)
  • Probability & Statistics with Applications (AREA)
  • Computational Linguistics (AREA)
  • Multimedia (AREA)
  • Two-Way Televisions, Distribution Of Moving Picture Or The Like (AREA)

Abstract

本发明公开了一种在线的群组电影推荐方法,包括如下步骤:步骤1、计算电影类型的社会影响力;步骤2、统计群组成员对电影类型熟悉程度;步骤3、计算群组成员对于某种电影类型的话语权;步骤4、融合群组成员的偏好;步骤5、电影推荐。本发明通过上述基于采样的电影类型社会影响力计算方法,简化了计算,反映了电影流行趋势;使用观众偏好融合方法对不同观众权重进行了考虑,进而获得合理的群组偏好。本方法能够考虑群组内部和群组外部对观众偏好融合影响,从而保证了推荐的有效性。

Description

一种在线的群组电影推荐方法
技术领域
本发明属于计算机应用技术领域,涉及一种基于偏好融合的电影群组,即多个具有相似特征的观众)推荐方法,当向群组所推荐的电影具有明确的题材或类别信息时,使用本方法能取得良好效果。
背景技术
在日常生活中,随着智能手机的普及,移动社交服务平台如雨后春笋般不断涌现,极大地丰富了人们的日常生活。这些平台的出现扩大了人们的社交半径,为集体活动的组织和举办提供了便捷。为了向观众构成的群组推荐让群组成员尽可能都满意的项目,群组推荐***应运而生。群组推荐***相较于传统推荐***而言,引入了群组的概念。之所以说群组推荐***的设计更具挑战性,主要是因为群组偏好的获取是十分困难的,因此用于获取群组偏好的偏好融合方法成为了群组推荐***的核心部分。因此,使用改进的观众偏好融合方法对群组推荐***性能的提升有着现实的意义。
给定全体观众集合U,全体电影集合V,全体群组集合G,全体电影类型集合C,观众-电影交互矩阵R,以及电影-类型交互矩阵T。其中,U={u1,u2,...,uk},k为观众总数,在本发明中,k值动态变化;V={v1,v2,...,vn},n为电影总数;G={G1,G2,...,Gs},s为群组总数;C={c1,c2,...,cl},l为类型总数;矩阵R中元素是观众对电影的评分,设置评分的值为1到5之间的整数;矩阵T中元素的值为0或1,为0表示项目不包含该类型,为1表示包含该类型。观众偏好融合的目标是将群组成员对电影的评分进行融合得到群组对项目的评分。
大多数现存的观众偏好融合方法是根据观众评分的数据特征来进行偏好融合的,偏好融合时观众权重的合理性和可解释性被忽视,所获取的群组偏好的准确性将无法保证,成为群组推荐***性能的瓶颈。而且在线电影推荐过程中集合U中的观众动态发生变化,给权重计算进一步增加了困难。
发明内容
本发明的目的是在于克服现有技术中的不足,在观众动态变化过程中采用采样的方法在保证电影类型权重计算精确度的条件下,减小计算复杂度;同时考虑观众在不同领域认知的差异以及群组内部成员之间的相互影响,提出了一种基于电影类型的观众偏好融合方法,使电影推荐过程更加客观、符合群组实际需要。具体技术方案如下:
一种在线的群组电影推荐方法,包括如下步骤:
步骤1、计算电影类型的社会影响力;
步骤2、统计群组成员对电影类型熟悉程度;
步骤3、计算群组成员对于某种电影类型的话语权;
步骤4、融合群组成员的偏好;
步骤5、电影推荐。
进一步的,所述步骤1由以下步骤组成:
步骤1-1、动态样本库维护
采用采样池采样的方法,对观众群体进行抽样;
假设采样池的大小,也就是样本数为M;针对观众集合U中观众序列,对采样池进行以下操作:
若采样池中观众数量小于M:则将该名观众放入采样池,并且设置进入蓄水池时间;
若采样池已满,也即蓄水池中观众数量已经为M时:
第一步、针对观众序列中的第i-j名观众,顺序号i为当前观众序号,j为8周前一天0时数据库中的最大序号,若(i-j)>=M,在[0,(i-j)]范围内取一个随机整数d,若d小于M,则用接收到的这个观众替换采样池中的第d个观众;
第二步:在每天开始时候,清理进入采样池超过8周都没有观影记录的样本观众。
重复第一步,直至没有新增观众。
步骤1-2电影类型影响力计算
访问采样池中观众的观影记录,计算各种类型电影的社会影响力,即统计电影类型C={c1,c2,...,cl}中所有类型电影的观影人数,除以M得到该种类型电影的社会影响力e。
进一步的,所述步骤2具体包括:
根据观众-电影交互矩阵和电影-类型交互矩阵确定观众对电影类型的熟悉程度;
假设数据集中所有电影的类型属于19种类型中的一种或多种,对于每一个电影项目,可以得到一个维度为19的类型向量,用这个类型向量来表示每一部电影的类型信息;
所有电影的类型向量构成的矩阵为T=(t1 T,t2 T,...,tn T)T,其中n表示电影总数;根据观众的观影记录和电影的类型向量,确定观众和电影类型之间的关系;对于观众ui,其计数向量wui用已观看电影的类型向量的累加和来表示,具体可用如下公式计算:
Figure BDA0002911528550000031
其中,Vu是观众ui已观看电影的集合;群组Gi中所有成员的计数向量构成的矩阵为:
Figure BDA0002911528550000032
其中,m为群组Gi中成员的数量。
进一步的,所述步骤3包括如下步骤:
步骤3-1、群组成员话语权计算
计算在群组Gi中群组成员对于某种电影类型k的话语权,观众权重通过下列公式计算得到;
Figure BDA0002911528550000033
其中Wu,k表示某个群组成员在步骤2中所得矩阵WGi中u行,k列的值,也即某个观众观看某种类型电影的数量;
步骤3-2、计算群组成员的权重方差,并调整成员权重;
群组Gi的成员权重方差可以被定义为:
Figure BDA0002911528550000034
其中,m表示群组Gi中成员总数,
Figure BDA0002911528550000035
是群组成员对于电影类型k的平均权重;
对观众权重设置阈值L;首先,在群组Gi中得到平均转移权重
Figure BDA0002911528550000036
平均转移权重的计算过程是将群组内小于阈值的观众权重求和然后除以权重大于阈值的观众数;具体计算公式如下:
Figure BDA0002911528550000041
其中,Si是群组Gi的子集,而且Si中的成员权重都低于阈值L;调整观众权重如下:
Figure BDA0002911528550000042
当权重方差低于阈值t时,认为群组成员对于该电影类型的熟悉程度比较均匀,此时群组成员的相互影响很小。
进一步的,所述步骤4包括如下步骤:
步骤4-1仅考虑电影的一种类型时,融合群组成员的偏好;
群组对于电影j的评分能通过下列公式计算得到:
Figure BDA0002911528550000043
其中,ru,j是观众u对电影j的评分,Cj是电影j包含的类型构成的集合,ek是电影类型的社会影响力,α和β分别控制群组内部和群组外部对观众偏好融合影响的程度;
4-2考虑电影j包含的所有类型时,群组对电影j的评分,即群组偏好,计算公式如下:
Figure BDA0002911528550000044
进一步的,所述步骤5具体如下:根据当前影院上映电影的类型,选取历史数据库中某部相同类型的电影,根据步骤4计算得到等待推荐群组的偏好,选择当前播放电影中满足该偏好的影片进行推荐。
本发明的有益效果:
本发明通过上述基于采样的电影类型社会影响力计算方法,简化了计算,反映了电影流行趋势;使用观众偏好融合方法对不同观众权重进行了考虑,进而获得合理的群组偏好。本方法能够考虑群组内部和群组外部对观众偏好融合影响,从而保证了推荐的有效性。
附图说明
图1是本发明的流程图。
图2是步骤1计算结果示意图:
图中影响力表示该种类型电影当前影响力。
图3是步骤2计算结果示意图:
图中显示了某一个群组的成员a、b、c对电影类型熟悉程度统计结果。
图4是步骤3计算结果示意图:
图中显示该群组成员对于奇幻电影的权重方差超过了0.1,但是群组中无权重小于阈值L(0.5)可供转移的观众,因此不需要进行权重转移计算。
图5显示了某一个群组的成员a、b、c对一部电影的评分。
具体实施方式
下面结合附图对本发明作进一步说明。
本发明的在线的群组电影推荐方法,具体步骤如下:
步骤1、计算电影类型的社会影响力;
步骤2、统计群组成员对电影类型熟悉程度;
步骤3、计算群组成员对于某种电影类型的话语权;
步骤4、融合群组成员的偏好;
步骤5、电影推荐。
具体的,步骤1计算电影类型的社会影响力由以下步骤组成:
电影类型的社会影响力可以理解为当前的流行趋势。由于观众人数过多,并且动态变化,为了减少计算量,通过随机采取总体观众样本的部分观众,对抽取观众的观影记录及相应电影类型进行统计计数,得到电影类型的社会影响力e,用于后续观众偏好融合的计算。
1-1动态样本库维护
由于在线推荐电影中观众观影记录动态变化,本步骤采用采样池采样的方法,对观众群体进行抽样,减小电影类型社会影响力的计算工作量。
假设采样池的大小,也就是样本数为M。针对观众集合U中观众序列,对采样池进行以下操作:
如果采样池中观众数量小于M:则将该名观众放入采样池,并且设置进入蓄水池时间。
第一步:当对采样池已满,也即蓄水池中观众数量已经为M时:
第二步:针对观众序列中的第i-j名观众(顺序号i为当前观众序号,j为56天(8周)前一天0时数据库中的最大序号),有(i-j)>=M,在[0,(i-j)]范围内取一个随机整数d,若d小于M,则用接收到的这个观众替换采样池中的第d个观众。
第三步:在每天开始时候,清理进入采样池超过8周都没有观影记录的样本观众。
重复第二步,直至没有新增观众。
1-2电影类型影响力计算
访问采样池中观众的观影记录,计算各种类型电影的社会影响力,即统计电影类型C={c1,c2,...,cl}中所有类型电影的观影人数,除以M得到该种类型电影的社会影响力e。
具体的,步骤2群组成员对电影类型熟悉程度统计过程如下:
根据观众-电影交互矩阵和电影-类型交互矩阵确定观众对电影类型的熟悉程度。
假设一个数据集中所有电影的类型属于19种类型中的一种或多种。因此对于每一个电影项目,可以得到一个维度为19的类型向量,用这个类型向量来表示每一部电影的类型信息。例如,电影《GoldenEye》是动作、冒险、恐怖类型,那么它的类型向量为
t=(1,0,0,1,1,0,0,0,0,0,0,0,0,0,0,0,0,0,0)T
于是所有电影的类型向量构成的矩阵为T=(t1 T,t2 T,...,tn T)T,其中n表示电影总数。根据观众的观影记录和电影的类型向量,能确定观众和电影类型之间的关系,并使用计数向量来表示这种关系。对于观众ui,其计数向量wui可用已观看电影的类型向量的累加和来表示,具体可用如下公式计算:
Figure BDA0002911528550000061
其中,Vu是观众ui已观看电影的集合。于是,群组Gi中所有成员的计数向量构成的矩阵为:
Figure BDA0002911528550000071
其中,m为群组Gi中成员的数量。
计数向量反映了观众对电影类型的熟悉程度,计数向量构成的计数矩阵被用来确定观众在偏好融合过程中的决策权重。因为电影一般有多种类型,所以群组成员的决策权重会随着电影类型的改变而改变。
具体的,步骤3群组成员对于某种电影类型的话语权计算过程有以下步骤组成:
3-1群组成员话语权计算
计算在群组Gi中群组成员对于某种电影类型k的话语权,观众权重能通过下列公式计算得到;
Figure BDA0002911528550000072
其中Wu,k表示某个群组成员在步骤2中所得矩阵WGi中u行,k列的值,也即某个观众观看某种类型电影的数量。
3-2计算群组成员的权重方差,并调整成员权重;
考虑到观众会受到群组中其他成员的影响,观众权重应进行适当调整,为了将这种合理假设引入到偏好融合方法中,以群组成员的权重方差为切入点进行合理优化。群组Gi的成员权重方差可以被定义为:
Figure BDA0002911528550000073
其中,m表示群组Gi中成员总数,
Figure BDA0002911528550000074
是群组成员对于电影类型k的平均权重。
对于方差考虑两种情况:第一,群组权重方差低于规定阈值t;第二,群组权重方差高于规定阈值t。当群组权重方差高于阈值时,认为群组成员对于该电影类型的熟悉程度差异极大。基于一个合理的假设:人们通常会采纳权威人士的建议,于是把低影响力的成员的决策权重调整为0。相对应地,高决策权重的成员的权重会变得更高。本发明中t取值为0.1。
为了方便建模,对观众权重也设置一个阈值L。如果观众权重高于该阈值,则认为他是权威人士,通常认为低于阈值的成员乐意听从权威人士的建议。本发明中L值设为0.5。
首先,在群组Gi中得到平均转移权重
Figure BDA0002911528550000081
平均转移权重的计算过程是将群组内小于阈值的观众权重求和然后除以权重大于阈值的观众数。具体计算公式如下:
Figure BDA0002911528550000082
其中,Si是群组Gi的子集,而且Si中的成员权重都低于阈值L。然后,调整观众权重如下:
Figure BDA0002911528550000083
当权重方差低于阈值t时,认为群组成员对于该电影类型的熟悉程度比较均匀,此时群组成员的相互影响很小。为了公平起见,不调整观众权重。
具体的,步骤4融合群组成员的偏好基本过程如下:
4-1仅考虑电影的一种类型时,融合群组成员的偏好;
群组对于电影j的评分能通过下列公式计算得到:
Figure BDA0002911528550000084
其中,ru,j是观众u对电影j的评分,Cj是电影j包含的类型构成的集合,ek是电影类型的社会影响力,α和β分别控制群组内部和群组外部(例如流行趋势)对观众偏好融合影响的程度,本发明分别取0.5和0.5。
4-2考虑电影j包含的所有类型时,群组对电影j的评分,即群组偏好,计算公式如下:
Figure BDA0002911528550000085
具体的,步骤5电影推荐过程如下:
根据当前影院上映电影的类型,选取历史数据库中某部相同类型的电影,根据步骤4计算得到等待推荐群组的偏好,选择当前播放电影中满足该偏好的影片进行推荐。
根据图5以及图2和图4所示数据计算可知该群组对于电影《GoldenEye》的偏好融合后的评分为3.2分。该评分即可用于衡量该群组用户的电影类型喜好,进而从当前上演电影中选择相应影片进行推荐。

Claims (1)

1.一种在线的群组电影推荐方法,其特征在于包括如下步骤:
步骤1、计算电影类型的社会影响力;
步骤2、统计群组成员对电影类型熟悉程度;
步骤3、计算群组成员对于某种电影类型的话语权;
步骤4、融合群组成员的偏好;
步骤5、电影推荐;
所述步骤1由以下步骤组成:
步骤1-1、动态样本库维护
采用采样池采样的方法,对观众群体进行抽样;
假设采样池的大小,也就是样本数为M;针对观众集合U中观众序列,对采样池进行以下操作:
若采样池中观众数量小于M:则将该名观众放入采样池,并且设置进入蓄水池时间;
若采样池已满,也即蓄水池中观众数量已经为M时:
第一步、针对观众序列中的第i-j名观众,顺序号i为当前观众序号,j为8周前一天0时数据库中的最大序号,若(i-j)>=M,在[0,(i-j)]范围内取一个随机整数d,若d小于M,则用接收到的这个观众替换采样池中的第d个观众;
第二步:在每天开始时候,清理进入采样池超过8周都没有观影记录的样本观众;
重复第一步,直至没有新增观众;
步骤1-2电影类型影响力计算
访问采样池中观众的观影记录,计算各种类型电影的社会影响力,即统计电影类型C={c1,c2,...,cl}中所有类型电影的观影人数,除以M得到该种类型电影的社会影响力e。
CN202110092664.5A 2021-01-22 2021-01-22 一种在线的群组电影推荐方法 Active CN112784172B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202110092664.5A CN112784172B (zh) 2021-01-22 2021-01-22 一种在线的群组电影推荐方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202110092664.5A CN112784172B (zh) 2021-01-22 2021-01-22 一种在线的群组电影推荐方法

Publications (2)

Publication Number Publication Date
CN112784172A CN112784172A (zh) 2021-05-11
CN112784172B true CN112784172B (zh) 2022-04-08

Family

ID=75758764

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202110092664.5A Active CN112784172B (zh) 2021-01-22 2021-01-22 一种在线的群组电影推荐方法

Country Status (1)

Country Link
CN (1) CN112784172B (zh)

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101739416A (zh) * 2008-11-04 2010-06-16 未序网络科技(上海)有限公司 多指标综合权重视频排序方法
CN109344176A (zh) * 2018-09-05 2019-02-15 浙江工业大学 基于双循环图的虚假评论检测方法
CN109933726A (zh) * 2019-03-22 2019-06-25 江西理工大学 基于用户平均加权兴趣向量聚类的协同过滤电影推荐方法

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
GB0317476D0 (en) * 2003-07-25 2003-08-27 Wright David E Methods and apparatus for screening for chromosomal abnormalities

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101739416A (zh) * 2008-11-04 2010-06-16 未序网络科技(上海)有限公司 多指标综合权重视频排序方法
CN109344176A (zh) * 2018-09-05 2019-02-15 浙江工业大学 基于双循环图的虚假评论检测方法
CN109933726A (zh) * 2019-03-22 2019-06-25 江西理工大学 基于用户平均加权兴趣向量聚类的协同过滤电影推荐方法

Also Published As

Publication number Publication date
CN112784172A (zh) 2021-05-11

Similar Documents

Publication Publication Date Title
US9727927B2 (en) Prediction of user response to invitations in a social networking system based on keywords in the user's profile
CN103678518B (zh) 一种推荐列表调整方法和装置
US20150143394A1 (en) Content presentation method, content presentation device, and program
US11301915B2 (en) Modelling user behavior in social network
CN110933473A (zh) 一种视频播放热度确定方法及装置
CN110225361A (zh) 直播间推荐方法、存储介质、电子设备及***
CN107454442A (zh) 一种推荐视频的方法和装置
CN112287167A (zh) 视频推荐召回方法及装置
CN106599165A (zh) 一种基于播放行为的内容推荐方法及服务器
CN110312167A (zh) 一种计算影视内容评分的方法、智能终端及存储介质
CN113645488A (zh) 一种基于用户数据的互联网电视视频推荐***及方法
CN112784172B (zh) 一种在线的群组电影推荐方法
CN108717442B (zh) 基于机器学习的相似影视推荐方法
CN109688217B (zh) 一种消息推送方法、装置及电子设备
CN113129078A (zh) 基于特征识别和数据可视化分析的社交软件广告信息投放方法
CN109451334A (zh) 用户画像生成处理方法、装置及电子设备
CN106658091B (zh) 一种实现收视信息处理的方法及装置
CN113468413B (zh) 一种面向多用户共享的多媒体网络视频推荐方法
TWI504273B (zh) 多媒體內容推薦系統以及方法
CN112291624B (zh) 视频处理方法、装置、电子设备及存储介质
CN111324509B (zh) 一种对应用沉迷的识别方法和装置
CN102129426A (zh) 显示人物关系的方法及装置
CN114996584A (zh) 基于深度强化学习的多样性感知交互推荐方法
CN110134878B (zh) 基于用户偏好与服务变化双向感知的移动服务推荐方法
CN113852864A (zh) 一种面向iptv终端应用的用户定制化服务推荐方法及***

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant