CN103488705A - 个性化推荐***的用户兴趣模型增量更新方法 - Google Patents

个性化推荐***的用户兴趣模型增量更新方法 Download PDF

Info

Publication number
CN103488705A
CN103488705A CN201310403293.3A CN201310403293A CN103488705A CN 103488705 A CN103488705 A CN 103488705A CN 201310403293 A CN201310403293 A CN 201310403293A CN 103488705 A CN103488705 A CN 103488705A
Authority
CN
China
Prior art keywords
document
user
user interest
interested
vector
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201310403293.3A
Other languages
English (en)
Other versions
CN103488705B (zh
Inventor
姚兴苗
夏春燕
伍盛
胡光岷
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
University of Electronic Science and Technology of China
Original Assignee
University of Electronic Science and Technology of China
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by University of Electronic Science and Technology of China filed Critical University of Electronic Science and Technology of China
Priority to CN201310403293.3A priority Critical patent/CN103488705B/zh
Publication of CN103488705A publication Critical patent/CN103488705A/zh
Application granted granted Critical
Publication of CN103488705B publication Critical patent/CN103488705B/zh
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • G06F40/205Parsing
    • G06F40/216Parsing using statistical methods
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/30Semantic analysis

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Probability & Statistics with Applications (AREA)
  • Health & Medical Sciences (AREA)
  • Artificial Intelligence (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Computational Linguistics (AREA)
  • General Health & Medical Sciences (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明公开了一种个性化推荐***的用户兴趣模型增量更新方法,该方法基本思想是存储生成当前用户兴趣模型的计算过程中的中间结果,更新用户兴趣模型时,在该中间结果基础上进行增量计算。本发明在确保更新过程不丢失兴趣信息的前提下,能满足用户兴趣模型在数据量庞大的情况下也能不断快速更新的要求,提高推荐***性能,为用户提供更高质量的服务。

Description

个性化推荐***的用户兴趣模型增量更新方法
技术领域
本发明涉及计算机应用技术领域,特别是一种个性化推荐***的用户兴趣模型增量更新方法。
背景技术
个性化推荐***通过建立用户与推荐对象之间的二元关系,利用已有的选择过程或相似性关系挖掘每个用户潜在感兴趣的对象,进而进行个性化推荐(刘建国,周涛,汪秉宏.个性化推荐***的研究进展[J].自然科学进展,2009,19(1),1-15.)。随着用户需求的多样化,个性化推荐***应用变得更加广泛,不仅用于电子商务,也用于推荐网页、文档等。对于文案人员和研究学者来说需要经常查阅大量的资料文献。基于文档内容信息的个性化推荐***通过收集和分析用户阅读过的感兴趣文档内容来了解用户的阅读兴趣并建立用户兴趣模型,通过比较文档内容与用户兴趣模型的匹配度,向用户推荐匹配度高的文档。基于文档内容信息的个性化推荐***有三个重要的模块:用户兴趣建模模块、推荐对象建模模块、推荐算法模块,该***模型如图1所示。
在基于文档内容信息的推荐***中,用户兴趣建模模块是其中一个核心的模块,其作用是从用户阅读过的感兴趣的文档中提取用户兴趣模型并根据用户兴趣的变化实现兴趣模型更新。为实现高精度的推荐,用户兴趣模型必须能够准确描述用户的当前兴趣,而兴趣模型的更新必须能够快速跟踪用户兴趣的变化。
目前用户兴趣模型的更新主要有两种方法,时间窗口法和遗忘函数法,时间窗口法是利用滑动时间窗滤除过时的兴趣,遗忘函数法是利用遗忘函数衰减兴趣的权重(费红晓,戴弋,穆珺等.基于优化时间窗的用户兴趣漂移方法[J].计算机工程,2008,34(16),210-214.)。文献(SHIN H.,CHO S..Neighborhood Property Based Pattern Selection for Support VectorMachines[J].Neural Computation,2007,19(3),816-855.)中采用时间窗口法更新用户兴趣模型,该方法利用滑动时间窗滤除过时的兴趣。文献(KEERTHI S.S.,SHEVADE S.K.,BHATTACHARYYA.,et al.A Fast Iterative Nearest Point Algorithm for Support Vector MachineClassifier Design[J].IEEE Transactions on Neural Networks,2000,11(1),124-136.)中采用遗忘函数法更新用户兴趣模型,该方法利用遗忘函数衰减兴趣的权重。单蓉(单蓉.用户兴趣模型的更新与遗忘机制研究[J].微型电脑应用,2011,27(7),10-11,69)根据HTML文档的特点以及用户的浏览速度更新兴趣模型,结合遗忘因子修正特征词的权重来实现模型的遗忘。文献(李峰,裴军,游之洋.基于隐式反馈的自适应用户兴趣模型[J].计算机工程与应用,2008,44(9),76-79.)将用户兴趣分为短期兴趣和长期兴趣,短期兴趣采用时间窗口更新机制,长期兴趣采用基于时间的遗忘函数的更新策略。
现有的用户兴趣模型更新方法强调的是如何从用户感兴趣的文档当中剔除偏离用户兴趣的文档,以及增加新的感兴趣文档,使得用于构建用户兴趣模型的文档更能反映用户当前兴趣,而忽略了用户兴趣模型更新的计算效率问题。随着用户阅读文档数量的增加,其标记的感兴趣的文档数量也会增加,用户兴趣模型更新的计算效率问题逐渐凸显出来,造成模型更新速度过低而不能满足用户需求的不良后果。
发明内容
本发明所要解决的技术问题是,针对现有技术不足,提供一种个性化推荐***的用户兴趣模型增量更新方法,在确保更新过程不丢失兴趣信息的前提下,提高用户兴趣模型更新的计算效率,满足用户兴趣模型在数据量庞大的情况下也能不断快速更新的要求,提高个性化推荐***性能,为用户提供更高质量的服务。
为解决上述技术问题,本发明所采用的技术方案是:一种个性化推荐***的用户兴趣模型增量更新方法,该方法为:
1)构建基于文档内容的用户兴趣向量空间模型U0
2)建立所述用户兴趣向量空间模型U0的用户感兴趣文档集D0={d01,d02,...,d0m},令D={d1,d2,...,dn}为待推荐文档集,其中文档di的特征向量为,(ti2,wi2),...,(tia,wia)};其中,d0e表示所述用户感兴趣文档集D0中的文档,e=1,2,...,m,m为所述用户感兴趣文档集D0中的文档总数;tik表示文档di第k项特征词;wik表示文档di第k项特征词的权重;i=1,2,...,n;k=1,2,...,a;a表示文档di特征词的总项数;这里,待推荐文档集一般从网络搜集得到或者从文献资料中得到;
3)推荐文档时,计算所述待推荐文档集D中所有文档特征向量与所述用户兴趣向量空间模型U0的相似度r,推荐出相似度r大于阈值α的文档,向个性化推荐***反馈感兴趣的新文档,所述新文档集合为
Figure BDA0000378349690000022
阈值α的取值范围为0到1之间,根据用户需要调节α大小,当用户希望得到更多推荐结果时,α的取值越接近0,当用户希望得到更准确的推荐结果时,α的取值越接近1;选择用户感兴趣文档集合中过时或者偏离用户兴趣的文档时,分别计算集合D0中各个文档特征向量与所述用户兴趣向量空间模型U0的相似度r',选择r'小于阈值α的文档作为过时或者偏离用户兴趣的文档,所述过时或者偏离用户兴趣的文档集合为
Figure BDA00003783496900000311
Figure BDA00003783496900000312
为所述新文档集合为D'中的文档,f=1,2,...,q,q为所述新文档集合D'中的文档总数;为所述过时或者偏离用户兴趣的文档集合D''中的文档,h=1,2,...,c,c为所述过时或者偏离用户兴趣的文档集合D''中的文档总数;
4)增加用户感兴趣文档集合时,将所述新文档集合D'添加到所述用户感兴趣文档集D0中,构成新的第一用户感兴趣文档集D1;剔除用户感兴趣文档集合中过时或者偏离用户兴趣的文档时,将所述过时或者偏离用户兴趣的文档集合D''从所述用户感兴趣文档集D0中剔除,构成新的第二用户感兴趣文档集D2
5)根据下式计算所述新的第一用户感兴趣文档集D1的中心向量
Figure BDA0000378349690000031
W D 1 ‾ = Σ e = 1 m W d 0 e + Σ f = 1 q W d pf m + q = m W D 0 ‾ + Σ f = 1 q W d pf m + q ;
其中,
Figure BDA0000378349690000033
为所述用户感兴趣文档集D0中第e个文档的特征向量;
Figure BDA0000378349690000034
为所述新文档集合D'中第f个文档的特征向量;q为所述新文档集合D'中的文档总数;
Figure BDA0000378349690000035
为所述用户感兴趣文档集D0的中心向量;m为所述用户感兴趣文档集D0中的文档总数;e=1,2,...,m;f=1,2,...,q;
根据下式计算新的第二用户感兴趣文档集D2的中心向量
Figure BDA0000378349690000036
W D 2 ‾ = Σ e = 1 m W d 0 e - Σ h = 1 c W d bh m - c = m W D 0 ‾ - Σ h = 1 c W d bh m - c ;
其中,
Figure BDA0000378349690000038
为所述用户感兴趣文档集D0中第h个文档的特征向量;
Figure BDA0000378349690000039
为过时或者偏离用户兴趣的文档集合D''中文档的特征向量;c为过时或者偏离用户兴趣的文档集合D''中文档总数;
Figure BDA00003783496900000310
为所述用户感兴趣文档集D0的中心向量;m为所述用户感兴趣文档集D0中文档总数;h=1,2,...,c;
6)将
Figure BDA0000378349690000041
Figure BDA0000378349690000042
各维按权值从大到小排序,选择
Figure BDA0000378349690000043
Figure BDA0000378349690000044
的前N维构建新的用户兴趣向量空间模型U1或U2,同时把
Figure BDA0000378349690000045
Figure BDA0000378349690000046
存入个性化推荐***;其中,N不超过
Figure BDA0000378349690000047
Figure BDA0000378349690000048
的维数;用所述新的用户兴趣向量空间模型U1或U2代替步骤1)中的U0进行新一轮推荐。
所述步骤1)中,构建基于文档内容的用户兴趣向量空间模型U0的具体步骤如下:
1)对所有用户感兴趣的文档进行特征词选择及特征词权重计算;文档特征词选择及特征词权重可以由ICTCLAS汉语分词软件(http://ictclas.nlpir.org/)的关键词提取功能获得,或基于词频的特征词选择方法得到;
2)提取所有用户感兴趣的文档的特征向量,构成文档特征向量集D3
3)计算所述文档特征向量集D3的中心向量,将所述文档特征向量集D3的中心向量按各维的权重从大到小排序,选取前M维作为用户兴趣向量空间模型U0;其中M不超过所述文档特征向量集D3的中心向量的维数。
文档特征向量集D3={d31,d32,...,d3x}的中心向量
Figure BDA0000378349690000049
的计算公式为:
W D 3 ‾ = Σ y = 1 x W d 3 y x ;
其中,x为所述文档特征向量集D3中元素的个数;
Figure BDA00003783496900000413
为所述文档特征向量集D3中第y个文档的特征向量;y=1,2,...,x。
待推荐文档集D中文档di的特征向量与所述用户兴趣向量空间模型U0的相似度r的计算公式为:
r = cos ( W d i , U 0 ) = W d i · U 0 | | W d i | | 2 × | | U 0 | | 2 ; 其中,||||2表示二范数。
用户感兴趣文档集D0中第e个文档特征向量与所述用户兴趣向量空间模型U0的相似度r'的计算公式为:
r ′ = cos ( W d 0 e , U 0 ) = W d 0 e · U 0 | | W d 0 e | | 2 × | | U 0 | | 2 .
本发明提出的用户兴趣模型增量更新方法的基本思想是存储生成当前用户兴趣模型的计算过程中的中间结果,更新用户兴趣模型时,在该中间结果基础上进行增量计算。
与现有技术相比,本发明所具有的有益效果为:本发明针对基于文档内容信息的推荐***的用户兴趣模型更新的效率问题,在保证用户信息完整的前提下,本发明的更新方法减少了用户兴趣模型更新时的计算量,使得用户兴趣模型可以快速频繁更新,提高了个性化推荐***的性能,能够快速实现用户兴趣跟踪,以适应用户兴趣的变化,为用户提供更高质量的服务。
附图说明
图1为基于文档内容信息的推荐***;
图2为本发明用户兴趣模型的构建流程。
具体实施方式
本发明中构建基于文档内容的用户兴趣向量空间模型的流程如图1所示,首先对用户感兴趣的文档进行特征词选择及特征词权重计算,得到一个由一组特征词及其权重组成的文档特征向量。文档特征向量提取方法可以利用ICTCLAS汉语分词软件(http://ictclas.nlpir.org/)的特征词提取功能,或基于词频的特征词选择方法得到。多个文档特征向量构成文档特征向量集。计算得到文档特征向量集的中心向量之后,将中心向量各维按权重从大到小排序,选取前N维作为该用户的兴趣模型向量。
文档特征向量集的中心向量计算方法如下:
文档集合D3={d31,d32,...,d3x},文档d2i的特征向量为
Figure BDA0000378349690000053
,(t3i2,w3i2),...,(t3im,w3im)},其中,t3ik表示文档d3i第k项特征词,w3ik表示文档d3i第k项特征词的权重,那么中心向量
Figure BDA0000378349690000051
计算公式为:
W D 3 ‾ = Σ y = 1 x W d 3 y x - - - ( 1 )
在此公式中,文档特征向量通过匹配每一维的特征词来求和,特征词相同则对应权值相加。该中心向量各维按权重排序后的前M项即为该用户的兴趣模型U,M不超过中心向量的维数,一般由训练样本经验值决定。
假设用户感兴趣文档为{d1,d2,d3},建立用户兴趣模型的过程见表1。
表1用户兴趣模型建立过程
Figure BDA0000378349690000061
表中中心向量
Figure BDA0000378349690000062
由公式(1)计算所得,此处选择该中心向量的前5个特征项作为用户兴趣模型U。
本发明提出的增量更新方法的具体实现步骤如下:
设U0为用户当前已经建立的用户兴趣模型,建立该用户兴趣模型的用户感兴趣文档集为D0={d01,d02,...,d0m}。文档集合D={d1,d2,...,dn}为待推荐文档,文档di的特征向量为
Figure BDA0000378349690000064
,(ti2,wi2),...,(tia,wia)}。
(1)推荐文档时,通过余弦夹角公式计算集合D中所有文档特征向量与用户模型U0的相似度r,推荐出相似度r大于阈值α的文档,用户浏览后向***反馈感兴趣的新文档,设该文档集合为
Figure BDA0000378349690000065
选择用户感兴趣文档集合中过时或者偏离用户兴趣的文档时,分别计算集合D0中各个文档特征向量与所述用户兴趣向量空间模型U0的相似度r',选择r'小于阈值α的文档作为过时或者偏离用户兴趣的文档,所述过时或者偏离用户兴趣的文档集合为 D ′ ′ = { d b 1 , d b 2 , . . . , d b c } ;
(2)增加用户感兴趣文档集合时,将所述新文档集合D'添加到所述用户感兴趣文档集D0中,构成新的用户感兴趣文档集D1;剔除用户感兴趣文档集合中过时或者偏离用户兴趣的文档时,将所述过时或者偏离用户兴趣的文档集合D''从所述用户感兴趣文档集D0中剔除,构成新的用户感兴趣文档集D2
(3)为了完整的保留用户兴趣,避免重复计算,提高算法性能,***已经预先存储了计算用户兴趣模型U0时文档集合D0的中心向量将公式(1)变形为公式(2)计算增加新文档后的新的兴趣模型的中心向量:
W D 1 ‾ = Σ e = 1 m W d 0 e + Σ f = 1 q W d pf m + q = m W D 0 ‾ + Σ f = 1 q W d pf m + q - - - ( 2 )
将公式(2)变形为公式(3)计算剔除过时或者偏离用户兴趣的文档后的新的兴趣模型的中心向量:
W D 2 ‾ = Σ e = 1 m W d 0 e - Σ h = 1 c W d bh m - c = m W D 0 ‾ - Σ h = 1 c W d bh m - c - - - ( 3 )
(4)将各维按权值从大到小排序,选择前N维构建新的用户兴趣模型U1(U2),同时把
Figure BDA0000378349690000074
)存入***。用得到的新用户兴趣模型U1(U2)代替步骤(1)中的U0进行新一阶段推荐。
从公式(2)和公式(3)可以看出,中心向量
Figure BDA0000378349690000075
都出现在这两个公式中。中心向量
Figure BDA0000378349690000076
是前一次计算用户兴趣模型的一个中间结果,本发明的核心就是每次更新用户兴趣模型时都保存该中心向量
Figure BDA0000378349690000077
使得下一次更新时不需要重新计算该部分内容,从而提高更新效率。
以表2中的例子为例,对表2所述的用户兴趣模型在增加文档d4更新时,设d4={{汽车,4.0},{保险,3.6},{国产,2.5},{涨幅,2.0}},在中心向量
Figure BDA0000378349690000078
的基础上更新,对于特征词“汽车”,其权值w1计算如式(4)所示,
w 1 = 3.2 * 3 + 4.0 3 + 1 = 3.4 - - - ( 4 )
剔除文档d1更新时,对于特征词“汽车”,其权值w2计算如式(5)所示,
w 2 = 3.2 * 3 - 5.3 3 - 1 = 2.15 - - - ( 5 )
以此类推得到新的用户兴趣模型中心向量,更新结果见表2。该示例仅在用户感兴趣文档数为3的基础上进行增量计算,所以在本示例中计算效率提高并不明显。本示例仅用来说明增量更新算法。实际应用中,用户标记的感兴趣文档数量会比较多,而增加或提出的文档数相对较少,这时候增量更新算法的效率会更为明显。
Figure BDA0000378349690000081
对比表1中的用户兴趣模型提取和和表2中本发明提出的增量更新过程,可以发现,中心向量
Figure BDA0000378349690000082
作为上一次用户兴趣模型创建或更新过程中的一个中间结果,本发明在该中间结果的基础上进行增量更新,从而避免了大量的向量求和工作;并且可以看出,本发明提出的增量更新方法得到的中心向量与直接从更新后的文档集合中提取的相同。一般来说,用于构建新的用户兴趣模型的文档有两部分构成,第一部分是新增加的感兴趣的文档;第二部分是原有的感兴趣文档中剔除偏离当前用户兴趣的文档后剩下的部分,而这部分文档数量占绝大多数。本发明提出的增量更新方式的意义在于避免了第二部分文档的重复计算工作,从而有效降低用户兴趣模型更新计算量。

Claims (5)

1.一种个性化推荐***的用户兴趣模型增量更新方法,其特征在于,该方法为:
1)构建基于文档内容的用户兴趣向量空间模型U0
2)建立所述用户兴趣向量空间模型U0的用户感兴趣文档集D0={d01,d02,...,d0m},令D={d1,d2,...,dn}为待推荐文档集,其中文档di的特征向量为
Figure FDA0000378349680000012
,(ti2,wi2),...,(tia,wia)};其中,d0e表示所述用户感兴趣文档集D0中的文档,e=1,2,...,m,m为所述用户感兴趣文档集D0中的文档总数;tik表示文档di第k项特征词;wik表示文档di第k项特征词的权重;i=1,2,...,n;k=1,2,...,a;a表示文档di特征词的总项数;
3)推荐文档时,计算所述待推荐文档集D中所有文档特征向量与所述用户兴趣向量空间模型U0的相似度r,推荐出相似度r大于阈值α的文档,向个性化推荐***反馈感兴趣的新文档,所述新文档集合为
Figure FDA0000378349680000013
;选择用户感兴趣文档集合中过时或者偏离用户兴趣的文档时,分别计算所述用户感兴趣文档集D0中各个文档特征向量与所述用户兴趣向量空间模型U0的相似度r',选择r'小于阈值α的文档作为过时或者偏离用户兴趣的文档,所述过时或者偏离用户兴趣的文档集合为
Figure FDA0000378349680000014
所述阈值α的取值范围为0~1;
Figure FDA0000378349680000015
为所述新文档集合为D'中的文档,f=1,2,...,q,q为所述新文档集合D'中的文档总数;
Figure FDA0000378349680000016
为所述过时或者偏离用户兴趣的文档集合D''中的文档,h=1,2,...,c,c为所述过时或者偏离用户兴趣的文档集合D''中的文档总数;
4)增加用户感兴趣文档集合时,将所述新文档集合D'添加到所述用户感兴趣文档集D0中,构成新的第一用户感兴趣文档集D1;或者在剔除用户感兴趣文档集合中过时或者偏离用户兴趣的文档时,将所述过时或者偏离用户兴趣的文档集合D''从所述用户感兴趣文档集D0中剔除,构成新的第二用户感兴趣文档集D2
5)根据下式计算所述新的第一用户感兴趣文档集D1的中心向量
W D 1 ‾ = Σ e = 1 m W d 0 e + Σ f = 1 q W d pf m + q = m W D 0 ‾ + Σ f = 1 q W d pf m + q ;
其中,
Figure FDA00003783496800000215
为所述用户感兴趣文档集D0中第e个文档的特征向量;为所述新文档集合D'中第f个文档的特征向量;
Figure FDA0000378349680000022
为所述用户感兴趣文档集D0的中心向量;
根据下式计算所述新的第二用户感兴趣文档集D2的中心向量
Figure FDA0000378349680000023
W D 2 ‾ = Σ e = 1 m W d 0 e - Σ h = 1 c W d bh m - c = m W D 0 ‾ - Σ h = 1 c W d bh m - c ;
其中,
Figure FDA00003783496800000217
为过时或者偏离用户兴趣的文档集合D''中第h个文档的特征向量;
6)将
Figure FDA0000378349680000025
Figure FDA0000378349680000026
各维按权值从大到小排序,选择
Figure FDA0000378349680000028
的前N维构建新的用户兴趣向量空间模型U1或U2,同时把
Figure FDA0000378349680000029
Figure FDA00003783496800000210
存入个性化推荐***;其中,N不超过
Figure FDA00003783496800000211
Figure FDA00003783496800000212
的维数;用所述新的用户兴趣向量空间模型U1或U2代替步骤
1)中的U0进行新一轮推荐。
2.根据权利要求1所述的个性化推荐***的用户兴趣模型增量更新方法,其特征在于,所述步骤1)中,构建基于文档内容的用户兴趣向量空间模型U0的具体步骤如下:
1)对所有用户感兴趣的文档进行特征词选择及特征词权重计算;
2)提取所有用户感兴趣的文档的特征向量,构成文档特征向量集D3
3)计算所述文档特征向量集D3的中心向量,将所述文档特征向量集D3的中心向量按各维的权重从大到小排序,选取前M维作为用户兴趣向量空间模型U0;其中M不超过所述文档特征向量集D3的中心向量的维数。
3.根据权利要求2所述的个性化推荐***的用户兴趣模型增量更新方法,其特征在于,所述文档特征向量集D3={d31,d32,...,d3x}的中心向量
Figure FDA00003783496800000213
的计算公式为:
W D 3 ‾ = Σ y = 1 x W d 3 y x ;
其中,x为所述文档特征向量集D3中元素的个数;
Figure FDA0000378349680000033
为所述文档特征向量集D3中第y个文档的的特征向量;y=1,2,...,x。
4.根据权利要求1~3之一所述的个性化推荐***的用户兴趣模型增量更新方法,其特征在于,所述待推荐文档集D中文档di的特征向量与所述用户兴趣向量空间模型U0的相似度r的计算公式为:
r = cos ( W d i , U 0 ) = W d i · U 0 | | W d i | | 2 × | | U 0 | | 2 ;
其中,|| ||2表示二范数。
5.根据权利要求4所述的个性化推荐***的用户兴趣模型增量更新方法,其特征在于,所述用户感兴趣文档集D0中第e个文档特征向量与所述用户兴趣向量空间模型U0的相似度r'的计算公式为:
r ′ = cos ( W d 0 e , U 0 ) = W d 0 e · U 0 | | W d 0 e | | 2 × | | U 0 | | 2 .
CN201310403293.3A 2013-09-06 2013-09-06 个性化推荐***的用户兴趣模型增量更新方法 Expired - Fee Related CN103488705B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201310403293.3A CN103488705B (zh) 2013-09-06 2013-09-06 个性化推荐***的用户兴趣模型增量更新方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201310403293.3A CN103488705B (zh) 2013-09-06 2013-09-06 个性化推荐***的用户兴趣模型增量更新方法

Publications (2)

Publication Number Publication Date
CN103488705A true CN103488705A (zh) 2014-01-01
CN103488705B CN103488705B (zh) 2016-06-22

Family

ID=49828931

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201310403293.3A Expired - Fee Related CN103488705B (zh) 2013-09-06 2013-09-06 个性化推荐***的用户兴趣模型增量更新方法

Country Status (1)

Country Link
CN (1) CN103488705B (zh)

Cited By (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104239512A (zh) * 2014-09-16 2014-12-24 电子科技大学 一种文本推荐方法
CN104268760A (zh) * 2014-09-24 2015-01-07 同济大学 一种用户兴趣获取与传播方法及其***
CN105260481A (zh) * 2015-11-13 2016-01-20 合一网络技术(北京)有限公司 一种推送列表多样性的评测方法及***
CN106055661A (zh) * 2016-06-02 2016-10-26 福州大学 基于多Markov链模型的多兴趣资源推荐方法
WO2017088587A1 (zh) * 2015-11-24 2017-06-01 华为技术有限公司 一种数据处理方法及装置
CN107562912A (zh) * 2017-09-12 2018-01-09 电子科技大学 新浪微博事件推荐方法
CN107635004A (zh) * 2017-09-26 2018-01-26 义乌控客科技有限公司 一种智能家居***中的个性化服务定制方法
WO2018028326A1 (zh) * 2016-08-08 2018-02-15 华为技术有限公司 一种模型更新方法和装置
CN108446350A (zh) * 2018-03-09 2018-08-24 华中科技大学 一种基于主题模型分析与用户长短兴趣的推荐方法
CN110287202A (zh) * 2019-05-16 2019-09-27 北京百度网讯科技有限公司 数据更新方法、装置、电子设备及存储介质

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101339562A (zh) * 2008-08-15 2009-01-07 北京航空航天大学 引入兴趣模型反馈更新机制的门户个性化推荐服务***
CN101477554A (zh) * 2009-01-16 2009-07-08 西安电子科技大学 基于用户兴趣的个性化元搜索引擎及搜索结果处理方法
CN102890689A (zh) * 2011-07-22 2013-01-23 北京百度网讯科技有限公司 一种用户兴趣模型的建立方法及***

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101339562A (zh) * 2008-08-15 2009-01-07 北京航空航天大学 引入兴趣模型反馈更新机制的门户个性化推荐服务***
CN101477554A (zh) * 2009-01-16 2009-07-08 西安电子科技大学 基于用户兴趣的个性化元搜索引擎及搜索结果处理方法
CN102890689A (zh) * 2011-07-22 2013-01-23 北京百度网讯科技有限公司 一种用户兴趣模型的建立方法及***

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
INGRID ZUKERMAN AND DAVID W. ALBRECHT: "Predictive Statistical Models for User Modeling", 《USER MODELING AND USER-ADAPTED INTERACTION》, 31 December 2001 (2001-12-31), pages 5 - 18, XP008026202, DOI: doi:10.1023/A:1011175525451 *
李峰,等。: "基于隐式反馈的自适应用户兴趣模型", 《计算机工程与应用》, 31 December 2008 (2008-12-31) *

Cited By (20)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104239512A (zh) * 2014-09-16 2014-12-24 电子科技大学 一种文本推荐方法
CN104239512B (zh) * 2014-09-16 2017-06-06 电子科技大学 一种文本推荐方法
CN104268760A (zh) * 2014-09-24 2015-01-07 同济大学 一种用户兴趣获取与传播方法及其***
CN104268760B (zh) * 2014-09-24 2017-06-13 同济大学 一种用户兴趣获取与传播方法及其***
CN105260481A (zh) * 2015-11-13 2016-01-20 合一网络技术(北京)有限公司 一种推送列表多样性的评测方法及***
CN105260481B (zh) * 2015-11-13 2019-09-17 优酷网络技术(北京)有限公司 一种推送列表多样性的评测方法及***
WO2017088587A1 (zh) * 2015-11-24 2017-06-01 华为技术有限公司 一种数据处理方法及装置
CN106055661A (zh) * 2016-06-02 2016-10-26 福州大学 基于多Markov链模型的多兴趣资源推荐方法
CN106055661B (zh) * 2016-06-02 2017-11-17 福州大学 基于多Markov链模型的多兴趣资源推荐方法
WO2018028326A1 (zh) * 2016-08-08 2018-02-15 华为技术有限公司 一种模型更新方法和装置
CN107704929A (zh) * 2016-08-08 2018-02-16 华为技术有限公司 一种模型更新方法和装置
CN107704929B (zh) * 2016-08-08 2020-10-23 华为技术有限公司 一种模型更新方法和装置
CN107562912A (zh) * 2017-09-12 2018-01-09 电子科技大学 新浪微博事件推荐方法
CN107562912B (zh) * 2017-09-12 2021-08-27 电子科技大学 新浪微博事件推荐方法
CN107635004A (zh) * 2017-09-26 2018-01-26 义乌控客科技有限公司 一种智能家居***中的个性化服务定制方法
CN107635004B (zh) * 2017-09-26 2020-12-08 杭州控客信息技术有限公司 一种智能家居***中的个性化服务定制方法
CN108446350A (zh) * 2018-03-09 2018-08-24 华中科技大学 一种基于主题模型分析与用户长短兴趣的推荐方法
CN108446350B (zh) * 2018-03-09 2020-05-19 华中科技大学 一种基于主题模型分析与用户长短兴趣的推荐方法
CN110287202A (zh) * 2019-05-16 2019-09-27 北京百度网讯科技有限公司 数据更新方法、装置、电子设备及存储介质
CN110287202B (zh) * 2019-05-16 2022-02-15 北京百度网讯科技有限公司 数据更新方法、装置、电子设备及存储介质

Also Published As

Publication number Publication date
CN103488705B (zh) 2016-06-22

Similar Documents

Publication Publication Date Title
CN103488705A (zh) 个性化推荐***的用户兴趣模型增量更新方法
CN103164540B (zh) 一种专利热点发现与趋势分析方法
CN105243438A (zh) 一种考虑径流不确定性的多年调节水库优化调度方法
CN104881706A (zh) 一种基于大数据技术的电力***短期负荷预测方法
CN102591917B (zh) 一种数据处理方法、***及相关装置
CN103268348A (zh) 一种用户查询意图识别方法
Li et al. A posteriori error estimates of recovery type for distributed convex optimal control problems
CN103886048B (zh) 一种基于聚类的增量数字图书推荐方法
CN104156811A (zh) 一种基于云海os的账单生成方法
CN102629305B (zh) 一种面向snp数据的特征选择方法
CN104933622A (zh) 一种基于用户和微博主题的微博流行度预测方法及***
CN102411583A (zh) 一种文本匹配方法及装置
CN108170650B (zh) 文本比较方法以及文本比较装置
CN102193936A (zh) 一种数据分类的方法及装置
CN108595435A (zh) 一种机构名称识别处理方法、智能终端及存储介质
CN103473217B (zh) 从文本中抽取关键词的方法和装置
CN105335491A (zh) 基于用户点击行为来向用户推荐图书的方法和***
CN104008248B (zh) 基于高斯过程的注塑成形工艺稳健设计与容差设计方法
CN102426590A (zh) 一种质量评价的方法和装置
CN104992297A (zh) 基于大数据平台聚类算法的电费回收风险评估装置及方法
CN110134780A (zh) 文档摘要的生成方法、装置、设备、计算机可读存储介质
CN111177216A (zh) 综合能源消费者行为特征的关联规则生成方法及装置
CN103095849B (zh) 基于QoS属性预测和纠错的有监督Web服务发现方法及***
CN102521713B (zh) 数据处理装置和数据处理方法
CN103778486A (zh) 一种配电网负荷预测方法

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C14 Grant of patent or utility model
GR01 Patent grant
CF01 Termination of patent right due to non-payment of annual fee

Granted publication date: 20160622

Termination date: 20190906

CF01 Termination of patent right due to non-payment of annual fee