CN106066864A - 一种多维度移动用户偏好动态识别方法 - Google Patents

一种多维度移动用户偏好动态识别方法 Download PDF

Info

Publication number
CN106066864A
CN106066864A CN201610362116.9A CN201610362116A CN106066864A CN 106066864 A CN106066864 A CN 106066864A CN 201610362116 A CN201610362116 A CN 201610362116A CN 106066864 A CN106066864 A CN 106066864A
Authority
CN
China
Prior art keywords
preference
mobile subscriber
user
mobile
user preference
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201610362116.9A
Other languages
English (en)
Other versions
CN106066864B (zh
Inventor
程克非
李耀辉
雒江涛
易燕
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Chongqing University of Post and Telecommunications
Original Assignee
Chongqing University of Post and Telecommunications
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Chongqing University of Post and Telecommunications filed Critical Chongqing University of Post and Telecommunications
Priority to CN201610362116.9A priority Critical patent/CN106066864B/zh
Publication of CN106066864A publication Critical patent/CN106066864A/zh
Application granted granted Critical
Publication of CN106066864B publication Critical patent/CN106066864B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/955Retrieval from the web using information identifiers, e.g. uniform resource locators [URL]
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/953Querying, e.g. by the use of web search engines
    • G06F16/9535Search customisation based on user profiles and personalisation

Landscapes

  • Engineering & Computer Science (AREA)
  • Databases & Information Systems (AREA)
  • Theoretical Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Mobile Radio Communication Systems (AREA)

Abstract

一种多维度移动用户偏好动态识别方法,用以解决移动用户的偏好随着时空分布规律动态改变的问题。本发明通过引入移动用户偏好衰减因子,动态更新移动用户偏好时间变化情况,再结合移动用户偏好的空间变化规律,解决移动用户偏好随时空而改变的问题,更加精准的识别移动用户偏好,以便提供个性化的服务。

Description

一种多维度移动用户偏好动态识别方法
所属技术领域
本发明涉及数据挖掘技术领域,尤其涉及一种多维度移动用户偏好动态识别方法。
背景技术
随着移动互联网、智能手机的普及,用户在移动端上网的时长、流量日益增加。另一方面,互联网用户庞大,且兴趣多样化,针对所有用户提供相同的业务适配与推荐成本高而且效率低。在现有的技术方案中,基于网页内容进行用户偏好分析,只要用户在上网过程中浏览网页,***就可分析用户上网访问的URL记录,根据URL库进行深入分析匹配归类,总结出用户的偏好属性,从而根据用户的偏好在网站上个性化地展现对其有价值的内容。
传统的方法大多是根据静态的“URL-偏好类别数据库”对用户的URL进行分类,之后对每个用户的偏好类别进行频次统计,给用户打上“标签”。CN104331404A公开了一种基于用户手机上网数据的用户行为预测方法和装置,根据手机用户使用移动互联网的数据记录,建立手机用户行为的张量模型,对手机用户使用移动互联网的新的数据记录,结合张量模型,预测手机用户的行为。CN104573021A公开了一种针对互联网行为进行分析的方法,它包括将URL清单与关键词库和网址分类库进行匹配,生成网络用户URL清单和URL兴趣点汇总表,得出用户上网偏好表,实现对用户上网行为的识别,并打上相应的标签,通过对这些行为信息的分析和理解,制定对用户的贴心服务及个性化推荐。
然而,因为移动用户偏好的动态改变,以及没有考虑移动用户上网的时空分布规律等问题带来了移动用户偏好识别精度下降的问题。
发明内容
本发明的目的是提供一种多维度移动用户偏好动态识别方法,用以解决移动用户的偏好随着时空分布规律动态改变的问题,进一步提高用户偏好识别精度。
一种多维度移动用户偏好动态识别方法的步骤如下:
步骤1:分析移动用户上网数据,结合移动应用分类库,生成移动用户访问记录;所述移动用户访问记录包括用户ID、用户访问发生时间、用户访问地基站信息、用户访问的应用名。
步骤2:根据移动用户访问记录计算用户访问各个应用的频次,与已知的访问阈值N行比较,判断用户所访问应用是否属于用户偏好,如果n<N,不是用户偏好,如果n>N,则为用户偏好;然后根据不同的移动用户行为,赋予移动用户不同的偏好权重W;
计算得初始移动用户偏好K:
K = ( n m ) * W
其中m为移动用户访问的总频次数,表示用户访问频次比例。
步骤3:由步骤2计算得初始移动用户偏好,随着时间的变化用户初始偏好发生变化,动态识别用户偏好,其具体步骤为。
步骤31:根据当前移动用户访问记录计算用户访问各个应用的频次,获取当前移动用户偏好,由步骤2计算公式得当前移动用户偏好K'。
步骤32:计算移动用户偏好的衰减;引入衰减因子α,根据访问时间间隔确定相应的衰减因子数值。
衰减因子α计算公式如下:
α=β*(ti-tj)
ti-tj表示两次相邻访问的时间间隔,β为相关系数;
衰减后的偏好比例系数γ:
γ=1-α
衰减后的初始移动用户偏好Q计算公式如下:
Q=K*γ
步骤33:更新衰减后的当前移动用户偏好Q';由步骤2计算当前移动用户偏好K',如果当前移动用户偏好列表中的偏好包含初始移动用户偏好,则将当前移动用户偏好K'与衰减后的初始移动用户偏好Q相加;否则,衰减后的当前移动用户偏好Q'即为K'。
Q'表示衰减后的当前移动用户偏好,计算公式:
Q'=Q+K'=K*γ+K'
K=0时,表示当前移动用户偏好列表中的偏好不包含初始移动用户偏好。
步骤4:引入空间分布规律,精确识别用户偏好:
步骤41:获取移动用户位置信息;根据移动用户信令数据中记录的基站LAC和CELL-ID以及事件类型,获取用户位置。
步骤42:确定移动用户空间位置-移动用户偏好之间关联关系;根据步骤41获得移动用户位置信息,步骤1、2和3获得的初始移动用户偏好、当前移动用户偏好、衰减后的初始移动用户偏好和衰减后的当前移动用户偏好,得到移动用户空间位置对应的移动用户偏好之间的关联关系。
步骤43:更新移动用户偏好随着空间位置的变化;根据步骤42获得移动用户偏好与位置信息之间的关联关系,追踪移动用户的移动轨迹更新移动用户偏好。
进一步,所述移动用户行为包括:浏览、收藏、分享。
进一步,所述访问阈值2<N<10,N最优值取4。
本发明提出一种多维度移动用户偏好识别方法。通过引入移动用户偏好衰减因子,动态更新移动用户偏好时间变化情况,再结合移动用户偏好的空间变化规律,解决用户偏好动态改变的问题,更加精准的识别移动用户偏好,以便提供个性化的服务。
附图说明
图1本发明的处理流程图;
图2本发明在时间维度动态更新移动用户偏好流程图;
图3本发明时间-空间维度移动用户偏好流程图。
具体实施例
以下结合实施例来具体说明本发明,对本发明的具体实施方式作进一步详细描述。以下实施例用于说明本发明,但不用来限制本发明的范围。
参见图1、图2和图3,本发明实施例提供一种多维度移动用户偏好动态识别方法,根据移动用户访问时间间隔,引入衰减因子,随时间变化动态更新移动用户偏好,然后分析移动用户偏好的空间变化规律,更加精准的识别移动用户偏好,以便提供个性化的服务。步骤1:获取移动用户上网数据,每条数据记录包括用户ID、用户访问发生时间、用户访问地基站信息、URL信息,结合应用分类库如下:
分类规则 类别 网站
http://sports.shouhu.com/* 体育 搜狐网
http://ent.qq.com/* 娱乐 腾讯网
http://news.qq.com/* 新闻 腾讯网
…… …… ……
识别移动用户访问应用。
步骤2:根据移动用户访问记录计算用户访问各个应用的频次,与已知的访问阈值N(N=4)行比较,判断用户所访问应用是否属于用户偏好,如果n<N,不是用户偏好,如果n>N,则为用户偏好。然后根据移动用户行为,包括“浏览”、“收藏”、“分享”等,赋予移动用户不同偏好于权重。
例如,由步骤1识别移动用户访问“新浪新闻”5次,“美图”1次,分享“电影”4次,计算用户访问各应用占比:“新浪新闻”0.5,“美图”因为只访问一次小于既定阈值,不是用户偏好,“视频”0.4;然后分析移动用户行为,赋予不同的行为不同的权重,“浏览”40,“收藏”60,“分享”90等。由移动用户初始偏好计算公式可得,初始移动用户偏好分别为“新浪新闻”20,“视频”36。
步骤3:随着时间的变化用户初始偏好可能会发生变化,需要动态识别用户偏好。由步骤2得到初始移动用户偏好的数值,按一定的偏好更新比例计算衰减后的初始移动用户偏好Q。所述偏好更新比例的计算方式是时间间隔越大,衰减比例越大,更新比例越小,例如,可以用“1-衰减因子”来表示该比例。假如,衰减因子等于0.3,那么偏好更新比例等于0.7。
例如,以0.7为偏好更新比例计算衰减后的当前移动用户偏好。首先,由步骤2得到初始移动用户偏好“新浪新闻”20,“电影”36。再按照步骤2计算当前移动用户偏好,假如,“电影”20,“音乐”40。然后,计算衰减后的初始移动用户偏好Q,“新浪新闻”14,“电影”25.2。最后,采用如下公式计算衰减后的当前用户偏好Q':
Q'=K*γ+K'
K为初始移动用户偏好(K=0表示当前移动用户偏好列表中的偏好不包含初始移动用户偏好);
γ为偏好更新比例;
K'为当前移动用户偏好;
计算更新后移动用户偏好如下:
“新浪新闻”更新后偏好值:20*0.7+0=14;
“电影”更新后偏好值:36*0.7+20=45.2;
“音乐”更新后偏好值:0*0.7+40=40;
因此,可以得到衰减后的当前用户偏好,“新浪新闻”为14,“电影”为45.2,“音乐”为40。
步骤4:由于移动用户偏好会随着空间位置的变化而不同,因此,引入空间分布规律,更加精确的识别用户偏好。
步骤41:获取移动用户位置信息。根据移动用户信令数据中记录的基站LAC和CELL-ID以及事件类型,获取用户位置。
步骤42:确定移动用户空间位置-移动用户偏好之间关联关系。步骤1、2和3获得初始移动用户偏好、当前移动用户偏好、衰减后的初始移动用户偏好和衰减后的当前移动用户偏好,然后根据移动用户信令数据中移动用户访问记录的时间及所处位置,将时间与位置信息作为自变量,移动用户偏好作为因变量,构造线性回归函数,通过拟合的方法得到移动用户空间位置-移动用户偏好之间的关联函数。
步骤43:更新移动用户偏好随着空间位置的变化。步骤42获得移动用户偏好与位置信息之间的关联关系,追踪移动用户的移动轨迹更新移动用户偏好。当移动用户的位置随时间发生变化时,可由移动用户空间位置-移动用户偏好之间的关联函数,更新移动用户偏好。例如:移动用户更喜欢在家的时候通过即时通讯软件聊天,而在上班的路上喜欢阅读新闻,因此可以通过位置的变化得到不同的移动用户的偏好的变化。
综上所述,以上实施例仅用以说明本发明的技术方案,而非对其限制;尽管参照上述实施例对本发明进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对上述各实施例所记载的技术方案进行修改,或者对其中部分技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本发明各实施例技术方案的精神和范围。

Claims (3)

1.一种多维度移动用户偏好动态识别方法,其特征在于,该方法的步骤如下:
步骤1:分析移动用户上网数据,结合移动应用分类库,生成移动用户访问记录;所述移动用户访问记录包括用户ID、用户访问发生时间、用户访问地基站信息、用户访问的应用名;
步骤2:根据移动用户访问记录计算用户访问各个应用的频次,与已知的访问阈值N进行比较,判断用户所访问应用是否属于用户偏好,如果n<N,不是用户偏好,如果n>N,则为用户偏好;然后根据不同的移动用户行为,赋予移动用户不同的偏好权重W;
计算得初始移动用户偏好K:
K = ( n m ) * W
其中m为移动用户访问的总频次数,表示用户访问频次比例;
步骤3:由步骤2计算得初始移动用户偏好,随着时间的变化用户初始偏好发生变化,动态识别用户偏好,其具体步骤为:
步骤31:根据当前移动用户访问记录计算用户访问各个应用的频次,获取当前移动用户偏好,由步骤2计算公式得当前移动用户偏好K';
步骤32:计算移动用户偏好的衰减;引入衰减因子α,根据访问时间间隔确定相应的衰减因子数值;
衰减因子α计算公式如下:
α=β*(ti-tj)
ti-tj表示两次相邻访问的时间间隔,β为相关系数;
衰减后的偏好比例系数γ:
γ=1-α
衰减后的初始移动用户偏好Q计算公式如下:
Q=K*γ
步骤33:更新衰减后的当前移动用户偏好Q';由步骤2计算当前移动用户偏好K',如果当前移动用户偏好列表中的偏好包含初始移动用户偏好,则将当前移动用户偏好K'与衰减后的初始移动用户偏好Q相加;否则,衰减后的当前移动用户偏好Q'即为K';
Q'表示衰减后的当前移动用户偏好,计算公式:
Q'=Q+K'=K*γ+K'
K=0时,表示当前移动用户偏好列表中的偏好不包含初始移动用户偏好;
步骤4:引入空间分布规律,精确识别用户偏好:
步骤41:获取移动用户位置信息;根据移动用户信令数据中记录的基站LAC和CELL-ID以及事件类型,获取用户位置;
步骤42:确定移动用户空间位置-移动用户偏好之间关联关系;根据步骤41获得移动用户位置信息,步骤1、2和3获得的初始移动用户偏好、当前移动用户偏好、衰减后的初始移动用户偏好和衰减后的当前移动用户偏好,得到移动用户空间位置对应的移动用户偏好之间的关联关系;
步骤43:更新移动用户偏好随着空间位置的变化;根据步骤42获得移动用户偏好与位置信息之间的关联关系,追踪移动用户的移动轨迹更新移动用户偏好。
2.根据权利要求1所述的一种多维度移动用户偏好动态识别方法,其特征在于,移动用户行为包括:浏览、收藏、分享。
3.根据权利要求1所述的一种多维度移动用户偏好动态识别方法,其特征在于:访问阈值2<N<10,N最优值取4。
CN201610362116.9A 2016-05-27 2016-05-27 一种多维度移动用户偏好动态识别方法 Active CN106066864B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201610362116.9A CN106066864B (zh) 2016-05-27 2016-05-27 一种多维度移动用户偏好动态识别方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201610362116.9A CN106066864B (zh) 2016-05-27 2016-05-27 一种多维度移动用户偏好动态识别方法

Publications (2)

Publication Number Publication Date
CN106066864A true CN106066864A (zh) 2016-11-02
CN106066864B CN106066864B (zh) 2019-04-30

Family

ID=57420766

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201610362116.9A Active CN106066864B (zh) 2016-05-27 2016-05-27 一种多维度移动用户偏好动态识别方法

Country Status (1)

Country Link
CN (1) CN106066864B (zh)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106503267A (zh) * 2016-12-07 2017-03-15 电子科技大学 一种适用于用户偏好动态演变的个性化推荐算法
CN110020180A (zh) * 2017-12-29 2019-07-16 北京京东尚科信息技术有限公司 推送方法、***及电子设备

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101140582A (zh) * 2007-09-27 2008-03-12 中兴通讯股份有限公司 用户偏好生成***和方法
CN104077714A (zh) * 2014-06-16 2014-10-01 微梦创科网络科技(中国)有限公司 访问网站的用户的偏好获取、广告推送方法和***
US20140372423A1 (en) * 2013-06-13 2014-12-18 Microsoft Corporation Personalized entity preferences model and notifications
CN104462245A (zh) * 2014-11-19 2015-03-25 亚信科技(南京)有限公司 一种用户上网偏好数据识别方法
CN105022729A (zh) * 2014-04-15 2015-11-04 ***通信集团河北有限公司 一种用户偏好确定方法及装置

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101140582A (zh) * 2007-09-27 2008-03-12 中兴通讯股份有限公司 用户偏好生成***和方法
US20140372423A1 (en) * 2013-06-13 2014-12-18 Microsoft Corporation Personalized entity preferences model and notifications
CN105022729A (zh) * 2014-04-15 2015-11-04 ***通信集团河北有限公司 一种用户偏好确定方法及装置
CN104077714A (zh) * 2014-06-16 2014-10-01 微梦创科网络科技(中国)有限公司 访问网站的用户的偏好获取、广告推送方法和***
CN104462245A (zh) * 2014-11-19 2015-03-25 亚信科技(南京)有限公司 一种用户上网偏好数据识别方法

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106503267A (zh) * 2016-12-07 2017-03-15 电子科技大学 一种适用于用户偏好动态演变的个性化推荐算法
CN110020180A (zh) * 2017-12-29 2019-07-16 北京京东尚科信息技术有限公司 推送方法、***及电子设备
CN110020180B (zh) * 2017-12-29 2021-11-30 北京京东尚科信息技术有限公司 推送方法、***及电子设备

Also Published As

Publication number Publication date
CN106066864B (zh) 2019-04-30

Similar Documents

Publication Publication Date Title
CN103295145B (zh) 一种基于用户消费特征向量的手机广告投放方法
JP6494777B2 (ja) 端末にプッシュされるデータコンテンツを選択するための方法およびデバイス
CN105224623B (zh) 数据模型的训练方法及装置
CN106682686A (zh) 一种基于手机上网行为的用户性别预测方法
CN103914478B (zh) 网页训练方法及***、网页预测方法及***
CN106503015A (zh) 一种构建用户画像的方法
CN104077714B (zh) 访问网站的用户的偏好获取、广告推送方法和***
CN107862022B (zh) 文化资源推荐***
CN103218431B (zh) 一种能识别网页信息自动采集的***
CN106504099A (zh) 一种构建用户画像的***
CN106649657A (zh) 面向社交网络基于张量分解的上下文感知推荐***及方法
CN101770520A (zh) 基于用户浏览行为的用户兴趣建模方法
CN103235824A (zh) 根据浏览网页确定用户感兴趣的网页文本的方法和***
CN105574159A (zh) 一种基于大数据的用户画像建立方法和用户画像管理***
CN108550068A (zh) 一种基于用户行为分析的个性化商品推荐方法及***
CN103246725A (zh) 一种基于无线网络的数据业务推送***和方法
CN103678618A (zh) 一种基于社交网络平台的Web服务推荐方法
CN104156356B (zh) 个性化导航页面生成方法及装置
CN100527132C (zh) 分类样本集的优化方法和内容相关广告服务器
CN101577866A (zh) 一种用户分类方法、广告投放方法及装置
CN103049452A (zh) 一种基于预估下载率进行应用排序的方法与设备
US20180307733A1 (en) User characteristic extraction method and apparatus, and storage medium
CN103810162A (zh) 推荐网络信息的方法和***
CN105224681A (zh) 基于家庭工作地上下文环境的用户需求获取方法及***
CN102567392A (zh) 一种基于时间窗口兴趣主题挖掘的控制方法

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant