CN105574183A - 一种基于协同过滤推荐算法-K最近邻分类算法的App推荐方法 - Google Patents

一种基于协同过滤推荐算法-K最近邻分类算法的App推荐方法 Download PDF

Info

Publication number
CN105574183A
CN105574183A CN201510973710.7A CN201510973710A CN105574183A CN 105574183 A CN105574183 A CN 105574183A CN 201510973710 A CN201510973710 A CN 201510973710A CN 105574183 A CN105574183 A CN 105574183A
Authority
CN
China
Prior art keywords
app
user
tuple
algorithm
information
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201510973710.7A
Other languages
English (en)
Inventor
刘海亮
宋聪颖
黄鹏
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Shenzhen Research Institute of Sun Yat Sen University
Original Assignee
Shenzhen Research Institute of Sun Yat Sen University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Shenzhen Research Institute of Sun Yat Sen University filed Critical Shenzhen Research Institute of Sun Yat Sen University
Priority to CN201510973710.7A priority Critical patent/CN105574183A/zh
Publication of CN105574183A publication Critical patent/CN105574183A/zh
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/953Querying, e.g. by the use of web search engines
    • G06F16/9535Search customisation based on user profiles and personalisation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/24Classification techniques
    • G06F18/241Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches
    • G06F18/2413Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches based on distances to training or reference patterns
    • G06F18/24147Distances to closest patterns, e.g. nearest neighbour classification

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Databases & Information Systems (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • Artificial Intelligence (AREA)
  • Evolutionary Computation (AREA)
  • Evolutionary Biology (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

一种基于协同过滤推荐算法-K最近邻分类算法的App推荐方法。本发明采用一种支持向量机与KNN算法相结合的方法实现室内定位,旨在改善App推荐的精准度,其实现推荐的主要过程如下,第一,采集用户注册信息,包括年龄、爱好、账号等信息;第二,采集用户移动设备上安装的App名称信息并且上传到后台服务器;在用户装载或卸载移动设备上的App时,其在后台服务器上对应的App名称信息也相应地添加或删除;第三,采用基于协同过滤的推荐算法,根据KNN原理,利用用户安装的App信息,找出与该用户兴趣相似度较大的集合M;将集合M中的用户所有App信息存储到集合N中;统计集合N中各个App出现的次数,按照次数多少的顺序返回给用户。

Description

一种基于协同过滤推荐算法-K最近邻分类算法的App推荐方法
技术领域
本发明涉及一种基于协同过滤推荐算法与K最近邻分类算法相结合的App推荐方法,是属于移动互联网应用领域。
背景技术
随着技术的发展,智能电视、智能机顶盒、智能手机等智能化产品越来越受到消费者的青睐。相应的,应用商店中的软件也如雨后春笋般快速地增长。如何将优质的应用通过排名准确地呈现给智能化产品的用户,让用户花费最少的成本及时间选择到适合自己的优质应用,成为维持应用商店健康发展的重点。第三方软件公司经常采用恶意下载方式,以此提升该应用排名。因此,需要改进应用排名方式,防止粗制软件占据榜单,以使得更好地保障应用商店的健康发展。
传统的应用商店按照“发布时间”、“排名上升速度”、“评分高低”、“评论次数”、“下载次数”、“检索次数”、“激活量”、“卸载次数”等属性分发应用。
在传统应用商店的分发模式下,70%的下载量都被0.1%的Top热门应用所占据,而99.9%不常使用的低频应用仅仅占到了总下载量的30%,即便有很好的工具、很好的服务,却没有好的方法触及自己的目标客户,居于不利位置。应用商店的展现形式是优先展示下载量最大的Top热门应用,形成强者恒强的局面,如果要搜索,前提是必须要知道这个应用的名字,很多需求无法有效对接给开发者。
并且,在传统应用商店分发模式下,第三方软件公司经常采用恶意下载方式,以此提升该应用排名。
最后,附近的人往往是相同的群体,其行为习惯也大体相同。但自己身边周围的人常用的一些应用常常因为排名靠后而不能被发现,互联网的长尾效应无法得到释放,没有很好的实现app的智能检索排序。
当前的应用商店按照传统分类方式将应用分类,未充分考虑用户之间的关系。因而需要设计适合的推荐算法来提高app搜索时的搜索效率。
发明内容
本发明的目的在于提供一种基于协同过滤推荐算法与K最近邻分类算法的App推荐方法,主要用于解决基于模型推荐算法的传统应用商店不能很好的解决用户喜好变化以及不能很好解决冷门App的推荐问题,从而提高App推荐的精度。
为解决上述的技术问题,本发明采用的方案如下:
第一步,采集用户注册信息,包括年龄、爱好、账号等信息;
第二步,采集用户移动设备上安装的App名称信息并且上传到后台服务器;在用户装载或卸载移动设备上的App时,其在后台服务器上对应的App名称信息也相应地添加或删除;
第三步,采用基于协同过滤的推荐算法,根据用户安装的App信息,找出与该用户兴趣相似度较大的集合M;将集合M中的用户所有App信息存储到集合N中;统计集合N中各个App出现的次数,按照次数多少的顺序返回给用户;
采用基于协同过滤推荐算法分类的具体过程如下:
第一步,根据用户兴趣,采用KNN算法,分为M个集合。其中,用户的兴趣来自用户安装的App信息以及用户注册时填写的兴趣;
第二步,将M个集合中的每个集合内的所有App信息存储到集合N中;统计集合N中各个App出现的次数,按照次数多少的顺序返回给用户;
其中,第一步中从安装的App得出用户兴趣的过称为:统计各款App的所属分类。第一步中KNN算法过程如下:
1.维护一个大小为k的的按距离由大到小的优先级队列,用于存储最近邻训练元组。随机从训练元组中选取k个用户作为初始的最近邻元组,分别计算测试元组到这k个元组的距离,设用户Ui与用户Uj兴趣相似度为Dj,则该距离计算公式为:
D j = | U i ∩ U j | | U i ∪ U j | ( j = 1 , 2 , ... K )
2.遍历训练元组集,计算当前训练元组与测试元组的距离,将所得距离L与优先级队列中的最大距离Lmax;
3.进行比较。若L>=Lmax,则舍弃该元组,遍历下一个元组。若L<Lmax,删除优先级队列中最大距离的元组,将当前训练元组存入优先级队列;
4.遍历完毕,计算优先级队列中k个元组的多数类,并将其作为测试元组的类别;
5.测试元组集测试完毕后计算误差率,继续设定不同的k值重新进行训练,最后取误差率最小的k值进行的分类。
有益效果
本发明对比已有的App推荐方法,具有以下创新点:
a.将用户兴趣相似度与KNN结合,找出与该用户基本上相似的其他用户集合U;
b.采用基于协同过滤的推荐算法,找到集合U中其他用户所有App信息,按照各个App出现次数排序,使推荐更具人性化;
本发明对比已有定位方法具有以下显著优点:
1、改进了基于模型推荐算法的传统应用商店不能很好的解决用户喜好变化问题,
2、改进了冷门App的推荐问题,
3、提高App推荐的精准度。
附图说明
附图1是基于协同过滤推荐算法与K最近邻分类算法的总体流程图。
具体的实施方式
下面结合说明书附图和具体实施方式对本发明作进一步的说明。
为解决上述的技术问题,本发明采用的技术方案是:基于协同过滤推荐算法与K最近邻分类算法的App推荐方法,包括以下的步骤:
S1、采集用户注册信息,包括年龄、爱好、账号等信息;
S2、采集用户移动设备上安装的App名称信息并且上传到后台服务器;在用户装载或卸载移动设备上的App时,其在后台服务器上对应的App名称信息也相应地添加或删除;
S3、采用基于协同过滤的推荐算法,根据用户安装的App信息,找出与该用户兴趣相似度较大的集合M;将集合M中的用户所有App信息存储到集合N中;统计集合N中各个App出现的次数,按照次数多少的顺序返回给用户;
采用基于协同过滤推荐算法分类的具体过程如下:
第一步,根据用户兴趣,采用KNN算法,分为M个集合。其中,用户的兴趣来自用户安装的App信息以及用户注册时填写的兴趣;
第二步,将M个集合中的每个集合内的所有App信息存储到集合N中;统计集合N中各个App出现的次数,按照次数多少的顺序返回给用户;
其中,第一步中从安装的App得出用户兴趣的过称为:统计各款App的所属分类。第一步中KNN算法过程如下:
1.维护一个大小为k的的按距离由大到小的优先级队列,用于存储最近邻训练元组。随机从训练元组中选取k个用户作为初始的最近邻元组,分别计算测试元组到这k个元组的距离,设用户Ui与用户Uj兴趣相似度为Dj,则该距离计算公式为:
D j = | U i &cap; U j | | U i &cup; U j | ( j = 1 , 2 , ... K )
2.遍历训练元组集,计算当前训练元组与测试元组的距离,将所得距离L与优先级队列中的最大距离Lmax;
3.进行比较。若L>=Lmax,则舍弃该元组,遍历下一个元组。若L<Lmax,删除优先级队列中最大距离的元组,将当前训练元组存入优先级队列;
4.遍历完毕,计算优先级队列中k个元组的多数类,并将其作为测试元组的类别;
5.测试元组集测试完毕后计算误差率,继续设定不同的k值重新进行训练,最后取误差率最小的k值进行的分类。

Claims (2)

1.一种基于协同过滤推荐算法与K最近邻分类算法的App推荐方法,其特征在于,采用基于协同过滤推荐算法与K最近邻法相结合的算法实现App推荐,具体的步骤如下:
S1、采集用户注册信息,包括年龄、爱好、账号等信息;
S2、采集用户移动设备上安装的App名称信息并且上传到后台服务器;在用户装载或卸载移动设备上的App时,其在后台服务器上对应的App名称信息也相应地添加或删除;
S3、采用基于协同过滤的推荐算法,根据用户安装的App信息,找出与该用户兴趣相似度较大的集合M;将集合M中的用户所有App信息存储到集合N中;统计集合N中各个App出现的次数,按照次数多少的顺序返回给用户。
2.根据权利要求1所述的基于协同过滤推荐算法与K最近邻分类算法的App推荐方法,其特征在于,利用采集的数据,实现训练分类,然后采用协同过滤算法处理训练分类后的数据集,具体的步骤如下:
第一步,根据用户兴趣,采用KNN算法,分为M个集合。其中,用户的兴趣来自用户安装的App信息以及用户注册时填写的兴趣;
第二步,将M个集合中的每个集合内的所有App信息存储到集合N中;统计集合N中各个App出现的次数,按照次数多少的顺序返回给用户;
其中,第一步中从安装的App得出用户兴趣的过称为:统计各款App的所属分类。第一步中KNN算法过程如下:
1).维护一个大小为k的的按距离由大到小的优先级队列,用于存储最近邻训练元组。随机从训练元组中选取k个用户作为初始的最近邻元组,分别计算测试元组到这k个元组的距离,设用户Ui与用户Uj兴趣相似度为Dj,则该距离计算公式为:
2).遍历训练元组集,计算当前训练元组与测试元组的距离,将所得距离L与优先级队列中的最大距离Lmax;
3).进行比较。若L>=Lmax,则舍弃该元组,遍历下一个元组。若L<Lmax,删除优先级队列中最大距离的元组,将当前训练元组存入优先级队列;
4).遍历完毕,计算优先级队列中k个元组的多数类,并将其作为测试元组的类别;
5).测试元组集测试完毕后计算误差率,继续设定不同的k值重新进行训练,最后取误差率最小的k值进行的分类。
CN201510973710.7A 2015-12-23 2015-12-23 一种基于协同过滤推荐算法-K最近邻分类算法的App推荐方法 Pending CN105574183A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201510973710.7A CN105574183A (zh) 2015-12-23 2015-12-23 一种基于协同过滤推荐算法-K最近邻分类算法的App推荐方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201510973710.7A CN105574183A (zh) 2015-12-23 2015-12-23 一种基于协同过滤推荐算法-K最近邻分类算法的App推荐方法

Publications (1)

Publication Number Publication Date
CN105574183A true CN105574183A (zh) 2016-05-11

Family

ID=55884314

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201510973710.7A Pending CN105574183A (zh) 2015-12-23 2015-12-23 一种基于协同过滤推荐算法-K最近邻分类算法的App推荐方法

Country Status (1)

Country Link
CN (1) CN105574183A (zh)

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107609785A (zh) * 2017-09-26 2018-01-19 广东电网有限责任公司信息中心 基于机器学习的企业公共信息模型扩展方法及***
CN107909119A (zh) * 2017-12-11 2018-04-13 深圳先进技术研究院 集合间相似度的确定方法和装置
CN108710555A (zh) * 2018-05-23 2018-10-26 郑州云海信息技术有限公司 一种基于监督学习的服务器错误诊断方法
US10885568B2 (en) 2016-11-15 2021-01-05 Industrial Technology Research Institute Interactive recommendation system and method

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103338223A (zh) * 2013-05-27 2013-10-02 清华大学 一种移动应用的推荐方法、客户端及服务器
CN104572962A (zh) * 2014-12-31 2015-04-29 浙江大学 一种app推荐的方法和***
KR20150120591A (ko) * 2014-04-17 2015-10-28 주식회사 솔트룩스 연관 앱 추천 시스템 및 추천 방법

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103338223A (zh) * 2013-05-27 2013-10-02 清华大学 一种移动应用的推荐方法、客户端及服务器
KR20150120591A (ko) * 2014-04-17 2015-10-28 주식회사 솔트룩스 연관 앱 추천 시스템 및 추천 방법
CN104572962A (zh) * 2014-12-31 2015-04-29 浙江大学 一种app推荐的方法和***

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
QXHAIT: "KNN算法详解-CSDN博客", 《HTTPS://BLOG.CSDN.NET/QXHAIT/ARTICLE/DETAILS/44463215》 *
林钦: "一种协同过滤的移动APP推荐算法的设计", 《鲁东大学学报(自然科学版)》 *

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US10885568B2 (en) 2016-11-15 2021-01-05 Industrial Technology Research Institute Interactive recommendation system and method
CN107609785A (zh) * 2017-09-26 2018-01-19 广东电网有限责任公司信息中心 基于机器学习的企业公共信息模型扩展方法及***
CN107909119A (zh) * 2017-12-11 2018-04-13 深圳先进技术研究院 集合间相似度的确定方法和装置
CN107909119B (zh) * 2017-12-11 2020-05-19 深圳先进技术研究院 集合间相似度的确定方法和装置
CN108710555A (zh) * 2018-05-23 2018-10-26 郑州云海信息技术有限公司 一种基于监督学习的服务器错误诊断方法

Similar Documents

Publication Publication Date Title
CN103914536B (zh) 一种用于电子地图的兴趣点推荐方法及***
CN103488766B (zh) 应用程序搜索方法和装置
CN104123398B (zh) 一种信息推送方法及装置
CN103678672B (zh) 一种信息推荐方法
CN103886048B (zh) 一种基于聚类的增量数字图书推荐方法
WO2017121251A1 (zh) 一种信息推送方法及装置
CN109166017A (zh) 基于重聚类的推送方法、装置、计算机设备及存储介质
CN104123325B (zh) 多媒体文件的推荐方法和推荐服务器
CN109360057A (zh) 信息推送方法、装置、计算机设备及存储介质
US20150148076A1 (en) Push method, system and server based on location information
CN105045916A (zh) 一种***推荐***及其推荐方法
CN103916436B (zh) 信息推送方法、装置、终端及服务器
CN104598450A (zh) 一种网络舆情事件的热度分析方法及***
CN104239496B (zh) 一种结合模糊权重相似性度量和聚类协同过滤的方法
CN105574183A (zh) 一种基于协同过滤推荐算法-K最近邻分类算法的App推荐方法
CN106339469A (zh) 数据推荐方法及装置
CN109597858B (zh) 一种商户的分类方法及其装置和商户的推荐方法及其装置
CN107885745A (zh) 一种歌曲推荐方法及装置
CN105824961B (zh) 一种标签确定方法及装置
CN108304399A (zh) 网络内容的推荐方法及装置
CN104615631B (zh) 一种信息推荐的方法及装置
CN104102696A (zh) 一种内容推荐方法及装置
CN106960354A (zh) 一种基于客户生命周期的精准化推荐方法及装置
CN108846097A (zh) 用户的兴趣标签表示方法、文章推荐方法、及装置、设备
CN108171535A (zh) 一种基于多特征的个性化餐厅推荐算法

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
WD01 Invention patent application deemed withdrawn after publication

Application publication date: 20160511

WD01 Invention patent application deemed withdrawn after publication