CN105574183A - 一种基于协同过滤推荐算法-K最近邻分类算法的App推荐方法 - Google Patents
一种基于协同过滤推荐算法-K最近邻分类算法的App推荐方法 Download PDFInfo
- Publication number
- CN105574183A CN105574183A CN201510973710.7A CN201510973710A CN105574183A CN 105574183 A CN105574183 A CN 105574183A CN 201510973710 A CN201510973710 A CN 201510973710A CN 105574183 A CN105574183 A CN 105574183A
- Authority
- CN
- China
- Prior art keywords
- app
- user
- tuple
- algorithm
- information
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/90—Details of database functions independent of the retrieved data types
- G06F16/95—Retrieval from the web
- G06F16/953—Querying, e.g. by the use of web search engines
- G06F16/9535—Search customisation based on user profiles and personalisation
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/24—Classification techniques
- G06F18/241—Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches
- G06F18/2413—Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches based on distances to training or reference patterns
- G06F18/24147—Distances to closest patterns, e.g. nearest neighbour classification
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Data Mining & Analysis (AREA)
- Databases & Information Systems (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- Artificial Intelligence (AREA)
- Evolutionary Computation (AREA)
- Evolutionary Biology (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Bioinformatics & Computational Biology (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Life Sciences & Earth Sciences (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
一种基于协同过滤推荐算法-K最近邻分类算法的App推荐方法。本发明采用一种支持向量机与KNN算法相结合的方法实现室内定位,旨在改善App推荐的精准度,其实现推荐的主要过程如下,第一,采集用户注册信息,包括年龄、爱好、账号等信息;第二,采集用户移动设备上安装的App名称信息并且上传到后台服务器;在用户装载或卸载移动设备上的App时,其在后台服务器上对应的App名称信息也相应地添加或删除;第三,采用基于协同过滤的推荐算法,根据KNN原理,利用用户安装的App信息,找出与该用户兴趣相似度较大的集合M;将集合M中的用户所有App信息存储到集合N中;统计集合N中各个App出现的次数,按照次数多少的顺序返回给用户。
Description
技术领域
本发明涉及一种基于协同过滤推荐算法与K最近邻分类算法相结合的App推荐方法,是属于移动互联网应用领域。
背景技术
随着技术的发展,智能电视、智能机顶盒、智能手机等智能化产品越来越受到消费者的青睐。相应的,应用商店中的软件也如雨后春笋般快速地增长。如何将优质的应用通过排名准确地呈现给智能化产品的用户,让用户花费最少的成本及时间选择到适合自己的优质应用,成为维持应用商店健康发展的重点。第三方软件公司经常采用恶意下载方式,以此提升该应用排名。因此,需要改进应用排名方式,防止粗制软件占据榜单,以使得更好地保障应用商店的健康发展。
传统的应用商店按照“发布时间”、“排名上升速度”、“评分高低”、“评论次数”、“下载次数”、“检索次数”、“激活量”、“卸载次数”等属性分发应用。
在传统应用商店的分发模式下,70%的下载量都被0.1%的Top热门应用所占据,而99.9%不常使用的低频应用仅仅占到了总下载量的30%,即便有很好的工具、很好的服务,却没有好的方法触及自己的目标客户,居于不利位置。应用商店的展现形式是优先展示下载量最大的Top热门应用,形成强者恒强的局面,如果要搜索,前提是必须要知道这个应用的名字,很多需求无法有效对接给开发者。
并且,在传统应用商店分发模式下,第三方软件公司经常采用恶意下载方式,以此提升该应用排名。
最后,附近的人往往是相同的群体,其行为习惯也大体相同。但自己身边周围的人常用的一些应用常常因为排名靠后而不能被发现,互联网的长尾效应无法得到释放,没有很好的实现app的智能检索排序。
当前的应用商店按照传统分类方式将应用分类,未充分考虑用户之间的关系。因而需要设计适合的推荐算法来提高app搜索时的搜索效率。
发明内容
本发明的目的在于提供一种基于协同过滤推荐算法与K最近邻分类算法的App推荐方法,主要用于解决基于模型推荐算法的传统应用商店不能很好的解决用户喜好变化以及不能很好解决冷门App的推荐问题,从而提高App推荐的精度。
为解决上述的技术问题,本发明采用的方案如下:
第一步,采集用户注册信息,包括年龄、爱好、账号等信息;
第二步,采集用户移动设备上安装的App名称信息并且上传到后台服务器;在用户装载或卸载移动设备上的App时,其在后台服务器上对应的App名称信息也相应地添加或删除;
第三步,采用基于协同过滤的推荐算法,根据用户安装的App信息,找出与该用户兴趣相似度较大的集合M;将集合M中的用户所有App信息存储到集合N中;统计集合N中各个App出现的次数,按照次数多少的顺序返回给用户;
采用基于协同过滤推荐算法分类的具体过程如下:
第一步,根据用户兴趣,采用KNN算法,分为M个集合。其中,用户的兴趣来自用户安装的App信息以及用户注册时填写的兴趣;
第二步,将M个集合中的每个集合内的所有App信息存储到集合N中;统计集合N中各个App出现的次数,按照次数多少的顺序返回给用户;
其中,第一步中从安装的App得出用户兴趣的过称为:统计各款App的所属分类。第一步中KNN算法过程如下:
1.维护一个大小为k的的按距离由大到小的优先级队列,用于存储最近邻训练元组。随机从训练元组中选取k个用户作为初始的最近邻元组,分别计算测试元组到这k个元组的距离,设用户Ui与用户Uj兴趣相似度为Dj,则该距离计算公式为:
2.遍历训练元组集,计算当前训练元组与测试元组的距离,将所得距离L与优先级队列中的最大距离Lmax;
3.进行比较。若L>=Lmax,则舍弃该元组,遍历下一个元组。若L<Lmax,删除优先级队列中最大距离的元组,将当前训练元组存入优先级队列;
4.遍历完毕,计算优先级队列中k个元组的多数类,并将其作为测试元组的类别;
5.测试元组集测试完毕后计算误差率,继续设定不同的k值重新进行训练,最后取误差率最小的k值进行的分类。
有益效果
本发明对比已有的App推荐方法,具有以下创新点:
a.将用户兴趣相似度与KNN结合,找出与该用户基本上相似的其他用户集合U;
b.采用基于协同过滤的推荐算法,找到集合U中其他用户所有App信息,按照各个App出现次数排序,使推荐更具人性化;
本发明对比已有定位方法具有以下显著优点:
1、改进了基于模型推荐算法的传统应用商店不能很好的解决用户喜好变化问题,
2、改进了冷门App的推荐问题,
3、提高App推荐的精准度。
附图说明
附图1是基于协同过滤推荐算法与K最近邻分类算法的总体流程图。
具体的实施方式
下面结合说明书附图和具体实施方式对本发明作进一步的说明。
为解决上述的技术问题,本发明采用的技术方案是:基于协同过滤推荐算法与K最近邻分类算法的App推荐方法,包括以下的步骤:
S1、采集用户注册信息,包括年龄、爱好、账号等信息;
S2、采集用户移动设备上安装的App名称信息并且上传到后台服务器;在用户装载或卸载移动设备上的App时,其在后台服务器上对应的App名称信息也相应地添加或删除;
S3、采用基于协同过滤的推荐算法,根据用户安装的App信息,找出与该用户兴趣相似度较大的集合M;将集合M中的用户所有App信息存储到集合N中;统计集合N中各个App出现的次数,按照次数多少的顺序返回给用户;
采用基于协同过滤推荐算法分类的具体过程如下:
第一步,根据用户兴趣,采用KNN算法,分为M个集合。其中,用户的兴趣来自用户安装的App信息以及用户注册时填写的兴趣;
第二步,将M个集合中的每个集合内的所有App信息存储到集合N中;统计集合N中各个App出现的次数,按照次数多少的顺序返回给用户;
其中,第一步中从安装的App得出用户兴趣的过称为:统计各款App的所属分类。第一步中KNN算法过程如下:
1.维护一个大小为k的的按距离由大到小的优先级队列,用于存储最近邻训练元组。随机从训练元组中选取k个用户作为初始的最近邻元组,分别计算测试元组到这k个元组的距离,设用户Ui与用户Uj兴趣相似度为Dj,则该距离计算公式为:
2.遍历训练元组集,计算当前训练元组与测试元组的距离,将所得距离L与优先级队列中的最大距离Lmax;
3.进行比较。若L>=Lmax,则舍弃该元组,遍历下一个元组。若L<Lmax,删除优先级队列中最大距离的元组,将当前训练元组存入优先级队列;
4.遍历完毕,计算优先级队列中k个元组的多数类,并将其作为测试元组的类别;
5.测试元组集测试完毕后计算误差率,继续设定不同的k值重新进行训练,最后取误差率最小的k值进行的分类。
Claims (2)
1.一种基于协同过滤推荐算法与K最近邻分类算法的App推荐方法,其特征在于,采用基于协同过滤推荐算法与K最近邻法相结合的算法实现App推荐,具体的步骤如下:
S1、采集用户注册信息,包括年龄、爱好、账号等信息;
S2、采集用户移动设备上安装的App名称信息并且上传到后台服务器;在用户装载或卸载移动设备上的App时,其在后台服务器上对应的App名称信息也相应地添加或删除;
S3、采用基于协同过滤的推荐算法,根据用户安装的App信息,找出与该用户兴趣相似度较大的集合M;将集合M中的用户所有App信息存储到集合N中;统计集合N中各个App出现的次数,按照次数多少的顺序返回给用户。
2.根据权利要求1所述的基于协同过滤推荐算法与K最近邻分类算法的App推荐方法,其特征在于,利用采集的数据,实现训练分类,然后采用协同过滤算法处理训练分类后的数据集,具体的步骤如下:
第一步,根据用户兴趣,采用KNN算法,分为M个集合。其中,用户的兴趣来自用户安装的App信息以及用户注册时填写的兴趣;
第二步,将M个集合中的每个集合内的所有App信息存储到集合N中;统计集合N中各个App出现的次数,按照次数多少的顺序返回给用户;
其中,第一步中从安装的App得出用户兴趣的过称为:统计各款App的所属分类。第一步中KNN算法过程如下:
1).维护一个大小为k的的按距离由大到小的优先级队列,用于存储最近邻训练元组。随机从训练元组中选取k个用户作为初始的最近邻元组,分别计算测试元组到这k个元组的距离,设用户Ui与用户Uj兴趣相似度为Dj,则该距离计算公式为:
2).遍历训练元组集,计算当前训练元组与测试元组的距离,将所得距离L与优先级队列中的最大距离Lmax;
3).进行比较。若L>=Lmax,则舍弃该元组,遍历下一个元组。若L<Lmax,删除优先级队列中最大距离的元组,将当前训练元组存入优先级队列;
4).遍历完毕,计算优先级队列中k个元组的多数类,并将其作为测试元组的类别;
5).测试元组集测试完毕后计算误差率,继续设定不同的k值重新进行训练,最后取误差率最小的k值进行的分类。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201510973710.7A CN105574183A (zh) | 2015-12-23 | 2015-12-23 | 一种基于协同过滤推荐算法-K最近邻分类算法的App推荐方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201510973710.7A CN105574183A (zh) | 2015-12-23 | 2015-12-23 | 一种基于协同过滤推荐算法-K最近邻分类算法的App推荐方法 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN105574183A true CN105574183A (zh) | 2016-05-11 |
Family
ID=55884314
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201510973710.7A Pending CN105574183A (zh) | 2015-12-23 | 2015-12-23 | 一种基于协同过滤推荐算法-K最近邻分类算法的App推荐方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN105574183A (zh) |
Cited By (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN107609785A (zh) * | 2017-09-26 | 2018-01-19 | 广东电网有限责任公司信息中心 | 基于机器学习的企业公共信息模型扩展方法及*** |
CN107909119A (zh) * | 2017-12-11 | 2018-04-13 | 深圳先进技术研究院 | 集合间相似度的确定方法和装置 |
CN108710555A (zh) * | 2018-05-23 | 2018-10-26 | 郑州云海信息技术有限公司 | 一种基于监督学习的服务器错误诊断方法 |
US10885568B2 (en) | 2016-11-15 | 2021-01-05 | Industrial Technology Research Institute | Interactive recommendation system and method |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN103338223A (zh) * | 2013-05-27 | 2013-10-02 | 清华大学 | 一种移动应用的推荐方法、客户端及服务器 |
CN104572962A (zh) * | 2014-12-31 | 2015-04-29 | 浙江大学 | 一种app推荐的方法和*** |
KR20150120591A (ko) * | 2014-04-17 | 2015-10-28 | 주식회사 솔트룩스 | 연관 앱 추천 시스템 및 추천 방법 |
-
2015
- 2015-12-23 CN CN201510973710.7A patent/CN105574183A/zh active Pending
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN103338223A (zh) * | 2013-05-27 | 2013-10-02 | 清华大学 | 一种移动应用的推荐方法、客户端及服务器 |
KR20150120591A (ko) * | 2014-04-17 | 2015-10-28 | 주식회사 솔트룩스 | 연관 앱 추천 시스템 및 추천 방법 |
CN104572962A (zh) * | 2014-12-31 | 2015-04-29 | 浙江大学 | 一种app推荐的方法和*** |
Non-Patent Citations (2)
Title |
---|
QXHAIT: "KNN算法详解-CSDN博客", 《HTTPS://BLOG.CSDN.NET/QXHAIT/ARTICLE/DETAILS/44463215》 * |
林钦: "一种协同过滤的移动APP推荐算法的设计", 《鲁东大学学报(自然科学版)》 * |
Cited By (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US10885568B2 (en) | 2016-11-15 | 2021-01-05 | Industrial Technology Research Institute | Interactive recommendation system and method |
CN107609785A (zh) * | 2017-09-26 | 2018-01-19 | 广东电网有限责任公司信息中心 | 基于机器学习的企业公共信息模型扩展方法及*** |
CN107909119A (zh) * | 2017-12-11 | 2018-04-13 | 深圳先进技术研究院 | 集合间相似度的确定方法和装置 |
CN107909119B (zh) * | 2017-12-11 | 2020-05-19 | 深圳先进技术研究院 | 集合间相似度的确定方法和装置 |
CN108710555A (zh) * | 2018-05-23 | 2018-10-26 | 郑州云海信息技术有限公司 | 一种基于监督学习的服务器错误诊断方法 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN103914536B (zh) | 一种用于电子地图的兴趣点推荐方法及*** | |
CN103488766B (zh) | 应用程序搜索方法和装置 | |
CN104123398B (zh) | 一种信息推送方法及装置 | |
CN103678672B (zh) | 一种信息推荐方法 | |
CN103886048B (zh) | 一种基于聚类的增量数字图书推荐方法 | |
WO2017121251A1 (zh) | 一种信息推送方法及装置 | |
CN109166017A (zh) | 基于重聚类的推送方法、装置、计算机设备及存储介质 | |
CN104123325B (zh) | 多媒体文件的推荐方法和推荐服务器 | |
CN109360057A (zh) | 信息推送方法、装置、计算机设备及存储介质 | |
US20150148076A1 (en) | Push method, system and server based on location information | |
CN105045916A (zh) | 一种***推荐***及其推荐方法 | |
CN103916436B (zh) | 信息推送方法、装置、终端及服务器 | |
CN104598450A (zh) | 一种网络舆情事件的热度分析方法及*** | |
CN104239496B (zh) | 一种结合模糊权重相似性度量和聚类协同过滤的方法 | |
CN105574183A (zh) | 一种基于协同过滤推荐算法-K最近邻分类算法的App推荐方法 | |
CN106339469A (zh) | 数据推荐方法及装置 | |
CN109597858B (zh) | 一种商户的分类方法及其装置和商户的推荐方法及其装置 | |
CN107885745A (zh) | 一种歌曲推荐方法及装置 | |
CN105824961B (zh) | 一种标签确定方法及装置 | |
CN108304399A (zh) | 网络内容的推荐方法及装置 | |
CN104615631B (zh) | 一种信息推荐的方法及装置 | |
CN104102696A (zh) | 一种内容推荐方法及装置 | |
CN106960354A (zh) | 一种基于客户生命周期的精准化推荐方法及装置 | |
CN108846097A (zh) | 用户的兴趣标签表示方法、文章推荐方法、及装置、设备 | |
CN108171535A (zh) | 一种基于多特征的个性化餐厅推荐算法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
WD01 | Invention patent application deemed withdrawn after publication |
Application publication date: 20160511 |
|
WD01 | Invention patent application deemed withdrawn after publication |