CN107592656B - 基于基站聚类的缓存方法 - Google Patents

基于基站聚类的缓存方法 Download PDF

Info

Publication number
CN107592656B
CN107592656B CN201710704882.3A CN201710704882A CN107592656B CN 107592656 B CN107592656 B CN 107592656B CN 201710704882 A CN201710704882 A CN 201710704882A CN 107592656 B CN107592656 B CN 107592656B
Authority
CN
China
Prior art keywords
base station
content
class
base stations
clustering
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201710704882.3A
Other languages
English (en)
Other versions
CN107592656A (zh
Inventor
刘楠
牛岩
潘志文
尤肖虎
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Southeast University
Original Assignee
Southeast University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Southeast University filed Critical Southeast University
Priority to CN201710704882.3A priority Critical patent/CN107592656B/zh
Publication of CN107592656A publication Critical patent/CN107592656A/zh
Application granted granted Critical
Publication of CN107592656B publication Critical patent/CN107592656B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Landscapes

  • Mobile Radio Communication Systems (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明公开了一种基于基站聚类的缓存方法,首先收集并分析密集基站网络下各个基站服务用户的历史请求,基于这些历史请求,对基站进行聚类处理,每个类内各个基站服务的用户有相似的兴趣;同时结合推荐***领域当中的协作滤波对各个基站的缓存内容进行决策;采用基于聚类的协作滤波能有效改善算法的可扩展性和数据稀疏性。本发明将内容的局部流行度和TOP N协作滤波***进行组合,有效的提高了基站的缓存命中率,能有效解决基站有限的缓存容量和不断增长的海量数据之间的矛盾,从而改善用户满意度和网络回程负载。

Description

基于基站聚类的缓存方法
技术领域
本发明涉及移动通信***技术领域,尤其是一种基于基站聚类的缓存方法。
背景技术
为了应对海量数据增长带来的对***容量的挑战,一种有效的方案是在基站上部署缓存,若用户请求内容在缓存中,基站直接通过无线链路传输该内容;否则需经由回程链路从核心网中获取。基站主动存储是在请求未到达之前将内容存储在基站中,可以减小回传链路的流量,进而缓解蜂窝***中的流量负载,改善***的性能。本发明通过对历史请求进行分析,给出一种基于基站聚类的缓存策略。
发明内容
本发明所要解决的技术问题在于,提供一种基于基站聚类的缓存方法,能够大大提高缓存命中率,有效缓解回程链路负载,提高用户满意度。
为解决上述技术问题,本发明提供一种基于基站聚类的缓存方法,包括如下步骤:(1)首先考虑基站聚类的问题;统计过去一段时间每个基站服务用户关于内容的请求频数,对于每个基站,将其服务用户对每个内容的请求频数作为这个基站的特征,采用k-means聚类对基站进行聚类,每个类的基站所服务的用户有相似的兴趣爱好,也就是请求的内容有很多相似的地方;
(2)基于基站的Top N协作滤波推荐***利用基站间的相似性预测基站覆盖用户未请求的内容;
(3)给定第一步中的每个类,根据类中内容流行度的分布,同时结合对每个类进行协作滤波对基站进行有针对性的缓存,确定每个基站所缓存的内容。
优选的,步骤(1)中具体的基站聚类包括如下步骤:
(11)根据过去一段时间的历史请求信息,通过核心网对数据的分析,得到内容流行度矩阵
Figure BDA0001381217740000011
其中矩阵中的每个元素pm,f代表基站m所服务的用户对内容f的请求频数,将内容的请求频数作为基站的特征,矩阵P的每一行pm表示一个F维的向量,代表了一个基站的特征向量;
(12)随机选择k基站作为基站聚类的初始中心点,其特征向量表示为
Figure BDA0001381217740000012
这里
Figure BDA0001381217740000021
上标(1)表示第一轮也就是初始值,下标表示第i个中心点;
(13)根据每个类的中心点,为使类内平方和最小,按照如下的方式确定基站属于哪一类:
Figure BDA0001381217740000022
这里
Figure BDA0001381217740000023
表示第t轮属于第i类的基站集合;
(14)根据步骤(13)划分的类,计算新的中心点:
Figure BDA0001381217740000024
(15)重复(13),(14)直到ci的变化小于给定阈值,最终得到k类,H1,...,Hk,每个基站属于其中的一个类。
优选的,步骤(2)中,类内基于基站协作滤波具体包括如下步骤:
(21)计算类内基站间的相似度
Figure BDA0001381217740000025
类内基站间的相似度通过如下相似度公式计算:
Figure BDA0001381217740000026
基站mi和基站mj属于同一个类,T(mi)和T(mj)分别表示基站mi和基站mj所服务的用户访问内容的集合;T(f)表示访问过内容f的基站的集合;
(22)根据(21)可以得到与基站mi最相近的基站的集合S(mi,G),则基站mi所服务的用户对过去一段时间从未请求过的内容f的感兴趣程度为
Figure BDA0001381217740000027
其中T(f)为对内容f产生过请求的基站的集合,
Figure BDA0001381217740000028
为基站mj对内容的f的感兴趣程度,此处为内容流行度矩阵P的元素。
优选的,步骤(3)中具体缓存方式包括如下步骤:
(31)首先对每个类中的内容流行度进行分析,也就是对类中所有基站服务的用户的请求内容进行统计,按内容访问次数从高到低进行排序;
(32)每个基站m的缓存容量为Sm;η为通过类内流行度缓存的内容所占缓存容量Sm的百分比,首先对内容根据类内流行度从高到低对基站进行缓存,每次缓存内容前,检查缓存内容的总大小是否超过η*Sm,若超过,则放弃缓存;
(33)对于基站剩余的缓存容量,通过类内基于基站协作滤波的步骤(22)进行缓存,对于内容按照p(m,f)由高到低进行缓存,直至缓存内容的总量大于缓存容量。
本发明的有益效果为:本发明通过对基站进行聚类分析,提出一种基于基站聚类的缓存策略,一方面对基站服务用户的兴趣爱好能够有很好的判断,另一方面,大大减少了基站协作滤波的复杂度,提升了算法性能;本发明将内容的局部流行度和TOP N协作滤波***进行组合,有效的提高了基站的缓存命中率,能有效解决基站有限的缓存容量和不断增长的海量数据之间的矛盾,从而改善用户满意度和网络回程负载;与现有技术相比,本发明通过对基站进行聚类,将机器学习算法引入到对缓存内容的预测中,大大提高了缓存命中率,有效缓解回程链路负载,提高用户满意度。
具体实施方式
一种基于基站聚类的缓存方法,包括如下步骤:
(1)首先考虑基站聚类的问题;统计过去一段时间每个基站服务用户关于内容的请求频数,对于每个基站,将其服务用户对每个内容的请求频数作为这个基站的特征,采用k-means聚类对基站进行聚类,每个类的基站所服务的用户有相似的兴趣爱好,也就是请求的内容有很多相似的地方;
(2)基于基站的Top N协作滤波推荐***利用基站间的相似性预测基站覆盖用户未请求的内容;
(3)给定第一步中的每个类,根据类中内容流行度的分布,同时结合对每个类进行协作滤波对基站进行有针对性的缓存,确定每个基站所缓存的内容。
优选的,步骤(1)中具体的基站聚类包括如下步骤:
(11)根据过去一段时间的历史请求信息,通过核心网对数据的分析,得到内容流行度矩阵
Figure BDA0001381217740000031
其中矩阵中的每个元素pm,f代表基站m所服务的用户对内容f的请求频数,将内容的请求频数作为基站的特征,矩阵P的每一行pm表示一个F维的向量,代表了一个基站的特征向量;
(12)随机选择k基站作为基站聚类的初始中心点,其特征向量表示为
Figure BDA0001381217740000032
这里
Figure BDA0001381217740000033
上标(1)表示第一轮也就是初始值,下标表示第i个中心点;
(13)根据每个类的中心点,为使类内平方和最小,按照如下的方式确定基站属于哪一类:
Figure BDA0001381217740000041
这里
Figure BDA0001381217740000042
表示第t轮属于第i类的基站集合;
(14)根据步骤(13)划分的类,计算新的中心点:
Figure BDA0001381217740000043
(15)重复(13),(14)直到ci的变化小于给定阈值,最终得到k类,H1,...,Hk,每个基站属于其中的一个类。
优选的,步骤(2)中,类内基于基站协作滤波具体包括如下步骤:
(21)计算类内基站间的相似度
Figure BDA0001381217740000044
类内基站间的相似度通过如下相似度公式计算:
Figure BDA0001381217740000045
基站mi和基站mj属于同一个类,T(mi)和T(mj)分别表示基站mi和基站mj所服务的用户访问内容的集合;T(f)表示访问过内容f的基站的集合;
(22)根据(21)可以得到与基站mi最相近的基站的集合S(mi,G),则基站mi所服务的用户对过去一段时间从未请求过的内容f的感兴趣程度为
Figure BDA0001381217740000046
其中T(f)为对内容f产生过请求的基站的集合,
Figure BDA0001381217740000047
为基站mj对内容的f的感兴趣程度,此处为内容流行度矩阵P的元素。
优选的,步骤(3)中具体缓存方式包括如下步骤:
(31)首先对每个类中的内容流行度进行分析,也就是对类中所有基站服务的用户的请求内容进行统计,按内容访问次数从高到低进行排序;
(32)每个基站m的缓存容量为Sm;η为通过类内流行度缓存的内容所占缓存容量Sm的百分比,首先对内容根据类内流行度从高到低对基站进行缓存,每次缓存内容前,检查缓存内容的总大小是否超过η*Sm,若超过,则放弃缓存;
(33)对于基站剩余的缓存容量,通过类内基于基站协作滤波的步骤(22)进行缓存,对于内容按照p(m,f)由高到低进行缓存,直至缓存内容的总量大于缓存容量。
实施例:
考虑M基站的网络部署
Figure BDA0001381217740000051
每个基站通过回程链路连接到核心网,缓存容量为Sm,内容请求集合为
Figure BDA0001381217740000052
每个内容的大小为L(f)。R(m)为基站m服务用户请求内容的集合,C(m)为基站m缓存内容的集合。我们定义缓存命中率如下:
Figure BDA0001381217740000053
我们采用如下的方式进行缓存,包括以下步骤:
(1)首先考虑基站聚类的问题,具体得是,统计过去一段时间每个基站服务用户关于内容的请求频数。对于每个基站,本专利将其服务用户对每个内容的请求频数作为这个基站的特征,采用k-means聚类对基站进行聚类,每个类的基站所服务的用户有相似的兴趣爱好,也就是请求的内容有很多相似的地方。
(2)基于基站的Top N协作滤波推荐***利用基站间的相似性预测基站覆盖用户未请求的内容。
(3)给定第一步中的每个类,本专利根据类中内容流行度的分布,同时结合对每个类进行协作滤波对基站进行有针对性的缓存,确定每个基站所缓存的内容。
步骤(1)中具体的基站聚类步骤包括
(11)根据过去一段时间的历史请求信息,通过核心网对数据的分析。我们能够得到内容流行度矩阵
Figure BDA0001381217740000054
其中矩阵中的每个元素pm,f代表基站m所服务的用户对内容f的请求频数。将内容的请求频数作为基站的特征,矩阵P的每一行pm表示一个F维的向量,代表了一个基站的特征向量。
(12)随机选择k个基站作为基站聚类的初始中心点,其特征向量表示为
Figure BDA0001381217740000055
Figure BDA0001381217740000056
(13)根据每个类的中心点,为使类内平方和最小,按照如下的方式确定基站属于哪一类:
Figure BDA0001381217740000061
(14)根据步骤(3)划分的类,计算新的中心点:
Figure BDA0001381217740000062
(15)(15)重复(13),(14)直到ci的变化小于给定阈值。最终得到k类,H1,...,Hk,每个基站属于其中的一个类。
步骤(2)基于类内基站协作滤波的具体步骤如下:
(21)计算类内基站间的相似度
Figure BDA0001381217740000063
类内基站间的相似度通过如下相似度公式计算:
Figure BDA0001381217740000064
基站mi和基站mj属于同一个类,T(mi)和T(mj)分别表示基站mi基站mj所服务的用户访问内容的集合。其中T(f)表示访问过内容f的基站的集合。
(22)根据(21)可以得到与基站mi最相近的基站的集合S(mi,G),则基站mi所服务的用户对过去一段时间从未请求过的内容f的感兴趣程度为
Figure BDA0001381217740000065
其中T(f)为对内容f产生过请求的基站的集合。
Figure BDA0001381217740000066
为基站mj对内容的f的感兴趣程度,此处为内容流行度矩阵P的元素。
步骤(3)中具体缓存方式如下:
(31)首先对每个类中的内容流行度(类内流行度)进行分析,也就是对类中所有基站服务的用户的请求内容进行统计。按内容访问次数从高到低进行排序。
(32)每个基站m的缓存容量为Sm。η为通过类内流行度缓存的内容所占缓存容量Sm的百分比。首先对内容根据类内流行度从高到低对基站进行缓存,每次缓存内容前,检查缓存内容的总大小是否超过η*Sm。若超过,则放弃缓存。
(33)对于基站剩余的缓存容量,通过类内基于基站协作滤波的步骤(22)进行缓存,对于内容按照p(m,f)由高到低进行缓存,直至缓存内容的总量大于缓存容量。
尽管本发明就优选实施方式进行了示意和描述,但本领域的技术人员应当理解,只要不超出本发明的权利要求所限定的范围,可以对本发明进行各种变化和修改。

Claims (1)

1.一种基于基站聚类的缓存方法,其特征在于,包括如下步骤:
(1)首先考虑基站聚类的问题;统计过去一段时间每个基站服务用户关于内容的请求频数,对于每个基站,将其服务用户对每个内容的请求频数作为这个基站的特征,采用k-means聚类对基站进行聚类,每个类的基站所服务的用户有相似的兴趣爱好,也就是请求的内容有很多相似的地方;具体的基站聚类包括如下步骤:
(11)根据过去一段时间的历史请求信息,通过核心网对数据的分析,得到内容流行度矩阵
Figure FDA0002493392940000011
其中矩阵中的每个元素pm,f代表基站m所服务的用户对内容f的请求频数,将内容的请求频数作为基站的特征,矩阵P的每一行pm表示一个F维的向量,代表了一个基站的特征向量;
(12)随机选择k基站作为基站聚类的初始中心点,其特征向量表示为
Figure FDA0002493392940000012
Figure FDA0002493392940000013
这里
Figure FDA0002493392940000014
上标(1)表示第一轮也就是初始值,下标表示第i个中心点;
(13)根据每个类的中心点,为使类内平方和最小,按照如下的方式确定基站属于哪一类:
Figure FDA0002493392940000015
这里
Figure FDA0002493392940000016
表示第t轮属于第i类的基站集合;
(14)根据步骤(13)划分的类,计算新的中心点:
Figure FDA0002493392940000017
(15)重复(13),(14)直到ci的变化小于给定阈值,最终得到k类,H1,...,Hk,每个基站属于其中的一个类;
(2)基于基站的Top N协作滤波推荐***利用基站间的相似性预测基站覆盖用户未请求的内容;基于基站协作滤波具体包括如下步骤:
(21)计算类内基站间的相似度
Figure FDA0002493392940000018
类内基站间的相似度通过如下相似度公式计算:
Figure FDA0002493392940000019
基站mi和基站mj属于同一个类,T(mi)和T(mj)分别表示基站mi和基站mj所服务的用户访问内容的集合;T(f)表示访问过内容f的基站的集合;
(22)根据(21)可以得到与基站mi最相近的基站的集合S(mi,G),则基站mi所服务的用户对过去一段时间从未请求过的内容f的感兴趣程度为
Figure FDA0002493392940000021
其中T(f)为对内容f产生过请求的基站的集合,
Figure FDA0002493392940000022
为基站mj对内容的f的感兴趣程度,此处为内容流行度矩阵P的元素;
(3)给定第一步中的每个类,根据类中内容流行度的分布,同时结合对每个类进行协作滤波对基站进行有针对性的缓存,确定每个基站所缓存的内容;具体缓存方式包括如下步骤:
(31)首先对每个类中的内容流行度进行分析,也就是对类中所有基站服务的用户的请求内容进行统计,按内容访问次数从高到低进行排序;
(32)每个基站m的缓存容量为Sm;η为通过类内流行度缓存的内容所占缓存容量Sm的百分比,首先对内容根据类内流行度从高到低对基站进行缓存,每次缓存内容前,检查缓存内容的总大小是否超过η*Sm,若超过,则放弃缓存;
(33)对于基站剩余的缓存容量,通过类内基于基站协作滤波的步骤(22)进行缓存,对于内容按照p(m,f)由高到低进行缓存,直至缓存内容的总量大于缓存容量。
CN201710704882.3A 2017-08-17 2017-08-17 基于基站聚类的缓存方法 Active CN107592656B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201710704882.3A CN107592656B (zh) 2017-08-17 2017-08-17 基于基站聚类的缓存方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201710704882.3A CN107592656B (zh) 2017-08-17 2017-08-17 基于基站聚类的缓存方法

Publications (2)

Publication Number Publication Date
CN107592656A CN107592656A (zh) 2018-01-16
CN107592656B true CN107592656B (zh) 2020-12-11

Family

ID=61043151

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201710704882.3A Active CN107592656B (zh) 2017-08-17 2017-08-17 基于基站聚类的缓存方法

Country Status (1)

Country Link
CN (1) CN107592656B (zh)

Families Citing this family (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108667653B (zh) * 2018-04-17 2020-12-11 东南大学 超密集网络中基于聚类的缓存配置方法及装置
CN108600365B (zh) * 2018-04-20 2020-05-22 西安交通大学 一种基于排序学习的无线异构网络缓存方法
CN108549719A (zh) * 2018-04-23 2018-09-18 西安交通大学 一种移动边缘计算网络中基于聚类的自适应缓存方法
CN108738048B (zh) * 2018-04-25 2021-02-26 杭州电子科技大学 一种基于遗传算法的最大化公平性基站主动存储方法
CN108833352B (zh) * 2018-05-17 2020-08-11 北京邮电大学 一种缓存方法及***
CN108990111B (zh) * 2018-06-13 2021-06-11 东南大学 一种内容流行度随时间变化下的基站缓存方法
CN109639844B (zh) * 2019-02-26 2020-06-05 北京中投视讯文化传媒股份有限公司 一种基站以及基于局部流行度的内容缓存方法
CN112995979B (zh) * 2021-03-04 2022-01-25 中国科学院计算技术研究所 一种面向用户QoE需求的无线网络缓存推荐方法
CN113709816B (zh) * 2021-06-04 2024-03-22 武汉大学 一种基于多特征用户群体的基站协作缓存方法

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6651141B2 (en) * 2000-12-29 2003-11-18 Intel Corporation System and method for populating cache servers with popular media contents
CN103428267A (zh) * 2013-07-03 2013-12-04 北京邮电大学 一种智慧缓存***及其区分用户喜好相关性的方法
CN104955077A (zh) * 2015-05-15 2015-09-30 北京理工大学 一种基于用户体验速率的异构网络小区分簇方法及装置
CN106453495A (zh) * 2016-08-31 2017-02-22 北京邮电大学 一种基于内容流行度预测的信息中心网络缓存方法
CN106714202A (zh) * 2015-11-16 2017-05-24 ***通信集团公司 一种网络容量优化方法及装置

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6651141B2 (en) * 2000-12-29 2003-11-18 Intel Corporation System and method for populating cache servers with popular media contents
CN103428267A (zh) * 2013-07-03 2013-12-04 北京邮电大学 一种智慧缓存***及其区分用户喜好相关性的方法
CN104955077A (zh) * 2015-05-15 2015-09-30 北京理工大学 一种基于用户体验速率的异构网络小区分簇方法及装置
CN106714202A (zh) * 2015-11-16 2017-05-24 ***通信集团公司 一种网络容量优化方法及装置
CN106453495A (zh) * 2016-08-31 2017-02-22 北京邮电大学 一种基于内容流行度预测的信息中心网络缓存方法

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
内容流行度分布动态性对基站端缓存性能的影响;戚凯强等;《信号处理》;20170331;第33卷(第3期);参见第1-4部分 *

Also Published As

Publication number Publication date
CN107592656A (zh) 2018-01-16

Similar Documents

Publication Publication Date Title
CN107592656B (zh) 基于基站聚类的缓存方法
CN108667653B (zh) 超密集网络中基于聚类的缓存配置方法及装置
CN110213627B (zh) 一种基于多小区用户移动性的流媒体缓存分配方法
Yu et al. Federated learning based proactive content caching in edge computing
CN107909108A (zh) 基于内容流行度预测的边缘缓存***及其方法
CN108549719A (zh) 一种移动边缘计算网络中基于聚类的自适应缓存方法
CN105812834B (zh) 基于聚类信息的视频推荐服务器、推荐方法和预缓存方法
CN101287280A (zh) 在异构无线网络中选择网络的方法和装置
CN107277159B (zh) 一种基于机器学习的超密集网络小站缓存方法
CN107734482B (zh) 基于d2d和业务卸载的内容分发方法
CN108668287A (zh) 一种基于用户内容流行度和移动规则的主动缓存方法
Bock et al. A 2-step approach to improve data-driven parking availability predictions
Khan et al. On the application of agglomerative hierarchical clustering for cache-assisted D2D networks
CN115314944A (zh) 基于移动车辆社会关系感知的车联网协作缓存方法
CN108600365B (zh) 一种基于排序学习的无线异构网络缓存方法
CN108063802B (zh) 基于边缘计算的用户位置动态性建模优化方法
CN115361710A (zh) 一种边缘缓存中的内容放置方法
CN113472420B (zh) 一种基于区域用户兴趣感知的卫星网络缓存放置方法
CN113037872B (zh) 一种基于物联网多级边缘节点的缓存和预取方法
CN112862060A (zh) 一种基于深度学习的内容缓存方法
CN108810139A (zh) 一种基于蒙特卡洛树搜索辅助的无线缓存方法
Wu et al. Semigradient-based cooperative caching algorithm for mobile social networks
CN116634396A (zh) 基于图注意力的车联网多智能体边缘计算内容缓存决策方法
CN114025017B (zh) 基于深度循环强化学习的网络边缘缓存方法、装置及设备
CN111901394B (zh) 一种联合考虑用户偏好及活跃程度的移动边缘缓存的方法及***

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant