CN111787592B - 一种基于谱聚类和c4.5算法的机会路由实现方法 - Google Patents

一种基于谱聚类和c4.5算法的机会路由实现方法 Download PDF

Info

Publication number
CN111787592B
CN111787592B CN202010607907.XA CN202010607907A CN111787592B CN 111787592 B CN111787592 B CN 111787592B CN 202010607907 A CN202010607907 A CN 202010607907A CN 111787592 B CN111787592 B CN 111787592B
Authority
CN
China
Prior art keywords
node
community
message
nodes
algorithm
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202010607907.XA
Other languages
English (en)
Other versions
CN111787592A (zh
Inventor
周军海
吴海涵
秦拯
张吉昕
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Hunan University
Original Assignee
Hunan University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Hunan University filed Critical Hunan University
Priority to CN202010607907.XA priority Critical patent/CN111787592B/zh
Publication of CN111787592A publication Critical patent/CN111787592A/zh
Application granted granted Critical
Publication of CN111787592B publication Critical patent/CN111787592B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04WWIRELESS COMMUNICATION NETWORKS
    • H04W40/00Communication routing or communication path finding
    • H04W40/02Communication route or path selection, e.g. power-based or shortest path routing
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/23Clustering techniques
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04WWIRELESS COMMUNICATION NETWORKS
    • H04W40/00Communication routing or communication path finding
    • H04W40/02Communication route or path selection, e.g. power-based or shortest path routing
    • H04W40/04Communication route or path selection, e.g. power-based or shortest path routing based on wireless node resources
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04WWIRELESS COMMUNICATION NETWORKS
    • H04W40/00Communication routing or communication path finding
    • H04W40/02Communication route or path selection, e.g. power-based or shortest path routing
    • H04W40/04Communication route or path selection, e.g. power-based or shortest path routing based on wireless node resources
    • H04W40/10Communication route or path selection, e.g. power-based or shortest path routing based on wireless node resources based on available power or energy
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04WWIRELESS COMMUNICATION NETWORKS
    • H04W40/00Communication routing or communication path finding
    • H04W40/02Communication route or path selection, e.g. power-based or shortest path routing
    • H04W40/12Communication route or path selection, e.g. power-based or shortest path routing based on transmission quality or channel quality
    • H04W40/14Communication route or path selection, e.g. power-based or shortest path routing based on transmission quality or channel quality based on stability
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04WWIRELESS COMMUNICATION NETWORKS
    • H04W40/00Communication routing or communication path finding
    • H04W40/24Connectivity information management, e.g. connectivity discovery or connectivity update
    • H04W40/248Connectivity information update

Landscapes

  • Engineering & Computer Science (AREA)
  • Signal Processing (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Data Mining & Analysis (AREA)
  • Theoretical Computer Science (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Evolutionary Biology (AREA)
  • Evolutionary Computation (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Artificial Intelligence (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Data Exchanges In Wide-Area Networks (AREA)

Abstract

本发明涉及一种基于谱聚类和C4.5算法的机会路由实现方法。其发明内容主要包括:(1)亲密度权重计算方法;(2)基于谱聚类的子社区划分方法;(3)基于C4.5算法的“信使节点”识别模型;(4)基于亲密社区和决策树算法的机会路由实现方法。通过谱聚类将节点社区化,当源节点与目的节点同社区时,基于简单的泛洪传递消息,提高消息传递效率。当源节点与目的节点不同社区时,通过决策树模型确定“信使节点”,利用“信使节点”充当媒介,将消息传递至目的社区,实现跨社区传递消息。

Description

一种基于谱聚类和C4.5算法的机会路由实现方法
技术领域
本发明涉及机器学习领域和无线通信技术领域,一种基于谱聚类和C4.5算法的机会路由实现方法。
背景技术
随着5G的兴起,无线通信技术的快速发展,越来越多小体积、低成本、具有短距离通信能力的移动终端设备得以大规模的普及。无线通信网络因其通信灵活、部署简单、成本低廉等特点被广泛应用到地下、水下、深空、山丘等各种极端的、具有挑战性的特殊环境中。但在这些应用中,由于节点移动、节点稀疏、射频关闭或障碍物造成信号衰减等多种原因都可能导致网络在大多数时候不能连通。在这种网络环境中,传统的MANET通信模式无法适用。而机会网络因其特殊的通信方式“存储-携带-转发”,可以有效地解决上述问题,但由于机会网络的拓扑动态变化,节点之间没有相对稳定的数据传输路径。因此,实现具有良好路由性能的路由协议是机会网络研究中最具挑战性的问题之一。
为了克服机会网络中不可预测性和高移动性带来的问题,已提出了许多路由协议,这些协议试图利用节点自身的移动性来帮助进行路由,大多数都采用基于泛洪的方法,其中消息以有限的生存时间(TTL)在整个网络中传播。节点通过在洪泛期间将副本发送到其他节点来帮助消息到达其目的地。虽然洪泛提高了传递概率,但它需要高开销,会消耗许多节点能量。因此,对于有限能量的移动节点,简单的泛洪是不切实际的。
随着人工智能的发展,机器学习算法在研究优化问题方面取得了很大的进步。因此可以考虑在机会网络领域中结合机器学习方法进行优化改进,自适应转发消息。目前谱聚类(spectral clustering,SC)是一种广泛使用的聚类算法,比起传统的K-Means算法,谱聚类对数据分布的适应性更强,对于处理稀疏数据的聚类很有效,同时聚类的计算量也小很多。C4.5算法是机器学习算法中的一个分类决策树算法,它是基于ID3算法进行改进后的一种重要算法,对于数据分类方面具有良好效果。因此本发明利用谱聚类划分的亲密社区,以及基于C4.5算法构造的“信使节点”识别模型来辅助机会网络中的消息转发。
发明内容
本发明提出了一种基于谱聚类和C4.5算法的机会路由实现方法,主要包括四大内容:
(1)亲密度权重计算方法;
(2)基于谱聚类的子社区划分方法;
(3)基于C4.5算法的“信使节点”识别模型;
(4)基于亲密社区和决策树算法的机会路由实现方法。
具体内容如下:
(1)亲密度权重计算方法。
定义1节点间亲密度越高,则认为越容易进行通信。本发明将单位时间内,节点间平均间隔通信时间的倒数作为其亲密度。它的意义表示两节点等待下一次通信时间越短,说明它们越亲密。平均间隔通信时间通过以下公式计算:
Figure BDA0002561456730000021
其中Intervals(i,j)表示节点i与节点j之间的平均间隔通信时间,delay_time(i,j,n)表示节点i与节点j第n次间隔时长,count表示单位时间内节点i与节点j之间通信总次数。间隔时长等于本次开始通信时刻减去上次结束通信时刻。
节点间的亲密度可通过以下公式计算:
Figure BDA0002561456730000031
其中λ(i,j)表示节点i与节点j之间的亲密度。若单位时间内,节点间仅通信一次,则简单认为该节点对之间的亲密度为0。
考虑到单位时间内节点通信频次的重要性,最终亲密度定义将综合考虑节点通信频次,具体公式如下:
Intimacy(i,j)=count*λ(i,j)
其中Intimacy(i,j)表示节点i与节点j之间的最终亲密度。最后,按该公式计算节点间的亲密度,并以此作为其权重,构建一张无向有权通信图,以矩阵存储通信图信息,以便分析和挖掘节点间的社区特征等重要信息。
(2)基于谱聚类的子社区划分方法。
谱聚类(Spectral Clustering,SC)是一种基于图论的聚类方法,通过对所有节点组成的图进行切图,让切图后不同的子图间边权重和尽可能的低,而子图内的边权重和尽可能的高,从而达到聚类的目的。本发明采用谱聚类将通信图进行划分,构建多个子社区。具体步骤如下:
邻接矩阵构建:基于方法(1)中得到的通信图,获取图中边的权重信息构建邻接矩阵W。
度矩阵构建:对于图中的任意一个点vi,它的度di定义为和它相连的所有边的权重之和,即
Figure BDA0002561456730000032
基于已构建的邻接矩阵,利用每个点的度,得到一个n维的度矩阵D,它是一个对角矩阵,只有主对角线有值,对应第i行的第i个点的度数。
计算并归一化拉普拉斯矩阵:拉普拉斯矩阵的定义公式如下:
L=D-W
归一化拉普拉斯矩阵可通过以下公式计算:
Figure BDA0002561456730000041
计算归一化拉普拉斯矩阵Q的k1个特征值所各自对应的特征向量f:该步骤巧妙地将切图问题转换为拉普拉斯矩阵特征值问题,将离散的聚类问题,松弛为连续的特征向量,最小的系列特征向量对应着图最优的系列划分方法。
最后将各自对应的特征向量f组成的矩阵按行标准化,组成n×k1维的特征矩阵F。对F中的每一行作为一个k1维的样本,共n个样本,用输入的聚类方法进行聚类,聚类维数为k2。得到簇
Figure BDA0002561456730000042
构建多个子社区。
(3)基于C4.5算法的“信使节点”识别模型。
由于机会网络中,处于同一社区中的节点往往会经常“见面”,便于消息的转发。当转发消息给某节点时,可通过将消息转发给该节点所处社区中的其他节点,其他节点在子社区内进行泛洪,可提高消息传递效率,将消息快速传递给目的节点。方法(2)中得到多个子社区后,若源节点与目的节点处于同一子社区中,只需简单地在该社区中进行泛洪,就能大概率的将消息成功传递至目的节点。若源节点与目的节点不在同一社区中,需要跨社区传递消息时,需要寻找一些游离于多个子社区中的“信使节点”。因此通过获取节点的一些属性特征,采用C4.5算法构造一个可以识别出“信使节点”的模型,利用该模型确定“信使节点”。具体步骤如下:
特征选择:在机会网络中,以下属性特征对于确定“信使节点”往往很有意义。
1)节点活跃度:表示节点的活动能力。通过一段时间内,平均邻居节点数来衡量;
2)节点中心度:表示节点的重要程度。通过分析节点相遇历史记录得出与该节点相连的其他节点的类型数。类型数越多表示该节点中心点越大;
3)节点新近度:基于最近多长时间该节点与其他任意节点建立连接;
4)节点可靠度:基于节点过去传递消息的成功次数与总次数的比值;
5)节点空闲缓冲空间:如果空闲缓存空间剩余不多或几乎没有剩余,则消息传递的机会比较小;
6)节点传输速度:不同节点的传输速度往往不一致,传输速度越快,表示节点传输能力越强;
7)节点传输范围:传输范围越大,表示节点越容易发现目的节点;
8)节点剩余能量:每个节点都会消耗能量,当能量消耗完时,节点会陷入死机状态。
决策树构造:决策树构造的关键问题是,选择哪个属性作为根节点、哪些属性作为内部节点以及何时停止并得到目标状态,即叶节点。本发明中采用C4.5算法,通过计算比较每个属性的信息增益比作为特征选择准则。具体步骤如下:
训练数据准备:基于节点通信历史记录,计算并统计节点的各个属性特征,格式如下表。
编号 活跃度 中心度 新近度 可靠度 空闲缓存 传输速度 传输范围 剩余能量 游离社区
1 5 8 3 0.2 10 20 10 50
n 10 8 5 0.6 50 15 10 100
信息熵计算:在信息论中,熵是随机变量不确定性的度量。熵越大,则随机变量的不确定性越大。可通过以下公式计算每个节点属性的信息熵:
Figure BDA0002561456730000061
其中Entropy(t)表示信息熵,pk|t表示节点t为分类k的概率。
信息增益计算:信息增益表示得知某属性特征X的信息而使得类Y信息的不确定性减少的程度,可通过以下公式计算:
Figure BDA0002561456730000062
Gain(N,i)表示信息增益,N是父亲节点,Nk是子节点,Gain(N,i)中的i作为N节点的属性选择。
信息增益比计算:ID3在计算的时候,倾向于选择取值多的属性。为了避免这个问题,C4.5进行了改进,采用信息增益比的方式来选择属性。具体公式如下:
Figure BDA0002561456730000063
Figure BDA0002561456730000064
最后,根据计算结果,选择信息增益比最大的属性作为根节点,根据该属性的不同取值建立子节点;对每个子节点使用相同的方式生成新的子节点,直到信息增益比很小或者没有特征可以选择为止,完成决策树构造。
(4)基于亲密社区和决策树算法的机会路由实现方法。
基于亲密社区和决策树算法的机会路由实现方法可分为3个阶段,分别为社区划分阶段、决策树模型训练阶段和传输阶段。在社区划分阶段,基于方法(2)利用谱聚类将所有通信节点划分为多个子社区。在决策树模型训练阶段,基于方法(3)采用C4.5算法,采集训练数据,通过获取节点的一些属性特征,训练一个可以识别出“信使节点”决策树模型。在传输阶段,分为两种消息传递方式:同社区传递消息和跨社区传递消息。当源节点与目的节点同社区时,采用同社区传递消息方式:源节点遇到邻居节点,判断邻居节点是否与目的节点同社区,若是,复制转发消息,否则,节点继续移动。当源节点与目的节点不同社区时,采用跨社区传递消息方式:源节点遇到邻居节点,判断邻居节点是否与目的节点同社区,若是,复制转发消息,否则,基于训练好的决策树模型判断该节点是否为“信使节点”,若是,复制转发消息,否则,节点继续移动。
附图说明
图1为本发明工作流程图。
具体实施方式
本发明是一种基于谱聚类和C4.5算法的机会路由实现方法,具体步骤如下:
步骤一:数据准备
节点移动往往具有一定的规律性以及周期性,因此根据节点移动的周期性,采集特定时间范围内的节点通信历史记录,并基于亲密度函数计算节点间亲密度,以此作为其权重,构建一张无向有权通信图。
步骤二:子社区划分
基于谱聚类方法,将无向有权通信图进行聚类划分,得到多个子社区。不同社区中的节点,采用不同标志进行标注,并定义表结构进行存储。
步骤三:决策树模型构建
对于跨社区传递消息时,往往需要“信使节点”作为媒介将消息传递至目的社区,因此基于C4.5算法,采集训练数据,通过获取节点的一些属性特征,训练一个可以识别出“信使节点”的决策树模型。
步骤四:消息传递
当源节点与目的节点同社区时,采用同社区传递消息方式:源节点移动遇到邻居节点,判断邻居节点是否与目的节点同社区,若是,复制转发消息,否则,节点继续移动。当源节点与目的节点不同社区时,采用跨社区传递消息方式:源节点移动遇到邻居节点,判断邻居节点是否与目的节点同社区,若是,复制转发消息,否则,基于训练好的决策树模型判断该节点是否为“信使节点”,若是,复制转发消息,否则,节点继续移动。

Claims (1)

1.一种基于谱聚类和C4.5算法的机会路由实现方法,其特征包括:
(1)亲密度权重计算方法;
(2)基于谱聚类的子社区划分方法;
(3)基于C4.5算法的“信使节点”识别模型;
(4)基于亲密社区和决策树算法的机会路由实现方法;
所述(1)亲密度权重计算方法的特征是:由于节点通信往往具有一定的规律性以及社会属性,因此基于节点历史通信记录,利用新定义的亲密度函数计算节点间的亲密度,并以此作为其权重,构建一张无向有权通信图,以便分析和挖掘节点间的社区特征信息;
所述(2)基于谱聚类的子社区划分方法的特征是:由于机会网络中,处于同一个社区中节点往往会经常“见面”,便于消息的转发,因此基于谱聚类将通信图划分为多个子图,构建多个子社区,当转发消息给某节点时,可通过将消息转发给该节点所处社区中的其他节点,其他节点在社区内进行复制转发,可提高消息传递效率,将消息快速传递给目的节点;
所述(3)基于C4.5算法的“信使节点”识别模型的特征是:同一社区中的节点消息传递快速可靠,当跨社区传递消息时,需要寻找一些游离于多个子社区中的“信使节点”,因此通过获取节点的活跃度、中心度、新近度、可靠度、空闲缓存空间、传输速度、传输范围、剩余能量属性特征,采用C4.5算法构造一个可以识别出“信使节点”的模型,利用该模型确定“信使节点”;
所述(4)基于亲密社区和决策树算法的机会路由实现方法的特征是:基于划分后的多个子社区以及训练好的决策树模型,当源节点与目的节点同社区时,只在该子社区中进行复制转发消息,当源节点与目的节点不同社区时,利用决策树模型识别“信使节点”,通过“信使节点”将消息传递至目的社区,目的社区中节点进行复制转发消息,最终传递给目的节点。
CN202010607907.XA 2020-06-30 2020-06-30 一种基于谱聚类和c4.5算法的机会路由实现方法 Active CN111787592B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202010607907.XA CN111787592B (zh) 2020-06-30 2020-06-30 一种基于谱聚类和c4.5算法的机会路由实现方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202010607907.XA CN111787592B (zh) 2020-06-30 2020-06-30 一种基于谱聚类和c4.5算法的机会路由实现方法

Publications (2)

Publication Number Publication Date
CN111787592A CN111787592A (zh) 2020-10-16
CN111787592B true CN111787592B (zh) 2022-07-19

Family

ID=72759878

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202010607907.XA Active CN111787592B (zh) 2020-06-30 2020-06-30 一种基于谱聚类和c4.5算法的机会路由实现方法

Country Status (1)

Country Link
CN (1) CN111787592B (zh)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112291827A (zh) * 2020-10-29 2021-01-29 王程 社会属性驱动的容迟网络路由改良算法

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107071844A (zh) * 2017-06-13 2017-08-18 湘潭大学 一种基于谱聚类社区划分的机会网络路由方法
CN108809709A (zh) * 2018-06-06 2018-11-13 山东大学 一种基于节点亲密性与标签传播的社区发现方法
CN109492673A (zh) * 2018-10-19 2019-03-19 南京理工大学 一种基于谱聚类采样的不平衡数据预测方法
CN109716346A (zh) * 2016-07-18 2019-05-03 河谷生物组学有限责任公司 分布式机器学习***、装置和方法
CN110493142A (zh) * 2019-07-05 2019-11-22 南京邮电大学 基于谱聚类和随机森林算法的移动应用程序行为识别方法
CN111343690A (zh) * 2020-03-01 2020-06-26 内蒙古科技大学 一种基于细粒度社会关系及社区协作的机会网络路由方法

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20190019254A1 (en) * 2017-07-14 2019-01-17 Allstate Insurance Company Distributed data processing systems for processing remotely captured sensor data

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109716346A (zh) * 2016-07-18 2019-05-03 河谷生物组学有限责任公司 分布式机器学习***、装置和方法
CN107071844A (zh) * 2017-06-13 2017-08-18 湘潭大学 一种基于谱聚类社区划分的机会网络路由方法
CN108809709A (zh) * 2018-06-06 2018-11-13 山东大学 一种基于节点亲密性与标签传播的社区发现方法
CN109492673A (zh) * 2018-10-19 2019-03-19 南京理工大学 一种基于谱聚类采样的不平衡数据预测方法
CN110493142A (zh) * 2019-07-05 2019-11-22 南京邮电大学 基于谱聚类和随机森林算法的移动应用程序行为识别方法
CN111343690A (zh) * 2020-03-01 2020-06-26 内蒙古科技大学 一种基于细粒度社会关系及社区协作的机会网络路由方法

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
SeScR: SDN-Enabled Spectral Clustering-Based Optimized Routing Using Deep Learning in VANET Environment;Laxmi Subedi等;《Proceedings of 2010 IEEE International Symposium on Circuits and Systems》;20100803;全文 *
认知无线车载自组织网络中的联合路由调度;张沪寅等;《计算机研究与发展》;20171115(第11期);全文 *

Also Published As

Publication number Publication date
CN111787592A (zh) 2020-10-16

Similar Documents

Publication Publication Date Title
Ali et al. Deep reinforcement learning paradigm for performance optimization of channel observation–based MAC protocols in dense WLANs
US20060146791A1 (en) Network coding approach to rapid information dissemination
CN111787000B (zh) 网络安全评估方法及电子设备
Rida et al. EK-means: A new clustering approach for datasets classification in sensor networks
Kuo et al. Quantum-inspired algorithm for cyber-physical visual surveillance deployment systems
Rafique et al. Application of evolutionary algorithms in detecting SMS spam at access layer
CN111787592B (zh) 一种基于谱聚类和c4.5算法的机会路由实现方法
Arkian et al. FcVcA: A fuzzy clustering-based vehicular cloud architecture
CN113516501A (zh) 一种基于图神经网络的用户通信行为预测方法和装置
Shahina et al. Clustering and data aggregation in wireless sensor networks using machine learning algorithms
Bharti et al. Clustering‐based resource discovery on Internet‐of‐Things
Qaim et al. DRAW: Data replication for enhanced data availability in IoT-based sensor systems
Loukas et al. Think globally, act locally: On the reshaping of information landscapes
Jyothi et al. MSoC: Multi-scale optimized clustering for energy preservation in wireless sensor network
Keipour et al. Generalizing supervised learning for intrusion detection in IoT mesh networks
Nabavi et al. Intelligent optimization of qos in wireless sensor networks using multiobjective grey wolf optimization algorithm
Ebrahimi et al. A new meta-heuristic approach for efficient search in the internet of things
Albalas et al. Detecting black hole attacks in MANET using relieff classification algorithm
CN111597139B (zh) 一种gpu的通信方法、***、设备以及介质
Noghabi et al. Optimized query forwarding for resource discovery in unstructured peer-to-peer grids
Marian et al. Sensing clouds: A distributed cooperative target tracking with tiny binary noisy sensors
Lakshmi et al. Socialized Proficient Routing in Opportunistic Mobile Network Using Machine Learning Techniques.
Thamizhmaran et al. Performance Analysis of Hybridization of [PIO-GSO] Algorithms in Wireless Sensor Networks
CN116367178B (zh) 无人集群自适应组网方法与装置
Chouhan et al. A survey on the applications of machine learning in wireless sensor networks

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant