CN105406993A - 一种加密流的识别方法及装置 - Google Patents

一种加密流的识别方法及装置 Download PDF

Info

Publication number
CN105406993A
CN105406993A CN201510710376.6A CN201510710376A CN105406993A CN 105406993 A CN105406993 A CN 105406993A CN 201510710376 A CN201510710376 A CN 201510710376A CN 105406993 A CN105406993 A CN 105406993A
Authority
CN
China
Prior art keywords
data message
testing data
window
stream
assessed value
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201510710376.6A
Other languages
English (en)
Inventor
张风雨
白冰
扈红超
张传浩
杜飞
王鹏
程国振
朱珂
王志明
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
PLA Information Engineering University
Original Assignee
PLA Information Engineering University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by PLA Information Engineering University filed Critical PLA Information Engineering University
Priority to CN201510710376.6A priority Critical patent/CN105406993A/zh
Publication of CN105406993A publication Critical patent/CN105406993A/zh
Pending legal-status Critical Current

Links

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L41/00Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks
    • H04L41/28Restricting access to network management systems or functions, e.g. using authorisation function to access network configuration

Landscapes

  • Engineering & Computer Science (AREA)
  • Computer Security & Cryptography (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Signal Processing (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本发明提出了一种加密流的识别方法及装置,该方法包括:步骤1,基于窗口跃迁在数据流中选择待测数据报文;步骤2,根据待测数据报文计算评估值;步骤3,基于评估值判断所述数据流是否加密。该装置包括:选择模块、计算模块和判断模块。本发明能够快速、准确的识别出各种加密的数据流,解决了现有技术中对各种加密流量识别的普适性问题。

Description

一种加密流的识别方法及装置
技术领域
本发明涉及网络通信技术领域,尤其涉及一种加密流的识别方法及装置。
背景技术
网上非法活动和翻墙穿透行为普遍采用加密通信。为了加强网络管理,实现网络有序管控的目标,需要在线识别加密流量。加密流识别面临三个难题:1)加密流量的内容千差万别,不具备统一的内容特征,难以匹配;2)加密流量的报文长度、到达间隔和传输方向完全由其所承载的业务决定,与非加密流量具有类似的流量特征;3)加密协议的多样化使得通过分析协议连接过程完成识别的可扩展性较差。
现有加密流识别技术大多从加密协议的握手特征出发,利用协议在握手及密钥协商阶段的通信特性,结合机器学习算法进行识别。这些方法仅对特定加密协议的特定版本有效,不具有普适性。
发明内容
本发明要解决的技术问题是,提供一种加密流的识别方法及装置,以解决现有技术中对各种加密流量识别的普适性问题。
本发明采用的技术方案是,所述加密流的识别方法,包括:
步骤1,基于窗口跃迁在数据流中选择待测数据报文;
步骤2,根据待测数据报文计算评估值;
步骤3,基于评估值判断所述数据流是否加密。
进一步的,步骤1具体包括:
设置一读取数据报文的窗口,所述窗口的长度为相邻的两个待测数据报文之间间隔的数据报文数量;
针对接收到的数据流,选择所述数据流的首个数据报文作为第一个待测数据报文,然后利用所述窗口在数据流中的跃迁来依次选择后续的待测数据报文。
进一步的,每次选择待测数据报文时对应的跃迁的窗口长度均遵循设定的函数关系。
进一步的,所述设定的函数关系为等差数列时,设所述窗口的长度为d,满足如下条件:针对第I次选择的待测数据报文,所需跃迁的窗口的长度d=D×(I-1),D为设定的延迟常数,I为大于1的整数。
进一步的,步骤2具体包括:针对每个待测数据报文执行WARE(Weighting-basedAdaptiveRandomnessEstimation,基于加权累计的自适应随机性评估算法),包括如下处理:
A1:将待测数据报文的二进制序列中的所有0替换为-1,生成变形序列ηi
A2:针对变形序列ηi的前k项和1≤k≤n,计算变形序列ηi的最大偏移值z=max[S1,S2,…,Sn],n为待测数据报文的二进制序列的长度,则评估值为 I ( z ) = 1 - Σ j = ( - n z + 1 ) / 4 ( n z - 1 ) / 4 [ Φ ( ( 4 j + 1 ) z n ) - Φ ( ( 4 j - 1 ) z n ) ] + Σ j = ( - n z - 3 ) / 4 ( n z - 1 ) / 4 [ Φ ( ( 4 j + 3 ) z n ) - Φ ( ( 4 j + 1 ) z n ) ] , 其中,Φ(x)为标准正态分布函数,
进一步的,步骤2还包括:
A3,将步骤A2得到的评估值与历史评估值进行加权综合,得到最终用于判断所述数据流是否加密的评估值;
所述历史评估值的获取过程包括:将执行完步骤A3时得到的评估值作为历史评估值进行保存,替换前一次保存的历史评估值。
进一步的,步骤3具体包括:
判断所述待测数据报文对应的评估值是否大于设定的评估阈值,若是,则判定所述数据流为加密流,否则判定所述数据流量为非加密流。
进一步的,步骤3具体包括:
B1,判断所述待测数据报文对应的评估值是否大于设定的评估阈值,若是,则判定所述数据流为加密流,否则执行步骤B2;
B2,判断窗口跃迁的次数是否达到设定的次数阈值,若是,则判定所述数据流量为非加密流,否则按照步骤1重新选择一待测数据报文执行所述方法。
本发明还提供一种加密流的识别装置,包括:
选择模块,用于基于窗口跃迁在数据流中选择待测数据报文;
计算模块,用于根据待测数据报文计算评估值;
判断模块,用于基于评估值判断所述数据流是否加密。
采用上述技术方案,本发明至少具有下列优点:
本发明所述加密流的识别方法及装置,能够快速、准确的识别出各种加密的数据流,解决了现有技术中对各种加密流量识别的普适性问题。
附图说明
图1为本发明第一实施例的加密流的识别方法流程图;
图2为本发明第二实施例的加密流的识别装置组成示意图;
图3为本发明第三实施例的基于窗口跃迁的协议不相关加密流识别方法流程图;
图4为本发明第三实施例的对理想识别点的数据报文实施WARE算法的具体流程图;
图5为本发明第三实施例的基于窗口跃迁的协议不相关加密流识别装置结构示意图。
具体实施方式
为更进一步阐述本发明为达成预定目的所采取的技术手段及功效,以下结合附图及较佳实施例,对本发明进行详细说明如后。
本发明第一实施例,一种加密流的识别方法,如图1所示,包括以下具体步骤:
步骤S101,基于窗口跃迁在数据流中选择待测数据报文。
具体的,步骤S101包括:
设置一读取数据报文的窗口,所述窗口的长度为相邻的两个待测数据报文之间间隔的数据报文数量;
针对接收到的数据流,选择所述数据流的首个数据报文作为第一个待测数据报文,然后利用所述窗口在数据流中的跃迁来依次选择后续的待测数据报文。
进一步的,每次选择待测数据报文时对应的跃迁的窗口长度均遵循设定的函数关系。比如,当该设定的函数关系为等差数列时,设所述窗口的长度为d,满足如下条件:针对第I次选择的待测数据报文,所需跃迁的窗口的长度d=D×(I-1),D为设定的延迟常数,I为大于1的整数。
步骤S102,根据待测数据报文计算评估值。
具体的,步骤S102包括:针对每个待测数据报文执行WARE算法,包括如下处理:
A1:将待测数据报文的二进制序列中的所有0替换为-1,生成变形序列ηi
A2:针对变形序列ηi的前k项和1≤k≤n,计算变形序列ηi的最大偏移值z=max[S1,S2,…,Sn],n为待测数据报文的二进制序列的长度,则评估值为 I ( z ) = 1 - Σ j = ( - n z + 1 ) / 4 ( n z - 1 ) / 4 [ Φ ( ( 4 j + 1 ) z n ) - Φ ( ( 4 j - 1 ) z n ) ] + Σ j = ( - n z - 3 ) / 4 ( n z - 1 ) / 4 [ Φ ( ( 4 j + 3 ) z n ) - Φ ( ( 4 j + 1 ) z n ) ] , 其中,Φ(x)为标准正态分布函数,
优选的,为了进一步提高对加密数据流的判断准确度,本实施例的步骤S102还包括下述具体步骤:
A3,将步骤A2得到的评估值与历史评估值进行加权综合,得到最终用于判断所述数据流是否加密的评估值;
所述历史评估值的获取过程包括:将执行完步骤A3时得到的评估值作为历史评估值进行保存,替换前一次保存的历史评估值。
步骤S103,基于评估值判断所述数据流是否加密。
具体的,步骤S103具体包括:
判断所述待测数据报文对应的评估值是否大于设定的评估阈值,若是,则判定所述数据流为加密流,否则判定所述数据流量为非加密流。
优选的,为了进一步提高对加密数据流的判断的效率,步骤S103还可以按照下述具体过程来实施:
B1,判断所述待测数据报文对应的评估值是否大于设定的评估阈值,若是,则判定所述数据流为加密流,否则执行步骤B2;
B2,判断窗口跃迁的次数是否达到设定的次数阈值,若是,则判定所述数据流量为非加密流,否则按照步骤1重新选择一待测数据报文执行所述方法。
本发明第二实施例,与第一实施例对应的提供一种加密流的识别装置,如图2所示,包括以下组成部分:
1)选择模块10,用于基于窗口跃迁在数据流中选择待测数据报文;
具体的,选择模块10用于:设置一读取数据报文的窗口,所述窗口的长度为相邻的两个待测数据报文之间间隔的数据报文数量;
针对接收到的数据流,选择所述数据流的首个数据报文作为第一个待测数据报文,然后利用所述窗口在数据流中的跃迁来依次选择后续的待测数据报文。
2)计算模块20,用于根据待测数据报文计算评估值;
具体的,计算模块20用于:针对每个待测数据报文执行WARE算法,具体执行过程在第一实施例中已详细描述。
3)判断模块30,用于基于评估值判断所述数据流是否加密。
具体的,判断模块30用于:判断所述待测数据报文对应的评估值是否大于设定的评估阈值,若是,则判定所述数据流为加密流,否则判定所述数据流量为非加密流。
优选的,为了进一步提高对加密数据流的判断的效率,判断模块30用于:还可以用于:
首选判断所述待测数据报文对应的评估值是否大于设定的评估阈值,若大于设定的评估阈值,则判定所述数据流为加密流;若小于等于设定的评估阈值,则判断窗口跃迁的次数是否达到设定的次数阈值,若是,则判定所述数据流量为非加密流,否则调用选择模块10重新选择一待测数据报文进行处理。
本发明第三实施例,本实施例在上述实施例的基础上提供一个应用实例,介绍一种基于窗口跃迁的协议不相关加密流识别方法,为了使本技术领域的人员更好地理解本申请实施例中的技术方案,并使本实施例的目的、特征和优点能够更加明显易懂,下面结合附图3~5对本申请实施例中技术方案作进一步详细的说明。
在详细描述本实施例之前,首先对本实施例中可能涉及的符号进行如下说明:
WARE:基于加权累计的自适应随机性评估算法;
D:设定的延迟常数,即窗口大小
W:预设的用于判定是是否为加密流的评估阀值
N:窗口跃迁的次数阀值
参见图3,为本实施例的基于窗口跃迁的协议不相关加密流识别方法的流程如下:
步骤101:对接收到的数据报文进行基于窗口跃迁的理想识别点试选。
具体的,首个理想识别点试选为接收到的数据流的第一个数据报文,后续试选以窗口d为大小进行跃迁。
这里的理想识别点的试选类似于上述实施例中的待测数据报文的选择,
步骤102:在理想识别点对数据报文进行基于加权累计的随机性评估测试。
具体的,对理想识别点的数据报文实施WARE算法,得出评估测试结果,并缓存在数据暂存块中。
步骤103:对比评估测试结果与设定阀值。
具体的,如果评估测试结果大于预设的评估阀值W,则输出为阳性,并结束识别;如果评估结果小于等于预设的评估阀值W,则进一步判断是否到窗口d的跃迁次数是否达到窗口跃迁的次数阀值N,如果到达,则输出为阴性,并结束识别,否则继续进行窗口跃迁,试选下一个理想识别点执行上述步骤。
这里,阳性指的是判定为加密流,阴性指的是判定为非加密流。
步骤104:结束判定并输出判定结果。
具体的,只要有一次测试显示识别出加密数据,则完成数据流的识别,识别结果为阳性。若超过窗口跃迁的次数阀值N后仍未识别出加密数据,则识别结果为阴性。窗口跃迁的次数阀值N的设定由***处理能力决定。
参见图4,在步骤102中,对理想识别点的数据报文实施WARE算法,得出评估测试结果的具体流程,如下:
步骤201:接收待测数据报文。
步骤202:单数据包累积计数。
具体的,步骤202包括:
C1:将该待测数据报文的二进制序列中的所有0替换为-1,生成新的变形序列。
C2:计算变形序列的前k项和1≤k≤n,计算变形序列ηi的最大偏移值z=max[S1,S2,…,Sn],n为待测数据报文的二进制序列的长度,则初步评估值为 I ( z ) = 1 - Σ j = ( - n z + 1 ) / 4 ( n z - 1 ) / 4 [ Φ ( ( 4 j + 1 ) z n ) - Φ ( ( 4 j - 1 ) z n ) ] + Σ j = ( - n z - 3 ) / 4 ( n z - 1 ) / 4 [ Φ ( ( 4 j + 3 ) z n ) - Φ ( ( 4 j + 1 ) z n ) ] , 其中,Φ(x)为标准正态分布函数,
步骤203:读取历史数据。
具体的,从数据暂存块中读取数据流的随机性评估结果历史,对于第一次操作,历史评估值为0。
步骤204:加权综合评估操作。
具体的,将初步评估值与历史评估值进行加权综合,得到最终用于判断所述数据流是否加密的评估值。
步骤205:更新历史数据。
具体的,将执行完步骤C3时得到的评估值作为历史评估值保存到数据暂存块中,替换前一次保存的历史评估值。
步骤205:输出最终用于判断所述数据流是否加密的评估值。
参见图5,本实施例的基于窗口跃迁的协议不相关加密流识别装置,包含:窗口跃迁模块301、随机性评估模块302和加密流判定模块303。
其中,窗口跃迁模块301,用于读取链路流量,以窗口d=D×(I-1)独立地在链路流量上进行跃迁,D为设定的延迟常数,跃迁的次数I为大于1的整数。
随机性评估模块302,用于基于加权累计的自适应随机性评估算法,对链路流量进行随机性评估。
加密流判定模块303,用于判定流量是否为加密流,具体的,如果评估测试结果大于预设的评估阀值W,则输出为阳性,并结束识别;如果评估结果小于等于预设的评估阀值W,则进一步判断是否到窗口d的跃迁次数是否达到窗口跃迁的次数阀值N,如果到达,则输出为阴性,并结束识别,否则继续进行窗口跃迁和判定。
通过以上的实施方式的描述可知,本领域的技术人员可以清楚地了解到本申请可借助软件加必需的通用硬件平台的方式来实现。基于这样的理解,本申请的技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品可以存储在存储介质中,如ROM/RAM、磁碟、光盘等,包括若干指令用以使得一台网络设备(可以是服务器,路由器,路由主控等)执行本申请各个实施例或者实施例的某些部分所述的方法。
通过具体实施方式的说明,应当可对本发明为达成预定目的所采取的技术手段及功效得以更加深入且具体的了解,然而所附图示仅是提供参考与说明之用,并非用来对本发明加以限制。

Claims (9)

1.一种加密流的识别方法,其特征在于,包括:
步骤1,基于窗口跃迁在数据流中选择待测数据报文;
步骤2,根据待测数据报文计算评估值;
步骤3,基于评估值判断所述数据流是否加密。
2.根据权利要求1所述的加密流的识别方法,其特征在于,步骤1具体包括:
设置一读取数据报文的窗口,所述窗口的长度为相邻的两个待测数据报文之间间隔的数据报文数量;
针对接收到的数据流,选择所述数据流的首个数据报文作为第一个待测数据报文,然后利用所述窗口在数据流中的跃迁来依次选择后续的待测数据报文。
3.根据权利要求2所述的加密流的识别方法,其特征在于,每次选择待测数据报文时对应的跃迁的窗口长度均遵循设定的函数关系。
4.根据权利要求3所述的加密流的识别方法,其特征在于,所述设定的函数关系为等差数列时,设所述窗口的长度为d,满足如下条件:针对第I次选择的待测数据报文,所需跃迁的窗口的长度d=D×(I-1),D为设定的延迟常数,I为大于1的整数。
5.根据权利要求1所述的加密流的识别方法,其特征在于,步骤2具体包括:针对每个待测数据报文执行基于加权累计的自适应随机性评估算法WARE,包括如下处理:
A1:将待测数据报文的二进制序列中的所有0替换为-1,生成变形序列ηi
A2:针对变形序列ηi的前k项和1≤k≤n,计算变形序列ηi的最大偏移值z=max[S1,S2,…,Sn],n为待测数据报文的二进制序列的长度,则评估值为其中,Φ(x)为标准正态分布函数,
6.根据权利要求5所述的加密流的识别方法,其特征在于,步骤2还包括:
A3,将步骤A2得到的评估值与历史评估值进行加权综合,得到最终用于判断所述数据流是否加密的评估值;
所述历史评估值的获取过程包括:将执行完步骤A3时得到的评估值作为历史评估值进行保存,替换前一次保存的历史评估值。
7.根据权利要求1~6中任一项所述的加密流的识别方法,其特征在于,步骤3具体包括:
判断所述待测数据报文对应的评估值是否大于设定的评估阈值,若是,则判定所述数据流为加密流,否则判定所述数据流量为非加密流。
8.根据权利要求1~6中任一项所述的加密流的识别方法,其特征在于,步骤3具体包括:
B1,判断所述待测数据报文对应的评估值是否大于设定的评估阈值,若是,则判定所述数据流为加密流,否则执行步骤B2;
B2,判断窗口跃迁的次数是否达到设定的次数阈值,若是,则判定所述数据流量为非加密流,否则按照步骤1重新选择一待测数据报文执行所述方法。
9.一种加密流的识别装置,其特征在于,包括:
选择模块,用于基于窗口跃迁在数据流中选择待测数据报文;
计算模块,用于根据待测数据报文计算评估值;
判断模块,用于基于评估值判断所述数据流是否加密。
CN201510710376.6A 2015-10-28 2015-10-28 一种加密流的识别方法及装置 Pending CN105406993A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201510710376.6A CN105406993A (zh) 2015-10-28 2015-10-28 一种加密流的识别方法及装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201510710376.6A CN105406993A (zh) 2015-10-28 2015-10-28 一种加密流的识别方法及装置

Publications (1)

Publication Number Publication Date
CN105406993A true CN105406993A (zh) 2016-03-16

Family

ID=55472256

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201510710376.6A Pending CN105406993A (zh) 2015-10-28 2015-10-28 一种加密流的识别方法及装置

Country Status (1)

Country Link
CN (1) CN105406993A (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110999256A (zh) * 2018-05-23 2020-04-10 Oppo广东移动通信有限公司 通信方法、终端设备和核心网络设备

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101827089A (zh) * 2009-03-02 2010-09-08 冲电气工业株式会社 加密通信量识别装置及具有该装置的加密通信量识别***
CN102164049A (zh) * 2011-04-28 2011-08-24 中国人民解放军信息工程大学 加密流量的普适识别方法
CN103873320A (zh) * 2013-12-27 2014-06-18 北京天融信科技有限公司 加密流量识别方法及装置

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101827089A (zh) * 2009-03-02 2010-09-08 冲电气工业株式会社 加密通信量识别装置及具有该装置的加密通信量识别***
CN102164049A (zh) * 2011-04-28 2011-08-24 中国人民解放军信息工程大学 加密流量的普适识别方法
CN103873320A (zh) * 2013-12-27 2014-06-18 北京天融信科技有限公司 加密流量识别方法及装置

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
赵博 等: "基于加权累积和检验的加密流量盲识别算法", 《软件学报》 *
赵博: "网络加密流量的协议不相关在线识别技术研究", 《中国博士学位论文全文数据库 信息科技辑》 *

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110999256A (zh) * 2018-05-23 2020-04-10 Oppo广东移动通信有限公司 通信方法、终端设备和核心网络设备
CN110999256B (zh) * 2018-05-23 2021-12-03 Oppo广东移动通信有限公司 通信方法、终端设备和核心网络设备

Similar Documents

Publication Publication Date Title
CN110276210A (zh) 基于联邦学习的模型参数的确定方法及装置
EP3220573A1 (en) Method and system for controlling encryption of information and analyzing information as well as terminal
CN103259778A (zh) 安全监视***以及安全监视方法
CN112100679B (zh) 基于隐私保护的数据处理方法、装置和服务器
CN106991095B (zh) 机器异常的处理方法、学习速率的调整方法及装置
CN104023352B (zh) 一种面向移动通信平台的即时通信软件侧信道测试***
CN110264172B (zh) 基于区块链的交易处理方法及装置
CN113762525B (zh) 一种具有差分隐私保护的联邦学习模型训练方法
CN111181930A (zh) DDoS攻击检测的方法、装置、计算机设备及存储介质
CN104506356A (zh) 一种确定ip地址信誉度的方法和装置
Idris et al. A deep learning approach for active S-box prediction of lightweight generalized feistel block ciphers
CN110944016A (zh) DDoS攻击检测方法、装置、网络设备及存储介质
CN113934983A (zh) 一种特征变量的分析方法、装置、计算机设备及存储介质
Chen et al. Neural-Aided Statistical Attack for Cryptanalysis
Hnath et al. Differential power analysis side-channel attacks in cryptography
CN117272386A (zh) 互联网大数据信息安全加密方法及装置、设备、***
EP3955149A1 (en) Method and apparatus for securing real-time data transfer from a device
CN114155083A (zh) 基于区块链的交易检测方法、装置、设备及可读存储介质
CN114531302A (zh) 数据加密方法、装置及存储介质
Behdadnia et al. Leveraging deep learning to increase the success rate of DOS attacks in PMU-based automatic generation control systems
CN105406993A (zh) 一种加密流的识别方法及装置
CN111092723A (zh) 一种数据隐私保护量子计算方法
JP2005134478A (ja) 暗号処理装置、および暗号処理方法、並びにコンピュータ・プログラム
CN112019547B (zh) 网络流量评估方法、攻击检测方法、服务器及存储介质
CN113076561A (zh) 一种数据块的分拆和重组***

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication

Application publication date: 20160316

RJ01 Rejection of invention patent application after publication