CN110536324B - 一种WiFi信号数据的采集和处理方法及其*** - Google Patents

一种WiFi信号数据的采集和处理方法及其*** Download PDF

Info

Publication number
CN110536324B
CN110536324B CN201910845417.0A CN201910845417A CN110536324B CN 110536324 B CN110536324 B CN 110536324B CN 201910845417 A CN201910845417 A CN 201910845417A CN 110536324 B CN110536324 B CN 110536324B
Authority
CN
China
Prior art keywords
data
wifi
packets
packet
protocol
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201910845417.0A
Other languages
English (en)
Other versions
CN110536324A (zh
Inventor
赵晋洪
武发鲁
周睿
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Shandong Yiwa Information Technology Co ltd
Original Assignee
Shandong Yiwa Information Technology Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Shandong Yiwa Information Technology Co ltd filed Critical Shandong Yiwa Information Technology Co ltd
Priority to CN201910845417.0A priority Critical patent/CN110536324B/zh
Publication of CN110536324A publication Critical patent/CN110536324A/zh
Application granted granted Critical
Publication of CN110536324B publication Critical patent/CN110536324B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N20/00Machine learning
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L69/00Network arrangements, protocols or services independent of the application payload and not provided for in the other groups of this subclass
    • H04L69/06Notations for structuring of protocol data, e.g. abstract syntax notation one [ASN.1]
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L69/00Network arrangements, protocols or services independent of the application payload and not provided for in the other groups of this subclass
    • H04L69/22Parsing or analysis of headers
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04WWIRELESS COMMUNICATION NETWORKS
    • H04W24/00Supervisory, monitoring or testing arrangements
    • H04W24/02Arrangements for optimising operational condition
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04WWIRELESS COMMUNICATION NETWORKS
    • H04W24/00Supervisory, monitoring or testing arrangements
    • H04W24/08Testing, supervising or monitoring using real traffic
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02DCLIMATE CHANGE MITIGATION TECHNOLOGIES IN INFORMATION AND COMMUNICATION TECHNOLOGIES [ICT], I.E. INFORMATION AND COMMUNICATION TECHNOLOGIES AIMING AT THE REDUCTION OF THEIR OWN ENERGY USE
    • Y02D30/00Reducing energy consumption in communication networks
    • Y02D30/70Reducing energy consumption in communication networks in wireless communication networks

Landscapes

  • Engineering & Computer Science (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Signal Processing (AREA)
  • Computer Security & Cryptography (AREA)
  • Theoretical Computer Science (AREA)
  • Software Systems (AREA)
  • Medical Informatics (AREA)
  • Evolutionary Computation (AREA)
  • Data Mining & Analysis (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Physics & Mathematics (AREA)
  • Computing Systems (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Mathematical Physics (AREA)
  • Artificial Intelligence (AREA)
  • Mobile Radio Communication Systems (AREA)

Abstract

本发明提出了一种WiFi信号数据的采集和处理方法及其***,所述方法步骤如下:S1、监听并接收WiFi信号传输的协议包;S2、将每次接收协议包的数据整理为数据包,积累一定量数据包打包发送到WiFi数据分析模块;S3、基于机器学习算法分析WiFi数据,得到WiFi设备名称、设备类型和WiFi信号数据类型;S4、生成检测报告,将接收数据、分析结果和检测报告对应的存储到数据库中;S5、从数据库中获取检测报告并在终端进行展示。所述***包括WiFi数据采集模块、WiFi数据传输模块、WiFi数据分析模块和WiFi数据展示模块。本发明方法和***可以非接触式的获取空中传输的WiFi数据,并根据数据判断WiFi设备类型和数据类型,实现对WiFi设备的实时检测,有利于对WiFi设备的监管。

Description

一种WiFi信号数据的采集和处理方法及其***
技术领域
本发明涉及一种无线WiFi信号采集及数据分析处理的方法及其***,属于无线WiFi信号检测技术领域。
背景技术
近几十年,现代无线通讯领域获得了长足的发展,目前在室内和小范围的无线局域网内的大数据传输主要由WiFi通讯协议主导实现。WiFi协议具有保密性好、传输速度较高的优点,目前WiFi协议主要应用在2.4Ghz和5.8Ghz两个频段上,大量的无线局域网设备均可以通过WiFi协议进行传输和控制,适用于办公环境、个人应用和家庭应用,WiFi协议是目前无线局域网模式下最主要的协议标准,以WiFi协议为基础的WiFi设备遍布人们的工作与生活。
大量WiFi设备的存在,也伴随着一个问题:由于WiFi设备的加密性高,所以很难对WiFi设备进行监控管理。一旦非法或者不经过用户允许的WiFi设备连接进入无线局域网内部,就会造成无线局域网中的数据或者个人信息的泄露;此外,一些WiFi设备被设置成为无线热点后,容易被用来进行不被允许的数据传输。由于WiFi的加密性高,现阶段大多需要在其热点/路由器上安装专业检测软件或者连接专业的设备来进行WiFi信号的管控,否则很难判断出无线WiFi终端设备的数据传输情况以及其设备的各类属性与安全情况,而独自建立无线热点的WiFi设备,则更难监督和检测其数据的传输。
发明内容
针对目前WiFi设备和WiFi信号检测、管理困难的问题,本发明提出了一种WiFi信号数据的采集和处理方法及其***,利用遵守IEEE802.11协议的芯片,在监听模式下直接捕获空中WiFi信号传输的协议包,根据机器学习算法分析WiFi数据,确认WiFi数据对应的设备类型和数据类型,实现对WiFi设备的实时检测,生成检测报告,方便相关人员查看WiFi设备信息,进而实现对WiFi设备的监管。
为解决上述技术问题,本发明采用了如下技术手段:
一种WiFi信号数据的采集和处理方法,包括以下步骤:
S1、在监听模式下按照固定频率监听空中的WiFi信号,并接收WiFi信号传输的协议包;
S2、将每次接收协议包的时间戳和协议包的帧头部分整理为数据包存储到临时数据库中,当临时数据库中同一WiFi信号的数据包的数量到达设置的阈值,将临时数据库中同一WiFi信号的数据包打包为数据包集合发送到WiFi数据分析模块;
S3、基于机器学习算法,根据数据包集合中的数据分析该WiFi信号对应的WiFi设备名称、设备类型和WiFi信号数据类型;
S4、根据数据包集合和步骤S3的分析结果生成检测报告,将数据包集合、分析结果和检测报告对应的存储到关系型数据库中;
S5、从关系型数据库中获取检测报告并在终端进行展示。
进一步的,所述的固定频率的取值范围为0.5~10次/秒。
进一步的,所述每个数据包中包括数据包序号、协议包的帧头部分和接收该协议包的时间戳,所述协议包的帧头部分包括SSID、帧长度、帧状态、持续时间长度、源MAC地址和目的MAC地址。
进一步的,所述步骤S2中设置的阈值大于等于300。
进一步的,步骤S3的具体操作如下:
S31、从数据包集合中提取协议包的SSID,分析SSID得到WiFi信号对应的WiFi设备名称;
S32、从数据包集合获取协议包的源MAC地址,将源MAC地址与IEEE数据库中登记在册的MAC信息登记表进行匹配,判断该源MAC地址对应的WiFi设备的设备类型;
S33、从数据包集合中提取数据特征,根据机器学习算法结合数据特征训练模型,利用训练好的模型判断WiFi信号数据类型。
进一步的,所述步骤S33的具体操作如下:
(1)任意选取一个数据包集合,将数据包集合中的数据包分为N组,每一组数据包中共有e个数据包,即有e个协议包,提取每一组数据包中每个协议包的帧长度,第i组数据包的帧长度集合为Ai={a1i,a2i,...,aji,...aei},其中,i=1,2,...,N,aji为第i组数据包中第j个协议包的帧长度,j=1,2,...,e,根据累积分布函数计算第i组数据包的帧长度分布
Figure BDA0002192562340000021
具体计算公式如下:
Figure BDA0002192562340000031
其中,Aimax表示协议包集合Ai中最大的帧长度,
Figure BDA0002192562340000032
代表Ai中元素小于等于
Figure BDA0002192562340000033
的概率;
(2)N组数据包的帧长度分布集合为
Figure BDA0002192562340000034
对帧长度分布集合进行KS检验,得到帧长度分布稳定性x,具体计算公式如下:
Figure BDA0002192562340000035
(3)提取每一组数据包中每个协议包的帧长度和接收协议包的时间戳,计算单位时间内传输的帧长度,即信号带宽,取带宽平均值作为该数据包集合的带宽值:
Figure BDA0002192562340000036
其中,B表示数据包集合的带宽值,bi表示第i组数据包的信号带宽;
(4)根据每一组数据包的信号带宽计算数据包集合的带宽标准差,作为数据包集合的带宽稳定性S;
(5)获取M个数据包集合,进行步骤(1)-(4)的处理,得到数据特征,所述数据特征包括帧长度分布、帧长度分布稳定性、带宽值和带宽稳定性,人工标注每个数据包集合中每组数据包的数据类型,用数据特征和人工标注的数据类型作为训练样本,基于机器学习算法训练WiFi数据类型识别模型;
(6)为新接收的数据包集合提取数据特征,将提取的数据特征输入训练好的模型,输出新接收的数据包集合对应的WiFi信号数据类型。
进一步的,所述检测报告包括WiFi设备名称、WiFi设备类型、WiFi信号数据类型、WiFi信号出现的时段、WiFi信号强度信息。
一种WiFi信号数据的采集和处理***,包括WiFi数据采集模块、WiFi数据传输模块、WiFi数据分析模块和WiFi数据展示模块。
所述WiFi数据采集模块,用于监听检测区域内的WiFi信号,采集WiFi信号传输的协议包;所述WiFi数据传输模块,用于临时存储WiFi数据采集模块采集的多个协议包,并通过有线或无线网络将采集的协议包打包后传输到WiFi数据分析模块;所述WiFi数据分析模块,用于分析采集到的协议包中的数据,判断该WiFi信号对应的WiFi设备名称、WiFi设备类型和WiFi信号数据类型,并生成检测报告;所述WiFi数据展示模块,用于存储采集的WiFi数据、分析结果和检测报告,并在终端展示检测报告。
进一步的,所述WiFi数据采集模块选用遵守IEEE802.11协议的WiFi芯片。
进一步的,所述WiFi设备类型包括手机、平板、笔记本、打印机、数码相机、无线摄像头;所述WiFi信号数据类型包括音频、视频。
采用以上技术手段后可以获得以下优势:
本发明提出了一种WiFi信号数据的采集和处理方法及其***,本发明方法及***利用WiFi芯片的监听功能,通过WiFi信号采集模块监听并采集检测区域内的WiFi信号传输的数据,WiFi信号采集模块不需要与任何WiFi设备进行硬件连接,也不需要在现有WiFi设备上安装软件,做到了非接触式的数据采集,移动WiFi数据采集模块即可改变监听范围,数据采集更加灵活、便捷。采集到的数据传输到WiFi数据分析模块,根据现有的数据库***和机器学习算法对WiFi数据进行分析、处理,判断WiFi设备名称、设备类型和WiFi信号数据类型,计算方法简单,整个操作自动化程度较高,不需要过多人工参与,计算结果较准确。采集到的数据和计算结果生成检测报告供相关人员查看,实现了WiFi信号检测可视、各类WiFi设备分类可视、各AP热点下连接的STA设备可视等功能,有利于相关人员了解WiFi设备的数据传输情况,方便相关人员对WiFi设备进行监管。本发明***成本较低,可以实时灵活采集和处理WiFi信号数据,本发明方法计算量较小,计算时间较短,计算结果精准,能够自动化实时分析数据,本发明***和方法提供了无线WiFi信号检测的高质量信息化服务。
附图说明
图1为本发明一种WiFi信号数据的采集和处理方法的步骤流程图。
图2为本发明一种WiFi信号数据的采集和处理***的结构示意图。
图中,1是WiFi数据采集模块,2是WiFi数据传输模块,3是WiFi数据分析模块,4是WiFi数据展示模块。
具体实施方式
下面结合附图对本发明的技术方案作进一步说明:
本发明提出了一种WiFi信号数据的采集和处理方法,如图1所示,具体包括以下步骤:
S1、在SNIFFER监听模式下,利用WiFi数据采集模块按照固定频率监听空中检测区域内的WiFi信号,接收WiFi信号传输的协议包。目前WiFi协议的2.4GHz频段在国内共使用13个频点,可以采用同一个采集模块按照固定频率依次监听每个频点,也可以采用13个采集模块按照固定频率分别监听13个频点,本发明方法中固定频率的取值范围为0.5~10次/秒,当某个频点没有信号正在传输时,可以减少监听该频点的次数或者延长相邻两次监听的时间间隔,即减小固定频率。
在本发明实施例中,首先用同一个WiFi数据采集模块按照10次/秒的频率依次监听13个频点,每个频点监听100ms,1.3秒内就可以轮询所有频点,轮询完所有频点后记录下有数据传输的频点;进行第二轮监听时,按0.5次/秒的频率监听有数据传输的频点,即每个频点监听2s时间,假设有数据传输的频点个数为N,则第二轮监听消耗时间为2*N秒;第三轮监听时,再次按照10次/秒的频率依次监听13个频点,重新记录有数据传输的频点,以此类推,采集WiFi信号传输的数据,也就是协议包。
每个协议包可以称为一个帧,根据目的设备、协议包内的数据等的不同,协议包可以分为管理帧、控制帧和数据帧,本发明主要采集管理帧和数据帧,抓取其帧头部分。帧头部分包括Physical Layer Convergence Procedure(PLCP)头和MAC header,PLCP头包含帧的长度,MAC header包含帧控制(FC)、持续时间长度和MAC地址,其中,FC表示帧的状态,包括分组的方向,即上行链路或下行链路;持续时间长度表示频道预留持续时间,即完成数据传输所需的时间;对于上行链路数据包,MAC地址包括AP的MAC地址、源MAC地址和目的MAC地址。
S2、将每次接收协议包的时间戳和协议包的帧头部分整理为数据包存储到临时数据库中,每个数据包中包括数据包序号、协议包的帧头部分和接收该协议包的时间戳,数据包序号主要用于标记该数据包属于哪个频点上的哪个WiFi信号,方便后续统计、查询和分析,数据包中存储的协议包的帧头部分主要包括SSID、帧长度、帧状态、持续时间长度、源MAC地址和目的MAC地址,时间戳包括接收该协议包的开始时间和结束时间。
因为一个数据包中的有用数据较少,为了在进行数据分析处理时拥有足够多的有用数据,提高数据分析准确度,本发明奖采集到的数据包先存储到临时数据库中,当临时数据库中同一WiFi信号的数据包的数量到达设置的阈值,再将临时数据库中同一WiFi信号的数据包打包为数据包集合发送到WiFi数据分析模块。通过多次试验,设置的阈值要大于等于300,即每次要采集300个以上的数据包,然后再打包发送到WiFi数据分析模块。
S3、基于机器学习算法,根据数据包集合中的数据分析该WiFi信号对应的WiFi设备名称、设备类型和WiFi信号数据类型;具体操作如下:
S31、从数据包集合中提取协议包的SSID,通常一个数据包集合中所有的协议包都来源于同一个WiFi设备,所以每个协议包中的SSID应该相同,分析SSID得到WiFi信号对应的WiFi设备名称。此外,也可以链接一些针对WiFi设备的后台数据库,检索后台数据库中已存在的现有数据,根据SSID确认设备类型,比如市面上销售的大部分路由器,其名称中包含路由器的品牌和型号,分析SSID就可以根据这些品牌和型号推导出WiFi设备为路由器设备。
S32、由于主流WiFi设备厂家都会在IEEE协会申请MAC地址的范围,因此可以通过IEEE数据库进行检索,进而判断某个MAC地址对应的WIFI设备是何种产品。分析数据包集合中的协议包,从协议包的帧头部分获取源MAC地址,通常一个数据包集合中所有的协议包都来源于同一个WiFi设备,所以源MAC地址应该相同,将源MAC地址与IEEE数据库中登记在册的MAC信息登记表进行匹配,判断该源MAC地址对应的WiFi设备的设备类型,本发明中的WiFi设备类型主要包括手机、平板、笔记本、打印机、数码相机和无线摄像头等。
S33、由于不同的WiFi设备在传输数据时会根据自身的特征来进行特定的数据长度的切分,因此,当某一个WiFi设备传输的数据包积累到一定数量时,就可以根据这些数据包来配合机器学习算法,查找数据长度切分的规律,进而区分出该WiFi信号传输的数据类型。从数据包集合中提取数据特征,根据机器学习算法结合数据特征训练模型,利用训练好的模型判断WiFi信号数据类型。步骤S33又可以具体分为以下操作:
(1)任意选取一个数据包集合,将数据包集合中的数据包分为N组,每一组数据包中共有e个数据包,即有e个协议包,比如一个数据包集合中有500个数据包,把500个数据包分为10组,则每一组包含50个数据包,即每一组中有50个协议包。
提取每一组数据包中每个协议包的帧长度,第i组数据包的帧长度集合为Ai={a1i,a2i,...,aji,...aei},其中,i=1,2,...,N,aji为第i组数据包中第j个协议包的帧长度,j=1,2,...,e,根据累积分布函数计算第i组数据包的帧长度分布
Figure BDA0002192562340000071
具体计算公式如下:
Figure BDA0002192562340000072
其中,Aimax表示协议包集合Ai中最大的帧长度,
Figure BDA0002192562340000073
代表Ai中元素小于等于
Figure BDA0002192562340000074
的概率。
(2)根据公式(4)计算出每组数据包的帧长度分布,得到N组数据包的帧长度分布集合
Figure BDA0002192562340000075
对帧长度分布集合进行KS检验,得到帧长度分布稳定性x,具体计算公式如下:
Figure BDA0002192562340000076
其中,sup()为上确界函数。
(3)提取每一组数据包中每个协议包的帧长度和接收协议包的时间戳,计算单位时间内传输的帧长度,即信号带宽,取带宽平均值作为该数据包集合的带宽值:
Figure BDA0002192562340000077
其中,B表示数据包集合的带宽值,bi表示第i组数据包的信号带宽。
(4)根据每一组数据包的信号带宽计算数据包集合的带宽标准差,作为数据包集合的带宽稳定性S:
Figure BDA0002192562340000081
(5)获取M个数据包集合,进行步骤(1)-(4)的处理,得到每个数据包的数据特征,数据特征包括帧长度分布、帧长度分布稳定性、带宽值和带宽稳定性,人工标注每个数据包集合中每组数据包的数据类型,用数据特征和人工标注的数据类型作为训练样本,基于机器学习算法训练WiFi数据类型识别模型。
(6)为新接收的数据包集合提取数据特征,将提取的数据特征输入训练好的模型,输出新接收的数据包集合对应的WiFi信号数据类型。
S4、根据数据包集合和步骤S3的分析结果生成检测报告,检测报告主要包括WiFi设备名称、WiFi设备类型、WiFi信号数据类型、WiFi信号出现的时段、WiFi信号强度信息等内容,其中WiFi信号强度可以直接通过采集模块获取。将数据包集合、分析结果和检测报告对应的存储到关系型数据库中,后续可以通过关键词从关系型数据库中调取相关数据,比如通过数据包序号调取相应的数据包集合、分析结果和检测报告。
S5、在终端上访问关系型数据库,从关系型数据库中获取检测报告,并在终端上展示检测报告中的内容,展示方式可以是表格、文本等。
本发明还提出了一种WiFi信号数据的采集和处理***,如图2所示,包括WiFi数据采集模块1、WiFi数据传输模块2、WiFi数据分析模块3和WiFi数据展示模块4。通过WiFi数据采集模块采集WiFi信号传输的数据,然后将数据打包后由WiFi数据传输模块传输到WiFi数据分析模块,WiFi数据分析模块利用现有的一些数据库和机器学习算法分析WiFi数据,得到传输该WiFi数据对应的WiFi设备名称、设备类型和WiFi信号数据类型,WiFi数据分析模块分析得到的结果跟采集到的WiFi数据一起组合形成检测报告,相关人员可以在WiFi数据展示模块查看检测报告。
WiFi数据采集模块主要用于监听检测区域内的WiFi信号,采集WiFi信号传输的协议包,WiFi数据采集模块可以采用无线路由网卡、专业WIFI模块、路由器等无线设备,WiFi数据采集模块的核心芯片需要采用遵守IEEE802.11协议的WiFi芯片,WiFi数据采集模块的检测区域大小一般由采用的硬件设备或芯片决定。本发明的WiFi数据采集模块工作在数据链路层,WiFi协议的2.4GHz频段在国内共使用13个频点,WiFi数据采集模块可以使用分时方式对需要的频点进行单独监听或者循环监听,并对IEEE802.11协议格式数据包进行抓取和基础分析,提取出协议包帧头部分中需要的数据。
WiFi数据传输模块用于临时存储WiFi数据采集模块采集的多个协议包,并通过有线或无线网络将采集的协议包打包后传输到WiFi数据分析模块,WiFi数据传输模块的传输方式包括但不限于WiFi、蓝牙、USB、RS-485总线、WLAN。WiFi数据传输模块不是必须模块,如果将WiFi数据采集模块与WiFi数据分析模块直接合并在同一套嵌入式设备上实现两者的数据传输,这种情况下可以省略WiFi数据传输模块。为了保证WiFi数据分析模块有足量的数据进行分析,也为了节约网络资源,WiFi数据传输模块会整理并临时存储WiFi数据采集模块采集到的数据,当WiFi数据堆积到一定的量之后再统一打包传输给WiFi数据分析模块。
WiFi数据分析模块主要用于分析WiFi数据采集模块采集到的数据,根据现有数据库和机器学***板、笔记本、打印机、数码相机、无线摄像头等,WiFi信号数据类型包括音频、视频等。检测报告是根据WiFi数据采集模块采集的数据和WiFi数据分析模块的分析结果生成的,检测报告包括WiFi设备名称、WiFi设备类型、WiFi信号数据类型、WiFi信号出现的时段、WiFi信号强度信息等内容。
WiFi数据展示模块用于存储采集的WiFi数据、分析结果和检测报告,并在终端展示检测报告,WiFi数据展示模块可以分为数据库端和展示端,数据库端依托服务器上的关系型数据库,将采集的WiFi数据、分析结果和检测报告对应的存储在关系型数据库中,展示端可以访问数据库端,获取检测报告并进行展示,展示端可以是手机、电脑、平板等终端上安装的软件,也可以是网页。
本发明方法和***可以自动采集并处理空中传输的WiFi数据,判断发送该数据的WiFi设备的名称、类型、WiFi数据类型等,本发明方法计算过程简单,计算量较小,计算结果精准,本发明***可以非接触的实现数据采集,成本较低,数据采集灵活快捷,本发明方法和***实现了对WiFi设备的实时检测,生成的检测报告可以方便相关人员查看WiFi设备信息,进而实现对WiFi设备的监管。
上面结合附图对本发明的实施方式作了详细地说明,但是本发明并不局限于上述实施方式,在本领域普通技术人员所具备的知识范围内,还可以在不脱离本发明宗旨的前提下做出各种变化。

Claims (8)

1.一种WiFi信号数据的采集和处理方法,其特征在于,包括以下步骤:
S1、在监听模式下按照固定频率监听空中的WiFi信号,并接收WiFi信号传输的协议包;
S2、将每次接收协议包的时间戳和协议包的帧头部分整理为数据包存储到临时数据库中,当临时数据库中同一WiFi信号的数据包的数量到达设置的阈值,将临时数据库中同一WiFi信号的数据包打包为数据包集合发送到WiFi数据分析模块;
S3、基于机器学习算法,根据数据包集合中的数据分析该WiFi信号对应的WiFi设备名称、设备类型和WiFi信号数据类型;步骤S3的具体操作如下:
S31、从数据包集合中提取协议包的SSID,分析SSID得到WiFi信号对应的WiFi设备名称;
S32、从数据包集合获取协议包的源MAC地址,将源MAC地址与IEEE数据库中登记在册的MAC信息登记表进行匹配,判断该源MAC地址对应的WiFi设备的设备类型;
S33、从数据包集合中提取数据特征,根据机器学习算法结合数据特征训练模型,利用训练好的模型判断WiFi信号数据类型;所述步骤S33的具体操作如下:
(1)任意选取一个数据包集合,将数据包集合中的数据包分为N组,每一组数据包中共有e个数据包,即有e个协议包,提取每一组数据包中每个协议包的帧长度,第i组数据包的帧长度集合为Ai={a1i,a2i,...,aji,...aei},其中,i=1,2,...,N,aji为第i组数据包中第j个协议包的帧长度,j=1,2,...,e,根据累积分布函数计算第i组数据包的帧长度分布
Figure FDA0003691004460000011
具体计算公式如下:
Figure FDA0003691004460000012
其中,Aimax表示协议包集合Ai中最大的帧长度,
Figure FDA0003691004460000021
代表Ai中元素小于等于
Figure FDA0003691004460000022
的概率;
(2)N组数据包的帧长度分布集合为
Figure FDA0003691004460000023
对帧长度分布集合进行KS检验,得到帧长度分布稳定性x,具体计算公式如下:
Figure FDA0003691004460000024
(3)提取每一组数据包中每个协议包的帧长度和接收协议包的时间戳,计算单位时间内传输的帧长度,即信号带宽,取带宽平均值作为该数据包集合的带宽值:
Figure FDA0003691004460000025
其中,B表示数据包集合的带宽值,bi表示第i组数据包的信号带宽;
(4)根据每一组数据包的信号带宽计算数据包集合的带宽标准差,作为数据包集合的带宽稳定性S;
(5)获取M个数据包集合,进行步骤(1)-(4)的处理,得到数据特征,所述数据特征包括帧长度分布、帧长度分布稳定性、带宽值和带宽稳定性,人工标注每个数据包集合中每组数据包的数据类型,用数据特征和人工标注的数据类型作为训练样本,基于机器学习算法训练WiFi数据类型识别模型;
(6)为新接收的数据包集合提取数据特征,将提取的数据特征输入训练好的模型,输出新接收的数据包集合对应的WiFi信号数据类型;
S4、根据数据包集合和步骤S3的分析结果生成检测报告,将数据包集合、分析结果和检测报告对应的存储到关系型数据库中;
S5、从关系型数据库中获取检测报告并在终端进行展示。
2.根据权利要求1所述的一种WiFi信号数据的采集和处理方法,其特征在于,所述的固定频率的取值范围为0.5~10次/秒。
3.根据权利要求1所述的一种WiFi信号数据的采集和处理方法,其特征在于,每个数据包中包括数据包序号、协议包的帧头部分和接收该协议包的时间戳,所述协议包的帧头部分包括SSID、帧长度、帧状态、持续时间长度、源MAC地址和目的MAC地址。
4.根据权利要求1所述的一种WiFi信号数据的采集和处理方法,其特征在于,所述步骤S2中设置的阈值大于等于300。
5.根据权利要求1所述的一种WiFi信号数据的采集和处理方法,其特征在于,所述检测报告包括WiFi设备名称、WiFi设备类型、WiFi信号数据类型、WiFi信号出现的时段、WiFi信号强度信息。
6.一种WiFi信号数据的采集和处理***,其特征在于,包括WiFi数据采集模块、WiFi数据传输模块、WiFi数据分析模块和WiFi数据展示模块;
所述WiFi数据采集模块,用于监听检测区域内的WiFi信号,采集WiFi信号传输的协议包;
所述WiFi数据传输模块,用于临时存储WiFi数据采集模块采集的多个协议包,并通过有线或无线网络将采集的协议包打包后传输到WiFi数据分析模块;
所述WiFi数据分析模块,用于分析采集到的协议包中的数据,判断该WiFi信号对应的WiFi设备名称、WiFi设备类型和WiFi信号数据类型,并生成检测报告;
其中,所述WiFi数据分析模块从数据包集合中提取协议包的SSID,分析SSID得到WiFi信号对应的WiFi设备名称;从数据包集合获取协议包的源MAC地址,将源MAC地址与IEEE数据库中登记在册的MAC信息登记表进行匹配,判断该源MAC地址对应的WiFi设备的设备类型;从数据包集合中提取数据特征,根据机器学习算法结合数据特征训练模型,利用训练好的模型判断WiFi信号数据类型;
其中,所述WiFi数据分析模块任意选取一个数据包集合,将数据包集合中的数据包分为N组,每一组数据包中共有e个数据包,即有e个协议包,提取每一组数据包中每个协议包的帧长度,第i组数据包的帧长度集合为Ai={a1i,a2i,...,aji,...aei},其中,i=1,2,...,N,aji为第i组数据包中第j个协议包的帧长度,j=1,2,...,e,根据累积分布函数计算第i组数据包的帧长度分布
Figure FDA0003691004460000031
具体计算公式如下:
Figure FDA0003691004460000041
其中,Aimax表示协议包集合Ai中最大的帧长度,
Figure FDA0003691004460000042
代表Ai中元素小于等于
Figure FDA0003691004460000043
的概率;
N组数据包的帧长度分布集合为
Figure FDA0003691004460000044
对帧长度分布集合进行KS检验,得到帧长度分布稳定性x,具体计算公式如下:
Figure FDA0003691004460000045
提取每一组数据包中每个协议包的帧长度和接收协议包的时间戳,计算单位时间内传输的帧长度,即信号带宽,取带宽平均值作为该数据包集合的带宽值:
Figure FDA0003691004460000046
其中,B表示数据包集合的带宽值,bi表示第i组数据包的信号带宽;
根据每一组数据包的信号带宽计算数据包集合的带宽标准差,作为数据包集合的带宽稳定性S;
获取M个数据包集合,进行步骤(1)-(4)的处理,得到数据特征,所述数据特征包括帧长度分布、帧长度分布稳定性、带宽值和带宽稳定性,人工标注每个数据包集合中每组数据包的数据类型,用数据特征和人工标注的数据类型作为训练样本,基于机器学习算法训练WiFi数据类型识别模型;
为新接收的数据包集合提取数据特征,将提取的数据特征输入训练好的模型,输出新接收的数据包集合对应的WiFi信号数据类型;
所述WiFi数据展示模块,用于存储采集的WiFi数据、分析结果和检测报告,并在终端展示检测报告。
7.根据权利要求6所述的一种WiFi信号数据的采集和处理***,其特征在于,所述WiFi数据采集模块选用遵守IEEE802.11协议的WiFi芯片。
8.根据权利要求6所述的一种WiFi信号数据的采集和处理***,其特征在于,所述WiFi设备类型包括手机、平板、笔记本、打印机、数码相机、无线摄像头;所述WiFi信号数据类型包括音频、视频。
CN201910845417.0A 2019-09-05 2019-09-05 一种WiFi信号数据的采集和处理方法及其*** Active CN110536324B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201910845417.0A CN110536324B (zh) 2019-09-05 2019-09-05 一种WiFi信号数据的采集和处理方法及其***

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201910845417.0A CN110536324B (zh) 2019-09-05 2019-09-05 一种WiFi信号数据的采集和处理方法及其***

Publications (2)

Publication Number Publication Date
CN110536324A CN110536324A (zh) 2019-12-03
CN110536324B true CN110536324B (zh) 2022-08-12

Family

ID=68667638

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201910845417.0A Active CN110536324B (zh) 2019-09-05 2019-09-05 一种WiFi信号数据的采集和处理方法及其***

Country Status (1)

Country Link
CN (1) CN110536324B (zh)

Families Citing this family (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111914244B (zh) * 2020-07-31 2024-06-07 深圳力维智联技术有限公司 数据处理方法、装置及计算机可读存储介质
CN112152875A (zh) * 2020-09-09 2020-12-29 杭州涂鸦信息技术有限公司 一种WiFi模块异常连接的测试***及方法
CN113836109B (zh) * 2021-08-17 2023-04-14 中国电子科技集团公司第二十九研究所 一种无线电磁信号监测数据统计分析及结果呈现方法
CN116156505B (zh) * 2023-04-18 2023-08-04 南京桂瑞得信息科技有限公司 基于去噪自编码器与度量学习的WiFi设备检测方法

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103402177A (zh) * 2013-08-02 2013-11-20 南京市海聚信息科技有限公司 一种WiFi终端信息推送***及其实现方法
CN105960016A (zh) * 2016-06-23 2016-09-21 成都信息工程大学 一种获取rssi的方法
CN108449716A (zh) * 2018-03-28 2018-08-24 北京智慧空间科技有限责任公司 一种基于无线传感器的用户属性分析方法和***
CN109451486A (zh) * 2018-11-30 2019-03-08 南京航空航天大学 基于探测请求帧的WiFi采集***及WiFi终端探测方法

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103402177A (zh) * 2013-08-02 2013-11-20 南京市海聚信息科技有限公司 一种WiFi终端信息推送***及其实现方法
CN105960016A (zh) * 2016-06-23 2016-09-21 成都信息工程大学 一种获取rssi的方法
CN108449716A (zh) * 2018-03-28 2018-08-24 北京智慧空间科技有限责任公司 一种基于无线传感器的用户属性分析方法和***
CN109451486A (zh) * 2018-11-30 2019-03-08 南京航空航天大学 基于探测请求帧的WiFi采集***及WiFi终端探测方法

Also Published As

Publication number Publication date
CN110536324A (zh) 2019-12-03

Similar Documents

Publication Publication Date Title
CN110536324B (zh) 一种WiFi信号数据的采集和处理方法及其***
US20200322237A1 (en) Traffic detection method and traffic detection device
US9961571B2 (en) System and method for a multi view learning approach to anomaly detection and root cause analysis
US7516049B2 (en) Wireless performance analysis system
CN106416136A (zh) 网络监测器
CN109451486B (zh) 基于探测请求帧的WiFi采集***及WiFi终端探测方法
CN107995626B (zh) 一种用于识别无线局域网中wifi信号安全类别的方法和装置
CN106961693B (zh) 一种确定无线接入设备工作信道的方法
CN106412809A (zh) 基于蓝牙和wifi的mac地址采集方法及***
Rusca et al. What WiFi probe requests can tell you
CN101426216B (zh) 无线接入***分布式基站的测试方法及装置
CN114629811A (zh) 一种用于工业以太网通讯***的运行监测方法
CN114554185A (zh) 一种基于无线网络流量的偷拍摄像头检测及防护方法
Redondi et al. Passive classification of Wi-Fi enabled devices
CN111885621B (zh) 无线报文抓取方法、***、终端和存储介质
CN111371689B (zh) 基于深度学习的tcp拥塞控制版本识别方法和装置
US20220123848A1 (en) Wireless communication quality visualization system, wireless communication quality visualization device, and measurement apparatus
US20230292229A1 (en) Terminal scanning method, system, and apparatus, electronic device, and storage medium
CN102595467B (zh) 一种数据采集方法和设备
Cache Fingerprinting 802.11 implementations via statistical analysis of the duration field
US20160134747A1 (en) Quality degradation analysis method, quality degradation analysis device, and network system
CN109618139A (zh) 一种基于视觉路由的智能视频监控***及方法
WO2021057997A1 (zh) 嗅探器的数据监听方法及嗅探器、存储介质、终端
de Mello Silva et al. Performance analysis of a privacy-preserving frame sniffer on a Raspberry Pi
CN117939189B (zh) 一种面向不良视频加密流量数据的质量属性评价方法和***

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant