CN111753023B - 一种互联网专线类型确定方法和装置 - Google Patents

一种互联网专线类型确定方法和装置 Download PDF

Info

Publication number
CN111753023B
CN111753023B CN202010583164.7A CN202010583164A CN111753023B CN 111753023 B CN111753023 B CN 111753023B CN 202010583164 A CN202010583164 A CN 202010583164A CN 111753023 B CN111753023 B CN 111753023B
Authority
CN
China
Prior art keywords
line
internet
type
private line
internet private
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202010583164.7A
Other languages
English (en)
Other versions
CN111753023A (zh
Inventor
班瑞
李彤
马季春
白海龙
邹雨佳
陈泉霖
郝宇飞
王鹏
王佳
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
China United Network Communications Group Co Ltd
China Information Technology Designing and Consulting Institute Co Ltd
Original Assignee
China United Network Communications Group Co Ltd
China Information Technology Designing and Consulting Institute Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by China United Network Communications Group Co Ltd, China Information Technology Designing and Consulting Institute Co Ltd filed Critical China United Network Communications Group Co Ltd
Priority to CN202010583164.7A priority Critical patent/CN111753023B/zh
Publication of CN111753023A publication Critical patent/CN111753023A/zh
Application granted granted Critical
Publication of CN111753023B publication Critical patent/CN111753023B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/28Databases characterised by their database models, e.g. relational or object models
    • G06F16/284Relational databases
    • G06F16/285Clustering or classification
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/29Geographical information databases

Landscapes

  • Engineering & Computer Science (AREA)
  • Databases & Information Systems (AREA)
  • Theoretical Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Remote Sensing (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本申请实施例提供一种互联网专线类型确定方法和装置,涉及通信领域,能够更准确的确定互联网专线的类型。该方法包括:获取待分类的互联网专线的分类相关特征;分类相关特征包括专线用户特征、专线网络特征和专线地理特征;专线用户特征用于指示互联网专线对应用户的使用习惯;专线网络特征用于指示互联网专线的网络性能;专线地理特征用于指示互联网专线的地理信息点POI;根据待分类的互联网专线的分类相关特征,利用实时专线分类模型,确定待分类的互联网专线的类型。

Description

一种互联网专线类型确定方法和装置
技术领域
本发明涉及通信领域,尤其涉及一种互联网专线类型确定方法和装置。
背景技术
目前互联网专线的类型分类主要依靠专线静态资源信息关联进行识别的,这种识别方法完全依赖静态数据准确性,静态数据越准确识别的就越精确。但是实际情况是专线的静态数据与专线的实际业务有较大偏差,因此基于这种识别方法存在一些弊端:(1)由专线静态资源信息表信息不全或不准性导致无法识别或误识别。(2)专线静态资源信息表中的分类信息较少且固定不变,不适应需求的变化。(3)专线静态资源信息表维护工作量大。
发明内容
本发明的实施例提供一种互联网专线类型确定方法和装置,能够更准确的确定互联网专线的类型。
为达到上述目的,本发明的实施例采用如下技术方案:
第一方面,提供一种互联网专线类型确定方法,包括:获取待分类的互联网专线的分类相关特征;分类相关特征包括专线用户特征、专线网络特征和专线地理特征;专线用户特征用于指示互联网专线对应用户的使用习惯;专线网络特征用于指示互联网专线的网络性能;专线地理特征用于指示互联网专线的地理信息点POI;根据待分类的互联网专线的分类相关特征,利用实时专线分类模型,确定待分类的互联网专线的类型。
第二方面,提供一种互联网专线类型确定装置,包括:获取模块和分类模块;其中,获取模块,用于获取待分类的互联网专线的分类相关特征;分类相关特征包括专线用户特征、专线网络特征和专线地理特征;专线用户特征用于指示互联网专线对应用户的使用习惯;专线网络特征用于指示互联网专线的网络性能;专线地理特征用于指示互联网专线的地理信息点POI;分类模块,用于根据获取模块获取的待分类的互联网专线的分类相关特征,利用专线分类模型,确定待分类的互联网专线的类型。
第三方面,提供一种互联网专线类型确定装置,包括存储器、处理器、总线和通信接口;存储器用于存储计算机执行指令,处理器与存储器通过总线连接;当互联网专线类型确定装置运行时,处理器执行存储器存储的计算机执行指令,以使互联网专线类型确定装置执行如第一方面提供的互联网专线类型确定方法。
第四方面,提供一种计算机可读存储介质,包括计算机执行指令,当计算机执行指令在计算机上运行时,使得计算机执行如第一方面提供的互联网专线类型确定方法。
本申请实施例提供的互联网专线类型确定方法和装置,该方法包括:获取待分类的互联网专线的分类相关特征;分类相关特征包括专线用户特征、专线网络特征和专线地理特征;专线用户特征用于指示互联网专线对应用户的使用习惯;专线网络特征用于指示互联网专线的网络性能;专线地理特征用于指示互联网专线的地理信息点POI;根据待分类的互联网专线的分类相关特征,利用实时专线分类模型,确定待分类的互联网专线的类型。本申请实施例提供的技术方案,首先获取待分类的互联网专线的分类相关特征,然后通过预先训练得出的专线分类模型确定待分类的互联网专线的类型;因为本身申请实施例中互联网专线的分类相关特征中包括的专线用户特征、专线网络特征和专线地理特征是和专线类型息息相关的,而且是互联网专线使用过程中产生的,能够准确的反映出互联网专线的类型特征;再加上后续其结合训练得出的专线分类模型对待分类的互联网专线进行类型的确定,所以相较与现有技术中利用专线静态资源信息进行类型判断的方式,本申请实施例提供的技术方案更加准确,而且能够适用各种类型的互联网专线的判断。
附图说明
为了更清楚地说明本申请实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1为本申请实施例提供的一种***架构示意图;
图2为本申请实施例提供的一种互联网专线类型确定方法的流程示意图一;
图3为本申请实施例提供的一种互联网专线类型确定方法的流程示意图二;
图4为本申请实施例提供的一种训练专线分类模型的方法流程示意图一;
图5为本申请实施例提供的一种训练专线分类模型的方法流程示意图二;
图6为本申请实施例提供的一种训练专线分类模型的方法流程示意图三;
图7为本申请实施例提供的一种训练专线分类模型的方法流程示意图四;
图8为本申请实施例提供的模型调参效果示意图;
图9为本申请实施例提供的一种训练专线分类模型的方法流程示意图五;
图10为本申请实施例提供的一种互联网专线类型确定方法的流程示意图三;
图11为本申请实施例提供的一种互联网专线类型确定装置的结构示意图;
图12为本申请实施例提供的另一种互联网专线类型确定装置的结构示意图。
具体实施方式
下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
需要说明的是,本申请实施例中,“示例性的”或者“例如”等词用于表示作例子、例证或说明。本申请实施例中被描述为“示例性的”或者“例如”的任何实施例或设计方案不应被解释为比其它实施例或设计方案更优选或更具优势。确切而言,使用“示例性的”或者“例如”等词旨在以具体方式呈现相关概念。
还需要说明的是,本申请实施例中,“的(英文:of)”,“相应的(英文:corresponding,relevant)”和“对应的(英文:corresponding)”有时可以混用,应当指出的是,在不强调其区别时,其所要表达的含义是一致的。
为了便于清楚描述本申请实施例的技术方案,在本发明的实施例中,采用了“第一”、“第二”等字样对功能和作用基本相同的相同项或相似项进行区分,本领域技术人员可以理解“第一”、“第二”等字样并不是在对数量和执行次序进行限定。
目前,互联网专线的类型分类主要依靠专线静态资源信息,但是因为静态资源信息往往和专线的实际业务情况存在较大偏差,所以导致对互联网专线的分类不够准确。而且因为需要依靠专线静态资源信息,而专线静态资源信息一般以专线静态资源表的形式存储,也就需要时刻对专线静态资源信息表进行维护,而随着互联网专线的增多,专线静态资源信息表的维护工作量会越来越大。
因此,针对上述问题,本申请提供一种互联网专线类型确定方法,能够更准确的确定互联网专线的类型。本是年轻提供的互联网专线类型确定方法应用于如图1所示的***架构中,该***架构中包括互联网专线类型确定装置01和互联网专线02(02-1、02-2)。
其中,互联网专线02的一端连接骨干网04,另一端则连接该条互联网专线02对应的用户03(单个用户终端或多个用户终端(03-1和03-2)组成的用户群),其主要用于为用户03提供仅供用户03使用的高速稳定的专有网络。
互联网专线类型确定装置01用于从互联网专线02中获取互联网专线的话单数据,并根据该话单数据确定互联网专线的类型。实际中,互联网专线类型确定装置01可以是运营商的业务***,也可以是运营商单独设置的装置,还可以是其他任意可行装置,只要能获取互联网专线的话单数据即可。
基于上述***架构,参照图2所示,本申请实施例提供一种互联网专线类型确定方法,该方法可以由图1中的互联网专线类型确定钻至01实施,该方法具体包括101-102:
101、获取待分类的互联网专线的分类相关特征。
其中,分类相关特征包括专线用户特征、专线网络特征和专线地理特征;专线用户特征用于指示互联网专线对应用户的使用习惯;专线网络特征用于指示互联网专线的网络性能;专线地理特征用于指示互联网专线的地理信息点(point of information,POI)。
可选的,参照图3所示,101步骤具体为:
101、利用深度报文识别(deep packet inspection,DPI)技术从待分类的互联网专线的话单(至少包括CDR(Call Detail Record,呼叫详细记录)数据中获取待分类的互联网专线的分类相关特征。
可选的,因为目前的ipv6(Internet Protocol version 6,网络协议版本6)相关的数据大多为测试数据,所以上述101步骤获取的话单数据可以仅针对ipv4(InternetProtocol version 4,网络协议版本4)相关的数据。
示例性的,分类相关特征是以一周时间为单位得出的,所以101步骤中的话单数据可以为一周的,也可以为多周的,当为多周时,可以取平均值。以一周为例,分类相关特征可以包括以下内容:
(1)IP地址。
(2)工作日每小时流量,周末每小时流量。工作日每小时流量指工作日五天中相同的每一小时的流量之和,例如工作日8:00-9:00的流量为周一8:00-9:00的流量和周二至周五的8:00-9:00的流量的和。周末每小时流量同理。
(3)工作日流量,周末流量。
工作日流量具体为工作日的总流量,周末流量具体指周末两天的总流量。
(4)整周流量。
(5)工作日每小时流量占工作日流量百分比。
(6)周末每小时流量占周末流量百分比。
(7)工作日9—12,13—19时流量占工作日流量占比。
(8)工作日19—23时流量占工作日流量占比。
(9)以每小时为单位的流量的波动率η1
Figure BDA0002553760670000051
其中,xi为一周中每天的第i小时的流量之和,
Figure BDA0002553760670000052
为一种中每小时的流量和的平均值。
(10)工作时间与非工作时间流量波动率η2
Figure BDA0002553760670000061
其中,x1为一周中每天的9-19点的流量和,x2为一周中每天的9-19点以外的时间的流量和,
Figure BDA0002553760670000062
为x1和x2的平均值。
(11)工作日流量占整周流量占比。
(12)周末流量占整周流量占比。
(13)各个应用大类使用量占总应用量占比。
其中,应用大类的区分以实际需求为准。
(14)上、下行流量。
其中,上行流量为一周的上行流量和,下行流量同理。
(15)上、下行持续时间。
其中,上行持续时间为一天中上行的时间和,下行持续时间同理。
(16)上、下行平均速率。
其中,上行平均速率为前述的上行流量和上行持续时间的比值;下行平均速率同理。
(17)上行平均速率与下行平均速率的比值。
(18)上、下行包数。
其中,上行包数为一周中上行的数据包的数量,下行包数同理。
(19)上、下行重传包数。
其中,上行重传包数为一周中上行重传的数据包的数量,下行重传包数同理。
(20)上、下行重传率。
其中,上行重传率为上行重传包数占上行包数的比例,下行重传率同理。
(21)TCP建链确认总时延。
具体为互联网专线在一周的TCP(transmission control protocol,传输控制协议)建链确认的时延之和。
(22)TCP建链确认总次数。
具体为互联网专线在一周的TCP建链确认的次数。
(23)TCP建链确认平均时延。
具体为TCP建链确认总时延和TCP建链确认总次数的商值。
(24)第一条事务请求到其第一个响应包总时延。
具体为所有在TCP建链确认前的第一条事务请求到其第一个响应包的时延之和。
(25)第一条事务请求到其第一个响应包总次数。
具体为所有在TCP建链确认前的第一条事务请求到其第一个响应包的总次数。
(26)第一条事务请求到其第一个响应包平均时延。
具体为第一条事务请求到其第一个响应包总时延和第一条事务请求到其第一个响应包总次数的比值。
(27)第一个HTTP响应包相对于第一个HTTP请求包的总时延。
具体为所有在TCP建链确认后的HTTP响应包相对于第一个HTTP请求包的时延之和。
(28)第一个HTTP响应包相对于第一个HTTP请求包的总次数。
具体为所有在TCP建链确认后的HTTP响应包相对于第一个HTTP请求包的总次数。
(29)第一个HTTP响应包相对于第一个HTTP请求包的平均时延。
具体为第一个HTTP响应包相对于第一个HTTP请求包的总时延和第一个HTTP响应包相对于第一个HTTP请求包的总次数的比值。
(30)各种消息事务类型的话单数。
(31)所有消息事务类型话单数。
(32)各种消息事务类型话单占比。
具体为每一种消息事务类型的话单数在所有消息事务类型的话单总数中的占比。
(33)各种消息事务类型流量占比。
具体为每一种消息事务类型的流量在所有消息事务类型的总流量中的占比。
(34)常用url(uniform resource locator,统一资源定位符)后缀话单占比(.com.cn、.com、.cn、.gov、.edu、.org、other)。
具体为以常用url为后缀的话单数占总话单数的占比。
(35)常用url后缀流量占比(.com.cn、.com、.cn、.gov、.edu、.org、other)。
具体为以常用url为后缀的话单的流量占总流量的占比。
(36)以一周为单位的终端类型占比。
具体为一周中各类终端的数量占总终端数量的占比。
(37)以一周为单位移动端与桌面端流量占比。
(38)每日终端类型占比(PC端占比、移动端占比)。
具体为每天中各类终端的数量占总终端数量的占比。
(39)以每天为单位,移动端占比的波动率(方差)。
具体为一周中每天的移动端占比的方差。
(40)各类http内容话单占比(application、text、audio、video、image、message、drawing、java、other)。
参照(34)解释。
(44)各类http内容流量占比(application、text、audio、video、image、message、drawing、java、other)。
参照(35)解释。
(42)TCP连接成功次数。
(43)TCP连接失败次数。
(44)TCP连接成功率。
(45)TCP连接失败率。
(46)不是重要关注业务话单数。
其中,重要关注业务为互联网专线用户设定的或者运营商设定的。
(47)是重要关注业务话单数。
(48)重要关注业务率。
具体为重要关注业务数占所有业务数的占比。
(49)不是高危网站话单数。
(50)是高危网站话单数。
(51)不是高危网站率。
(52)是高危网站率。
(53)经纬度1(从现场中提取美团,饿了么,每日生鲜,宅急送的收货地址,将出现最多的地理标签(住宅、CBD商务区、学校、……),作为IP的地理位置标签)。
(54)经纬度2(uri中出现的经纬度,剔除异常值。将经纬度平均值作为IP地理位置的参考)。
(55)根据经纬度1和经纬度2,生成地理位置POI类型(无地理位置类型用null)。
其中,专线用户特征包括上述的(2)-(13)、(30)-(41)和(46)-(52);专线网络特征包括上述的(14)-(29)和(42)-(45);专线地理特征包括上述的(1)和(53)-(55)。
另外,需要说明的是,上述的55个特征不全都是直接利用DPI技术从话单数据中获取的,因为直接获取的特征可能会仅仅存在量的差别,而不同类型的互联网专线的特征差别应当主要体现在比例上,所以直接提取特征后,还需要根据直接提取的特征再构造,具体的,构造得到的特征可以包括上述的(5)-(13)、(16)、(17)、(20)、(23)、(26)、(29)、(32)、(33)-(41)、(44)、(45)、(48)、(51)和(55)。
当然,实际中,还可以获取比上述特征更多的或者更少的特征,此处不做具体限制。
102、根据待分类的互联网专线的分类相关特征,利用专线分类模型,确定待分类的互联网专线的类型。
基于上述技术方案,因为该技术方案中中互联网专线的分类相关特征中包括的专线用户特征、专线网络特征和专线地理特征是和专线类型息息相关的,而且是互联网专线使用过程中产生的,能够准确的反映出互联网专线的类型特征;再加上后续其结合训练得出的专线分类模型对待分类的互联网专线进行类型的确定,所以相较与现有技术中利用专线静态资源信息进行类型判断的方式,本申请实施例提供的技术方案更加准确,而且能够适用各种类型的互联网专线的判断。
可选的,参照图4,为了保证本申请实施例提供的技术方案的顺利实施,102步骤之前还包括(也可以是101步骤前,此处仅为示例,具体根据实际需求而定)S1-S4:
S1、利用DPI技术从多个样本互联网专线的历史话单数据中获取样本互联网专线的历史分类相关特征。
其中,历史话单数据为当前时刻之前第一预设时间段内样本互联网专线的话单数据;历史分类相关特征包括样本互联网专线在第一预设时间段内的专线用户特征、专线网络特征和专线地理特征;第一预设时间段的时间长度至少为一周(本申请中,第一预设时间段为一周的整数倍)。
S2、根据样本互联网专线的历史分类相关特征,利用预设聚类算法对样本互联网专线聚类,以得到k类样本互联网专线;k为正整数。
可选的,与预设聚类算法为k-means聚类算法为例,参照图5所示,S2具体包括S21-S25:
S21、对样本互联网专线的历史分类相关特征赋值。
其中,赋值使用的相关规则应当为同一规则。
S22、根据赋值后的历史分类相关特征确定样本互联网专线的特征坐标。
示例性的,以特征1和特征2两个特征为例,若对特征1赋值为1,对特征2赋值为2,则其对应额互联网专线的特征坐标为(1,2)。
S23、根据样本互联网专线的特征坐标,计算不同样本互联网专线之间的特征距离。
示例性的,以样本互联网专线A的特征坐标为(1,1),样本互联网专线B的特征坐标为(2,2)为例,两者的特征距离为
Figure BDA0002553760670000102
S24、根据轮廓系数公式确定k值。
具体的,轮廓系数越高,确定的k值达到的分类效果越好;k如果过大会导致聚类结果准确率低;k如果过小会导致聚类结果模糊。
示例性的,轮廓系数公式为:
Figure BDA0002553760670000101
其中,S(i)为轮廓系数;a(i)为样本i到本簇其它样本的平均距离;b(i)为样本i到其他簇样本的平均距离。
S25、根据k值和不同样本互联网专线之间的特征距离,利用k-means聚类算法将样本互联网专线分为k类。
S3、对k类样本互联网专线设置类型标签,类型标签和k类样本互联网专线一一对应;类型标签用于指示专线类型。
示例性的,可选的类型标签参照下表1所示。
Figure BDA0002553760670000111
表1
可选的,参照图6所示,S3具体包括S31-S32和S33-S35两种变脸方案:
S31、利用DPI技术从已知类型的参考互联网专线的话单数据中获取参考互联专线的参考分类相关特征。
其中,参考分类相关特征包括参考互联网专线的专线用户特征、专线网络特征和专线地理特征。示例性的,因为实际中有些互联网专线,运营商在设置时便会确定其类型且设置好类型标签,这类已知类型的互联网专线便为参考互联网专线。
S32、根据已知类型的参考互联网专线的参考分类相关特征,对样本互联网专线设置类型标签。
可选的,可以将历史分类相关特征与参考分类相关特征相似度最高的样本互联网专线的类型标签设置为对应参考互联网专线的类型的类型标签。相似度的计算可以是任意可行方式,此处不做具体限制。
基于S31-S32提供的技术方案,可以自动对样本互联网专线设置类型标签,可以进一步提高整个方案的实施效率。
S33、将样本互联网专线的聚类结果,以及样本互联网专线的历史分类相关特征发送给分类终端。
示例性的,分类终端的所有人可以为对样本互联网专线具有足够认知的专业分析人员。
S34、接收分类终端对样本互联网专线的类型标签设置结果。
S35、根据分类终端对样本互联网专线的类型标签设置结果,对样本互联网专线设置类型标签。
基于S33-S34提供的技术方案,可以利用专业人员对互联网专线的认知,更准确的对样本互联网专线设置类型标签,可以进一步提高本申请技术方***性。
S4、将样本互联网专线的类型标签和样本互联网专线的历史分类相关特征作为训练数据,利用预设机器学习算法构建专线分类模型。
示例性的,以预设机器学习算法为随机森林模型训练算法为例(实际中还可以是其他算法,可以任选,也可以在都测试后选取效果最好的作为预设机器学习算法),参照图7所示,S4包括:S41-S45:
S41、将训练数据分为两份,一份作为训练集,一份作为测试集。
示例性的,具体训练集和测试集中样本的比例可以为7:3;在分割时,具体,一个样本包括一个互联网专线的类型标签及其对应的历史分类相关特征。
S42、使用训练集,采用随机森林模型算法训练得出初始专线分类模型。
S43、使用测试集对初始专线分类模型进行测试评估,确定初始专线分类模型是否符合预设指标。
当确定初始专线分类模型符合预设指标时,执行S44;当确定初始专线分类模型不符合预设指标时,执行S45。
具体的,由于是多分类问题,并且存在样本不均衡问题。所以采用准确性accuracy和宏平均来衡量模型优劣的。accuracy注重整体的正确率,宏平均能兼顾少数类的识别准确率。
其中,accuracy=分类正确的样本个数/分类的所有样本个数;
宏平均具体包括综合指标、宏查准率和宏查全率(三者数值越高则表明模型效果越好):
综合指标F1=(2*宏查准率Pmacro*宏查全率Rmacro)/(宏查准率+宏查全率);
Figure BDA0002553760670000131
Figure BDA0002553760670000132
其中,Pi为第i类的样本互联网专线的查准率,Ri为第i类的样本互联网专线的查全率,n为初始专线分类模型可以分出的类型数。
S44、将初始专线分类确定为专线分类模型。
S45、根据测试集对初始专线分类模型进行测试评估的结果对初始专线分类模型调参,直至其满足预设指标后,将其确定为专线分类模型。
示例性的,随机森林模型算法得出的初始分类模型中可调的参数如下表2。
Figure BDA0002553760670000133
表2
可选的,如果根据测试评估的结果确定初始专线分类模型是过拟合,则将参数向模型简单化的方向调整;如果是欠拟合将参数向模型复杂化的方向调整。示例性的,模型简单化可以是将min_samples_split调高,复杂化则相反;以调整min_samples_split为例,参照图8所示,可知min_samples_split的最佳参数为6;图中auc面积为accuracy的值。
可选的,因为前述的分类相关特征中的55种特征中可能存在并不能准确区别不同类型的特征或者特征存在一定噪声、缺失等问题,所以参照图9所示,在S2步骤前还包括SA:
SA、对样本互联网专线的历史分类相关特征进行特征工程。
其中,特征工程至少包括:数据预处理和特征选择;数据预处理至少包括:无量纲化、缺失值处理和连续性特征处理;特征选择至少包括:方差过滤和互信息法过滤。
其中,无量纲化可以加快模型收敛速度、消除不同特征数值相差过大的影响,具体可以将各个特征的数值进行标准化。示例性的,特征1(工作日9:00至10:00的流量占比)这个特征值可能为0.1,特征2(TCP建链响应平均时延)这个特征可能为500,标准化是将这两个特征的均值变成0,标准差和方差都变为1;假设特征1的均值为0.05,标准差为0.025,则0.1标准化后为2;假设特征2的均值为400,标准差为100,则500标准化后为1。可见,标准化明显降低了不同量纲的特征的数值之间的巨大差异。具体的,A的标准化后的值=(A-A的均值)/A的标准差。
缺失值处理具体可以为将缺失的部分可以用0值填补。
连续性特征处理具体为将连续性特征变为离散型特征(分段),主要是因为以下三点:(1)如决策树、朴素贝叶斯等算法,都是基于离散型的数据展开的。如果要使用该类算法,必须将离散型的数据进行。有效的离散化能减小算法的时间和空间开销,提高***对样本的分类聚类能力和抗噪声能力。(2)离散化的特征相对于连续型特征更易理解,更接近知识层面的表达。比如工资收入,月薪2000和月薪20000,从连续型特征来看高低薪的差异还要通过数值层面才能理解,但将其转换为离散型数据(底薪、高薪),则可以更加直观的表达出了我们心中所想的高薪和底薪。(3)可以有效的克服数据中隐藏的缺陷,使模型结果更加稳定。
方差过滤的方式为将方差为0的特征去除。因为如果某一个特征的方差为0则表明其全部相同,不具备区分能力。
互信息法过滤的原因:特征与类型标签的概率之间不一定是按比例成直线的关系,也可能是非线性关系(前期一个特征越大,类型标签是某一类的概率越大,但是到后期可能并不是这样),所以需要采用互信息法过滤噪声。具体方式,计算每个特征和类型标签之间的互信息量,将互信息量为0(表明该特征和类型标签完全不相关)的特征删除。具体互信息量的计算可参照现有技术,此处不对此赘述。
另外,除了上述的特征处理方式以外,对于分类相关特征中的涉及到时间段的特征(例如工作日9-12时的流量占工作日流量的占比)对于不同的行业使用互联网专线可能并不能体验出不同类型的互联网专线的区别,所以还需要利用分箱合并的方式将这类特征进行一定程度的合并处理。
需要说明的是,如果在训练专线分类相关模型时进行了上述特征工程,则在101步骤后也需要对待分类的互联网专线的分类相关特征进行同样的特征工程,或者直接根据训练专线分类相关模型筛选出的特征选取101步骤获取的分类相关特征中的部分特征作为后续102步骤中输入专线分类模型中的特征。
可选的,参照图10所示,为了能够不断优化专线分类模型,102步骤之后还包括103-105:
103、每隔第二预设时间段利用DPI技术从目标互联网专线的话单数据中获取目标互联网专线的分类相关特征。
其中,目标互联网专线为在第二预设时间段内出现的已知类型的互联网专线;例如某运营商对某幼儿园设置类型标签为x的互联网专线。其中,幼儿园这一类型对应的类型标签x还有可能在原先的类型标签库中不存在,即前述102步骤中专线分类模型永远不可能将某个互联网专线的类型标签确定为对应幼儿园这一类型的类型标签x。
104、将目标互联网专线作为新的样本互联网专线,并将目标互联网专线的类型作为其对应的类型标签,以更新训练数据。
105、根据更新后的训练数据,利用预设机器学习算法更新专线分类模型。
本申请实施例提供的互联网专线类型确定方法和装置,该方法包括:获取待分类的互联网专线的分类相关特征;分类相关特征包括专线用户特征、专线网络特征和专线地理特征;专线用户特征用于指示互联网专线对应用户的使用习惯;专线网络特征用于指示互联网专线的网络性能;专线地理特征用于指示互联网专线的地理信息点POI;根据待分类的互联网专线的分类相关特征,利用实时专线分类模型,确定待分类的互联网专线的类型。本申请实施例提供的技术方案,首先获取待分类的互联网专线的分类相关特征,然后通过预先训练得出的专线分类模型确定待分类的互联网专线的类型;因为本身申请实施例中互联网专线的分类相关特征中包括的专线用户特征、专线网络特征和专线地理特征是和专线类型息息相关的,而且是互联网专线使用过程中产生的,能够准确的反映出互联网专线的类型特征;再加上后续其结合训练得出的专线分类模型对待分类的互联网专线进行类型的确定,所以相较与现有技术中利用专线静态资源信息进行类型判断的方式,本申请实施例提供的技术方案更加准确,而且能够适用各种类型的互联网专线的判断。
参照图11所示,本申请实施例提供的一种如图1中所示互联网专线类型确定装置01,用于实施前述实施例提供的技术方案,该装置具体包括:获取模块21、分类模块22和建模模块23。
其中,获取模块21,用于获取待分类的互联网专线的分类相关特征;分类相关特征包括专线用户特征、专线网络特征和专线地理特征;专线用户特征用于指示互联网专线对应用户的使用习惯;专线网络特征用于指示互联网专线的网络性能;专线地理特征用于指示互联网专线的地理信息点POI;
分类模块22,用于根据获取模块21获取的待分类的互联网专线的分类相关特征,利用专线分类模型,确定待分类的互联网专线的类型。
可选的,获取模块21具体用于:利用深度报文识别DPI技术从待分类的互联网专线的话单数据中获取待分类的互联网专线的分类相关特征。
可选的,建模模块23包括获取单元231、聚类单元232、贴标单元233和训练单元234;
获取单元231,用于利用DPI技术从多个样本互联网专线的历史话单数据中获取样本互联网专线的历史分类相关特征;历史话单数据为当前时刻之前第一预设时间段内样本互联网专线的话单数据;历史分类相关特征包括样本互联网专线在第一预设时间段内的专线用户特征、专线网络特征和专线地理特征;第一预设时间段的时间长度至少为一周;
聚类单元232,用于根据获取单元231获取的样本互联网专线的历史分类相关特征,利用预设聚类算法对样本互联网专线聚类,以得到k类样本互联网专线;k为正整数;
贴标单元233,用于对聚类单元232聚类出的k类样本互联网专线设置类型标签,类型标签和k类样本互联网专线一一对应;类型标签用于指示专线类型;
训练单元234,用于将贴标单元233对样本互联网专线设置的类型标签和获取单元231获取的样本互联网专线的历史分类相关特征作为训练数据,利用预设机器学习算法构建专线分类模型。
可选的,贴标单元233具体用于:利用DPI技术从已知类型的参考互联网专线的话单数据中获取参考互联专线的参考分类相关特征;参考分类相关特征包括参考互联网专线的专线用户特征、专线网络特征和专线地理特征;
根据已知类型的参考互联网专线的参考分类相关特征,对样本互联网专线设置类型标签。
可选的,贴标单元233具体用于:将聚类单元232对样本互联网专线的聚类结果,以及获取单元231获取的样本互联网专线的历史分类相关特征发送给分类终端;接收分类终端对样本互联网专线的类型标签设置结果;根据分类终端对样本互联网专线的类型标签设置结果,对样本互联网专线设置类型标签。
可选的,建模模块23还包括特征处理单元235;特征处理单元235,用于在聚类单元232根据获取单元231获取的样本互联网专线的历史分类相关特征,利用预设聚类算法对样本互联网专线聚类,以得到k类样本互联网专线之前,对样本互联网专线的历史分类相关特征进行特征工程;特征工程至少包括:数据预处理和特征选择;数据预处理至少包括:无量纲化、缺失值处理和连续性特征处理;特征选择至少包括:方差过滤和互信息法过滤。
可选的,在分类模块22对待分类的互联网专线的类型进行确定后,
获取单元231还用于每隔第二预设时间段利用DPI技术从目标互联网专线的话单数据中获取目标互联网专线的分类相关特征;目标互联网专线为在第二预设时间段内出现的已知类型的互联网专线;
训练单元234还用于将获取单元231获取的目标互联网专线作为新的样本互联网专线,并将获取单元231获取的目标互联网专线的类型作为其对应的类型标签,以更新训练数据;
训练单元234还用于根据更新后的训练数据,利用预设机器学习算法更新专线分类模型。
本申请实施例提供的互联网专线类型确定装置,因为该装置包括:获取模块,用于获取待分类的互联网专线的分类相关特征;分类相关特征包括专线用户特征、专线网络特征和专线地理特征;专线用户特征用于指示互联网专线对应用户的使用习惯;专线网络特征用于指示互联网专线的网络性能;专线地理特征用于指示互联网专线的地理信息点POI;分类模块,用于根据获取模块获取的待分类的互联网专线的分类相关特征,利用专线分类模型,确定待分类的互联网专线的类型。所以本申请实施例提供的技术方案,首先可以获取待分类的互联网专线的分类相关特征,然后通过预先训练得出的专线分类模型确定待分类的互联网专线的类型;因为本身申请实施例中互联网专线的分类相关特征中包括的专线用户特征、专线网络特征和专线地理特征是和专线类型息息相关的,而且是互联网专线使用过程中产生的,能够准确的反映出互联网专线的类型特征;再加上后续其结合训练得出的专线分类模型对待分类的互联网专线进行类型的确定,所以相较与现有技术中利用专线静态资源信息进行类型判断的方式,本申请实施例提供的技术方案更加准确,而且能够适用各种类型的互联网专线的判断。
参照图12所示,本申请实施例还提供另一种互联网专线类型确定装置,包括存储器41、处理器42、总线43和通信接口44;存储器41用于存储计算机执行指令,处理器42与存储器41通过总线43连接;当互联网专线类型确定装置运行时,处理器42执行存储器41存储的计算机执行指令,以使互联网专线类型确定装置执行如上述实施例提供的互联网专线类型确定方法。
在具体的实现中,作为一种实施例,处理器42(42-1和42-2)可以包括一个或多个CPU,例如图12中所示的CPU0和CPU1。且作为一种实施例,互联网专线类型确定装置可以包括多个处理器42,例如图12中所示的处理器42-1和处理器42-2。这些处理器42中的每一个CPU可以是一个单核处理器(Single-CPU),也可以是一个多核处理器(Multi-CPU)。这里的处理器42可以指一个或多个设备、电路、和/或用于处理数据(例如计算机程序指令)的处理核。
存储器41可以是只读存储器41(Read-Only Memory,ROM)或可存储静态信息和指令的其他类型的静态存储设备,随机存取存储器(Random Access Memory,RAM)或者可存储信息和指令的其他类型的动态存储设备,也可以是电可擦可编程只读存储器(Electrically Erasable Programmable Read-Only Memory,EEPROM)、只读光盘(CompactDisc Read-Only Memory,CD-ROM)或其他光盘存储、光碟存储(包括压缩光碟、激光碟、光碟、数字通用光碟、蓝光光碟等)、磁盘存储介质或者其他磁存储设备、或者能够用于携带或存储具有指令或数据结构形式的期望的程序代码并能够由计算机存取的任何其他介质,但不限于此。存储器41可以是独立存在,通过总线43与处理器42相连接。存储器41也可以和处理器42集成在一起。
在具体的实现中,存储器41,用于存储本申请中的数据和执行本申请的软件程序对应的计算机执行指令。处理器42可以通过运行或执行存储在存储器41内的软件程序,以及调用存储在存储器41内的数据,互联网专线类型确定装置的各种功能。
通信接口44,使用任何收发器一类的装置,用于与其他设备或通信网络通信,如控制***、无线接入网(Radio Access Network,RAN),无线局域网(Wireless Local AreaNetworks,WLAN)等。通信接口44可以包括接收单元实现接收功能,以及发送单元实现发送功能。
总线43,可以是工业标准体系结构(Industry Standard Architecture,ISA)总线、外部设备互连(Peripheral Component Interconnect,PCI)总线或扩展工业标准体系结构(Extended Industry Standard Architecture,EISA)总线等。该总线43可以分为地址总线、数据总线、控制总线等。为便于表示,图12中仅用一条粗线表示,但并不表示仅有一根总线或一种类型的总线。
本申请实施例还提供一种计算机可读存储介质,计算机可读存储介质包括计算机执行指令,当计算机执行指令在计算机上运行时,使得计算机执行如上述实施例提供的互联网专线类型确定方法。
本申请实施例还提供一种计算机程序,该计算机程序可直接加载到存储器中,并含有软件代码,该计算机程序经由计算机载入并执行后能够实现上述实施例提供的互联网专线类型确定方法。
本领域技术人员应该可以意识到,在上述一个或多个示例中,本发明所描述的功能可以用硬件、软件、固件或它们的任意组合来实现。当使用软件实现时,可以将这些功能存储在计算机可读介质中或者作为计算机可读介质上的一个或多个指令或代码进行传输。计算机可读介质包括计算机可读存储介质和通信介质,其中通信介质包括便于从一个地方向另一个地方传送计算机程序的任何介质。存储介质可以是通用或专用计算机能够存取的任何可用介质。
通过以上的实施方式的描述,所属领域的技术人员可以清楚地了解到,为描述的方便和简洁,仅以上述各功能模块的划分进行举例说明,实际应用中,可以根据需要而将上述功能分配由不同的功能模块完成,即将装置的内部结构划分成不同的功能模块,以完成以上描述的全部或者部分功能。
在本申请所提供的几个实施例中,应该理解到,所揭露的装置和方法,可以通过其它的方式实现。例如,以上所描述的装置实施例仅仅是示意性的,例如,所述模块或单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式。例如多个单元或组件可以结合或者可以集成到另一个装置,或一些特征可以忽略,或不执行。另一点,所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些接口,装置或单元的间接耦合或通信连接,可以是电性,机械或其它的形式。作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是一个物理单元或多个物理单元,即可以位于一个地方,或者也可以分布到多个不同地方。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。
另外,在本发明各个实施例中的各功能单元可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中。上述集成的单元既可以采用硬件的形式实现,也可以采用软件功能单元的形式实现。集成的单元如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个可读取存储介质中。基于这样的理解,本申请实施例的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的全部或部分可以以软件产品的形式体现出来,该软件产品存储在一个存储介质中,包括若干指令用以使得一个设备(可以是单片机,芯片等)或处理器(processor)执行本发明各个实施例所述方法的全部或部分步骤。而前述的存储介质包括:U盘、移动硬盘、ROM、RAM、磁碟或者光盘等各种可以存储程序代码的介质。
以上所述,仅为本发明的具体实施方式,但本发明的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本发明揭露的技术范围内,可轻易想到的变化或替换,都应涵盖在本发明的保护范围之内。因此,本发明的保护范围应以权利要求的保护范围为准。

Claims (14)

1.一种互联网专线类型确定方法,其特征在于,包括:
获取待分类的互联网专线的分类相关特征;所述分类相关特征包括专线用户特征、专线网络特征和专线地理特征;专线用户特征用于指示互联网专线对应用户的使用习惯;专线网络特征用于指示互联网专线的网络性能;专线地理特征用于指示互联网专线的地理信息点POI;
利用深度报文识别DPI技术从多个样本互联网专线的历史话单数据中获取所述样本互联网专线的历史分类相关特征;所述历史话单数据为当前时刻之前第一预设时间段内所述样本互联网专线的话单数据;所述历史分类相关特征包括所述样本互联网专线在所述第一预设时间段内的专线用户特征、专线网络特征和专线地理特征;所述第一预设时间段的时间长度至少为一周;
根据所述样本互联网专线的历史分类相关特征,利用预设聚类算法对所述样本互联网专线聚类,以得到k类样本互联网专线;k为正整数;
对所述k类样本互联网专线设置类型标签,类型标签和所述k类样本互联网专线一一对应;所述类型标签用于指示专线类型;
将所述样本互联网专线的类型标签和所述样本互联网专线的历史分类相关特征作为训练数据,利用预设机器学习算法构建专线分类模型;
根据所述待分类的互联网专线的分类相关特征,利用专线分类模型,确定所述待分类的互联网专线的类型。
2.根据权利要求1所述的互联网专线类型确定方法,其特征在于,所述获取待分类的互联网专线用户的分类相关特征包括:
利用DPI技术从所述待分类的互联网专线的话单数据中获取所述待分类的互联网专线的分类相关特征。
3.根据权利要求1所述的互联网专线类型确定方法,其特征在于,所述对所述k类样本互联网专线设置类型标签,类型标签和所述k类样本互联网专线一一对应包括:
利用DPI技术从已知类型的参考互联网专线的话单数据中获取所述参考互联网专线的参考分类相关特征;所述参考分类相关特征包括所述参考互联网专线的专线用户特征、专线网络特征和专线地理特征;
根据已知类型的参考互联网专线的参考分类相关特征,对所述样本互联网专线设置类型标签。
4.根据权利要求1所述的互联网专线类型确定方法,其特征在于,所述对所述k类样本互联网专线设置类型标签,类型标签和所述k类样本互联网专线一一对应包括:
将所述样本互联网专线的聚类结果,以及所述样本互联网专线的历史分类相关特征发送给分类终端;
接收所述分类终端对所述样本互联网专线的类型标签设置结果;
根据所述分类终端对所述样本互联网专线的类型标签设置结果,对所述样本互联网专线设置类型标签。
5.根据权利要求1所述的互联网专线类型确定方法,其特征在于,所述根据所述样本互联网专线的历史分类相关特征,利用预设聚类算法对所述样本互联网专线聚类,以得到k类样本互联网专线之前还包括:
对所述样本互联网专线的历史分类相关特征进行特征工程;所述特征工程至少包括:数据预处理和特征选择;所述数据预处理至少包括:无量纲化、缺失值处理和连续性特征处理;所述特征选择至少包括:方差过滤和互信息法过滤。
6.根据权利要求1所述的互联网专线类型确定方法,其特征在于,所述根据所述待分类的互联网专线的分类相关特征,利用实时专线分类模型,确定所述待分类的互联网专线的类型之后还包括:
每隔第二预设时间段利用DPI技术从目标互联网专线的话单数据中获取所述目标互联网专线的分类相关特征;所述目标互联网专线为在所述第二预设时间段内出现的已知类型的互联网专线;
将所述目标互联网专线作为新的样本互联网专线,并将所述目标互联网专线的类型作为其对应的类型标签,以更新所述训练数据;
根据更新后的所述训练数据,利用所述预设机器学习算法更新所述专线分类模型。
7.一种互联网专线类型确定装置,其特征在于,包括:获取模块、分类模块、以及建模模块,所述建模模块包括获取单元、聚类单元、贴标单元和训练单元;
所述获取模块,用于获取待分类的互联网专线的分类相关特征;所述分类相关特征包括专线用户特征、专线网络特征和专线地理特征;专线用户特征用于指示互联网专线对应用户的使用习惯;专线网络特征用于指示互联网专线的网络性能;专线地理特征用于指示互联网专线的地理信息点POI;
所述获取单元,用于利用深度报文识别DPI技术从多个样本互联网专线的历史话单数据中获取所述样本互联网专线的历史分类相关特征;所述历史话单数据为当前时刻之前第一预设时间段内所述样本互联网专线的话单数据;所述历史分类相关特征包括所述样本互联网专线在所述第一预设时间段内的专线用户特征、专线网络特征和专线地理特征;所述第一预设时间段的时间长度至少为一周;
所述聚类单元,用于根据所述获取单元获取的所述样本互联网专线的历史分类相关特征,利用预设聚类算法对所述样本互联网专线聚类,以得到k类样本互联网专线;k为正整数;
所述贴标单元,用于对所述聚类单元聚类出的所述k类样本互联网专线设置类型标签,类型标签和所述k类样本互联网专线一一对应;所述类型标签用于指示专线类型;
所述训练单元,用于将所述贴标单元对所述样本互联网专线设置的类型标签和所述获取单元获取的所述样本互联网专线的历史分类相关特征作为训练数据,利用预设机器学习算法构建专线分类模型;
所述分类模块,用于根据所述获取模块获取的所述待分类的互联网专线的分类相关特征,利用专线分类模型,确定所述待分类的互联网专线的类型。
8.根据权利要求7所述的互联网专线类型确定装置,其特征在于,所述获取模块具体用于:
利用DPI技术从所述待分类的互联网专线的话单数据中获取所述待分类的互联网专线的分类相关特征。
9.根据权利要求7所述的互联网专线类型确定装置,其特征在于,所述贴标单元具体用于:
利用DPI技术从已知类型的参考互联网专线的话单数据中获取所述参考互联网专线的参考分类相关特征;所述参考分类相关特征包括所述参考互联网专线的专线用户特征、专线网络特征和专线地理特征;
根据已知类型的参考互联网专线的参考分类相关特征,对所述样本互联网专线设置类型标签。
10.根据权利要求7所述的互联网专线类型确定装置,其特征在于,所述贴标单元具体用于:
将所述聚类单元对所述样本互联网专线的聚类结果,以及所述获取单元获取的所述样本互联网专线的历史分类相关特征发送给分类终端;
接收所述分类终端对所述样本互联网专线的类型标签设置结果;
根据所述分类终端对所述样本互联网专线的类型标签设置结果,对所述样本互联网专线设置类型标签。
11.根据权利要求7所述的互联网专线类型确定装置,其特征在于,所述建模模块还包括特征处理单元;
所述特征处理单元,用于在所述聚类单元根据所述获取单元获取的所述样本互联网专线的历史分类相关特征,利用预设聚类算法对所述样本互联网专线聚类,以得到k类样本互联网专线之前,对所述样本互联网专线的历史分类相关特征进行特征工程;所述特征工程至少包括:数据预处理和特征选择;所述数据预处理至少包括:无量纲化、缺失值处理和连续性特征处理;所述特征选择至少包括:方差过滤和互信息法过滤。
12.根据权利要求7所述的互联网专线类型确定装置,其特征在于,在所述分类模块对所述待分类的互联网专线的类型进行确定后,
所述获取单元还用于每隔第二预设时间段利用DPI技术从目标互联网专线的话单数据中获取所述目标互联网专线的分类相关特征;所述目标互联网专线为在所述第二预设时间段内出现的已知类型的互联网专线;
所述训练单元还用于将所述获取单元获取的所述目标互联网专线作为新的样本互联网专线,并将所述获取单元获取的所述目标互联网专线的类型作为其对应的类型标签,以更新所述训练数据;
所述训练单元还用于根据更新后的所述训练数据,利用所述预设机器学习算法更新所述专线分类模型。
13.一种互联网专线类型确定装置,其特征在于,包括存储器、处理器、总线和通信接口;所述存储器用于存储计算机执行指令,所述处理器与所述存储器通过所述总线连接;当所述互联网专线类型确定装置运行时,所述处理器执行所述存储器存储的所述计算机执行指令,以使所述互联网专线类型确定装置执行如权利要求1-6任一项所述的互联网专线类型确定方法。
14.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质包括计算机执行指令,当所述计算机执行指令在计算机上运行时,使得所述计算机执行如权利要求1-6任一项所述的互联网专线类型确定方法。
CN202010583164.7A 2020-06-23 2020-06-23 一种互联网专线类型确定方法和装置 Active CN111753023B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202010583164.7A CN111753023B (zh) 2020-06-23 2020-06-23 一种互联网专线类型确定方法和装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202010583164.7A CN111753023B (zh) 2020-06-23 2020-06-23 一种互联网专线类型确定方法和装置

Publications (2)

Publication Number Publication Date
CN111753023A CN111753023A (zh) 2020-10-09
CN111753023B true CN111753023B (zh) 2023-06-06

Family

ID=72676943

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202010583164.7A Active CN111753023B (zh) 2020-06-23 2020-06-23 一种互联网专线类型确定方法和装置

Country Status (1)

Country Link
CN (1) CN111753023B (zh)

Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102055674A (zh) * 2011-01-17 2011-05-11 工业和信息化部电信传输研究所 Ip报文及基于该ip报文的信息处理方法及装置
CN102546220A (zh) * 2010-12-31 2012-07-04 ***通信集团福建有限公司 一种基于业务特征的关键质量指标构成方法
CN106452858A (zh) * 2016-09-28 2017-02-22 北京齐尔布莱特科技有限公司 一种识别网络用户的方法、装置和计算设备
CN107563429A (zh) * 2017-07-27 2018-01-09 国家计算机网络与信息安全管理中心 一种网络用户群体的分类方法及装置
CN108021673A (zh) * 2017-12-06 2018-05-11 北京拉勾科技有限公司 一种用户兴趣模型生成方法、职位推荐方法及计算设备
CN111131068A (zh) * 2018-11-01 2020-05-08 ***通信集团广东有限公司 互联网专线数据传输方法及装置
CN111125061A (zh) * 2019-12-18 2020-05-08 甘肃省卫生健康统计信息中心(西北人口信息中心) 一种规范和促进健康医疗大数据的方法

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US10528604B2 (en) * 2018-01-30 2020-01-07 Sunrise Opportunities, LLC Methods and systems for tracking the flow of trucking freight and/or other assets using mobile device geolocation data

Patent Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102546220A (zh) * 2010-12-31 2012-07-04 ***通信集团福建有限公司 一种基于业务特征的关键质量指标构成方法
CN102055674A (zh) * 2011-01-17 2011-05-11 工业和信息化部电信传输研究所 Ip报文及基于该ip报文的信息处理方法及装置
CN106452858A (zh) * 2016-09-28 2017-02-22 北京齐尔布莱特科技有限公司 一种识别网络用户的方法、装置和计算设备
CN107563429A (zh) * 2017-07-27 2018-01-09 国家计算机网络与信息安全管理中心 一种网络用户群体的分类方法及装置
CN108021673A (zh) * 2017-12-06 2018-05-11 北京拉勾科技有限公司 一种用户兴趣模型生成方法、职位推荐方法及计算设备
CN111131068A (zh) * 2018-11-01 2020-05-08 ***通信集团广东有限公司 互联网专线数据传输方法及装置
CN111125061A (zh) * 2019-12-18 2020-05-08 甘肃省卫生健康统计信息中心(西北人口信息中心) 一种规范和促进健康医疗大数据的方法

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
a neuro-fuzzy approach for user behaviour classification and prediction;Atta ur Rahman等;journal of cloud computing;1-15 *
大客户专线接入的建设方式研究;欧秀惠;;中国新通信;第19卷(第12期);56-57 *

Also Published As

Publication number Publication date
CN111753023A (zh) 2020-10-09

Similar Documents

Publication Publication Date Title
CN107181724B (zh) 一种协同流的识别方法、***以及使用该方法的服务器
CN111935820B (zh) 基于无线网络的定位实现方法及相关设备
CN113742387A (zh) 数据处理方法、设备及计算机可读存储介质
JP2002523814A (ja) 通常表現を使用するトランザクションの認識および予測
US8239532B1 (en) System and method of reducing latency using adaptive DNS resolution
CN108322495B (zh) 资源访问请求的处理方法、装置和***
CN115080854A (zh) 一种用于企业服务的数字化服务平台***
CN113918622A (zh) 基于区块链的信息溯源方法及***
CN111753023B (zh) 一种互联网专线类型确定方法和装置
CN111581226B (zh) 基于大数据平台的数据共享方法、装置及政企云平台
CN111783107B (zh) 一种多源可信数据接入方法、装置及设备
CN110674832A (zh) 互联网用户所属企业的识别方法、装置和终端
CN116094969B (zh) 带宽调整方法、装置、设备及存储介质
CN109167673B (zh) 一种融合异常Qos数据检测的新型云服务筛选方法
CN112396313B (zh) 一种利用智能手表优化电话销售工作绩效的方法
CN108227038B (zh) 一种台风强度诊断方法、装置、服务器及存储介质
CN112054989A (zh) 一种检测模型的构建方法及批量操作异常的检测方法
RU2795667C1 (ru) Система анализа интернет-трафика пользователя для присвоения пользовательскому устройству коэффициента классификации пользователя
WO2019231015A1 (ko) 기업 정보 제공 장치 및 방법
CN112906999B (zh) 话务指标优化效果评估方法、装置及计算设备
CN117172721B (zh) 用于融资业务的数据流转监管预警方法及***
CN116912001B (zh) 一种基于互联网区块链的工程材料交易管控方法及***
CN113645051B (zh) 一种对客户投诉进行预警的方法及装置
CN110929106B (zh) 用于获取目标数据的方法及装置
JP4780670B2 (ja) トラヒック分析モデルの構築方法、装置および構築プログラムならびにその記憶媒体

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant