CN111163482B - 数据的处理方法、设备及存储介质 - Google Patents

数据的处理方法、设备及存储介质 Download PDF

Info

Publication number
CN111163482B
CN111163482B CN201911360830.4A CN201911360830A CN111163482B CN 111163482 B CN111163482 B CN 111163482B CN 201911360830 A CN201911360830 A CN 201911360830A CN 111163482 B CN111163482 B CN 111163482B
Authority
CN
China
Prior art keywords
base station
data
portrait
portrait label
label
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201911360830.4A
Other languages
English (en)
Other versions
CN111163482A (zh
Inventor
尹屾
武亚龙
李�禾
严希音
解觯
蔡凯
郭宇
付莉
黄婕
王双
只璐
仲思睿
张蕾
屈洋
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
China United Network Communications Group Co Ltd
Original Assignee
China United Network Communications Group Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by China United Network Communications Group Co Ltd filed Critical China United Network Communications Group Co Ltd
Priority to CN201911360830.4A priority Critical patent/CN111163482B/zh
Publication of CN111163482A publication Critical patent/CN111163482A/zh
Application granted granted Critical
Publication of CN111163482B publication Critical patent/CN111163482B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04WWIRELESS COMMUNICATION NETWORKS
    • H04W24/00Supervisory, monitoring or testing arrangements
    • H04W24/02Arrangements for optimising operational condition
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04WWIRELESS COMMUNICATION NETWORKS
    • H04W24/00Supervisory, monitoring or testing arrangements
    • H04W24/10Scheduling measurement reports ; Arrangements for measurement reports

Landscapes

  • Engineering & Computer Science (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Signal Processing (AREA)
  • Mobile Radio Communication Systems (AREA)

Abstract

本申请提供一种数据的处理方法、设备及存储介质,该方法包括:获取原始数据,所述原始数据包括基站相关数据;对所述原始数据进行数据预处理,获得预设格式的基站属性数据;根据所述基站属性数据,确定各基站的第一画像标签;根据所述基站属性数据及所述第一画像标签,确定各基站的第二画像标签;基于各基站的第一画像标签和第二画像标签,建立各基站的基站画像;基于各基站的基站画像,对网络进行相应的处理。实现了对基站原始数据的自动化处理,提高数据处理效率及准确性,降低成本,并提高原始数据的可用性,使得基站的原始数据可以更好地指导网络工作。

Description

数据的处理方法、设备及存储介质
技术领域
本申请涉及互联网技术领域,尤其涉及一种数据的处理方法、设备及存储介质。
背景技术
基站(公用移动通信基站,Base Station Subsystem)是网络运营商的接入网设备,所有(包括但不限于2G、3G、4G、5G、6G及后续网络制式)移动设备、终端设备、物联网设备等都需要通过基站的无线网络覆盖接入互联网,基站是运营商和无线网络用户接入网络最重要的设备之一。基站也是无线电台站的一种形式。基站具有大量描述其属性性能等的原始数据,包括但不限于基础数据、MR(Measurement Report,移动网络无线信道状态测量报告)数据、KPI指标(Network Key Performance Indicator,网络关键绩效指标)、MDT(Minimization of Drive Tests,最小化路测)数据、话单数据、互联网厂商APP数据等。
基站的这些原始数据对于网络具有重要价值,比如在网络规划、网络建设等工作中具有极大价值。但是基站的原始数据数据量巨大、种类繁多、格式复杂、变化频率快。现有技术对基站原始数据的使用通常依赖于工作人员人工分析、简单表格筛选和单一数值比对等方法,处理效率低下,且错误率高。
发明内容
本申请提供一种数据的处理方法、设备及存储介质,以解决现有技术数据处理效率低等缺陷。
本申请第一个方面提供一种数据的处理方法,包括:
获取原始数据,所述原始数据包括基站相关数据;
对所述原始数据进行数据预处理,获得预设格式的基站属性数据;
根据所述基站属性数据,确定各基站的第一画像标签;
根据所述基站属性数据及所述第一画像标签,确定各基站的第二画像标签;
基于各基站的第一画像标签和第二画像标签,建立各基站的基站画像;
基于各基站的基站画像,对网络进行相应的处理。
可选地,所述方法还包括:
基于所述基站属性数据、所述第一画像标签及所述第二画像标签,确定各基站的第三画像标签;
所述基于各基站的第一画像标签和第二画像标签,建立各基站的基站画像,包括:
基于各基站的第一画像标签、第二画像标签及第三画像标签,建立各基站的基站画像。
可选地,所述方法还包括:
将各基站及其对应的第一画像标签、第二画像标签及第三画像标签进行存储处理。
可选地,所述对所述原始数据进行数据预处理,获得预设格式的基站属性数据,包括:
基于预设清洗规则,对所述原始数据进行数据清洗,获得清洗后数据;
基于预设分类规则,对所述清洗后数据进行分类,获得分类数据;
基于预设提取规则,对所述分类数据进行数据提取,获得所述预设格式的基站属性数据。
可选地,所述根据所述基站属性数据,确定各基站的第一画像标签,包括:
根据所述基站属性数据及第一预设规则,采用预设数据分析挖掘工具,确定各基站的第一画像标签。
可选地,根据所述基站属性数据及所述第一画像标签,确定各基站的第二画像标签,包括:
基于所述基站属性数据及所述第一画像标签,采用第一预设人工智能算法,确定各基站的第二画像标签。
可选地,所述基于所述基站属性数据、所述第一画像标签及所述第二画像标签,确定各基站的第三画像标签,包括:
基于所述基站属性数据、所述第一画像标签及所述第二画像标签,采用第二预设规则及第二预设人工智能算法,确定各基站的第三画像标签。
可选地,所述基于各基站的基站画像,对网络进行相应的处理,包括:
基于各基站的基站画像,进行网络规划、网络建设、网络维护、网络优化及业务服务处理。
本申请第二个方面提供一种电子设备,包括:至少一个处理器和存储器;
所述存储器存储计算机执行指令;
所述至少一个处理器执行所述存储器存储的计算机执行指令,使得所述至少一个处理器执行如上第一个方面以及第一个方面各种可能的设计所述的方法。
本申请第三个方面提供一种计算机可读存储介质,所述计算机可读存储介质中存储有计算机执行指令,当处理器执行所述计算机执行指令时,实现如上第一个方面以及第一个方面各种可能的设计所述的方法。
本申请提供的数据的处理方法、设备及存储介质,通过获取原始数据,对原始数据进行数据预处理,获得预设格式的基站属性数据,根据基站属性数据,确定各基站的第一画像标签,根据基站属性数据及第一画像标签,确定各基站的第二画像标签,基于各基站的第一画像标签和第二画像标签,建立各基站的基站画像,基于各基站的基站画像,对网络进行相应的处理,实现了对基站原始数据的自动化处理,提高数据处理效率及准确性,降低成本,并提高原始数据的可用性,使得基站的原始数据可以更好地指导网络工作。
附图说明
为了更清楚地说明本申请实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作一简单地介绍,显而易见地,下面描述中的附图是本申请的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。
图1为本申请实施例基于的处理***的架构示意图;
图2为本申请一实施例提供的数据的处理方法的流程示意图;
图3为本申请另一实施例提供的数据的处理方法的流程示意图;
图4为本申请一实施例提供的电子设备的结构示意图。
通过上述附图,已示出本申请明确的实施例,后文中将有更详细的描述。这些附图和文字描述并不是为了通过任何方式限制本公开构思的范围,而是通过参考特定实施例为本领域技术人员说明本申请的概念。
具体实施方式
为使本申请实施例的目的、技术方案和优点更加清楚,下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本申请一部分实施例,而不是全部的实施例。基于本申请中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本申请保护的范围。
本申请实施例提供的数据的处理方法,适用于对基站相关的原始数据进行处理并建立基站画像指导网络规划、建设、维护、优化等的场景。如图1所示,为本申请实施例基于的处理***的架构示意图。该处理***可以包括基站画像平台、基站及其他相关设备,其中,基站画像平台可以为服务器、计算机设备、云等。其他相关设备可以是原始数据的数据源设备。基站画像平台可以从基站及其他相关设备获取基站相关的原始数据,并对原始数据进行数据预处理,获得预设格式的基站属性数据,根据基站属性数据来确定基站的第一画像标签,进一步根据基站属性数据及第一画像标签确定基站的第二画像标签,基于基站的第一画像标签和第二画像标签建立基站画像,基于基站画像对网络进行相应的处理。其中,基站可以是一个或多个。可选地,还可以基于基站属性数据、第一画像标签、第二画像标签确定基站的第三画像标签,基于各基站的第一画像标签、第二画像标签及第三画像标签,建立各基站的基站画像,用于指导网络规划、建设、维护、优化等。通过建立基站的多层次多维度的基站画像,实现了对基站原始数据的自动化处理,提高数据处理效率及准确性,降低成本,并提高原始数据的可用性,使得基站的原始数据可以更好地指导网络工作。
此外,术语“第一”、“第二”等仅用于描述目的,而不能理解为指示或暗示相对重要性或者隐含指明所指示的技术特征的数量。在以下各实施例的描述中,“多个”的含义是两个以上,除非另有明确具体的限定。
下面这几个具体的实施例可以相互结合,对于相同或相似的概念或过程可能在某些实施例中不再赘述。下面将结合附图,对本发明的实施例进行描述。
实施例一
本实施例提供一种数据的处理方法,用于对基站相关的原始数据进行处理,建立基站画像,指导网络工作。本实施例的执行主体为基站画像平台,该基站画像平台可以设置在服务器、计算机设备、云等电子设备中。
如图2所示,为本实施例提供的数据的处理方法的流程示意图,该方法包括:
步骤101,获取原始数据,原始数据包括基站相关数据。
具体的,基站画像平台可以从基站及其他相关数据源设备获取基站相关数据,基站相关数据包括但不限于基础数据、MR(Measurement Report,移动网络无线信道状态测量报告)数据、KPI指标(Network Key Performance Indicator,网络关键绩效指标)数据、MDT(Minimization of Drive Tests,最小化路测)数据、话单数据、互联网厂商APP数据等。
其中,基础数据包括但不限于基站名称、站号、ID、PCI(Physical CellIdentifier,物理小区标识)、CI(Cell Identity,小区识别号)、TAC(Tracking Area Code,跟踪区号)、经纬度、所属分公司、地址、站高、站间距、天线挂高、天线增益、水平半功率角、方向角、下倾角、频点、功率、带宽、设备厂家、工作模式、上下行配比、馈线长度、MIMO(MultiInput Multi Output,多入多出天线***)配置、端口数、美化方式等信息的基站工程参数和基础信息数据。
MR数据是指MRO(Measurement Report Original,测量报告原始采样点)和MRS(Measurement Report Statistics,测量报告统计)等基站采集的包括但不限于覆盖电平、覆盖质量、UE(User Equipment,用户设备)发射功率余量、丢包率、时间提前量等移动网络无线信道状态测量报告数据。
KPI指标数据是指从后台基站统计工具提取的KPI指标,包括但不限于RRC(RadioResource Control,无线资源控制)信令连接、接入保持、承载连接、寻呼、传输、切换、流量、MAC(Media Access Control,媒体访问控制)层性能、功率资源负荷、PRB(physicalresource block,物理资源块)资源负荷、信道资源负荷、网络质量、用户数量、核心网接口流量、随机接入、重定向、调度、网络可用、语音质量等网络性能指标数据。其中,后台统计工具包括但不限于网优平台,厂家专业网管OSS/U2000或话务统计工具NASTAR,Discover等。
MDT数据是指通过将已有的测量报告、位置信息以及信令信息与测试人员坐在汽车中用专业的测试仪表对整个路段进行测试得到的数据结合,并且合并计算处理后得到的终端的下载速率、流量、时延、接通率、掉话率等。
话单数据包括但不限于流水号、业务时长、费率、费用、折扣等信息的网络统计数据。
互联网厂商APP数据是指第三方互联网厂商依法采集并经过脱敏处理后提供的网络性能数据。
可选地,基站画像平台也可以预先获取原始数据进行存储,比如将原始数据进行SQL数据库入库处理。当需要进行处理时,从数据库获取这些原始数据。数据库可以是用于存取数据以及查询、更新和管理数据的数据库***。
步骤102,对原始数据进行数据预处理,获得预设格式的基站属性数据。
具体的,在获取到原始数据后,可以对原始数据进行数据预处理,获得预设格式的基站属性数据。
具体来说,数据预处理可以包括数据清洗、数据分类、数据提取等。
其中,数据清洗是为了清洗掉冗余和错误的数据,可以预先设置清洗规则,根据清洗规则进行清洗。具体清洗规则可以根据实际需求设置,本实施例不做限定。
数据分类和数据提取是指根据实际需求将分散的多方数据(清洗后数据)进行整合纳入统一,并进行标准化和细分,最终获得预设格式的基站属性数据。基站属性数据可以包括一个或多个基站的属性数据。基站属性数据包括基站的多个属性字段,比如以一个基站为例,从清洗后数据中的多方数据中,分别提取出用于描述该基站的属性字段,整合到一行(即一条记录)中,这一行包括该基站的标识字段及该基站对应的各属性字段。后续需要基于各基站的这些属性字段来确定基站的各种画像标签,建立基站画像。
步骤103,根据基站属性数据,确定各基站的第一画像标签。
具体的,在获得基站属性数据后,则可以根据基站属性数据确定各基站的第一画像标签,第一画像标签可以称为基站画像事实标签,基站画像事实标签是指基于基站的客观事实数据(即上述的基站属性数据)经过统计分析得到的描述基站事实属性的标签。
示例性的,采用贝叶斯网络、KNN算法、KNIME、FME、PYTHON程序等统计分析和数据挖掘工具根据基站属性数据,归纳为“数据流量”、“站间距近”、“接通率低”、“地理化栅格评估良好”、“页面打开时延高”、“视频播放行为累积次数高于区域内均值”、“用户套餐类型”、“投入产出比”、“可用天面”等基站画像事实标签。
步骤104,根据基站属性数据及第一画像标签,确定各基站的第二画像标签。
具体的,在确定了基站的第一画像标签后,还可以根据基站属性数据及第一画像标签来确定各基站的第二画像标签。
其中,第二画像标签可以称为基站画像模型标签,基站画像模型标签是指通过统计分析或建模分析得到的数学模型化的描述基站属性的标签。
示例性的,可以采用Apriori、Jactard、KNN(k-NearestNeighbor,邻近算法,或称K最近邻分类算法)、Logistic回归、决策树、随机森林、XGBOOST等人工智能算法进行建模和分析得到基站画像模型标签。Apriori算法是一种关联规则挖掘算法;KNN算法是一种数据挖掘分类方法;Logistic回归是一种广义的线性回归分析模型,用于数据挖掘;XGBOOST是一种机器学***均深度,可以估算出一个特征的重要程度。
示例性的,从网优平台提取基站5天的包含30个KPI指标的小时级KPI指标数据,将数据合并为数据集DATASET,则该数据集有30个属性,每一行数据是一个样本。将卡顿率超过10%的基站归类为高卡顿率基站,将数据集拆分为DATASET1和DATASET2,将DATASET1经过条件筛选得到高卡顿率基站的训练集。对训练集数据集DATASET1使用随机森林算法进行30个属性的特征选择,发现PRB资源负荷、忙时流量、下行初始重传比例、网络质量,接入保持性能是影响卡顿率的5个最主要特征,是导致基站覆盖范围内用户游戏卡顿率高主要原因,得到基站画像模型标签“卡顿率高”所对应的模型,用DATASET2作为预测集进行验证,若验证结果符合预设要求,获得卡顿率高对应的最终模型,可以基于基站属性数据,采用该最终模型,确定基站是否有基站画像模型标签“卡顿率高”,由于基站属性数据包括很多属性字段,可以采用上述一种或结合多种人工智能算法,为基站确定一个或多个基站画像模型标签。
示例性的,还可以基于上述的第一画像标签,及相应的人工智能算法为各基站确定基站画像模型标签,比如若某基站的第一画像标签满足一定条件,则为该基站增加一个第二画像标签。比如当该基站第一画像标签有10个,其中3个标签“重要基站”、“性能差”、“投诉多”,反映出该基站应为“重点关注”的基站,则确定该基站具有第二画像标签“重点关注”,需要说明的是每个基站的第二画像标签也可以根据实际需求有一个或多个,本申请实施例不做限定。
示例性的,还可以结合上述的基站属性数据和第一画像标签,来确定基站的第二画像标签,比如可以设置一定规则,当某基站的基站属性数据满足第一条件,且该基站的第一画像标签满足第二条件,则确定该基站具有一第二画像标签A。
步骤105,基于各基站的第一画像标签和第二画像标签,建立各基站的基站画像。
具体的,在获得各基站的第一画像标签和第二画像标签后,则可以基于各基站的第一画像标签和第二画像标签,建立各基站的基站画像,即建立各基站与其第一画像标签和第二画像标签的对应关系。
步骤106,基于各基站的基站画像,对网络进行相应的处理。
具体的,在建立了个基站的基站画像后,可以基于各基站的基站画像,对网络进行相应的处理。比如基于各基站的基站画像确定网络规划、建设、维护、优化等方案,调整网络服务、指导市场等。具体可以根据实际需求应用,本实施例不做限定。
本实施例提供的数据的处理方法,通过获取原始数据,对原始数据进行数据预处理,获得预设格式的基站属性数据,根据基站属性数据,确定各基站的第一画像标签,根据基站属性数据及第一画像标签,确定各基站的第二画像标签,基于各基站的第一画像标签和第二画像标签,建立各基站的基站画像,基于各基站的基站画像,对网络进行相应的处理,实现了对基站原始数据的自动化处理,提高数据处理效率及准确性,降低成本,并提高原始数据的可用性,使得基站的原始数据可以更好地指导网络工作。
实施例二
本实施例对实施例一提供的方法做进一步补充说明。
如图3所示,为本实施例提供的数据的处理方法的流程示意图。
作为一种可实施的方式,在上述实施例一的基础上,可选地,该方法还可以包括:
步骤2011,基于基站属性数据、第一画像标签及第二画像标签,确定各基站的第三画像标签。
相应的,基于各基站的第一画像标签和第二画像标签,建立各基站的基站画像,包括:
步骤1051,基于各基站的第一画像标签、第二画像标签及第三画像标签,建立各基站的基站画像。
具体的,在确定了个基站的第二画像标签后,还可以基于基站属性数据、第一画像标签及第二画像标签,确定各基站的第三画像标签,第三画像标签可以称为基站画像预测标签,基站画像预测标签是结合专家经验及人工智能算法,将上述获得的多个层级、多个维度的画像标签组合归纳获得。
示例性的,上述获得的某基站的第二画像标签包括“卡顿频繁预期高”、“基站部署密度大”、“劳模基站”、“LTE容量受限”、“质差”、“低时延业务需求大”、“预测视频业务高发区”、“政治类场景”、“高收益区域”,结合专家经验及预设人工智能算法,对这些第二画像标签进行组合归纳,得到该基站的第三画像标签为“5G潜力基站”。
示例性的,某基站的第二画像标签包括“频繁卡顿”、“长期掉话高”、“累积零话务特征”、“站址位置差”、“天面阻挡”等,结合专家经验及预设人工智能算法,对这些第二画像标签进行组合归纳,得到该基站的第三画像标签为“垃圾基站”。
需要说明的是,本申请实施例中涉及到的人工智能算法,对于需要进行训练的,则在使用前可以基于训练数据进行训练,获得训练好的算法或模型使用,具体训练过程与现有技术一致,在此不再赘述。
作为一种可实施的方式,可选地,该方法还包括:
步骤2021,将各基站及其对应的第一画像标签、第二画像标签及第三画像标签进行存储处理。
具体的,在确定了各基站及其第一画像标签、第二画像标签及第三画像标签后,还可以将各基站与其对应的第一画像标签、第二画像标签及第三画像标签进行对应存储,为后续应用提供数据基础。
具体来说,根据上述得到的多层次画像标签建立基站画像标签体系,完成全方位多角度的基站画像,将所得到的基站画像事实标签、基站画像模型标签和基站画像预测标签进行归纳整合,并且将基站与该基站的标签一一对应进行存储,建立基于上述方法和逻辑的全方位、多角度的基站画像标签体系,并逐步积累数据量和标签数量,完善和扩展上述基站画像标签体系。
作为一种可实施的方式,可选地,对原始数据进行数据预处理,获得预设格式的基站属性数据,包括:
1021,基于预设清洗规则,对原始数据进行数据清洗,获得清洗后数据。
1022,基于预设分类规则,对清洗后数据进行分类,获得分类数据。
1023,基于预设提取规则,对分类数据进行数据提取,获得预设格式的基站属性数据。
具体的,在获取到原始数据后,可以基于预设清洗规则,对原始数据进行数据清洗,获得清洗后数据,基于预设分类规则,对清洗后数据进行分类,获得分类数据,基于预设提取规则,对分类数据进行数据提取,获得预设格式的基站属性数据。其中,预设清洗规则、预设分类规则、预设提取规则可以根据实际需求设置,本申请实施例不做限定。
其中,数据清洗是为了清洗掉冗余和错误的数据,可以预先设置清洗规则,根据清洗规则进行清洗。具体清洗规则可以根据实际需求设置,本实施例不做限定。数据分类和数据提取是指根据实际需求将分散的多方数据(清洗后数据)进行整合纳入统一,并进行标准化和细分,最终获得预设格式的基站属性数据。基站属性数据可以包括一个或多个基站的属性数据。基站属性数据包括基站的多个属性字段,比如以一个基站为例,从清洗后数据中的多方数据中,分别提取出用于描述该基站的属性字段,整合到一行(即一条记录)中,这一行包括该基站的标识字段及该基站对应的各属性字段。后续需要基于各基站的这些属性字段来确定基站的各种画像标签,建立基站画像。
作为一种可实施的方式,可选地,根据基站属性数据,确定各基站的第一画像标签,包括:
步骤1031,根据基站属性数据及第一预设规则,采用预设数据分析挖掘工具,确定各基站的第一画像标签。
具体的,在获得基站属性数据后,则可以根据基站属性数据及第一预设规则,采用预设数据分析挖掘工具,确定各基站的第一画像标签,第一画像标签可以称为基站画像事实标签,基站画像事实标签是指基于基站的客观事实数据(即上述的基站属性数据)经过统计分析得到的描述基站事实属性的标签。
其中,预设数据分析挖掘工具可以包括但不限于贝叶斯网络、KNN算法、KNIME、FME、PYTHON程序等工具。
示例性的,采用KNIME、FME、PYTHON程序等统计分析和数据挖掘工具根据基站属性数据,归纳为“数据流量”、“站间距近”、“接通率低”、“地理化栅格评估良好”、“页面打开时延高”、“视频播放行为累积次数高于区域内均值”、“用户套餐类型”、“投入产出比”、“可用天面”等基站画像事实标签。
第一预设规则可以包括预先设置的第一画像标签,基于基站属性数据和第一预设规则,采用预设数据分析挖掘工具,为各基站确定其所符合的第一画像标签。
作为一种可实施的方式,可选地,根据基站属性数据及第一画像标签,确定各基站的第二画像标签,包括:
步骤1041,基于基站属性数据及第一画像标签,采用第一预设人工智能算法,确定各基站的第二画像标签。
具体的,在确定了基站的第一画像标签后,还可以基于基站属性数据及第一画像标签,采用第一预设人工智能算法,确定各基站的第二画像标签,第二画像标签可以称为基站画像模型标签,基站画像模型标签是指通过统计分析或建模分析得到的数学模型化的描述基站属性的标签。
其中,第一预设人工智能算法包括但不限于Apriori、Jactard、KNN(k-NearestNeighbor,邻近算法,或称K最近邻分类算法)、Logistic回归、决策树、随机森林、XGBOOST等人工智能算法。
以随机森林算法在基站覆盖范围内用户的游戏卡顿原因分析中的应用并建模分析得到基站画像模型标签的过程为例:
示例性的,从网优平台提取基站5天的包含30个KPI指标的小时级KPI指标数据,将数据合并为数据集DATASET,则该数据集有30个属性,每一行数据是一个样本。将卡顿率超过10%的基站归类为高卡顿率基站,将数据集拆分为DATASET1和DATASET2,将DATASET1经过条件筛选得到高卡顿率基站的训练集。对训练集数据集DATASET1使用随机森林算法进行30个属性的特征选择,发现PRB资源负荷、忙时流量、下行初始重传比例、网络质量,接入保持性能是影响卡顿率的5个最主要特征,是导致基站覆盖范围内用户游戏卡顿率高主要原因,得到基站画像模型标签“卡顿率高”所对应的模型,用DATASET2作为预测集进行验证,若验证结果符合预设要求,获得卡顿率高对应的最终模型,可以基于基站属性数据,采用该最终模型,确定基站是否有基站画像模型标签“卡顿率高”,由于基站属性数据包括很多属性字段,可以采用上述一种或结合多种人工智能算法,为基站确定一个或多个基站画像模型标签。
示例性的,还可以基于上述的第一画像标签,及相应的人工智能算法为各基站确定基站画像模型标签,比如若某基站的第一画像标签满足一定条件,则为该基站增加一个第二画像标签。比如当该基站第一画像标签有10个,其中3个标签“重要基站”、“性能差”、“投诉多”,反映出该基站应为“重点关注”的基站,则确定该基站具有第二画像标签“重点关注”,需要说明的是每个基站的第二画像标签也可以根据实际需求有一个或多个,本申请实施例不做限定。
示例性的,还可以结合上述的基站属性数据和第一画像标签,来确定基站的第二画像标签,比如可以设置一定规则,当某基站的基站属性数据满足第一条件,且该基站的第一画像标签满足第二条件,则确定该基站具有一第二画像标签A。
作为一种可实施的方式,可选地,基于基站属性数据、第一画像标签及第二画像标签,确定各基站的第三画像标签,包括:
步骤20111,基于基站属性数据、第一画像标签及第二画像标签,采用第二预设规则及第二预设人工智能算法,确定各基站的第三画像标签。
具体的,在确定了个基站的第二画像标签后,还可以基于基站属性数据、第一画像标签及第二画像标签,采用第二预设规则及第二预设人工智能算法,确定各基站的第三画像标签。第三画像标签可以称为基站画像预测标签,基站画像预测标签是结合专家经验及人工智能算法,将上述获得的多个层级、多个维度的画像标签组合归纳获得。
示例性的,上述获得的某基站的第二画像标签包括“卡顿频繁预期高”、“基站部署密度大”、“劳模基站”、“LTE容量受限”、“质差”、“低时延业务需求大”、“预测视频业务高发区”、“政治类场景”、“高收益区域”,结合专家经验及预设人工智能算法,对这些第二画像标签进行组合归纳,得到该基站的第三画像标签为“5G潜力基站”。
作为另一种可实施的方式,在上述实施例的基础上,可选地,基于各基站的基站画像,对网络进行相应的处理,包括:
步骤1061,基于各基站的基站画像,进行网络规划、网络建设、网络维护、网络优化及业务服务处理。
具体的,在建立了个基站的基站画像后,可以基于各基站的基站画像,对网络进行相应的处理。比如基于各基站的基站画像确定网络规划、建设、维护、优化等方案,调整网络服务、指导市场等。具体可以根据实际需求应用,本实施例不做限定。
示例性的,基站画像可以用于指导网络规划,指导网络规划是指基于获得的基站画像,对未来网络规划和建设方案进行指导和修正。比如通过得到的“垃圾基站”、“基站簇属性”、“零话务专业户”等基站画像标签,进一步分析得出该区域目前的网络建设规划与实际区域属性不符,需要对目前的网络规划和建设方案进行调整和修正,该区域需要进行“区域重新规划”。
示例性的,基站画像可以用于指导市场,指导市场是指基于基站画像,对未来市场部门的业务发展方向进行指导和修正。通过得到的“大概率投诉”、“预测视频高发”、“基站功能定位”等基站画像标签,进一步分析得出该区域目前的市场业务发展方向与该区域常驻用户的需求和习惯不符,且与该区域基站功能定位有冲突,需要对当前市场部门的业务发展方向进行调整和修正,该区域需要进行“市场侧业务发展方向调整”。
需要说明的是,本实施例中各可实施的方式可以单独实施,也可以在不冲突的情况下以任意组合方式结合实施本申请不做限定。
本实施例提供的数据的处理方法,通过获取原始数据,对原始数据进行数据预处理,获得预设格式的基站属性数据,根据基站属性数据,确定各基站的第一画像标签,根据基站属性数据及第一画像标签,确定各基站的第二画像标签,基于各基站的第一画像标签和第二画像标签,建立各基站的基站画像,基于各基站的基站画像,对网络进行相应的处理,实现了对基站原始数据的自动化处理,提高数据处理效率及准确性,降低成本,并提高原始数据的可用性,使得基站的原始数据可以更好地指导网络工作。
在一些实施例中,还可以提供一种基站画像平台,该基站画像平台可以包括数据采集模块、数据挖掘模块、事实标签模块、模型标签模块、预测标签模块、标签体系管理模块、数据存储模块以及前台交互式查询模块。
其中,数据采集模块,用于将原始数据(基站的基础数据、MR数据、KPI指标、MDT数据、话单数据、互联网厂商APP数据等)进行SQL数据库入库处理。数据挖掘模块,用于对入库的原始数据进行数据预处理,包括数据清洗、数据分类、数据提取,获得预设格式的基站属性数据。事实标签模块,用于基于基站属性数据,确定各基站的基站画像事实标签(即第一画像标签)。模型标签模块,用于基于基站属性数据及第一画像标签,确定基站画像模型标签(即第二画像标签)。预测标签模块,用于基于基站属性数据、第一画像标签及第二画像标签得到基站画像预测标签。标签体系管理模块,用于根据得到的多层次画像标签信息建立基站画像标签体系,完成全方位多角度的基站画像。数据存储模块,用于对原始数据、基站属性数据、画像标签数据等数据的存储。前台交互式查询模块,用于进行包括但不限于交互式数据库查询、基站画像标签查询、复杂查询、聚合连接等查询操作。其中,各个模块的具体操作与上述方法实施例一致,在此不再赘述。
实施例三
本实施例提供一种电子设备,用于执行上述实施例提供的方法。
如图4所示,为本实施例提供的电子设备的结构示意图。该电子设备50包括:至少一个处理器51和存储器52;
存储器存储计算机执行指令;至少一个处理器执行存储器存储的计算机执行指令,使得至少一个处理器执行如上任一实施例提供的方法。
根据本实施例的电子设备,通过获取原始数据,对原始数据进行数据预处理,获得预设格式的基站属性数据,根据基站属性数据,确定各基站的第一画像标签,根据基站属性数据及第一画像标签,确定各基站的第二画像标签,基于各基站的第一画像标签和第二画像标签,建立各基站的基站画像,基于各基站的基站画像,对网络进行相应的处理,实现了对基站原始数据的自动化处理,提高数据处理效率及准确性,降低成本,并提高原始数据的可用性,使得基站的原始数据可以更好地指导网络工作。
实施例四
本实施例提供一种计算机可读存储介质,计算机可读存储介质中存储有计算机执行指令,当处理器执行计算机执行指令时,实现如上任一实施例提供的方法。
根据本实施例的计算机可读存储介质,通过获取原始数据,对原始数据进行数据预处理,获得预设格式的基站属性数据,根据基站属性数据,确定各基站的第一画像标签,根据基站属性数据及第一画像标签,确定各基站的第二画像标签,基于各基站的第一画像标签和第二画像标签,建立各基站的基站画像,基于各基站的基站画像,对网络进行相应的处理,实现了对基站原始数据的自动化处理,提高数据处理效率及准确性,降低成本,并提高原始数据的可用性,使得基站的原始数据可以更好地指导网络工作。
在本申请所提供的几个实施例中,应该理解到,所揭露的装置和方法,可以通过其它的方式实现。例如,以上所描述的装置实施例仅仅是示意性的,例如,所述单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,例如多个单元或组件可以结合或者可以集成到另一个***,或一些特征可以忽略,或不执行。另一点,所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些接口,装置或单元的间接耦合或通信连接,可以是电性,机械或其它的形式。
所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。
另外,在本申请各个实施例中的各功能单元可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中。上述集成的单元既可以采用硬件的形式实现,也可以采用硬件加软件功能单元的形式实现。
上述以软件功能单元的形式实现的集成的单元,可以存储在一个计算机可读取存储介质中。上述软件功能单元存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)或处理器(processor)执行本申请各个实施例所述方法的部分步骤。而前述的存储介质包括:U盘、移动硬盘、只读存储器(Read-Only Memory,ROM)、随机存取存储器(Random Access Memory,RAM)、磁碟或者光盘等各种可以存储程序代码的介质。
本领域技术人员可以清楚地了解到,为描述的方便和简洁,仅以上述各功能模块的划分进行举例说明,实际应用中,可以根据需要而将上述功能分配由不同的功能模块完成,即将装置的内部结构划分成不同的功能模块,以完成以上描述的全部或者部分功能。上述描述的装置的具体工作过程,可以参考前述方法实施例中的对应过程,在此不再赘述。
最后应说明的是:以上各实施例仅用以说明本申请的技术方案,而非对其限制;尽管参照前述各实施例对本申请进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分或者全部技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本申请各实施例技术方案的范围。

Claims (9)

1.一种数据的处理方法,其特征在于,包括:
获取原始数据,所述原始数据包括基站相关数据;
对所述原始数据进行数据预处理,获得预设格式的基站属性数据;
根据所述基站属性数据,确定各基站的第一画像标签;
根据所述基站属性数据及所述第一画像标签,确定各基站的第二画像标签;
基于各基站的第一画像标签和第二画像标签,建立各基站的基站画像;
基于各基站的基站画像,对网络进行相应的处理;
所述方法还包括:
基于所述基站属性数据、所述第一画像标签及所述第二画像标签,确定各基站的第三画像标签;
所述基于各基站的第一画像标签和第二画像标签,建立各基站的基站画像,包括:
基于各基站的第一画像标签、第二画像标签及第三画像标签,建立各基站的基站画像。
2.根据权利要求1所述的方法,其特征在于,所述方法还包括:
将各基站及其对应的第一画像标签、第二画像标签及第三画像标签进行存储处理。
3.根据权利要求1所述的方法,其特征在于,所述对所述原始数据进行数据预处理,获得预设格式的基站属性数据,包括:
基于预设清洗规则,对所述原始数据进行数据清洗,获得清洗后数据;
基于预设分类规则,对所述清洗后数据进行分类,获得分类数据;
基于预设提取规则,对所述分类数据进行数据提取,获得所述预设格式的基站属性数据。
4.根据权利要求1所述的方法,其特征在于,所述根据所述基站属性数据,确定各基站的第一画像标签,包括:
根据所述基站属性数据及第一预设规则,采用预设数据分析挖掘工具,确定各基站的第一画像标签。
5.根据权利要求1所述的方法,其特征在于,根据所述基站属性数据及所述第一画像标签,确定各基站的第二画像标签,包括:
基于所述基站属性数据及所述第一画像标签,采用第一预设人工智能算法,确定各基站的第二画像标签。
6.根据权利要求1所述的方法,其特征在于,所述基于所述基站属性数据、所述第一画像标签及所述第二画像标签,确定各基站的第三画像标签,包括:
基于所述基站属性数据、所述第一画像标签及所述第二画像标签,采用第二预设规则及第二预设人工智能算法,确定各基站的第三画像标签。
7.根据权利要求1-6任一项所述的方法,其特征在于,所述基于各基站的基站画像,对网络进行相应的处理,包括:
基于各基站的基站画像,进行网络规划、网络建设、网络维护、网络优化及业务服务处理。
8.一种电子设备,其特征在于,包括:至少一个处理器和存储器;
所述存储器存储计算机执行指令;
所述至少一个处理器执行所述存储器存储的计算机执行指令,使得所述至少一个处理器执行如权利要求1-7任一项所述的方法。
9.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质中存储有计算机执行指令,当处理器执行所述计算机执行指令时,实现如权利要求1-7任一项所述的方法。
CN201911360830.4A 2019-12-25 2019-12-25 数据的处理方法、设备及存储介质 Active CN111163482B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201911360830.4A CN111163482B (zh) 2019-12-25 2019-12-25 数据的处理方法、设备及存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201911360830.4A CN111163482B (zh) 2019-12-25 2019-12-25 数据的处理方法、设备及存储介质

Publications (2)

Publication Number Publication Date
CN111163482A CN111163482A (zh) 2020-05-15
CN111163482B true CN111163482B (zh) 2022-10-14

Family

ID=70556757

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201911360830.4A Active CN111163482B (zh) 2019-12-25 2019-12-25 数据的处理方法、设备及存储介质

Country Status (1)

Country Link
CN (1) CN111163482B (zh)

Families Citing this family (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111866896B (zh) * 2020-07-17 2023-02-28 中国联合网络通信集团有限公司 基站位置确定方法、装置、设备以及存储介质
CN115460622A (zh) * 2021-05-19 2022-12-09 中兴通讯股份有限公司 建模方法、网元数据处理方法和装置、电子设备、介质
CN114357249A (zh) * 2022-01-04 2022-04-15 吉林亿联银行股份有限公司 数据处理方法及装置、存储介质及电子设备
CN116186414B (zh) * 2023-03-31 2023-08-01 北京比格大数据有限公司 一种实体画像调度***及方法

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106851669A (zh) * 2017-02-06 2017-06-13 中国铁塔股份有限公司 一种无线站点价值评估方法及***
CN107426759A (zh) * 2017-08-09 2017-12-01 广州杰赛科技股份有限公司 新增基站数据业务量的预测方法和***
CN109495920A (zh) * 2017-09-13 2019-03-19 ***通信集团设计院有限公司 一种无线通信网络特征画像方法、设备和计算机程序产品
CN109640340A (zh) * 2018-12-25 2019-04-16 中国联合网络通信集团有限公司 基站数据处理方法、装置、设备及计算机可读存储介质
CN109661000A (zh) * 2018-12-19 2019-04-19 中国联合网络通信集团有限公司 低效基站的管理方法、装置、设备及可读存储介质
CN109963288A (zh) * 2019-03-12 2019-07-02 中国联合网络通信集团有限公司 基站的评估方法及装置

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US10063406B2 (en) * 2015-07-15 2018-08-28 TUPL, Inc. Automatic customer complaint resolution

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106851669A (zh) * 2017-02-06 2017-06-13 中国铁塔股份有限公司 一种无线站点价值评估方法及***
CN107426759A (zh) * 2017-08-09 2017-12-01 广州杰赛科技股份有限公司 新增基站数据业务量的预测方法和***
CN109495920A (zh) * 2017-09-13 2019-03-19 ***通信集团设计院有限公司 一种无线通信网络特征画像方法、设备和计算机程序产品
CN109661000A (zh) * 2018-12-19 2019-04-19 中国联合网络通信集团有限公司 低效基站的管理方法、装置、设备及可读存储介质
CN109640340A (zh) * 2018-12-25 2019-04-16 中国联合网络通信集团有限公司 基站数据处理方法、装置、设备及计算机可读存储介质
CN109963288A (zh) * 2019-03-12 2019-07-02 中国联合网络通信集团有限公司 基站的评估方法及装置

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
5G无线网络智能化规划体系及实现;孟繁丽 等;《移动通信 》;20190615;全文 *
运维大数据分析助力精准化网络运营研究;李恒久;《电信网技术》;20150415(第04期);全文 *

Also Published As

Publication number Publication date
CN111163482A (zh) 2020-05-15

Similar Documents

Publication Publication Date Title
CN111163482B (zh) 数据的处理方法、设备及存储介质
JP6411435B2 (ja) 携帯電話ネットワークを維持しまたは最適化する方法およびシステム
CN111817868B (zh) 一种网络质量异常的定位方法与装置
US20220179884A1 (en) Label Determining Method, Apparatus, and System
CN108934016B (zh) 小区场景类别的划分方法、装置、计算机设备和存储介质
CN108243435B (zh) 一种lte小区场景划分中的参数优化方法及装置
CN105050132A (zh) 小区极值吞吐量的估计方法
CN107943697A (zh) 问题分配方法、装置、***、服务器和计算机存储介质
CN111294730B (zh) 一种网络问题投诉信息处理的方法及装置
CN106233764B (zh) 一种信息处理方法及装置
CN114066184A (zh) 一种区域覆盖的评估方法、装置和电子设备
CN113688490A (zh) 网络共建共享处理方法、装置、设备及存储介质
CN110662212B (zh) 一种基于大数据的手机终端识别方法
CN109040744B (zh) 预测视频业务的关键质量指标的方法、装置及存储介质
EP3849231A1 (en) Configuration of a communication network
CN114995342A (zh) 一种基于大数据技术的c3无线通信超时分析方法及***
CN110120883B (zh) 一种评估网络性能的方法、装置和计算机可读存储介质
CN107517474B (zh) 一种网络分析优化方法及装置
CN112085282B (zh) 小区流量预测方法及服务器
CN112243257B (zh) 一种无线小区的覆盖黑洞识别方法及***
CN114745289A (zh) 网络性能数据的预测方法、装置、存储介质及设备
CN108093431A (zh) 一种以干数据处理网元tdpne为处理节点的数据上报方法和装置
CN112749717A (zh) 物联网业务质量端到端评估方法、装置、设备及存储介质
CN115038040B (zh) 一种小区定位方法、装置、设备、***及介质
US11928013B2 (en) Image analysis of data logs

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant