CN111148018A - 基于通信数据识别定位区域价值的方法和装置 - Google Patents
基于通信数据识别定位区域价值的方法和装置 Download PDFInfo
- Publication number
- CN111148018A CN111148018A CN201911312738.0A CN201911312738A CN111148018A CN 111148018 A CN111148018 A CN 111148018A CN 201911312738 A CN201911312738 A CN 201911312738A CN 111148018 A CN111148018 A CN 111148018A
- Authority
- CN
- China
- Prior art keywords
- data
- target
- communication evaluation
- target communication
- communication
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Images
Classifications
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04W—WIRELESS COMMUNICATION NETWORKS
- H04W4/00—Services specially adapted for wireless communication networks; Facilities therefor
- H04W4/02—Services making use of location information
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04W—WIRELESS COMMUNICATION NETWORKS
- H04W24/00—Supervisory, monitoring or testing arrangements
- H04W24/08—Testing, supervising or monitoring using real traffic
Landscapes
- Engineering & Computer Science (AREA)
- Computer Networks & Wireless Communication (AREA)
- Signal Processing (AREA)
- Telephonic Communication Services (AREA)
- Mobile Radio Communication Systems (AREA)
Abstract
本申请涉及一种基于通信数据识别定位区域价值的方法、装置、计算机设备和存储介质,包括:接收携带目标区域的区域标识的区域通信价值评估请求;根据区域通信价值评估请求获取目标区域的目标通信评估数据集合,目标通信评估数据集合包括不同维度的多项目标通信评估数据;获取各项目标通信评估数据对应的目标通信评估指标的权重,进而计算得到各项目标通信评估数据对应的分数;将相同维度的目标通信评估数据的分数累加,得到各个维度的目标通信评估数据对应的总分数;获取各个维度的目标通信评估数据对应的权重,进而计算得到目标区域的综合分数;向区域通信价值评估请求的发送端返回各个维度的目标通信评估数据对应的总分数和综合分数。
Description
技术领域
本申请涉及通信技术领域,特别是涉及一种基于通信数据识别定位区域价值的方法、装置、计算机设备和存储介质。
背景技术
随着通信技术的发展,运营商越来越重视区域的通信价值,可以通过评估区域的通信价值,将区域划分为不同的等级,为运营商的经营管理提供科学的依据。
然而,传统评估区域通信价值的方法是根据区域内的人口密度来评估,例如,若区域内的人口密度大于预设阈值,则该区域的通信价值高,这种方式只考虑人口密度这一个维度的信息,比较片面,导致区域通信价值评估的准确性低。
发明内容
基于此,有必要针对上述技术问题,提供一种能够提高区域通信价值评估准确性的基于通信数据识别定位区域价值的方法、装置、计算机设备和存储介质。
一种基于通信数据识别定位区域价值的方法,所述方法包括:
接收区域通信价值评估请求,所述区域通信价值评估请求携带目标区域的区域标识;
根据所述区域通信价值评估请求获取所述目标区域的目标通信评估数据集合,所述目标通信评估数据集合包括不同维度的多项目标通信评估数据,所述目标通信评估数据集合是根据通话数据、流量数据、应用数据和基站数据确定的;
获取各项目标通信评估数据对应的目标通信评估指标的权重,根据所述各项目标通信评估数据和对应的所述目标通信评估指标的权重计算得到所述各项目标通信评估数据对应的分数,所述目标通信评估指标的权重是根据样本区域集合中样本区域的目标通信评估数据和样本区域总数确定的;
将相同维度的目标通信评估数据的分数累加,得到所述目标通信评估数据集合中各个维度的目标通信评估数据对应的总分数;
获取所述各个维度的目标通信评估数据对应的权重,根据所述各个维度的目标通信评估数据对应的权重和各个维度的目标通信评估数据对应的总分数计算得到所述目标区域的综合分数;
向所述区域通信价值评估请求的发送端返回所述各个维度的目标通信评估数据对应的总分数和所述综合分数,以使所述发送端展示所述各个维度的目标通信评估数据对应的总分数和所述综合分数。
一种基于通信数据识别定位区域价值的装置,所述装置包括:
请求接收模块,用于接收区域通信价值评估请求,所述区域通信价值评估请求携带目标区域的区域标识;
目标通信评估数据获取模块,用于根据所述区域通信价值评估请求获取所述目标区域的目标通信评估数据集合,所述目标通信评估数据集合包括不同维度的多项目标通信评估数据,所述目标通信评估数据集合是根据通话数据、流量数据、应用数据和基站数据确定的;
分数计算模块还用于获取各项目标通信评估数据对应的目标通信评估指标的权重,根据所述各项目标通信评估数据和对应的所述目标通信评估指标的权重计算得到所述各项目标通信评估数据对应的分数,所述目标通信评估指标的权重是根据样本区域集合中样本区域的目标通信评估数据和样本区域总数确定的;所述分数计算模块还用于将相同维度的目标通信评估数据的分数累加,得到所述目标通信评估数据集合中各个维度的目标通信评估数据对应的总分数;所述分数计算模块还用于获取所述各个维度的目标通信评估数据对应的权重,根据所述各个维度的目标通信评估数据对应的权重和各个维度的目标通信评估数据对应的总分数计算得到所述目标区域的综合分数;
分数发送模块,用于向所述区域通信价值评估请求的发送端返回所述各个维度的目标通信评估数据对应的总分数和所述综合分数,以使所述发送端展示所述各个维度的目标通信评估数据对应的总分数和所述综合分数。
一种计算机设备,包括存储器和处理器,所述存储器存储有计算机程序,所述处理器执行所述计算机程序时实现以下步骤:
接收区域通信价值评估请求,所述区域通信价值评估请求携带目标区域的区域标识;
根据所述区域通信价值评估请求获取所述目标区域的目标通信评估数据集合,所述目标通信评估数据集合包括不同维度的多项目标通信评估数据,所述目标通信评估数据集合是根据通话数据、流量数据、应用数据和基站数据确定的;
获取各项目标通信评估数据对应的目标通信评估指标的权重,根据所述各项目标通信评估数据和对应的所述目标通信评估指标的权重计算得到所述各项目标通信评估数据对应的分数,所述目标通信评估指标的权重是根据样本区域集合中样本区域的目标通信评估数据和样本区域总数确定的;
将相同维度的目标通信评估数据的分数累加,得到所述目标通信评估数据集合中各个维度的目标通信评估数据对应的总分数;
获取所述各个维度的目标通信评估数据对应的权重,根据所述各个维度的目标通信评估数据对应的权重和各个维度的目标通信评估数据对应的总分数计算得到所述目标区域的综合分数;
向所述区域通信价值评估请求的发送端返回所述各个维度的目标通信评估数据对应的总分数和所述综合分数,以使所述发送端展示所述各个维度的目标通信评估数据对应的总分数和所述综合分数。
一种计算机可读存储介质,其上存储有计算机程序,所述计算机程序被处理器执行时实现以下步骤:
接收区域通信价值评估请求,所述区域通信价值评估请求携带目标区域的区域标识;
根据所述区域通信价值评估请求获取所述目标区域的目标通信评估数据集合,所述目标通信评估数据集合包括不同维度的多项目标通信评估数据,所述目标通信评估数据集合是根据通话数据、流量数据、应用数据和基站数据确定的;
获取各项目标通信评估数据对应的目标通信评估指标的权重,根据所述各项目标通信评估数据和对应的所述目标通信评估指标的权重计算得到所述各项目标通信评估数据对应的分数,所述目标通信评估指标的权重是根据样本区域集合中样本区域的目标通信评估数据和样本区域总数确定的;
将相同维度的目标通信评估数据的分数累加,得到所述目标通信评估数据集合中各个维度的目标通信评估数据对应的总分数;
获取所述各个维度的目标通信评估数据对应的权重,根据所述各个维度的目标通信评估数据对应的权重和各个维度的目标通信评估数据对应的总分数计算得到所述目标区域的综合分数;
向所述区域通信价值评估请求的发送端返回所述各个维度的目标通信评估数据对应的总分数和所述综合分数,以使所述发送端展示所述各个维度的目标通信评估数据对应的总分数和所述综合分数。
上述基于通信数据识别定位区域价值的方法、装置、计算机设备和存储介质,通过接收区域通信价值评估请求,区域通信价值评估请求携带目标区域的区域标识;根据区域通信价值评估请求获取目标区域的目标通信评估数据集合,目标通信评估数据集合包括不同维度的多项目标通信评估数据,目标通信评估数据集合是根据通话数据、流量数据、应用数据和基站数据确定的;获取各项目标通信评估数据对应的目标通信评估指标的权重,根据各项目标通信评估数据和对应的目标通信评估指标的权重计算得到各项目标通信评估数据对应的分数,目标通信评估指标的权重是根据样本区域集合中样本区域的目标通信评估数据和样本区域总数确定的;将相同维度的目标通信评估数据的分数累加,得到目标通信评估数据集合中各个维度的目标通信评估数据对应的总分数;获取各个维度的目标通信评估数据对应的权重,根据各个维度的目标通信评估数据对应的权重和各个维度的目标通信评估数据对应的总分数计算得到目标区域的综合分数;向区域通信价值评估请求的发送端返回各个维度的目标通信评估数据对应的总分数和综合分数,以使发送端展示各个维度的目标通信评估数据对应的总分数和综合分数。由于目标通信评估数据集合是根据通话数据、流量数据、应用数据和基站数据确定的,目标通信评估数据集合包括不同维度的多项目标通信评估数据,因此目标通信评估数据集合可以反映目标区域内的通信信息。根据目标通信评估数据集合计算得到的各个维度的目标通信评估数据对应的总分数可以反映目标区域各个维度的通信价值,计算得到的综合分数可以反映目标区域的综合通信价值,因此根据综合分数对区域进行通信价值评估的准确性高。
附图说明
图1为一个实施例中基于通信数据识别定位区域价值的方法的应用环境图;
图2为一个实施例中基于通信数据识别定位区域价值的方法的流程示意图;
图2A为一个实施例中区域通信价值的展示界面图;
图3为一个实施例中确定目标通信评估指标的流程示意图;
图4为一个实施例中抓取学校POI数据的展示界面示意图;
图5为另一个实施例中确定目标通信评估指标的流程示意图;
图6为一个实施例中确定目标通信评估指标对应的权重的流程示意图;
图7为一个实施例中确定目标标签的流程示意图;
图8为另一个实施例中区域通信价值的展示界面图;
图9为一个实施例中基于通信数据识别定位区域价值的装置的结构框图;
图10为另一个实施例中基于通信数据识别定位区域价值的装置的结构框图;
图11为一个实施例中计算机设备的内部结构图。
具体实施方式
为了使本申请的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,对本申请进行进一步详细说明。应当理解,此处描述的具体实施例仅仅用以解释本申请,并不用于限定本申请。
本申请提供的基于通信数据识别定位区域价值的方法,可以应用于如图1所示的应用环境中。该应用环境包括终端102和服务器104。其中,终端102通过网络与服务器104通过网络进行通信。终端102可以但不限于是各种个人计算机、笔记本电脑、智能手机、平板电脑和便携式可穿戴设备,服务器104可以用独立的服务器或者是多个服务器组成的服务器集群来实现。
具体地,服务器104接收终端102发送的区域通信价值评估请求,区域通信价值评估请求携带目标区域的区域标识。服务器104根据区域通信价值评估请求获取目标区域的目标通信评估数据集合,目标通信评估数据集合包括不同维度的多项目标通信评估数据,目标通信评估数据集合是根据通话数据、流量数据、应用数据和基站数据确定的。服务器104获取各项目标通信评估数据对应的目标通信评估指标的权重,根据各项目标通信评估数据和对应的目标通信评估指标的权重计算得到各项目标通信评估数据对应的分数,其中,目标通信评估指标的权重是根据样本区域集合中样本区域的目标通信评估数据和样本区域总数确定的。服务器104将相同维度的目标通信评估数据的分数累加,得到目标通信评估数据集合中各个维度的目标通信评估数据对应的总分数。接着,服务器104获取各个维度的目标通信评估数据对应的权重,根据各个维度的目标通信评估数据对应的权重和各个维度的目标通信评估数据对应的总分数计算得到目标区域的综合分数。最后,服务器104向终端102返回各个维度的目标通信评估数据对应的总分数和综合分数,以使终端102展示各个维度的目标通信评估数据对应的总分数和综合分数。
在一个实施例中,如图2所示,提供了一种基于通信数据识别定位区域价值的方法,以该方法应用于图1中的服务器为例进行说明,包括以下步骤:
S202,接收区域通信价值评估请求,区域通信价值评估请求携带目标区域的区域标识。
其中,区域通信价值评估请求是用于对目标区域的通信价值进行评估。目标区域是指待评估通信价值的区域。区域标识是用于唯一标识区域,具体可以包括字母、数字和符号中的至少一种字符的字符串。
具体地,终端上运行有通信价值评估***,终端可以通过该通信价值评估***展示通信价值评估界面,并在通信价值评估界面中展示有用于触发区域通信价值评估请求的控件。当检测到作用于该控件的触发指令时,终端可以根据目标区域的区域标识生成区域通信价值评估请求。其中,触发操作具体可以是单击操作、双击操作、长按操作或语音操作等。
在一个实施例中,通信价值评估界面包括数字地图。区域标识具体可以是目标区域中心点的经纬度和区域半径,终端根据该区域标识生成区域通信价值评估请求。
在一个实施例中,在数字地图上将待评估地区均匀划分为多个500m*500m的栅格,每个栅格存在对应的经纬度。一个栅格对应一个目标区域。
在一个实施例中,不对数字地图进行划分,通信价值评估界面上设置有区域半径的输入框。以用户在终端录入的半径值作为区域半径,用户在数字地图上单击击中的点的经纬度作为目标区域中心点的经纬度,从而确定目标区域。
图2A为一个实施例中区域通信价值的展示界面图。参照图2A,用户首先在区域半径输入框输入“300”,并点击“计算区域得分”控件。用户在数字地图中单击任意位置,终端会获取鼠标单击处的经纬度,并结合半径300米确定目标区域和区域标识,进而生成区域通信价值评估请求,发送至服务器。进一步的,界面上还可以显示鼠标单击处的地址和经纬度。
S204,根据区域通信价值评估请求获取目标区域的目标通信评估数据集合,目标通信评估数据集合包括不同维度的多项目标通信评估数据,目标通信评估数据集合是根据通话数据、流量数据、应用数据和基站数据确定的。
其中,目标通信评估数据集合是一个数据集合,包括不同维度的多项目标通信评估数据。目标通信评估数据集合包括反映生态价值的多项目标通信评估数据,反映用户价值的多项目标通信评估数据,反映业务价值的多项目标通信评估数据和反映竞争价值的多项目标通信评估数据。生态价值、用户价值、业务价值、竞争价值表示不同的维度。
通话数据是与用户通话行为相关的数据,通话数据可以是CDR(Calling detailrecords,呼叫详细记录)数据。其中,CDR数据可以用于描述呼叫连续的全过程。通过对CDR数据中的重要数据进行分析和处理,可以为固定电话网和电话网业务提供分析的基础。通话数据可以从运营商的服务器上获取。流量数据是与用户上网行为相关的数据,流量数据可以是DPI(Deep Packet Inspection,深度包检测)数据。其中,DPI数据可以用于对流量进行监控和管理。DPI数据可以通过DPI设备对链路上的流量进行采集和识别得到。流量数据可以从运营商的服务器上获取。应用数据是与用户使用的应用程序相关的数据,应用数据可以通过网络爬虫抓取应用程序中的数据得到。其中,网络爬虫是一种按照一定规则,自动地抓取应用程序数据的程序或者脚本。基站数据是与基站相关的数据,基站数据包括MR(Measurement Report,测量报告)数据和基站性能数据。MR指的是信息在业务信道上每480ms(信令信道上470ms)发送一次数据,可以用于网络评估和优化。因为通话数据、流量数据、应用数据和基站数据具有碎片性、数据量大的特点,所以需要分别对这四种数据进行清洗、筛选和聚合,得到目标通信评估数据集合,方便后续对目标通信评估数据进行分析处理。
目标通信评估数据集合是根据通话数据、流量数据、应用数据和基站数据确定的。进一步的,目标通信评估数据集合是根据相同时间段内的通话数据、流量数据、应用数据和基站数据确定的。例如,获取2019年8月份的通话数据、流量数据、应用数据和基站数据,根据2019年8月份的通话数据、流量数据、应用数据和基站数据确定目标通信评估数据集合。具体的时间段可以由用户确定,例如区域通信价值评估请求携带时间段信息,根据该时间段信息获取该时间段信息对应的目标通信评估数据集合。具体的时间段还可以默认为当前时间所在的月份,例如区域通信价值评估请求是2019年8月份接收的,则获取2019年8月份的目标通信评估数据集合。
具体地,目标通信评估数据集合与区域标识是关联存储的。服务器根据区域通信价值评估请求携带的区域标识获取该区域标识对应的目标区域的目标通信评估数据集合。
在一个实施例中,目标通信评估数据集合可以以列表的方式存储在服务器中。
S206,获取各项目标通信评估数据对应的目标通信评估指标的权重,根据各项目标通信评估数据和对应的目标通信评估指标的权重计算得到各项目标通信评估数据对应的分数,目标通信评估指标的权重是根据样本区域集合中样本区域的目标通信评估数据和样本区域总数确定的。
其中,目标通信评估指标是用于表征评估区域通信特性的指标。目标通信评估指标和目标通信评估数据存在对应关系,例如,2019年8月份目标区域A的总通话时长为60万分钟,那么目标通信评估指标为总通话时长,目标通信评估数据为60万分钟的总通话时长。2019年8月份外卖应用程序中目标区域A的月订单数量为5000个,那么目标通信评估指标为月订单数量,目标通信评估数据为5000个订单数量。
样本区域集合包括多个样本区域。样本区域是预先在待评估地区内随机抽取的多个区域,该多个区域的大小相同。例如,首先在数字地图上确定一个待评估地区,如深圳市。接着,在深圳市随机抽取100个500m*500m的区域作为样本区域,组成样本区域集合。服务器根据样本区域集合中每个样本区域的目标通信评估数据和样本区域总数可以确定目标通信评估指标的权重。目标区域是待评估地区内的一个子区域。由于目标区域和样本区域集合中的样本区域位于同一地区内,该地区内的用户属性和用户行为比较相似。因此,根据样本区域集合的数据确定的目标通信评估指标的权重的准确性和可靠性较高。
具体地,服务器存储有目标通信评估指标的权重,该权重是根据样本区域集合中样本区域的目标通信评估数据和样本区域总数通过熵值法确定的。服务器根据样本区域集合中各项目标通信评估数据的最大值和最小值对目标区域的各项目标通信评估数据进行归一化处理,将各项目标通信评估数据映射到0~100范围之内。服务器根据目标通信评估指标的权重,对目标区域经过映射的各项目标通信评估数据进行加权求和,将加权求和得到的结果作为各项目标通信评估数据对应的分数。例如,目标通信评估数据为5000个订单数量,对应的目标通信评估指标为月订单数量,月订单数量对应的权重为30%,假设根据样本区域集合的数据该目标通信评估数据映射到90,那么该目标通信评估数据对应的分数为90*30%=27。
其中,熵值法是指用来判断某个指标的离散程度的数学方法。离散程度越大,对该指标对综合评价的影响越大。可以用熵值判断某个指标的离散程度。
S208,将相同维度的目标通信评估数据的分数累加,得到目标通信评估数据集合中各个维度的目标通信评估数据对应的总分数。
具体地,将反映用户价值的各项目标通信评估数据的分数累加得到反映用户价值的目标通信评估数据对应的总分数。将反映生态价值的各项目标通信评估数据的分数累加得到反映生态价值的目标通信评估数据对应的总分数。将反映业务价值的各项目标通信评估数据的分数累加得到反映业务价值的目标通信评估数据对应的总分数。将反映竞争价值的各项目标通信评估数据的分数累加得到反映竞争价值的目标通信评估数据对应的总分数。
S210,获取各个维度的目标通信评估数据对应的权重,根据各个维度的目标通信评估数据对应的权重和各个维度的目标通信评估数据对应的总分数计算得到目标区域的综合分数。
其中,综合分数是用于综合评估区域的通信价值。可以预先设置各个维度的目标通信评估数据对应的权重,存储在服务器中。各个维度的目标通信评估数据对应的权重可以根据通信专家的考虑而定。服务器还可以接收修改权重的设置请求,设置请求携带权重的修改信息,服务器根据该设置请求修改各个维度的目标通信评估数据对应的权重。
具体地,服务器获取各个维度的目标通信评估数据对应的权重,对各个维度的目标通信评估数据对应的总分数进行加权求和,得到目标区域的综合分数。
S212,向区域通信价值评估请求的发送端返回各个维度的目标通信评估数据对应的总分数和综合分数,以使发送端展示各个维度的目标通信评估数据对应的总分数和综合分数。
具体地,服务器向发送区域通信价值评估请求的终端返回各个维度的目标通信评估数据对应的总分数和综合分数。终端在通信价值评估界面上展示该总分数和综合分数,展示方式包括但不限于浮框的方式和弹幕的方式。
在一个实施例中,分数的展示方式为浮框的方式,可以参照图2A进行理解。
在一个实施例中,服务器可以向终端返回多个目标区域的各个维度目标通信评估数据对应的总分数和综合分数。终端可以将该多个目标区域的综合分数进行排序,根据排序结果对目标区域对应的栅格渲染颜色。例如,将多个目标区域的综合分数从高到低进行排序。综合分数位于前10%的目标区域对应的栅格可以渲染为红色,综合分数位于前10%-40%的目标区域对应的栅格可以渲染为黄色,剩下的目标区域对应的栅格可以渲染为蓝色。并且在通信价值评估界面上展示渲染规则。
上述基于通信数据识别定位区域价值的方法,通过接收区域通信价值评估请求,区域通信价值评估请求携带目标区域的区域标识;根据区域通信价值评估请求获取目标区域的目标通信评估数据集合,目标通信评估数据集合包括不同维度的多项目标通信评估数据,目标通信评估数据集合是根据通话数据、流量数据、应用数据和基站数据确定的;获取各项目标通信评估数据对应的目标通信评估指标的权重,根据各项目标通信评估数据和对应的目标通信评估指标的权重计算得到各项目标通信评估数据对应的分数,目标通信评估指标的权重是根据样本区域集合中样本区域的目标通信评估数据和样本区域总数确定的;将相同维度的目标通信评估数据的分数累加,得到目标通信评估数据集合中各个维度的目标通信评估数据对应的总分数;获取各个维度的目标通信评估数据对应的权重,根据各个维度的目标通信评估数据对应的权重和各个维度的目标通信评估数据对应的总分数计算得到目标区域的综合分数;向区域通信价值评估请求的发送端返回各个维度的目标通信评估数据对应的总分数和综合分数,以使发送端展示各个维度的目标通信评估数据对应的总分数和综合分数。由于目标通信评估数据集合是根据通话数据、流量数据、应用数据和基站数据确定的,目标通信评估数据集合包括不同维度的多项目标通信评估数据,因此目标通信评估数据集合可以反映目标区域内的通信信息。根据目标通信评估数据集合计算得到的各个维度的目标通信评估数据对应的总分数可以反映目标区域各个维度的通信价值,计算得到的综合分数可以反映目标区域的综合通信价值,因此根据综合分数对区域进行通信价值评估的准确性和可靠性高。
在一个实施例中,如图3所示,接收区域通信价值评估请求之前,基于通信数据识别定位区域价值的方法还包括:
S302,获取样本区域集合,样本区域集合包括多个样本区域。
S304,获取各个样本区域的通信数据,通信数据包括通话数据、流量数据、应用数据和基站数据。
具体地,服务器获取样本区域集合,样本区域集合包括多个样本区域。服务器可以从各个不同渠道获取通信数据。例如,服务器从运营商服务器获取通话数据、流量数据和基站数据。服务器从终端获取应用数据。通话数据和流量数据中都包括时间信息、用户终端标识和基站信息,根据时间信息和用户终端标识可以将通话数据和流量数据进行关联。基站数据包括基站信息,根据基站信息可以将通话数据、流量数据和基站数据进行关联。由于基站数据包括信号在用户终端与基站间的传播时间、信号在用户终端与基站间的传播角度、基站的位置信息,因此可以根据基站数据确定用户终端标识对应的用户终端的位置信息。各个样本区域存在对应的位置信息,应用数据也存在对应的位置信息,根据位置信息可以确定样本区域的应用数据、通话数据、流量数据和基站数据,进而得到样本区域的通信数据。
S306,对通信数据进行清洗和筛选,得到各个样本区域的候选通信数据。
S308,对候选通信数据进行聚合,得到各个样本区域的多项候选通信评估数据。
具体地,服务器对通信数据进行清洗,包括处理无效值和缺失值。例如,可以将无效值删除,将缺失值填充为0。进一步的,由于通信数据的数据量特别大,因此需要对通信数据进行筛选。
针对CDR数据的筛选规则可以为保留原始CDR数据中字段为CITY(城市)、BSC(BSC基站所属的区域号)、MONTH(月份)、TODAY(日期)、HOURS(小时)、DATEINDEX(日期索引)、CALL_CURRENT_TIMESTAMP(当前时间戳)、IMSI(用户的国际移动用户识别码)、MEID(手机设备号)、MSISDN(主(被)叫号码)、AC_SECOND(接入时刻秒数)、AC_MILLSECOND(接入时刻毫秒数)、CALL_CONTINUE_TIME(呼叫持续时间,单位为ms)、CALL_TAG(呼叫标志)、CALL_START_BUSINESS_OPTION(呼叫初始的业务选项)、CALL_END_BUSINESS_OPTION(最终的业务选项)、CELL_ID(接入导频_CELLID)、SECTORID_ID(接入导频_SECTORID)的数据,删除其余字段的数据。对CDR数据筛选得到目标CDR数据。一次通话对应一组目标CDR数据。根据单位时间内的目标CDR数据生成目标CDR数据表。例如,可以根据一天的目标CDR数据生成一张目标CDR数据表,也可以根据一周的目标CDR数据生成一张目标CDR数据表。单位时间可以设置为一天、一周、一个月、一个季度等时间粒度。
其中,根据呼叫标志可以确定通话是主叫通话,还是被叫通话。主叫通话是指用户主动拨打建立的通话。被叫通话是指用户被动接听建立的通话。接入导频_CELLID是指接入导频对应的主小区标识。接入导频_SECTORID是指接入导频对应的扇区标识。
对目标CDR数据表中的数据基于时间进行聚合,可以得到单位时间内的目标CDR数据对应的总通话人数、总通话时长、总主叫通话人数、总主叫通话时长、总通话次数、工作时间通话人数和工作时间通话时长。例如,一张目标CDR数据表存储有区域A在2019年1月1日的目标CDR数据,将目标CDR数据进行聚合,可以得到区域A在2019年1月1日的总通话人数、总通话时长、总主叫通话人数、总主叫通话时长、总通话次数、工作时间通话人数和工作时间通话时长。例如,总通话人数是对目标CDR数据表中字段为IMSI的数据进行统计得到。总通话时长是将目标CDR数据表中字段为CALL_CONTINUE_TIME的数据累加得到。工作时间通话时长是将目标CDR数据表中字段为CALL_CONTINUE_TIME并且数据值处于工作时间内的数据累加得到。工作时间通话人数是根据与计算工作时间通话时长的数据对应的字段为IMSI的数据得到。进一步的,根据工作时间通话人数与总通话人数的比值可以得到工作时间通话人数占比。根据工作时间通话时长与总通话时长的比值可以得到工作时间通话时长占比。根据总主叫通话人数与总通话人数的比值可以得到主叫通话人数占比。根据总主叫通话时长与总通话时长的比值可以得到主叫通话时长占比。根据总通话次数与总通话人数的比值可以得到平均每人通话次数。根据总通话次数与总通话时长的比值可以得到平均每次通话时长。最终可以得到CDR数据对应的多项候选通信评估数据。
针对DPI数据的筛选规则可以为保留DPI数据中字段为day(日期)、IMSI(用户的国际移动用户识别码)、enb_id(基站ID)、servicetype(业务应用类型)、sum_online_duration_seconds(持续时间,单位为s)、sum_inputoctets(发给用户的业务字节数,单位为bit)、sum_outputoctets(用户发出的业务字节数的数据,单位为bit)的数据,删除其余字段的数据。对DPI数据筛选得到目标DPI数据。根据单位时间内的目标DPI数据生成目标DPI数据表。
对目标DPI数据表中的数据基于时间进行聚合,可以得到单位时间内的目标DPI数据对应的总流量、总上网人数、关键应用流量、总上网次数、关键应用总流量、关键应用上网次数。例如,总上网人数是对目标DPI数据表中字段为IMSI的数据进行统计得到。总流量是对目标DPI数据表中字段为sum_outputoctets和sum_inputoctets的数据累加得到。进一步的,根据总上网次数和总上网人数的比值可以得到平均每人上网次数。根据总流量和总上网次数的比值可以得到平均每人上网次数。根据关键应用上网次数和总上网次数的比值可以得到关键应用上网次数占比。最终可以得到DPI数据对应的多项候选通信评估数据。
其中,关键应用流量对目标DPI数据表中所有用户在关键应用耗费的流量。关键应用可以根据实际需求设置。在一个实施例中,关键应用可以为微信、QQ、淘宝、今日头条和抖音五大应用。根据目标DPI数据表中字段为servicetype的数据可以确定应用类型。
针对MR数据的筛选规则可以为保留MR数据中字段为eNodeBID(4G基站标识)、MmeUeS1apld(用户终端在MME侧S1接口上的唯一标识)、TimeStamp(时间戳)、LteScEarfcn(主小区载波号)、LteScPci(主小区PCI(Physical Cell Identifier,物理小区标识))、LteNcEarfcn(邻区载波号)、LteNcPci(邻区PCI)、Uarfcn(频点)的数据,删除其余字段的数据。对MR数据筛选得到目标MR数据。移动、电信、联通运营商的基站都有对应的频点范围。根据字段为Uarfcn(频点)的数据可以确定竞争对手的基站数量。频点和基站的对应关系可以为一个频点对应一个基站。根据MR数据可以得到竞争对手基站数量这一项候选通信评估数据。
针对基站性能数据的筛选规则可以为保留基站性能数据中字段为基站标识、下行平均PRB利用率、下行激活用户数、下行平均激活用户数、上行平均PRB利用率、上行平均激活用户数、下行用户体验速率、上行用户体验速率、PDCCH信道占用率、寻呼信道利用率、PRACH信道利用率的数据,删除其余字段的数据。对基站性能数据筛选得到目标基站性能数据,根据单位时间内的目标基站性能数据生成目标基站性能数据表。
对目标基站性能数据表中的数据基于时间进行聚合,可以得到单位时间内的目标基站性能数据。单位时间可以为一周。根据聚合后的基站性能数据对基站的无线负荷进行评估,评估基站的负荷等级。对基站的无线负荷进行评估的规则为:1、当下行平均PRB利用率>65%,且下行激活用户数>3,表示基站下行资源受限;2、当上行平均PRB利用率>65%,且上行平均激活用户数>3,表示基站上行资源受限;3、当下行激活用户数>8,且下行用户体验速率<4Mbps,且下行平均PRB利用率>40%,表示基站下行调度受限;4、当上行平均激活用户数>8,且上行用户体验速率<0.256Mbps,且上行平均PRB利用率>40%,表示基站上行调度受限;5、当PDCCH信道占用率>75%,且下行平均激活用户数>3,表示基站信令容量受限;6、当寻呼信道利用率>75%,表示基站寻呼容量受限;7、当PRACH信道利用率>75%,表示基站接入容量受限。每满足一个条件,基站的负荷等级加1。根据基站性能数据可以得到基站负荷等级这一项候选通信评估数据。
在一个实施例中,应用数据包括点评类应用数据、外卖类应用数据、POI(Point ofInterest,兴趣点)数据、数字地图的热力图数据和租房类应用数据。
在终端打开点评类应用,可以通过网络爬虫获取样本区域内所有商户的商户信息,商户信息包括商户的地址。通过网络爬虫在终端的百度地图坐标拾取器上自动输入每个商户的地址,自动触发查询控件,得到每个商户的百度坐标系经纬度。网络爬虫再自动抓取每个商户的百度坐标系经纬度,根据每个商户的百度坐标系经纬度和每个商户的商户信息生成点评类应用数据表。点评类应用数据表包括商家标识、商家地址、商家的用户点评数量、商家的用户评分、商家的百度坐标系经纬度、商家的火星坐标系经纬度、百度地图坐标拾取器信息等数据和数据的获取时间和更新时间。其中,火星坐标系经纬度和百度坐标系经纬度可以相互转换得到。由此,得到点评类应用的数据。通过相同的方法可以得到外卖类应用数据表,得到外卖类应用的数据。外卖类应用数据表包括外卖商家标识、外卖商家地址、外卖商家的用户点评数量、外卖商家的用户评分、外卖商家的月销售订单数量、外卖商家附件的POI的百度坐标系经纬度和火星坐标系经纬度、外卖商家的百度坐标系经纬度和火星坐标系经纬度、百度地图坐标拾取器信息等数据和数据的获取时间和更新时间。通过相同的方法可以得到租房类应用数据表,得到租房类应用的数据。租房类应用数据表包括楼盘标识、楼盘地址、楼盘类型、楼盘每平方楼价、楼盘租金、楼盘的百度坐标系经纬度和火星坐标系经纬度等数据和数据的获取时间和更新时间。
可以在终端的百度地图坐标拾取器的搜索框内输入POI信息,通过网络爬虫抓取所有搜索结果,生成POI数据表。POI数据表包括POI标识、POI地址、POI的百度坐标系经纬度、POI类别等数据。由此,得到POI数据。POI包括学校、医院和银行等兴趣点。图4为一个实施例中抓取学校POI数据的界面示意图,参照图4,其中402为百度地图坐标拾取器的搜索框,在搜索框中输入深圳市龙华区学校,触发搜索控件,可以得到深圳市龙华区所有学校的名称、地址、坐标。404为其中一条搜索结果。通过网络爬虫抓取所有搜索结果,可以得到学校类POI数据。
终端安装有雷电模拟器,在雷电模拟器中运行百度地图APP。将地图定位到样本区域的中心点,打开百度地图APP的热力图功能。此时,地图界面的颜色深浅不一,其中,颜色越深表示手机用户集中度越高。接着,利用雷电模拟器自动对样本区域进行截屏,通过图像处理技术解析截屏图片中各个热力区域的热力程序,得到各个热力区域的热力度。由于百度地图的热力图功能无法得到热力区域的经纬度,所以需要利用经纬度获取工具得到各个热力区域的经纬度。虽然热力区域是不规则形状的,但是经过研究发现,百度地图的热力区域可以近似看成是由多个圆形组合而成的不规则形状。因此热力区域的经纬度可以根据每个圆形的圆心确定。首先确定每个热力区域的圆心,在经纬度获取工具中的数字地图找到与该圆心匹配的点,该点的经纬度即为热力区域的经纬度。根据热力区域的热力度和经纬度得到热力图数据。
在一个实施例中,可以对根据通信数据得到的多项候选通信评估数据分类,分为反映用户价值、生态价值、业务价值和竞争价值的四个维度的候选通信评估数据。具体的分类规则可以根据通信专家的考虑而定。
S310,计算各项候选通信评估数据对应的候选通信评估指标之间的相关性,根据相关性确定目标通信评估指标。
其中,相关性是指两个指标之间的关联程度。若两个指标之间的相关性大,那么这两个指标密切关联,这两个指标实质上反映同一事物,其中有一个指标是冗余的,该指标对评估通信价值没有贡献,反而增加了服务器的工作量。
具体地,服务器根据各个样本区域的各项候选通信评估数据计算各项候选通信评估数据对应的候选通信评估指标之间的相关性,得到相关性比例系数。在所有候选通信评估指标中滤除相关性比例系数的绝对值大于预设阈值的候选通信评估指标,得到目标通信评估指标。
上述实施例中,从通话数据、流量数据、应用数据和基站数据中提取出有用的字段数据,对有用的字段数据进行分析得到目标通信评估指标,可以提高服务器处理数据的效率。由于目标通信评估指标之间的相关性小于或等于预设阈值,目标通信评估指标之间相互独立最大化,从而可以提高目标区域的通信价值的评估可靠性。
在一个实施例中,如图5所示,步骤S308即计算各项候选通信评估数据对应的候选通信评估指标之间的相关性,根据相关性确定目标通信评估指标,包括:
S502,获取样本区域集合中各项候选通信评估数据的最大值和最小值。
S504,根据样本区域集合中各项候选通信评估数据的最大值和最小值对各个样本区域的各项候选通信评估数据进行归一化处理。
具体地,服务器获取样本区域集合中各项候选通信评估数据的最大值和最小值,根据样本区域集合中各项候选通信评估数据的最大值和最小值对每个样本区域的各项候选通信评估数据进行归一化处理,将各项候选通信评估数据映射到0~100范围内。
在一个实施例中,假设样本区域集合包括P个样本区域。若一个样本区域的候选通信评估数据组成一张数据表,那么可以得到P个数据表。可以使用进行归一化处理,其中,Xij为归一化处理后第i个数据表的第j个候选通信评估指标对应的候选通信评估数据,xij为第i个数据表的第j个候选通信评估指标对应的候选通信评估数据即未归一化处理的候选通信评估数据,max(xj)为P个数据表中第j个候选通信评估指标对应的候选通信评估数据最大值,min(xj)为P个数据表中第j个候选通信评估指标对应的候选通信评估数据最小值。
S506,计算每个候选通信评估指标对应的归一化处理后的候选通信评估数据的均值和标准差。
S508,根据均值和标准差计算每个候选通信评估指标与其他候选通信评估指标的相关性比例系数。
具体地,服务器计算每个候选通信评估指标对应的归一化处理后的候选通信评估数据的均值和标准差,根据均值和标准差计算每个候选通信评估指标与其他候选通信评估指标的相关性比例系数。
在一个实施例中,假设样本区域集合包括P个样本区域。若一个样本区域的候选通信评估数据组成一张数据表,那么可以得到P个数据表,每个数据表有Q个候选通信评估指标。可以通过计算相关性比例系数。其中,rjj′为候选通信评估指标j与候选通信评估指标j′的相关性比例系数(j≠j′,j,j′∈Q,Q表示所有候选通信评估指标的集合),Xij为归一化处理后第i个数据表的第j个候选通信评估指标对应的候选通信评估数据,Xij′为归一化处理后第i个数据表的第j′个候选通信评估指标对应的候选通信评估数据,为P个数据表中第j个候选通信评估指标对应的候选通信评估数据的平均值,为P个数据表中第j′个候选通信评估指标对应的候选通信评估数据的平均值,为P个数据表中第j个候选通信评估指标对应的候选通信评估数据的标准差,为P个数据表中第j′个候选通信评估指标对应的候选通信评估数据的标准差。
S510,根据相关性比例系数与预设阈值的关系对候选通信评估指标进行过滤,得到目标通信评估指标。
具体地,当两个候选通信评估指标之间的相关性比例系数的绝对值大于预设阈值时,这两个候选通信评估指标强相关,因此需要在这两个候选通信评估指标中滤除一个候选通信评估指标。最终保留下来的候选通信评估指标作为目标通信评估指标。其中,预设阈值根据预先设置,存储在服务器中,例如,预设阈值可以设置为0.8。
在一个实施例中,可以根据实际业务需求和业务经验确定两个候选通信评估指标中保留哪一个候选通信评估指标。
在一个实施例中,可以根据这两个候选通信评估指标与其他候选通信评估指标的相关性比例系数确定保留哪一个候选通信评估指标。分别计算这两个候选通信评估指标与其他候选通信评估指标的相关性比例系数绝对值的均值,保留均值更小的候选通信评估指标。
在一个实施例中,可以根据实际业务需求和业务经验对个别相关性比例系数的绝对值大于预设阈值的候选通信评估指标予以保留。
上述实施例中,根据归一化处理后的候选通信评估数据的均值和标准差计算候选通信评估指标之间的相关性比例系数,滤除相关性比例系数较大的候选通信评估指标,得到目标通信评估指标。最终得到的目标通信评估指标保持合理的个数并且目标通信评估指标相互独立最大化。
在一个实施例中,如图6所示,基于通信数据识别定位区域价值的方法还包括:
S602,根据各个样本区域归一化处理后的各项目标通信评估数据计算各个样本区域的各项目标通信评估数据的贡献度。
S604,获取样本区域总数,根据样本区域总数和贡献度计算目标通信评估指标对应的熵值。
具体地,服务器根据目标通信评估指标可以确定各个样本区域的各项目标通信评估数据,还可以确定各个样本区域归一化处理后的各项目标通信评估数据。进而,服务器可以根据各个样本区域归一化处理后的各项目标通信评估数据计算各个样本区域的各项目标通信评估数据对各项目标通信评估数据对应目标通信评估指标的贡献度。服务器获取样本区域总数,根据样本区域总数和各项目标通信评估数据的贡献度分别计算各个维度下各个目标通信评估指标对应的熵值。例如,根据样本区域总数和反映用户价值的各项目标通信评估数据的贡献度计算反映用户价值的各个目标通信评估指标对应的熵值。
在一个实施例中,假设样本区域集合包括P个样本区域。若一个样本区域的目标通信评估数据组成一张数据表,那么可以得到P个数据表,每个数据表中A维度的目标通信评估指标有R个。可以通过计算各个样本区域的各项目标通信评估数据对对应的目标通信评估指标的贡献度,Pij为第i个数据表A维度的第j个目标通信评估指标对应的目标通信评估数据对第j个目标通信评估指标的贡献度,Xij为归一化处理后第i个数据表A维度的第j个目标通信评估指标对应的目标通信评估数据,为P个数据表中A维度的第j个目标通信评估指标对应的目标通信评估数据的总和。可以通过计算目标通信评估指标对应的熵值。其中,Ej为A维度的第j个目标通信评估指标对应的熵值。其中,k为常数,可以通过计算得到,P为样本区域总数。
S606,根据目标通信评估指标对应的熵值计算目标通信评估指标对应的差异系数,根据差异系数计算得到目标通信评估指标的权重。
具体地,服务器根据各个维度的各个目标通信评估指标对应的熵值计算得到各个维度的各个目标通信评估指标对应的差异系数,也称为信息熵冗余度。然后根据计算得到的各个差异系数计算各个维度的各个目标通信评估指标对应的权重。其中,相同维度的各个目标通信评估指标对应的权重相加为1。
在一个实施例中,可以通过dj=1-Ej计算目标通信评估指标对应的差异系数。其中,dj为第j个目标通信评估指标对应的差异系数,Ej为第j个目标通信评估指标对应的熵值。进而,可以通过计算目标通信评估指标对应的权重。其中,Wj为第j个目标通信评估指标对应的权重,dj为第j个目标通信评估指标对应的差异系数,为1个维度的R个目标通信评估指标对应的差异系数的和。
上述实施例中,根据归一化处理后的各个样本区域的各项目标通信评估数据和样本区域总数计算目标通信评估指标对应的熵值,根据目标通信评估指标对应的熵值计算目标通信评估指标对应的差异系数,根据目标通信评估指标对应的差异系数计算得到目标通信评估指标对应的权重,能够准确计算得到各个目标通信评估指标对应的权重。
在一个实施例中,如图7所示,基于通信数据识别定位区域价值的方法还包括:
S702,将各项目标通信评估数据和预设标签库中的标签信息进行匹配。
S704,根据匹配结果确定目标区域的目标标签。
其中,预设标签库是预先建立的标签库。标签库里有多个标签信息,标签信息包括标签名称、标签名称对应的标签定义和通信评估指标。例如,标签名称为白领区域,该标签名称对应的标签定义为外卖类应用中商家的月订单销量大于或等于1.5w。该标签名称对应的通信评估指标为月订单销量。
具体地,服务器获取目标区域的各项目标通信评估数据对应的目标通信评估指标,将该目标通信评估指标与标签库中标签信息的通信评估指标进行匹配。当匹配成功时,获取匹配成功的目标通信评估指标对应的目标通信评估数据和通信评估指标对应的标签定义。将目标通信评估数据和标签定义进行匹配,当匹配成功时,将匹配成功的标签定义对应的标签名称作为目标标签。例如,标签名称为白领区域,该标签名称对应的标签定义为外卖类应用中商家的月订单销量大于或等于1.5w。该标签名称对应的目标通信评估指标为月订单销量。当目标区域的月订单销量为3w时,白领区域可以作为该目标区域的目标标签。
S706,向区域通信价值评估请求的发送端返回目标标签,以使发送端展示目标标签。
具体地,服务器向发送区域通信价值请求的终端返回目标标签。终端在通信价值评估界面上展示目标标签,展示方式包括但不限于浮框的方式和弹幕的方式。
上述实施例中,将各项目标通信评估数据和预设标签库中的标签信息进行匹配,根据匹配结果确定目标区域的目标标签,向区域通信价值评估请求的发送端返回目标标签,以使发送端展示目标标签。目标标签可以直观地展示出目标区域的通信特征,可以进一步体现目标区域的通信价值。
在一个具体的实施例中,基于通信数据识别定位区域价值的方法包括:
(一)获取通信数据
在深圳市龙华区内随机抽取100个样本区域组成样本区域集合。样本区域的大小为500米*500米。参考图8,图8为一个实施例中区域通信价值的展示界面图。在数字地图上由曲线圈出来的区域为深圳市龙华区,深圳市龙华区被均匀划分为多个500米*500米的栅格。图中的一个圆点表示一个500米*500米的栅格。服务器从运营商服务器获取通话数据、流量数据和基站数据,服务器从终端获取应用数据。服务器根据各个样本区域的位置信息,确定各个样本区域对应的通话数据、流量数据、应用数据和基站数据,进而得到各个样本区域的通信数据。
(二)对通信数据进行处理
服务器对通信数据进行清洗、筛选和聚合得到多项候选通信评估数据。将各项候选通信评估数据分为反映用户价值、生态价值、业务价值和竞争价值四个维度的候选通信评估数据。根据各项候选通信评估数据的最大值和最小值对各项候选通信评估数据进行归一化处理,计算归一化处理后的各项候选通信评估数据的均值和标准差,根据均值和标准差计算各个候选通信评估指标之间的相关性比例系数。在所有候选通信评估指标中滤除相关性比例系数的绝对值大于预设阈值的候选通信评估指标,同时出于业务需求的考虑可以保留个别相关性比例系数的绝对值大于预设阈值的候选通信评估指标,最终确定目标通信评估指标。各个目标通信评估指标可以如表1所示。
(三)计算权重
根据熵值法确定各个维度下的目标通信评估指标对应的权重,各个目标通信评估指标对应的权重可以如表1所示。其中,反映用户价值的各个目标通信评估指标对应的权重相加为1,反映生态价值的各个目标通信评估指标对应的权重累加为1,反映业务价值的各个目标通信评估指标对应的权重累加为1,反映竞争价值的各个目标通信评估指标对应的权重累加为1。各个维度对应的权重根据通信专家的考虑确定。其中,用户价值对应的权重为20%,生态价值对应的权重为50%,业务价值对应的权重为20%,竞争价值对应的权重为10%。
表1
(四)计算分数
图8中的一个栅格对应一个目标区域。服务器获取每个目标区域的目标通信评估数据,根据样本区域集合中各项目标通信评估数据的最大值和最小值对目标区域的各项目标通信评估数据进行归一化处理。根据目标区域归一化处理后的各项目标通信评估数据和各项目标通信评估数据对应的目标通信评估指标的权重,计算目标区域各项目标通信评估数据对应的分数。将相同维度的目标通信评估数据对应的分数累加得到各个维度目标通信评估数据对应的总分数。根据各个维度目标通信评估数据对应的权重和各个维度目标通信评估数据对应的总分数计算得到目标区域的综合分数。
服务器将每个目标区域的各个维度目标通信评估数据的总分数和综合分数发送到终端,进而在终端的通信价值评估界面上进行展示。进一步的,用户在终端单击任意一个栅格可以展示具体的分数值和栅格的经纬度,展示方式可以参考图8。用户单击的栅格的中心点的经度为114.0257435,纬度为22.6673224。
进一步的,还可以将目标区域的目标通信评估数据与标签库中的标签信息进行匹配,确定目标区域的目标标签。服务器将目标区域的目标标签发送到终端,进而在终端的通信价值评估界面上进行展示,展示方式可以参考图8。
应该理解的是,虽然上述流程图中的各个步骤按照箭头的指示依次显示,但是这些步骤并不是必然按照箭头指示的顺序依次执行。除非本文中有明确的说明,这些步骤的执行并没有严格的顺序限制,这些步骤可以以其它的顺序执行。而且,上述流程图中的至少一部分步骤可以包括多个子步骤或者多个阶段,这些子步骤或者阶段并不必然是在同一时刻执行完成,而是可以在不同的时刻执行,这些子步骤或者阶段的执行顺序也不必然是依次进行,而是可以与其它步骤或者其它步骤的子步骤或者阶段的至少一部分轮流或者交替地执行。
在一个实施例中,如图9所示,提供了一种基于通信数据识别定位区域价值的装置,包括:请求接收模块902、目标通信评估数据获取模块904、分数计算模块906和分数发送模块908,其中:
请求接收模块902,用于接收区域通信价值评估请求,区域通信价值评估请求携带目标区域的区域标识。
目标通信评估数据获取模块904,用于根据区域通信价值评估请求获取目标区域的目标通信评估数据集合,目标通信评估数据集合包括不同维度的多项目标通信评估数据,目标通信评估数据集合是根据通话数据、流量数据、应用数据和基站数据确定的。
分数计算模块906,用于获取各项目标通信评估数据对应的目标通信评估指标的权重,根据各项目标通信评估数据和对应的目标通信评估指标的权重计算得到各项目标通信评估数据对应的分数,目标通信评估指标的权重是根据样本区域集合中样本区域的目标通信评估数据和样本区域总数确定的;将相同维度的目标通信评估数据的分数累加,得到目标通信评估数据集合中各个维度的目标通信评估数据对应的总分数;获取各个维度的目标通信评估数据对应的权重,根据各个维度的目标通信评估数据对应的权重和各个维度的目标通信评估数据对应的总分数计算得到目标区域的综合分数。
分数发送模块908,用于向区域通信价值评估请求的发送端返回各个维度的目标通信评估数据对应的总分数和综合分数,以使发送端展示各个维度的目标通信评估数据对应的总分数和综合分数。
在一个实施例中,如图10所示,基于通信数据识别定位区域价值的装置还包括:
目标通信评估指标确定模块901,用于获取样本区域集合,样本区域集合包括多个样本区域;获取各个样本区域的通信数据,通信数据包括通话数据、流量数据、应用数据和基站数据;对通信数据进行清洗和筛选,得到各个样本区域的候选通信数据;对候选通信数据进行聚合,得到各个样本区域的多项候选通信评估数据;计算各项候选通信评估数据对应的候选通信评估指标之间的相关性,根据相关性确定所述目标通信评估指标。
在一个实施例中,目标通信评估指标确定模块901还用于根据各个样本区域归一化处理后的各项目标通信评估数据计算各个样本区域的各项目标通信评估数据的贡献度;获取样本区域总数,根据样本区域总数和贡献度计算目标通信评估指标对应的熵值;根据目标通信评估指标对应的熵值计算目标通信评估指标对应的差异系数,根据差异系数计算得到目标通信评估指标的权重。
在一个实施例中,如图10所示,基于通信数据识别定位区域价值的装置还包括:
标签确定模块909,用于将各项目标通信评估数据和预设标签库中的标签信息进行匹配;根据匹配结果确定目标区域的目标标签;向区域通信价值评估请求的发送端返回目标标签,以使发送端展示目标标签。
关于基于通信数据识别定位区域价值的装置的具体限定可以参见上文中对于基于通信数据识别定位区域价值的方法的限定,在此不再赘述。上述基于通信数据识别定位区域价值的装置中的各个模块可全部或部分通过***、硬件及其组合来实现。上述各模块可以硬件形式内嵌于或独立于计算机设备中的处理器中,也可以以***形式存储于计算机设备中的存储器中,以便于处理器调用执行以上各个模块对应的操作。
在一个实施例中,提供了一种计算机设备,该计算机设备可以是服务器,其内部结构图可以如图11所示。该计算机设备包括通过***总线连接的处理器、存储器、网络接口和数据库。其中,该计算机设备的处理器用于提供计算和控制能力。该计算机设备的存储器包括非易失性存储介质、内存储器。该非易失性存储介质存储有操作***、计算机程序和数据库。该内存储器为非易失性存储介质中的操作***和计算机程序的运行提供环境。该计算机设备的数据库用于存储通信数据。该计算机设备的网络接口用于与外部的终端通过网络连接通信。该计算机程序被处理器执行时以实现一种基于通信数据识别定位区域价值的方法。
本领域技术人员可以理解,图11中示出的结构,仅仅是与本申请方案相关的部分结构的框图,并不构成对本申请方案所应用于其上的计算机设备的限定,具体的计算机设备可以包括比图中所示更多或更少的部件,或者组合某些部件,或者具有不同的部件布置。
在一个实施例中,提供了一种计算机设备,包括存储器和处理器,存储器存储有计算机程序,计算机程序被处理器执行时,使得处理器执行上述基于通信数据识别定位区域价值的方法的步骤。此处基于通信数据识别定位区域价值的方法的步骤可以是上述各个实施例的基于通信数据识别定位区域价值的方法中的步骤。
在一个实施例中,提供了一种计算机可读存储介质,存储有计算机程序,计算机程序被处理器执行时,使得处理器执行上述基于通信数据识别定位区域价值的方法的步骤。此处基于通信数据识别定位区域价值的方法的步骤可以是上述各个实施例的基于通信数据识别定位区域价值的方法中的步骤。
本领域普通技术人员可以理解实现上述实施例方法中的全部或部分流程,是可以通过计算机程序来指令相关的硬件来完成,所述的计算机程序可存储于一非易失性计算机可读取存储介质中,该计算机程序在执行时,可包括如上述各方法的实施例的流程。其中,本申请所提供的各实施例中所使用的对存储器、存储、数据库或其它介质的任何引用,均可包括非易失性和/或易失性存储器。非易失性存储器可包括只读存储器(ROM)、可编程ROM(PROM)、电可编程ROM(EPROM)、电可擦除可编程ROM(EEPROM)或闪存。易失性存储器可包括随机存取存储器(RAM)或者外部高速缓冲存储器。作为说明而非局限,RAM以多种形式可得,诸如静态RAM(SRAM)、动态RAM(DRAM)、同步DRAM(SDRAM)、双数据率SDRAM(DDRSDRAM)、增强型SDRAM(ESDRAM)、同步链路(Synchlink)DRAM(SLDRAM)、存储器总线(Rambus)直接RAM(RDRAM)、直接存储器总线动态RAM(DRDRAM)、以及存储器总线动态RAM(RDRAM)等。
以上实施例的各技术特征可以进行任意的组合,为使描述简洁,未对上述实施例中的各个技术特征所有可能的组合都进行描述,然而,只要这些技术特征的组合不存在矛盾,都应当认为是本说明书记载的范围。
以上所述实施例仅表达了本申请的几种实施方式,其描述较为具体和详细,但并不能因此而理解为对发明专利范围的限制。应当指出的是,对于本领域的普通技术人员来说,在不脱离本申请构思的前提下,还可以做出若干变形和改进,这些都属于本申请的保护范围。因此,本申请专利的保护范围应以所附权利要求为准。
Claims (10)
1.一种基于通信数据识别定位区域价值的方法,所述方法包括:
接收区域通信价值评估请求,所述区域通信价值评估请求携带目标区域的区域标识;
根据所述区域通信价值评估请求获取所述目标区域的目标通信评估数据集合,所述目标通信评估数据集合包括不同维度的多项目标通信评估数据,所述目标通信评估数据集合是根据通话数据、流量数据、应用数据和基站数据确定的;
获取各项目标通信评估数据对应的目标通信评估指标的权重,根据所述各项目标通信评估数据和对应的所述目标通信评估指标的权重计算得到所述各项目标通信评估数据对应的分数,所述目标通信评估指标的权重是根据样本区域集合中样本区域的目标通信评估数据和样本区域总数确定的;
将相同维度的目标通信评估数据的分数累加,得到所述目标通信评估数据集合中各个维度的目标通信评估数据对应的总分数;
获取所述各个维度的目标通信评估数据对应的权重,根据所述各个维度的目标通信评估数据对应的权重和各个维度的目标通信评估数据对应的总分数计算得到所述目标区域的综合分数;
向所述区域通信价值评估请求的发送端返回所述各个维度的目标通信评估数据对应的总分数和所述综合分数,以使所述发送端展示所述各个维度的目标通信评估数据对应的总分数和所述综合分数。
2.根据权利要求1所述的方法,其特征在于,所述接收区域通信价值评估请求之前,所述方法还包括:
获取所述样本区域集合,所述样本区域集合包括多个所述样本区域;
获取各个样本区域的通信数据,所述通信数据包括通话数据、流量数据、应用数据和基站数据;
对所述通信数据进行清洗和筛选,得到所述各个样本区域的候选通信数据;
对所述候选通信数据进行聚合,得到所述各个样本区域的多项候选通信评估数据;
计算各项候选通信评估数据对应的候选通信评估指标之间的相关性,根据所述相关性确定所述目标通信评估指标。
3.根据权利要求2所述的方法,其特征在于,所述计算各项候选通信评估数据对应的候选通信评估指标之间的相关性,根据所述相关性确定所述目标通信评估指标,包括:
获取所述样本区域集合中各项候选通信评估数据的最大值和最小值;
根据所述样本区域集合中各项候选通信评估数据的最大值和最小值对所述各个样本区域的各项候选通信评估数据进行归一化处理;
计算每个候选通信评估指标对应的归一化处理后的候选通信评估数据的均值和标准差;
根据所述均值和标准差计算所述每个候选通信评估指标与其他候选通信评估指标的相关性比例系数;
根据所述相关性比例系数与预设阈值的关系对所述候选通信评估指标进行过滤,得到所述目标通信评估指标。
4.根据权利要求3所述的方法,其特征在于,所述方法还包括:
根据各个样本区域归一化处理后的各项目标通信评估数据计算所述各个样本区域的各项目标通信评估数据的贡献度;
获取样本区域总数,根据所述样本区域总数和贡献度计算所述目标通信评估指标对应的熵值;
根据所述目标通信评估指标对应的熵值计算所述目标通信评估指标对应的差异系数,根据所述差异系数计算得到所述目标通信评估指标的权重。
5.根据权利要求1所述的方法,其特征在于,所述方法还包括:
将所述各项目标通信评估数据和预设标签库中的标签信息进行匹配;
根据匹配结果确定所述目标区域的目标标签;
向所述区域通信价值评估请求的发送端返回所述目标标签,以使所述发送端展示所述目标标签。
6.一种基于通信数据识别定位区域价值的装置,其特征在于,所述装置包括:
请求接收模块,用于接收区域通信价值评估请求,所述区域通信价值评估请求携带目标区域的区域标识;
目标通信评估数据获取模块,用于根据所述区域通信价值评估请求获取所述目标区域的目标通信评估数据集合,所述目标通信评估数据集合包括不同维度的多项目标通信评估数据,所述目标通信评估数据集合是根据通话数据、流量数据、应用数据和基站数据确定的;
分数计算模块还用于获取各项目标通信评估数据对应的目标通信评估指标的权重,根据所述各项目标通信评估数据和对应的所述目标通信评估指标的权重计算得到所述各项目标通信评估数据对应的分数,所述目标通信评估指标的权重是根据样本区域集合中样本区域的目标通信评估数据和样本区域总数确定的;所述分数计算模块还用于将相同维度的目标通信评估数据的分数累加,得到所述目标通信评估数据集合中各个维度的目标通信评估数据对应的分数;所述分数计算模块还用于获取所述各个维度的目标通信评估数据对应的权重,根据所述各个维度的目标通信评估数据对应的权重和各个维度的目标通信评估数据对应的分数计算得到所述目标区域的综合分数;
分数发送模块,用于向所述区域通信价值评估请求的发送端返回所述各个维度的目标通信评估数据对应的分数和所述综合分数,以使所述发送端展示所述各个维度的目标通信评估数据对应的分数和所述综合分数。
7.根据权利要求6所述的装置,其特征在于,所述装置还包括:
目标通信评估指标确定模块,用于获取所述样本区域集合,所述样本区域集合包括多个所述样本区域;获取各个样本区域的通信数据,所述通信数据包括通话数据、流量数据、应用数据和基站数据;对所述通信数据进行清洗和筛选,得到所述各个样本区域的候选通信数据;对所述候选通信数据进行聚合,得到所述各个样本区域的多项候选通信评估数据;计算各项候选通信评估数据对应的候选通信评估指标之间的相关性,根据所述相关性确定所述目标通信评估指标。
8.根据权利要求6所述的装置,其特征在于,所述装置还包括:
标签确定模块,用于将所述各项目标通信评估数据和预设标签库中的标签信息进行匹配;根据匹配结果确定所述目标区域的目标标签;向所述区域通信价值评估请求的发送端返回所述目标标签,以使所述发送端展示所述目标标签。
9.一种计算机设备,包括存储器和处理器,所述存储器存储有计算机程序,其特征在于,所述处理器执行所述计算机程序时实现权利要求1至5中任一项所述方法的步骤。
10.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现权利要求1至5中任一项所述的方法的步骤。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201911312738.0A CN111148018B (zh) | 2019-12-18 | 2019-12-18 | 基于通信数据识别定位区域价值的方法和装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201911312738.0A CN111148018B (zh) | 2019-12-18 | 2019-12-18 | 基于通信数据识别定位区域价值的方法和装置 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN111148018A true CN111148018A (zh) | 2020-05-12 |
CN111148018B CN111148018B (zh) | 2020-12-29 |
Family
ID=70518821
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201911312738.0A Active CN111148018B (zh) | 2019-12-18 | 2019-12-18 | 基于通信数据识别定位区域价值的方法和装置 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN111148018B (zh) |
Cited By (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN111614167A (zh) * | 2020-06-11 | 2020-09-01 | 郑州铁路职业技术学院 | 一种基于物联网的智能供配电管理*** |
CN111988734A (zh) * | 2020-08-28 | 2020-11-24 | 北京思特奇信息技术股份有限公司 | 基于热力图的区域营销方法及*** |
CN113473483A (zh) * | 2021-06-29 | 2021-10-01 | 航天海鹰机电技术研究院有限公司 | 一种全量用户的定位方法及*** |
CN113570238A (zh) * | 2021-07-26 | 2021-10-29 | 北京浩瀚深度信息技术股份有限公司 | 一种互联网质量指标评估方法以及质量优化方法及*** |
Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US7251806B2 (en) * | 2004-04-09 | 2007-07-31 | Synopsys, Inc. | Model-based two-dimensional interpretation filtering |
CN104299041A (zh) * | 2013-07-15 | 2015-01-21 | 北京鸿讯信盟通讯技术有限公司 | 一种基于信令的区域流量价值评估方法 |
CN106803192A (zh) * | 2017-01-17 | 2017-06-06 | 上海百林通信网络科技服务股份有限公司 | 一种房地产的环境和周围配套的影响评估方法 |
CN107403285A (zh) * | 2017-08-10 | 2017-11-28 | 南京坦道信息科技有限公司 | 基于最优分割法的运营商营销渠道价值评估方法 |
US20190242718A1 (en) * | 2018-02-02 | 2019-08-08 | Cory Rebecca Siskind | Generating safe routes for traffic using crime-related information |
-
2019
- 2019-12-18 CN CN201911312738.0A patent/CN111148018B/zh active Active
Patent Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US7251806B2 (en) * | 2004-04-09 | 2007-07-31 | Synopsys, Inc. | Model-based two-dimensional interpretation filtering |
CN104299041A (zh) * | 2013-07-15 | 2015-01-21 | 北京鸿讯信盟通讯技术有限公司 | 一种基于信令的区域流量价值评估方法 |
CN106803192A (zh) * | 2017-01-17 | 2017-06-06 | 上海百林通信网络科技服务股份有限公司 | 一种房地产的环境和周围配套的影响评估方法 |
CN107403285A (zh) * | 2017-08-10 | 2017-11-28 | 南京坦道信息科技有限公司 | 基于最优分割法的运营商营销渠道价值评估方法 |
US20190242718A1 (en) * | 2018-02-02 | 2019-08-08 | Cory Rebecca Siskind | Generating safe routes for traffic using crime-related information |
Cited By (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN111614167A (zh) * | 2020-06-11 | 2020-09-01 | 郑州铁路职业技术学院 | 一种基于物联网的智能供配电管理*** |
CN111988734A (zh) * | 2020-08-28 | 2020-11-24 | 北京思特奇信息技术股份有限公司 | 基于热力图的区域营销方法及*** |
CN113473483A (zh) * | 2021-06-29 | 2021-10-01 | 航天海鹰机电技术研究院有限公司 | 一种全量用户的定位方法及*** |
CN113473483B (zh) * | 2021-06-29 | 2024-05-14 | 航天海鹰机电技术研究院有限公司 | 一种全量用户的定位方法及*** |
CN113570238A (zh) * | 2021-07-26 | 2021-10-29 | 北京浩瀚深度信息技术股份有限公司 | 一种互联网质量指标评估方法以及质量优化方法及*** |
Also Published As
Publication number | Publication date |
---|---|
CN111148018B (zh) | 2020-12-29 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN111148018B (zh) | 基于通信数据识别定位区域价值的方法和装置 | |
CN108009915B (zh) | 一种欺诈用户社区的标记方法及相关装置 | |
CN109829020B (zh) | 地点资源数据推送方法、装置、计算机设备和存储介质 | |
EP3014904B1 (en) | Categorized location identification based on historical locations of a user device | |
KR20190139130A (ko) | 피셀 알고리즘을 이용하여 실시간 유동 인구 데이터의 제공이 가능한 유동인구 정보 분석 방법 | |
RU2527754C2 (ru) | Система генерирования статистической информации и способ генерирования статистической информации | |
US20130066814A1 (en) | System and Method for Automated Classification of Web pages and Domains | |
CN107885742B (zh) | 服务推荐方法和装置 | |
US20140372172A1 (en) | Method and computer system to forecast economic time series of a region and computer program thereof | |
CN105160173B (zh) | 安全评估方法和装置 | |
CN111080501B (zh) | 基于手机信令数据的真实人群密度时空分布估算方法 | |
JP2019533842A (ja) | 電子装置、小売店舗評価モデルを構築する方法、システム及び記憶媒体 | |
CN110298687B (zh) | 一种区域吸引力评估方法及设备 | |
Luca et al. | Modeling international mobility using roaming cell phone traces during COVID-19 pandemic | |
US10959041B1 (en) | Traffic analysis of mobile phones partitioned by geohash | |
Woods et al. | Exploring methods for mapping seasonal population changes using mobile phone data | |
CN111105064A (zh) | 确定欺诈事件的嫌疑信息的方法及装置 | |
JP2012054921A (ja) | 移動機分布算出システム及び移動機分布算出方法 | |
CN109635057B (zh) | 用电业务处理方法、装置、计算机设备和存储介质 | |
CN109919811A (zh) | 基于大数据的保险代理人培养方案生成方法及相关设备 | |
CN110399399A (zh) | 用户分析的方法、装置、电子设备和存储介质 | |
CN115208831B (zh) | 请求处理方法、装置、设备及存储介质 | |
CN116258500A (zh) | 风险预测方法、装置、设备及计算机可读存储介质 | |
CN112752252B (zh) | 小区归属地识别方法和装置 | |
CN111222897B (zh) | 基于客户上网满意度预测方法及装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |