CN111125510B - 一种精准营销obu用户车辆数据的获取方法及存储介质 - Google Patents
一种精准营销obu用户车辆数据的获取方法及存储介质 Download PDFInfo
- Publication number
- CN111125510B CN111125510B CN201911094847.XA CN201911094847A CN111125510B CN 111125510 B CN111125510 B CN 111125510B CN 201911094847 A CN201911094847 A CN 201911094847A CN 111125510 B CN111125510 B CN 111125510B
- Authority
- CN
- China
- Prior art keywords
- record
- vehicle
- license plate
- data
- record set
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000000034 method Methods 0.000 title claims abstract description 27
- 238000004422 calculation algorithm Methods 0.000 claims abstract description 13
- 230000001186 cumulative effect Effects 0.000 claims description 33
- 238000004590 computer program Methods 0.000 claims description 10
- 238000009825 accumulation Methods 0.000 claims description 7
- 230000004931 aggregating effect Effects 0.000 claims description 4
- 230000002776 aggregation Effects 0.000 claims description 3
- 238000004220 aggregation Methods 0.000 claims description 3
- 238000012216 screening Methods 0.000 claims description 2
- 230000006870 function Effects 0.000 description 8
- 238000007635 classification algorithm Methods 0.000 description 2
- 238000007418 data mining Methods 0.000 description 2
- 238000012545 processing Methods 0.000 description 2
- 230000002159 abnormal effect Effects 0.000 description 1
- 230000003190 augmentative effect Effects 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 230000003749 cleanliness Effects 0.000 description 1
- 230000006872 improvement Effects 0.000 description 1
- 238000012423 maintenance Methods 0.000 description 1
- 230000007246 mechanism Effects 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 230000006855 networking Effects 0.000 description 1
- 235000015097 nutrients Nutrition 0.000 description 1
- 230000035764 nutrition Effects 0.000 description 1
- 235000016709 nutrition Nutrition 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 238000012163 sequencing technique Methods 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/90—Details of database functions independent of the retrieved data types
- G06F16/95—Retrieval from the web
- G06F16/953—Querying, e.g. by the use of web search engines
- G06F16/9535—Search customisation based on user profiles and personalisation
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/20—Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
- G06F16/24—Querying
- G06F16/245—Query processing
- G06F16/2458—Special types of queries, e.g. statistical queries, fuzzy queries or distributed queries
- G06F16/2462—Approximate or statistical queries
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/20—Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
- G06F16/24—Querying
- G06F16/245—Query processing
- G06F16/2458—Special types of queries, e.g. statistical queries, fuzzy queries or distributed queries
- G06F16/2465—Query processing support for facilitating data mining operations in structured databases
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/20—Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
- G06F16/28—Databases characterised by their database models, e.g. relational or object models
- G06F16/284—Relational databases
- G06F16/285—Clustering or classification
-
- G—PHYSICS
- G07—CHECKING-DEVICES
- G07B—TICKET-ISSUING APPARATUS; FARE-REGISTERING APPARATUS; FRANKING APPARATUS
- G07B15/00—Arrangements or apparatus for collecting fares, tolls or entrance fees at one or more control points
- G07B15/06—Arrangements for road pricing or congestion charging of vehicles or vehicle users, e.g. automatic toll systems
Landscapes
- Engineering & Computer Science (AREA)
- Databases & Information Systems (AREA)
- Physics & Mathematics (AREA)
- Theoretical Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Data Mining & Analysis (AREA)
- General Engineering & Computer Science (AREA)
- Probability & Statistics with Applications (AREA)
- Mathematical Physics (AREA)
- Fuzzy Systems (AREA)
- Software Systems (AREA)
- Computational Linguistics (AREA)
- Business, Economics & Management (AREA)
- Finance (AREA)
- Devices For Checking Fares Or Tickets At Control Points (AREA)
- Traffic Control Systems (AREA)
Abstract
本发明公开了一种精准营销OBU用户车辆数据的获取方法及存储介质,包括:获取某省高速公路通行记录中符合预设要求的车辆通行数据;根据所述车辆通行数据,生成设定时间内行驶过全省高速公路的所有该省车牌车辆的记录集A和使用过ETC支付高速公路通行费的该省车牌车辆的记录集B;根据记录集A和记录集B,得到设定时间内行驶过全省高速公路的只使用现金及手机移动支付高速公路通行费的该省车牌车辆的记录集C;依据二八定律按照通行频度优先的遍历算法获取高频精准营销用户车辆数据。本发明依据二八定律挖掘出通行次数占了总体大部分的客户群,然后对通行次数占了总体大部分客户群进行精准营销电子标签OBU,能快速提升该省高速公路的ETC使用率。
Description
技术领域
本发明涉及ETC不停车电子收费***技术领域,具体涉及一种精准营销OBU用户车辆数据的获取方法及存储介质。
背景技术
现在全国各个省份都在通过各种渠道(全国各大银行的各省分行、地方银行、各省份联网收费清分机构的自营营业厅等等)来大力发展ETC不停车电子收费***电子标签(即OBU)的发行。但是,目前生产OBU电子标签的厂商存在着供货不足的情况,那么如何才能在现有供应的OBU电子标签基础上,快速地提高高速公路的ETC不停车电子收费***使用率,以尽快实现交通运输部对各省的目标要求,这是摆在广东省高速公路的联网收费的清分结算机构面前的一个难题。
发明内容
鉴于以上技术问题,本发明的目的在于提供一种精准营销OBU用户车辆数据的获取方法及存储介质,解决现有供应的OBU电子标签不足导致高速公路的ETC不停车电子收费***使用率低的问题。
本发明采用技术方案如下:
一种精准营销OBU用户车辆数据的获取方法,包括:
获取某省高速公路通行记录中符合预设要求的车辆通行数据;
根据所述车辆通行数据,生成设定时间内行驶过全省高速公路的所有该省车牌车辆的记录集A;
根据所述车辆通行数据,生成设定时间内行驶过全省高速公路的使用过ETC支付高速公路通行费的该省车牌车辆的记录集B;
根据记录集A和记录集B,得到设定时间内行驶过全省高速公路的只使用现金及手机移动支付高速公路通行费的该省车牌车辆的记录集C,所述记录集C为属于记录集A但不属于记录集B,且设定时间内通行次数大于1的数据的集合。
依据二八定律按照通行频度优先的遍历算法获取高频精准营销用户车辆数据。
进一步的,所述高频精准营销客户车辆数据分别是用户数量在5%左右且累积通行次数占比在35%左右、用户数量在10%左右且累积通行次数占比在50%左右、用户数量在20%左右且累积通行次数占比在80%左右。
进一步的,依据二八定律按照通行频度优先的遍历算法获取高频精准营销用户车辆数据步骤包括:
对设定时间内行驶过全省高速公路的只使用现金及手机移动支付高速公路通行费的该省车牌车辆的记录集C进行汇总统计,生成记录集C总体的通行次数all_sum_vehcount和总体通行费用all_sum_money;
按照通行频度TollLevel 进行聚合统计,并按照通行频度 TollLevel 降序排序,在每条记录前增加一个自动序列号(从1开始,依次加1)生成记录集D;
依次读取记录集D中的所有记录 D1,并对记录D1数据执行以下步骤:
读取 D1的通行频度TollLevel到变量 var_tolllevel,访问记录集D获取通行频度TollLevel小于等于 var_tolllevel的记录;
并根据累积通行次数占比ratio_sum_veh:= 累积通行次数part_sum_vehcount /总体的通行次数all_sum_vehcount,计算累积通行次数占比;
根据累积通行费用占比ratio_sum_money:= 累积通行费用part_sum_money /总体通行费用all_sum_money,计算累积通行费用占比;
将 D1 中所有字段信息、累积通行次数 part_sum_vehcount、累积通行费用part_sum_money、累积通行次数占比ratio_sum_veh和累积通行费用占比ratio_sum_money写入记录集 E中;
在记录集D中的所有记录都读取并处理完成后,打开记录集E,依次读取记录集E中的每条记录E1;
若记录E1数据满足累积用户数量占比为5%、10%、20%左右并且累积通行占比为30%、50%、80%左右,将记录E1数据输出到文件 Result.xls,并在文件 Result.xls中的该记录打上特殊颜色标记;若记录E1数据不满足累积用户数量占比为5%、10%、20%左右并且累积通行占比为30%、50%、80%左右,直接将记录E1输出到到文件Result.xls;
对文件Result.xls中打上特殊颜色标记的记录数据对应的车辆数据作为高频精准营销用户车辆数据。
进一步的,根据记录集A和记录集B,得到设定时间内行驶过全省高速公路的只使用现金及手机移动支付高速公路通行费的该省车牌车辆的记录集C的步骤包括:
依次读取记录集A中的所有记录A1;
判断记录A1是否属于记录集 B;
若记录A1不属于记录集 B,且记录A1数据的年通行次数大于1,则根据记录A1数据的通行次数,计算记录A1数据的对应的通行频度TollLevel,所述通行频度TollLevel =年通行次数/5,并将记录A1及生成的通行频度TollLevel,写入记录集C。
进一步的,生成设定时间内行驶过全省高速公路的使用过ETC支付高速公路通行费的该省车牌车辆的记录集B的步骤包括:
获取设定时间内行驶过全省高速公路的使用过ETC支付的记录集P;
依次从记录集P中读取所有记录 P1;
判断记录P1数据对应的车牌是否为该省车牌;
若记录P1对应的车牌为该省车牌,取出该工班该车辆的通行次数day_vehcount和通行金额day_money,对取出该工班该车辆的通行次数day_vehcount进行判断,若通行次数day_vehcount>=10;
根据P1中的工班日期,计算当前车辆在该月的通行次数、通行金额;
该月的通行次数month_vehcount:= day_vehcount的累计;
通行金额month_money:= day_money的累计;
将结果写入到记录集Q;
依次从P中读取其他记录,直到记录集 P 中的所有记录都处理完成;
对记录集 Q,剔除月通行次数大于300次的车辆记录,并且按照车牌统计每个车辆在一年期间的通行次数sum_vehcount 和通行金额sum_money ,将结果写入记录集B。
进一步的,获取设定时间内行驶过全省高速公路的使用过ETC支付的记录集P的步骤包括:
获取设定时间内行驶过全省高速公路的车辆通行数据,筛选出支付卡类开PayCardType 为22或者23 的数据,并且按照工班日期和出口车牌两个字段进行聚合,统计每个工班中每辆车的通行次数和通行金额,生成记录集P。
进一步的,生成设定时间内行驶过全省高速公路的所有该省车牌车辆的记录集A步骤包括:
对设定时间内省高速公路的车辆通行数据,按照工班日期和出口车牌两个字段进行聚合,统计每个工班中每辆车的通行次数和通行金额,生成记录集M;
依次从记录集M中读取所有记录 M1;
判断记录M1的车牌是否为该省车牌;
若记录M1对应的车牌是该省车牌,取出设定工班日期内该车牌对应车辆的通行次数day_vehcount和通行金额day_money,若设定工班时间内该车辆的通行次数day_vehcount>=10,根据记录M1中的设定工班日期,计算当前车辆在该月的通行次数、通行金额;将对应车牌为该省车牌的记录M1,以及对应车牌为该省车牌的记录M1的车辆在该月的通行次数和通行金额写入到记录集N;
将记录集 N中月通行次数大于300次的车辆记录的数据剔除后,作为记录集A。
进一步的,获取某省高速公路通行记录中符合预设要求的车辆通行数据的步骤包括:
获取某省高速公路通行记录中所有车辆通行数据;对高速公路通行记录中的车牌进行车牌合法性判断,将车牌判断为不合法的车辆通行数据剔除;
对高速公路通行记录中的车牌进行车牌合理性判断,将车牌判断为不合理的车辆通行数据剔除;若一个车牌照在某一工班日期通行次数大于或等于预设日通行次数或某一月通行次数数字大于或等于预设月通行次数,该车牌判定为不合理;
将高速公路通行记录中不选择现金支付、手机移动支付和ETC支付的通行记录,或出口车型不为1类至5类车车辆通行数据剔除。
进一步的,设定某省为广东省,对高速公路通行记录中的车牌进行车牌合法性判断包括:通过函数develop.F_ISVALID_YueJiYVEH 判断是否为合法的粤牌车辆。
一种计算机存储介质,其上存储有计算机程序,所述计算机程序被处理器执行时,实现所述的精准营销OBU用户车辆数据的获取方法。
相比现有技术,本发明的有益效果在于:
本发明通过获取只使用现金及手机移动支付高速公路通行费的车辆通行信息,并计算出各自的通行频度,对全部的通行频度进行数据挖掘算法中的分类算法分析,依据二八定律挖掘出通行次数占了总体大部分的客户群,然后对通行次数占了总体大部分客户群进行精准营销电子标签OBU,来快速提升省公路的ETC使用率。
附图说明
图1为本发明一种精准营销OBU用户车辆数据的获取方法的流程示意图;
图2为本发明实施例二中车牌合法性并且为粤牌的判断函数的流程示意图;
图3为本发明实施例二中生成一年中行驶过全省高速公路的所有粤牌车辆记录集A的流程示意图;
图4为本发明实施例二中生成一年中行驶过全省高速公路的使用过ETC支付的粤牌车辆记录集B的流程示意图;
图5为本发明实施例二中生成一年中行驶过全省高速公路的只使用现金及手机移动支付的粤牌车辆记录集C的流程示意图;
图6为本发明实施例二中依据二八定律按照通行频度优先的遍历算法获取高频精准营销用户车辆数据的流程示意图;
图7为本发明实施例二中只使用现金及手机移动支付的通行频度与累积用户数量/累积通行次数的函数图像。
具体实施方式
下面,结合附图以及具体实施方式,对本发明做进一步描述,需要说明的是,在不相冲突的前提下,以下描述的各实施例之间或各技术特征之间可以任意组合形成新的实施例。
实施例一:
请参考图1-7所示,一种精准营销OBU用户车辆数据的获取方法,如图1所示,包括:
步骤S1:获取某省高速公路通行记录中符合预设要求的车辆通行数据;
步骤S2:根据所述车辆通行数据,生成设定时间内行驶过全省高速公路的所有该省车牌车辆的记录集A;
步骤S3:根据所述车辆通行数据,生成设定时间内行驶过全省高速公路的使用过ETC支付高速公路通行费的该省车牌车辆的记录集B;
步骤S4:根据记录集A和记录集B,得到设定时间内行驶过全省高速公路的只使用现金及手机移动支付高速公路通行费的该省车牌车辆的记录集C,所述记录集C为属于记录集A但不属于记录集B,且设定时间内通行次数大于1的数据的集合。
步骤S5:依据二八定律按照通行频度优先的遍历算法获取高频精准营销用户车辆数据。
实施例二:
作为又一实施例,本具体实施例设定时间设定为取一年,以广东省为车辆通行数据为例,对本发明方法流程进行具体介绍。
一、高速公路通行记录中出口车牌的合法性判断算法、合理性判断规则以及车辆通行数据选择范围。
1、车牌合法性判断规则
因为高速公路车辆通行记录中的出口车牌有相当比例来自于车道的车牌识别设备,而车牌识别设备的准确率标准交通部设定为95%,但在实际中,车牌识别设备的准确率取决于车道的实际工作环境(包括天气、镜头的干净程度、还有设备商的维护情况),所以在实际中车牌识别率离95%会有较大的差距,所以必须对通行记录中的出口车牌进行合法性判断,如果不正确,则直接过滤掉该通行记录。本***中车牌合法性的判断函数F_ISVALID_YueJiYVEH对交通部营改增***正则表达式V1.1(20180409)进行了改进,增加了车辆是否是广东牌的判断,之所以这样处理,就是因为本次精准营销的车辆都是针对广东籍车辆,如图2所示,所以设计车牌合法性判断函数 F_ISVALID_YueJiYVEH 时,只有车牌中包含“粤”的广东籍车辆作为参数时,才会输出车牌合法值“0”,否则都输出“-1”。该判断函数根据以下交通部营改增***正则表达式V1.1(20180409)中得出。^([京津沪渝冀豫云辽黑湘皖鲁新苏浙赣鄂桂甘晋蒙陕吉闽贵粤青藏川宁琼使领A-Z0-9]{1}[A-Z0-9]{1}([京津沪渝桂蒙宁新藏冀晋辽吉黑苏浙皖赣闽鲁粤鄂湘豫川云贵陕甘青琼])?[A-NP-Z0-9]{1}[A-NP-Z0-9]{3}[A-NP-Z0-9挂学警港澳领试超外]{1}([A-NP-Z0-9外])?_(0|1|2|3|4|5|6|9))|([A-Z0-9]{7}_(0|1|2|3|4|5|6|9))$。
2、车牌合理性判断规则
因为高速公路收费车道的车牌识别设备发生故障时,有时会将识别车牌的结果一直设置为最近一次正确识别的车牌,所以会出现一个车牌照在某一工班日期,通行次数是一个比较大的数字。
若一个车牌照在某一工班日期通行次数大于或等于预设日通行次数或某一月通行次数数字大于或等于预设月通行次数,该车牌判定为不合理;根据统计与经验,在本***中设置一个工班日期(相当于一个自然日的周期)内,一辆车在高速公路的通行次数在10次以内(包含10次);一个月中一辆车在高速公路的通行次数在300次以内(包含300次)。
3、车辆通行数据选择范围(参与运算的车辆通行记录选取标准)
因为高速公路路段上传到广东联合电服公司的通行记录中,有不少异常记录,所以在处理时,只选择现金支付、手机移动支付、ETC支付的通行记录,并且出口车型为1类至5类车。
1、生成一年中行驶过全省高速公路的所有粤牌车辆记录集A;
具体的,请参照图3所示,对2018年8月至2019年7月期间广东省高速公路的车辆通行数据,按照(工班日期,出口车牌)两个字段进行聚合,统计每个工班中每辆车的通行次数和通行金额,该记录集为M;
从M中读取一条记录 M1;
判断M1的车牌是否为粤牌,
若M1对应的车牌是粤牌,取出该工班该车辆的通行次数day_vehcount和通行金额day_money;对取出该工班该车辆的通行次数day_vehcount进行判断,若通行次数day_vehcount>=10,
根据M1中的工班日期,计算当前车辆在该月的通行次数、通行金额;
该月的通行次数month_vehcount:= day_vehcount的累计;
month_money := day_money的累计;
由以下代码可得:month_vehcount := month_vehcount + dya_vehcount
month_money := day_money;
将结果写入到记录集N;
依次从M中读取其他记录,直到记录集 M 中的所有记录都处理完成;
对记录集 N,剔除掉月通行次数大于300次的车辆记录,并且按照车牌统计每个车辆在一年期间的通行次数sum_vehcount 和通行金额sum_money ,将结果写入记录集A。
具体的,可使用函数develop.F_ISVALID_YueJiYVEH 来判断是否为合法的粤牌车辆。
2、生成一年中行驶过全省高速公路的使用过ETC支付粤牌车辆记录集B;
具体的,请参照图4所示,对2018年8月至2019年7月期间广东省高速公路的车辆通行数据,筛选出支付卡类开PayCardType 为22或者23 的数据,并且按照(工班日期,出口车牌)两个字段进行聚合,统计每个工班中每辆车的通行次数和通行金额,该记录集为P;
从P 中读取一条记录 P1;
判断P1的车牌是否为粤牌;
若P1对应的车牌为粤牌,取出该工班该车辆的通行次数day_vehcount和通行金额day_money;对取出该工班该车辆的通行次数day_vehcount进行判断,若通行次数day_vehcount>=10;
根据P1中的工班日期,计算当前车辆在该月的通行次数、通行金额;
该月的通行次数month_vehcount:= day_vehcount的累计;该月的通行金额month_money := day_money的累计;
由以下代码可得:month_vehcount := month_vehcount + dya_vehcount
month_money := day_money;
将结果写入到记录集Q;
依次从P中读取其他记录,直到记录集 P 中的所有记录都处理完成;
对记录集 Q,剔除掉月通行次数大于300次的车辆记录,并且按照车牌统计每个车辆在一年期间的通行次数 sum_vehcount和通行金额 sum_money ,将结果写入记录集 B。
3、生成一年中行驶过全省高速公路的只使用现金及手机移动支付粤牌车辆记录集C;
首先生成记录集A-B,然后从中取出一年中通行次数大于1的记录集,则为C。
具体的,请参照图5所示,打开一年中行驶过全省高速公路的所有粤牌车辆记录集A、一年中行驶过全省高速公路的使用过ETC支付粤牌车辆记录集B;
从A 中读取一条记录 A1;
A1中的车牌中,是否有记录集 B中存在;
若存在,则继续从A中读取其他记录;
若不存在,根据A1的通行次数,计算对应的通行频度TollLevel,所述通行频度TollLevel =通行次数/5;
将年通行次数大于1的A1及其生成的通行频度TollLevel,写入记录集C;
直到记录集 A中的所有记录都处理完成,输出记录集C。
4、依托二八定律进行频度优先的遍历算法进行精准营销对象数据获取的算法流程;
因为在对现金及手机移动支付车辆进行精准营销OBU时,优先营销的是通行频度越高的车辆,所以在对数据源处理时,按照通行频度进行了降序排列,就保证了通行频度高的车辆被优先遍历。
再者,进行精准营销时,我们依托二八定律,制定了几个高频精准营销集合,分别是用户数量在5%左右且累积通行次数占比在35%左右、用户数量在10%左右且累积通行次数占比在50%左右、用户数量在20%左右且累积通行次数占比在80%左右。
具体的,请参照图6所示,对一年中行驶过全省高速公路的现金及手机移动支付粤牌车辆结果集C进行汇总统计,生成总体的通行次数all_sum_vehcount和总体通行费用all_sum_money;
对一年中行驶过全省高速公路的现金及手机移动支付粤牌车辆记录集C,按照通行频度TollLevel 进行聚合统计,并按照通行频度 TollLevel 降序排序,在每条记录前增加一个自动序列号(从1开始,依次加1)生成记录集D;
从记录集D中读取一条记录 D1;
读取 D1的通行频度TollLevel到变量 var_tolllevel,访问记录集D获取通行频度TollLevel小于等于 var_tolllevel的记录,计算累积通行次数 part_sum_vehcount和累积通行费用 part_sum_money,然后计算累积通行次数占比、累积通行费用占比。
累积通行次数占比ratio_sum_veh := 累积通行次数part_sum_vehcount /总体的通行次数all_sum_vehcount;
累积通行费用占比ratio_sum_money := 累积通行费用part_sum_money /总体通行费用all_sum_money;
将 D1 中所有字段信息,再加上累积通行次数part_sum_vehcount和累积通行费用 part_sum_money,然后计算累积通行次数占比ratio_sum_veh、累积通行费用占比ratio_sum_money ,写入记录集 E中。
继续从记录集D中读取下一条记录,并执行上述步骤写入记录集E中,直到记录集D中的所有记录都处理完成;
打开记录集E,读取一条记录E1;
若E1数据满足累积用户数量占比为5%、10%、20%左右并且累积通行占比为30%、50%、80%左右,将E1数据输出到文件 Result.xls,并对当前记录打上特殊颜色标记;
若E1数据不满足累积用户数量占比为5%、10%、20%左右并且累积通行占比为30%、50%、80%左右,直接将E1输出到到文件 Result.xls;
继续执行上述步骤,直到记录集E中的所有记录都处理完成。
四、通过本发明的方法实施后的结果输出如下:
1、对1300多万车辆按照不同通行频度进行分类聚合的结果如表1;
表1:1300多万车辆按照不同通行频度的分类聚合结果
序号 | 通行频率 | 车辆数 | 通行次数 | 累积用户数量 | 累积通行次数 | 累积用户数量占比 | 累积通行次数占比 |
1 | 509 | 1 | 2548 | 1 | 2548 | 0.00% | 0.00% |
2 | 491 | 1 | 2458 | 2 | 5006 | 0.00% | 0.00% |
3 | 488 | 1 | 2443 | 3 | 7449 | 0.00% | 0.00% |
4 | 483 | 1 | 2419 | 4 | 9868 | 0.00% | 0.00% |
5 | 477 | 2 | 4775 | 6 | 14643 | 0.00% | 0.00% |
… | |||||||
391 | 32 | 29010 | 4699128 | 700576 | 217137201 | 5.11% | 40.81% |
392 | 31 | 31031 | 4871206 | 731607 | 222008407 | 5.33% | 41.73% |
393 | 30 | 33122 | 5033696 | 764729 | 227042103 | 5.58% | 42.67% |
… | |||||||
404 | 19 | 78298 | 7591869 | 1347167 | 295781036 | 9.82% | 55.59% |
405 | 18 | 86167 | 7923057 | 1433334 | 303704093 | 10.45% | 57.08% |
406 | 17 | 94391 | 8208134 | 1527725 | 311912227 | 11.14% | 58.62% |
… | |||||||
413 | 10 | 228795 | 11882675 | 2634808 | 383179642 | 19.21% | 72.02% |
414 | 9 | 270971 | 12715844 | 2905779 | 395895486 | 21.19% | 74.41% |
415 | 8 | 321617 | 13483855 | 3227396 | 409379341 | 23.53% | 76.94% |
… | |||||||
422 | 1 | 2353238 | 15914603 | 10323213 | 522852281 | 75.28% | 98.27% |
423 | 0 | 3390485 | 9217309 | 13713698 | 532069590 | 100.00% | 100.00% |
合计 | 13713698 | 532069590 |
2、1300多万车辆只使用现金及手机移动支付的车辆序号(通行频度)与累积用户数量/累积通行次数的函数图像如图7所示,以序号为横轴,累积占比为纵轴,“累积用户数量占比”和“累积通行次数占比”的函数图像。
从图7可以看出,在序号小于200以前,“累积用户数量占比”和“累积通行次数占比”接近于0 ;而当序号在介于200和320之间时,“累积用户数量占比”缓慢上升不到1%而“累积通行次数占比”则接近10% ,二者之间的缺口迅速拉开。
当序号为392(通行频度为31)时,“累积用户数量占比”为5.33%(数量为731607),“累积通行次数占比”为41.73% ,达到2.22亿次。
当序号为405(通行频度为18)时,“累积用户数量占比”为10.45%(数量为1433334),“累积通行次数占比”为57.08% ,达到3.04亿次。
当序号为414(通行频度为9)时,“累积用户数量占比”为21.19%(数量为2905779),“累积通行次数占比”为74.41% ,达到3.96亿次。
参照广东省高速一年中车辆的通行次数在18亿次左右,所以只要能够精准营销以上为数不多的车辆,可以提高全省ETC使用率12%至22% 。
因此本次营销的客户对象就是通行频度大于等于9的2905779个车辆。具体分为三个阶段进行精准营销,即通行频度大于等于31的731607个车辆、通行频度在[18,31) 的701727个车辆、通行频度在在[9,18)的1472445个车辆。
依托管理学二八定律,采用本发明方法,对2018年8月至2019年7月一年期间通行于广东省高速公路的18亿条通行记录进行算法处理,生成了一年期间通行次数大于1次,从不使用ETC,只使用现金及手机移动支付高速公路通行费的1300多万车辆通行信息,并计算出各自的通行频度,对全部的通行频度进行数据挖掘算法中的分类算法分析,最终挖掘出占总体客户比例5.33%、10.45%和 21.19%的三个客户群,但他们对应的通行次数却占了总体的 41.73%、57.08% 和 74.41% ,通过对这三个客户群进行精准营销OBU,来快速提升广东省公路的ETC使用率。
本发明还提供一种计算机存储介质,其上存储有计算机程序,本发明的方法如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在该计算机存储介质中。基于这样的理解,本发明实现上述实施例方法中的全部或部分流程,也可以通过计算机程序来指令相关的硬件来完成,所述的计算机程序可存储于一计算机存储介质中,该计算机程序在被处理器执行时,可实现上述各个方法实施例的步骤。其中,所述计算机程序包括计算机程序代码,所述计算机程序代码可以为源代码形式、对象代码形式、可执行文件或某些中间形式等。所述计算机存储介质可以包括:能够携带所述计算机程序代码的任何实体或装置、记录介质、U盘、移动硬盘、磁碟、光盘、计算机存储器、只读存储器(ROM,Read-OnlyMemory)、随机存取存储器(RAM,Random Access Memory)、电载波信号、电信信号以及软件分发介质等。需要说明的是,所述计算机存储介质包含的内容可以根据司法管辖区内立法和专利实践的要求进行适当的增减,例如在某些司法管辖区,根据立法和专利实践,计算机存储介质不包括电载波信号和电信信号。
对本领域的技术人员来说,可根据以上描述的技术方案以及构思,做出其它各种相应的改变以及形变,而所有的这些改变以及形变都应该属于本发明权利要求的保护范围之内。
Claims (7)
1.一种精准营销OBU用户车辆数据的获取方法,其特征在于,包括:
获取某省高速公路通行记录中符合预设要求的车辆通行数据;
根据所述车辆通行数据,生成设定时间内行驶过全省高速公路的所有该省车牌车辆的记录集A;
根据所述车辆通行数据,生成设定时间内行驶过全省高速公路的使用过ETC支付高速公路通行费的该省车牌车辆的记录集B;
根据记录集A和记录集B,得到设定时间内行驶过全省高速公路的只使用现金及手机移动支付高速公路通行费的该省车牌车辆的记录集C,所述记录集C为属于记录集A但不属于记录集B,且设定时间内通行次数大于1的数据的集合;
依据二八定律按照通行频度优先的遍历算法获取高频精准营销用户车辆数据;
所述高频精准营销用户车辆数据分别是用户数量在5%左右且累积通行次数占比在35%左右、用户数量在10%左右且累积通行次数占比在50%左右、用户数量在20%左右且累积通行次数占比在80%左右;
根据所述依据二八定律按照通行频度优先的遍历算法获取高频精准营销用户车辆数据步骤包括:
对设定时间内行驶过全省高速公路的只使用现金及手机移动支付高速公路通行费的该省车牌车辆的记录集C进行汇总统计,生成记录集C总体的通行次数all_sum_vehcount和总体通行费用all_sum_money;按照通行频度TollLevel进行聚合统计,并按照通行频度TollLevel降序排序,在每条记录前增加一个自动序列号,从1开始,依次加1,生成记录集D;
依次读取记录集D中的所有记录D1,并对记录D1数据执行以下步骤:读取D1的通行频度TollLevel到变量var_tolllevel,访问记录集D获取通行频度TollLevel小于等于var_tolllevel的记录;
并根据累积通行次数占比ratio_sum_veh:=累积通行次数part_sum_vehcount/总体的通行次数all_sum_vehcount,计算累积通行次数占比;
根据累积通行费用占比ratio_sum_money:=累积通行费用part_sum_money/总体通行费用all_sum_money,计算累积通行费用占比;
将D1中所有字段信息、累积通行次数part_sum_vehcount、累积通行费用part_sum_money、累积通行次数占比ratio_sum_veh和累积通行费用占比ratio_sum_money写入记录集E中;
在记录集D中的所有记录都读取并处理完成后,打开记录集E,依次读取记录集E中的每条记录E1;
若记录E1数据满足累积用户数量占比为5%、10%、20%左右并且累积通行占比为30%、50%、80%左右,将记录E1数据输出到文件Result.xls,并在文件Result.xls中的该记录打上特殊颜色标记;若记录E1数据不满足累积用户数量占比为5%、10%、20%左右并且累积通行占比为30%、50%、80%左右,直接将记录E1输出到文件Result.xls;
对文件Result.xls中打上特殊颜色标记的记录数据对应的车辆数据作为高频精准营销用户车辆数据。
2.根据权利要求1所述的精准营销OBU用户车辆数据的获取方法,其特征在于,根据记录集A和记录集B,得到设定时间内行驶过全省高速公路的只使用现金及手机移动支付高速公路通行费的该省车牌车辆的记录集C的步骤包括:
依次读取记录集A中的所有记录A1;
判断记录A1是否属于记录集B;
若记录A1不属于记录集B,且记录A1数据的年通行次数大于1,则根据记录A1数据的通行次数,计算记录A1数据的对应的通行频度TollLevel,所述通行频度TollLevel=年通行次数/5,并将记录A1及生成的通行频度TollLevel,写入记录集C。
3.根据权利要求1所述的精准营销OBU用户车辆数据的获取方法,其特征在于,生成设定时间内行驶过全省高速公路的使用过ETC支付高速公路通行费的该省车牌车辆的记录集B的步骤包括:
获取设定时间内行驶过全省高速公路的使用过ETC支付的记录集P;依次从记录集P中读取所有记录P1;
判断记录P1数据对应的车牌是否为该省车牌;
若记录P1对应的车牌为该省车牌,取出对应工班该车辆的通行次数day_vehcount和通行金额day_money,对取出对应工班该车辆的通行次数day_vehcount进行判断,若通行次数day_vehcount>=10;
根据P1中的工班日期,计算当前车辆在当月的通行次数、通行金额;当月的通行次数month_vehcount:=day_vehcount的累计;
通行金额month_money:=day_money的累计;
将结果写入到记录集Q;
依次从P中读取其他记录,直到记录集P中的所有记录都处理完成;对记录集Q,剔除月通行次数大于300次的车辆记录,并且按照车牌统计每个车辆在一年期间的通行次数sum_vehcount和通行金额sum_money,将结果写入记录集B。
4.根据权利要求3所述的精准营销OBU用户车辆数据的获取方法,其特征在于,获取设定时间内行驶过全省高速公路的使用过ETC支付的记录集P的步骤包括:
获取设定时间内行驶过全省高速公路的车辆通行数据,筛选出支付卡类开PayCardType为22或者23的数据,并且按照工班日期和出口车牌两个字段进行聚合,统计每个工班中每辆车的通行次数和通行金额,生成记录集P。
5.根据权利要求1所述的精准营销OBU用户车辆数据的获取方法,其特征在于,生成设定时间内行驶过全省高速公路的所有该省车牌车辆的记录集A步骤包括:
对设定时间内省高速公路的车辆通行数据,按照工班日期和出口车牌两个字段进行聚合,统计每个工班中每辆车的通行次数和通行金额,生成记录集M;
依次从记录集M中读取所有记录M1;
判断记录M1的车牌是否为该省车牌;
若记录M1对应的车牌是该省车牌,取出设定工班日期内该车牌对应车辆的通行次数day_vehcount和通行金额day_money,若设定工班时间内该车辆的通行次数day_vehcount>=10,根据记录M1中的设定工班日期,计算当前车辆在当月的通行次数、通行金额;将对应车牌为该省车牌的记录M1,以及对应车牌为该省车牌的记录M1的车辆在当月的通行次数和通行金额写入到记录集N;
将记录集N中月通行次数大于300次的车辆记录的数据剔除后,作为记录集A。
6.根据权利要求1所述的精准营销OBU用户车辆数据的获取方法,其特征在于,获取某省高速公路通行记录中符合预设要求的车辆通行数据的步骤包括:
获取某省高速公路通行记录中所有车辆通行数据;对高速公路通行记录中的车牌进行车牌合法性判断,将车牌判断为不合法的车辆通行数据剔除;
以车牌中包含“粤”的广东籍车辆作为参数时,输出车牌合法值“0”,否则都输出“-1”;
对高速公路通行记录中的车牌进行车牌合理性判断,将车牌判断为不合理的车辆通行数据剔除;若一个车牌照在某一工班日期通行次数大于或等于预设日通行次数或某一月通行次数数字大于或等于预设月通行次数,该车牌判定为不合理;
将高速公路通行记录中不选择现金支付、手机移动支付和ETC支付的通行记录,或出口车型不为1类至5类车车辆通行数据剔除。
7.一种计算机存储介质,其上存储有计算机程序,其特征在于,所述计算机程序被处理器执行时,实现如权利要求1-6任一项所述的精准营销OBU用户车辆数据的获取方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201911094847.XA CN111125510B (zh) | 2019-11-11 | 2019-11-11 | 一种精准营销obu用户车辆数据的获取方法及存储介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201911094847.XA CN111125510B (zh) | 2019-11-11 | 2019-11-11 | 一种精准营销obu用户车辆数据的获取方法及存储介质 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN111125510A CN111125510A (zh) | 2020-05-08 |
CN111125510B true CN111125510B (zh) | 2023-12-22 |
Family
ID=70495207
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201911094847.XA Active CN111125510B (zh) | 2019-11-11 | 2019-11-11 | 一种精准营销obu用户车辆数据的获取方法及存储介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN111125510B (zh) |
Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN105610940A (zh) * | 2015-12-29 | 2016-05-25 | 山东易构软件技术股份有限公司 | 高速公路大数据参数状态名单全路网下发*** |
CN106652065A (zh) * | 2016-12-30 | 2017-05-10 | 广东联合电子服务股份有限公司 | 一种获取车型不符obu的方法和*** |
CN108256923A (zh) * | 2018-01-30 | 2018-07-06 | 长安大学 | 一种基于车辆通行特征的etc客户细分方法 |
CN110083638A (zh) * | 2019-04-24 | 2019-08-02 | 广东联合电子服务股份有限公司 | 一种滞留规则库构建方法及数据滞留分析方法 |
CN110111435A (zh) * | 2019-05-17 | 2019-08-09 | 深圳成谷科技有限公司 | 提高高速公路通行效率的收费方法及收费*** |
CN110164134A (zh) * | 2018-02-12 | 2019-08-23 | 华为技术有限公司 | 信息处理的方法和装置 |
Family Cites Families (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US7685158B2 (en) * | 2004-06-15 | 2010-03-23 | Honda Motor Co., Ltd. | System and method for managing an on-board entertainment system |
-
2019
- 2019-11-11 CN CN201911094847.XA patent/CN111125510B/zh active Active
Patent Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN105610940A (zh) * | 2015-12-29 | 2016-05-25 | 山东易构软件技术股份有限公司 | 高速公路大数据参数状态名单全路网下发*** |
CN106652065A (zh) * | 2016-12-30 | 2017-05-10 | 广东联合电子服务股份有限公司 | 一种获取车型不符obu的方法和*** |
CN108256923A (zh) * | 2018-01-30 | 2018-07-06 | 长安大学 | 一种基于车辆通行特征的etc客户细分方法 |
CN110164134A (zh) * | 2018-02-12 | 2019-08-23 | 华为技术有限公司 | 信息处理的方法和装置 |
CN110083638A (zh) * | 2019-04-24 | 2019-08-02 | 广东联合电子服务股份有限公司 | 一种滞留规则库构建方法及数据滞留分析方法 |
CN110111435A (zh) * | 2019-05-17 | 2019-08-09 | 深圳成谷科技有限公司 | 提高高速公路通行效率的收费方法及收费*** |
Also Published As
Publication number | Publication date |
---|---|
CN111125510A (zh) | 2020-05-08 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN108090823B (zh) | 基于SaaS的账务数据管理*** | |
CN104715416A (zh) | 一种委贷信托业务管理的方法及*** | |
CN102081781A (zh) | 基于信息自循环的金融建模优化方法 | |
CN111046184A (zh) | 文本的风险识别方法、装置、服务器和存储介质 | |
CN109325845A (zh) | 一种金融产品智能推荐方法及*** | |
CN108305409A (zh) | 一种针对路内停车欠费的追缴方法及*** | |
CN116681450B (zh) | 一种支撑智能催费的客户信用评价方法及*** | |
CN116229594A (zh) | 一种基于高速公路的车辆收费监测方法、设备及介质 | |
CN106875185A (zh) | 一种风控模型训练方法及装置 | |
CN112634048A (zh) | 一种反洗钱模型的训练方法及装置 | |
CN112037049A (zh) | 银行卡收费方法及装置 | |
CN111125510B (zh) | 一种精准营销obu用户车辆数据的获取方法及存储介质 | |
CN112541752A (zh) | 车辆租赁平台的费用处理方法、装置、计算机设备及介质 | |
CN117252719A (zh) | 一种适用于企业的财务会计管理*** | |
CN108647952A (zh) | 一种电子支付对账方法和装置 | |
CN112967410A (zh) | 一种基于最长公共子序列的偷逃通行费车辆识别方法 | |
CN112001723A (zh) | 一种etc通行费的付款方法及*** | |
CN103761573A (zh) | 实现内部交易业务进行对账关联的方法及装置 | |
CN111126966A (zh) | 票据审核方法、装置、计算机设备和计算机可读存储介质 | |
CN113159789A (zh) | 一种跨行转账退汇记账方法和装置 | |
CN112001722A (zh) | 一种etc通行费的付款方法及*** | |
CN111178992A (zh) | 一种电子票据票源发放方法及*** | |
CN113888110B (zh) | 一种基于大数据的审计信息化处理***及方法 | |
CN111832999A (zh) | 一种项目化企业管理*** | |
CN104182896A (zh) | 一种微观税收分析***及方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |