CN114707506A - 快递进入派件站点的分拣方法、***及可读存储介质 - Google Patents

快递进入派件站点的分拣方法、***及可读存储介质 Download PDF

Info

Publication number
CN114707506A
CN114707506A CN202210287185.3A CN202210287185A CN114707506A CN 114707506 A CN114707506 A CN 114707506A CN 202210287185 A CN202210287185 A CN 202210287185A CN 114707506 A CN114707506 A CN 114707506A
Authority
CN
China
Prior art keywords
dispatch
delivery
area
address
express
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202210287185.3A
Other languages
English (en)
Inventor
王豹
徐梦佳
杨周龙
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Dongpu Software Co Ltd
Original Assignee
Dongpu Software Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Dongpu Software Co Ltd filed Critical Dongpu Software Co Ltd
Priority to CN202210287185.3A priority Critical patent/CN114707506A/zh
Publication of CN114707506A publication Critical patent/CN114707506A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • G06F40/279Recognition of textual entities
    • G06F40/289Phrasal analysis, e.g. finite state techniques or chunking
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/24Querying
    • G06F16/245Query processing
    • G06F16/2458Special types of queries, e.g. statistical queries, fuzzy queries or distributed queries
    • G06F16/2462Approximate or statistical queries
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/24Querying
    • G06F16/245Query processing
    • G06F16/2458Special types of queries, e.g. statistical queries, fuzzy queries or distributed queries
    • G06F16/2477Temporal data queries
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/28Databases characterised by their database models, e.g. relational or object models
    • G06F16/284Relational databases
    • G06F16/285Clustering or classification
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/28Databases characterised by their database models, e.g. relational or object models
    • G06F16/284Relational databases
    • G06F16/288Entity relationship models
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/29Geographical information databases
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/951Indexing; Web crawling techniques
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • G06F40/279Recognition of textual entities
    • G06F40/284Lexical analysis, e.g. tokenisation or collocates
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • G06F40/279Recognition of textual entities
    • G06F40/289Phrasal analysis, e.g. finite state techniques or chunking
    • G06F40/295Named entity recognition
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/045Combinations of networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/049Temporal neural networks, e.g. delay elements, oscillating neurons or pulsed inputs
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Databases & Information Systems (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • Computational Linguistics (AREA)
  • Artificial Intelligence (AREA)
  • Health & Medical Sciences (AREA)
  • General Health & Medical Sciences (AREA)
  • Software Systems (AREA)
  • Mathematical Physics (AREA)
  • Biophysics (AREA)
  • Computing Systems (AREA)
  • Molecular Biology (AREA)
  • Evolutionary Computation (AREA)
  • Biomedical Technology (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Probability & Statistics with Applications (AREA)
  • Fuzzy Systems (AREA)
  • Remote Sensing (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明属于物流运输领域,具体公开了一种快递进入派件站点的分拣方法、***及可读存储介质。所述的分拣方法通过把各个派件站点所覆盖的服务地区划分成多个派件区域,再结合分词处理技术和关键词提取技术的应用,将从快递订单中提取的派件地址与派件区域进行匹配,然后确定派件区域所属的派件站点,最后在快递进入派件站点内时,按照派件区域对快递进行分拣,这避免了站内的二次分拣,解决了由此导致的高成本、高耗时等问题,并且节省了派件员的时间和精力,为派件员的工作提供了巨大的便利。

Description

快递进入派件站点的分拣方法、***及可读存储介质
技术领域
本发明涉及物流运输领域,具体涉及一种快递进入派件站点的分拣方法、***及可读存储介质。
背景技术
快递在物流运输过程中往往会辗转多个快递站点,在最终由派件员进行统一派送前,需要先进入末端的派件站点内。派件站点所覆盖的服务范围较广,一般小则十几平方公里,大则上百平方公里。所以快递到了派件站点后,常常还需要进行站内的二次分拣,并且此项针对二次分拣的工作不仅具有成本高、耗时长等不足,在人工分拣过程中还难以避免出现分拣错误等问题。
在快递进行派送的过程中,派件员仅根据单号无法快速定位自己所配送的具体区域,容易导致在派件范围内多次往返同一具体区域的问题,给派件员带来较大不便。
发明内容
为了解决上述技术问题,本发明的目的之一在于提供一种快递进入派件站点的分拣方法,具体的,包括以下步骤:
把各个派件站点所覆盖的服务地区划分成多个派件区域;
基于快递订单获取快递的派件地址,对快递的派件地址进行分词处理;
利用派件区域数据***对分词处理后的派件地址进行识别,匹配派件地址所属的派件区域;
在快递进入适配的派件站点内时,按照派件区域对快递进行分拣。
进一步的,把各个派件站点所覆盖的服务地区划分成多个派件区域,具体步骤包括:
S101.根据派件员的行驶轨迹数据,确定初始派件区域;
S102.基于地图供应商的底层路网数据,用地理围栏形式表示出每个派件区域。
所述把各个派件站点所覆盖的服务地区划分成多个派件区域具体步骤包括:
根据派件员的行驶轨迹数据,确定初始派件区域;
基于地图供应商的底层路网数据,用不同的地理围栏形式表示出每个派件区域。
所述用不同的地理围栏形式表示出每个派件区域进一步包括:
在初始派件区域找到满足预设条件的若干POI核心点,POI核心点包含名称、类别、坐标、分类在内的信息;
给每一POI核心点添加围栏,表示出每个派件区域:给每一POI核心点添加围栏,表示出每个派件区域:其具体为:
创建每一POI核心点为一个中心点坐标fenceClient.setActivateAction(GeoFenceClient.GEOFENCE_IN);
按照预设半径值添加圆形围栏,形成一适配的派件区域,建立所述派件区域与派件员标识的适配关系,预设半径值为初始派件区域进行距离若干等划分后确认;
同步触发快递员地图上绘示所述该些POI核心点组成的各个圆形围栏,并且实时监听围栏状态回调,以便获知该快递员进入该圆形围栏中确认进入所述适配派件区域。
进一步的,所述分词处理,具体步骤包括:
S201.基于地址字典对待处理的派件地址进行分词匹配;
S202.遇到地址字典无法匹配的新词时,采用模型进行处理。
进一步的,地址字典是通过统计年鉴和行政区划,并根据网络爬虫技术获取商铺、小区、楼宇等地址信息得到的。
进一步的,采用模型进行处理,具体为使用BILSTM+Bert+CRF技术。
进一步的,根据历史派件地址数据确定每个派件区域的地址集合,再对各个地址集合内的历史派件地址数据进行准确的分词处理,然后提取其中的关键词所得到的地址关键词集合。
所述采用模型进行处理具体包括:
设置BERT及中文模型;
启动服务,发送请求获取BERT词嵌入信息;
通过bert-base macan训练NER模型,发送请求获取实体解析结果;
使用bert_base做NER训练数据;
启动命名实体识别识别任务的服务。
进一步的,确定派件区域所匹配的派件站点,具体步骤包括:
S401.将派件区域和派件员进行绑定;
S402.根据派件员和派件站点间已有的绑定关系进一步确定出每个派件区域所属的派件站点。
进一步的,派件区域是指物流派件***中最小的派件单元。
本发明的目的之二在于提供一种快递进入派件站点的分拣***,具体的,包括:
分区模块,用于把各个派件站点所覆盖的服务地区划分成多个派件区域;
分词模块,用于基于快递订单获取快递的派件地址,对快递的派件地址进行分词处理;
匹配模块:利用派件区域数据***对分词处理后的派件地址进行识别,匹配派件地址所属的派件区域;
分拣模块:在快递进入匹配的派件站点内时,按照派件区域对快递进行分拣。
本发明的目的之三在于提供一种可读存储介质,其上存储有计算机程序,具体的,计算机程序被处理器执行时实现上述分拣方法的步骤。
采用上述技术方案后,与现有技术相比,本发明的有益之处在于:首先,在根据历史派件地址数据,确定每个派件区域的地址集合之后,对于每个派件区域的地址集合,对该地址集合内的历史派件地址数据进行准确分词处理;基于分词处理后的历史派件地址数据,提取历史派件地址数据的关键词;将提取的关键词与该地址集合所对应的派件区域,建立关联关系。建立该关联关系之后,在进行分单时,可通过对待分配的订单的地址进行分词处理,确定该地址所关联的派件区域。本发明提供了更加精准的针对地址的分词处理技术和关键词提取技术。通过入站时对快递按派件区域进行分拣,避免了站内的二次分拣,解决了由此导致的高成本、高耗时等问题。并且由于派件员与派件区域的绑定,更有利于派件员知晓自己的送货区域,简化了其查看快递地址的流程,提高了快递派送速度,节省了派件员的时间和精力,为派件员的工作提供了巨大的便利。
接着,基于路网数据,确定派件区域的地理围栏,以及每个历史派件地址数据的地理编码;根据地理编码和地理围栏,确定每个历史派件地址数据所属的派件区域。
附图说明
图1为快递进入派件站点的分拣方法的原理步骤示意图;
图2为快递进入派件站点的分拣方法的示例步骤示意图;
图3为一种快递进入派件站点的分拣方法的分拣***。
具体实施方式
下面通过实施例和附图,对本发明进行进一步详细说明,应当理解,此处所描述的具体实施例仅用以解释本发明,并不用于限定本发明,本领域技术人员应该理解的是,在不偏离本发明的结构思路、使用范围下可以对本发明技术方案的细节和形式进行修改或替换,但这些修改和替换均在本发明的保护范围内。
本发明提供了一种快递进入派件站点的分拣方法、***及可读存储介质,其中分拣方法的步骤示意图如附图1所示,具体处理过程如下:
S110:把各个派件站点所覆盖的服务地区划分成多个派件区域;
若物流平台设置的分拣服务器来处理该流程,分拣服务器可以按照快递员为主体进行划分派件区域。比如快递员(快递员终端,简称快递员终端)的历史轨迹信息作为初始派件区域,每一派件站点将其所管辖的快递员的初始派件区域在地图上进行显示,若有不同快递员的初始派件区域重合,则删除其中重合部分或平分初始派件区域重合部分后,重新定义快递员的初始派件区域,使得派件站点所覆盖的服务地区被其匹配下属快递员的初始派件区域完全覆盖。同理,当某一派件站点所覆盖的服务地区存在空白,则将空白区域指定后其中一递员的初始派件区域。本发明的第一实例是可以获得当前派件站点所属的各个派件员(或称派件员终端)的一定周期内的行驶轨迹数据,按照各个派件员历史行驶轨迹数据、最小派件区域的地理范围信息等考量因子划分派件区域。
分拣服务器还可以按照派件站点为主体进行划分派件区域。分拣服务器将把各个派件站点所覆盖的服务地区划分成多个派件区域。以上海为例,分拣服务器可以将上海的每个的派件站点所覆盖的服务地区划分成多个派件区域,每一派件区域以符合某种要求的商铺,小区,楼宇为规则进行划分。
本发明第二种实例可以采用LBS技术来实现。基于位置的服务(LocationBasedServices,LBS),是利用各类型的定位技术来获取定位设备当前的所在位置,通过移动互联网向定位设备提供信息资源和基础服务。首先用户可利用定位技术确定自身的空间位置,随后用户便可通过移动互联网来获取与位置相关资源和信息。最底层的主要是由百度地图、高德地图、腾讯地图等地图厂商提供基础的位置信息能力,各个App通过接入或调用地图服务接口可以获知当前派件站点所在的位置信息,以该站点为中心对周边进行网格化处理后,再考虑每周期内的平均送件量、最小送件地理范围等考量因子划分派件区域。
本发明的第三实例是按照POI来进行划分派件区域。
POI是“PointofInterest”的缩写,中文可以翻译为“兴趣点”。在地理信息***中,一个POI可以是一栋房子、一个商铺、一个学校、一个工厂等。POI包含四方面信息,名称、类别、坐标、分类。高德地图等提供了海量的POI信息数据,例如上海407W+POI,一个长宁区就包含了18W。通过高德提供的POI接口数据或者将数据爬取下来。
各个App通过接入或调用地图服务接口可以获知当前派件站点所在的位置信息,以该站点为中心对周边按照考量因子(如某一距离内)依次确认若干POI点,每个POI点为圆心确认某一半径组成的圆或某一边长的正方形等预设形形状所属地理范围为派件区域。
给每一POI核心点添加围栏,表示出每个派件区域:其具体为:
创建每一POI核心点为一个中心点坐标fenceClient.setActivateAction(GeoFenceClient.GEOFENCE_IN);
按照预设半径值添加圆形围栏,形成一适配的派件区域,建立所述派件区域与派件员标识的适配关系,预设半径值为初始派件区域进行距离若干等划分后确认;比如,将该区域按照其地理位置及送件数量,将其分成N等分,则将该快递员的初始派件区域分为N个派件区域,每一派件区域找一送件量最大的POI核心点。
同步触发快递员地图上绘示所述该些POI核心点组成的各个圆形围栏,并且实时监听围栏状态回调,以便获知该快递员进入该圆形围栏中确认进入所述适配派件区域。
以上仅为派件区域划分方案进行举例,还有很多种其它方案,不再赘述。
S120:基于快递订单获取快递的派件地址,对快递的派件地址进行分词处理。
当分拣服务器对各个当前的快递订单进行分单时,通常是某一时间点(如早晨等)进行批量分分单处理。
分拣服务器可以先根据历史派件地址数据,确定步骤S110确认的每个派件区域的地址集合之后,对于每个派件区域的地址集合,对该地址集合内的历史派件地址数据进行分词处理。
基于分词处理后的历史派件地址数据,提取历史派件地址数据的关键词;将提取的关键词与该地址集合所对应的派件区域,建立关联关系。
建立该关联关系之后,在进行分单时,可通过对待分配的订单的地址进行分词处理,确定该地址所关联的派件区域。例如“上海市青浦区盈港东路6679弄”这个地址,利用数据挖掘算法可提取“盈港东路6679弄”关键词。提取关键词之后,便可把关键词和区域进行关联。
在上述过程中,可以使用字典地址库进行地址数据的匹配,地址字典可以从统计年鉴和行政区划得到,并且通过爬虫技术获取商铺,小区,楼宇等地址信息,提高中文分词的准确率。并通过BILSTM+Bert+CRF技术实现地址新词的发现。训练预料使用收集的地址及对应的地址词语,这将进一步提高地址的识别率。命名实体识别(Named EntityRecognition,NER)是自然语言处理的基础技术,常常用于信息提取,在对话***中用于槽位提取。根据需要提取的实体,主要有两个实现思路:规则和模型。基于规则的方法主要是正则和词典。其优点是便于修改更新,确定性强;正则需要编写大量规则,词典则需要收集大量同义词。正则适用于结构比较清晰的实体,例如时间日期等。而词典则适用于专用词汇,例如一卡通等。基于模型的方法,经典结构是BiLSTM+CRF。其优点是泛化能力强。为了更快速地实现一个实体提取器,提高***易用性,我们可以采用迁移学习的思想,在先验知识的基础上进行模型训练。下面将介绍采用BERT做embedding,结合BiLSTM+CRF实现的NER。BERT Embedding+BiLSTM+CRF是指使用BERT预训练模型做embedding,可以将大量语义信息迁移过来。为了实现结构分层,Embedding层设置为不可变。构造一个小样本数据集,训练后布署。
S130:对分词处理后的派件地址进行识别,匹配派件地址所属的派件区域。
例如,派件地址为“上海市青浦区盈港东路6679弄”这个地址,则识别出“盈港东路6679弄”,找到其地址所属的派件区域。
S140:确定派件区域所属的派件站点;
预先保存的派件区域与派件站点的匹配关系,则通过确认的派件区域即可获得其所在的派件站点。
S150:在快递进入派件站点内时,按照派件区域对快递进行分拣。
把各个派件站点所覆盖的服务地区划分成多个派件区域,根据历史派件地址数据确定每个派件区域的地址集合,再对各个地址集合内的历史派件地址数据进行准确的分词处理,然后提取其中的关键词,得到每个派件区域的地址关键词集合。基于快递订单获取快递的派件地址,对快递的派件地址进行分词处理,对分词处理后的派件地址进行识别,匹配派件地址所属的派件区域,确定派件区域所属的派件站点,在快递进入派件站点内时,按照派件区域对快递进行分拣。
实施例2
请参阅图2,本实例可以利用地理围栏技术进行站点快递的分拣。
上面提到POI是兴趣点,即核心点的概念。实际在产品召回或者LBS营销应用时,会从更大范围的区域进行,即通过多边形的方式,将POI周围的区域圈定起来,就像打篱笆围栏。地理围栏(Geo-fencing)是LBS的一种新应用,就是用一个虚拟的栅栏围出一个虚拟地理边界。当手机进入、离开某个特定地理区域,或在该区域内活动时,手机可以接收自动通知和警告。有了地理围栏技术,分拣服务器就可以帮助用户在进入某一地区时自动登记。
找到站点所在的位置信息及历史站点所在的地理区域信息。
找到该地理区域信息中的核心点。比如,找到该地理区域信息的小区、商铺点、大厦等投递点信息,再考虑其各个投递点信息的历史快递数据等考虑因子,找到某一距离信息范围内的考虑因子大(或某一阈值范围内)的投递点作为核心点,再设置添加围栏添加方式确认添加围栏。
比如1.添加围栏((圆形围栏,多边形围栏,POI行政区划检索围栏,POI圆形区域检索围栏,行政区域围栏)多种添加围栏添加方式。)
Figure BDA0003560364570000091
2.监听围栏状态回调
Figure BDA0003560364570000092
Figure BDA0003560364570000101
3.在地图上绘制围栏
Figure BDA0003560364570000102
以上仅是一种举例,并非限定。基于地图供应商(百度地图、高德地图、腾讯地图、搜狗地图等)的底层路网数据,用地理围栏形式表示出每个派件区域,即为矢量图,作为物流基础的派件单元。地理围栏(Geo-fencing)是LBS的一种新应用,就是用一个虚拟的栅栏围出一个虚拟地理边界。当手机进入、离开某个特定地理区域,或在该区域内活动时,手机可以接收自动通知和警告。有了地理围栏技术,位置社交网站就可以帮助用户在进入某一地区时自动登记。在地理围栏中,有几个核心点,区别于普通的LBS,地理区域是被网格化的。网格化的标准是根据一个地理区域内的业务和商业聚类的,而不是纯粹的经纬度和城市地图的匹配。实际上地理围栏的各个围栏的区隔是一个个的应用需求群地图。主要的商业需求聚集在特定区域,形成的一个聚合信息服务区域。终端(主要是指快递员手机终端)自己或者在网络帮助下能够识别所处的围栏。终端的围栏信息彼此之间能够共享,也能够与应用开发商分享,双向、互动是关键。
根据派件员的行驶轨迹数据,确定初始派件区域;基于地图供应商的底层路网数据,用不同地理围栏形式表示出每个派件区域。在初始派件区域找到满足预设条件的若干POI核心点,POI核心点包含名称、类别、坐标、分类在内的信息;给每一POI核心点添加围栏,表示出每个派件区域。预设条件可以为某一网格距离内找到一POI核心点。或者超过某一送件数值为一POI核心点。添加围栏主要是添加形状等。虽然,不同地理围栏形式表示出每个派件区域,但是该些地理围栏需组成一完整的初始派件区域。
根据历史派件地址数据确定每个派件区域的地址集合,再对各个地址集合内的历史派件地址数据进行准确的分词处理,然后提取其中的关键词,得到各个派件区域的地址关键词集合。
通过快递订单获取快递的派件地址,对快递的派件地址进行分词处理:先基于地址字典对待处理的派件地址进行分词匹配,遇到地址字典无法匹配的新词时,采用模型进行处理。对分词处理后的派件地址进行识别处理,匹配派件地址所属的派件区域。
将派件区域和派件员进行绑定。然后根据派件员和派件站点间已有的的绑定关系进一步确定出每个派件区域所属的派件站点。在快递进入派件站点内时,按照派件区域对快递进行分拣。
在快递订单中获取快递的派件地址,对快递的派件地址进行分词处理:先通过统计年鉴和行政区划,并根据网络爬虫技术获取商铺、小区、楼宇等地址信息,得到地址字典,基于地址字典对待处理的派件地址进行分词匹配;遇到地址字典无法匹配的新词时,采用BILSTM+Bert+CRF技术进行处理。其具体包括:
设置BERT及中文模型;
启动服务,发送请求获取BERT word embeding;
通过bert-base macan训练NER模型,发送请求获取实体解析结果;
使用bert_base,做NER训练数据
1)、命令及参数:
bert-base-ner-train\
-data_dir{your dataset dir}\
-output_dir{training output dir}\
-init_checkpoint{Google BERT model dir}\
-bert_config_file{bert_config.json under the Google BERT model dir}\
-vocab_file{vocab.txt under the Google BERT model dir}
2)、标签定义
["O","B-PER","I-PER","B-ORG","I-ORG","B-LOC","I-LOC","B-TIM","I_TIM","X","[CLS]","[SEP]"]
B表示实体开端单字,I表示实体后续字,O表示非实体内容PER表示人员,ORG表示机构,LOC表示位置,TIM表示时间"X",“[CLS]”,“[SEP]”是附加的,[CLS]”,"[SEP]"是句子的开始和结束标志,X是wordpice产生的东西,中文先不用关注。
3)、训练数据格式:
其中data_dir是数据所在的目录,训练数据,验证数据和测试数据命名格式为:train.txt,dev.txt,test.txt,请按照这个格式命名文件,否则会报错。训练数据的格式如下示例:
海O
钓O
比O
赛O
地O
点O
在O
厦B-LOC
门I-LOC
与O
金B-LOC
门I-LOC
之O
间O的O
海O
域O
。O
每行得第一个是字,第二个是它的标签,使用空格’'分隔,请一定要使用空格。句与句之间使用空行划分。程序会自动读取你的数据。
output_dir:训练模型输出的文件路径,模型的checkpoint以及一些标签映射表都会存储在这里,这个路径在作为服务的时候,可以指定为-ner_model_dirinit_checkpoint:下载的谷歌BERT模型bert_config_file:谷歌BERT模型下面的bert_config.json vocab_file:谷歌BERT模型下面的vocab.txt训练完成后,指定的output_dir中查看训练结果。
4)、启动命名实体识别任务的服务,
服务的命名是:bert-base-serving-start。
这种处理方式,对地址的识别的精准性很高,大大降低识别不出来的情况。
根据历史派件地址数据确定每个派件区域的地址关键词集合,具体步骤包括:
(1)生成与订单相对应的订单信息码,在订单数据库中存储与订单信息码相关联的派件地址数据,当接收到派件终端通过订单信息码触发的扫码送达请求时,确定用于触发扫码送达请求的订单信息码,从订单数据库中查询与该订单信息码相关联的派件地址数据,确定派件终端触发扫码送达请求时所对应的送达地址数据。
(2)基于路网数据,确定派件区域的地理围栏,以及每个历史派件地址数据的地理编码;根据地理编码和地理围栏,确定每个历史派件地址数据所属的派件区域;其中,属于同一个派件区域的历史派件地址数据,构成该派件区域的地址集合,再结合分词处理技术和关键词提取技术,得到各个派件区域的关键词集合。
确认每个派件区域的地址关键词集合后,就能够确认待分配的快递订单的派件地址属于哪个集合,即可以匹配出派件地址所属的派件区域。
确定每个派件区域所对应的派件员信息并将派件区域和派件员进行绑定,然后根据派件员和派件站点的绑定关系进一步确定出每个派件区域所属的派件站点。
在快递进入派件站点内时,按照派件区域对快递进行分拣。
实施例3
本实施例提供一种运用上述实施例提供的一种快递进入派件站点的分拣方法的分拣***,请参阅图3,该分拣***包括分区模块11、分词模块12、匹配模块13、定点模块14、分拣模块15;其中,
分区模块11:把各个派件站点所覆盖的服务地区划分成多个派件区域;
分词模块12:基于快递订单获取快递的派件地址,对快递的派件地址进行分词处理;
匹配模块13:利用派件区域数据***对分词处理后的派件地址进行识别,匹配派件地址所属的派件区域;
分拣模块14:在快递进入适配的派件站点内时,按照派件区域对快递进行分拣。
需要说明的是,本发明的另一实施例还提供了一种计算机可读存储介质。
该计算机可读存储介质可以为非易失性计算机可读存储介质,该计算机可读存储介质也可以为易失性计算机可读存储介质。该计算机可读存储介质中存储有指令,当该指令在计算机上运行时,使得计算机执行实施例一中的快递进入派件站点的分拣方法的步骤。
快递进入派件站点的分拣方法的如果以程序指令的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本实施例的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的全部或部分可以以软件的形式体现出来,该计算机软件存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本公开各个实施例所述方法的全部或部分步骤。而前述的存储介质包括:U盘、移动硬盘、只读存储器(Read-onlymemory,ROM)、随机存取存储器(Random access memory,RAM)、磁碟或者光盘等各种可以存储程序代码的介质。
所属领域的技术人员可以清楚地了解到,为描述得方便和简洁,上述描述的***及设备的具体执行的识别内容,可以参考前述方法实施例中的对应过程。
以上所述仅为本发明的较佳实施例,并不用以限制本发明,凡在本发明的精神和原则之内,所作的任何修改、等同替换、改进等均应包含在本发明的保护范围之内。

Claims (10)

1.一种快递进入派件站点的分拣方法,其特征在于,包括以下步骤:
把各个派件站点所覆盖的服务地区划分成多个派件区域;
基于快递订单获取快递的派件地址,对快递的派件地址进行分词处理;
对分词处理后的派件地址进行识别,匹配派件地址所属的派件区域;
在快递进入适配的派件站点内时,按照派件区域对快递进行分拣。
2.根据权利要求1所述的分拣方法,其特征在于,所述把各个派件站点所覆盖的服务地区划分成多个派件区域具体步骤包括:
根据派件员的行驶轨迹数据,确定初始派件区域;
基于地图供应商的底层路网数据,用不同的地理围栏形式表示出每个派件区域。
3.根据权利要求1所述的分拣方法,其特征在于,所述用不同的地理围栏形式表示出每个派件区域进一步包括:
在初始派件区域找到满足预设条件的若干POI核心点,POI核心点包含名称、类别、坐标、分类在内的信息;
给每一POI核心点添加围栏,表示出每个派件区域:其具体为:
创建每一POI核心点为一个中心点坐标;
按照预设半径值添加圆形围栏,形成一适配的派件区域,建立所述派件区域与派件员标识的适配关系,预设半径值为初始派件区域进行距离若干等划分后确认;
同步触发快递员地图上绘示所述该些POI核心点组成的各个圆形围栏,并且实时监听围栏状态回调,以便获知该快递员进入该圆形围栏中确认进入所述适配派件区域。
4.根据权利要求1所述的分拣方法,其特征在于,所述对快递的派件地址进行分词处理具体步骤包括:
基于地址字典对待处理的派件地址进行分词匹配遇到地址字典无法匹配的新词时,采用模型进行处理,所述地址字典是通过统计年鉴和行政区划,并根据网络爬虫技术获取商铺、小区、楼宇在内的地址信息得到的。
5.根据权利要求3所述的分拣方法,其特征在于,所述采用模型进行处理具体包括:
设置BERT及中文模型;
启动服务,发送请求获取BERT词嵌入信息;
通过bert-base macan训练NER模型,发送请求获取实体解析结果;
使用bert_base做NER训练数据;
启动命名实体识别任务的服务。
6.根据权利要求1所述的分拣方法,其特征在于,所述根据历史派件地址数据确定每个派件区域的地址集合,再对各个地址集合内的历史派件地址数据进行准确的分词处理,然后提取其中的关键词所得到的地址关键词集合。
7.根据权利要求1所述的分拣方法,其特征在于,所述在快递进入适配的派件站点内时,还包括:
将派件区域和派件员进行绑定;
根据派件员和派件站点间已有的绑定关系进一步确定出每个派件区域所属的派件站点为其适配的派件站点。
8.根据权利要求1所述的分拣方法,其特征在于,所述把各个派件站点所覆盖的服务地区划分成多个派件区域具体包括:
各个App通过接入或调用地图服务接口获知当前派件站点所在的位置信息;
以该站点为中心对周边按照包括距离和/或周期时间快速单量在内的考量因子依次确认若干POI点;
每个POI点为圆心确认预设形状所属地理范围为一派件区域。
9.一种运用权利要求1至8任一项所述的分拣方法的分拣***,其特征在于,包括:
分区模块,用于把各个派件站点所覆盖的服务地区划分成多个派件区域;
分词模块,用于基于快递订单获取快递的派件地址,对快递的派件地址进行分词处理;
匹配模块,用于对分词处理后的派件地址进行识别,匹配派件地址所属的派件区域;
分拣模块,用于在快递进入适配的派件站点内时,按照派件区域对快递进行分拣。
10.一种可读存储介质,其上存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现如权利要求1至8任一项所述的步骤。
CN202210287185.3A 2022-03-23 2022-03-23 快递进入派件站点的分拣方法、***及可读存储介质 Pending CN114707506A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202210287185.3A CN114707506A (zh) 2022-03-23 2022-03-23 快递进入派件站点的分拣方法、***及可读存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202210287185.3A CN114707506A (zh) 2022-03-23 2022-03-23 快递进入派件站点的分拣方法、***及可读存储介质

Publications (1)

Publication Number Publication Date
CN114707506A true CN114707506A (zh) 2022-07-05

Family

ID=82169543

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202210287185.3A Pending CN114707506A (zh) 2022-03-23 2022-03-23 快递进入派件站点的分拣方法、***及可读存储介质

Country Status (1)

Country Link
CN (1) CN114707506A (zh)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN116029704A (zh) * 2023-03-27 2023-04-28 浙江虎哥数字科技有限公司 可回收物品的回收方法、***以及介质
CN117829704A (zh) * 2024-01-08 2024-04-05 江苏科技大学 无人值守物流驿站的包裹管理方法及包裹管理***

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN116029704A (zh) * 2023-03-27 2023-04-28 浙江虎哥数字科技有限公司 可回收物品的回收方法、***以及介质
CN117829704A (zh) * 2024-01-08 2024-04-05 江苏科技大学 无人值守物流驿站的包裹管理方法及包裹管理***

Similar Documents

Publication Publication Date Title
WO2020228706A1 (zh) 基于围栏地址的坐标数据处理方法、装置和计算机设备
CN105677793B (zh) 地点数据库的建立和候选乘车地点的推荐方法及装置
US9551586B2 (en) System and method for providing contextual information for a location
CN112398895B (zh) 提供服务信息的方法及装置
CN106897919A (zh) 用车类型预测模型建立、信息提供方法及装置
CN107124695A (zh) 基于联系人信息来标注被访问的位置的方法和***
CN114707506A (zh) 快递进入派件站点的分拣方法、***及可读存储介质
US20110246404A1 (en) Method for Allocating Trip Sharing
EP2549233A2 (en) Method of operating a navigation system to provide geographic location information
US11966424B2 (en) Method and apparatus for dividing region, storage medium, and electronic device
WO2012172160A1 (en) Method and apparatus for resolving geo-identity
CN104160440A (zh) 使用基于位置的语言建模的自动输入信号识别
CN111427983A (zh) 基于地理信息检索的服务方法、***、设备及存储介质
CN102589556B (zh) 实时导航***中有效操作环境的方法与***
CN111861296A (zh) 一种揽件任务分配方法、装置、揽件***、设备及介质
US20230049839A1 (en) Question Answering Method for Query Information, and Related Apparatus
CN111782741A (zh) 兴趣点挖掘方法、装置、电子设备及存储介质
JP2007219655A (ja) 施設情報管理システム、施設情報管理方法および施設情報管理プログラム
Yuan et al. Recognition of functional areas based on call detail records and point of interest data
CN113722580A (zh) 地址信息处理方法、装置、电子设备和计算机可读介质
CN112948714A (zh) 一种餐厅推荐的方法及装置
US20210311971A1 (en) Geocoding methods and systems of correcting latitude and longitude of a point of interest
US11694554B2 (en) Information processing apparatus, information processing method, and information processing system
CN114970990A (zh) 一种商旅推荐方法、设备及介质
CN114153897A (zh) 用电结构化地址级联搜索方法、***、装置及存储介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination