CN112052673A - 物流网点识别方法、装置、计算机设备和存储介质 - Google Patents
物流网点识别方法、装置、计算机设备和存储介质 Download PDFInfo
- Publication number
- CN112052673A CN112052673A CN202010888602.0A CN202010888602A CN112052673A CN 112052673 A CN112052673 A CN 112052673A CN 202010888602 A CN202010888602 A CN 202010888602A CN 112052673 A CN112052673 A CN 112052673A
- Authority
- CN
- China
- Prior art keywords
- target
- text
- sequence
- word
- logistics network
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 title claims abstract description 70
- 238000003860 storage Methods 0.000 title claims abstract description 15
- 239000013598 vector Substances 0.000 claims abstract description 329
- 238000011176 pooling Methods 0.000 claims abstract description 78
- 230000011218 segmentation Effects 0.000 claims abstract description 54
- 230000004927 fusion Effects 0.000 claims abstract description 23
- 238000012549 training Methods 0.000 claims description 59
- 238000001914 filtration Methods 0.000 claims description 23
- 230000015654 memory Effects 0.000 claims description 18
- 238000004590 computer program Methods 0.000 claims description 14
- 238000012216 screening Methods 0.000 claims description 8
- 230000008569 process Effects 0.000 description 20
- 238000012545 processing Methods 0.000 description 12
- 238000010586 diagram Methods 0.000 description 7
- 238000005457 optimization Methods 0.000 description 7
- 238000010606 normalization Methods 0.000 description 6
- 238000007781 pre-processing Methods 0.000 description 6
- 238000004364 calculation method Methods 0.000 description 5
- 230000002457 bidirectional effect Effects 0.000 description 4
- 238000009826 distribution Methods 0.000 description 3
- 230000006870 function Effects 0.000 description 3
- 210000002569 neuron Anatomy 0.000 description 3
- 230000009849 deactivation Effects 0.000 description 2
- 238000002372 labelling Methods 0.000 description 2
- 210000004027 cell Anatomy 0.000 description 1
- 230000008859 change Effects 0.000 description 1
- 238000004140 cleaning Methods 0.000 description 1
- 238000010219 correlation analysis Methods 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 230000000415 inactivating effect Effects 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 230000009467 reduction Effects 0.000 description 1
- 230000006403 short-term memory Effects 0.000 description 1
- 238000004904 shortening Methods 0.000 description 1
- 230000003068 static effect Effects 0.000 description 1
- 230000001360 synchronised effect Effects 0.000 description 1
- 238000012360 testing method Methods 0.000 description 1
- 230000001960 triggered effect Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/20—Natural language analysis
- G06F40/279—Recognition of textual entities
- G06F40/284—Lexical analysis, e.g. tokenisation or collocates
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Health & Medical Sciences (AREA)
- Artificial Intelligence (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Computational Linguistics (AREA)
- General Health & Medical Sciences (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
本申请涉及一种物流网点识别方法、装置、计算机设备和存储介质。该方法包括:获取目标地址文本;对目标地址文本进行地址分词得到包括分级词与相应词级的目标文本序列;通过已训练好的物流网点识别模型,根据目标文本序列中的分级词与词级确定目标地址文本对应的第一目标向量序列,对第一目标向量序列进行特征融合得到第二目标向量序列,根据第二目标向量序列得到最大池化特征向量序列、平均池化特征向量序列与权重特征向量序列,根据最大池化特征向量序列、平均池化特征向量序列与权重特征向量序列,确定每个候选物流网点的置信度;根据每个候选物流网点的置信度确定目标地址文本对应的目标物流网点。采用本方法能够提高物流网点识别准确性。
Description
技术领域
本申请涉及物流技术领域,特别是涉及一种物流网点识别方法、装置、计算机设备和存储介质。
背景技术
在完整的物流配送体系中,物流网点是快递员派件到户的起始点与上门取件的结束点。从客户下单开始,在整个物流配送周期中,将快递包裹准确地分配到收件地址附件的物流网点,是实现快递员派件到户的关键一环,而将快递包裹准确地分配到发件地址附件的物流网点,是实现快递员上门取件的关键一环。由此,如何基于快递包裹的地址文本确定收发该快递包裹的物流网点,也即如何确定地址文本对应的物流网点,是值得关注的问题。
目前,通常是基于规则匹配的方式确定地址文本对应的物流网点。但是,该种物流网点识别方式,需要建立并维护词典与规则,且受限于词典与规则的覆盖面与更新速率,存在物流网点的识别准确性低的问题。
发明内容
基于此,有必要针对上述技术问题,提供一种能够提高物流网点的识别准确性的物流网点识别方法、装置、计算机设备和存储介质。
一种物流网点识别方法,所述方法包括:
获取目标地址文本;
对所述目标地址文本进行地址分词得到分词后的目标文本序列;所述目标文本序列包括分级词与每个分级词对应的词级;
通过已训练好的物流网点识别模型,根据所述目标文本序列中的分级词与词级确定所述目标地址文本对应的第一目标向量序列,对所述第一目标向量序列进行特征融合得到第二目标向量序列,根据所述第二目标向量序列得到相应的最大池化特征向量序列、平均池化特征向量序列与权重特征向量序列,根据所述最大池化特征向量序列、所述平均池化特征向量序列与所述权重特征向量序列,确定预配置的每个候选物流网点对应的置信度;
根据所述每个候选物流网点对应的置信度确定所述目标地址文本对应的目标物流网点。
一种物流网点识别装置,所述装置包括:
获取模块,用于获取目标地址文本;
分词模块,用于对所述目标地址文本进行地址分词得到分词后的目标文本序列;所述目标文本序列包括分级词与每个分级词对应的词级;
预测模块,用于通过已训练好的物流网点识别模型,根据所述目标文本序列中的分级词与词级确定所述目标地址文本对应的第一目标向量序列,对所述第一目标向量序列进行特征融合得到第二目标向量序列,根据所述第二目标向量序列得到相应的最大池化特征向量序列、平均池化特征向量序列与权重特征向量序列,根据所述最大池化特征向量序列、所述平均池化特征向量序列与所述权重特征向量序列,确定预配置的每个候选物流网点对应的置信度;
识别模块,用于根据所述每个候选物流网点对应的置信度确定所述目标地址文本对应的目标物流网点。
一种计算机设备,包括存储器和处理器,所述存储器存储有计算机程序,所述处理器执行所述计算机程序时实现上述方法实施例中的步骤。
一种计算机可读存储介质,其上存储有计算机程序,所述计算机程序被处理器执行时实现上述方法实施例中的步骤。
上述物流网点识别方法、装置、计算机设备和存储介质,对待识别的目标地址文本进行地址分词,得到包括相应分级词与每个分级词对应的词级的目标文本序列,通过已训练好的物流网点识别模型,根据该目标文本序列中的各分级词与相应词级,确定目标地址文本对应的第一目标向量序列,对该第一目标向量序列进行特征融合得到相应的第二目标向量序列,根据该第二目标向量序列得到相应的最大池化特征向量序列、平均池化特征向量序列与权重特征向量序列,并根据该最大池化特征向量序列、平均池化特征向量序列与权重特征向量序列,确定预配置的每个候选物流网点对应的置信度,能够提高各候选物流网点的置信度的预测效率与准确性,也即能够快速而准确的得到每个候选物流网点对应的置信度。进一步地,根据各候选物流网点对应的置信度,能够快速而准确地从预配置的候选物流网点中筛选目标地址文本对应的目标物流网点,从而能够在保证物流网点识别效率的情况下,提高物流网点的识别准确性。
附图说明
图1为一个实施例中物流网点识别方法的应用环境图;
图2为一个实施例中物流网点识别方法的流程示意图;
图3为另一个实施例中物流网点识别方法的流程示意图;
图4为一个实施例中物流网点识别方法的原理示意图;
图5为一个实施例中物流网点识别装置的结构框图;
图6为一个实施例中计算机设备的内部结构图。
具体实施方式
为了使本申请的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,对本申请进行进一步详细说明。应当理解,此处描述的具体实施例仅仅用以解释本申请,并不用于限定本申请。
本申请提供的物流网点识别方法,可以应用于如图1所示的应用环境中。其中,终端102通过网络与服务器104进行通信。服务器104获取目标地址文本,对该目标地址文本进行地址分词得到包括分级词与相应词级的目标文本序列,通过已训练好的物流网点识别模型,根据该目标文本序列中的分级词与词级确定目标地址文本对应的第一目标向量序列,对该第一目标向量序列进行特征融合得到第二目标向量序列,根据该第二目标向量序列得到相应的最大池化特征向量序列、平均池化特征向量序列与权重特征向量序列,根据该最大池化特征向量序列、平均池化特征向量序列与权重特征向量序列,确定预配置的每个候选物流网点对应的置信度,并根据各候选物流网点对应的置信度从预配置的候选物流网点中筛选目标地址文本对应的目标物流网点。其中,终端102可以但不限于是各种个人计算机、笔记本电脑、智能手机、平板电脑和便携式可穿戴设备,服务器104可以用独立的服务器或者是多个服务器组成的服务器集群来实现。
在一个实施例中,如图2所示,提供了一种物流网点识别方法,以该方法应用于图1中的服务器为例进行说明,包括以下步骤:
步骤202,获取目标地址文本。
其中,目标地址文本是指待识别物流网点的地址文本。目标地址文本也可理解为目标地址数据。举例说明,目标地址文本为:广东省深圳市龙华区工业路先跟创业园5栋A304。
在一个实施例中,服务器接收终端发送的物流网点识别请求,并解析该物流网点识别请求得到相应的目标地址文本。
在一个实施例中,当满足物流网点识别条件时,服务器从预配置的收派件运单地址库中获取待识别物流网点的目标地址文本。物流网点识别条件是用于触发物流网点识别操作的条件或依据,具体可以是接收到终端发送的物流网点识别指令,或者,自前一次触发物流网点识别操作起达到预设时长,在此不作具体具体限定。终端根据用户的物流网点识别触发操作生成物流网点识别指令,并将该物流网点识别指令发送至服务器。预设时长可自定义,比如1小时。
在一个实施例中,服务器获取待识别物流网点的初始地址文本,并对该初始地址文本进行规范化处理得到相应的目标地址文本。其中,规范化处理包括但不限于是清洗无效非法字符、数字英文标准化、地址任命标准化、繁转简、去重补全、括号内容处理与后缀处理等。举例说明,初始地址文本为:广东深圳龙华龙华工业路先跟创业园五栋a304,对该初始地址文本进行规范化处理后得到的目标地址文本为:广东省深圳市龙华区工业路先跟创业园5栋A304。
在一个实施例中,服务器调用预配置的地址规范化***对初始地址文本进行规范化处理,得到相应的目标地址文本。
步骤204,对目标地址文本进行地址分词得到分词后的目标文本序列;目标文本序列包括分级词与每个分级词对应的词级。
其中,对目标地址文本进行地址分词,是指对目标地址文本按照预配置的地址层级进行分词,以将该目标地址文本划分为多个分级词,并确定每个分级词对应的词级。词级与地址层级一一对应,每个分级词所表征的地址或区域属于相应词级所对应的地址层级,比如“省”这一地址层级对应的词级为“1”,还比如“广东省”这一分级词所表征的地址或区域属于“省”这一地址层级。
在一个实施例中,针对地址文本预配置有省、市、区、街道、道路、道路编号、园区、楼栋、单元、房号等18个地址层级,每个地址层级对应一个词级,也即针对地址文本预配置有1至18共18个词级,由此,基于该预配置的地址层级,能够实现对目标地址文本的18级分词,得到该目标地址文本对应的分级词,以及每个分级词对应的词级。
具体地,服务器对所获取到的目标地址文本进行地址分词,得到该目标地址文本对应的分级词,以及每个分级词对应的词级,并根据该目标地址文本对应的分级词与词级得到分词后的目标文本序列。
举例说明,目标地址文本为:广东省深圳市龙华区工业路先跟创业园5栋A304,分词后的目标文本序列为:广东省^1|深圳市^2|龙华区^3|工业路^9|先跟创业园^13|5栋^14|A304^17,其中,广东省、深圳市、龙华区、工业路、先跟创业园、5栋与A304,均是目标地址文本对应的分级词,目标文本序列中每个分级词后的数字是该分级词对应的词级,比如说广东省这一分级词对应的词级为1,还比如A304这一分级词对应的词级为17,在此不一一列举。
在一个实施例中,服务器调用预配置的地址分词***,对目标地址文本进行地址分词,得到分词后的目标文本序列。该预配置的地址分词***相较于目前的通用型的分词工具,针对目标地址文本具有更好的分词效果。
在一个实施例中,服务器对目标地址文本逐字生成每个字对应的字向量,根据该目标地址文本中各字对应的字向量得到相应的字向量序列,将该字向量序列输入已训练好的地址文本分词模型,得到相应的标签序列,并根据标签序列得到目标地址文本对应的分词后的目标文本序列。可以理解,服务器具体可调用地址分词***,按照本实施例中的地址分词流程对目标地址文本进行地址分词,得到分词后的目标文本序列。
在一个实施例中,服务器还可采用已有的分词方式对目标地址文本进行分词,得到分词后的目标文本序列,在此不作具体赘述。已有的分词方式比如,基于词典的规则匹配方式,或者,基于CRF++的分词方式,在此不一一举例。
步骤206,通过已训练好的物流网点识别模型,根据目标文本序列中的分级词与词级确定目标地址文本对应的第一目标向量序列,对第一目标向量序列进行特征融合得到第二目标向量序列,根据第二目标向量序列得到相应的最大池化特征向量序列、平均池化特征向量序列与权重特征向量序列,根据最大池化特征向量序列、平均池化特征向量序列与权重特征向量序列,确定预配置的每个候选物流网点对应的置信度。
其中,物流网点识别模型是基于预先获取的训练样本集训练得到的、能够用于针对目标地址文本预测预配置的每个候选物流网点对应的置信度的模型。训练样本集包括多个样本地址文本各自对应的样本文本序列与样本物流网点,每个样本文本序列包括相应样本地址文本所对应的分级词,以及每个分级词对应的词级。候选物流网点对应的置信度,是指该候选物流网点为目标地址文本所对应的目标物流网点的可信程度,也即是指该候选物流网点为目标地址文本实际对应的物流网点的可信程度。向量序列是由多个向量组成的序列,以第一目标向量序列为例,目标文本序列中的每个分级词对应一个词向量,每个词级对应一个词级向量,由每个分级词对应的词向量与该分级词对应的词级所对应的词级向量得到相应的拼接向量,由此,针对目标文本序列能够得到多个拼接向量,由该多个拼接向量能够得到相应的第一目标向量序列。在此不再针对第二目标向量序列、最大池化特征向量序列、平均池化特征向量序列与权重特征向量序列分别进行解释说明。
具体地,服务器将目标地址文本对应的目标文本序列输入已训练好的物流网点识别模型,并通过该物流网点识别模型根据该目标文本序列,按照下述流程预测得到预配置的每个候选物流网点对应的置信度。服务器通过物流网点识别模型根据目标文本序列预测每个候选物流网点对应的置信度的步骤,包括:分别确定目标文本序列中每个分级词对应的词向量,以及每个词级对应的词级向量,根据目标文本序列中各分级词对应的词向量与相应词级所对应的词级向量,得到目标地址文本对应的第一目标向量序列,对该第一目标向量序列进行特征融合得到相应的第二目标向量序列,对该第二目标向量序列并行地进行最大池化操作、平均池化操作与注意力权重计算操作,得到相应的最大池化特征向量序列、平均池化特征向量序列与权重特征向量序列,对所得到的最大池化特征向量序列、平均池化特征向量序列与权重特征向量序列进行拼接,得到相应的目标特征向量序列,并根据该目标特征向量序列预测预配置的每个候选物流网点对应的置信度。
在一个实施例中,服务器还通过物流网点识别模型,对第一目标向量序列中的向量标注,得到标注后的第一目标向量序列,并对该标注后的第一目标向量序列进行特征融合得到相应的第二目标向量序列。其中,第一目标向量序列中所标注的向量,是由经常出现、但对物流网点的预测不是很重要的词级与相应分级词确定的,以便于物流网点识别模型在后续的处理中根据标注忽略掉一些经常出现但对物流网点的预测不是很重要的词级与相应分级词。
在一个实施例中,物流网点识别模型包括Embedding层(嵌入层)、Mask层、LSTM(Long Short-Term Memory,长短时记忆网络)层、最大池化层、平均池化层、Attention(注意力权重计算)层与Dense(全连接)层。其中,Embedding层用于根据目标文本序列中的分级词与词级,确定目标地址文本对应的第一目标向量序列。Mask层用于对第一目标向量序列中由对物流网点预测不是很重要的词级与相应分级词确定的向量进行标注,得到标注后的第一目标向量序列,以便于LSTM层基于标注后的第一目标向量序列进行特征融合时,能够自动屏蔽所标注的向量。LSTM层用于基于标注后的第一目标向量序列进行特征融合,得到相应的第二目标向量序列。最大池化层用于对第二目标向量序列进行最大池化操作,得到相应的最大池化特征向量序列。平均池化层用于对第二目标向量序列进行平均池化操作,得到相应的平均池化特征向量序列。Attention层用于对第二目标向量序列进行注意力权重计算操作,得到相应的权重特征向量序列。Dense层用于根据目标特征向量序列预测每个候选物流网点对应的置信度,其中,目标特征向量序列是由最大池化特征向量序列、平均池化特征向量序列与权重特征向量序列拼接得到的。
可以理解,最大池化层用于从第二目标向量序列中提取对物流网点预测有用的信息,也即是减少无用信息。平均池化层用于提取第二目标向量序列中的各向量与物流网点预测之间的关联信息。由于地址文本为短文本,通过并行化的最大池化操作与平均池化操作,能够保留物流网点识别模型中更多的上层信息。Attention层用于提取全局信息,也即是用于根据第二目标向量序列,确定目标地址文本中每个分级词对物流网点预测的重要程度,对物流网点预测影响越大的词级与相应分级词所对应的权重越大,由此,通过优化Attention层的权重计算,能够动态调整各词级与分级词在物流网点预测中所占的权重。比如,13级的POI(兴趣点/小区)词,9级的道路词和11级的路号词/门牌号词是对物流网点预测影响比较大的词级,由此该几个词级对应的权重较大。
在一个实施例中,通过LSTM层对第一目标向量序列进行特征融合的步骤,包括:将第一目标向量序列中的第一个向量输入LSTM网络得到相应的第一个输出向量,将该第一目标向量序列中的第二个向量与该第一个输出向量输入LSTM网络,得到相应的第二个输出向量,依此类推,得到第一目标向量序列中每个向量对应的输出向量,并由各输出向量得到第二目标向量序列。
在一个实施例中,物流网点识别模型中的LSTM层为双向LSTM层,也即是该物流网点识别模型中包括两个LSTM层。第一个LSTM层用于对第一目标向量序列进行特征融合,得到特征融合后的第一目标向量序列,并通过第二个LSTM层对该特征融合后的第一目标向量序列再次进行特征融合,得到相应的第二目标向量序列。这样,通过双向LSTM层进行特征融合,能够提高特征融合程度,从而能够提高置信度的预测准确性。
在一个实施例中,针对上述物流网点识别模型,在最大池化层与Dense层之间,以及平均池化层与Dense层之间分别设置Dropout(随机失活)层,以便于通过Dropout层实现神经元的随机失活,以在物流网点识别模型的训练过程中,避免物流网点识别模型的过拟合,能够提高物流网点识别模型的准确性,并提高物流网点识别模型的泛化能力。可以理解,还可在Embedding层与Mask层之间设置Dropout层。
步骤208,根据每个候选物流网点对应的置信度确定目标地址文本对应的目标物流网点。
具体地,服务器在得到预配置的各候选物流网点对应的置信度后,根据各候选物流网点对应的置信度,从该预配置的候选物流网点中筛选目标地址文本对应的目标物流网点。
在一个实施例中,服务器从候选物流网点中筛选置信度最高的候选物流网点,作为目标地址文本对应的目标物流网点。
在一个实施例中,步骤208,包括:根据各候选物流网点对应的置信度与预配置的置信度阈值,动态确定目标地址文本对应的至少一个目标物流网点。
其中,置信度阈值是用于与各候选物流网点对应的置信度进行比较,以根据比较结果动态确定目标地址文本对应的物流网点数量与各目标物流网点,具体可自定义,比如90%。
具体地,服务器根据各候选物流网点对应的置信度,从预配置的候选物流网点中选取置信度最大的候选物流网点,并将所选取的候选物流网点对应的置信度与预配置的置信度阈值进行比较。当该所选取出的候选物流网点对应的置信度大于或等于置信度阈值时,则判定目标地址文本对应的物流网点数据为一个,并将该置信度最大的候选物流网点确定为目标地址文本对应的目标物流网点。当该所选取出的候选物流网点对应的置信度小于置信度阈值时,则从候选物流网点中选取置信度仅次于最大置信度的候选物流网点,也即是从候选物流网点中选取置信度第二大的候选物流网点,并将最大置信度和第二大置信度的和值与置信度阈值进行比较。当最大置信度和第二大置信度的和值大于或等于置信度阈值时,则判定目标地址文本对应的物流网点数量为两个,并将该置信度最大与置信度第二大的候选物流网点,确定为目标地址文本对应的目标物流网点。当最大置信度和第二大置信度的和值小于置信度阈值时,则判定目标地址文本对应的物流网点数量为三个,并将预配置的候选物流网点中置信度最大、置信度第二大与置信度第三大的候选物流网点,确定为目标地址文本对应的目标物流网点,也即是将预配置的候选物流网点中置信度排前三的三个候选物流网点均确定为目标物流网点。
在一个实施例中,服务器按照置信度对候选物流网点进行排序得到物流网点序列;根据各候选物流网点在物流网点序列中的排序与各候选物流网点对应的置信度,以及预配置的置信度阈值动态确定目标地址文本对应的至少一个目标物流网点。具体地,服务器按照置信度从大到小的顺序对候选物流网点进行排序,得到相应的物流网点序列。服务器将物流网点序列中的第一个候选物流网点对应的置信度与预配置的置信度阈值进行比较,当该第一个候选物流网点对应的置信度大于或等于置信度阈值时,则将该第一个候选物流网点确定为目标物流网点,当该第一个候选物流网点对应的置信度小于置信度阈值时,则将物流网点序列中第一个候选物流网点与第二个候选物流网点各自对应的置信度求和,当和值大于或等于置信度阈值时,将该第一个候选物流网点与第二个候选物流网点均确定为目标物流网点,当和值小于置信度阈值时,则将物流网点序列中的第一个候选物流网点、第二个候选物流网点与第三个候选物流网点序列,均确定为目标物流网点。
上述实施例中,由于一个地址可能属于多个物流网点,也即是一个地址文本可能对应多个物流网点,由此,根据各候选物流网点对应的置信度与置信度阈值,动态确定目标地址文本对应的物流网点数量与目标物流网点,以便于在实际派件或收件过程中,基于该动态确定的目标物流网点进一步确定目标地址文本实际对应的物流网点,能够提高物流网点的识别准确性。
上述物流网点识别方法,对待识别的目标地址文本进行地址分词,得到包括相应分级词与每个分级词对应的词级的目标文本序列,通过已训练好的物流网点识别模型,根据该目标文本序列中的各分级词与相应词级,确定目标地址文本对应的第一目标向量序列,对该第一目标向量序列进行特征融合得到相应的第二目标向量序列,根据该第二目标向量序列得到相应的最大池化特征向量序列、平均池化特征向量序列与权重特征向量序列,并根据该最大池化特征向量序列、平均池化特征向量序列与权重特征向量序列,确定预配置的每个候选物流网点对应的置信度,能够提高各候选物流网点的置信度的预测效率与准确性,也即能够快速而准确的得到每个候选物流网点对应的置信度。进一步地,根据各候选物流网点对应的置信度,能够快速而准确地从预配置的候选物流网点中筛选目标地址文本对应的目标物流网点,从而能够在保证物流网点识别效率的情况下,提高物流网点的识别准确性。
在一个实施例中,步骤204,包括:将目标地址文本与预配置的白名单地址集合进行匹配;当目标地址文本与白名单地址集合匹配失败时,对目标地址文本进行地址分词得到分词后的初始文本序列;初始文本序列包括目标地址文本对应的分级词,以及每个分级词对应的词级;将初始文本序列与预配置的无效地址过滤条件进行比较;当初始文本序列不满足无效地址过滤条件时,根据初始文本序列得到目标地址文本对应的目标文本序列。
其中,白名单地址集合是包括一个或多个白名单地址文本,以及每个白名单地址文本对应的物流网点的地址集合。白名单地址文本是指通过物流网点识别模型进行物流网点识别时会识别错误的地址文本。若基于已训练好的物流网点识别模型确定目标地址文本对应的目标物流网点后,在实际应用场景中判定该基于物流网点识别模型确定的目标物流网点,并不是该目标地址文本实际对应的物流网点,则人工确定该目标地址文本实际对应的物流网点,则将该目标地址文本确定为白名单地址文本,并将该目标地址文本与其实际对应的物流网点新增至白名单地址集合中,以便于再次对该目标地址文本进行物流网点的识别时,能够基于白名单地址集合快速而准确地确定该目标地址文本对应的目标物流网点。
无效地址过滤条件是用于过滤无效地址的条件或依据,具体可以用于指定不可缺失的词级。当目标地址文本中缺失无效地址过滤条件所指定的不可缺失的词级时,表明该目标地址文本满足该无效地址过滤条件,则判定该目标地址文本为无效地址。不可缺失的词级比如包括4级、6级、9+11级与13级,当目标地址文本中同时缺失4级、6级、9+11级与13级各自对应的分级词时,则判定该目标地址文本为无效地址。
具体地,服务器将所获取到的目标地址文本分别与预配置的白名单地址集合中的每个白名单地址文本进行匹配,以实现目标地址文本与该白名单地址集合的匹配。当目标地址文本与白名单地址集合中的各白名单地址文本均匹配失败时,服务器则判定该目标地址文本与白名单地址集合匹配失败,并按照本申请中一个或多个实施例中提供的地址分词方式,对目标地址文本进行地址分词得到该目标地址文本对应的分级词,以及每个分级词对应的词级,根据该目标地址文本对应的分级词与每个分级词对应的词级,得到分词后的初始文本序列。服务器将目标地址文本对应的初始文本序列与预配置的无效地址过滤条件进行比较,以判断该初始文本序列中是否缺失无效地址过滤条件所指定的不可缺失的词级。当判定初始文本序列中没有缺失该不可缺失的词级时,服务器则判定该初始文本序列不满足无效地址过滤条件,也即是判定相应的目标地址文本不是无效地址,并根据该初始文本序列确定该目标地址文本对应的目标文本序列。
相应地,当目标地址文本与白名单地址集合中的任意一个白名单地址文本匹配成功时,服务器则判定该目标地址文本与白名单地址集合匹配成功,并将该白名单地址集合中与该目标地址文本相匹配的白名单地址文本对应的物流网点,确定为该目标地址文本对应的目标物流网点。当判定初始文本序列中缺失无效地址过滤条件所指定的不可缺失的词级时,服务器则判定该目标地址文本为无效地址,则不会继续针对该目标地址文本执行物流网点识别的相关操作。
在一个实施例中,当判定初始文本序列不满足无效地址过滤条件时,服务器将该初始文本序列直接确定为目标地址文本对应的目标文本序列,或者,从该初始文本序列中筛选与物流网点识别具有较高相关性的词级,以及各词级对应的分级词,并根据所筛选出的词级与分词级得到相应的目标文本序列。
在一个实施例中,采用Redis和MySQL来存储白名单地址集合。
上述实施例中,基于预配置的白名单地址集合与无效地址过滤条件,对目标地址文本进行筛选,以筛选出通过物流网点识别模型进行物流网点识别的目标地址文本,而针对处于白名单地址集合中的目标地址文本,直接基于白名单地址集合确定相应的目标物流网点,能够在保证物流网点识别效率的情况下,提高物流网点的识别准确性。
在一个实施例中,根据初始文本序列得到目标地址文本对应的目标文本序列,包括:从初始文本序列中筛选词级与预配置的网点相关词级集合相匹配的分级词;根据所筛选出的分级词与相应的词级得到相应的目标文本序列。
其中,网点相关词级集合是由与物流网点识别具有较高相关性的词级组成的集合,具体可用于指定与物流网点识别具有较高相关性的多个词级。网点相关词级集合中的各词级是通过数据相关性分析确定的。网点相关词级集合中所包括的词级比如有1、2、7、8、12、16、17与18。
具体地,服务器将初始文本序列中每个分级词对应的词级,分别与预配置的网点相关词级集合中的各词级进行匹配,并根据匹配结果从该初始文本序列中筛选词级与该网点相关词级集合相匹配的分级词。针对初始文本序列中的每个分级词,当网点相关词级集合中存在与该分级词的词级相匹配的词级时,则将该分级词与相应的词级从该初始文本序列中筛选出来。服务器根据从初始文本序列中所筛选出的分级词与词级,得到相应的目标文本序列,也即是该目标文本序列中包括所筛选出的各分级词与相应的词级。
可以理解,按照预配置的网点相关词级集合从初始文本序列中筛选目标文本序列,该数据处理过程可理解为词级过滤,也即是从初始文本序列中过滤掉与物流网点识别相关性较低的词级与相应分级词,得到由与物理网点识别具有较高相关性的词级与相应分级词组成的目标文本序列。
举例说明,假设目标地址文本对应的初始文本序列为:广东省^1|深圳市^2|龙华区^3|工业路^9|先跟创业园^13|5栋^14|A304^17,按照上述方式得到的目标文本序列为:龙华区^3|工业路^9|先跟创业园^13|5栋^14。
在一个实施例中,服务器也可在获取到目标地址文本后,按照本申请提供的地址分词方式直接对该目标地址文本进行分词,得到分词后的初始文本序列,并按照上述方式根据该初始文本序列得到相应的目标文本序列。
上述实施例中,按照预配置的网点相关词级集合,从初始文本序列中过滤掉与物流网点识别相关性较低的词级与分词级,得到相应目标文本序列,以便于基于该目标文本序列进一步识别目标地址文本对应的目标物流网点时,能够在保证物流网点识别准确性的同时,降低数据处理量,从而提高识别效率。
在一个实施例中,根据目标文本序列中的分级词与词级确定目标地址文本对应的第一目标向量序列,包括:确定目标文本序列中每个分级词对应的词向量,以及目标文本序列中每个词级对应的词级向量;将目标文本序列中每个分级词对应的词向量与相应词级所对应的词级向量进行拼接,得到相应的拼接向量;根据目标文本序列中各分级词对应的拼接向量,得到目标地址文本对应的第一目标向量序列。
其中,词向量是指分级词对应的向量。词级向量是指词级对应的向量。拼接向量是指将词向量与词级向量进行首尾拼接得到的向量。
举例说明,假设目标地址文本对应的目标文本序列为:龙华区^3|工业路^9|先跟创业园^13|5栋^14,该目标文本序列对应的第一目标向量序列为:V(龙华区)+V(3),V(工业路)+V(9),V(先跟创业园)+V(13),V(5栋)+V(14),其中,V(龙华区)表征“龙华区”这一分级词对应的词向量,V(3)表征“3”这一词级对应的词级向量,V(龙华区)+V(3)表征由分级词“龙华区”对应的词向量与相应的词级“3”对应的词级向量拼接得到的拼接向量,在此不再一一列举。
在一个实施例中,已训练好的物流网点识别模型中包括目标词向量集合与目标词级向量集合。服务器通过该物流网点识别模型,在目标词向量集合中分别查询目标文本序列中的每个分级词对应的词向量,并在目标词级向量集合中分别查询目标文本序列中的每个词级对应的词级向量。其中,目标词向量集合与目标词级向量集合,具体可以是在物流网点识别模型的训练过程中同步训练得到的。在基于训练样本集训练物流网点识别模型的过程中,还会同步训练训练样本集中每个分级词对应的词向量,以及每个词级对应的词级向量,并在得到已训练好的物流网点识别模型的同时,得到每个分级词对应的目标词向量与每个词级对应的目标词级向量,并根据各目标词向量得到目标词向量集合,以及根据各目标词级向量得到目标词级向量集合。
在一个实施例中,当在目标词向量集合中没有查询到目标序列文本中的分级词对应的词向量时,则从初始词向量集合中查询该分级词对应的词向量。相应的,当在目标词级向量集合中没有查询到目标文本序列中的词级对应的词级向量时,则从初始词级向量集合中查询该词级对应的词级向量。初始词向量集合与初始词级向量集合,是通过Word2Vec模型根据训练样本集预先生成的。
在一个实施例中,在基于训练样本集训练物流网点识别模型时,该训练样本集中每个分级词对应的初始词向量,以及每个词级对应的初始词级向量,是通过Word2Vec模型生成的。具体地,在训练物流网点识别模型之前,通过Word2Vec模型根据训练样本集中包括分级词与相应词级的各样本文本序列,分别得到该训练样本集中每个分级词对应的初始词向量,以及每个词级对应的初始词级向量,并根据各初始词向量得到初始词向量集合,以及根据各初始词级向量得到初始词级向量集合。这样,在物流网点识别模型的训练过程中,能够基于该初始词向量集合确定样本文本序列中每个分级词对应的初始词向量,基于该初始词级向量集合确定样本文本序列中每个词级对应的初始词级向量,并基于该各初始词向量与初始词级向量得到该样本文本序列对应的第一样本向量序列,进而基于该第一样本向量序列执行后续的模型训练流程。其中,通过Word2Vec模型按照已有的向量生成方式,根据样本文本序列生成该样本文本序列中每个分级词对应的词向量,以及每个词级对应的词级向量,在此不再赘述。
上述实施例中,对目标文本序列中的分级词与词级分别进行向量化,将向量化得到的词向量与词级向量分别进行拼接得到相应的拼接向量,并基于拼接向量得到第一目标向量序列,进而基于该第一目标向量序列进行后续的模型训练操作。这样,目标文本序列中的各分级词是具有层级关系的,该层级关系通过词级来表征,基于携带词级信息的第一目标向量序列进行模型训练,能够使得训练得到的模型对地址的分词位置更敏感,针对具有相同分级词不同词级的部分能够进行有效区分,也即能够提高物流网点识别模型的准确性。
在一个实施例中,物流网点识别模型的训练步骤,包括:获取训练样本集;训练样本集包括样本地址文本对应的样本文本序列与样本物流网点;样本文本序列包括相应样本地址文本所对应的分级词,以及每个分级词对应的词级;将样本文本序列作为输入特征,将相应的样本物流网点作为期望的输出特征进行模型训练,得到已训练好的物流网点识别模型。
具体地,服务器获取多个样本地址文本,以及每个样本地址文本对应的样本物流网点。服务器对每个样本地址文本进行地址分词,得到相应的分级词与每个分级词对应的词级,并根据每个样本地址文本对应的分级词与词级得到相应的样本文本序列。服务器根据各样本地址文本对应的样本文本序列与样本物流网点得到训练样本集。进一步地,服务器将训练样本集中的样本文本序列作为输入特征,将相应的样本物流网点作为期望的输出特征进行模型训练,得到已训练好的物流网点识别模型。
在一个实施例中,服务器从收派件运单地址库中获取至少半年的全量地址数据,以及从全国地址标准库中获取全量地址数据,并根据所获取到的全量地址数据得到多个样本地址文本与每个样本地址文本对应的样本物流网点。其中,全量地址数据是指满足获取要求的所有地址数据。举例说明,样本地址文本为:广东省深圳市龙华区工业路先跟创业园5栋A304样本地址文本对应的样本物流网点为:755BN014。
在一个实施例中,服务器在获取到初始的样本地址文本后,对每个样本地址文本进行数据预处理得到相应的样本文本序列。其中,数据预处理包括地址文本规范化、地址分词与词级过滤等中的一种或多种。服务器具体可参照本申请一个或多个实施例中针对目标地址文本提供的数据预处理方式,对样本地址文本进行数据预处理,在此不再赘述。
在一个实施例中,服务器将tensorflow平台作为模型训练的主框架,也即是基于tensorflow平台来训练物流网点识别模型,并将已训练好的物流网点识别模型保存为tensorflow平台savedmodel模型。在将已训练好的物流网点识别模型进行线上部署以提供web服务时,使用Golang语言的labstack/echo框架来部署tensorflow平台的savedmodel模型。其中,选择Golang的原因是Golang有专门调用tensorflow平台的API,使用方便,labstack/echo框架对高并发多线程优化很好,能最大化实现模型部署后的web服务性能。
在一个实施例中,按照本申请一个或多个实施例中提供的物流网点识别模型的训练方式,针对全国300多个城市分别训练得到相应的物流网点识别模型,并将针对各城市分别训练得到的物流网点识别模型部署至同一服务器,该服务器基于所部署的各物流网点识别模型,能够覆盖所有城市中各地址所属的物流网点的识别,也即是能够提供任意城市的地址文本对应的物流网点识别功能。该同一的服务器可以是单台服务器,比如单台256G内存的服务器,还可以是由多台服务器组成的服务器集群。可以理解,服务器通过每个城市对应的物流网点识别模型,根据该城市内的目标地址文本会预测得到该城市内的各候选物流网点对应的置信度。
在一个实施例中,当满足模型更新条件时,获取更新样本集;更新样本集包括更新地址文本对应的更新文本序列与更新物流网点;更新文本序列包括相应更新地址文本所对应的分级词,以及每个分级词对应的词级;根据更新样本集对物流网点识别模型进行迭代更新,得到更新后的物流网点识别模型,并将更新后的物流网点识别模型作为已训练好的物流网点识别模型。
其中,模型更新条件是触发模型更新操作的条件或依据,具体可以是接收到终端发送的模型更新指令,或者,自前一次触发模型更新操作起达到指定时长。指定时长比如6个月,由于新地址会不断出现,由此需要按照预设周期定期更新已训练得到的物流网点识别模型。具体地,服务器将新增的地址文本作为更新地址文本,根据更新地址文本获取相应的更新文本序列与更新物流网点,进而得到用于更新物流网点识别模型的更新样本集。进一步地,服务器根据更新样本集,按照模型训练的类似流程对已训练得到的物流网点识别模型进行迭代更新,得到更新后的物流网点识别模型,并在后续的物流网点识别应用中,将该更新后的物流网点识别模型作为已训练好的物流网点识别模型。
上述实施例中,根据训练样本集预先训练得到已训练好的物流网点识别模型,以便于在物流网点识别应用过程中,基于该已训练好的物流网点识别模型,根据目标地址文本对应的目标文本序列,能够快速而准确地预测得到该目标地址文本对应的目标物流网点。
在一个实施例中,将样本文本序列作为输入特征,将相应的样本物流网点标识作为期望的输出特征进行模型训练,得到已训练好的物流网点识别模型,包括:将样本文本序列作为输入特征输入待训练的物流网点识别模型;通过待训练的物流网点识别模型,根据样本文本序列中的分级词与词级确定样本文本序列对应的第一样本向量序列,对第一样本向量序列进行特征融合得到第二样本向量序列,根据第二样本向量序列得到相应的最大池化特征向量序列、平均池化特征向量序列与权重特征向量序列,根据所得到的最大池化特征向量序列、平均池化特征向量序列与权重特征向量序列,确定预配置的每个候选物流网点对应的置信度,并筛选置信度最大的候选物流网点作为预测物流网点;根据样本文本序列对应的预测物流网点与样本物流网点,反向调整待训练的物流网点识别模型的模型参数,并返回至将样本文本序列作为输入特征输入待训练的物流网点识别模型的步骤继续执行,直至满足迭代停止条件时,停止迭代,得到已训练好的物流网点识别模型。
可以理解,在物流网点识别模型的训练与应用过程中,通过已训练好的物流网点识别模型根据目标文本地址对应的目标文本序列,预测每个候选物流网点对应的置信度的相关操作,与通过待训练的物流网点识别模型根据样本文本地址对应的样本文本序列,预测每个候选物流网点对应的指定度的相关操作类似,在此不再赘述。在物流网点识别模型的训练过程中,待训练的物流网点识别模型在每次迭代过程中,还会根据当次迭代过程中针对各候选物流网点预测得到的置信度,筛选置信度最大的候选物流网点作为样本地址文本对应的预测物流网点,并根据样本地址文本对应的预测物流网点与样本物流网点,反向调整该待训练的物流网点识别模型的模型参数,并基于调整模型参数后的物流网点识别模型继续执行上述迭代训练操作,直至满足迭代停止条件时,停止迭代,得到已训练好的物流网点识别模型。迭代停止条件比如迭代次数大于或等于迭代次数阈值,或者,待训练的模型参数趋于稳定等,在此不作具体。
在一个实施例中,在按照上述方式训练物流网点识别模型时,还会进行网络参数的优化,网络参数的优化包括词向量与词级向量训练时的参数优化,以及物流网点识别模型训练是的参数优化,参数优化的主要依据是在保证模型高指标的情况下,尽可能缩短模型训练时间,减少模型数据量大小。优化的网络参数包括但不限于是模型维度、模型中网络层的层数、神经元数量与学习率等。针对学习率的优化,比如实现多重学习率的自优化,具体地,在物流网点识别模型的训练过程中,在已完成预设批次的迭代训练与损失函数变化不大时,自动降低学习率,以便于自动确定最佳收敛点。可以理解,由于损失函数快要收敛时,梯度变化会很小,若保持学习率不变,可能会导致所确定的收敛点存在误差,由此,通过自动优化学习率,能够提高模型的准确性。
如图3所示,在一个实施例中,提供了一种物流网点识别方法,该方法具体包括以下步骤:
步骤302,获取目标地址文本。
步骤304,将目标地址文本与预配置的白名单地址集合进行匹配。
步骤306,当目标地址文本与白名单地址集合匹配失败时,对目标地址文本进行地址分词得到分词后的初始文本序列;初始文本序列包括目标地址文本对应的分级词,以及每个分级词对应的词级。
步骤308,将初始文本序列与预配置的无效地址过滤条件进行比较。
步骤310,当初始文本序列不满足无效地址过滤条件时,从初始文本序列中筛选词级与预配置的网点相关词级集合相匹配的分级词。
步骤312,根据所筛选出的分级词与相应的词级得到相应的目标文本序列。
步骤314,通过已训练好的物流网点识别模型,确定目标文本序列中每个分级词对应的词向量,以及目标文本序列中每个词级对应的词级向量,将目标文本序列中每个分级词对应的词向量与相应词级所对应的词级向量进行拼接,得到相应的拼接向量,根据目标文本序列中各分级词对应的拼接向量,得到目标地址文本对应的第一目标向量序列,对第一目标向量序列进行特征融合得到第二目标向量序列,根据第二目标向量序列得到相应的最大池化特征向量序列、平均池化特征向量序列与权重特征向量序列,根据最大池化特征向量序列、平均池化特征向量序列与权重特征向量序列,确定预配置的每个候选物流网点对应的置信度。
步骤316,根据各候选物流网点对应的置信度与预配置的置信度阈值,动态确定目标地址文本对应的至少一个目标物流网点。
上述实施例中,基于已训练好的物流网点识别模型,根据目标地址文本对应的目标文本序列预测相应的目标物流网点,能够提高对物流网点识别的准确性,减少物流网点的错分,能够节约派件与收件的成本,从而能够节约整个物流的成本。
图4为一个实施例中物流网点识别方法的原理示意图。如图4所示,完整的物流网点识别过程主要包括数据预处理、模型训练与模型上线等三个阶段。数据预处理阶段依次包括获取样本地址文本、规范化处理、地址分词、特征工程与向量化。其中,特征工程是指词级过滤,具体可以是指对由样本地址文本依次通过规范化处理与地址分词处理得到的样本文本序列进行词级过滤。向量化是指通过Word2Vec模型对样本文本序列中的分级词与词级进行向量化处理,得到相应的初始词向量与初始词级向量,以便于在模型训练阶段,基于样本文本序列能够获取相应的初始词向量与初始词级向量,并基于该初始词向量与初始词级向量进行迭代训练。
模型训练阶段用于训练物流网点识别模型,该物流网点识别模型的内部网络架构与各网络层之间的关系如图4所示,Embedding层获取样本文本序列对应的初始词向量与初始词级向量,并在模型的迭代训练过程中不断优化调整各词级对应的词级向量,以及各分级词对应的词向量,Mask层用于标注对物流网点预测不是很重要的词级与相应分级词,双向LSTM层用于进行特征融合,最大池化层、平均池化层与Attention层,分别用于对由双向LSTM层输出的向量序列进行最大池化操作、平均池化操作与注意力权重计算操作,Dropout层用于是神经元随机失活。在基于上述网络架构训练得到已训练好的物流网点识别模型后,保存该已训练好的物流网点识别模型,并进一步基于测试样本集测试该已训练好的物流网点识别模型的准确率,当判定准确率不达标时,比如准确性低于准确率阈值,则通过特征工程动态调整所需过来的词级,并基于动态调整后的词级,按照上述方式重新训练物流网点识别模型,当判定准确率达标时,则将该已训练好的物流网点识别模型进行模型上线的部署。
模型上线部署阶段,采用Golang框架提供的HTTP与TCP实现模型的上线部署,采用Redis和MySQL建立并保存白名单地址集合,基于白名单地址集合过滤掉与白名单地址文本相匹配的目标地址文本,并基于白名单地址集合直接确定与该被过滤掉的目标地址文本对应的目标物流网点,进一步,基于无效地址过滤条件过滤掉无效地址,并针对过滤掉无效地址后的目标地址文本,调用已部署的物流网点识别模型进行目标物流网点的预测,并动态输出至少一个目标物流网点。
应该理解的是,虽然图2-3的流程图中的各个步骤按照箭头的指示依次显示,但是这些步骤并不是必然按照箭头指示的顺序依次执行。除非本文中有明确的说明,这些步骤的执行并没有严格的顺序限制,这些步骤可以以其它的顺序执行。而且,图2-3中的至少一部分步骤可以包括多个步骤或者多个阶段,这些步骤或者阶段并不必然是在同一时刻执行完成,而是可以在不同的时刻执行,这些步骤或者阶段的执行顺序也不必然是依次进行,而是可以与其它步骤或者其它步骤中的步骤或者阶段的至少一部分轮流或者交替地执行。
在一个实施例中,如图5所示,提供了一种物流网点识别装置500,包括:获取模块501、分词模块502、预测模块503和识别模块504,其中:
获取模块501,用于获取目标地址文本;
分词模块502,用于对目标地址文本进行地址分词得到分词后的目标文本序列;目标文本序列包括分级词与每个分级词对应的词级;
预测模块503,用于通过已训练好的物流网点识别模型,根据目标文本序列中的分级词与词级确定目标地址文本对应的第一目标向量序列,对第一目标向量序列进行特征融合得到第二目标向量序列,根据第二目标向量序列得到相应的最大池化特征向量序列、平均池化特征向量序列与权重特征向量序列,根据最大池化特征向量序列、平均池化特征向量序列与权重特征向量序列,确定预配置的每个候选物流网点对应的置信度;
识别模块504,用于根据每个候选物流网点对应的置信度确定目标地址文本对应的目标物流网点。
在一个实施例中,识别模块504,还用于根据各候选物流网点对应的置信度与预配置的置信度阈值,动态确定目标地址文本对应的至少一个目标物流网点。
在一个实施例中,分词模块502,还用于将目标地址文本与预配置的白名单地址集合进行匹配;当目标地址文本与白名单地址集合匹配失败时,对目标地址文本进行地址分词得到分词后的初始文本序列;初始文本序列包括目标地址文本对应的分级词,以及每个分级词对应的词级;将初始文本序列与预配置的无效地址过滤条件进行比较;当初始文本序列不满足无效地址过滤条件时,根据初始文本序列得到目标地址文本对应的目标文本序列。
在一个实施例中,分词模块502,还用于从初始文本序列中筛选词级与预配置的网点相关词级集合相匹配的分级词;根据所筛选出的分级词与相应的词级得到相应的目标文本序列。
在一个实施例中,预测模块503,还用于确定目标文本序列中每个分级词对应的词向量,以及目标文本序列中每个词级对应的词级向量;将目标文本序列中每个分级词对应的词向量与相应词级所对应的词级向量进行拼接,得到相应的拼接向量;根据目标文本序列中各分级词对应的拼接向量,得到目标地址文本对应的第一目标向量序列。
在一个实施例中,上述物流网点识别装置500,还包括:训练模块;
训练模块,用于获取训练样本集;训练样本集包括样本地址文本对应的样本文本序列与样本物流网点;样本文本序列包括相应样本地址文本所对应的分级词,以及每个分级词对应的词级;将样本文本序列作为输入特征,将相应的样本物流网点作为期望的输出特征进行模型训练,得到已训练好的物流网点识别模型。
在一个实施例中,训练模块,还用于将样本文本序列作为输入特征输入待训练的物流网点识别模型;通过待训练的物流网点识别模型,根据样本文本序列中的分级词与词级确定样本文本序列对应的第一样本向量序列,对第一样本向量序列进行特征融合得到第二样本向量序列,根据第二样本向量序列得到相应的最大池化特征向量序列、平均池化特征向量序列与权重特征向量序列,根据所得到的最大池化特征向量序列、平均池化特征向量序列与权重特征向量序列,确定预配置的每个候选物流网点对应的置信度,并筛选置信度最大的候选物流网点作为预测物流网点;根据样本文本序列对应的预测物流网点与样本物流网点,反向调整待训练的物流网点识别模型的模型参数,并返回至将样本文本序列作为输入特征输入待训练的物流网点识别模型的步骤继续执行,直至满足迭代停止条件时,停止迭代,得到已训练好的物流网点识别模型。
关于物流网点识别装置的具体限定可以参见上文中对于物流网点识别方法的限定,在此不再赘述。上述物流网点识别装置中的各个模块可全部或部分通过软件、硬件及其组合来实现。上述各模块可以硬件形式内嵌于或独立于计算机设备中的处理器中,也可以以软件形式存储于计算机设备中的存储器中,以便于处理器调用执行以上各个模块对应的操作。
在一个实施例中,提供了一种计算机设备,该计算机设备可以是服务器,其内部结构图可以如图6所示。该计算机设备包括通过***总线连接的处理器、存储器和网络接口。其中,该计算机设备的处理器用于提供计算和控制能力。该计算机设备的存储器包括非易失性存储介质、内存储器。该非易失性存储介质存储有操作***、计算机程序和数据库。该内存储器为非易失性存储介质中的操作***和计算机程序的运行提供环境。该计算机设备的数据库用于存储已训练好的物流网点识别模型。该计算机设备的网络接口用于与外部的终端通过网络连接通信。该计算机程序被处理器执行时以实现一种物流网点识别方法。
本领域技术人员可以理解,图6中示出的结构,仅仅是与本申请方案相关的部分结构的框图,并不构成对本申请方案所应用于其上的计算机设备的限定,具体的计算机设备可以包括比图中所示更多或更少的部件,或者组合某些部件,或者具有不同的部件布置。
在一个实施例中,提供了一种计算机设备,包括存储器和处理器,存储器中存储有计算机程序,该处理器执行计算机程序时实现上述各方法实施例中的步骤。
在一个实施例中,提供了一种计算机可读存储介质,其上存储有计算机程序,计算机程序被处理器执行时实现上述各方法实施例中的步骤。
本领域普通技术人员可以理解实现上述实施例方法中的全部或部分流程,是可以通过计算机程序来指令相关的硬件来完成,的计算机程序可存储于一非易失性计算机可读取存储介质中,该计算机程序在执行时,可包括如上述各方法的实施例的流程。其中,本申请所提供的各实施例中所使用的对存储器、存储、数据库或其它介质的任何引用,均可包括非易失性和易失性存储器中的至少一种。非易失性存储器可包括只读存储器(Read-OnlyMemory,ROM)、磁带、软盘、闪存或光存储器等。易失性存储器可包括随机存取存储器(Random Access Memory,RAM)或外部高速缓冲存储器。作为说明而非局限,RAM可以是多种形式,比如静态随机存取存储器(Static Random Access Memory,SRAM)或动态随机存取存储器(Dynamic Random Access Memory,DRAM)等。
以上实施例的各技术特征可以进行任意的组合,为使描述简洁,未对上述实施例中的各个技术特征所有可能的组合都进行描述,然而,只要这些技术特征的组合不存在矛盾,都应当认为是本说明书记载的范围。
以上实施例仅表达了本申请的几种实施方式,其描述较为具体和详细,但并不能因此而理解为对发明专利范围的限制。应当指出的是,对于本领域的普通技术人员来说,在不脱离本申请构思的前提下,还可以做出若干变形和改进,这些都属于本申请的保护范围。因此,本申请专利的保护范围应以所附权利要求为准。
Claims (10)
1.一种物流网点识别方法,其特征在于,所述方法包括:
获取目标地址文本;
对所述目标地址文本进行地址分词得到分词后的目标文本序列;所述目标文本序列包括分级词与每个分级词对应的词级;
通过已训练好的物流网点识别模型,根据所述目标文本序列中的分级词与词级确定所述目标地址文本对应的第一目标向量序列,对所述第一目标向量序列进行特征融合得到第二目标向量序列,根据所述第二目标向量序列得到相应的最大池化特征向量序列、平均池化特征向量序列与权重特征向量序列,根据所述最大池化特征向量序列、所述平均池化特征向量序列与所述权重特征向量序列,确定预配置的每个候选物流网点对应的置信度;
根据所述每个候选物流网点对应的置信度确定所述目标地址文本对应的目标物流网点。
2.根据权利要求1所述的方法,其特征在于,所述根据所述每个候选物流网点对应的置信度确定所述目标地址文本对应的目标物流网点,包括:
根据各所述候选物流网点对应的置信度与预配置的置信度阈值,动态确定所述目标地址文本对应的至少一个目标物流网点。
3.根据权利要求1所述的方法,其特征在于,所述对所述目标地址文本进行地址分词得到分词后的目标文本序列,包括:
将所述目标地址文本与预配置的白名单地址集合进行匹配;
当所述目标地址文本与所述白名单地址集合匹配失败时,对所述目标地址文本进行地址分词得到分词后的初始文本序列;所述初始文本序列包括所述目标地址文本对应的分级词,以及每个分级词对应的词级;
将所述初始文本序列与预配置的无效地址过滤条件进行比较;
当所述初始文本序列不满足所述无效地址过滤条件时,根据所述初始文本序列得到所述目标地址文本对应的目标文本序列。
4.根据权利要求3所述的方法,其特征在于,所述根据所述初始文本序列得到所述目标地址文本对应的目标文本序列,包括:
从所述初始文本序列中筛选词级与预配置的网点相关词级集合相匹配的分级词;
根据所筛选出的分级词与相应的词级得到相应的目标文本序列。
5.根据权利要求1所述的方法,其特征在于,所述根据所述目标文本序列中的分级词与词级确定所述目标地址文本对应的第一目标向量序列,包括:
确定所述目标文本序列中每个分级词对应的词向量,以及所述目标文本序列中每个词级对应的词级向量;
将所述目标文本序列中每个分级词对应的词向量与相应词级所对应的词级向量进行拼接,得到相应的拼接向量;
根据所述目标文本序列中各分级词对应的拼接向量,得到所述目标地址文本对应的第一目标向量序列。
6.根据权利要求1至5任意一项所述的方法,其特征在于,物流网点识别模型的训练步骤,包括:
获取训练样本集;所述训练样本集包括样本地址文本对应的样本文本序列与样本物流网点;所述样本文本序列包括相应样本地址文本所对应的分级词,以及每个分级词对应的词级;
将所述样本文本序列作为输入特征,将相应的样本物流网点作为期望的输出特征进行模型训练,得到已训练好的物流网点识别模型。
7.根据权利要求6所述的方法,其特征在于,所述将所述样本文本序列作为输入特征,将相应的样本物流网点标识作为期望的输出特征进行模型训练,得到已训练好的物流网点识别模型,包括:
将所述样本文本序列作为输入特征输入待训练的物流网点识别模型;
通过所述待训练的物流网点识别模型,根据所述样本文本序列中的分级词与词级确定所述样本文本序列对应的第一样本向量序列,对所述第一样本向量序列进行特征融合得到第二样本向量序列,根据所述第二样本向量序列得到相应的最大池化特征向量序列、平均池化特征向量序列与权重特征向量序列,根据所得到的最大池化特征向量序列、平均池化特征向量序列与权重特征向量序列,确定预配置的每个候选物流网点对应的置信度,并筛选置信度最大的候选物流网点作为预测物流网点;
根据所述样本文本序列对应的预测物流网点与样本物流网点,反向调整所述待训练的物流网点识别模型的模型参数,并返回至所述将所述样本文本序列作为输入特征输入待训练的物流网点识别模型的步骤继续执行,直至满足迭代停止条件时,停止迭代,得到已训练好的物流网点识别模型。
8.一种物流网点识别装置,其特征在于,所述装置包括:
获取模块,用于获取目标地址文本;
分词模块,用于对所述目标地址文本进行地址分词得到分词后的目标文本序列;所述目标文本序列包括分级词与每个分级词对应的词级;
预测模块,用于通过已训练好的物流网点识别模型,根据所述目标文本序列中的分级词与词级确定所述目标地址文本对应的第一目标向量序列,对所述第一目标向量序列进行特征融合得到第二目标向量序列,根据所述第二目标向量序列得到相应的最大池化特征向量序列、平均池化特征向量序列与权重特征向量序列,根据所述最大池化特征向量序列、所述平均池化特征向量序列与所述权重特征向量序列,确定预配置的每个候选物流网点对应的置信度;
识别模块,用于根据所述每个候选物流网点对应的置信度确定所述目标地址文本对应的目标物流网点。
9.一种计算机设备,包括存储器和处理器,所述存储器存储有计算机程序,其特征在于,所述处理器执行所述计算机程序时实现权利要求1至7中任一项所述的方法的步骤。
10.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现权利要求1至7中任一项所述的方法的步骤。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010888602.0A CN112052673A (zh) | 2020-08-28 | 2020-08-28 | 物流网点识别方法、装置、计算机设备和存储介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010888602.0A CN112052673A (zh) | 2020-08-28 | 2020-08-28 | 物流网点识别方法、装置、计算机设备和存储介质 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN112052673A true CN112052673A (zh) | 2020-12-08 |
Family
ID=73607531
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202010888602.0A Pending CN112052673A (zh) | 2020-08-28 | 2020-08-28 | 物流网点识别方法、装置、计算机设备和存储介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN112052673A (zh) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN112818666A (zh) * | 2021-01-29 | 2021-05-18 | 上海寻梦信息技术有限公司 | 地址识别方法、装置、电子设备和存储介质 |
Citations (10)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN103440311A (zh) * | 2013-08-27 | 2013-12-11 | 深圳市华傲数据技术有限公司 | 一种地名实体识别的方法及*** |
CN106296059A (zh) * | 2015-06-02 | 2017-01-04 | 阿里巴巴集团控股有限公司 | 派送网点确定方法及设备 |
CN106407221A (zh) * | 2015-07-31 | 2017-02-15 | 阿里巴巴集团控股有限公司 | 地址数据检索方法及装置 |
CN109376227A (zh) * | 2018-10-29 | 2019-02-22 | 山东大学 | 一种基于多任务人工神经网络的刑期预测方法 |
CN109389270A (zh) * | 2017-08-09 | 2019-02-26 | 菜鸟智能物流控股有限公司 | 一种物流对象确定方法、装置和机器可读介质 |
CN109858032A (zh) * | 2019-02-14 | 2019-06-07 | 程淑玉 | 融合Attention机制的多粒度句子交互自然语言推理模型 |
CN110534087A (zh) * | 2019-09-04 | 2019-12-03 | 清华大学深圳研究生院 | 一种文本韵律层级结构预测方法、装置、设备及存储介质 |
CN111046669A (zh) * | 2019-12-06 | 2020-04-21 | 江苏苏宁物流有限公司 | 一种兴趣点的匹配方法、装置及计算机*** |
CN111079985A (zh) * | 2019-11-26 | 2020-04-28 | 昆明理工大学 | 一种基于bert并融合可区分属性特征的刑事案件刑期预测方法 |
CN111310411A (zh) * | 2020-03-09 | 2020-06-19 | 重庆邮电大学 | 一种基于多样性模型的文本相关性判定方法、装置和设备 |
-
2020
- 2020-08-28 CN CN202010888602.0A patent/CN112052673A/zh active Pending
Patent Citations (10)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN103440311A (zh) * | 2013-08-27 | 2013-12-11 | 深圳市华傲数据技术有限公司 | 一种地名实体识别的方法及*** |
CN106296059A (zh) * | 2015-06-02 | 2017-01-04 | 阿里巴巴集团控股有限公司 | 派送网点确定方法及设备 |
CN106407221A (zh) * | 2015-07-31 | 2017-02-15 | 阿里巴巴集团控股有限公司 | 地址数据检索方法及装置 |
CN109389270A (zh) * | 2017-08-09 | 2019-02-26 | 菜鸟智能物流控股有限公司 | 一种物流对象确定方法、装置和机器可读介质 |
CN109376227A (zh) * | 2018-10-29 | 2019-02-22 | 山东大学 | 一种基于多任务人工神经网络的刑期预测方法 |
CN109858032A (zh) * | 2019-02-14 | 2019-06-07 | 程淑玉 | 融合Attention机制的多粒度句子交互自然语言推理模型 |
CN110534087A (zh) * | 2019-09-04 | 2019-12-03 | 清华大学深圳研究生院 | 一种文本韵律层级结构预测方法、装置、设备及存储介质 |
CN111079985A (zh) * | 2019-11-26 | 2020-04-28 | 昆明理工大学 | 一种基于bert并融合可区分属性特征的刑事案件刑期预测方法 |
CN111046669A (zh) * | 2019-12-06 | 2020-04-21 | 江苏苏宁物流有限公司 | 一种兴趣点的匹配方法、装置及计算机*** |
CN111310411A (zh) * | 2020-03-09 | 2020-06-19 | 重庆邮电大学 | 一种基于多样性模型的文本相关性判定方法、装置和设备 |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN112818666A (zh) * | 2021-01-29 | 2021-05-18 | 上海寻梦信息技术有限公司 | 地址识别方法、装置、电子设备和存储介质 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN110363449B (zh) | 一种风险识别方法、装置及*** | |
CN110162414B (zh) | 基于微服务架构实现人工智能服务的方法及装置 | |
CN110263152B (zh) | 基于神经网络的文本分类方法、***及计算机设备 | |
CN110197207B (zh) | 对未归类用户群进行归类的方法及相关装置 | |
CN113254649B (zh) | 敏感内容识别模型的训练方法、文本识别方法及相关装置 | |
US20210158183A1 (en) | Trustworthiness of artificial intelligence models in presence of anomalous data | |
WO2021026034A1 (en) | Artificial intelligence job recommendation neural network machine learning training based on embedding technologies and actual and synthetic job transition latent information | |
CN114547257B (zh) | 类案匹配方法、装置、计算机设备及存储介质 | |
CN114492601A (zh) | 资源分类模型的训练方法、装置、电子设备及存储介质 | |
CN112052670A (zh) | 地址文本分词方法、装置、计算机设备和存储介质 | |
CN112508177A (zh) | 一种网络结构搜索方法、装置、电子设备及存储介质 | |
CN117851909B (zh) | 一种基于跳跃连接的多循环决策意图识别***及方法 | |
CN112052673A (zh) | 物流网点识别方法、装置、计算机设备和存储介质 | |
CN113407837A (zh) | 基于人工智能的智慧医疗大数据处理方法及智慧医疗*** | |
US20210065031A1 (en) | Network optimization | |
WO2011084238A1 (en) | Method and apparatus of adaptive categorization technique and solution for services selection based on pattern recognition | |
CN115878864A (zh) | 一种数据检索方法、装置、设备及可读存储介质 | |
CN114513578A (zh) | 外呼方法、装置、计算机设备及存储介质 | |
CN112732423B (zh) | 流程迁移方法、装置、设备及介质 | |
CN116432633A (zh) | 地址纠错方法、装置、计算机设备及可读介质 | |
US20220292529A1 (en) | Utilizing machine learning for optimization of planning and value realization for private networks | |
CN111737319B (zh) | 用户集群的预测方法、装置、计算机设备和存储介质 | |
CN114861818A (zh) | 基于人工智能的主数据匹配方法、装置、设备及存储介质 | |
CN109918486B (zh) | 智能客服的语料构建方法、装置、计算机设备及存储介质 | |
CN113657496A (zh) | 基于相似度匹配模型的信息匹配方法、装置、设备及介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |