CN106557896A - 网络数据处理方法、装置及*** - Google Patents

网络数据处理方法、装置及*** Download PDF

Info

Publication number
CN106557896A
CN106557896A CN201510623228.0A CN201510623228A CN106557896A CN 106557896 A CN106557896 A CN 106557896A CN 201510623228 A CN201510623228 A CN 201510623228A CN 106557896 A CN106557896 A CN 106557896A
Authority
CN
China
Prior art keywords
address
pending
subordinate
site
mark
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201510623228.0A
Other languages
English (en)
Inventor
凌宇
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Cainiao Smart Logistics Holding Ltd
Original Assignee
Alibaba Group Holding Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Alibaba Group Holding Ltd filed Critical Alibaba Group Holding Ltd
Priority to CN201510623228.0A priority Critical patent/CN106557896A/zh
Publication of CN106557896A publication Critical patent/CN106557896A/zh
Pending legal-status Critical Current

Links

Landscapes

  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本申请提供网络数据处理方法、装置及***,方法包括接收当前网点终端发送的待处理数据信息;其中,所述待处理数据信息包括物品的待处理地址、当前网点级别、当前网点标识以及当前主体标识,将待处理地址中与所述当前网点级别的下级网点级别对应的行政区划信息,确定为待处理地址关键词;在预设数据库的与当前主体标识对应的当前数据集合中,确定与所述当前网点标识的下级网点标识对应的下级数据集合;若在所述下级数据集合查找到与所述待处理地址关键词匹配成功的目标地址关键词,则推送与所述目标地址关键词对应的目标下级网点。本申请将确定物品的下级网点的过程在服务器上实现,由于避免人为操作过程,所以可以提高分类效率和准确率。

Description

网络数据处理方法、装置及***
技术领域
本申请涉及数据处理技术领域,尤其涉及网络数据处理方法、装置及***。
背景技术
随着网络技术的迅速发展,网购企业迅猛发展,与之俱增还有物流公司。近些年伴随着物流公司不断壮大,物流公司的网点已经覆盖我国大部分的地区。
为了实现物品的派送,在物流公司的网点中需要对物品进行分类,以便将物品分配至本网点的下级网点。目前,在物流公司中主要采用人工方式对物品进行分类,其过程大体为人工预先熟记本网点的各个下级网点的派送范围,再依据物品地址在人脑中判定出物品地址所对应的目标下级网点,将物品分配至目标下级网点;从而实现对物品进行分类的过程。
由于人工分类过程的效率和准确率较低,所以导致物品分类过程已经成为物流公司提高其业务水平的瓶颈。因此,现在需要一种可以自动对物品进行分类的方法,以便可以辅助本网点准确、快速地确定物品对应的下级网点,从而提高物品的分类效率和准确率。
发明内容
本申请提供了网络数据处理方法、装置及***,使用本申请可以辅助本网点准确、快速地确定物品对应的下级网点,从而提高物品的分类效率和准确率。
为了实现上述目的,本申请采用以下技术手段:
一种网络数据处理方法,包括:
接收当前网点终端发送的待处理数据信息;其中,所述待处理数据信息包括物品的待处理地址、当前网点级别、当前网点标识以及当前主体标识,所述当前主体标识为当前网点所归属主体的标识;
将所述待处理地址中与所述当前网点级别的下级网点级别对应的行政区划信息,确定为待处理地址关键词;其中,所述待处理地址包括多个行政区划信息,每个行政区划信息对应一个网点级别;
在预设数据库的与所述当前主体标识对应的当前数据集合中,确定与所述当前网点标识的下级网点标识对应的下级数据集合;其中,所述预设数据库包括多个主体标识以及与每个主体标识对应的数据集合,每个数据集合包括各个级别的网点标识以及与每个网点标识对应的地址关键词;所述下级数据集合包括若干个地址关键词,以及与每个地址关键词一一对应的下级网点标识;
若在所述下级数据集合查找到与所述待处理地址关键词匹配成功的目标地址关键词,则向所述当前网点终端发送与所述目标地址关键词对应的目标下级网点;其中,所述目标下级网点为所述下级数据集合中与所述目标地址关键词一一对应的下级网点。
优选的,所述将所述待处理地址中与所述当前网点级别的下级网点级别对应的行政区划信息,确定为待处理地址关键词,包括:
在所述当前网点级别为省级别的情况下,将所述待处理地址中与市级别对应的市行政区划信息,确定为所述待处理地址关键词;
在所述当前网点级别为市级别的情况下,将所述待处理地址中与县区级别对应的区行政区划信息,确定为所述待处理地址关键词;
在所述当前网点级别为县区级别的情况下,将所述待处理地址中与乡镇级别对应的乡镇行政区划信息,确定为所述待处理地址关键词,或者,将所述待处理地址中与承包区级别对应的承包区信息,确定为所述待处理地址关键词。
优选的,在所述下级数据集合查找到与所述待处理地址关键词匹配成功的目标地址关键词,包括:
在所述待处理地址关键词为市行政区划信息、区行政区划信息或乡镇行政区划信息的情况下,在所述下级数据集合中查找与所述待处理地址关键词完全一致的地址关键词;
将所述下级数据集合与所述待处理地址关键词完全一致的地址关键词,确定为与所述待处理地址关键词匹配成功的目标地址关键词。
优选的,待处理地址中与承包区级别对应的承包区信息的确定过程,包括:
将所述待处理地址中的待处理道路信息,确定为与承包区级别对应的承包区信息。
优选的,所述待处理道路信息包括待处理道路名称和待处理道路号码,并且,所述下级数据集合中的地址关键词包括与各个下级网点标识一一对应的道路信息;则在所述下级数据集合查找到与所述待处理地址关键词匹配成功的目标地址关键词,包括:
在所述下级数据集合查找与所述待处理道路名称完全一致,并且包含所述待处理道路号码的地址关键词;
将所述下级数据集合与所述待处理道路名称完全一致,并且包含所述待处理道路号码的地址关键词,确定为与所述待处理地址关键词匹配成功的目标地址关键词。
优选的,待处理地址中与承包区级别对应的承包区信息的确定过程,包括:
将所述待处理地址中的待处理兴趣点信息,确定为与承包区级别对应的承包区信息。
优选的,所述下级数据集合中的地址关键词包括与各个下级网点标识一一对应的兴趣点信息;则在所述下级数据集合查找到与所述待处理地址关键词匹配成功的目标地址关键词,包括:
计算所述待处理兴趣点信息与所述下级数据集合中的兴趣点信息的相似度;
将所述下级数据集合中与所述待处理兴趣点信息相似度最高的兴趣点信息,确定为所述目标地址关键词。
优选的,所述计算所述待处理兴趣点信息与所述下级数据集合中兴趣点信息的相似度,包括:
计算所述待处理兴趣点信息与所述兴趣点信息之间的编辑距离;其中,所述编辑距离为由所述待处理兴趣点信息转换为所述兴趣点信息所需的最少编辑操作次数,所述编辑操作包括将一个字符替换为另一字符,***一个字符,以及删除一个字符;
计算所述待处理兴趣点信息与所述兴趣点信息的公共子串的数量;其中,所述待处理兴趣点信息和所述兴趣点信息相同的字符中,相邻两个及两个以上的字符为一个公共子串;
根据所述编辑距离和公共子串的数量,按预设公式计算待处理兴趣点信息和所述兴趣点信息之间的相似度。
优选的,还包括:
接收一个主体标识以及与所述主体标识对应的最新数据集合;
在所述预设数据库中,确定与所述主体标识对应的已有数据集合;
利用所述最新数据集合更新所述已有数据集合。
一种网络数据处理方法,包括:
获取当前网点一个物品的待处理地址;
利用所述待处理地址、当前网点级别、当前网点标识以及当前主体标识,构建待处理数据信息;其中,所述当前主体标识为当前网点所归属主体的标识;
向服务器发送所述待处理数据信息;
其中,所述待处理数据信息可被服务器用于,接收当前网点终端发送的待处理数据信息;将所述待处理地址中与所述当前网点级别的下级网点级别对应的行政区划信息,确定为待处理地址关键词;其中,所述待处理地址包括多个行政区划信息,每个行政区划信息对应一个网点级别;在预设数据库的与所述当前主体标识对应的当前数据集合中,确定与所述当前网点标识的下级网点标识对应的下级数据集合;其中,所述预设数据库包括多个主体标识以及与每个主体标识对应的数据集合,每个数据集合包括各个级别的网点标识以及与每个网点标识对应的地址关键词;所述下级数据集合包括若干个地址关键词,以及与每个地址关键词一一对应的下级网点标识;若在所述下级数据集合查找到与所述待处理地址关键词匹配成功的目标地址关键词,则向所述当前网点终端发送与所述目标地址关键词对应的目标下级网点;其中,所述目标下级网点为所述下级数据集合中与所述目标地址关键词一一对应的下级网点。
优选的,所述获取待处理地址包括:
接收用户通过输入设备输入的待处理地址;或
接收扫描设备发送的所述待处理地址,其中,所述待处理地址由所述扫描设备以扫描二维码或条形码的方式获得。
优选的,还包括:
接收服务器发送的与所述目标地址关键词对应的目标下级网点。
优选的,还包括:
向所述服务器发送当前主体标识以及与所述当前主体标识对应的最新数据集合。
一种网络数据处理装置,包括:
第一接收单元,用于接收当前网点终端发送的待处理数据信息;其中,所述待处理数据信息包括物品的待处理地址、当前网点级别、当前网点标识以及当前主体标识,所述当前主体标识为当前网点所归属主体的标识;
第一确定单元,用于将所述待处理地址中与所述当前网点级别的下级网点级别对应的行政区划信息,确定为待处理地址关键词;其中,所述待处理地址包括多个行政区划信息,每个行政区划信息对应一个网点级别;
第二确定单元,用于在预设数据库与所述当前主体标识对应的当前数据集合中,确定与所述当前网点标识的下级网点标识对应的下级数据集合;其中,所述预设数据库包括多个主体标识以及与每个主体标识对应的数据集合,每个数据集合包括各个级别的网点标识以及与每个网点标识对应的地址关键词;所述下级数据集合包括若干个地址关键词,以及与每个地址关键词一一对应的下级网点标识;
查找目标地址关键词单元,用于在所述下级数据集合查找到与所述待处理地址关键词匹配成功的目标地址关键词;
第一发送单元,用于若在所述下级数据集合查找到与所述待处理地址关键词匹配成功的目标地址关键词,则向所述当前网点终端发送与所述目标地址关键词对应的目标下级网点;其中,所述目标下级网点为所述下级数据集合中与所述目标地址关键词一一对应的下级网点。
优选的,所述第一确定单元,包括:
省级确定单元,用于在所述当前网点级别为省级别的情况下,将所述待处理地址中与市级别对应的市行政区划信息,确定为所述待处理地址关键词;
市级确定单元,用于在所述当前网点级别为市级别的情况下,将所述待处理地址中与县区级别对应的区行政区划信息,确定为所述待处理地址关键词;
县区级确定单元,用于在所述当前网点级别为县区级别的情况下,将所述待处理地址中与乡镇级别对应的乡镇行政区划信息,确定为所述待处理地址关键词,或者,将所述待处理地址中与承包区级别对应的承包区信息,确定为所述待处理地址关键词。
优选的,所述查找目标地址关键词单元,包括:
第一查找单元,用于在所述待处理地址关键词为市行政区划信息、区行政区划信息或乡镇行政区划信息的情况下,在所述下级数据集合中查找与所述待处理地址关键词完全一致的地址关键词;
第一目标地址关键词确定单元,用于将所述下级数据集合与所述待处理地址关键词完全一致的地址关键词,确定为与所述待处理地址关键词匹配成功的目标地址关键词。
优选的,与承包区级别对应的承包区信息为所述待处理地址中的待处理道路信息,所述待处理道路信息包括待处理道路名称和待处理道路号码,并且,所述下级数据集合中的地址关键词包括与各个下级网点标识一一对应的道路信息;则在所述查找目标地址关键词单元包括:
第二查找单元,用于在所述下级数据集合查找与所述待处理道路名称完全一致,并且包含所述待处理道路号码的地址关键词;
第二目标地址关键词确定单元,用于将所述下级数据集合与所述待处理道路名称完全一致,并且包含所述待处理道路号码的地址关键词,确定为与所述待处理地址关键词匹配成功的目标地址关键词。
优选的,其特征在于,与承包区级别对应的承包区信息为所述待处理地址中的待处理兴趣点信息,所述下级数据集合中的地址关键词包括与各个下级网点标识一一对应的兴趣点信息;则所述查找目标地址关键词单元包括:
计算相似度单元,用于计算所述待处理兴趣点信息与所述下级数据集合中的兴趣点信息的相似度;
第三目标地址关键词确定单元,用于将所述下级数据集合中与所述待处理兴趣点信息相似度最高的兴趣点信息,确定为所述目标地址关键词。
优选的,所述计算相似度单元,包括:
计算编辑距离单元,用于计算所述待处理兴趣点信息与所述兴趣点信息之间的编辑距离;其中,所述编辑距离为由所述待处理兴趣点信息转换为所述兴趣点信息所需的最少编辑操作次数,所述编辑操作包括将一个字符替换为另一字符,***一个字符,以及删除一个字符;
计算公共子串单元,用于计算所述待处理兴趣点信息与所述兴趣点信息的公共子串的数量;其中,所述待处理兴趣点信息和所述兴趣点信息相同的字符中,相邻两个及两个以上的字符为一个公共子串;
计算单元,用于根据所述编辑距离和公共子串的数量,按预设公式计算待处理兴趣点信息和所述兴趣点信息之间的相似度。
优选的,还包括:
更新单元,用于接收一个主体标识以及与所述主体标识对应的最新数据集合;在所述预设数据库中,确定与所述主体标识对应的已有数据集合;利用所述最新数据集合更新所述已有数据集合。
一种网络数据处理装置,包括:
获取单元,用于获取当前网点一个物品的待处理地址;
构建单元,用于利用所述待处理地址、当前网点级别、当前网点标识以及当前主体标识,构建待处理数据信息;其中,所述当前主体标识为当前网点所归属主体的标识;
第二发送单元,用于向服务器发送所述待处理数据信息;
其中,所述待处理数据信息可被服务器用于,接收当前网点终端发送的待处理数据信息;将所述待处理地址中与所述当前网点级别的下级网点级别对应的行政区划信息,确定为待处理地址关键词;其中,所述待处理地址包括多个行政区划信息,每个行政区划信息对应一个网点级别;在预设数据库的与所述当前主体标识对应的当前数据集合中,确定与所述当前网点标识的下级网点标识对应的下级数据集合;其中,所述预设数据库包括多个主体标识以及与每个主体标识对应的数据集合,每个数据集合包括各个级别的网点标识以及与每个网点标识对应的地址关键词;所述下级数据集合包括若干个地址关键词,以及与每个地址关键词一一对应的下级网点标识;若在所述下级数据集合查找到与所述待处理地址关键词匹配成功的目标地址关键词,则向所述当前网点终端发送与所述目标地址关键词对应的目标下级网点;其中,所述目标下级网点为所述下级数据集合中与所述目标地址关键词一一对应的下级网点。
优选的,所述获取单元具体用于,接收用户通过输入设备输入的待处理地址;或用于接收扫描设备发送的所述待处理地址,其中,所述待处理地址由所述扫描设备以扫描二维码或条形码的方式获得。
优选的,第二接收单元,用于接收服务器发送的与所述目标地址关键词对应的目标下级网点。
优选的,还包括:
发送数据单元,用于向所述服务器发送当前主体标识以及与所述当前主体标识对应的最新数据集合。
一种网络数据处理***,包括:
服务器,与所述服务器相连的若干个网点终端;所述若干个网点中任一网点终端为当前网点终端;
所述当前网点终端,用于获取当前网点一个物品的待处理地址;利用所述待处理地址、当前网点级别、当前网点标识以及当前主体标识,构建待处理数据信息;其中,所述当前主体标识为当前网点所归属主体的标识;向服务器发送所述待处理数据信息;
所述服务器,用于接收当前网点终端发送的待处理数据信息;将所述待处理地址中与所述当前网点级别的下级网点级别对应的行政区划信息,确定为待处理地址关键词;其中,所述待处理地址包括多个行政区划信息,每个行政区划信息对应一个网点级别;在预设数据库与所述当前主体标识对应的当前数据集合中,确定与所述当前网点标识的下级网点标识对应的下级数据集合;其中,所述预设数据库包括多个主体标识以及与每个主体标识对应的数据集合,每个数据集合包括各个级别的网点标识以及与每个网点标识对应的地址关键词;所述下级数据集合包括若干个地址关键词,以及与每个地址关键词一一对应的下级网点标识;若在所述下级数据集合查找到与所述待处理地址关键词匹配成功的目标地址关键词,则向所述当前网点终端发送与所述目标地址关键词对应的目标下级网点;其中,所述目标下级网点为所述下级数据集合中与所述目标地址关键词一一对应的下级网点。
从上述内容可以看出本申请具有以下技术手段:
本申请在服务器的预设数据库中存储有各个主体的数据集合,数据集合中包括各个级别的网点标识以及与每个网点标识对应的地址关键词;这个过程可以替代人工记忆下级网点的派送范围的过程。在服务器接收一个待处理数据信息之后,在待处理地址确定出与数据集合进行匹配的待查询地址关键词,并将待查询地址关键词与下级数据集合进行匹配,从而匹得到与待查询地址关键词对应的目标下级网点;这一过程替代人工在人脑中判定物品的下级网点的过程。
本申请将确定物品的下级网点的过程在服务器上实现,由于避免了人为操作过程,所以可以提高分类效率和准确率。
附图说明
为了更清楚地说明本申请实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本申请的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1为本申请实施例公开的网络数据处理***的结构示意图;
图2为本申请实施例公开的网络数据处理***中构建预设数据库的流程图;
图3为本申请实施例公开的网络数据处理***中更新预设数据库的流程图;
图4为本申请实施例公开的网络数据处理方法的流程图;
图5为本申请实施例公开的又一网络数据处理方法的流程图;
图6为本申请实施例公开的又一网络数据处理方法的流程图;
图7为本申请实施例公开的又一网络数据处理方法的流程图;
图8为本申请实施例公开的又一网络数据处理方法的流程图;
图9为本申请实施例公开的又一网络数据处理方法的流程图;
图10为本申请实施例公开的网络数据处理装置的结构示意图;
图11为本申请实施例公开的网络数据处理装置中第一确定单元的结构示意图;
图12为本申请实施例公开的网络数据处理装置中查找目标地址关键词单元的结构示意图;
图13为本申请实施例公开的网络数据处理装置中又一查找目标地址关键词单元的结构示意图;
图14为本申请实施例公开的网络数据处理装置中又一查找目标地址关键词单元的结构示意图;
图15为本申请实施例公开的网络数据处理装置中计算相似度单元的结构示意图;
图16为本申请实施例公开的又一网络数据处理装置的结构示意图。
具体实施方式
下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本申请一部分实施例,而不是全部的实施例。基于本申请中的实施例,本领域普通技术人员所获得的所有其他实施例,都属于本申请保护的范围。
以一个物流公司为例,一个物流公司下设有多个级别网点,例如,省级别网点、市级别网点、县区级别网点、承包区级别网点以及乡镇级别网点,其中,承包区级别网点与乡镇级别网点处于同一级别。在物流公司中各个级别网点可以具有多个网点,例如,全国一共有23个省,则一个物流公司则可以具有23个省级级别网点。
在物流公司中,物品分类过程即为在本级别网点中确定物品的下级网点的过程。本申请为了实现物品自动化分类过程,为各个物流公司的每个网点设立一个或多个终端,与每个网点对应的终端称为网点终端;一个物流公司的所有网点的网点终端的集合称为主体。由于主体为该物流公司所有网点终端的集合,所以主体可以从侧面反应物流公司,即主体相当于物流公司。并且,一个与网点对应的网点终端具有该网点的所有属性。
比如,一个网点具有的属性为网点级别1、网点标识1以及网点所归属物流公司的标识1,则网点对应的网点终端也具有网点终端级别(与网点级别1相同)、网点标识(与网点标识1相同)以及主体标识(与网点所归属物流公司的标识1相同)。
为了实现自动化分类过程,本申请提供了一种网络数据处理***。参见图1,本申请提供了一种网络数据处理***的实施例,包括:
服务器100,与所述服务器100相连的若干个网点终端200。
由于一个主体下包括若干个网点终端(即一个物流公司下具有多个网点),每个主体的网点终端均可以与服务器100相连,从而利用服务器100实现物品分类过程;所以,与服务器100相连的若干个网点终端100为各个主体中的网点终端。
为了实现自动化分类过程,首先在服务器100上存储多个物流公司的各个级别网点的派送范围,在本申请将一个物流公司的派送范围,采用地址关键词的方式表示。例如,一个网点的派送范围为“北京市”,则采用地址关键词“北京”来表示该网点的派送范围;再如,一个网点的派送范围为“裕华路001号-100号”,则采用地址关键词“裕华路001号-100号”,来表示该网点的派送范围。
可见,本申请可以利用各个网点的地址关键词,表示各个网点的派送范围。那么,一个物流公司的派送范围,可以采用各个网点的地址关键词的集合表示。即各个网点标识与各个网点标识对应的地址关键词组成一个主体的数据集合,将该主体的数据集合作为物流公司的派送范围。
下面详细介绍在服务器上存储各个物流公司的派送范围的过程,如图2所示,包括以下步骤:
步骤S201:预先接收多个主体标识以及与每个主体标识对应的数据集合;每个数据集合包括各个级别的网点标识以及与每个网点标识对应的地址关键词。
服务器可以接收网点终端发送的各个主体的数据集合,或者由其它服务器发送的各个主体的数据集合。每个主体的数据集合包括与各个级别对应的数据集合。例如,与省级别对应省级数据集合,与市级别对应的市级数据集合,与县区级别对应的县区数据集合等。每个级别的数据集合中均为该级别派送范围的地址关键词,以及与每个地址关键词对应的网点标识。
步骤S202:将各个主体数据集合与各个主体标识对应存储。
由于服务器存储有多个主体的数据集合,为了区分各个物流公司的数据集合,将各个主体的数据集合与各个主体标识对应存储。服务器可以各个主体标识以及与各个主体标识对应的数据集合,作为用于表示各个物流公司派送范围的预设数据库。
在本实施例中,该预设数据库的各个主体集合以树形结构进行存储。以一个主体的数据集合为例,在数据集合最上层的父节点为各个省级数据集合,二级叶子节点为市级数据集合,三级叶子节点为县区数据集合,四级叶子节点乡镇数据集合或承包区数据集合;承包区数据集合可以为道路信息集合或兴趣点信息集合。
在执行图2所示的过程之后,服务器上便存储有与各个主体对应的数据集合,每个数据集合包括各个级别的网点标识以及与每个网点标识对应的地址关键词。后续过程中可以在服务器上依据各个级别网点的数据集合,来确定物品的下级网点。
由于服务器在后续过程中需要依据预设数据库来确定物品的下级网点,为了保证物品分类的准确性,需要持续保持预设数据库准确性。预设数据库即为各个主体标识的数据集合。但是每个物流公司中各个级别的派送范围并不是一成不变的,即每个主体的数据集合不是一成不变的,而是会发生变化的。因此,服务器可以更新已有的数据集合,以便保持各个主体的数据集合始终维持在最新状态。
下面介绍服务器更新数据集合的过程,参见图3,包括以下步骤:
步骤S301:接收所述主体标识以及与所述主体标识对应的最新数据集合。
在一个主体的数据集合发生变化的时候,网点终端可以获取最新数据集合,然后网点终端向服务器发送最新数据集合以及主体标识。服务器可以接收网点终端发送的主体标识以及最新数据集合。
步骤S302:在所述预设数据库中,确定与所述主体标识对应的已有数据集合。
预设数据库有多个主体标识以及与每个主体标识对应的数据集合;所以服务器在接收主体标识以及最新数据集合之后,可以依据主体标识在预设数据库中确定与主体标识对应的已有数据集合。
步骤S303:利用所述最新数据集合更新所述已有数据集合。
在确定与主体标识对应的已有数据集合之后,然后利用最新数据集合替换已有数据集合,从而实现更新预设数据库的目的。
通过图3所示的过程,可以使得各个主体的数据集合始终维持在最新状态。
上述内容详细介绍一种网络数据处理***,以及在服务器上存储各个主体的数据集合的过程。在后续过程中,网点终端可以向服务器发送物品的待处理数据信息,服务器便可以依据待处理数据信息来确定物品的下级网点。
由于服务器针对每个网点终端的执行过程均是一致的,所以,将若干个网点终端中一个网点终端作为当前网点终端,以当前网点终端为例对本申请的执行过程进行详细说明。可以理解的是,其它网点终端的执行过程与当前网点终端的执行过程是一致的。
在上述网络数据处理***的基础上,本申请还提供了一种网络数据处理方法,应用于服务器。参见图4,所述方法具体包括:
步骤S401:接收当前网点终端发送的待处理数据信息;其中,所述待处理数据信息包括物品的待处理地址、当前网点级别、当前网点标识以及当前主体标识,所述当前主体标识为当前网点所归属主体的标识。
服务器可以接收当前网点终端发送的待处理数据信息,利用待处理数据信息,在服务器中确定物品的下级网点。
步骤S402:将所述待处理地址中与所述当前网点级别的下级网点级别对应的行政区划信息,确定为待处理地址关键词;其中,所述待处理地址包括多个行政区划信息,每个行政区划信息对应一个网点级别。
为了确定物品的下级网点,物品的待处理地址中确定待处理地址关键词,通过待处理地址关键词来确定物品的下级网点。
由于一个主体具有多个级别网点,不同级别网点所使用的地址关键词是不同的,所以可以根据本网点的级别在待处理地址中提取相应的地址关键词,然后,在根据地址关键词在在服务器中确定下级网点。
确定待处理关键词的步骤具体可以分为以下三种情况:
第一种情况:在所述当前网点级别为省级别的情况下,将所述待处理地址中与市级别对应的市行政区划信息,确定为所述待处理地址关键词。
在待处理数据信息中可以获得当前网点终端的当前网点级别,在当前网点级别为省级别的情况下,说明物品应该分类至省级别的下级网点:市级别网点。为此,本申请在待处理地址中确定与市级别对应的行政区域信息。
例如,假设待处理地址为“河北省保定市北市区人民检察院”,则可以在待处理地址中提取“保定市”,将“保定市”确定为待处理地址关键词。
第二种情况:在所述当前网点级别为市级别的情况下,将所述待处理地址中与县区级别对应的区行政区划信息,确定为所述待处理地址关键词。
在待处理数据信息中获得当前网点终端的当前网点级别,在当前网点级别为市级别的情况下,说明物品应该分类至市级别的下级网点:县区级别网点。为此,本申请在待处理地址中确定与县区级别对应的行政区域信息。
例如,假设待处理地址为“河北省保定市北市区人民检察院”,则可以在待处理地址中提取“北市区”,将“北市区”确定为待处理地址关键词。
第三种情况:在所述当前网点级别为县区级别的情况下,将所述待处理地址中与乡镇级别对应的乡镇行政区划信息,确定为所述待处理地址关键词,或者,将所述待处理地址中与承包区级别对应的承包区信息,确定为所述待处理地址关键词。
在待处理数据信息中获得当前网点终端的当前网点级别,在当前网点级别为县区级别的情况下,说明物品应该分类至县区级别的下级网点:乡镇级别网点或承包区网点。
县区级别网点的下级网点可以分为两种:乡镇级别网点和承包区网点。针对乡镇级别网点和承包区网点,在确定待处理地址关键词的是不同的,下面针对乡镇级别网点和承包区网点分别进行详细介绍:
乡镇级别网点即为该物品需要派送至县区级别网点的下级乡镇,因此可以在待处理地址中提取与乡镇级别对应的乡镇行政区划信息,确定为所述待处理地址关键词。例如,假设待处理地址为“河北省保定市满城县神星镇”,则可以在待处理地址中提取“神星镇”,将“神星镇”确定为待处理地址关键词。
承包区网点即为该物品需要派送至县区级别网点的下级承包区,因此,可以在待处理地址中提取与承包区级别对应的承包区信息,确定为所述待处理地址关键词。
在确定与承包区级别对应的承包区信息时,可以分为两种方式:
第一种方式:将所述待处理地址中的待处理道路信息,确定为与承包区级别对应的承包区信息。
由于承包区级别基本是按道路划分的,因此,可以将待处理地址中的道路信息,作为待处理道路信息,并将待处理道路信息确定为承包区信息。
例如,待处理地址为“河北省保定市新市区云杉路86号大志电器”,则可以在待处理地址中的“云杉路86号”确定为与承包区级别对应承包区信息,然后可以将待处理道路信息“云杉路86号”,确定为待处理地址关键词。
第二种方式:将所述待处理地址中的待处理兴趣点信息,确定为与承包区级别对应的承包区信息。
由于承包区级别在一些情况下可以按兴趣点划分,因此,可以将待处理地址中的兴趣点信息,作为待处理兴趣点信息,并将待处理兴趣点信息确定为承包区信息。
例如,待处理地址为“河北省保定市新市区云杉路86号大志电器”,则可以在待处理地址中的兴趣点信息“大志电器”确定为与承包区级别对应承包区信息,然后可以将待处理兴趣点信息“云杉路86号”,确定为待处理地址关键词。
步骤S403:在预设数据库的与所述当前主体标识对应的当前数据集合中,确定与所述当前网点标识的下级网点标识对应的下级数据集合;其中,所述预设数据库包括多个主体标识以及与每个主体标识对应的数据集合,每个数据集合包括各个级别的网点标识以及与每个网点标识对应的地址关键词;所述下级数据集合包括若干个地址关键词,以及与每个地址关键词一一对应的下级网点标识。
在预设数据库有与多个主体标识对应的数据集合,不同的主题标识对应的数据集合为不同物流公司的派送范围,因此需要在预设数据库中查找到与当前主体标识对应的当前数据集合,当前数据集合用来表示与当前网点终端所归属物流公司的派送范围。
在每个数据集合中具有与各个级别网点标识对应的数据集合,根据待处理数据信息中的当前网点级别和当前网点标识,确定与当前网点标识的下级网点标识对应的下级数据集合。下级数据集合包括下级网点标识和下级网点标识对应的若干个地址关键词。每个地址关键词均对应一个下级网点标识。
步骤S404:若在所述下级数据集合查找到与所述待处理地址关键词匹配成功的目标地址关键词,则向所述当前网点终端发送与所述目标地址关键词对应的目标下级网点;其中,所述目标下级网点为所述下级数据集合中与所述目标地址关键词一一对应的下级网点。
在步骤S403中查询得到下级数据集合查找与待查询的地址关键词匹配的地址关键词,若查找到与待查询地址关键词匹配成功的地址关键词,则将待地址关键词确定为目标地址关键词。
在下级数据集合中确定与匹配成功的地址关键词对应的下级网点,将该下级网点确定为物品的目标下级网点,即本申请最终确定的目标下级网点。在确定目标下级网点之后,服务器可以向当前网点终端推送目标下级网点。以便当前网点终端显示所述目标下级网点,供用户查看物品的下级网点,从而实现物品分类的过程。
从上述内容可以看出,本申请具有以下有益效果:本申请在服务器的预设数据库中存储有各个主体的数据集合,数据集合中包括各个级别的网点标识以及与每个网点标识对应的地址关键词;这个过程类似于人工记忆下级网点的派送范围的过程。在服务器接收一个待处理数据信息之后,在待处理地址确定出与数据集合进行匹配的待查询地址关键词,并将待查询地址关键词与下级数据集合进行匹配,从而匹得到与待查询地址关键词对应的目标下级网点;这一过程为人工在人脑中判定物品的下级网点的过程。
本申请将确定物品的下级网点的过程在服务器上实现,由于避免了人为操作过程,所以可以提高分类效率和准确率。
针对图4所示的步骤S404,下面介绍查找与待查询的地址关键词匹配的地址关键词的几种情况:
第一种情况:精确查询。
如图5所示,第一情况可以包括以下步骤:
步骤S501:在所述待处理地址关键词为市行政区划信息、县区行政区划信息或乡镇行政区划信息的情况下,在所述下级数据集合中查找与所述待处理地址关键词完全一致的地址关键词。
通过步骤S402所示的几种情况,可以看出本申请待处理地址关键词具有以下几种情况,市行政区划信息、县区行政区划信息、乡镇行政区划信息、承包区信息四种信息,在以上四种信息中市行政区划信息、县区行政区划信息和乡镇行政区划信息三种信息,在与下级数据集合中的地址关键词进行匹配时,一般采用精确匹配。因为采用模糊匹配的话,可能会导致匹配结果不精确,而出现误操作的问题。
步骤S502:将所述下级数据集合与所述待处理地址关键词完全一致的地址关键词,确定为与所述待处理地址关键词匹配成功的目标地址关键词。
在第一种情况中,介绍待处理地址关键词为市行政区划信息、县区行政区划信息和乡镇行政区划信息的情况,下面介绍待处理地址关键词为承包区信息的情况。由于承包区信息又可以分为待处理道路信息和待处理兴趣点信息,下面分两种方式对承包区信息作为待处理地址关键词时的查询过程进行详细介绍:
第二种情况:待处理地址关键词为待处理道路信息。所述待处理道路信息包括待处理道路名称和待处理道路号码,并且,所述下级数据集合中的地址关键词包括与各个下级网点标识一一对应的道路信息。
如图6所示,第二种情况包括以下步骤:
步骤S601:在所述下级数据集合查找与所述待处理道路名称完全一致,并且包含所述待处理道路号码的地址关键词。
下级数据集合的地址关键词中包含与各个下级网点标识一一对应的道路信息,一般情况下,一个网点标识对应的道路信息包括道路名称和道路号码范围。例如,“裕华路001号-100号”。
可以将待处理道路信息的名称为与下级数据集合中各个道路名称进行匹配,查找与待处理道路名称完全一致的地址关键词的道路名称。在匹配成功后,即查找到与待处理道路名称一致的地址关键词之后,再判断待处理道路号码是否在地址关键词的道路号码范围内,如果待处理道路号码在地址关键词的道路号码范围内,则确定该地址关键词为与待处理地址关键词匹配成功的地址关键词。
步骤S602:将所述下级数据集合与所述待处理道路名称完全一致,并且包含所述待处理道路号码的地址关键词,确定为与所述待处理地址关键词匹配成功的目标地址关键词。
第三种情况:待处理地址关键词为待处理道路信息。所述下级数据集合中的地址关键词包括与各个下级网点标识一一对应的兴趣点信息;则在所述下级数据集合查找到与所述待处理地址关键词匹配成功的目标地址关键词。
如图7所示,针对第三种情况,具体包括步骤:
步骤S701:计算所述待处理兴趣点信息与所述下级数据集合中的兴趣点信息的相似度。
由于兴趣点信息可以为建筑物名称,但是人们对建筑物名称通常会有简称。例如,“XX科学技术研究院”,可以被简称为“XX研究院”或者“XX科研院”。因此,针对兴趣点信息进行精确匹配,而进行模糊匹配。
但是为了保证匹配的精确度,本申请计算待处理兴趣点与下级数据集合中所有兴趣点的之间的相似度。可以理解的是,相似度越高待处理兴趣点信息与兴趣点信息的匹配程度就越高。
待处理兴趣点信息和兴趣点信息均为字符串,目前计算字符串相似度的方法可以有计算两个字符串的余弦距离,距离越小代表相似度越高。或者,计算两个字符串的编辑距离,编辑距离越小表示两者的相似度越高。当然还可以采用其它方式来计算两个字符串之间的相似度,即计算待处理兴趣点信息和兴趣点信息的相似度。
步骤S702:将所述下级数据集合中与所述待处理兴趣点信息相似度最高的兴趣点信息,确定为所述目标地址关键词。
在下级数据集合中确定出与待处理兴趣点信息相似度最高的兴趣点信息,该兴趣点信息为与待处理兴趣点最接近的兴趣点信息,因此可以认为两者是一致的。然后将兴趣点信息确定为与待处理兴趣点信息对应的目标地址关键词。
如图8所示,下面介绍一种确定相似度的过程。
步骤S801:计算所述待处理兴趣点信息与所述兴趣点信息之间的编辑距离;其中,所述编辑距离为由所述待处理兴趣点信息转换为所述兴趣点信息所需的最少编辑操作次数,所述编辑操作包括将一个字符替换为另一字符,***一个字符,以及删除一个字符。
以待处理兴趣点信息为“浙江工业大学”,兴趣点信息为“浙江理工大学”为例对计算待处理兴趣点信息和兴趣点信息的相似度的过程进行详细介绍。
首先,计算待处理兴趣点信息与所述兴趣点信息之间的编辑距离,其中,所述编辑距离指由所述待处理兴趣点信息转换为所述兴趣点信息所需的最少编辑操作次数。从“浙江工业大学”转换为“浙江理工大学”的过称为:即将“工”替换为“理”,将“业”替换为“工”;因此,待处理兴趣点信息与兴趣点信息之间的编辑距离为2。
步骤S802:计算所述待处理兴趣点信息与所述兴趣点信息的公共子串的数量;其中,所述待处理兴趣点信息和所述兴趣点信息相同的字符中,相邻两个及两个以上的字符为一个公共子串。
首先,确定待处理兴趣点信息与兴趣点信息的公共子串,从待处理兴趣点“浙江工业大学”与兴趣点信息“浙江理工大学”发现,“浙江”一个公共子串,“大学”是一个公共子串。因此,待处理兴趣点信息和兴趣点信息的公共子串的数量为2。
步骤S803:根据所述编辑距离和公共子串的数量,按预设公式计算待处理兴趣点信息和所述兴趣点信息之间的相似度。
假设预设公式为:相似度=S2*[1+p/(S1+1)]。其中,S1为编辑距离,S2为公共子串的数量,p为可调节参数,具体数值可以根据具体情况而定。当然还可以采用其它公式来综合考虑编辑距离和公共子串的数量,从而得到待处理兴趣点信息和兴趣点信息的相似度。
按照图8所示的步骤,即可计算得到待处理兴趣点信息和兴趣点信息的相似度。
以上为服务器依据待处理数据确定目标下级网点的过程,下面介绍当前网点终端构建待处理数据的过程。参见图9,本申请还提供一种网络数据处理方法,应用于当前网点终端,所述方法包括:
步骤S901:获取当前网点一个物品的待处理地址。
用户可以在当前网点选择一个物品,该物品需要被分配至与物品地址对应的目标下级网点。为了实现自动化确定物品目标下级网点的过程,可以在当前网点对应的当前网点终端确定物品的待处理数据信息,然后由服务器依据待处理数据信息确定物品的下级网点。
由服务器的处理过程可以得知,待处理数据信息包括待处理地址、当前网点级别、当前网点标识以及当前主体标识,所述当前主体标识为当前网点所归属主体的标识。
为此,首先获得物品的待处理地址,当前网点终端获取物品的待处理地址的方式可以有以下两种方式:
第一种方式:接收用户通过输入设备输入的待处理地址。
用户可以利用与当前网点设备相连的输入设备,或者,当前网点设备自身的输入设备(例如,键盘等设备)来向当前网点终端输入待处理地址。该方式较为缓慢,且容易出错。
第二种方式:接收扫描设备扫描二维码或条形码的方式获得的所述待处理地址。
现在物品的包装上一般有二维码或条形码,在二维码或者条形码中包含有物品的相关信息,当二维码或条形码上有物品的地址信息时,可以通过扫描二维码或者条形码的方式来获取待处理地址。
步骤S902:利用所述待处理地址、当前网点级别、当前网点标识以及当前主体标识,构建待处理数据信息;其中,所述当前主体标识为当前网点所归属主体的标识。
在当前网点终端上,设有当前网点的当前网点级别、当前网点标识以及当前网点所归属物流公司的当前主体标识,因此,在获得物品的待处理地址之后,便可以利用待处理地址、当前网点级别、当前网点标识以及当前主体标识,构建待处理数据信息。
步骤S903:向服务器发送所述待处理数据信息。
当前网点终端可以通过无线通信方式向服务器发送待处理数据信息。以便服务器可以采用图4所示实施例的方式,来对待处理数据信息进行进一步处理,从而确定物品的目标下级网点,然后再将目标下级网点发送至当前网点终端。
当前网点终端在接收到服务器发送的目标下级网点之后,则显示所述目标下级网点,以便用户可以查看目标下级网点,并将物品分类至目标下级网点。
与图4所示的实施例相对应,如图10所示,本申请还提供了一种网络数据处理装置,包括:
第一接收单元101,用于接收当前网点终端发送的待处理数据信息;其中,所述待处理数据信息包括物品的待处理地址、当前网点级别、当前网点标识以及当前主体标识,所述当前主体标识为当前网点所归属主体的标识;
第一确定单元102,用于将所述待处理地址中与所述当前网点级别的下级网点级别对应的行政区划信息,确定为待处理地址关键词;其中,所述待处理地址包括多个行政区划信息,每个行政区划信息对应一个网点级别;
第二确定单元103,用于在预设数据库与所述当前主体标识对应的当前数据集合中,确定与所述当前网点标识的下级网点标识对应的下级数据集合;其中,所述预设数据库包括多个主体标识以及与每个主体标识对应的数据集合,每个数据集合包括各个级别的网点标识以及与每个网点标识对应的地址关键词;所述下级数据集合包括若干个地址关键词,以及与每个地址关键词一一对应的下级网点标识;
查找目标地址关键词单元104,用于在所述下级数据集合查找到与所述待处理地址关键词匹配成功的目标地址关键词;
第一发送单元105,用于若在所述下级数据集合查找到与所述待处理地址关键词匹配成功的目标地址关键词,则向所述当前网点终端发送与所述目标地址关键词对应的目标下级网点;其中,所述目标下级网点为所述下级数据集合中与所述目标地址关键词一一对应的下级网点。
此外,本申请提供的一种网络数据处理装置,还包括:
更新单元106,用于接收一个主体标识以及与所述主体标识对应的最新数据集合;在所述预设数据库中,确定与所述主体标识对应的已有数据集合;利用所述最新数据集合更新所述已有数据集合。
如图11所示,所述第一确定单元102,包括:
省级确定单元111,用于在所述当前网点级别为省级别的情况下,将所述待处理地址中与市级别对应的市行政区划信息,确定为所述待处理地址关键词;
市级确定单元112,用于在所述当前网点级别为市级别的情况下,将所述待处理地址中与县区级别对应的区行政区划信息,确定为所述待处理地址关键词;
县区级确定单元113,用于在所述当前网点级别为县区级别的情况下,将所述待处理地址中与乡镇级别对应的乡镇行政区划信息,确定为所述待处理地址关键词,或者,将所述待处理地址中与承包区级别对应的承包区信息,确定为所述待处理地址关键词。
图10中的查找目标地址关键词单元104,可以有以下三种具体实现方式:
如图12所示为查找目标地址关键词单元104的第一种实现方式:
第一查找单元121,用于在所述待处理地址关键词为市行政区划信息、区行政区划信息或乡镇行政区划信息的情况下,在所述下级数据集合中查找与所述待处理地址关键词完全一致的地址关键词;
第一目标地址关键词确定单元122,用于将所述下级数据集合与所述待处理地址关键词完全一致的地址关键词,确定为与所述待处理地址关键词匹配成功的目标地址关键词。
如图13所示,为查找目标地址关键词单元104第二种实现方式:
在第二种实现方式中,与承包区级别对应的承包区信息为所述待处理地址中的待处理道路信息,所述待处理道路信息包括待处理道路名称和待处理道路号码,并且,所述下级数据集合中的地址关键词包括与各个下级网点标识一一对应的道路信息。
那么,查找目标地址关键词单元104具体包括:
第二查找单元131,用于在所述下级数据集合查找与所述待处理道路名称完全一致,并且包含所述待处理道路号码的地址关键词;
第二目标地址关键词确定单元132,用于将所述下级数据集合与所述待处理道路名称完全一致,并且包含所述待处理道路号码的地址关键词,确定为与所述待处理地址关键词匹配成功的目标地址关键词。
如图14所示,为查找目标地址关键词单元104第三种实现方式:
在第三种实现方式中,与承包区级别对应的承包区信息为所述待处理地址中的待处理兴趣点信息,所述下级数据集合中的地址关键词包括与各个下级网点标识一一对应的兴趣点信息。那么,所述查找目标地址关键词单元104包括:
计算相似度单元141,用于计算所述待处理兴趣点信息与所述下级数据集合中的兴趣点信息的相似度;
第三目标地址关键词确定单元142,用于将所述下级数据集合中与所述待处理兴趣点信息相似度最高的兴趣点信息,确定为所述目标地址关键词。
如图15所示,所述计算相似度单元141,包括:
计算编辑距离单元151,用于计算所述待处理兴趣点信息与所述兴趣点信息之间的编辑距离;其中,所述编辑距离为由所述待处理兴趣点信息转换为所述兴趣点信息所需的最少编辑操作次数,所述编辑操作包括将一个字符替换为另一字符,***一个字符,以及删除一个字符;
计算公共子串单元152,用于计算所述待处理兴趣点信息与所述兴趣点信息的公共子串的数量;其中,所述待处理兴趣点信息和所述兴趣点信息相同的字符中,相邻两个及两个以上的字符为一个公共子串;
计算单元153,用于根据所述编辑距离和公共子串的数量,按预设公式计算待处理兴趣点信息和所述兴趣点信息之间的相似度。
与图9所示的一种数据数据方法相对应,本申请还提供一种网络数据处理装置。如图16所示,所述装置具体包括:
获取单元161,用于获取当前网点一个物品的待处理地址。
其中,所述获取单元161具体用于接收用户通过输入设备输入的待处理地址;或具体用于接收扫描设备发送的所述待处理地址,其中,所述待处理地址由所述扫描设备以扫描二维码或条形码的方式获得。
构建单元162,用于利用所述待处理地址、当前网点级别、当前网点标识以及当前主体标识,构建待处理数据信息;其中,所述当前主体标识为当前网点所归属主体的标识;
第二发送单元163,用于向服务器发送所述待处理数据信息;
其中,所述待处理数据信息可被服务器用于,接收当前网点终端发送的待处理数据信息;将所述待处理地址中与所述当前网点级别的下级网点级别对应的行政区划信息,确定为待处理地址关键词;其中,所述待处理地址包括多个行政区划信息,每个行政区划信息对应一个网点级别;在预设数据库的与所述当前主体标识对应的当前数据集合中,确定与所述当前网点标识的下级网点标识对应的下级数据集合;其中,所述预设数据库包括多个主体标识以及与每个主体标识对应的数据集合,每个数据集合包括各个级别的网点标识以及与每个网点标识对应的地址关键词;所述下级数据集合包括若干个地址关键词,以及与每个地址关键词一一对应的下级网点标识;若在所述下级数据集合查找到与所述待处理地址关键词匹配成功的目标地址关键词,则向所述当前网点终端发送与所述目标地址关键词对应的目标下级网点;其中,所述目标下级网点为所述下级数据集合中与所述目标地址关键词一一对应的下级网点。
此外,本申请还提供一种网络数据处理装置,还包括:
第二接收单元164,用于接收服务器发送的与所述目标地址关键词对应的目标下级网点。
发送数据单元165,用于向所述服务器发送当前主体标识以及与所述当前主体标识对应的最新数据集合。
参见图1,本申请提供了一种网络数据处理***,包括:
服务器100,与所述服务器相连的若干个网点终端200。所述若干个网点中任一网点终端为当前网点终端;
所述当前网点终端200,用于获取当前网点一个物品的待处理地址;利用所述待处理地址、当前网点级别、当前网点标识以及当前主体标识,构建待处理数据信息;其中,所述当前主体标识为当前网点所归属主体的标识;向服务器发送所述待处理数据信息;
所述服务器100,用于接收当前网点终端发送的待处理数据信息;将所述待处理地址中与所述当前网点级别的下级网点级别对应的行政区划信息,确定为待处理地址关键词;其中,所述待处理地址包括多个行政区划信息,每个行政区划信息对应一个网点级别;在预设数据库与所述当前主体标识对应的当前数据集合中,确定与所述当前网点标识的下级网点标识对应的下级数据集合;其中,所述预设数据库包括多个主体标识以及与每个主体标识对应的数据集合,每个数据集合包括各个级别的网点标识以及与每个网点标识对应的地址关键词;所述下级数据集合包括若干个地址关键词,以及与每个地址关键词一一对应的下级网点标识;若在所述下级数据集合查找到与所述待处理地址关键词匹配成功的目标地址关键词,则向所述当前网点终端发送与所述目标地址关键词对应的目标下级网点;其中,所述目标下级网点为所述下级数据集合中与所述目标地址关键词一一对应的下级网点。
本实施例方法所述的功能如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算设备可读取存储介质中。基于这样的理解,本申请实施例对现有技术做出贡献的部分或者该技术方案的部分可以以软件产品的形式体现出来,该软件产品存储在一个存储介质中,包括若干指令用以使得一台计算设备(可以是个人计算机,服务器,移动计算设备或者网络设备等)执行本申请各个实施例所述方法的全部或部分步骤。而前述的存储介质包括:U盘、移动硬盘、只读存储器(ROM,Read-Only Memory)、随机存取存储器(RAM,Random Access Memory)、磁碟或者光盘等各种可以存储程序代码的介质。
本说明书中各个实施例采用递进的方式描述,每个实施例重点说明的都是与其它实施例的不同之处,各个实施例之间相同或相似部分互相参见即可。
对所公开的实施例的上述说明,使本领域专业技术人员能够实现或使用本申请。对这些实施例的多种修改对本领域的专业技术人员来说将是显而易见的,本文中所定义的一般原理可以在不脱离本申请的精神或范围的情况下,在其它实施例中实现。因此,本申请将不会被限制于本文所示的这些实施例,而是要符合与本文所公开的原理和新颖特点相一致的最宽的范围。

Claims (25)

1.一种网络数据处理方法,其特征在于,包括:
接收当前网点终端发送的待处理数据信息;其中,所述待处理数据信息包括物品的待处理地址、当前网点级别、当前网点标识以及当前主体标识,所述当前主体标识为当前网点所归属主体的标识;
将所述待处理地址中与所述当前网点级别的下级网点级别对应的行政区划信息,确定为待处理地址关键词;其中,所述待处理地址包括多个行政区划信息,每个行政区划信息对应一个网点级别;
在预设数据库的与所述当前主体标识对应的当前数据集合中,确定与所述当前网点标识的下级网点标识对应的下级数据集合;其中,所述预设数据库包括多个主体标识以及与每个主体标识对应的数据集合,每个数据集合包括各个级别的网点标识以及与每个网点标识对应的地址关键词;所述下级数据集合包括若干个地址关键词,以及与每个地址关键词一一对应的下级网点标识;
若在所述下级数据集合查找到与所述待处理地址关键词匹配成功的目标地址关键词,则向所述当前网点终端发送与所述目标地址关键词对应的目标下级网点;其中,所述目标下级网点为所述下级数据集合中与所述目标地址关键词一一对应的下级网点。
2.如权利要求1所述的方法,其特征在于,所述将所述待处理地址中与所述当前网点级别的下级网点级别对应的行政区划信息,确定为待处理地址关键词,包括:
在所述当前网点级别为省级别的情况下,将所述待处理地址中与市级别对应的市行政区划信息,确定为所述待处理地址关键词;
在所述当前网点级别为市级别的情况下,将所述待处理地址中与县区级别对应的区行政区划信息,确定为所述待处理地址关键词;
在所述当前网点级别为县区级别的情况下,将所述待处理地址中与乡镇级别对应的乡镇行政区划信息,确定为所述待处理地址关键词,或者,将所述待处理地址中与承包区级别对应的承包区信息,确定为所述待处理地址关键词。
3.如权利要求2所述的方法,其特征在于,在所述下级数据集合查找到与所述待处理地址关键词匹配成功的目标地址关键词,包括:
在所述待处理地址关键词为市行政区划信息、区行政区划信息或乡镇行政区划信息的情况下,在所述下级数据集合中查找与所述待处理地址关键词完全一致的地址关键词;
将所述下级数据集合与所述待处理地址关键词完全一致的地址关键词,确定为与所述待处理地址关键词匹配成功的目标地址关键词。
4.如权利要求2所述的方法,其特征在于,待处理地址中与承包区级别对应的承包区信息的确定过程,包括:
将所述待处理地址中的待处理道路信息,确定为与承包区级别对应的承包区信息。
5.如权利要求4所述的方法,其特征在于,所述待处理道路信息包括待处理道路名称和待处理道路号码,并且,所述下级数据集合中的地址关键词包括与各个下级网点标识一一对应的道路信息;则在所述下级数据集合查找到与所述待处理地址关键词匹配成功的目标地址关键词,包括:
在所述下级数据集合查找与所述待处理道路名称完全一致,并且包含所述待处理道路号码的地址关键词;
将所述下级数据集合与所述待处理道路名称完全一致,并且包含所述待处理道路号码的地址关键词,确定为与所述待处理地址关键词匹配成功的目标地址关键词。
6.如权利要求2所述的方法,其特征在于,待处理地址中与承包区级别对应的承包区信息的确定过程,包括:
将所述待处理地址中的待处理兴趣点信息,确定为与承包区级别对应的承包区信息。
7.如权利要求6所述的方法,其特征在于,所述下级数据集合中的地址关键词包括与各个下级网点标识一一对应的兴趣点信息;则在所述下级数据集合查找到与所述待处理地址关键词匹配成功的目标地址关键词,包括:
计算所述待处理兴趣点信息与所述下级数据集合中的兴趣点信息的相似度;
将所述下级数据集合中与所述待处理兴趣点信息相似度最高的兴趣点信息,确定为所述目标地址关键词。
8.如权利要求7所述的方法,其特征在在于,所述计算所述待处理兴趣点信息与所述下级数据集合中兴趣点信息的相似度,包括:
计算所述待处理兴趣点信息与所述兴趣点信息之间的编辑距离;其中,所述编辑距离为由所述待处理兴趣点信息转换为所述兴趣点信息所需的最少编辑操作次数,所述编辑操作包括将一个字符替换为另一字符,***一个字符,以及删除一个字符;
计算所述待处理兴趣点信息与所述兴趣点信息的公共子串的数量;其中,所述待处理兴趣点信息和所述兴趣点信息相同的字符中,相邻两个及两个以上的字符为一个公共子串;
根据所述编辑距离和公共子串的数量,按预设公式计算待处理兴趣点信息和所述兴趣点信息之间的相似度。
9.如权利要求1-8任一项所述的方法,其特征在于,还包括:
接收一个主体标识以及与所述主体标识对应的最新数据集合;
在所述预设数据库中,确定与所述主体标识对应的已有数据集合;
利用所述最新数据集合更新所述已有数据集合。
10.一种网络数据处理方法,其特征在于,包括:
获取当前网点一个物品的待处理地址;
利用所述待处理地址、当前网点级别、当前网点标识以及当前主体标识,构建待处理数据信息;其中,所述当前主体标识为当前网点所归属主体的标识;
向服务器发送所述待处理数据信息;
其中,所述待处理数据信息可被服务器用于,接收当前网点终端发送的待处理数据信息;将所述待处理地址中与所述当前网点级别的下级网点级别对应的行政区划信息,确定为待处理地址关键词;其中,所述待处理地址包括多个行政区划信息,每个行政区划信息对应一个网点级别;在预设数据库的与所述当前主体标识对应的当前数据集合中,确定与所述当前网点标识的下级网点标识对应的下级数据集合;其中,所述预设数据库包括多个主体标识以及与每个主体标识对应的数据集合,每个数据集合包括各个级别的网点标识以及与每个网点标识对应的地址关键词;所述下级数据集合包括若干个地址关键词,以及与每个地址关键词一一对应的下级网点标识;若在所述下级数据集合查找到与所述待处理地址关键词匹配成功的目标地址关键词,则向所述当前网点终端发送与所述目标地址关键词对应的目标下级网点;其中,所述目标下级网点为所述下级数据集合中与所述目标地址关键词一一对应的下级网点。
11.如权利要求10所述的方法,其特征在于,所述获取待处理地址包括:
接收用户通过输入设备输入的待处理地址;或
接收扫描设备发送的所述待处理地址,其中,所述待处理地址由所述扫描设备以扫描二维码或条形码的方式获得。
12.如权利要求11所述的方法,其特征在于,还包括:
接收服务器发送的与所述目标地址关键词对应的目标下级网点。
13.如权利要求11所述的方法,其特征在于,还包括:
向所述服务器发送当前主体标识以及与所述当前主体标识对应的最新数据集合。
14.一种网络数据处理装置,其特征在于,包括:
第一接收单元,用于接收当前网点终端发送的待处理数据信息;其中,所述待处理数据信息包括物品的待处理地址、当前网点级别、当前网点标识以及当前主体标识,所述当前主体标识为当前网点所归属主体的标识;
第一确定单元,用于将所述待处理地址中与所述当前网点级别的下级网点级别对应的行政区划信息,确定为待处理地址关键词;其中,所述待处理地址包括多个行政区划信息,每个行政区划信息对应一个网点级别;
第二确定单元,用于在预设数据库与所述当前主体标识对应的当前数据集合中,确定与所述当前网点标识的下级网点标识对应的下级数据集合;其中,所述预设数据库包括多个主体标识以及与每个主体标识对应的数据集合,每个数据集合包括各个级别的网点标识以及与每个网点标识对应的地址关键词;所述下级数据集合包括若干个地址关键词,以及与每个地址关键词一一对应的下级网点标识;
查找目标地址关键词单元,用于在所述下级数据集合查找到与所述待处理地址关键词匹配成功的目标地址关键词;
第一发送单元,用于若在所述下级数据集合查找到与所述待处理地址关键词匹配成功的目标地址关键词,则向所述当前网点终端发送与所述目标地址关键词对应的目标下级网点;其中,所述目标下级网点为所述下级数据集合中与所述目标地址关键词一一对应的下级网点。
15.如权利要求14所述的装置,其特征在于,所述第一确定单元,包括:
省级确定单元,用于在所述当前网点级别为省级别的情况下,将所述待处理地址中与市级别对应的市行政区划信息,确定为所述待处理地址关键词;
市级确定单元,用于在所述当前网点级别为市级别的情况下,将所述待处理地址中与县区级别对应的区行政区划信息,确定为所述待处理地址关键词;
县区级确定单元,用于在所述当前网点级别为县区级别的情况下,将所述待处理地址中与乡镇级别对应的乡镇行政区划信息,确定为所述待处理地址关键词,或者,将所述待处理地址中与承包区级别对应的承包区信息,确定为所述待处理地址关键词。
16.如权利要求15所述的装置,其特征在于,所述查找目标地址关键词单元,包括:
第一查找单元,用于在所述待处理地址关键词为市行政区划信息、区行政区划信息或乡镇行政区划信息的情况下,在所述下级数据集合中查找与所述待处理地址关键词完全一致的地址关键词;
第一目标地址关键词确定单元,用于将所述下级数据集合与所述待处理地址关键词完全一致的地址关键词,确定为与所述待处理地址关键词匹配成功的目标地址关键词。
17.如权利要求15所述的装置,其特征在于,与承包区级别对应的承包区信息为所述待处理地址中的待处理道路信息,所述待处理道路信息包括待处理道路名称和待处理道路号码,并且,所述下级数据集合中的地址关键词包括与各个下级网点标识一一对应的道路信息;则在所述查找目标地址关键词单元包括:
第二查找单元,用于在所述下级数据集合查找与所述待处理道路名称完全一致,并且包含所述待处理道路号码的地址关键词;
第二目标地址关键词确定单元,用于将所述下级数据集合与所述待处理道路名称完全一致,并且包含所述待处理道路号码的地址关键词,确定为与所述待处理地址关键词匹配成功的目标地址关键词。
18.如权利要求15所述的装置,其特征在于,与承包区级别对应的承包区信息为所述待处理地址中的待处理兴趣点信息,所述下级数据集合中的地址关键词包括与各个下级网点标识一一对应的兴趣点信息;则所述查找目标地址关键词单元包括:
计算相似度单元,用于计算所述待处理兴趣点信息与所述下级数据集合中的兴趣点信息的相似度;
第三目标地址关键词确定单元,用于将所述下级数据集合中与所述待处理兴趣点信息相似度最高的兴趣点信息,确定为所述目标地址关键词。
19.如权利要求18所述的装置,其特征在在于,所述计算相似度单元,包括:
计算编辑距离单元,用于计算所述待处理兴趣点信息与所述兴趣点信息之间的编辑距离;其中,所述编辑距离为由所述待处理兴趣点信息转换为所述兴趣点信息所需的最少编辑操作次数,所述编辑操作包括将一个字符替换为另一字符,***一个字符,以及删除一个字符;
计算公共子串单元,用于计算所述待处理兴趣点信息与所述兴趣点信息的公共子串的数量;其中,所述待处理兴趣点信息和所述兴趣点信息相同的字符中,相邻两个及两个以上的字符为一个公共子串;
计算单元,用于根据所述编辑距离和公共子串的数量,按预设公式计算待处理兴趣点信息和所述兴趣点信息之间的相似度。
20.如权利要求14-19任一项所述的装置,其特征在于,还包括:
更新单元,用于接收一个主体标识以及与所述主体标识对应的最新数据集合;在所述预设数据库中,确定与所述主体标识对应的已有数据集合;利用所述最新数据集合更新所述已有数据集合。
21.一种网络数据处理装置,其特征在于,包括:
获取单元,用于获取当前网点一个物品的待处理地址;
构建单元,用于利用所述待处理地址、当前网点级别、当前网点标识以及当前主体标识,构建待处理数据信息;其中,所述当前主体标识为当前网点所归属主体的标识;
第二发送单元,用于向服务器发送所述待处理数据信息;
其中,所述待处理数据信息可被服务器用于,接收当前网点终端发送的待处理数据信息;将所述待处理地址中与所述当前网点级别的下级网点级别对应的行政区划信息,确定为待处理地址关键词;其中,所述待处理地址包括多个行政区划信息,每个行政区划信息对应一个网点级别;在预设数据库的与所述当前主体标识对应的当前数据集合中,确定与所述当前网点标识的下级网点标识对应的下级数据集合;其中,所述预设数据库包括多个主体标识以及与每个主体标识对应的数据集合,每个数据集合包括各个级别的网点标识以及与每个网点标识对应的地址关键词;所述下级数据集合包括若干个地址关键词,以及与每个地址关键词一一对应的下级网点标识;若在所述下级数据集合查找到与所述待处理地址关键词匹配成功的目标地址关键词,则向所述当前网点终端发送与所述目标地址关键词对应的目标下级网点;其中,所述目标下级网点为所述下级数据集合中与所述目标地址关键词一一对应的下级网点。
22.如权利要求21所述的装置,其特征在于,
所述获取单元具体用于,接收用户通过输入设备输入的待处理地址;或用于接收扫描设备发送的所述待处理地址,其中,所述待处理地址由所述扫描设备以扫描二维码或条形码的方式获得。
23.如权利要求21所述的装置,其特征在于,
第二接收单元,用于接收服务器发送的与所述目标地址关键词对应的目标下级网点。
24.如权利要求21所述的装置,其特征在于,还包括:
发送数据单元,用于向所述服务器发送当前主体标识以及与所述当前主体标识对应的最新数据集合。
25.一种网络数据处理***,其特征在于,包括:
服务器,与所述服务器相连的若干个网点终端;所述若干个网点中任一网点终端为当前网点终端;
所述当前网点终端,用于获取当前网点一个物品的待处理地址;利用所述待处理地址、当前网点级别、当前网点标识以及当前主体标识,构建待处理数据信息;其中,所述当前主体标识为当前网点所归属主体的标识;向服务器发送所述待处理数据信息;
所述服务器,用于接收当前网点终端发送的待处理数据信息;将所述待处理地址中与所述当前网点级别的下级网点级别对应的行政区划信息,确定为待处理地址关键词;其中,所述待处理地址包括多个行政区划信息,每个行政区划信息对应一个网点级别;在预设数据库与所述当前主体标识对应的当前数据集合中,确定与所述当前网点标识的下级网点标识对应的下级数据集合;其中,所述预设数据库包括多个主体标识以及与每个主体标识对应的数据集合,每个数据集合包括各个级别的网点标识以及与每个网点标识对应的地址关键词;所述下级数据集合包括若干个地址关键词,以及与每个地址关键词一一对应的下级网点标识;若在所述下级数据集合查找到与所述待处理地址关键词匹配成功的目标地址关键词,则向所述当前网点终端发送与所述目标地址关键词对应的目标下级网点;其中,所述目标下级网点为所述下级数据集合中与所述目标地址关键词一一对应的下级网点。
CN201510623228.0A 2015-09-25 2015-09-25 网络数据处理方法、装置及*** Pending CN106557896A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201510623228.0A CN106557896A (zh) 2015-09-25 2015-09-25 网络数据处理方法、装置及***

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201510623228.0A CN106557896A (zh) 2015-09-25 2015-09-25 网络数据处理方法、装置及***

Publications (1)

Publication Number Publication Date
CN106557896A true CN106557896A (zh) 2017-04-05

Family

ID=58416319

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201510623228.0A Pending CN106557896A (zh) 2015-09-25 2015-09-25 网络数据处理方法、装置及***

Country Status (1)

Country Link
CN (1) CN106557896A (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112364114A (zh) * 2020-11-16 2021-02-12 深圳壹账通智能科技有限公司 地址标准化方法、装置、计算机设备和存储介质

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20030085276A1 (en) * 2001-11-07 2003-05-08 Hitachi, Ltd. Distribution management method and system
CN101030274A (zh) * 2007-02-14 2007-09-05 河南万和科技有限公司 运输物流信息管理方法
CN101101647A (zh) * 2007-06-08 2008-01-09 刘礼维 物流联合运输网络数据处理***及其数据处理方法
CN102314645A (zh) * 2011-09-26 2012-01-11 深圳市络道科技有限公司 一种地址匹配方法及匹配***
CN102799972A (zh) * 2012-04-26 2012-11-28 杭州新锐信息技术有限公司 物流寄递监管***及其监管方法

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20030085276A1 (en) * 2001-11-07 2003-05-08 Hitachi, Ltd. Distribution management method and system
CN101030274A (zh) * 2007-02-14 2007-09-05 河南万和科技有限公司 运输物流信息管理方法
CN101101647A (zh) * 2007-06-08 2008-01-09 刘礼维 物流联合运输网络数据处理***及其数据处理方法
CN102314645A (zh) * 2011-09-26 2012-01-11 深圳市络道科技有限公司 一种地址匹配方法及匹配***
CN102799972A (zh) * 2012-04-26 2012-11-28 杭州新锐信息技术有限公司 物流寄递监管***及其监管方法

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112364114A (zh) * 2020-11-16 2021-02-12 深圳壹账通智能科技有限公司 地址标准化方法、装置、计算机设备和存储介质

Similar Documents

Publication Publication Date Title
CN106033460A (zh) 地址数据处理方法及装置
CN106164865A (zh) 用于数据复制的依赖性感知的事务批处理
CN103345521B (zh) 一种在哈希表数据库中处理键值的方法和装置
CN109840284B (zh) 家族亲缘关系知识图谱构建方法与***
CN109063113A (zh) 一种基于不对称深度离散哈希的快速图像检索方法、检索模型及模型构建方法
CN106462620A (zh) 巨型网络上的距离查询
CN106203494A (zh) 一种基于内存计算的并行化聚类方法
CN102915382A (zh) 一种基于索引的数据库的数据查询方法和装置
CN110019617B (zh) 地址标识的确定方法和装置、存储介质、电子装置
CN106933883B (zh) 基于检索日志的兴趣点常用检索词分类方法、装置
CN113190687B (zh) 知识图谱的确定方法、装置、计算机设备及存储介质
CN105550219A (zh) 一种信息资源的自动编目方法
CN106326438A (zh) 一种人员信息的关联方法
CN104794130B (zh) 一种表间关联查询方法和装置
CN105209858A (zh) 企业场所数据的非确定性消岐和匹配
CN104915388B (zh) 一种基于谱聚类和众包技术的图书标签推荐方法
Isaj et al. Multi-source spatial entity linkage
CN103793401B (zh) 建立多个数据库表的共享索引的方法及装置
CN110737779A (zh) 知识图谱的构建方法、装置、存储介质和电子设备
CN114579794A (zh) 特征一致性建议的多尺度融合地标图像检索方法及***
CN104008205A (zh) 一种内容路由的查询方法及***
JP5470082B2 (ja) 情報蓄積検索方法及び情報蓄積検索プログラム
CN109086381A (zh) 模糊概念格的一种更新生成方法
CN109614521A (zh) 一种高效的隐私保护子图查询处理方法
CN106557896A (zh) 网络数据处理方法、装置及***

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
TA01 Transfer of patent application right

Effective date of registration: 20180328

Address after: Four story 847 mailbox of the capital mansion of Cayman Islands, Cayman Islands, Cayman

Applicant after: CAINIAO SMART LOGISTICS HOLDING Ltd.

Address before: Cayman Islands Grand Cayman capital building a four storey No. 847 mailbox

Applicant before: ALIBABA GROUP HOLDING Ltd.

TA01 Transfer of patent application right
RJ01 Rejection of invention patent application after publication

Application publication date: 20170405

RJ01 Rejection of invention patent application after publication