CN113139376A - 一种快件妥投地址校验的实现方法 - Google Patents
一种快件妥投地址校验的实现方法 Download PDFInfo
- Publication number
- CN113139376A CN113139376A CN202010051975.2A CN202010051975A CN113139376A CN 113139376 A CN113139376 A CN 113139376A CN 202010051975 A CN202010051975 A CN 202010051975A CN 113139376 A CN113139376 A CN 113139376A
- Authority
- CN
- China
- Prior art keywords
- express
- address
- verification
- data
- elements
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/20—Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
- G06F16/24—Querying
- G06F16/245—Query processing
- G06F16/2455—Query execution
- G06F16/24564—Applying rules; Deductive queries
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q10/00—Administration; Management
- G06Q10/08—Logistics, e.g. warehousing, loading or distribution; Inventory or stock management
- G06Q10/083—Shipping
Landscapes
- Engineering & Computer Science (AREA)
- Business, Economics & Management (AREA)
- Theoretical Computer Science (AREA)
- Economics (AREA)
- General Physics & Mathematics (AREA)
- Physics & Mathematics (AREA)
- Tourism & Hospitality (AREA)
- Entrepreneurship & Innovation (AREA)
- Quality & Reliability (AREA)
- Strategic Management (AREA)
- Marketing (AREA)
- Human Resources & Organizations (AREA)
- General Business, Economics & Management (AREA)
- Operations Research (AREA)
- Development Economics (AREA)
- Computational Linguistics (AREA)
- Data Mining & Analysis (AREA)
- Databases & Information Systems (AREA)
- General Engineering & Computer Science (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
本发明的名称为一种快件妥投地址校验的实现方法,该方法应用于物流运输领域。采用的技术方案是:构建运单自动识别模型,利用运单自动识别模型及正则匹配规则,自动判断运单所属快递公司;构建快件地理要素词典、分配单词权重,并自定义规则库,根据运单号加载对应的运输信息文本,从运输信息文本中提取地址信息,对地址信息进行解析及校验;对运输信息文本进行二次提取,获取时间和人员及操作要素并按时间进行排序,并进行交叉比对判断,输出风险评级。本发明的有益效果是:运单所属快递公司的识别,不受运单编码格式干扰;地点、时间等相关要素的获取不受运输信息格式的干扰,可成功对各类物流信息进行统一校验。
Description
技术领域
本发明一般涉及物流运输领域,具体涉及一种快件妥投地址校验的实现方法。
背景技术
在互联网电子商务迅速发展的同时,网络失信问题愈发突出,尤其是虚假交易、刷单炒信等情况频现,具体表现为虚假运单号、虚假发货、虚假签收等。因此从快递运输监管方面着手处理电子商务网络失信问题不失为一个好的解决方法。
但由于物流信息化较为缓慢,行业标准、规范等不健全,信息资源及保存方式存在差异化、区别化的特点,这就造成数据信息交换共享和综合利用困难。不同快递公司有着不同的信息记录方式,这就造成不同快递公司运单编码格式混乱、妥投信息数据格式各异、妥投点选取差异性较大等结果,这无一不使得物流信息的统一校验及利用变得困难。
发明内容
鉴于现有技术中的上述缺陷或不足,期望提供一种快件妥投地址校验的实现方法,该方法支持数据批量校验。可以通过运单编号自动识别快递公司,通过地址解析获取快递公司运单编号的运输关键地点及时间信息、判断最终妥投地址是否正确,从而实现对的快递运单真实性的校验。
第一方面,本发明快件妥投地址校验的实现方法,应用于运单编号自动识别,包括以下步骤:
通过梳理各快递公司运单号的编码规律,构建运单自动识别模型;
获取运单号样本数据,基于正则匹配规则和运单识别模型完成通过运单号自动判断该运单号所属快递公司的判断。
第二方面,本发明快件妥投地址校验的实现方法,应用于运单号运输信息中地址信息提取、解析及校验,包括以下步骤:
分析快件地址要素特点,构建快件地理要素词典,分配单词权重,支持词典本地加载,梳理运单运输信息中地址要素排列规律及校验比对判断规律,创建自定义规则库,;
支持批量快件地址数据加载和数据流转换及并行处理;
分析地址中地理要素规律,实现各主流快递公司的地理、时间和人员要素解析规则;
基于运单编号规则识别的快递公司,根据单号加载对应的运输信息文本;
基于自然语言处理(NLP)并结合TF-IDF权重分析法,从不规则的运输信息文本中提取出关键配送网点、行政区划要素;
基于快递网点地理库,将妥投地址中提取出的配送网点与快递网点进行遍历比对,若未能找到,则继续后续其他规则的比对操作;
基于全国行政区划库,将妥投地址中提取出的地理要素与市级行政区划进行遍历比对,若未能找到,则取下一个地理要素重复上述操作,若行政区划要素未匹配,则继续后续其他规则的比对操作;
基于自定义规则库,提取运单运输信息中配送节点数据,并根据地理要素词典提取配送节点中的所有地理要素,与妥投地址中提取的地理要素进行一一遍历比对,若地理要素匹配失败,则输出匹配结果;
基于正则表达式对运输信息文本进行二次提取,具体操作是根据自定义解析规则对运输信息文本进行解析,提取地点、时间和人员及操作要素,聚合时间和地点要素,时间和人员、操作要素,并对根据时间对地点、人员和操作要素进行排序;
基于自定义规则库,对二次提取的地点、时间、人员和操作要素进行比对交叉比对,判断地点和操作是否有序和缺失,根据妥投地址和要素比对结果,进行风险评级并输出。
附图说明
为了更清楚地说明本发明实施例中的技术方案,下面将对实施例描述中所需要使用的附图作简要介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域的普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。
图1为本发明实施案例提供的一种***架构示意图;
图2 为本发明实施提供的一种快件妥投地址校验的实现方法的基本流程图;
图3 为本发明实施提供的一种快件妥投地址校验的实现方法中运单编号自动识别的流程示意图;
图4为本发明实施提供的一种快件妥投地址校验的实现方法中地址信息提取、解析、校验判断的流程示意图;
图5为二次提取、交叉对比、最终风险输出的流程示意图;
图6为本申请实施例提供的一种web端地址校验结果界面示意图;
图7 为本申请实施例提供的一种web端地址校验分析详情界面示意图。
具体实施方式
下面结合附图和实施例对本申请作进一步的详细说明。可以理解的是,此处所描述的具体实施例仅仅用于解释相关发明,而非对该发明的限定。另外还需要说明的是,为了便于描述,附图中仅示出了与发明相关的部分。
需要说明的是,在不冲突的情况下,本申请中的实施例及实施例中的特征可以相互组合。下面将参考附图并结合实施例来详细说明本申请。
为了便于理解和说明,下面通过图1至图7详细的阐述本申请实施例提供的一种快件妥投地址校验的实现方法。
请参考图1,其为本申请实施例提供的一种快件妥投地址校验的实现方法的***架构示意图,本发明实施例适用的***架构包括用户端S101、导入模块S102、识别模块S103、提取模块S104、校验模块S105、展示模块S106、推送模块S107。
用户端S101与导入模块S102相连,校验后信息由展示模块S106向用户端展示;数据由用户端S101进入***后逐步由导入模块S102向识别模块S103、提取模块S104、校验模块S105、展示模块S106、推送模块S107流转校验,支持数据的并行处理,以提高处理效率。
请参考图2,其为本申请实施例提供的一种快件妥投地址校验的实现方法的的基本流程示意图,包括以下步骤:
S201,获取运单号样本数据。需要说明的是运单号样本数据应该至少包括运单号、物流公司名称、收货人地址信息,运单号及物流公司用于运单号样本所属快递公司的查验;
S202,判断运单号样本所属快递公司。主要是基于正则匹配规则和运单识别模型完成通过运单号所属快递公司的自动判断;
S203,妥投地址的提取、解析及校验。主要是利用地理要素词典及分配单词权重对运输信息文本中的地址进行提取,并利用自定义规则库将提取后地址信息与样本数据中的收货人地址信息进行比对校验;
S204,二次提取关键信息,与原始信息比对,输出风险评级。具体操作是根据自定义解析规则对运输信息文本进行解析,提取地点、时间和人员及操作要素,并对提取的要素按时间进行排序;然后对提取要素进行比对交叉比对,判断地点和操作是否有序和缺失,根据妥投地址和要素比对结果,输出风险评级。
基于图2的基本流程示意图,对其中的S201、S202进行详细展开说明,如图3所示,包括以下步骤:
S301,获取运单号样本数据,批量加载至快件妥投地址校验方法中。具体操作是将批量运单号样本数据中的运单号数据中提取出来,在数据量比较大时,对数据集进行拆分,直至拆分到合适处理的子批量为止;
S302,识别运单编码信息。具体的说,运单号可以包括数字、字母、符号等字符,因为不同快递公司运单编码格式混乱、字符长度不同,因此对S301拆分出来的子批次并行处理,进行运单编号信息的识别;
S303,将编码信息利用正则匹配规则进行划分。具体的说是拆分和标准化待判断的运单号,利用正则匹配规则对运单号关键识别信息进行拆分,以提取出运单号关键识别要素,并对提取出的运单号关键识别要素进行标准化;
S304,利用运单识别模型对划分后的运单号进行匹配,输出运单号所属快递公司信息。具体的说是在梳理各快递公司运单号编码规律的基础上,构建运单自动识别模型;获取已经标准化的运单号样本数据,基于正则匹配规则将已标准化的运单号样本数据与运单自动识别模型中的运单所属快递公司实体进行关联,完成通过运单号自动判断该运单号所属快递公司的判断。
基于图2的基本流程示意图,对其中的S203进行详细展开说明,如图4所示,包括以下步骤:
S401,根据单号加载对应的运输信息文本,可批量加载。具体操作是将通过图3流程成功识别出快递公司的运单号加载对应的运输信息文本;
S402,提取运输信息文本中的关键配送网点、行政区划要素。首先行政区划要素具有稳定性和规范性的特点,配送网点主要是由行政区划内的乡镇、道路、建筑物等地址要素名称构成,这使得关键配送网点、行政区划要素在一定周期内保持稳定。通过梳理这些要素的特点及规律,可以制定出对应的文本解析规则,利用自然语言处理(NLP)方法可初步提取出关键地址要素,结合TF-IDF权重法得到更精确的关键配送网点及行政区划要素;
S403、S404,对提取的行政区划要素进行全国行政区划库比对,对提取的关键配送网点进行快递网点地理库比对。基于全国行政区划库、快递网点地理库,借助逆向最大匹配算法,将S402中提取出的行政区划要素与市级行政区划进行遍历比对,将S402提取出的关键配送网点与快递网点进行遍历比对,若未能找到,则取下一个地理要素重复上述操作,直到提取的所有可识别要素被识别出来;
S405,提取运输信息文本中的配送节点数据。基于自定义规则库,通过归纳特征词,建立规则的方法以完成提取运输信息中配送节点数据;
S406、407、S408,提取S405中节点的所有地理要素,将所有提取要素与运单目的地理要素比对,输出校验结果。根据地理要素词典、基于正则匹配规则提取配送节点中的所有地理要素,与妥投地址中提取的地理要素进行一一遍历比对,若地理要素匹配失败,则输出匹配结果。
基于图2的基本流程示意图,对其中的S204进行详细展开说明,如图5所示,包括以下步骤:
S501,对运输信息文本进行二次提取。基于正则表达式、根据自定义解析规则对S401加载的运输信息文本进行二次提取,并解析、提取地点、时间和人员及操作要素;
S502、S503,输出运输文本信息中的地点、时间、人员及操作要素,并对提取出要素按时间排序。主要是聚合时间和地点要素,时间和人员、操作要素,对时间、对地点、人员和操作要素进行排序;
S504、S505,对要素进行交叉比对,判断是否有缺失,最终输出风险评级结果。基于自定义规则库,对S501中二次提取的地点、时间、人员和操作要素进行比对交叉比对,判断地点和操作是否有序和缺失,根据妥投地址和要素比对结果,进行风险评级并输出。
需要说明的是,本实施例中与其它实施例中相同步骤和相同内容的说明,可以参照其它实施例中的描述,此处不再赘述。
举例说明,请参考图6、7,其为本申请实例提供的一种web端地址校验分析结果界面示意图及web端地址校验分析详情界面示意图。
如图6所示,一种web端地址校验分析结果展示界面支持数据的导入、校验结果查询、校验结果展示、校验数据导出四大功能。校验结果查询支持多种查询方式,具体支持按批次号、运单号、原始运单快递公司、校验后快递公司、物流信息、运单状态、妥投地址、风险等级等方式进行查询。
如图7所示,一种web端地址校验分析详情界面展示单个运单具体的交易结果,主要包括运输关键地址、物流节点、时间等信息提取分析后的展示,及具体快件妥投地址校验结果的展示。
应当注意,尽管在上文详细描述中提及了一种快件妥投地址校验的实现方法实施例的若干模块或者单元,但是这种划分并非强制性的。实际上,根据本公开的实施方式,上文描述的两个或更多模块或者单元的特征和功能可以在一个模块或者单元中具体化。反之,上文描述的一个模块或者单元的特征和功能可以进一步划分为由多个模块或者单元来具体化。
此外,尽管在附图中以特定顺序描述了本公开中方法的各个步骤,但是,这并非要求或者暗示必须按照该特定顺序来执行这些步骤,或是必须执行全部所示的步骤才能实现期望的结果。附加的或备选地,可以省略某些步骤,将多个步骤合并为一个步骤执行,以及/或者将一个步骤分解为多个步骤执行等。
以上描述仅为本申请的较佳实施例以及对所运用技术原理的说明。本领域技术人员应当理解,本申请中所涉及的发明范围,并不限于上述技术特征的特定组合而成的技术方案,同时也应涵盖在不脱离所述发明构思的情况下,由上述技术特征或其等同特征进行任意组合而形成的其它技术方案。例如上述特征与本申请中公开的(但不限于)具有类似功能的技术特征进行互相替换而形成的技术方案。
Claims (11)
1.一种快件妥投地址校验的实现方法,应用于快件妥投地址校验,其特征在于,所述方法包括:
获取用户在终端设备导入的快件收件地址数据;
识别用户导入数据中的快件单号和快件收件地址文本;
根据快件单号规则识别快件所述的快件公司;
根据快件单号获取对应的快件详情;
提取快件收件地址文本中的行政区划和其他地址要素;
提取快件详情中的配送网点、行政区划及其他地址、时间、人员和操作要素;
快件收件地址文本和快件详情文本中各要素的交叉校验以及各要素的有序性和缺失性校验;
实现快件收件地址和详情中妥投地址的校验结果风险评级;
将所有校验、评级和排序信息发送到所属终端设备。
2.根据权利要求1所属的一种快件妥投地址校验的实现方法,其特征在于,所述识别用户导入数据中的快件单号和快件收件地址文本,包括:
若所述用户输入快递单号信息包含文字,则判定用户导入数据不合法;若合法,则进行数据转换并暂存于服务设备内存;
若所述用户输入快件收件地址信息为纯数字或字母,判定用户导入数据不合法;若合法,则进行数据转换并暂存于服务设备内存。
3.根据权利要求1所述的一种快件妥投地址校验的实现方法,其特征在于,所述方法还包括:
接收所述终端设备发送的校验指令;
将用户导入数据转换为数据流发送到校验模块;
将快件收件地址的校验结果可视化的展现给用户。
4.根据权利要求1所述的一种快件妥投地址校验的实现方法,其特征在于,所述方法包括:
针对不同快件公司的单号,自动识别该单号所述的快件公司,并输出快件公司编码。
5.根据权利要求1所述的一种快件妥投地址校验的实现方法,其特征在于,所述方法包括:
基于NLP和自定义规则的快件收件地址文本中行政区划和其他地址要素的识别和提取;
基于NLP和自定义规则的快件详情文本中配送网点、行政区划和其他地址、人员及操作要素的识别和提取。
6.根据权利要求1所述的一种快件妥投地址校验的实现方法,其特征在于,所述方法包括:
实现快件收件地址和详情中配送网点、行政区划和其他地址要素的校验;
实现快件详情中地址、人员和操作要素的有序性和缺失性校验;
实现快件详情中地址、人员和操作要素的排序。
7.根据权利要求1所述的一种快件妥投地址校验的实现方法,其特征在于,所述方法包括:
快件收件地址的校验状态和结果的实时推送,所述终端接收并展现给用户。
8.一种快件妥投地址校验的实现方法,应用于终端设备,其特征在于,所属方法包括:
获取所述校验模块发送的与所述用户导入数据快递单号一致的的校验结果;
获取所述校验模块发送的与所述用户导入数据快递单号一致的快件详情地址、人员和操作要素排序结果;
对校验结果进行风险评级。
9.根据权利要求8所述的一种快件妥投地址校验的实现方法,其特征在于,所述要素排序结果获取,包括:
聚合地址和时间要素形成地址节点,聚合人员、操作和时间要素形成人员操作节点;
按照时间要素对地址节点、人员操作节点进行排序;
获取排序后的节点集合并按序在所述终端展示。
10.根据权利要求8所述的一种快件妥投地址校验的实现方法,其特征在于,所述校验结果风险评级,包括:
校验结果进行等级分类,每一个等级分类包含互不重复的校验结果;
将所述等级在屏幕上横向显示或纵向显示,并以不同的颜色区分不同的等级。
11.一种快件妥投地址校验的实现方法,其特征在于,所述装置包括:
导入模块,用于将用户的数据文件导入校验平台;
识别模块,根据单号规则识别快件所属快件公司;
提取模块,根据提取规则提取快件收件地址文本中的行政区划和其他地址要素,提取快件详情文本中的快递网点、行政区划和其他地址、人员、操作和时间要素;
校验模块,对快件收件地址和详情中的各要素进行交叉校验,校验地址、人员、操作和时间要素的有序和缺失性;
推送模块,校验工程各数据状态和结果向所述终端的推送;
展示模块,用于展示快件妥投地址的校验结果。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010051975.2A CN113139376A (zh) | 2020-01-17 | 2020-01-17 | 一种快件妥投地址校验的实现方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010051975.2A CN113139376A (zh) | 2020-01-17 | 2020-01-17 | 一种快件妥投地址校验的实现方法 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN113139376A true CN113139376A (zh) | 2021-07-20 |
Family
ID=76808269
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202010051975.2A Pending CN113139376A (zh) | 2020-01-17 | 2020-01-17 | 一种快件妥投地址校验的实现方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN113139376A (zh) |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN113837113A (zh) * | 2021-09-27 | 2021-12-24 | 中国平安财产保险股份有限公司 | 基于人工智能的文档校验方法、装置、设备及介质 |
CN114154595A (zh) * | 2022-02-07 | 2022-03-08 | 国家***邮政业安全中心 | 异常寄递行为检测方法、***、电子设备和存储介质 |
CN114492434A (zh) * | 2022-01-27 | 2022-05-13 | 圆通速递有限公司 | 一种基于运单号自动识别模型智能识别运单号方法 |
-
2020
- 2020-01-17 CN CN202010051975.2A patent/CN113139376A/zh active Pending
Cited By (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN113837113A (zh) * | 2021-09-27 | 2021-12-24 | 中国平安财产保险股份有限公司 | 基于人工智能的文档校验方法、装置、设备及介质 |
CN114492434A (zh) * | 2022-01-27 | 2022-05-13 | 圆通速递有限公司 | 一种基于运单号自动识别模型智能识别运单号方法 |
CN114492434B (zh) * | 2022-01-27 | 2022-10-11 | 圆通速递有限公司 | 一种基于运单号自动识别模型智能识别运单号方法 |
CN114154595A (zh) * | 2022-02-07 | 2022-03-08 | 国家***邮政业安全中心 | 异常寄递行为检测方法、***、电子设备和存储介质 |
CN114154595B (zh) * | 2022-02-07 | 2022-04-08 | 国家***邮政业安全中心 | 异常寄递行为检测方法、***、电子设备和存储介质 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN113139376A (zh) | 一种快件妥投地址校验的实现方法 | |
CN102609999B (zh) | 一种电子储物柜箱格分配***及基于该***的快件投递、邮寄方法 | |
US7979155B2 (en) | Sort plan optimization | |
EP0584607A2 (en) | Data processing system for merger of sorting information and redundancy information to provide contextual predictive keying for postal addresses | |
CN107122483A (zh) | 基础地理信息数据质检方法、装置及*** | |
CN110990474A (zh) | 一种区域性产业画像分析的方法及装置 | |
CN111804599A (zh) | 物流包裹的自动分拣派送*** | |
CN113011959A (zh) | 一种“七项费用”智慧审计***及其使用方法 | |
WO2018145636A1 (zh) | 物流单号生成方法 | |
CN111260153A (zh) | 基于快递面单的二段码管理方法、装置、设备及存储介质 | |
CN113918583B (zh) | 一种业务单据中审核节点风险等级的确定方法及确定装置 | |
CN111429073A (zh) | 快件签收方法、装置、设备和存储介质 | |
KR102205637B1 (ko) | 주소 약칭 운송장 | |
CN106710082A (zh) | 智能信包箱*** | |
RU2349395C2 (ru) | Способ и устройство для обработки графической информации, имеющейся на почтовых отправлениях | |
CN113688418A (zh) | 基于区块链数据存储的工程订单结算方法及*** | |
CN112651733A (zh) | 渠道路由选择方法、装置、设备及存储介质 | |
CN109829769B (zh) | 一种电子***查重方法及*** | |
Wang et al. | A data management model for intelligent water project construction based on blockchain | |
CN116228265A (zh) | ***风险识别方法、装置和设备 | |
CN106953880A (zh) | 一种数据处理方法及***、子服务器和主服务器 | |
CN115982241A (zh) | 一种数据处理方法、装置、电子设备及计算机可读介质 | |
CN101856917A (zh) | 一种通过产品防窜码计算外箱防窜码的方法和装置 | |
CN115309705A (zh) | 一种自动识别城市信息模型平台基础数据元素的数据集成分类***及其分类方法 | |
CN113642291B (zh) | 上市公司报告的逻辑结构树构建方法、***、存储介质及终端 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |