WO2018072250A1

WO2018072250A1 - 一种数据分拣***及其实现方法

Info

Publication number: WO2018072250A1
Application number: PCT/CN2016/106008
Authority: WO
Inventors: 郑葵荣; 李勇波; 季统凯
Original assignee: 国云科技股份有限公司
Priority date: 2016-10-18
Filing date: 2016-11-16
Publication date: 2018-04-26
Also published as: CN106503118B; US20190272278A1; US11386110B2; CN106503118A

Abstract

一种基于HC-TABLE的数据分拣***及其实现方法。所述***由规则库和分拣调度模块组成。规则库，包括构成HC-TABLE的分拣配置库、基于HC-TABLE的分拣规则库以及分拣结果集。分拣调度模块提供调度和分发功能，调度功能以任务的形式将结果集的结构化查询语言转换为实际数据文件，分发功能将数据文件进行分发。通过本方法将数据进行分拣定制化处理，具有扩展性好、适用范围广等特点，可有效地应用于多种业务型***中。

Description

一种数据分拣***及其实现方法

技术领域

本发明涉及计算机应用技术领域，特别涉及一种基于HC-TABLE的数据分拣***及其实现方法。

背景技术

随着计算机应用技术的发展，用户涉及到的数据需求愈趋向于多样化。伴随着业务的复杂化及不确定因素，重复类似的数据需求及其分拣工作需要花费较多时间。在传统业务***内，往往无法对数据分拣工作进行统一定制化。这时候更需要一种灵活度高和适用范围广的方法，可以在快速响应业务需求，并实现统一规则管理。

发明内容

本发明解决的技术问题在于提供一种基于HC-TABLE的数据分拣***。针对重复类似的数据需求及其分拣工作需要花费较多时间的问题，通过规则库的维护，实现分拣数据需求细化管理，可以在短时间内将业务需求拆分并实现数据分拣。同时，以HC-TABLE的方式存放规则细目，保证***的多元化及可扩展性。

本发明解决的另一技术问题在于提供一种基于HC-TABLE的数据分拣***的实现方法。

本发明解决上述技术问题之一的技术方案是：

所述的***由规则库和分拣调度模块组成，并提供相应的开发和集成接口；

所述的规则库，包括构成HC-TABLE的分拣配置库、基于HC-TABLE的分拣规则库以及分拣结果集；

所述的分拣配置库，提供构成HC-TABLE的单元组件集合，包括HC-TABLE子集组件、字典翻译组件和HC-TABLE关系维护模块；

所述的HC-TABLE子集组件，是构成HC-TABLE的单元；每一个子集都具备唯一标识及其特性，作为HC-TABLE的一个属性存在，HC-TABLE子集的唯一标识可以自定义为代码的形式，并通过字典翻译组件进行翻译；

所述的字典翻译组件，提供分拣过程中涉及到的代码翻译，支持代码转换为代码以及非代码两种方式的翻译；

所述的HC-TABLE关系维护模块，负责维护HC-TABLE间的关联关系，关联关系可由一个或多个子集的唯一标识组成，通过维护，将HC-TABLE间的关系动态关联，为分拣规则库提供规则基础；

所述的分拣规则库，提供具体的分拣业务规则，以一定业务规则维护的HC-TABLE关系集合，为分拣结果集提供分拣依据；

所述的分拣结果集，是业务的集合，是建立在分拣规则库基础上的一种多态形式；分拣结果集提供输入输出控制手段，对输出及输入的HC-TABLE子集进行控制进而产生不同的结果集；

所述的分拣调度模块提供调度和分发功能，调度功能以任务的形式将结果集的结构化查询语言转换为实际数据文件，分发功能将数据文件进行分发。

所述的HC-TABLE是高可配的结构化表，可通过分拣配置库进行配置组装；HC-TABLE由一个或多个HC-TABLE子集组成。

所述的分拣结果集通过控制输入端，过滤分拣结果；通过控制输出端，以多态的形式生成分拣结果；生成每一个结果集可用结构化查询语言表示，作为分拣调度模块调度的基础。

所述的规则库提供CRUD访问接口，用于查询及维护HC-TABLE子集组件、字典翻译组件和HC-TABLE关系维护模块配置信息。

本发明解决上述技术问题之二的技术方案是：

配置HC-TABLE子集组件步骤是：

第一步，选择HC-TABLE子集生成方式，新建或者复用原有子集；

第二步，选择HC-TABLE子集唯一标识生成方式，自定义或者***分配；

第三步，添加子集匹配库、表及其对应栏位，并校验该子集是否可用；

第四步，添加子集匹配栏位中英文名称；

第五步，添加子集展示次序、大小、占行长度及横竖位置；

第六步，添加子集可选的数据处理方式，包括求精度、截取和拼接功能；

第七步，日志记录，保存HC-TABLE子集；

配置字典翻译组件的步骤是：

第一步，新建字典翻译细目；

第二步，选择HC-TABLE子集已存在的标识；

第三步，添加标识对应的翻译项；

第四步，保存细目记录；

第五步，添加子集存在的<K，V>键值项；

第六步，保存键值项；

第七步，日志记录，完成；

HC-TABLE关系维护模块的流程是：

第一步，新建HC-TABLE；

第二步，添加一个或多个HC-TABLE子集软链接；

第三步，保存HC-TABLE；

第四步，添加HC-TABLE与其他TABLE存在的关联关系，包括左连接、右连接和全连接，并关联TABLE间的子集关系，形成一对一或一对多的映射关系；

第五步，保存关联关系；

第六步，日志记录，完成。

分拣规则库维护流程是：

第一步，新建分拣业务类别，生成唯一标识；

第二步，新建规则，产生规则标识；

第三步，选择一个或多个HC-TABLE组成规则主体；

第四步，选择已选HC-TABLE下的子集作为输出项；

第五步，保存规则；

第六步，日志记录，完成。

分拣结果集管理流程是：

第一步，新建分拣结果集类别，生成唯一标识；

第二步，选择一个或多个分拣规则；

第三步，当选择多个分拣规则时，判断是否存在关联关系；

第四步，通过子集的数据处理方式管理配置输出及输入项；

第五步，选择数据文件输出路径；

第六步，保存结果集，并生成结构化查询语言；

第七步，日志记录，完成。

分拣调度模块的流程是：

第一步，新建调度任务；

第二步，选择已配置完成的分拣结果集；

第三步，添加执行周期及时间；

第四步，任务调度完成后根据结果集配置的文件服务器输出路径进行数据分发；

第五步，日志记录，完成。

本发明针对业务需求的复杂化及不确定因素多的问题，通过对数据需求进行分解，并以规则的形式进行定制。HC-TABLE子集存放了规则细节，支持多维度数据处理；HC-TABLE统一管理子集，并为规则实现提供依据。分拣结果集通过输入输出控制，实现了规则的多态。规则库内各个组件紧密结合，将数据分拣需求真正地实现了动态拆分处理，保证了***的灵活性和扩展性。

附图说明

下面结合附图对本发明进一步说明：

图1是本发明的总体结构图；

图2是本发明分拣规则库的配置活动图；

图3是本发明分拣调度模块的序列图。

具体实施方式

本发明针对重复类似的数据需求及其分拣工作需要花费较多时间的问题，提供了一种基于HC-TABLE的数据分拣***。实现了分拣数据需求细化管理，可以在短时间内将业务需求拆分并实现数据分拣。

图1表示了本发明的总体结构图，由规则库和分拣调度模块组成。

HC-TABLE：是高可配的结构化表，可通过分拣配置库进行配置组装；由一个或多个HC-TABLE子集组成。

规则库：包括分拣配置库、分拣规则库以及分拣结果集三部分。

分拣配置库，提供构成HC-TABLE的单元组件集合，包括HC-TABLE子集组件、字典翻译组件和HC-TABLE关系维护模块。HC-TABLE子集组件，是构成HC-TABLE的单元；每一个子集都具备唯一标识及其特性，作为HC-TABLE的一个属性存在，HC-TABLE子集的唯一标识可以自定义为代码的形式，并通过字典翻译组件进行翻译。字典翻译组件，提供分拣过程中涉及到的代码翻译，支持代码转换为代码以及非代码两种方式的翻译。HC-TABLE关系维护模块，负责维护HC-TABLE间的关联关系，关联关系可由一个或多个子集的唯一标识组成，通过维护，将HC-TABLE间的关系动态关联，为分拣规则库提供规则基础。分拣规则库，提供具体的分拣业务规则，以一定业务规则维护的HC-TABLE关系集合，为分拣结果集提供分拣依据。分拣结果集，是业务的集合，是建立在分拣规则库基础上的一种多态形式；分拣结果集提供输入输出控制手段，对输出及输入的HC-TABLE子集进行控制进而产生不同的结果集；通过控制输入端，过滤分拣结果；通过控制输出端，以多态的形式生成分拣结果；生成每一个结果集可用结构化查询语言表示，作为分拣调度模块调度的基础。

分拣调度模块提供调度和分发功能，调度功能以任务的形式将结果集的结构化查询语言转换为实际数据文件，分发功能将数据文件进行分发。

此外，规则库提供CRUD访问接口，用于查询及维护HC-TABLE子集组件、字典翻译组件和HC-TABLE关系维护模块配置信息。

图2表示了分拣规则库的配置活动图，图3表示了分拣调度模块的序列图，有关的实现步骤分别如下。

配置HC-TABLE子集组件步骤是：

第四步，添加子集匹配栏位中英文名称；

第五步，添加子集展示次序、大小、占行长度及横竖位置；

第七步，日志记录，保存HC-TABLE子集；

配置字典翻译组件的步骤是：

第一步，新建字典翻译细目；

第二步，选择HC-TABLE子集已存在的标识；

第三步，添加标识对应的翻译项；

第四步，保存细目记录；

第五步，添加子集存在的<K，V>键值项；

第六步，保存键值项；

第七步，日志记录，完成；

HC-TABLE关系维护模块的流程是：

第一步，新建HC-TABLE；

第二步，添加一个或多个HC-TABLE子集软链接；

第三步，保存HC-TABLE；

第五步，保存关联关系；

第六步，日志记录，完成。

分拣规则库维护流程是：

第一步，新建分拣业务类别，生成唯一标识；

第二步，新建规则，产生规则标识；

第三步，选择一个或多个HC-TABLE组成规则主体；

第四步，选择已选HC-TABLE下的子集作为输出项；

第五步，保存规则；

第六步，日志记录，完成。

分拣结果集管理流程是：

第一步，新建分拣结果集类别，生成唯一标识；

第二步，选择一个或多个分拣规则；

第三步，当选择多个分拣规则时，判断是否存在关联关系；

第四步，通过子集的数据处理方式管理配置输出及输入项；

第五步，选择数据文件输出路径；

第六步，保存结果集，并生成结构化查询语言；

第七步，日志记录，完成。

分拣调度模块的流程是：

第一步，新建调度任务；

第二步，选择已配置完成的分拣结果集；

第三步，添加执行周期及时间；

第五步，日志记录，完成。

本发明将数据进行分拣定制化处理，具有扩展性好、适用范围广等特点，可有效地应用于多种业务型***中。

Claims

一种数据分拣***，其特征在于：所述的***由规则库和分拣调度模块组成，并提供相应的开发和集成接口；

所述的规则库，包括构成HC-TABLE的分拣配置库、基于HC-TABLE的分拣规则库以及分拣结果集；

所述的分拣配置库，提供构成HC-TABLE的单元组件集合，包括HC-TABLE子集组件、字典翻译组件和HC-TABLE关系维护模块；

所述的HC-TABLE子集组件，是构成HC-TABLE的单元；每一个子集都具备唯一标识及其特性，作为HC-TABLE的一个属性存在，HC-TABLE子集的唯一标识可以自定义为代码的形式，并通过字典翻译组件进行翻译；

所述的字典翻译组件，提供分拣过程中涉及到的代码翻译，支持代码转换为代码以及非代码两种方式的翻译；

所述的HC-TABLE关系维护模块，负责维护HC-TABLE间的关联关系，关联关系可由一个或多个子集的唯一标识组成，通过维护，将HC-TABLE间的关系动态关联，为分拣规则库提供规则基础；

所述的分拣规则库，提供具体的分拣业务规则，以一定业务规则维护的HC-TABLE关系集合，为分拣结果集提供分拣依据；

所述的分拣结果集，是业务的集合，是建立在分拣规则库基础上的一种多态形式；分拣结果集提供输入输出控制手段，对输出及输入的HC-TABLE子集进行控制进而产生不同的结果集；

所述的分拣调度模块提供调度和分发功能，调度功能以任务的形式将结果集的结构化查询语言转换为实际数据文件，分发功能将数据文件进行分发。
根据权利要求1所述的数据分拣***，其特征在于：所述的HC-TABLE是高可配的结构化表，可通过分拣配置库进行配置组装；HC-TABLE由一个或多个HC-TABLE子集组成。
根据权利要求1所述的数据分拣***，其特征在于：所述的分拣结果集通过控制输入端，过滤分拣结果；通过控制输出端，以多态的形式生成分拣结果；生成每一个结果集可用结构化查询语言表示，作为分拣调度模块调度的基础。
根据权利要求1所述的数据分拣***，其特征在于：所述的分拣结果集通过控制输入端，过滤分拣结果；通过控制输出端，以多态的形式生成分拣结果；生成每一个结果集可用结构化查询语言表示，作为分拣调度模块调度的基础。
根据权利要求1至4任一项所述的数据分拣***，其特征在于：所述的规则库提供CRUD访问接口，用于查询及维护HC-TABLE子集组件、字典翻译组件和HC-TABLE关系维护模块配置信息。
一种权利要求1-5任一项所述的数据分拣***的实现方法，其特征在于：

配置HC-TABLE子集组件步骤是：

第一步，选择HC-TABLE子集生成方式，新建或者复用原有子集；

第二步，选择HC-TABLE子集唯一标识生成方式，自定义或者***分配；

第三步，添加子集匹配库、表及其对应栏位，并校验该子集是否可用；

第四步，添加子集匹配栏位中英文名称；

第五步，添加子集展示次序、大小、占行长度及横竖位置；

第六步，添加子集可选的数据处理方式，包括求精度、截取和拼接功能；

第七步，日志记录，保存HC-TABLE子集；

配置字典翻译组件的步骤是：

第一步，新建字典翻译细目；

第二步，选择HC-TABLE子集已存在的标识；

第三步，添加标识对应的翻译项；

第四步，保存细目记录；

第五步，添加子集存在的<K,V>键值项；

第六步，保存键值项；

第七步，日志记录，完成；

HC-TABLE关系维护模块的流程是：

第一步，新建HC-TABLE；

第二步，添加一个或多个HC-TABLE子集软链接；

第三步，保存HC-TABLE；

第四步，添加HC-TABLE与其他TABLE存在的关联关系，包括左连接、右连接和全连接，并关联TABLE间的子集关系，形成一对一或一对多的映射关系；

第五步，保存关联关系；

第六步，日志记录，完成。
一种权利要求6所述的数据分拣***的实现方法，其特征在于：

分拣规则库维护流程是：

第一步，新建分拣业务类别，生成唯一标识；

第二步，新建规则，产生规则标识；

第三步，选择一个或多个HC-TABLE组成规则主体；

第四步，选择已选HC-TABLE下的子集作为输出项；

第五步，保存规则；

第六步，日志记录，完成。
一种权利要求6或7所述的数据分拣***的实现方法，其特征在于：

分拣结果集管理流程是：

第一步，新建分拣结果集类别，生成唯一标识；

第二步，选择一个或多个分拣规则；

第三步，当选择多个分拣规则时，判断是否存在关联关系；

第四步，通过子集的数据处理方式管理配置输出及输入项；

第五步，选择数据文件输出路径；

第六步，保存结果集，并生成结构化查询语言；

第七步，日志记录，完成。
一种权利要求6或7所述的数据分拣***的实现方法，其特征在于：

分拣调度模块的流程是：

第一步，新建调度任务；

第二步，选择已配置完成的分拣结果集；

第三步，添加执行周期及时间；

第四步，任务调度完成后根据结果集配置的文件服务器输出路径进行数据分发；

第五步，日志记录，完成。
一种权利要求8所述的数据分拣***的实现方法，其特征在于：

分拣调度模块的流程是：

第一步，新建调度任务；

第二步，选择已配置完成的分拣结果集；

第三步，添加执行周期及时间；

第四步，任务调度完成后根据结果集配置的文件服务器输出路径进行数据分发；

第五步，日志记录，完成。