CN114760365A - 一种数据提取方法、装置及电子设备 - Google Patents

一种数据提取方法、装置及电子设备 Download PDF

Info

Publication number
CN114760365A
CN114760365A CN202210421274.2A CN202210421274A CN114760365A CN 114760365 A CN114760365 A CN 114760365A CN 202210421274 A CN202210421274 A CN 202210421274A CN 114760365 A CN114760365 A CN 114760365A
Authority
CN
China
Prior art keywords
message
domain
information
standard
data extraction
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202210421274.2A
Other languages
English (en)
Other versions
CN114760365B (zh
Inventor
许彦键
杨润斌
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Agricultural Bank of China
Original Assignee
Agricultural Bank of China
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Agricultural Bank of China filed Critical Agricultural Bank of China
Priority to CN202210421274.2A priority Critical patent/CN114760365B/zh
Publication of CN114760365A publication Critical patent/CN114760365A/zh
Application granted granted Critical
Publication of CN114760365B publication Critical patent/CN114760365B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L69/00Network arrangements, protocols or services independent of the application payload and not provided for in the other groups of this subclass
    • H04L69/22Parsing or analysis of headers
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/35Clustering; Classification
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L69/00Network arrangements, protocols or services independent of the application payload and not provided for in the other groups of this subclass
    • H04L69/06Notations for structuring of protocol data, e.g. abstract syntax notation one [ASN.1]

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Computer Security & Cryptography (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Signal Processing (AREA)
  • Data Mining & Analysis (AREA)
  • Databases & Information Systems (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Information Transfer Between Computers (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明提供了一种数据提取方法、装置及电子设备,数据提取设备中预先配置有多种报文信息存储表,多种报文信息存储表具有特定映射关系。从而在需要进行报文提取时,获取报文类型,并从SWIFT报文标准书中确定出报文类型对应的报文标准页面,从报文标准页面中提取出报文主体信息,并将报文主体信息存储到多种报文信息存储表中的相应表中;报文主体信息包括报文域,确定报文域对应的集合域,依次跳转至报文域和集合域的标准界面,提取出标准界面的名称信息、格式信息以及域编码信息中的至少一个,并存储至多种报文信息存储表中的相应表中,解决了需要提取SWIFT报文标准书中的数据的问题。

Description

一种数据提取方法、装置及电子设备
技术领域
本发明涉及数据提取领域,更具体的说,涉及一种数据提取方法、装置及电子设备。
背景技术
目前每次进行SWIFT升级前,部分银行业务***都会以主办或协办方式参与升级项目,通过对报文标准书升级包的分析,结合当前***所涉及的电文类型,确定升级范围。而对升级包的解析主要就是将新的SWIFT报文标准书中的数据自动提取出来,并存储为静态数据表。
而SWIFT报文标准书的架构较为复杂,一种报文类型由多个网页嵌套描述,那么如何将SWIFT报文标准书中的数据提取出来,是本领域技术人员亟需解决的技术问题。
发明内容
有鉴于此,本发明提供一种数据提取方法、装置及电子设备,以解决需要提取出SWIFT报文标准书中的数据的问题。
为解决上述技术问题,本发明采用了如下技术方案:
一种数据提取方法,应用于数据提取设备,所述数据提取设备中预先配置有多种报文信息存储表,所述多种报文信息存储表具有特定映射关系,所述数据提取方法包括:
获取报文类型,并从SWIFT报文标准书中确定出所述报文类型对应的报文标准页面;
从所述报文标准页面中提取出报文主体信息,并将所述报文主体信息存储到所述多种报文信息存储表中的相应表中;所述报文主体信息包括报文域;
确定所述报文域对应的集合域;
依次跳转至所述报文域和所述集合域的标准界面,提取出所述标准界面的名称信息、格式信息以及域编码信息中的至少一个,并存储至所述多种报文信息存储表中的相应表中。
可选地,所述多种报文信息存储表包括报文主体表、报文集合域映射表、报文名称表、报文格式表和报文域编码表;
从所述报文标准页面中提取出报文主体信息,并将所述报文主体信息存储到所述多种报文信息存储表中的相应表中,包括:
从所述报文标准页面中至少提取出报文域、循环信息和必输项信息,并存储至所述报文主体表中。
可选地,确定所述报文域对应的集合域,包括:
提取所述报文域的选项值;
确定所述选项值是否是特殊标准符;
若是,则基于所述特殊标准符的类型,识别所述报文域对应的集合域。
可选地,在确定所述报文域对应的集合域之后,还包括:
将所述报文域以及所述报文域对应的集合域之间的映射关系,存储到所述报文集合域映射表中。
可选地,依次跳转至所述报文域和所述集合域的标准界面,提取出所述标准界面的名称信息、格式信息以及域编码信息中的至少一个,并存储至所述多种报文信息存储表中的相应表中,包括:
依次跳转至所述报文域的第一标准界面,并提取出所述第一标准界面的名称信息、格式信息以及域编码信息;
依次跳转至所述集合域的第二标准界面,并提取出所述第二标准界面的名称信息以及格式信息;
将提取的名称信息存储至报文名称表中,将提取的格式信息存储至报文格式表中,以及将提取的域编码信息存储至报文域编码表中。
可选地,将所述域编码信息存储至报文域编码表中之后,还包括:
将所述多种报文信息存储表中存储的数据转换为数据库脚本语言,并将所述数据库脚本语言作为静态数据模型。
一种数据提取装置,应用于数据提取设备,所述数据提取设备中预先配置有多种报文信息存储表,所述多种报文信息存储表具有特定映射关系,所述数据提取装置包括:
页面确定模块,用于获取报文类型,并从SWIFT报文标准书中确定出所述报文类型对应的报文标准页面;
第一数据存储模块,用于从所述报文标准页面中提取出报文主体信息,并将所述报文主体信息存储到所述多种报文信息存储表中的相应表中;所述报文主体信息包括报文域;
集合域确定模块,用于确定所述报文域对应的集合域;
第二数据存储模块,用于依次跳转至所述报文域和所述集合域的标准界面,提取出所述标准界面的名称信息、格式信息以及域编码信息中的至少一个,并存储至所述多种报文信息存储表中的相应表中。
可选地,所述多种报文信息存储表包括报文主体表、报文集合域映射表、报文名称表、报文格式表和报文域编码表;
所述第一数据存储模块具体用于:
从所述报文标准页面中至少提取出报文域、循环信息和必输项信息,并存储至所述报文主体表中。
可选地,所述集合域确定模块具体用于:
提取所述报文域的选项值,确定所述选项值是否是特殊标准符,若是,则基于所述特殊标准符的类型,识别所述报文域对应的集合域。
一种电子设备,包括:存储器和处理器;
其中,所述存储器用于存储程序;
处理器调用程序并用于执行上述的数据提取方法。
相较于现有技术,本发明具有以下有益效果:
本发明提供了一种数据提取方法、装置及电子设备,所述数据提取设备中预先配置有多种报文信息存储表,所述多种报文信息存储表具有特定映射关系。从而在需要进行报文提取时,获取报文类型,并从SWIFT报文标准书中确定出所述报文类型对应的报文标准页面,从所述报文标准页面中提取出报文主体信息,并将所述报文主体信息存储到所述多种报文信息存储表中的相应表中;所述报文主体信息包括报文域,确定所述报文域对应的集合域,依次跳转至所述报文域和所述集合域的标准界面,提取出所述标准界面的名称信息、格式信息以及域编码信息中的至少一个,并存储至所述多种报文信息存储表中的相应表中,解决了需要提取SWIFT报文标准书中的数据的问题。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据提供的附图获得其他的附图。
图1为本发明实施例提供的一种报文信息存储表的映射关系图;
图2为本发明实施例提供的一种数据提取方法的方法流程图;
图3为本发明实施例提供的一种数据提取方法的示意图;
图4为本发明实施例提供的一种数据提取方法的另一示意图;
图5为本发明实施例提供的一种数据提取方法的再一示意图;
图6为本发明实施例提供的一种数据提取方法的又一示意图;
图7为本发明实施例提供的一种数据提取方法的第五个示意图;
图8为本发明实施例提供的一种数据提取方法的第六个示意图;
图9为本发明实施例提供的一种数据提取装置的结构示意图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
为了本领域技术人员能够更加清楚的了解本发明的技术内容,先对一些专业术语进行解释。
SWIFT:环球同业银行金融电讯协会。
SWIFT报文:SWIFT提供的银行间通信的标准格式报文。
SWIFT报文标准书:SWIFT报文标准实用手册,用于查询报文的标准格式等。
HTML:一种用于创建网页的超文本标记语言。
通常,SWIFT每年都会组织报文标准的升级工作,包括涉及的电文类型以及电文域,据此对交易要素予以同步修改,并调整映射关系。SWIFT成员(银行)使用的部分银行业务***需对最新报文标准予以支持,且往往需在规定的时间点完成切换才不影响***电文的正常收发。这种情况下,就要求相关***能对这类升级予以最快的响应与实现,以满足最新的行业标准和业务要求。
目前每次SWIFT升级前,部分银行业务***都会以主办或协办方式参与升级项目,通过对报文标准书升级包的分析,结合当前***所涉及的电文类型,确定升级范围。而对升级包的解析主要就是分析新的SWIFT报文标准域的改动,根据报文域的变化改变映射关系,此时,如果能通过一种方法将新的报文标准域数据自动提取出来存储为静态数据表,在程序中形成映射关系,在每一次数据更新时,将数据提取出来,更新静态数据表,便能减少了手工及更新数据的工作量,减少大量的更新时间。
目前,在进行数据提取时,可以先定义数据提取标签和数据标签的使用格式后,通过标签数据解析器对HTML网页对的标签进行标签数据提取解析,数据解析后得到多维度数据,最后生成文本文件。
但由于SWIFT报文标准书较为复杂,一种报文类型由多个网页嵌套描述,上述这种标签解析方式,无法适用于SWIFT报文标准书的解析。
为了解决无法解析SWIFT报文标准书技术问题,发明人经过研究发现,SWIFT报文的标准书是以HTML网页的形式展示,我们可以通过获取HTML节点的方式将节点数据进行提取,但是SWIFT的报文标准是比较复杂的,包含着报文的标准域、隶属于哪个模块、以及域的必选和可选属性、域的规范性、是否循环等,其中大部分域中还包含可选域A、B、C等,域的规范性也会因类型的不同而变化,故单纯的通过将数据提取出来存为表格,也很难将表格数据转化为开发人员所需要的数据。
因此,可以将SWIFT报文标准书的数据以5个不同的数据表方式展示。从标准书中自动提取并生成对应的数据的数据库***语句,5个表的数据根据报文的类型和编号一一对应,各司其职,形成映射关系,构成静态数据模型。本技术方案能够快速获取新的SWIFT报文标准数据,减少因报文域的改变而引起的程序修改,同时减少人工操作工作量,具有方便灵活、适应性强、集中管理的特点。
在上述内容的基础上,本发明实施例提供了一种数据提取方法,应用于数据提取设备,数据提取设备可以是控制器、处理器等设备。
本发明的数据提取方法主要是用于提取SWIFT报文标准书。SWIFT报文标准书中,每一种报文都包含大量的域,每个域都拥有大量的属性,要将每种报文每个域的属性都一一映射为静态表数据,是比较困难的,报文域的映射关系复杂性主要表现为以下几点:
1、报文域分为必输域和可选域;
2、报文中有一些域是会循环的;
3、同一个报文域可能出现在不同的序列中,如57a(报文的一个信息域)会出现在Sequence A(报文的A序列),也会出现在Sequence B(报文的B序列);
4、同一个序列中还会存在子序列,如Sequence B中会包含Subsequence B1、Subsequence B2(报文的B序列中的子序列)等;
5、同一个域中包含多种集合域,如57a包含57A、57D,57J等,每种集合域的格式和含义也都不一样,如57A域的含义为Party Identifier和Identifier Code,57D域的含义为Party Identifier和Name and Address;
6、每个域的格式都不一样,格式均为正则表达式,且包含可选域和必输域,如57D域为[/1!a][/34x]4*35x,/1!a和/34x为可选域,4*35x为必输域;
7、大多数域中都包含多个格式,大部分报文域的格式均由多个正则表达式组装而成,如57A域为[/1!a][/34x]4!a2!a2!c[3!c],包含/1!a、/34x、4!a、2!a、2!c、3!c等多个必输域和可选域,其中带[]的为可选域;
8、部分域拥有默认值和可选值。
由于报文域的属性较为复杂,如果使用一个静态数据表来存储,则远远无法满足该复杂的映射关系,故该发明中设计了五个静态数据表,通过五个表的映射关系及层次递进关系,来形成报文结构树,可以很清晰的展示出报文域的映射关系。
因此,本发明中,所述数据提取设备中预先配置有多种报文信息存储表,所述多种报文信息存储表具有特定映射关系。
具体的,设计五张报文结构树表参照图1:
1、报文主体表:该表用于存储报文主体,主要存储该报文类型拥有哪些域,以及域的类型、是否必输、是否循环等。
报文主体表中登记着报文域的主体信息,根据报文类型的不同进行分类后,每一个报文的域都拥有唯一的报文域编号。
2、报文集合域映射表:该表应用于拥有多个集合域的域信息,用于存储多个集合域之间的映射关系,如Sequence A的57a映射为57A、57D,57J等。
报文集合域映射表中登记报文集合域之间的映射关系,如果该报文域拥有集合域(如57A/57D/57J)则该表中会为集合域生成一个新报文域编号,以进行区分并在后续的表映射关系中以该新的报文域编号进行映射;
报文集合域映射表中的报文域编号与报文主体表中的报文域编号对应。若是某一报文域有对应的集合域,则该报文域有对应的报文集合域映射表。
3、报文格式表:该表用于存储每一个报文域的格式,一个域包含多个格式得拆分为多条数据。
报文格式表中的报文域编号与报文主体表中的报文域编号和报文集合域映射表中的新报文域编号对应,报文格式表中存储每个报文域(包括报文域和集合域)的格式,因每个域中可能含有多行,故在该表中会根据域的行数生成新的报文子行编号,与报文名称表及报文域编码表形成映射关系。
4、报文名称表:该表用于存储每一个报文域的名称,如果一个域分为多行,则分为多条数据,每一行的名称也一一对应。
报文名称表中存储每个子行的名称,与报文格式表中的报文子行编号形成映射关系。
5、报文域编码表:该表用于存储一些拥有默认值和可选值的域和值。
报文域编码表中存储子行可选值信息,与报文格式表中的报文子行编号形成映射关系。
在上述五种报文信息存储表的基础上,参照图2,数据提取方法可以包括:
S11、获取报文类型,并从SWIFT报文标准书中确定出所述报文类型对应的报文标准页面。
由于SWIFT报文标准书为HTML的形式,每一项数据信息都能追溯到具体的某一个节点标签值,故我们可以通过获取HTML的不同节点的方式提取需要的数据。
具体的,获取报文类型,即先确定我们需要获取的报文类型,如确定需要获取MT300的报文数据。SWIFT报文标准书会根据报文类型进行分类,所以,可以根据报文类型从SWIFT报文标准书中查询到对应的报文标准页面。
如查询MT300的报文,可从3字头报文中找到MT300的报文后进入MT300的报文标准页面,具体参照图3。
S12、从所述报文标准页面中提取出报文主体信息,并将所述报文主体信息存储到所述多种报文信息存储表中的相应表中。
其中,所述报文主体信息包括报文域。
具体的,从所述报文标准页面中至少提取出报文域名、循环信息和必输项信息,并存储至所述报文主体表中。
详细来说,提取该报文类型标准首页的信息:提取该类报文的所有报文域名及是否必输、是否循环等基本属性,放入报文主体表数据列表。根据SWIFT报文标准书的Tag域可得报文域名(具体参照图3)。通过HTML的标签节点值提取域的状态status值可以获取该域是否为必输域,参照图4,为M则必输,为O则可选。
参照图5,当列表中存在循环标志箭头时,到出现END循环标志符之间的域,形成一个循环体,通过是否存在循环体,确定是否循环这一基本属性。
在提取出上述的报文域名及是否必输、是否循环等基本属性后,将其作为报文主体信息,并存储到报文主体表中。
报文主体表中的其他信息,如:报文类型、报文编号、序列编号、序列顺序、报文域类型、报文域编号的生成过程如下:
报文类型:SWIFT报文固定为MT。
报文编号:从SWIFT报文标准书首页获得,报文标准书详情页的标题中截取(图7标题可见)。
序列编号:由脚本按照一定规律生成,唯一标识。
序列顺序:该类型的电文域按从小到大的序号由脚本依次生成。
报文域类型:根据SWIFT报文标准书的Content/Options判断该域是否为集合域(参照图3)。
报文域编号:由脚本根据报文域按照一定规律生成。
S13、确定所述报文域对应的集合域。
具体的,提取所述报文域的选项值,确定所述选项值是否是特殊标准符。若是,则基于所述特殊标准符的类型,识别所述报文域对应的集合域。
详细来说,参照图6,查看该报文是否有特殊域(包含多种类型):提取报文域的选项options值,并判断是否为“A,D,or J”等特殊标准符。如果有,则根据A/D/J等类型进行分类后,确定报文域对应的集合域,并将所述报文域以及所述报文域对应的集合域之间的映射关系,存储到所述报文集合域映射表中。
报文集合域映射表中配置的字段有:报文域编号、报文类型、报文编号、新报文域编号和报文域顺序。
其中,报文域编号:与报文主体表的报文域编号对应。
报文类型:与报文主体表的报文类型对应。
报文编号:与报文主体表的报文编号对应。
新报文域编号:是报文主体表的报文域编号对应的集合域的编号,根据报文域编号,由脚本按照一定规律生成。
报文域顺序:以一个报文域为整体,按从小到大的序号由脚本依次生成。
S14、依次跳转至所述报文域和所述集合域的标准界面,提取出所述标准界面的名称信息、格式信息以及域编码信息中的至少一个,并存储至所述多种报文信息存储表中的相应表中。
具体的,步骤S14可以包括:
1)依次跳转至所述报文域的第一标准界面,并提取出所述第一标准界面的名称信息、格式信息以及域编码信息。
2)依次跳转至所述集合域的第二标准界面,并提取出所述第二标准界面的名称信息以及格式信息。
3)将提取的名称信息存储至报文名称表中,将提取的格式信息存储至报文格式表中,以及将提取的域编码信息存储至报文域编码表中。
具体的,循环提取每个域(包括报文域和集合域)的格式:循环进入每个域的标准页面(如报文域的第一标准界面和集合域的第二标准界面),通过读取每一个域的格式,根据行数进行拆分,再对格式的可选属性(域的格式中,带[]的为可选域,如[/1!a][/34x]4!a2!a2!c[3!c]的格式中,带[]的均为可选值)和报文格式内容进行拆分,放入报文格式表和报文名称表中。
如图7所示,图7是MT300的53a域的详情页,提取53a域中每一行的格式及其对应的描述(图7中的文本框中的内容),形成映射关系。
通过上述步骤,可以得到名称信息和格式信息,对于域编码信息,仅在报文域的第一标准界面中提取。
具体的,检查报文域的内容是否有可选值:在域的标准页中查看codes值是否有可选列表值,如果有,则放入报文域编码表中;
如图8所示,图8是MT300的49域的可选值为N和Y,通过提取表头CODES内的节点值可以获取到域的可选值,并存储至报文域编码表中。
本实施例中,报文格式表中的字段的含义如下:
报文域编号:与报文主体表的报文域编号及报文集合域映射表的新报文域编号对应。
报文类型:与报文主体表的报文类型对应。
报文编号:与报文主体表的报文编号对应。
报文域类型:与报文主体表的报文域类型对应。
报文域顺序:以一个报文域为整体,按行数按从小到大的序号由脚本依次生成。
报文子行编号:根据报文域编号,由脚本按照一定规律生成。
报文格式:由报文域的format部分第二栏获取(参照图7)。
开始符:报文格式的开始符。
结束符:报文格式的结束符。
报文名称表中的字段的含义如下:
报文域编号:与报文主体表的报文域编号及报文集合域映射表的新报文域编号对应。
报文域顺序:与报文集合域映射表的报文域顺序对应。
报文子行编号:与报文格式表的报文子行编号相对应。
报文子行顺序:与报文格式表的报文域顺序对应。
报文子行名称:由报文域的format部分第三栏获取(参照图7)。
报文域编码表中的字段的含义如下:
报文域编号:与报文主体表的报文域编号及报文集合域映射表的新报文域编号对应。
报文域顺序:与报文集合域映射表的报文域顺序对应。
报文子行编号:与报文格式表的报文子行编号相对应。
报文子行顺序:与报文格式表的报文域顺序对应。
可选值顺序:以一个报文域为整体,按行数按从小到大的序号由脚本依次生成。
可选值:由报文域的codes部分第一栏获取(图8)。
类型:与报文主体表的报文类型对应。
是否必输:与报文主体表的是否必输对应。
在上述将所述域编码信息存储至报文域编码表中之后,还包括:
将所述多种报文信息存储表中存储的数据转换为数据库脚本语言,并将所述数据库脚本语言作为静态数据模型。
具体的,将提取出来的数据格式化为数据库脚本语言(sql),构建成静态数据模型。
本发明将SWIFT报文的标准格式数据提取为静态数据表的形式,进而建立一套数据模型,实现了集中管理。
另外,本发明实现了将报文标准数据化,若在代码中通过读取数据的方式来编写报文配置,在后续SWIFT报文标准改动时,可减少***代码层面的改动,极大减少重复工作。
可选地,在上述数据提取方法的实施例的基础上,本发明的另一实施例提供了一种数据提取装置,应用于数据提取设备,所述数据提取设备中预先配置有多种报文信息存储表,所述多种报文信息存储表具有特定映射关系,参照图9,所述数据提取装置包括:
页面确定模块11,用于获取报文类型,并从SWIFT报文标准书中确定出所述报文类型对应的报文标准页面;
第一数据存储模块12,用于从所述报文标准页面中提取出报文主体信息,并将所述报文主体信息存储到所述多种报文信息存储表中的相应表中;所述报文主体信息包括报文域;
集合域确定模块13,用于确定所述报文域对应的集合域;
第二数据存储模块14,用于依次跳转至所述报文域和所述集合域的标准界面,提取出所述标准界面的名称信息、格式信息以及域编码信息中的至少一个,并存储至所述多种报文信息存储表中的相应表中。
进一步,所述多种报文信息存储表包括报文主体表、报文集合域映射表、报文名称表、报文格式表和报文域编码表;
所述第一数据存储模块具体用于:
从所述报文标准页面中至少提取出报文域、循环信息和必输项信息,并存储至所述报文主体表中。
进一步,所述集合域确定模块具体用于:
提取所述报文域的选项值,确定所述选项值是否是特殊标准符,若是,则基于所述特殊标准符的类型,识别所述报文域对应的集合域。
进一步,还包括:
第三数据存储模块,用于将所述报文域以及所述报文域对应的集合域之间的映射关系,存储到所述报文集合域映射表中。
进一步,第二数据存储模块14包括:
第一提取子模块,用于依次跳转至所述报文域的第一标准界面,并提取出所述第一标准界面的名称信息、格式信息以及域编码信息;
第二提取子模块,用于依次跳转至所述集合域的第二标准界面,并提取出所述第二标准界面的名称信息以及格式信息;
数据存储子模块,用于将提取的名称信息存储至报文名称表中,将提取的格式信息存储至报文格式表中,以及将提取的域编码信息存储至报文域编码表中。
进一步,还包括:
模型确定模块,用于将所述多种报文信息存储表中存储的数据转换为数据库脚本语言,并将所述数据库脚本语言作为静态数据模型。
本实施例中,所述数据提取设备中预先配置有多种报文信息存储表,所述多种报文信息存储表具有特定映射关系。从而在需要进行报文提取时,获取报文类型,并从SWIFT报文标准书中确定出所述报文类型对应的报文标准页面,从所述报文标准页面中提取出报文主体信息,并将所述报文主体信息存储到所述多种报文信息存储表中的相应表中;所述报文主体信息包括报文域,确定所述报文域对应的集合域,依次跳转至所述报文域和所述集合域的标准界面,提取出所述标准界面的名称信息、格式信息以及域编码信息中的至少一个,并存储至所述多种报文信息存储表中的相应表中,解决了需要提取SWIFT报文标准书中的数据的问题。
需要说明的是,本实施例中的各个模块、子模块的工作过程,请参照上述实施例中的相应说明,在此不再赘述。
可选地,在上述数据提取方法及装置的实施例的基础上,本发明的另一实施例提供了一种电子设备,电子设备可以是上述的数据提取设备。
电子设备包括:存储器和处理器;
其中,所述存储器用于存储程序;
处理器调用程序并用于执行上述的数据提取方法。
本实施例中,所述数据提取设备中预先配置有多种报文信息存储表,所述多种报文信息存储表具有特定映射关系。从而在需要进行报文提取时,获取报文类型,并从SWIFT报文标准书中确定出所述报文类型对应的报文标准页面,从所述报文标准页面中提取出报文主体信息,并将所述报文主体信息存储到所述多种报文信息存储表中的相应表中;所述报文主体信息包括报文域,确定所述报文域对应的集合域,依次跳转至所述报文域和所述集合域的标准界面,提取出所述标准界面的名称信息、格式信息以及域编码信息中的至少一个,并存储至所述多种报文信息存储表中的相应表中,解决了需要提取SWIFT报文标准书中的数据的问题。
对所公开的实施例的上述说明,使本领域专业技术人员能够实现或使用本发明。对这些实施例的多种修改对本领域的专业技术人员来说将是显而易见的,本文中所定义的一般原理可以在不脱离本发明的精神或范围的情况下,在其它实施例中实现。因此,本发明将不会被限制于本文所示的这些实施例,而是要符合与本文所公开的原理和新颖特点相一致的最宽的范围。

Claims (10)

1.一种数据提取方法,其特征在于,应用于数据提取设备,所述数据提取设备中预先配置有多种报文信息存储表,所述多种报文信息存储表具有特定映射关系,所述数据提取方法包括:
获取报文类型,并从SWIFT报文标准书中确定出所述报文类型对应的报文标准页面;
从所述报文标准页面中提取出报文主体信息,并将所述报文主体信息存储到所述多种报文信息存储表中的相应表中;所述报文主体信息包括报文域;
确定所述报文域对应的集合域;
依次跳转至所述报文域和所述集合域的标准界面,提取出所述标准界面的名称信息、格式信息以及域编码信息中的至少一个,并存储至所述多种报文信息存储表中的相应表中。
2.根据权利要求1所述的数据提取方法,其特征在于,所述多种报文信息存储表包括报文主体表、报文集合域映射表、报文名称表、报文格式表和报文域编码表;
从所述报文标准页面中提取出报文主体信息,并将所述报文主体信息存储到所述多种报文信息存储表中的相应表中,包括:
从所述报文标准页面中至少提取出报文域、循环信息和必输项信息,并存储至所述报文主体表中。
3.根据权利要求2所述的数据提取方法,其特征在于,确定所述报文域对应的集合域,包括:
提取所述报文域的选项值;
确定所述选项值是否是特殊标准符;
若是,则基于所述特殊标准符的类型,识别所述报文域对应的集合域。
4.根据权利要求3所述的数据提取方法,其特征在于,在确定所述报文域对应的集合域之后,还包括:
将所述报文域以及所述报文域对应的集合域之间的映射关系,存储到所述报文集合域映射表中。
5.根据权利要求2所述的数据提取方法,其特征在于,依次跳转至所述报文域和所述集合域的标准界面,提取出所述标准界面的名称信息、格式信息以及域编码信息中的至少一个,并存储至所述多种报文信息存储表中的相应表中,包括:
依次跳转至所述报文域的第一标准界面,并提取出所述第一标准界面的名称信息、格式信息以及域编码信息;
依次跳转至所述集合域的第二标准界面,并提取出所述第二标准界面的名称信息以及格式信息;
将提取的名称信息存储至报文名称表中,将提取的格式信息存储至报文格式表中,以及将提取的域编码信息存储至报文域编码表中。
6.根据权利要求5所述的数据提取方法,其特征在于,将所述域编码信息存储至报文域编码表中之后,还包括:
将所述多种报文信息存储表中存储的数据转换为数据库脚本语言,并将所述数据库脚本语言作为静态数据模型。
7.一种数据提取装置,其特征在于,应用于数据提取设备,所述数据提取设备中预先配置有多种报文信息存储表,所述多种报文信息存储表具有特定映射关系,所述数据提取装置包括:
页面确定模块,用于获取报文类型,并从SWIFT报文标准书中确定出所述报文类型对应的报文标准页面;
第一数据存储模块,用于从所述报文标准页面中提取出报文主体信息,并将所述报文主体信息存储到所述多种报文信息存储表中的相应表中;所述报文主体信息包括报文域;
集合域确定模块,用于确定所述报文域对应的集合域;
第二数据存储模块,用于依次跳转至所述报文域和所述集合域的标准界面,提取出所述标准界面的名称信息、格式信息以及域编码信息中的至少一个,并存储至所述多种报文信息存储表中的相应表中。
8.根据权利要求7所述的数据提取装置,其特征在于,所述多种报文信息存储表包括报文主体表、报文集合域映射表、报文名称表、报文格式表和报文域编码表;
所述第一数据存储模块具体用于:
从所述报文标准页面中至少提取出报文域、循环信息和必输项信息,并存储至所述报文主体表中。
9.根据权利要求8所述的数据提取装置,其特征在于,所述集合域确定模块具体用于:
提取所述报文域的选项值,确定所述选项值是否是特殊标准符,若是,则基于所述特殊标准符的类型,识别所述报文域对应的集合域。
10.一种电子设备,其特征在于,包括:存储器和处理器;
其中,所述存储器用于存储程序;
处理器调用程序并用于执行如权利要求1-6任一项所述的数据提取方法。
CN202210421274.2A 2022-04-21 2022-04-21 一种数据提取方法、装置及电子设备 Active CN114760365B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202210421274.2A CN114760365B (zh) 2022-04-21 2022-04-21 一种数据提取方法、装置及电子设备

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202210421274.2A CN114760365B (zh) 2022-04-21 2022-04-21 一种数据提取方法、装置及电子设备

Publications (2)

Publication Number Publication Date
CN114760365A true CN114760365A (zh) 2022-07-15
CN114760365B CN114760365B (zh) 2024-06-11

Family

ID=82332072

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202210421274.2A Active CN114760365B (zh) 2022-04-21 2022-04-21 一种数据提取方法、装置及电子设备

Country Status (1)

Country Link
CN (1) CN114760365B (zh)

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109344183A (zh) * 2018-01-30 2019-02-15 深圳壹账通智能科技有限公司 数据交互方法、装置、计算机设备和存储介质
CN113312108A (zh) * 2021-06-18 2021-08-27 中国农业银行股份有限公司 Swift报文的校验方法、装置、电子设备及存储介质

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109344183A (zh) * 2018-01-30 2019-02-15 深圳壹账通智能科技有限公司 数据交互方法、装置、计算机设备和存储介质
WO2019149019A1 (zh) * 2018-01-30 2019-08-08 深圳壹账通智能科技有限公司 数据交互方法、装置、计算机设备和存储介质
CN113312108A (zh) * 2021-06-18 2021-08-27 中国农业银行股份有限公司 Swift报文的校验方法、装置、电子设备及存储介质

Also Published As

Publication number Publication date
CN114760365B (zh) 2024-06-11

Similar Documents

Publication Publication Date Title
CN103077185B (zh) 一种基于对象的自定义扩展信息的方法
CN102662966B (zh) 一种面向主题的获取动态页面内容的方法及***
CN110333863B (zh) 一种生成、显示小程序页面的方法及装置
CN111045678A (zh) 页面执行动态代码的方法、装置、设备及存储介质
CN103389895A (zh) 一种前端页面的生成方法及***
CN113312108B (zh) Swift报文的校验方法、装置、电子设备及存储介质
CN108170409B (zh) Web前端控件的开发方法和***
CN108664546B (zh) Xml数据结构转换方法和装置
CN110020358A (zh) 用于生成动态页面的方法和装置
CN113158101A (zh) 一种可视化页面渲染方法、装置、设备及存储介质
CN111628975A (zh) 一种组装xml报文的方法及装置
CN111508562A (zh) 流程描述性语言的可视化显示方法、装置、设备和介质
CN107590288B (zh) 用于抽取网页图文块的方法和装置
US7461337B2 (en) Exception markup documents
CN112463261B (zh) 接口调用方法、装置、电子设备、介质及产品
CN114398138A (zh) 界面生成方法、装置、计算机设备和存储介质
CN112632425A (zh) 一种离线资源文件的生成方法、装置、设备及存储介质
CN112650492A (zh) 一种Web页面的渲染方法、***及相关装置
EP2711838A1 (en) Documentation parser
CN114760365B (zh) 一种数据提取方法、装置及电子设备
JP2006065467A (ja) データ抽出定義情報生成装置およびデータ抽出定義情報生成方法
CN113656000B (zh) 网页的处理方法和装置
CN112800078A (zh) 基于javascript的轻量级文本标注方法、***、设备及存储介质
CN111475403A (zh) 测试脚本的动态生成方法及相关装置
CN111309319A (zh) 可继承的局数据动态页面配置方法和装置

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant