CN112767138B - 国际收支申报数据漏报检测方法及*** - Google Patents

国际收支申报数据漏报检测方法及*** Download PDF

Info

Publication number
CN112767138B
CN112767138B CN202110184003.5A CN202110184003A CN112767138B CN 112767138 B CN112767138 B CN 112767138B CN 202110184003 A CN202110184003 A CN 202110184003A CN 112767138 B CN112767138 B CN 112767138B
Authority
CN
China
Prior art keywords
data
missing report
transaction
international balance
international
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202110184003.5A
Other languages
English (en)
Other versions
CN112767138A (zh
Inventor
钟玉兴
李伟良
李旺
尹智伟
袁鹏
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Industrial and Commercial Bank of China Ltd ICBC
Original Assignee
Industrial and Commercial Bank of China Ltd ICBC
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Industrial and Commercial Bank of China Ltd ICBC filed Critical Industrial and Commercial Bank of China Ltd ICBC
Priority to CN202110184003.5A priority Critical patent/CN112767138B/zh
Publication of CN112767138A publication Critical patent/CN112767138A/zh
Application granted granted Critical
Publication of CN112767138B publication Critical patent/CN112767138B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q40/00Finance; Insurance; Tax strategies; Processing of corporate or income taxes
    • G06Q40/02Banking, e.g. interest calculation or account maintenance
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • G06F40/279Recognition of textual entities
    • G06F40/284Lexical analysis, e.g. tokenisation or collocates
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q40/00Finance; Insurance; Tax strategies; Processing of corporate or income taxes
    • G06Q40/04Trading; Exchange, e.g. stocks, commodities, derivatives or currency exchange

Landscapes

  • Engineering & Computer Science (AREA)
  • Business, Economics & Management (AREA)
  • Finance (AREA)
  • Accounting & Taxation (AREA)
  • Theoretical Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Physics & Mathematics (AREA)
  • Marketing (AREA)
  • Development Economics (AREA)
  • Economics (AREA)
  • Strategic Management (AREA)
  • Technology Law (AREA)
  • General Business, Economics & Management (AREA)
  • General Engineering & Computer Science (AREA)
  • General Health & Medical Sciences (AREA)
  • Computational Linguistics (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Artificial Intelligence (AREA)
  • Health & Medical Sciences (AREA)
  • Financial Or Insurance-Related Operations Such As Payment And Settlement (AREA)

Abstract

本发明提供了一种国际收支申报数据漏报检测方法及***,可用于人工智能领域,所述方法包括:获取国际收支交易数据和客户输入的国际收支申报数据;通过预设的漏报检测模型根据所述国际收支交易数据和所述国际收支申报数据确定所述国际收支申报数据中是否存在漏报数据;若存在漏报数据,形成漏报警示信息以反馈给管理人员,本发明可及时发现国际收支申报数据中的漏报数据,以确保国际收支申报数据的及时性、准确性和完整性。

Description

国际收支申报数据漏报检测方法及***
技术领域
本发明涉及大数据技术领域,特别涉及人工智能领域,尤其涉及一种国际收支申报数据漏报检测方法及***。
背景技术
银行等金融机构的客户通常在办理境外收款或对外付款后,需要通过交易银行进行国际收支间接申报。客户应按要求完整、准确地根据境外收款或对外付款的国际收支数据填写申报单的各项内容,做到不漏报、不错报和不迟报。银行等金融机构会根据国际收支交易的记录对客户上报的国际收支数据审核和发送国际收支统计申报相关信息等职责,确保申报数据的及时性、准确性和完整性。如何避免国际收支统计间接申报中的漏报,是银行等金融机构防范合规性风险的难点问题。
发明内容
本发明的一个目的在于提供一种国际收支申报数据漏报检测方法,及时发现国际收支申报数据中的漏报数据,以确保国际收支申报数据的及时性、准确性和完整性。本发明的另一个目的在于提供一种国际收支申报数据漏报检测***。本发明再一个目的在于提供一种计算机设备。本发明还一个目的在于提供一种可读介质。
为了达到以上目的,本发明一方面公开了一种国际收支申报数据漏报检测方法,包括:
获取国际收支交易数据和客户输入的国际收支申报数据;
通过预设的漏报检测模型根据所述国际收支交易数据和所述国际收支申报数据确定所述国际收支申报数据中是否存在漏报数据;
若存在漏报数据,形成漏报警示信息以反馈给管理人员。
优选的,进一步包括预先建立所述漏报检测模型的步骤:
根据预设模型训练规则对历史国际收支交易数据进行样本数据抽取得到交易样本数据,所述模型训练规则包括国际收支交易数据和国际收支申报数据的源表信息以及数据抽取规则;
对交易数据样本的国际收支申报数据进行样本数据抽取得到申报样本数据;
对所述历史国际收支交易数据进行标记得到是否漏报的标签;
根据所述交易样本数据、所述申报样本数据和所述标签对预设训练模型进行训练得到所述漏报检测模型。
优选的,若所述交易类型为退款交易,所述退款交易的源表信息包括退款交易明细表和退款交易申报表,所述数据抽取规则包括抽取交易附言。
优选的,所述通过预设的漏报检测模型根据所述国际收支交易数据和所述国际收支申报数据确定所述国际收支申报数据中是否存在漏报数据具体包括:
根据所述国际收支申报数据确定交易类型;
根据所述交易类型确定对应的目标漏报检测模型;
通过所述目标漏报检测模型根据所述国际收支交易数据和所述国际收支申报数据确定所述国际收支申报数据中是否存在漏报数据。
优选的,进一步包括:
基于管理人员针对所述漏报警示信息确定所述国际收支申报数据是否存在漏报数据的反馈信息确定所述漏报检测模型的检测结果是否准确;
统计预设时间段内所述漏报检测模型的检测结果的准确率;
若所述准确率低于预设准确率阈值,则下线所述漏报检测模型。
优选的,进一步包括:
基于管理人员针对所述漏报警示信息确定所述国际收支申报数据是否存在漏报数据的反馈信息确定所述漏报检测模型的检测结果是否准确;
根据所述检测结果是否准确确定是否漏报的标签;
根据所述国际收支申报数据、所述国际收支交易数据和所述标签得到更新样本数据以对所述漏报检测模型进行再训练。
优选的,所述若存在漏报数据,形成漏报警示信息以反馈给管理人员具体包括:
若存在漏报数据;
根据所述漏报数据形成包括补报信息的漏报警示信息并将所述漏报警示信息反馈给管理人员;
根据管理人员针对所述漏报警示信息的确认操作对所述国际收支申报数据进行补报。
本发明还公开了一种国际收支申报数据漏报检测***,包括:
数据获取模块,用于获取国际收支交易数据和客户输入的国际收支申报数据;
漏报检测模块,用于通过预设的漏报检测模型根据所述国际收支交易数据和所述国际收支申报数据确定所述国际收支申报数据中是否存在漏报数据;
漏报反馈模块,用于若存在漏报数据,形成漏报警示信息以反馈给管理人员。
本发明还公开了一种计算机设备,包括存储器、处理器以及存储在存储器上并可在处理器上运行的计算机程序,
所述处理器执行所述程序时实现如上所述方法。
本发明还公开了一种计算机可读介质,其上存储有计算机程序,
该程序被处理器执行时实现如上所述方法。
本发明通过对国际收支交易数据和客户输入的国际收支申报数据进行数据抽取,将抽取得到的国际收支交易数据和客户输入的国际收支申报数据输入预设的漏报检测模型,通过漏报检测模型智能、自动和快速的检测客户输入的国际收支申报数据中是否存在漏报数据。进一步的,当存在漏报数据时,根据漏报检测结果形成漏报警示信息以反馈给管理人员,以便于管理人员针对漏报数据进行补报,确保申报数据的及时性、准确性和完整性。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1示出本发明国际收支申报数据漏报检测方法一个具体实施例的流程图;
图2示出本发明国际收支申报数据漏报检测方法一个具体实施例S000的流程图;
图3示出本发明国际收支申报数据漏报检测方法一个具体实施例S200的流程图;
图4示出本发明国际收支申报数据漏报检测方法一个具体实施例模型评价的流程图;
图5示出本发明国际收支申报数据漏报检测方法一个具体实施例S500的流程图;
图6示出本发明国际收支申报数据漏报检测方法一个具体实施例S300的流程图;
图7示出本发明国际收支申报数据漏报检测***一个具体实施例的结构图;
图8示出本发明国际收支申报数据漏报检测***一个具体实施例包括漏报检测模块的结构图;
图9示出适于用来实现本发明实施例的计算机设备的结构示意图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
需要说明的是,本申请公开的国际收支申报数据漏报检测方法及***可用于人工智能技术领域,也可用于除人工智能技术领域之外的任意领域,本申请公开的国际收支申报数据漏报检测方法及***的应用领域不做限定。
需要说明的是,国际收支统计申报是编制国家国际收支平衡表和国际投资头寸表的重要数据来源,也是国家制订货币政策、汇率政策的重要依据。根据国家外汇管理政策的规定,境内个人或单位通过银行等金融机构办理的境外收款或对外付款,都必须通过交易银行进行国际收支间接申报。客户应按要求完整、准确地填写申报单的各项内容(除“申报号码”等信息由银行填写外,其余各项均由客户填写),做到不漏报、不错报、不迟报。银行应该履行审核和发送国际收支统计申报相关信息等职责,确保申报数据的及时性、准确性和完整性。如何避免国际收支统计间接申报中的漏报,是银行防范合规性风险的难点问题。伴随着金融全球化的不断融合发展和金融创新的日益多样化,国际收支统计间接申报漏报的形式也更趋于复杂化。比如,目前国际收支统计间接申报对5000美元以下(含5000美元)的对私涉外收付款,实行限额下免申报。由于***折算率使用月折算率,而银行多使用日折算率,可能造成5000美元左右的数据漏报。再比如,在金融产品层出不穷的全球化背景下,各类融资产品在被赋予抵押、担保、转卖等种种特性后,其复杂性已经将原始交易性质层层掩盖。尤其是福费廷、押汇、海外代付等产品,在交易关联方多、交易时点不清的情况下容易产生漏报。为了解决目前国际收支申报数据可能存在漏报的情况,本发明提供了一种国际收支申报数据漏报检测方法及***,智能、自动和快速的检测客户输入的国际收支申报数据中是否存在漏报数据,以便于管理人员针对漏报数据进行补报,确保申报数据的及时性、准确性和完整性。
根据本发明的一个方面,本实施例公开了一种国际收支申报数据漏报检测方法。
如图1所示,本实施例中,所述方法包括:
S100:获取国际收支交易数据和客户输入的国际收支申报数据。
S200:通过预设的漏报检测模型根据所述国际收支交易数据和所述国际收支申报数据确定所述国际收支申报数据中是否存在漏报数据。
S300:若存在漏报数据,形成漏报警示信息以反馈给管理人员。
本发明通过对国际收支交易数据和客户输入的国际收支申报数据进行数据抽取,将抽取得到的国际收支交易数据和客户输入的国际收支申报数据输入预设的漏报检测模型,通过漏报检测模型智能、自动和快速的检测客户输入的国际收支申报数据中是否存在漏报数据。进一步的,当存在漏报数据时,根据漏报检测结果形成漏报警示信息以反馈给管理人员,以便于管理人员针对漏报数据进行补报,确保申报数据的及时性、准确性和完整性。
在优选的实施方式中,如图2所示,所述方法进一步包括预先建立所述漏报检测模型的步骤S000:
S010:根据预设模型训练规则对历史国际收支交易数据进行样本数据抽取得到交易样本数据,所述模型训练规则包括国际收支交易数据和国际收支申报数据的源表信息以及数据抽取规则,对交易数据样本的国际收支申报数据进行样本数据抽取得到申报样本数据。其中,需要说明的是,国际收支交易数据可包括收入或支出等类型的交易类型、交易金额、交易账号以及表示何种交易的交易性质等交易数据,根据国际收支交易数据进行申报的申报数据可以包括交易类型、交易附言和交易对象国别等信息。在实际应用中,本领域技术人员可根据实际需求得到国际收支交易数据和国际收支申报数据,为本领域的常规技术手段,本发明对此并不作限定。
S020:对所述历史国际收支交易数据进行标记得到是否漏报的标签。
S030:根据所述交易样本数据、所述申报样本数据和所述标签对预设训练模型进行训练得到所述漏报检测模型。
可以理解的是,在该优选的实施方式中,国际收支交易数据和申报数据中可能存在自然语言的识别和检测,涉及自然语言处理。自然语言处理是计算机科学,人工智能,语言学关注计算机和人类语言直接的相互作用的领域。因此,在该优选的实施方式中,可采用自然语言处理和机器学习的训练模型有FastText,TextCNN,ULMFit,BERT等。例如,在一个具体例子中,可采用FastText模型作为训练模型,FastText模型中输入一个词的序列,可输出这个词序列属于不同类别的概率,即可通过对训练模型进行训练,使得到的漏报检测模型可以检测实时输入的待检测数据为漏报类别和不是漏报类别的概率,实现漏报检测的目的。其中,在训练模型中,所述交易样本数据和所述申报样本数据形成的序列中的词和词组组成特征向量,特征向量通过线性变换映射到中间层,中间层在映射到标签。
需要说明的是,该优选的实施方式中,用于训练所述训练模型的交易样本数据、所述申报样本数据和所述标签的样本数据,可以通过对历史国际收支交易数据和国际收支申报数据进行抽取得到,也可以通过管理人员上传得到。即本发明也可人工上传已经完成标注的样本数据,业务管理人员可以对现有的错报漏报的数据进行样本数据标注后输入,则可根据管理人员输入的样本数据进行模型训练。
在该优选的实施方式中,在模型训练过程中,根据预设的模型训练规则从数据库(数据湖)中从国际收支交易数据和国际收支申报数据中抽取对应的数据可得到交易样本数据和申报样本数据。进一步的,对该国际收支申报数据的相关申报信息进行分析可得到该国际收支申报数据是否存在漏报,可对抽取的申报样本数据进行是否漏报的标签标注。其中,预设的模型训练规则可以包括该模型训练需要抽取的国际收支交易数据和国际收支申报数据的源表信息以及数据抽取规则,数据抽取规则中限定了从源表信息中抽取的具体数据,通过数据抽取规则可从源表信息中抽取需要的数据得到交易样本数据和申报样本数据。例如,在一个具体例子中,对于进口信用证业务,模型训练规则中的源表信息指定数据湖中的表DCM_GDS_F_BSAG_ILCBMAN_A,数据抽取规则为预设时间内发生过对外付款交易的业务,若在对应时间段的国际收支申报数据不存在,则自动设置为漏报标签。
在优选的实施方式中,若所述交易类型为退款交易,所述退款交易的源表信息包括退款交易明细表和退款交易申报表,所述数据抽取规则包括抽取交易附言。
可以理解的是,本发明中的漏报检测模型可以是一个,也可以是多个。优选的,可以针对每个交易类型设置一个漏报检测模型,以提高漏报检测的准确率。比如,实务中,退款业务和错汇款业务虽然都会产生“退款”的实际操作,但两种业务在国际收支统计申报业务处理上有很大的区别:错汇款业务由于并没有实际的交易背景,处理方式是删除前一笔交易申报信息,对错汇款的退款不进行申报。而退款业务要根据实际交易背景保留前一笔申报信息,并对当前退款做同一个交易性质项目下的申报,同时勾选“退款”选项。实务中,由于容易将上述两个概念混淆而将退款业务错认为是错汇款业务,从而造成退款业务前后两笔申报数据的漏报。
由此,在该优选的实施方式中,通过模型训练可得到一个与退款交易对应的退款业务漏报检测模型,以解决退款交易下漏报情况的检测发现。通过设置模型训练规则,可设置源表信息包括数据湖中的退款交易明细表,与报送的述国际收支申报数据一同抽取得到样本数据。进一步的,在具体例子中,可选择FastText训练模型得到漏报检测模型,可将漏报检测模型的准确度设定为95%,以保证训练得到的漏报检测模型的检测准确率。对于退款交易来说,数据抽取规则中包括抽取交易附言,则根据训练得到的漏报检测模型,识别出的检测结果如表1所示:
表1
在优选的实施方式中,如图3所示,所述S200通过预设的漏报检测模型根据所述国际收支交易数据和所述国际收支申报数据确定所述国际收支申报数据中是否存在漏报数据具体包括:
S210:根据所述国际收支申报数据确定交易类型。
S220:根据所述交易类型确定对应的目标漏报检测模型。
S230:通过所述目标漏报检测模型根据所述国际收支交易数据和所述国际收支申报数据确定所述国际收支申报数据中是否存在漏报数据。
可以理解的是,本发明中的漏报检测模型可以是一个,也可以是多个。优选的,可以针对每个交易类型设置一个漏报检测模型,以提高漏报检测的准确率。从而在该优选的实施方式中,根据每个交易类型设置一个漏报检测模型,则所有交易类型的漏报检测模型可以形成模型库。当需要对国际收支申报数据或国际收支交易数据进行漏报检测时,可首先根据所述国际收支申报数据确定交易类型,根据所述交易类型选择对应的目标漏报检测模型,通过该交易对应的目标漏报检测模型根据所述国际收支交易数据和所述国际收支申报数据确定所述国际收支申报数据中是否存在漏报数据,以实现特定交易类型的申报数据漏报检测。
在优选的实施方式中,如图4所示,所述方法进一步包括:
S410:基于管理人员针对所述漏报警示信息确定所述国际收支申报数据是否存在漏报数据的反馈信息确定所述漏报检测模型的检测结果是否准确。
S420:统计预设时间段内所述漏报检测模型的检测结果的准确率。
S430:若所述准确率低于预设准确率阈值,则下线所述漏报检测模型。
可以理解的是,若存在漏报数据,可形成漏报警示信息以反馈给管理人员,实现模型作业运行结果的展现输出,可以通过邮件或者短信等方式通知到金融机构管理人员及时进行确认。则根据管理人员针对漏报警示信息的反馈信息可确定每次漏报检测模型的检测结果是否准确,管理人员可针对漏报检测结果的判定,确定是否需要补报,即确定存在漏报或者模型检测误报两种确认结果,反馈信息可包括“需整改”和“无需整改”等信息。根据统计得到的一段时间内管理人员的反馈信息可以对漏报检测模型的检测准确率进行评估,若低于预设准确率阈值,则表示漏报检测模型的检测准确率不高,误报率较高,可下线该漏报检测模型对便于开发人员对该漏报检测模型进行优化,保证运行的漏报检测模型的检测准确率。
在优选的实施方式中,如图5所示,所述方法进一步包括S500:
S510:基于管理人员针对所述漏报警示信息确定所述国际收支申报数据是否存在漏报数据的反馈信息确定所述漏报检测模型的检测结果是否准确。
S520:根据所述检测结果是否准确确定是否漏报的标签。
S530:根据所述国际收支申报数据、所述国际收支交易数据和所述标签得到更新样本数据以对所述漏报检测模型进行再训练。
可以理解的是,针对每次模型运行结果以及管理人员对于漏报警示信息的反馈信息可形成更新样本数据,该更新样本数据可作为样本数据对漏报检测模型进行进一步的训练,以适应不断变化的交易数据和申报数据变化,提高漏报检测模型的检测准确率。进一步的,可设置模型运行策略,如设置为按时间定时触发或事件触发的任务,自动执行。用户可以自行配置触发的时间、事件、执行次数等信息,例如设置任务在工作日每天12:00或每隔1小时执行一次;在增量数据达到增量阈值的情况下自动运行等。同理的,可设置模型训练策略,定时或根据数据量对漏报检测模型进行自动再训练以实现对漏报检测模型的在线自动优化升级。
在优选的实施方式中,如图6所示,所述S300若存在漏报数据,形成漏报警示信息以反馈给管理人员具体包括:
S310:若存在漏报数据。
S320:根据所述漏报数据形成包括补报信息的漏报警示信息并将所述漏报警示信息反馈给管理人员。
S330:根据管理人员针对所述漏报警示信息的确认操作对所述国际收支申报数据进行补报。
可以理解的是,若存在漏报数据,可以根据漏报数据形成补报信息,将补报信息设置于漏报警示信息中反馈给管理人员,管理人员可根据漏报警示信息检查确认是否存在漏报。若存在漏报,可同时确定生成的补报信息是否准确,若补报信息准确,管理人员可通过简单的确认操作对补报信息进行确认和补报,无需再手动输入进行申报数据的补报。
本发明提供了一种基于大数据技术避免国际收支申报数据漏报的国际收支申报数据漏报检测方法,本发明支持数据模型训练和发布运行,及时发现漏报数据,并可智能生成补报信息主动推送给银行等金融机构的管理人员进行确认后自动完成补报,确保申报数据的及时性、准确性和完整性。
基于相同原理,本实施例还公开了一种国际收支申报数据漏报检测***。如图7所示,所述***包括数据获取模块11、漏报检测模块12和漏报反馈模块13。
其中,数据获取模块11用于获取国际收支交易数据和客户输入的国际收支申报数据。
漏报检测模块12用于通过预设的漏报检测模型根据所述国际收支交易数据和所述国际收支申报数据确定所述国际收支申报数据中是否存在漏报数据。
漏报反馈模块13用于若存在漏报数据,形成漏报警示信息以反馈给管理人员。
本发明通过对国际收支交易数据和客户输入的国际收支申报数据进行数据抽取,将抽取得到的国际收支交易数据和客户输入的国际收支申报数据输入预设的漏报检测模型,通过漏报检测模型智能、自动和快速的检测客户输入的国际收支申报数据中是否存在漏报数据。进一步的,当存在漏报数据时,根据漏报检测结果形成漏报警示信息以反馈给管理人员,以便于管理人员针对漏报数据进行补报,确保申报数据的及时性、准确性和完整性。
在优选的实施方式中,如图8所示,所述***进一步包括预先建立所述漏报检测模型的模型管理模块10。模型管理模块10用于根据预设模型训练规则对历史国际收支交易数据进行样本数据抽取得到交易样本数据,所述模型训练规则包括国际收支交易数据和国际收支申报数据的源表信息以及数据抽取规则。对交易数据样本的国际收支申报数据进行样本数据抽取得到申报样本数据;对所述历史国际收支交易数据进行标记得到是否漏报的标签。根据所述交易样本数据、所述申报样本数据和所述标签对预设训练模型进行训练得到所述漏报检测模型。
可以理解的是,在该优选的实施方式中,国际收支交易数据和申报数据中可能存在自然语言的识别和检测,涉及自然语言处理。自然语言处理是计算机科学,人工智能,语言学关注计算机和人类语言直接的相互作用的领域。因此,在该优选的实施方式中,可采用自然语言处理和机器学习的训练模型有FastText,TextCNN,ULMFit,BERT等。例如,在一个具体例子中,可采用FastText模型作为训练模型,FastText模型中输入一个词的序列,可输出这个词序列属于不同类别的概率,即可通过对训练模型进行训练,使得到的漏报检测模型可以检测实时输入的待检测数据为漏报类别和不是漏报类别的概率,实现漏报检测的目的。其中,在训练模型中,所述交易样本数据和所述申报样本数据形成的序列中的词和词组组成特征向量,特征向量通过线性变换映射到中间层,中间层在映射到标签。
需要说明的是,该优选的实施方式中,用于训练所述训练模型的交易样本数据、所述申报样本数据和所述标签的样本数据,可以通过对历史国际收支交易数据和国际收支申报数据进行抽取得到,也可以通过管理人员上传得到。即本发明也可人工上传已经完成标注的样本数据,业务管理人员可以对现有的错报漏报的数据进行样本数据标注后输入,则可根据管理人员输入的样本数据进行模型训练。
在该优选的实施方式中,在模型训练过程中,根据预设的模型训练规则从数据库(数据湖)中从国际收支交易数据和国际收支申报数据中抽取对应的数据可得到交易样本数据和申报样本数据。进一步的,对该国际收支申报数据的相关申报信息进行分析可得到该国际收支申报数据是否存在漏报,可对抽取的申报样本数据进行是否漏报的标签标注。其中,预设的模型训练规则可以包括该模型训练需要抽取的国际收支交易数据和国际收支申报数据的源表信息以及数据抽取规则,数据抽取规则中限定了从源表信息中抽取的具体数据,通过数据抽取规则可从源表信息中抽取需要的数据得到交易样本数据和申报样本数据。例如,在一个具体例子中,对于进口信用证业务,模型训练规则中的源表信息指定数据湖中的表DCM_GDS_F_BSAG_ILCBMAN_A,数据抽取规则为预设时间内发生过对外付款交易的业务,若在对应时间段的国际收支申报数据不存在,则自动设置为漏报标签。
在优选的实施方式中,若所述交易类型为退款交易,所述退款交易的源表信息包括退款交易明细表和退款交易申报表,所述数据抽取规则包括抽取交易附言。
可以理解的是,本发明中的漏报检测模型可以是一个,也可以是多个。优选的,可以针对每个交易类型设置一个漏报检测模型,以提高漏报检测的准确率。比如,实务中,退款业务和错汇款业务虽然都会产生“退款”的实际操作,但两种业务在国际收支统计申报业务处理上有很大的区别:错汇款业务由于并没有实际的交易背景,处理方式是删除前一笔交易申报信息,对错汇款的退款不进行申报。而退款业务要根据实际交易背景保留前一笔申报信息,并对当前退款做同一个交易性质项目下的申报,同时勾选“退款”选项。实务中,由于容易将上述两个概念混淆而将退款业务错认为是错汇款业务,从而造成退款业务前后两笔申报数据的漏报。
由此,在该优选的实施方式中,通过模型训练可得到一个与退款交易对应的退款业务漏报检测模型,以解决退款交易下漏报情况的检测发现。通过设置模型训练规则,可设置源表信息包括数据湖中的退款交易明细表,与报送的述国际收支申报数据一同抽取得到样本数据。进一步的,在具体例子中,可选择FastText训练模型得到漏报检测模型,可将漏报检测模型的准确度设定为95%,以保证训练得到的漏报检测模型的检测准确率。对于退款交易来说,数据抽取规则中包括抽取交易附言,则根据训练得到的漏报检测模型,识别出的检测结果如表1所示。
在优选的实施方式中,所述漏报检测模块具体用于根据所述国际收支申报数据确定交易类型。根据所述交易类型确定对应的目标漏报检测模型。通过所述目标漏报检测模型根据所述国际收支交易数据和所述国际收支申报数据确定所述国际收支申报数据中是否存在漏报数据。
可以理解的是,本发明中的漏报检测模型可以是一个,也可以是多个。优选的,可以针对每个交易类型设置一个漏报检测模型,以提高漏报检测的准确率。从而在该优选的实施方式中,根据每个交易类型设置一个漏报检测模型,则所有交易类型的漏报检测模型可以形成模型库。当需要对国际收支申报数据或国际收支交易数据进行漏报检测时,可首先根据所述国际收支申报数据确定交易类型,根据所述交易类型选择对应的目标漏报检测模型,通过该交易对应的目标漏报检测模型根据所述国际收支交易数据和所述国际收支申报数据确定所述国际收支申报数据中是否存在漏报数据,以实现特定交易类型的申报数据漏报检测。
在优选的实施方式中,模型管理模块10进一步用于基于管理人员针对所述漏报警示信息确定所述国际收支申报数据是否存在漏报数据的反馈信息确定所述漏报检测模型的检测结果是否准确。统计预设时间段内所述漏报检测模型的检测结果的准确率。若所述准确率低于预设准确率阈值,则下线所述漏报检测模型。
可以理解的是,若存在漏报数据,可形成漏报警示信息以反馈给管理人员,实现模型作业运行结果的展现输出,可以通过邮件或者短信等方式通知到金融机构管理人员及时进行确认。则根据管理人员针对漏报警示信息的反馈信息可确定每次漏报检测模型的检测结果是否准确,管理人员可针对漏报检测结果的判定,确定是否需要补报,即确定存在漏报或者模型检测误报两种确认结果,反馈信息可包括“需整改”和“无需整改”等信息。根据统计得到的一段时间内管理人员的反馈信息可以对漏报检测模型的检测准确率进行评估,若低于预设准确率阈值,则表示漏报检测模型的检测准确率不高,误报率较高,可下线该漏报检测模型对便于开发人员对该漏报检测模型进行优化,保证运行的漏报检测模型的检测准确率。
在优选的实施方式中,模型管理模块10进一步基于管理人员针对所述漏报警示信息确定所述国际收支申报数据是否存在漏报数据的反馈信息确定所述漏报检测模型的检测结果是否准确。根据所述检测结果是否准确确定是否漏报的标签。根据所述国际收支申报数据、所述国际收支交易数据和所述标签得到更新样本数据以对所述漏报检测模型进行再训练。
可以理解的是,针对每次模型运行结果以及管理人员对于漏报警示信息的反馈信息可形成更新样本数据,该更新样本数据可作为样本数据对漏报检测模型进行进一步的训练,以适应不断变化的交易数据和申报数据变化,提高漏报检测模型的检测准确率。进一步的,可设置模型运行策略,如设置为按时间定时触发或事件触发的任务,自动执行。用户可以自行配置触发的时间、事件、执行次数等信息,例如设置任务在工作日每天12:00或每隔1小时执行一次;在增量数据达到增量阈值的情况下自动运行等。同理的,可设置模型训练策略,定时或根据数据量对漏报检测模型进行自动再训练以实现对漏报检测模型的在线自动优化升级。
在优选的实施方式中,所述漏报反馈模块进一步用于若存在漏报数据。根据所述漏报数据形成包括补报信息的漏报警示信息并将所述漏报警示信息反馈给管理人员。根据管理人员针对所述漏报警示信息的确认操作对所述国际收支申报数据进行补报。
可以理解的是,若存在漏报数据,可以根据漏报数据形成补报信息,将补报信息设置于漏报警示信息中反馈给管理人员,管理人员可根据漏报警示信息检查确认是否存在漏报。若存在漏报,可同时确定生成的补报信息是否准确,若补报信息准确,管理人员可通过简单的确认操作对补报信息进行确认和补报,无需再手动输入进行申报数据的补报。
本发明提供了一种基于大数据技术避免国际收支申报数据漏报的国际收支申报数据漏报检测方法,本发明支持数据模型训练和发布运行,及时发现漏报数据,并可智能生成补报信息主动推送给银行等金融机构的管理人员进行确认后自动完成补报,确保申报数据的及时性、准确性和完整性。
由于该***解决问题的原理与以上方法类似,因此本***的实施可以参见方法的实施,在此不再赘述。
上述实施例阐明的***、装置、模块或单元,具体可以由计算机芯片或实体实现,或者由具有某种功能的产品来实现。一种典型的实现设备为计算机设备,具体的,计算机设备例如可以为个人计算机、膝上型计算机、蜂窝电话、相机电话、智能电话、个人数字助理、媒体播放器、导航设备、电子邮件设备、游戏控制台、平板计算机、可穿戴设备或者这些设备中的任何设备的组合。
在一个典型的实例中计算机设备具体包括存储器、处理器以及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述程序时实现如上所述的由客户端执行的方法,或者,所述处理器执行所述程序时实现如上所述的由服务器执行的方法。
下面参考图9,其示出了适于用来实现本申请实施例的计算机设备600的结构示意图。
如图9所示,计算机设备600包括中央处理单元(CPU)601,其可以根据存储在只读存储器(ROM)602中的程序或者从存储部分608加载到随机访问存储器(RAM))603中的程序而执行各种适当的工作和处理。在RAM603中,还存储有***600操作所需的各种程序和数据。CPU601、ROM602、以及RAM603通过总线604彼此相连。输入/输出(I/O)接口605也连接至总线604。
以下部件连接至I/O接口605:包括键盘、鼠标等的输入部分606;包括诸如阴极射线管(CRT)、液晶反馈器(LCD)等以及扬声器等的输出部分607;包括硬盘等的存储部分608;以及包括诸如LAN卡,调制解调器等的网络接口卡的通信部分609。通信部分609经由诸如因特网的网络执行通信处理。驱动器610也根据需要连接至I/O接口605。可拆卸介质611,诸如磁盘、光盘、磁光盘、半导体存储器等等,根据需要安装在驱动器610上,以便于从其上读出的计算机程序根据需要被安装如存储部分608。
特别地,根据本发明的实施例,上文参考流程图描述的过程可以被实现为计算机软件程序。例如,本发明的实施例包括一种计算机程序产品,其包括有形地包含在机器可读介质上的计算机程序,所述计算机程序包括用于执行流程图所示的方法的程序代码。在这样的实施例中,该计算机程序可以通过通信部分609从网络上被下载和安装,和/或从可拆卸介质611被安装。
计算机可读介质包括永久性和非永久性、可移动和非可移动媒体可以由任何方法或技术来实现信息存储。信息可以是计算机可读指令、数据结构、程序的模块或其他数据。计算机的存储介质的例子包括,但不限于相变内存(PRAM)、静态随机存取存储器(SRAM)、动态随机存取存储器(DRAM)、其他类型的随机存取存储器(RAM)、只读存储器(ROM)、电可擦除可编程只读存储器(EEPROM)、快闪记忆体或其他内存技术、只读光盘只读存储器(CD-ROM)、数字多功能光盘(DVD)或其他光学存储、磁盒式磁带,磁带磁盘存储或其他磁性存储设备或任何其他非传输介质,可用于存储可以被计算设备访问的信息。按照本文中的界定,计算机可读介质不包括暂存电脑可读媒体(transitory media),如调制的数据信号和载波。
为了描述的方便,描述以上装置时以功能分为各种单元分别描述。当然,在实施本申请时可以把各单元的功能在同一个或多个软件和/或硬件中实现。
本发明是参照根据本发明实施例的方法、设备(***)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器,使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。
这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读存储器中,使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品,该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。
这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上,使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理,从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。
还需要说明的是,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、商品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、商品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括所述要素的过程、方法、商品或者设备中还存在另外的相同要素。
本领域技术人员应明白,本申请的实施例可提供为方法、***或计算机程序产品。因此,本申请可采用完全硬件实施例、完全软件实施例或结合软件和硬件方面的实施例的形式。而且,本申请可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、CD-ROM、光学存储器等)上实施的计算机程序产品的形式。
本申请可以在由计算机执行的计算机可执行指令的一般上下文中描述,例如程序模块。一般地,程序模块包括执行特定任务或实现特定抽象数据类型的例程、程序、对象、组件、数据结构等等。也可以在分布式计算环境中实践本申请,在这些分布式计算环境中,由通过通信网络而被连接的远程处理设备来执行任务。在分布式计算环境中,程序模块可以位于包括存储设备在内的本地和远程计算机存储介质中。
本说明书中的各个实施例均采用递进的方式描述,各个实施例之间相同相似的部分互相参见即可,每个实施例重点说明的都是与其他实施例的不同之处。尤其,对于***实施例而言,由于其基本相似于方法实施例,所以描述的比较简单,相关之处参见方法实施例的部分说明即可。
以上所述仅为本申请的实施例而已,并不用于限制本申请。对于本领域技术人员来说,本申请可以有各种更改和变化。凡在本申请的精神和原理之内所作的任何修改、等同替换、改进等,均应包含在本申请的权利要求范围之内。

Claims (8)

1.一种国际收支申报数据漏报检测方法,其特征在于,包括:
获取国际收支交易数据和客户输入的国际收支申报数据;
通过预设的漏报检测模型根据所述国际收支交易数据和所述国际收支申报数据确定所述国际收支申报数据中是否存在漏报数据;
若存在漏报数据,形成漏报警示信息以反馈给管理人员;
进一步包括预先建立所述漏报检测模型的步骤:
根据预设模型训练规则对历史国际收支交易数据进行样本数据抽取得到交易样本数据,所述模型训练规则包括国际收支交易数据和国际收支申报数据的源表信息以及数据抽取规则;
对交易数据样本的国际收支申报数据进行样本数据抽取得到申报样本数据;
对所述历史国际收支交易数据进行标记得到是否漏报的标签;
根据所述交易样本数据、所述申报样本数据和所述标签对预设训练模型进行训练得到所述漏报检测模型;
若交易类型为退款交易,所述退款交易的源表信息包括退款交易明细表和退款交易申报表,所述数据抽取规则包括抽取交易附言。
2.根据权利要求1所述的国际收支申报数据漏报检测方法,其特征在于,所述通过预设的漏报检测模型根据所述国际收支交易数据和所述国际收支申报数据确定所述国际收支申报数据中是否存在漏报数据具体包括:
根据所述国际收支申报数据确定交易类型;
根据所述交易类型确定对应的目标漏报检测模型;
通过所述目标漏报检测模型根据所述国际收支交易数据和所述国际收支申报数据确定所述国际收支申报数据中是否存在漏报数据。
3.根据权利要求1所述的国际收支申报数据漏报检测方法,其特征在于,进一步包括:
基于管理人员针对所述漏报警示信息确定所述国际收支申报数据是否存在漏报数据的反馈信息确定所述漏报检测模型的检测结果是否准确;
统计预设时间段内所述漏报检测模型的检测结果的准确率;
若所述准确率低于预设准确率阈值,则下线所述漏报检测模型。
4.根据权利要求1所述的国际收支申报数据漏报检测方法,其特征在于,进一步包括:
基于管理人员针对所述漏报警示信息确定所述国际收支申报数据是否存在漏报数据的反馈信息确定所述漏报检测模型的检测结果是否准确;
根据所述检测结果是否准确确定是否漏报的标签;
根据所述国际收支申报数据、所述国际收支交易数据和所述标签得到更新样本数据以对所述漏报检测模型进行再训练。
5.根据权利要求1所述的国际收支申报数据漏报检测方法,其特征在于,所述若存在漏报数据,形成漏报警示信息以反馈给管理人员具体包括:
若存在漏报数据;
根据所述漏报数据形成包括补报信息的漏报警示信息并将所述漏报警示信息反馈给管理人员;
根据管理人员针对所述漏报警示信息的确认操作对所述国际收支申报数据进行补报。
6.一种国际收支申报数据漏报检测***,其特征在于,包括:
数据获取模块,用于获取国际收支交易数据和客户输入的国际收支申报数据;
漏报检测模块,用于通过预设的漏报检测模型根据所述国际收支交易数据和所述国际收支申报数据确定所述国际收支申报数据中是否存在漏报数据;
漏报反馈模块,用于若存在漏报数据,形成漏报警示信息以反馈给管理人员;
所述***进一步包括预先建立所述漏报检测模型的模型管理模块,用于根据预设模型训练规则对历史国际收支交易数据进行样本数据抽取得到交易样本数据,所述模型训练规则包括国际收支交易数据和国际收支申报数据的源表信息以及数据抽取规则;对交易数据样本的国际收支申报数据进行样本数据抽取得到申报样本数据;对所述历史国际收支交易数据进行标记得到是否漏报的标签;根据所述交易样本数据、所述申报样本数据和所述标签对预设训练模型进行训练得到所述漏报检测模型;
若交易类型为退款交易,所述退款交易的源表信息包括退款交易明细表和退款交易申报表,所述数据抽取规则包括抽取交易附言。
7.一种计算机设备,包括存储器、处理器以及存储在存储器上并可在处理器上运行的计算机程序,其特征在于,
所述处理器执行所述程序时实现如权利要求1-5任一项所述方法。
8.一种计算机可读介质,其上存储有计算机程序,其特征在于,
该程序被处理器执行时实现如权利要求1-5任一项所述方法。
CN202110184003.5A 2021-02-10 2021-02-10 国际收支申报数据漏报检测方法及*** Active CN112767138B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202110184003.5A CN112767138B (zh) 2021-02-10 2021-02-10 国际收支申报数据漏报检测方法及***

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202110184003.5A CN112767138B (zh) 2021-02-10 2021-02-10 国际收支申报数据漏报检测方法及***

Publications (2)

Publication Number Publication Date
CN112767138A CN112767138A (zh) 2021-05-07
CN112767138B true CN112767138B (zh) 2024-02-06

Family

ID=75705521

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202110184003.5A Active CN112767138B (zh) 2021-02-10 2021-02-10 国际收支申报数据漏报检测方法及***

Country Status (1)

Country Link
CN (1) CN112767138B (zh)

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111369253A (zh) * 2020-03-18 2020-07-03 中国建设银行股份有限公司 外汇业务申报方法、装置、设备及存储介质
CN111783636A (zh) * 2020-06-30 2020-10-16 中国工商银行股份有限公司 基于ocr的国际收支网申数据处理方法和装置
CN111782809A (zh) * 2020-06-30 2020-10-16 中国工商银行股份有限公司 国际收支网申数据处理方法、装置、电子设备及存储介质
CN112307477A (zh) * 2020-11-10 2021-02-02 深圳市欢太科技有限公司 代码检测方法、装置、存储介质以及终端

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111369253A (zh) * 2020-03-18 2020-07-03 中国建设银行股份有限公司 外汇业务申报方法、装置、设备及存储介质
CN111783636A (zh) * 2020-06-30 2020-10-16 中国工商银行股份有限公司 基于ocr的国际收支网申数据处理方法和装置
CN111782809A (zh) * 2020-06-30 2020-10-16 中国工商银行股份有限公司 国际收支网申数据处理方法、装置、电子设备及存储介质
CN112307477A (zh) * 2020-11-10 2021-02-02 深圳市欢太科技有限公司 代码检测方法、装置、存储介质以及终端

Also Published As

Publication number Publication date
CN112767138A (zh) 2021-05-07

Similar Documents

Publication Publication Date Title
US20200210260A1 (en) Flow based pattern intelligent monitoring system
US8768809B1 (en) Methods and systems for managing financial data
CN111539811B (zh) 风险账户的识别方法及装置
CN104992234A (zh) 一种基于多种运营数据的企业风险评估方法
CN112214652B (zh) 一种报文生成方法、装置及设备
CN106254543A (zh) 基于云计算架构的分布式互联网金融网贷方法和***
US20210311952A1 (en) Computer-based systems for dynamic network graph generation based on automated entity and/or activity resolution and methods of use thereof
CN112200402B (zh) 一种基于风险画像的风险量化方法、装置及设备
CN111782809A (zh) 国际收支网申数据处理方法、装置、电子设备及存储介质
CN102496126A (zh) 一种托管资产交易数据监控设备
CN113034046A (zh) 一种数据风险计量方法、装置、电子设备及存储介质
CN116468444A (zh) 一种消费预警方法、***、设备和存储介质
US20220027876A1 (en) Consolidating personal bill
CN112767138B (zh) 国际收支申报数据漏报检测方法及***
CN116757835A (zh) ***客户贷中交易风险监控方法及装置
US20230237589A1 (en) Model output calibration
CN115482094A (zh) 一种业务处理方法、装置、电子设备及计算机可读介质
CN115994819A (zh) 风险客户识别方法、装置、设备和介质
CN114298825A (zh) 还款积极度评估方法及装置
WO2022109002A1 (en) Systems and methods for confidence interval transaction settlement range predictions
CN113159924A (zh) 授信客户对象的确定方法及装置
Kang Fraud Detection in Mobile Money Transactions Using Machine Learning
CN116800831B (zh) 一种业务数据推送方法、装置、存储介质及处理器
US20230306279A1 (en) Guided feedback loop for automated information categorization
CN116797343A (zh) 风险评估方法、模型训练方法、装置、介质及设备

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant