CN109919690A - 一种用于对***变票虚开行为进行监控的方法及*** - Google Patents

一种用于对***变票虚开行为进行监控的方法及*** Download PDF

Info

Publication number
CN109919690A
CN109919690A CN201711283447.4A CN201711283447A CN109919690A CN 109919690 A CN109919690 A CN 109919690A CN 201711283447 A CN201711283447 A CN 201711283447A CN 109919690 A CN109919690 A CN 109919690A
Authority
CN
China
Prior art keywords
invoice
ticket
commodity
numerical value
parameter group
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201711283447.4A
Other languages
English (en)
Inventor
刘丹
孙艺
潘竞旭
田宜喜
谢宇
宋颖
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Aisino Corp
Original Assignee
Aisino Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Aisino Corp filed Critical Aisino Corp
Priority to CN201711283447.4A priority Critical patent/CN109919690A/zh
Publication of CN109919690A publication Critical patent/CN109919690A/zh
Pending legal-status Critical Current

Links

Landscapes

  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本发明公开了用于对***变票虚开行为进行监控的方法:检测变票虚开***中的商品,将变票虚开***中出现的次数达到预定值的商品作为高风险商品;基于进项或销项***信息表,筛选出与进项或销项***信息表中高风险商品对应的纳税人;建立包括纳税人的***信息的进项或销项***事实表;将第一特征参数组以及第一特征参数组的特征参数的数值、第二特征参数组以及第二特征参数组的特征参数的数值、高风险商品的相关特征参数的数值存储至***变票虚开预警结果表;将第一特征参数组的特征参数的数值、第二特征参数组的特征参数的数值以及相关特征参数的数值与预先设置对应的特征参数的阈值进行比较,基于比较结果确定***变票虚开的嫌疑纳税人。

Description

一种用于对***变票虚开行为进行监控的方法及***
技术领域
本发明涉及税务数据监控技术领域,更具体地,涉及一种用于对***变票虚开行为进行监控的方法及***。
背景技术
随着税务***改革的深入,在简化办税程序的同时,税收管理风险也逐渐增加,每年为国家造成数以亿计的巨大经济损失,正常的税收和经济秩序被扰乱。“虚开***”是一种严重的税收违法行为,“变票虚开”则是一种特殊的“虚开***”类型,他的特点是购销不匹配,即购进和销售的物品不一致。
现有技术提供了一种进项***抵扣联的认证***,包括扫描设备、加密模块、网络传输模块、第一解密模块、第二解密模块、比对模块以及认证结果输出模块。现有技术还公开了一种进项***抵扣联的认证方法及对应的客户端与应用服务器。上述认证***、方法及对应的客户端与应用服务器通过网上认证的方式即可快速便捷的对***抵扣联进行认证,既能分流税局大厅的***认证工作,从而在很大程度上缓解税局大厅的认证工作压力,同时也能够满足企业足不出户,及时快速认证的现实需求。然后,现有的针对虚开***的监控方法是基于Oracle技术的,通过分析企业的商品构成来实现。该方法有三点不足:基于Oracle技术进行数据处理,在税务数据成倍增长的今天,无法适应大数据条件下的数据处理性能要求;对纳税人进项、销项***的所有商品进行构成分析,缺乏面向特定类型虚开案件的针对性,降低了监控效率;在主要步骤中,虽然对进项和销项的商品构成分别进行了分组计算,但仅使用了销项商品构成数据进行虚开分析,且特征参数只有商品的金额占比,无法满足精确监控的要求。
因此,需要一种技术,以解决对***变票虚开行为进行监控的问题。
发明内容
本申请提供了一种用于对***变票虚开行为进行监控的方法及***,以解决如何对***变票虚开行为进行监控的问题。
为了解决上述问题,本发明提供了一种用于对***变票虚开行为进行监控的方法,所述方法包括:
检测变票虚开***中的商品并且对所述商品出现在变票虚开***中的次数进行记录,将变票虚开***中出现的次数达到预定值的商品作为高风险商品;
基于进项***信息表,筛选出与所述进项***信息表中所述高风险商品对应的纳税人,建立包括纳税人和纳税人的***信息的进项***事实表;
基于销项***信息表,筛选出与所述销项***信息表中所述高风险商品对应的纳税人,建立包括纳税人和纳税人的***信息的销项***事实表;
确定所述进项***事实表中的第一特征参数组,并计算所述第一特征参数组中的特征参数的数值,将所述第一特征参数组以及所述第一特征参数组的特征参数的数值存储至***变票虚开预警结果表中;
确定所述销项***事实表中的第二特征参数组,并计算所述第二特征参数组中的特征参数的数值,将所述第二特征参数组以及所述第二特征参数组的特征参数的数值存储至所述***变票虚开预警结果表中;
基于所述第一特征参数组的特征参数和所述第二特征参数组的特征参数,计算所述高风险商品的相关特征参数的数值,并将所述相关特征参数的数值存储至所述***变票虚开预警结果表中;
将所述***变票虚开预警结果表中所述第一特征参数组的特征参数的数值、所述第二特征参数组的特征参数的数值以及所述相关特征参数的数值与预先设置对应的特征参数的阈值进行比较,基于比较结果确定***变票虚开的嫌疑纳税人。
优选地,通过Spark程序检测存在***变票虚开行为的商品;获取的高风险商品的商品类型和19位商品分类编码。
优选地,通过Spark程序,基于进项***信息表,筛选出与所述进项***信息表中所述高风险商品对应的纳税人,建立包括纳税人和纳税人的***信息的进项***事实表,所述进项***事实表为HIVE数据库表;
通过Spark程序,基于销项***信息表,筛选出与所述销项***信息表中所述高风险商品对应的纳税人,建立包括纳税人和纳税人的***信息的销项***事实表,所述销项***事实表为HIVE数据库表。
优选地,通过Spark程序,确定所述进项***事实表中的第一特征参数组,并计算所述第一特征参数组中的特征参数的数值,将所述第一特征参数组以及所述第一特征参数组中的特征参数的数值存储至***变票虚开预警结果表中,所述***变票虚开预警结果表为HIVE数据库表;
通过Spark程序,确定所述销项***事实表中的第二特征参数组,并计算所述第二特征参数组中的特征参数的数值,将所述第二特征参数组以及所述第二特征参数组中的特征参数的数值存储至所述***变票虚开预警结果表中,所述***变票虚开预警结果表为HIVE数据库表;
通过Spark程序,基于所述第一特征参数组的特征参数和所述第二特征参数组的特征参数,计算所述高风险商品的相关特征参数的数值,并将所述相关特征参数的数值存储至所述***变票虚开预警结果表中,所述***变票虚开预警结果表为HIVE数据库表。
优选地,通过Spark程序,将所述***变票虚开预警结果表中所述第一特征参数组的特征参数的数值、所述第二特征参数组的特征参数的数值以及所述相关特征参数的数值与预先设置对应的特征参数的阈值进行比较,基于比较结果确定***变票虚开的嫌疑纳税人。
优选地,方法还包括:
为不同的高风险商品设置所述第一特征参数组的特征参数的阈值;
为不同的高风险商品设置所述第二特征参数组的特征参数的阈值。
优选地,所述第一特征参数组包括的特征参数为:购进的所有商品的总金额,购进的高风险商品的金额,购进的其他商品的金额,购进的高风险商品与所有购进商品的金额比值。
优选地,所述第二特征参数组包括的特征参数为:销售的所有商品的总金额,销售的高风险商品的金额,销售的其他商品的金额,销售的高风险商品与所有销售商品的金额比值。
基于本发明的另一方面,提供一种用于对***变票虚开行为进行监控的***,所述***包括:
统计单元,检测变票虚开***中的商品并且对所述商品出现在变票虚开***中的次数进行记录,将变票虚开***中出现的次数达到预定值的商品作为高风险商品;
建立单元,用于基于进项***信息表,筛选出与所述进项***信息表中所述高风险商品对应的纳税人,建立包括纳税人和纳税人的***信息的进项***事实表;用于基于销项***信息表,筛选出与所述销项***信息表中所述高风险商品对应的纳税人,建立包括纳税人和纳税人的***信息的销项***事实表;
计算单元,用于确定所述进项***事实表中的第一特征参数组,并计算所述第一特征参数组中的特征参数的数值,将所述第一特征参数组以及所述第一特征参数组的特征参数的数值存储至***变票虚开预警结果表中;用于确定所述销项***事实表中的第二特征参数组,并计算所述第二特征参数中的特征参数的数值,将所述第二特征参数组的特征参数的数值以及所述第二特征参数组的特征参数的数值存储至所述***变票虚开预警结果表中;用于基于所述第一特征参数组的特征参数和所述第二特征参数组的特征参数,计算所述高风险商品的相关特征参数的数值,并将所述相关特征参数的数值存储至所述***变票虚开预警结果表中;
分析单元,用于将所述***变票虚开预警结果表中所述第一特征参数组的特征参数的数值、所述第二特征参数组的特征参数的数值以及所述相关特征参数的数值与预先设置对应的特征参数的阈值进行比较,基于比较结果确定***变票虚开的嫌疑纳税人。
优选地,所述统计单元还用于:通过Spark程序检测存在***变票虚开行为的商品;获取的高风险商品的商品类型和19位商品分类编码。
优选地,所述建立单元还用于:
通过Spark程序,基于进项***信息表,筛选出与所述进项***信息表中所述高风险商品对应的纳税人,建立包括纳税人和纳税人的***信息的进项***事实表,所述进项***事实表为HIVE数据库表;
通过Spark程序,基于销项***信息表,筛选出与所述销项***信息表中所述高风险商品对应的纳税人,建立包括纳税人和纳税人的***信息的销项***事实表,所述销项***事实表为HIVE数据库表。
优选地,所述计算单元还用于:
通过Spark程序,确定所述进项***事实表中的第一特征参数组,并计算所述第一特征参数组中的特征参数的数值,将所述第一特征参数组以及所述第一特征参数组中的特征参数的数值存储至***变票虚开预警结果表中,所述***变票虚开预警结果表为HIVE数据库表;
通过Spark程序,确定所述销项***事实表中的第二特征参数组,并计算所述第二特征参数组中的特征参数的数值,将所述第二特征参数组以及所述第二特征参数组中的特征参数的数值存储至所述***变票虚开预警结果表中,所述***变票虚开预警结果表为HIVE数据库表;
将所述***变票虚开预警结果表中所述第一特征参数组的特征参数的数值、所述第二特征参数组的特征参数的数值以及所述相关特征参数的数值与预先设置对应的特征参数的阈值进行比较,基于比较结果确定***变票虚开的嫌疑纳税人。
优选地,所述分析单元还用于:通过Spark程序,将所述票变票虚开预警结果表中所述第一特征参数组的特征参数的数值、所述第二特征参数组的特征参数的数值以及所述相关特征参数的数值与预先设置对应的特征参数的阈值进行比较,基于比较结果确定***变票虚开的嫌疑纳税人。
优选地,所述分析单元还用于:
为不同的高风险商品设置所述第一特征参数组的特征参数的阈值;
为不同的高风险商品设置所述第二特征参数组的特征参数的阈值。
优选地,所述第一特征参数组包括的特征参数为:购进的所有商品的总金额,购进的高风险商品的金额,购进的其他商品的金额,购进的高风险商品与所有购进商品的金额比值。
优选地,所述第二特征参数组包括的特征参数为:销售的所有商品的总金额,销售的高风险商品的金额,销售的其他商品的金额,销售的高风险商品与所有销售商品的金额比值。
本申请技术方案通过分析历史***变票虚开案件,得到具有高虚开风险的商品名称;通过统计出的高风险商品名称,利用高风险商品的商品编码筛选出进项或销项***中含有高风险商品的纳税人,建立包括纳税人和纳税人的***信息的进项***事实表和销项***事实表;计算高风险商品在纳税人进项***事实表和销项***事实表中***数据中的特征参数的数值,将将特征参数以及特征参数的数值存储至***变票虚开预警结果表中。本申请技术方案通过为高风险商品设置变票虚开预警模型,将***变票虚开预警结果表中特征参数的数值与预先建立的***变票虚开预警模型中特征参数的阈值进行比较,确定***变票虚开的嫌疑纳税人,并对嫌疑纳税人进行预警提示。本申请技术方案结合进项和销项的***数据,计算多种特征参数,针对***变票虚开的高风险商品进行预警监控,能够减少冗余计算,提高***的处理效率,加强税务风险监控的针对性和准确性。
附图说明
通过参考下面的附图,可以更为完整地理解本发明的示例性实施方式:
图1为根据本发明实施方式的一种用于对***变票虚开行为进行监控的方法流程图;以及
图2为根据本发明实施方式的一种用于对***变票虚开行为进行监控的***结构图。
具体实施方式
现在参考附图介绍本发明的示例性实施方式,然而,本发明可以用许多不同的形式来实施,并且不局限于此处描述的实施例,提供这些实施例是为了详尽地且完全地公开本发明,并且向所属技术领域的技术人员充分传达本发明的范围。对于表示在附图中的示例性实施方式中的术语并不是对本发明的限定。在附图中,相同的单元/元件使用相同的附图标记。
除非另有说明,此处使用的术语(包括科技术语)对所属技术领域的技术人员具有通常的理解含义。另外,可以理解的是,以通常使用的词典限定的术语,应当被理解为与其相关领域的语境具有一致的含义,而不应该被理解为理想化的或过于正式的意义。
图1为根据本发明实施方式的一种用于对***变票虚开行为进行监控的方法流程图。本申请通过分析历史***变票虚开案件,得到具有高虚开风险的商品名称;通过统计出的高风险商品名称,利用高风险商品的商品编码筛选出进项或销项***中含有高风险商品的纳税人,建立包括纳税人和纳税人的***信息的进项***事实表和销项***事实表;计算高风险商品在纳税人进项***事实表和销项***事实表中***数据中的特征参数的数值,以及相关特征参数,将特征参数的数值存储至***变票虚开预警结果表中。本申请通过为高风险商品设置变票虚开预警模型,将***变票虚开预警结果表中特征参数的数值与预先建立的***变票虚开预警模型中特征参数的阈值进行比较,基于比较结果确定***变票虚开的嫌疑纳税人,并对嫌疑纳税人进行预警提示。如图1所示,方法100从步骤101起步:
优选地,在步骤101:检测变票虚开***中的商品并且对商品出现在变票虚开***中的次数进行记录,将变票虚开***中出现的次数达到预定值的商品作为高风险商品。
优选地,通过Spark程序检测存在***变票虚开行为的商品;获取的高风险商品的商品类型和19位商品分类编码。由于变票虚开的商品类型在不同的地域具有一定的差异,且随着时间会产生一定的变化,因此我们需要通过运行Spark程序,对历史变票虚开案件进行聚合分析,获取这些案件中出现频率次数达到预定值的商品类型和19位商品分类编码,存入HIVE的高风险商品信息表。
优选地,在步骤102:基于进项***信息表,筛选出与进项***信息表中高风险商品对应的纳税人,建立包括纳税人和纳税人的***信息的进项***事实表。本申请在筛选出进项***中含有高风险商品的纳税人时,通过使用Spark程序,对当前月HIVE中的进项***信息表进行数据清洗,并利用商品分类编码关联进项***中的商品和高风险商品信息表中的商品,从而筛选出进项***中含有高风险商品的纳税人,把这些纳税人的***信息存入进项***事实表中。
优选地,在步骤103:基于销项***信息表,筛选出与销项***信息表中高风险商品对应的纳税人,建立包括纳税人和纳税人的***信息的销项***事实表。本申请在筛选出销项***中含有高风险商品的纳税人时,通过使用Spark程序,对当前月HIVE中的销项***信息表进行数据清洗,并利用商品分类编码关联销项***中的商品和高风险商品信息表中的商品,从而筛选出销项***中含有高风险商品的纳税人,把这些纳税人的***信息存入销项***事实表中。
优选地,通过Spark程序,基于进项***信息表,筛选出与进项***信息表中高风险商品对应的纳税人,建立包括纳税人和纳税人的***信息的进项***事实表,进项***事实表为HIVE数据库表;
通过Spark程序,基于销项***信息表,筛选出与销项***信息表中高风险商品对应的纳税人,建立包括纳税人和纳税人的***信息的销项***事实表,销项***事实表为HIVE数据库表。
优选地,在步骤104:确定进项***事实表中的第一特征参数组,并计算第一特征参数组中的特征参数的数值,将第一特征参数组以及第一特征参数组的特征参数的数值存储至***变票虚开预警结果表中。
优选地,通过Spark程序,确定进项***事实表中的第一特征参数组,并计算第一特征参数组中的特征参数的数值,将第一特征参数组以及第一特征参数组中的特征参数的数值存储至***变票虚开预警结果表中,***变票虚开预警结果表为HIVE数据库表;
优选地,第一特征参数组包括的特征参数为:购进的所有商品的总金额,购进的高风险商品的金额,购进的其他商品的金额,购进的高风险商品与所有购进商品的金额比值。本申请通过使用Spark程序,计算进项***事实表中纳税人购进的所有商品的总金额、购进的高风险商品的金额、购进的其他商品的总金额、购进的高风险商品占所有购进的金额占比,存入虚开***预警结果表中。
优选地,通过Spark程序,基于第一特征参数组的特征参数和第二特征参数组的特征参数,计算高风险商品的相关特征参数的数值,并将相关特征参数的数值存储至***变票虚开预警结果表中,***变票虚开预警结果表为HIVE数据库表。
优选地,在步骤105:确定销项***事实表中的第二特征参数组,并计算第二特征参数组中的特征参数的数值,将第二特征参数组以及第二特征参数组的特征参数的数值存储至***变票虚开预警结果表中。
优选地,第二特征参数组包括的特征参数为:销售的所有商品的总金额,销售的高风险商品的金额,销售的其他商品的金额,销售的高风险商品与所有销售商品的金额比值。
优选地,通过Spark程序,确定销项***事实表中的第二特征参数组,并计算第二特征参数组中的特征参数的数值,将第二特征参数组以及第二特征参数组中的特征参数的数值存储至***变票虚开预警结果表中,***变票虚开预警结果表为HIVE数据库表。
本申请通过使用Spark程序,计算销项***事实表中纳税人销售的所有商品的总金额、销售的高风险商品的金额、销售的其他商品的总金额、销售的高风险商品占所有销售的金额占比,存入虚开***预警结果表中。
优选地,在步骤106:基于第一特征参数组的特征参数和第二特征参数组的特征参数,计算高风险商品的相关特征参数的数值,并将相关特征参数的数值存储至***变票虚开预警结果表中。本申请结合进项***事实表、销项***事实表,使用Spark程序计算某一类高风险商品的相关特征参数,并存入虚开***预警结果表。例如:把某一类高风险商品记为A,计算A的销售的金额占A的购进的金额比值、计算总销售的金额占A的购进的金额的比值、计算其他购进的金额占其他销售的金额的比值。
优选地,在步骤107:将***变票虚开预警结果表中第一特征参数组的特征参数的数值、第二特征参数组的特征参数的数值以及相关特征参数的数值与预先设置对应的特征参数的阈值进行比较,基于比较结果确定***变票虚开的嫌疑纳税人。
优选地,通过Spark程序,将***变票虚开预警结果表中第一特征参数组的特征参数的数值、第二特征参数组的特征参数的数值以及相关特征参数的数值与预先设置对应的特征参数的阈值进行比较,基于比较结果确定***变票虚开的嫌疑纳税人。
优选地,方法100能够为不同的高风险商品设置第一特征参数组的特征参数的阈值;
为不同的高风险商品设置第二特征参数组的特征参数的阈值。
由于***变票虚开案件中,不同高风险商品的特征参数具有显著的不同,因此我们需要单独为每一个高风险商品设置预警模型。本申请以某一类高风险商品A为例,其预警模型中的特征参数有:A的购进金额、A的购进占所有购进的金额占比、A的销售的金额占所有销售的金额占比、A的销售的金额占A的购进的金额比例、总销售的金额占A的购进的金额比值、其他购进的金额占其他销售的金额的比例、其他销售金额,我们通过使用Spark程序对历史虚开案件进行汇总分析,从而得到A商品的预警模型的特征参数的阈值。
利用高风险商品的对应预警模型,将***变票虚开预警结果表中第一特征参数组的特征参数的数值、第二特征参数组的特征参数的数值以及相关特征参数的数值与预先设置对应的特征参数的阈值进行比较,对虚开***预警结果表中纳税人的数据进行筛选,从而得到具有变票虚开嫌疑的纳税人。
本申请通过运行Spark程序,对历史开票变票虚开案件进行聚合分析,获取这些案件中出现频率较高的商品类型和19位商品分类编码,存入HIVE的高风险商品信息表。以及通过使用Spark程序进行数据清理,并利用商品分类编码关联进项、销项***中的商品和高风险商品信息表中的商品,从而筛选出含有高风险商品的纳税人。本申请利用Spark程序计算高风险商品的特征参数,特高了数据处理的效率。本申请为每一种变票虚开的高风险商品设置独立预警模型,设置特征参数的不同阈值,实现了精准监控。
本申请提供的一种对***变票虚开行为进行监控的方法,使用Spark技术进行数据处理,使用HIVE分区方式存储初始数据以及计算过程中产生数据,它们具有可扩展性和高效率的特点,解决了营改增以后***量日益增长的问题。其次,本申请结合进项和销项的***数据,计算多种特征参数,针对变票虚开的高风险商品品类型进行预警监控,能够减少冗余计算,提高***的处理效率,加强监控的针对性和准确性。此外,本申请还能够提高税务人员的工作效率,提高变票虚开行为的监控准确率,对规范税收秩序、防控执法风险和税款流失风险具有重要意义。
图2为根据本发明实施方式的一种用于对***变票虚开行为进行监控的***结构图。如图2所示,一种用于对***变票虚开行为进行监控的***200包括:
统计单元201,检测变票虚开***中的商品并且对商品出现在变票虚开***中的次数进行记录,将变票虚开***中出现的次数达到预定值的商品作为高风险商品。优选地,统计单元201还用于:通过Spark程序检测存在***变票虚开行为的商品;获取的高风险商品的商品类型和19位商品分类编码。
建立单元202,用于基于进项***信息表,筛选出与进项***信息表中高风险商品对应的纳税人,建立包括纳税人和纳税人的***信息的进项***事实表;用于基于销项***信息表,筛选出与销项***信息表中高风险商品对应的纳税人,建立包括纳税人和纳税人的***信息的销项***事实表。
优选地,建立单元202还用于:
通过Spark程序,基于进项***信息表,筛选出与进项***信息表中高风险商品对应的纳税人,建立包括纳税人和纳税人的***信息的进项***事实表,进项***事实表为HIVE数据库表;
通过Spark程序,基于销项***信息表,筛选出与销项***信息表中高风险商品对应的纳税人,建立包括纳税人和纳税人的***信息的销项***事实表,销项***事实表为HIVE数据库表。
计算单元203,用于确定进项***事实表中的第一特征参数组,并计算第一特征参数组中的特征参数的数值,将第一特征参数组以及第一特征参数组的特征参数的数值存储至***变票虚开预警结果表中;用于确定销项***事实表中的第二特征参数组,并计算第二特征参数组中的特征参数的数值,将第二特征参数组的特征参数的数值以及第二特征参数组的特征参数的数值存储至***变票虚开预警结果表中;用于基于第一特征参数组的特征参数和第二特征参数组的特征参数,计算高风险商品的相关特征参数的数值,并将相关特征参数的数值存储至***变票虚开预警结果表中。
优选地,第一特征参数组包括的特征参数为:购进的所有商品的总金额,购进的高风险商品的金额,购进的其他商品的金额,购进的高风险商品与所有购进商品的金额比值。
优选地,第二特征参数组包括的特征参数为:销售的所有商品的总金额,销售的高风险商品的金额,销售的其他商品的金额,销售的高风险商品与所有销售商品的金额比值。
优选地,计算单元203还用于:
通过Spark程序,确定进项***事实表中的第一特征参数组,并计算第一特征参数组中的特征参数的数值,将第一特征参数组以及第一特征参数组中的特征参数的数值存储至***变票虚开预警结果表中,***变票虚开预警结果表为HIVE数据库表;
通过Spark程序,确定销项***事实表中的第二特征参数组,并计算第二特征参数中的特征参数组中的特征参数的数值,将第二特征参数组以及第二特征参数组中的特征参数的数值存储至***变票虚开预警结果表中,***变票虚开预警结果表为HIVE数据库表;
将***变票虚开预警结果表中第一特征参数组的特征参数的数值、第二特征参数组的特征参数的数值以及相关特征参数的数值与预先设置对应的特征参数的阈值进行比较,基于比较结果确定***变票虚开的嫌疑纳税人。
分析单元204,用于将***变票虚开预警结果表中第一特征参数组的特征参数的数值、第二特征参数组的特征参数的数值以及相关特征参数的数值与预先设置对应的特征参数的阈值进行比较,基于比较结果确定***变票虚开的嫌疑纳税人。
优选地,分析单元204还用于:通过Spark程序,将票变票虚开预警结果表中第一特征参数组的特征参数的数值、第二特征参数组的特征参数的数值以及相关特征参数的数值与预先设置对应的特征参数的阈值进行比较,基于比较结果确定***变票虚开的嫌疑纳税人。
优选地,分析单元204还用于:
为不同的高风险商品设置第一特征参数组的特征参数的阈值;
为不同的高风险商品设置第二特征参数组的特征参数的阈值。
本发明实施方式的一种用于对***变票虚开行为进行监控的***200与本发明实施方式的一种用于对***变票虚开行为进行监控的方法100相对应,在此不再进行赘述。
已经通过参考少量实施方式描述了本发明。然而,本领域技术人员所公知的,正如附带的专利权利要求所限定的,除了本发明以上公开的其他的实施例等同地落在本发明的范围内。
通常地,在权利要求中使用的所有术语都根据他们在技术领域的通常含义被解释,除非在其中被另外明确地定义。所有的参考“一个/所述/该[装置、组件等]”都被开放地解释为所述装置、组件等中的至少一个实例,除非另外明确地说明。这里公开的任何方法的步骤都没必要以公开的准确的顺序运行,除非明确地说明。

Claims (16)

1.一种用于对***变票虚开行为进行监控的方法,所述方法包括:
检测变票虚开***中的商品并且对所述商品出现在变票虚开***中的次数进行记录,将变票虚开***中出现的次数达到预定值的商品作为高风险商品;
基于进项***信息表,筛选出与所述进项***信息表中所述高风险商品对应的纳税人,建立包括纳税人和纳税人的***信息的进项***事实表;
基于销项***信息表,筛选出与所述销项***信息表中所述高风险商品对应的纳税人,建立包括纳税人和纳税人的***信息的销项***事实表;
确定所述进项***事实表中的第一特征参数组,并计算所述第一特征参数组中的特征参数的数值,将所述第一特征参数组以及所述第一特征参数组的特征参数的数值存储至***变票虚开预警结果表中;
确定所述销项***事实表中的第二特征参数组,并计算所述第二特征参数组中的特征参数的数值,将所述第二特征参数组以及所述第二特征参数组的特征参数的数值存储至所述***变票虚开预警结果表中;
基于所述第一特征参数组的特征参数和所述第二特征参数组的特征参数,计算所述高风险商品的相关特征参数的数值,并将所述相关特征参数的数值存储至所述***变票虚开预警结果表中;
将所述***变票虚开预警结果表中所述第一特征参数组的特征参数的数值、所述第二特征参数组的特征参数的数值以及所述相关特征参数的数值与预先设置对应的特征参数的阈值进行比较,基于比较结果确定***变票虚开的嫌疑纳税人。
2.根据权利要求1所述的方法,通过程序检测存在***变票虚开行为的商品;获取的高风险商品的商品类型和19位商品分类编码。
3.根据权利要求1所述的方法,通过程序,基于进项***信息表,筛选出与所述进项***信息表中所述高风险商品对应的纳税人,建立包括纳税人和纳税人的***信息的进项***事实表,所述进项***事实表为数据库表;
通过程序,基于销项***信息表,筛选出与所述销项***信息表中所述高风险商品对应的纳税人,建立包括纳税人和纳税人的***信息的销项***事实表,所述销项***事实表为数据库表。
4.根据权利要求1所述的方法,通过程序,确定所述进项***事实表中的第一特征参数组,并计算所述第一特征参数组中的特征参数的数值,将所述第一特征参数组以及所述第一特征参数组中的特征参数的数值存储至***变票虚开预警结果表中,所述***变票虚开预警结果表为数据库表;
通过程序,确定所述销项***事实表中的第二特征参数组,并计算所述第二特征参数组中的特征参数的数值,将所述第二特征参数组以及所述第二特征参数组中的特征参数的数值存储至所述***变票虚开预警结果表中,所述***变票虚开预警结果表为数据库表;
通过程序,基于所述第一特征参数组的特征参数和所述第二特征参数组的特征参数,计算所述高风险商品的相关特征参数的数值,并将所述相关特征参数的数值存储至所述***变票虚开预警结果表中,所述***变票虚开预警结果表为数据库表。
5.根据权利要求1所述的方法,通过程序,将所述***变票虚开预警结果表中所述第一特征参数组的特征参数的数值、所述第二特征参数组的特征参数的数值以及所述相关特征参数的数值与预先设置对应的特征参数的阈值进行比较,基于比较结果确定***变票虚开的嫌疑纳税人。
6.根据权利要求1所述的方法,还包括:
为不同的高风险商品设置所述第一特征参数组的特征参数的阈值;
为不同的高风险商品设置所述第二特征参数组的特征参数的阈值。
7.根据权利要求1所述的方法,所述第一特征参数组包括的特征参数为:购进的所有商品的总金额,购进的高风险商品的金额,购进的其他商品的金额,购进的高风险商品与所有购进商品的金额比值。
8.根据权利要求1所述的方法,所述第二特征参数组包括的特征参数为:销售的所有商品的总金额,销售的高风险商品的金额,销售的其他商品的金额,销售的高风险商品与所有销售商品的金额比值。
9.一种用于对***变票虚开行为进行监控的***,所述***包括:
统计单元,检测变票虚开***中的商品并且对所述商品出现在变票虚开***中的次数进行记录,将变票虚开***中出现的次数达到预定值的商品作为高风险商品;
建立单元,用于基于进项***信息表,筛选出与所述进项***信息表中所述高风险商品对应的纳税人,建立包括纳税人和纳税人的***信息的进项***事实表;用于基于销项***信息表,筛选出与所述销项***信息表中所述高风险商品对应的纳税人,建立包括纳税人和纳税人的***信息的销项***事实表;
计算单元,用于确定所述进项***事实表中的第一特征参数组,并计算所述第一特征参数组中的特征参数的数值,将所述第一特征参数组以及所述第一特征参数组的特征参数的数值存储至***变票虚开预警结果表中;用于确定所述销项***事实表中的第二特征参数组,并计算所述第二特征参数组中的特征参数的数值,将所述第二特征参数组的特征参数的数值以及所述第二特征参数组的特征参数的数值存储至所述***变票虚开预警结果表中;用于基于所述第一特征参数组的特征参数和所述第二特征参数组的特征参数,计算所述高风险商品的相关特征参数的数值,并将所述相关特征参数的数值存储至所述***变票虚开预警结果表中;
分析单元,用于将所述***变票虚开预警结果表中所述第一特征参数组的特征参数的数值、所述第二特征参数组的特征参数的数值以及所述相关特征参数的数值与预先设置对应的特征参数的阈值进行比较,基于比较结果确定***变票虚开的嫌疑纳税人。
10.根据权利要求9所述的***,所述统计单元还用于:通过程序检测存在***变票虚开行为的商品;获取的高风险商品的商品类型和19位商品分类编码。
11.根据权利要求9所述的***,所述建立单元还用于:
通过程序,基于进项***信息表,筛选出与所述进项***信息表中所述高风险商品对应的纳税人,建立包括纳税人和纳税人的***信息的进项***事实表,所述进项***事实表为数据库表;
通过程序,基于销项***信息表,筛选出与所述销项***信息表中所述高风险商品对应的纳税人,建立包括纳税人和纳税人的***信息的销项***事实表,所述销项***事实表为数据库表。
12.根据权利要求9所述的***,所述计算单元还用于:
通过程序,确定所述进项***事实表中的第一特征参数组,并计算所述第一特征参数组中的特征参数的数值,将所述第一特征参数组以及所述第一特征参数组中的特征参数的数值存储至***变票虚开预警结果表中,所述***变票虚开预警结果表为数据库表;
通过程序,确定所述销项***事实表中的第二特征参数组,并计算所述第二特征参数组中的特征参数的数值,将所述第二特征参数组以及所述第二特征参数组中的特征参数的数值存储至所述***变票虚开预警结果表中,所述***变票虚开预警结果表为数据库表;
将所述***变票虚开预警结果表中所述第一特征参数组的特征参数的数值、所述第二特征参数组的特征参数的数值以及所述相关特征参数的数值与预先设置对应的特征参数的阈值进行比较,基于比较结果确定***变票虚开的嫌疑纳税人。
13.根据权利要求9所述的***,所述分析单元还用于:通过程序,将所述票变票虚开预警结果表中所述第一特征参数组的特征参数的数值、所述第二特征参数组的特征参数的数值以及所述相关特征参数的数值与预先设置对应的特征参数的阈值进行比较,基于比较结果确定***变票虚开的嫌疑纳税人。
14.根据权利要求9所述的***,所述分析单元还用于:
为不同的高风险商品设置所述第一特征参数组的特征参数的阈值;
为不同的高风险商品设置所述第二特征参数组的特征参数的阈值。
15.根据权利要求9所述的***,所述第一特征参数组包括的特征参数为:购进的所有商品的总金额,购进的高风险商品的金额,购进的其他商品的金额,购进的高风险商品与所有购进商品的金额比值。
16.根据权利要求9所述的***,所述第二特征参数组包括的特征参数为:销售的所有商品的总金额,销售的高风险商品的金额,销售的其他商品的金额,销售的高风险商品与所有销售商品的金额比值。
CN201711283447.4A 2017-12-07 2017-12-07 一种用于对***变票虚开行为进行监控的方法及*** Pending CN109919690A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201711283447.4A CN109919690A (zh) 2017-12-07 2017-12-07 一种用于对***变票虚开行为进行监控的方法及***

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201711283447.4A CN109919690A (zh) 2017-12-07 2017-12-07 一种用于对***变票虚开行为进行监控的方法及***

Publications (1)

Publication Number Publication Date
CN109919690A true CN109919690A (zh) 2019-06-21

Family

ID=66956666

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201711283447.4A Pending CN109919690A (zh) 2017-12-07 2017-12-07 一种用于对***变票虚开行为进行监控的方法及***

Country Status (1)

Country Link
CN (1) CN109919690A (zh)

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104424595A (zh) * 2013-09-04 2015-03-18 航天信息股份有限公司 税务监控方法及其***
CN104636970A (zh) * 2013-11-06 2015-05-20 航天信息股份有限公司 一种通过商品差异监控企业逃税的方法及其***
US9092447B1 (en) * 2008-10-20 2015-07-28 Jpmorgan Chase Bank, N.A. Method and system for duplicate detection
CN105630785A (zh) * 2014-10-27 2016-06-01 航天信息股份有限公司 一种***使用异常预警方法和***
CN106933814A (zh) * 2015-12-28 2017-07-07 航天信息股份有限公司 税务数据异常分析方法及***

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US9092447B1 (en) * 2008-10-20 2015-07-28 Jpmorgan Chase Bank, N.A. Method and system for duplicate detection
CN104424595A (zh) * 2013-09-04 2015-03-18 航天信息股份有限公司 税务监控方法及其***
CN104636970A (zh) * 2013-11-06 2015-05-20 航天信息股份有限公司 一种通过商品差异监控企业逃税的方法及其***
CN105630785A (zh) * 2014-10-27 2016-06-01 航天信息股份有限公司 一种***使用异常预警方法和***
CN106933814A (zh) * 2015-12-28 2017-07-07 航天信息股份有限公司 税务数据异常分析方法及***

Similar Documents

Publication Publication Date Title
CN110717828B (zh) 一种基于频繁交易模式的异常账户检测方法及***
CN108921689A (zh) 贷款风险监控***及方法
US8180696B2 (en) Stock purchase indices
CN106779996A (zh) 一种供应链金融中企业数据挖掘方法及***
US20040122764A1 (en) Capped bill systems, methods and products
WO2002091264A1 (fr) Systeme d'evaluation de la clientele
AU2006246368B2 (en) System and method for quantitative peer travel and expense benchmarking analysis
US20080255971A1 (en) Method and system of self-auditing for recovering sales tax
WO2005101265A2 (en) Systems and methods for investigation of financial reporting information
CN108898480A (zh) 用于授信贷款的贷款等级评估***及方法
CN109460421A (zh) 商户交易数据管理方法及装置
CN109919667B (zh) 一种用于识别企业ip的方法和装置
WO2009120884A1 (en) System and method of determining the quality of enhanced transaction data
CN109919690A (zh) 一种用于对***变票虚开行为进行监控的方法及***
WO2006073551A2 (en) Method of processing investment data and making compensation determinations and associated system
CN115423631A (zh) 基于产业互联网平台交易数据的交易会员评分方法及***
US11182818B1 (en) Computer system for identifying aberrant activity on a reward card platform
US20070265886A1 (en) Warranty management system and method
CN112149398B (zh) 一种快速生成电商企业经营利润报表的***
KR101187099B1 (ko) 대용량처리전용 데이터베이스를 이용한 국제회계기준 금융상품 회계처리시스템
Normah et al. Comparison of Classification C4. 5 Algorithms and Naïve Bayes Classifier in Determining Merchant Acceptance on Sponsorship Program
CN111311331A (zh) 一种rfm分析方法
CN117236996B (zh) 一种基于大数据分析的用户行为预测方法和***
CN108985855B (zh) 一种合约信息的确定方法及***
CN116957631B (zh) 一种税务***数据智能识别方法、***和介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication
RJ01 Rejection of invention patent application after publication

Application publication date: 20190621