CN109978675A - 一种税务监控方法和装置 - Google Patents
一种税务监控方法和装置 Download PDFInfo
- Publication number
- CN109978675A CN109978675A CN201711402133.1A CN201711402133A CN109978675A CN 109978675 A CN109978675 A CN 109978675A CN 201711402133 A CN201711402133 A CN 201711402133A CN 109978675 A CN109978675 A CN 109978675A
- Authority
- CN
- China
- Prior art keywords
- commodity
- pin item
- pin
- income
- product name
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/20—Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
- G06F16/24—Querying
- G06F16/245—Query processing
- G06F16/2455—Query execution
- G06F16/24553—Query execution of query operations
- G06F16/24554—Unary operations; Data partitioning operations
- G06F16/24556—Aggregation; Duplicate elimination
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q40/00—Finance; Insurance; Tax strategies; Processing of corporate or income taxes
- G06Q40/10—Tax strategies
Landscapes
- Engineering & Computer Science (AREA)
- Business, Economics & Management (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- Accounting & Taxation (AREA)
- Finance (AREA)
- General Physics & Mathematics (AREA)
- Development Economics (AREA)
- Data Mining & Analysis (AREA)
- Computational Linguistics (AREA)
- Databases & Information Systems (AREA)
- General Engineering & Computer Science (AREA)
- Economics (AREA)
- Marketing (AREA)
- Strategic Management (AREA)
- Technology Law (AREA)
- General Business, Economics & Management (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
本发明公开了一种税务监控方法和装置,所述方法包括,获得总进销项商品对应的进项商品数据集合和销项商品数据集合;根据进销项商品的商品名称的相似度将进销项商品分为三个区间,这样就能够减少计算的复杂度,完全一致的商品和匹配度低的商品都可以提出单独计算。针对物品匹配的部分利用匈牙利算法,更有效准确的得到每个物品的最佳匹配,有效的提高数据的准确性。
Description
技术领域
本发明涉及税控技术领域,尤其涉及一种税务监控方法和装置。
背景技术
针对现有税务平台的监控***,需要通过纳税人进项物品和销项物品之间的差异监控企业是否有逃税漏税的风险。随着税务大数据的兴起,税务业务的大数据化也在逐步进行中。在分析纳税人监控的时候,进销项差异的计算尤为重要。
现在大数据技术越来越成熟,这就要求在税务监控中使用更成熟的技术提供更准确更有效的分析。想要分析纳税人进项和销项的差异,我们需要对比进项物品和销项物品的差异,然而计算机并不清楚利用哪个物品和哪个物品做匹配来计算差异度,因此,计算差异度的算法尤为重要。
但是,现有技术中在进行税务监控时,差异度计算方法复杂,计算效率低下。
发明内容
本发明实施例通过提供一种税务监控方法和装置,用于解决现有技术中在进行税务监控时,差异度计算方法复杂,计算效率低下的技术问题。
第一方面,本发明一种税务监控方法,所述方法包括:
获得总进销项商品对应的进项商品数据集合和销项商品数据集合;
获得所述进项商品数据集合中商品名称和所述销项商品数据集合中商品名称相同的第一进销项商品对应的第一物品差异度集合,获得所述进项商品数据集合中商品名称和所述销项商品数据集合中每个商品的商品名称的相似度均小于第一阈值的第二进销项商品对应的第二物品差异度集合,以及获得第三进销项商品对应的第三物品差异度集合,其中,所述总进销项商品由所述第一进销项商品、第二进销项商品和第三进销项商品组成;
利用纳税人识别号对所述第一物品差异度集合、所述第二物品差异度集合和所述第三物品差异度集合进行聚合,获得商品差异度集合。
可选的,所述获得所述进项商品数据集合中商品名称和所述销项商品数据集合中商品名称相同的第一进销项商品对应的第一物品差异度集合,包括:
对所述第一进销项商品中的商品名称相同的每一进销项商品进行以下操作:
确定商品名称相同的一进项商品和一销项商品为一进销项商品;
获得所述商品名称相同的一进项商品和一销项商品的商品名称的初始差异度;
获得所述商品名称相同的一进项商品和一销项商品的物品总金额差值;
利用所述物品总金额差值对所述初始差异度进行加权处理,对加权处理后的结果进行归一化,获得所述商品名称相同的一进项商品和一销项商品的物品差异度;其中,所述每一进销项商品的物品差异度组成所述第一物品差异度集合。
可选的,所述获得所述进项商品数据集合中商品名称和所述销项商品数据集合中每个商品的商品名称的相似度均小于第一阈值的第二进销项商品对应的第二物品差异度集合,包括:
对所述第二进销项商品中的每个进项商品和每个销项商品进行以下操作:
确定所述第二进销项商品中一进项商品和一销项商品;
获得所述第二进销项商品中一进项商品和一销项商品的商品名称的初始差异度;
获得所述第二进销项商品中一进项商品和一销项商品的物品总金额差值;
利用所述物品总金额差值对所述初始差异度进行加权处理,对加权处理后的结果进行归一化,获得所述第二进销项商品中一进项商品和一销项商品的物品差异度;其中,所述第二进销项商品中每一进项商品和每一销项物品的物品差异度组成所述第二物品差异度集合。
可选的,所述获得第三进销项商品对应的第三物品差异度集合,包括:
根据所述第三进销项商品中的每个进项商品和每个销项商品的相似度,计算所述第三进销项商品中的每个进项商品和每个销项商品的商品名称的初始差异度矩阵;
根据所述初始差异度矩阵,利用匈牙利算法获得所述第三进销项商品中的每个进项商品和每个销项商品的商品名称的最佳匹配结果;
利用所述最佳匹配结果中的进销项商品的物品总金额差值对所述最佳匹配结果中的进销项商品的初始差异度进行加权处理,对加权处理后的结果进行归一化,获得所述第三物品差异度集合。
第二方面,本发明一实施例提供了一种税务监控装置,所述装置包括:
第一获得模块,用于获得总进销项商品对应的进项商品数据集合和销项商品数据集合;
第二获得模块,用于获得所述进项商品数据集合中商品名称和所述销项商品数据集合中商品名称相同的第一进销项商品对应的第一物品差异度集合,获得所述进项商品数据集合中商品名称和所述销项商品数据集合中每个商品的商品名称的相似度均小于第一阈值的第二进销项商品对应的第二物品差异度集合,以及获得第三进销项商品对应的第三物品差异度集合,其中,所述总进销项商品由所述第一进销项商品、第二进销项商品和第三进销项商品组成;
聚合模块,用于利用纳税人识别号对所述第一物品差异度集合、所述第二物品差异度集合和所述第三物品差异度集合进行聚合,获得商品差异度集合。
可选的,所述第一获得模块具体用于:
对所述第一进销项商品中的商品名称相同的每一进销项商品进行以下操作:
确定商品名称相同的一进项商品和一销项商品为一进销项商品;
获得所述商品名称相同的一进项商品和一销项商品的商品名称的初始差异度;
获得所述商品名称相同的一进项商品和一销项商品的物品总金额差值;
利用所述物品总金额差值对所述初始差异度进行加权处理,对加权处理后的结果进行归一化,获得所述商品名称相同的一进项商品和一销项商品的物品差异度;其中,所述每一进销项商品的物品差异度组成所述第一物品差异度集合。
可选的,所述第一获得模块具体用于:
对所述第二进销项商品中的每个进项商品和每个销项商品进行以下操作:
确定所述第二进销项商品中一进项商品和一销项商品;
获得所述第二进销项商品中一进项商品和一销项商品的商品名称的初始差异度;
获得所述第二进销项商品中一进项商品和一销项商品的物品总金额差值;
利用所述物品总金额差值对所述初始差异度进行加权处理,对加权处理后的结果进行归一化,获得所述第二进销项商品中一进项商品和一销项商品的物品差异度;其中,所述第二进销项商品中每一进项商品和每一销项物品的物品差异度组成所述第二物品差异度集合。
可选的,所述第一获得模块具体用于:
根据所述第三进销项商品中的每个进项商品和每个销项商品的相似度,计算所述第三进销项商品中的每个进项商品和每个销项商品的商品名称的初始差异度矩阵;
根据所述初始差异度矩阵,利用匈牙利算法获得所述第三进销项商品中的每个进项商品和每个销项商品的商品名称的最佳匹配结果;
利用所述最佳匹配结果中的进销项商品的物品总金额差值对所述最佳匹配结果中的进销项商品的初始差异度进行加权处理,对加权处理后的结果进行归一化,获得所述第三物品差异度集合。
第三方面,本发明一实施例提供了一种计算机装置,所述装置包括处理器,所述处理器用于执行存储器中存储的计算机程序时实现第一方面实施例中所述方法的步骤。
第四方面,本发明一实施例提供了一种计算机可读存储介质,其上存储有计算机程序,所述计算机程序被处理器执行时实现如第一方面实施例中所述方法的步骤。
本发明实施例中提供的一个或多个技术方案,至少具有如下技术效果或优点:
采用本发明提供的技术方案,针对需要对比两个集合的差异度或者相似度,提供有效的匹配方式,将复杂问题简单化,划分好每个需要对比的物品的区间,减少计算的复杂度,提高计算的准确性。
附图说明
图1为本发明实施例提供的税务监控方法的流程图;
图2为本发明实施例提供的税务监控装置的示意图。
具体实施方式
为了解决上述技术问题,本发明实施例中的技术方案的总体思路如下:一种税务监控方法和装置,所述方法包括,获得总进销项商品对应的进项商品数据集合和销项商品数据集合;获得所述进项商品数据集合中商品名称和所述销项商品数据集合中商品名称相同的第一进销项商品对应的第一物品差异度集合,获得所述进项商品数据集合中商品名称和所述销项商品数据集合中每个商品的商品名称的相似度均小于第一阈值的第二进销项商品对应的第二物品差异度集合,以及获得第三进销项商品对应的第三物品差异度集合,其中,所述总进销项商品由所述第一进销项商品、第二进销项商品和第三进销项商品组成;利用纳税人识别号对所述第一物品差异度集合、所述第二物品差异度集合和所述第三物品差异度集合进行聚合,获得商品差异度集合。这样针对需要对比两个集合的差异度或者相似度,提供有效的匹配方式,将复杂问题简单化,划分好每个需要对比的物品的区间,减少计算的复杂度,提高计算的准确性。
为了更好的理解上述技术方案,下面将结合说明书附图以及具体的实施方式对上述技术方案进行详细的说明。
如图1所示,本发明实施例一提供了一种税务监控方法,所述方法包括:
S101,获得总进销项商品对应的进项商品数据集合和销项商品数据集合;
S102,获得所述进项商品数据集合中商品名称和所述销项商品数据集合中商品名称相同的第一进销项商品对应的第一物品差异度集合,获得所述进项商品数据集合中商品名称和所述销项商品数据集合中每个商品的商品名称的相似度均小于第一阈值的第二进销项商品对应的第二物品差异度集合,以及获得第三进销项商品对应的第三物品差异度集合,其中,所述总进销项商品由所述第一进销项商品、第二进销项商品和第三进销项商品组成;
S103,利用纳税人识别号对所述第一物品差异度集合、所述第二物品差异度集合和所述第三物品差异度集合进行聚合,获得商品差异度集合。
对于步骤S101,总进销项商品包括总进项商品和总销项商品,总进项商品对应有进项商品数据集合,总销项商品对应有销项商品数据集。
进行总进项商品对应的进项商品数据准备,执行进项数据查询,对查询到的数据结果按照纳税人识别号和商品名称做分组计算,得到进项商品数据集合。
进行总销项商品对应的销项商品数据准备,执行销项数据查询,对查询到的数据结果按照纳税人和商品名称做分组计算,得到构成的销项商品数据集合。
在获得进项商品数据集合和销项商品数据集合后,执行步骤S102,进行进销项差异度计算,具体计算方法如下:
以进项商品数据集合中的商品名称和销项商品数据集合中商品名称为比较对象,将进销项商品分为三个区间,第一区间是所述进项商品数据集合中商品名称和所述销项商品数据集合中商品名称相同的第一进销项商品,第二区间是所述进项商品数据集合中商品名称和所述销项商品数据集合中每个商品的商品名称的相似度均小于第一阈值的第二进销项商品,第三区间是总进销项商品中除第一进销项商品、第二进销项商品之外其余的进销项商品,这些其余的进销项商品构成第三进销项商品。
其中,第一进销项商品对应第一物品差异度集合,第二进销项商品对应第二物品差异度集合,第三进销项商品对应第三物品差异度集合。
获得第一、第二以及第三物品差异度集合的具体方法如下所述。
1、对于获得第一物品差异度集合的方法具体是:
对所述第一进销项商品中的商品名称相同的每一进销项商品进行以下操作:
确定商品名称相同的一进项商品和一销项商品为一进销项商品;
获得所述商品名称相同的一进项商品和一销项商品的商品名称的初始差异度,其中,所述商品名称相同的一进项商品和一销项商品的商品名称的初始差异度与所述商品名称相同的一进项商品和一销项商品的相似度之和为1;
获得所述商品名称相同的一进项商品和一销项商品的物品总金额差值;
利用所述物品总金额差值对所述初始差异度进行加权处理,对加权处理后的结果进行归一化,获得所述进商品名称相同的一进项商品和一销项商品的物品差异度;其中,所述每一进销项商品的物品差异度组成所述第一物品差异度集合。
具体地,例如,对于述商品名称相同的一进项商品和一销项商品,二者的商品名称的相似度为1,则二者的商品名称的初始差异度为0;
计算二者的物品总金额差异,利用物品总金额差异对初始差异度0进行加权,获得加权处理后的结果,对加权处理后的结果进行归一化,获得二者的物品差异度。所述第一进销项商品中的商品名称相同所述每一进销项商品的物品差异度组成所述第一物品差异度集合A。
2、对于获得第二物品差异度集合的方法具体是:
对所述第二进销项商品中的每个进项商品和每个销项商品进行以下操作:
确定所述第二进销项商品中一进项商品和一销项商品;
获得所述第二进销项商品中一进项商品和一销项商品的商品名称的初始差异度;
获得所述第二进销项商品中一进项商品和一销项商品的物品总金额差值;
利用所述物品总金额差值对所述初始差异度进行加权处理,对加权处理后的结果进行归一化,获得所述第二进销项商品中一进项商品和一销项商品的物品差异度;其中,所述第二进销项商品中每一进项商品和每一销项物品的物品差异度组成所述第二物品差异度集合。
例如,对于第二进销项商品,其对应的进项商品数据集合中商品名称和销项商品数据集合中每个商品的商品名称的相似度均小于第一阈值,第一阈值可以人为选定,例如第一阈值是0.2。那么根据相似度计算商品名称初始差异度。例如,所述第二进销项商品中的一进项商品和一销项商品的商品名称的初始差异度与所述第二进销项商品中的一进项商品和一销项商品的相似度之和为1。述第二进销项商品中每一进项商品和每一销项物品的物品差异度组成所述第二物品差异度集合B。
3、对于获得第三物品差异度集合的方法具体是:
根据所述第三进销项商品中的每个进项商品和每个销项商品的相似度,计算所述第三进销项商品中的每个进项商品和每个销项商品的商品名称的初始差异度矩阵;
根据所述初始差异度矩阵,利用匈牙利算法获得所述第三进销项商品中的每个进项商品和每个销项商品的商品名称的最佳匹配结果;
利用所述最佳匹配结果中的进销项商品的物品总金额差值对所述最佳匹配结果中的进销项商品的初始差异度进行加权处理,对加权处理后的结果进行归一化,获得所述第三物品差异度集合。
例如,对于总进销项商品,剔除掉商品名称完全相同的进项商品和销项商品,剔除掉商品名称相似度很低(例如小于相似度阈值0.2)的商品,剩余的进项商品和销项商品构成第三进销项商品,计算所述第三进销项商品中的每个进项商品和每个销项商品的商品名称的初始差异度矩阵,利用所述最佳匹配结果中的进销项商品的物品总金额差值对所述最佳匹配结果中的进销项商品的初始差异度进行加权处理,对加权处理后的结果进行归一化,获得所述第三物品差异度集合C。
在获得第一物品差异度集合A、第二物品差异度集合B以及第三物品差异度集合C之后,将第一物品差异度集合A、第二物品差异度集合B以及第三物品差异度集合C分别存储到差异度临时表“tmp”。
然后执行步骤S103,具体地,通过纳税人识别号对表“tmp”进行聚合,得到最终的差异度结果吗,即得到商品差异度集合,利用商品差异度集合可以对纳税人的税务信息进行监控。
如图2所示,本发明实施例二提供了一种税务监控装置,所述装置包括:
第一获得模块201,用于获得总进销项商品对应的进项商品数据集合和销项商品数据集合;
第二获得模块202,用于获得所述进项商品数据集合中商品名称和所述销项商品数据集合中商品名称相同的第一进销项商品对应的第一物品差异度集合,获得所述进项商品数据集合中商品名称和所述销项商品数据集合中每个商品的商品名称的相似度均小于第一阈值的第二进销项商品对应的第二物品差异度集合,以及获得第三进销项商品对应的第三物品差异度集合,其中,所述总进销项商品由所述第一进销项商品、第二进销项商品和第三进销项商品组成;
聚合模块203,用于利用纳税人识别号对所述第一物品差异度集合、所述第二物品差异度集合和所述第三物品差异度集合进行聚合,获得商品差异度集合。
其中,总进销项商品包括总进项商品和总销项商品,总进项商品对应有进项商品数据集合,总销项商品对应有销项商品数据集。
第一获得模块201,进行总进项商品对应的进项商品数据准备,执行进项数据查询,对查询到的数据结果按照纳税人识别号和商品名称做分组计算,得到进项商品数据集合。第一获得模块201,还进行总销项商品对应的销项商品数据准备,执行销项数据查询,对查询到的数据结果按照纳税人和商品名称做分组计算,得到构成的销项商品数据集合。
在获得进项商品数据集合和销项商品数据集合后,第二获得模块202进行进销项差异度计算,具体计算的实现方式如下:
以进项商品数据集合中的商品名称和销项商品数据集合中商品名称为比较对象,将进销项商品分为三个区间,第一区间是所述进项商品数据集合中商品名称和所述销项商品数据集合中商品名称相同的第一进销项商品,第二区间是所述进项商品数据集合中商品名称和所述销项商品数据集合中每个商品的商品名称的相似度均小于第一阈值的第二进销项商品,第三区间是总进销项商品中除第一进销项商品、第二进销项商品之外其余的进销项商品,这些其余的进销项商品构成第三进销项商品。
其中,第一进销项商品对应第一物品差异度集合,第二进销项商品对应第二物品差异度集合,第三进销项商品对应第三物品差异度集合。
第二获得模块202获得第一、第二以及第三物品差异度集合的具体方法如下所述。
1、第二获得模块202获得第一物品差异度集合的实现方式具体是:
对所述第一进销项商品中的商品名称相同的每一进销项商品进行以下操作:
确定商品名称相同的一进项商品和一销项商品为一进销项商品;
获得所述商品名称相同的一进项商品和一销项商品的商品名称的初始差异度,其中,所述商品名称相同的一进项商品和一销项商品的商品名称的初始差异度与所述商品名称相同的一进项商品和一销项商品的相似度之和为1;
获得所述商品名称相同的一进项商品和一销项商品的物品总金额差值;
利用所述物品总金额差值对所述初始差异度进行加权处理,对加权处理后的结果进行归一化,获得所述进商品名称相同的一进项商品和一销项商品的物品差异度;其中,所述每一进销项商品的物品差异度组成所述第一物品差异度集合。
具体地,例如,对于述商品名称相同的一进项商品和一销项商品,二者的商品名称的相似度为1,则二者的商品名称的初始差异度为0;
计算二者的物品总金额差异,利用物品总金额差异对初始差异度0进行加权,获得加权处理后的结果,对加权处理后的结果进行归一化,获得二者的物品差异度。所述第一进销项商品中的商品名称相同所述每一进销项商品的物品差异度组成所述第一物品差异度集合A。
2、第二获得模块202获得第二物品差异度集合的实现方式具体是:
对所述第二进销项商品中的每个进项商品和每个销项商品进行以下操作:
确定所述第二进销项商品中一进项商品和一销项商品;
获得所述第二进销项商品中一进项商品和一销项商品的商品名称的初始差异度;
获得所述第二进销项商品中一进项商品和一销项商品的物品总金额差值;
利用所述物品总金额差值对所述初始差异度进行加权处理,对加权处理后的结果进行归一化,获得所述第二进销项商品中一进项商品和一销项商品的物品差异度;其中,所述第二进销项商品中每一进项商品和每一销项物品的物品差异度组成所述第二物品差异度集合。
例如,对于第二进销项商品,其对应的进项商品数据集合中商品名称和销项商品数据集合中每个商品的商品名称的相似度均小于第一阈值,第一阈值可以人为选定,例如第一阈值是0.2。那么根据相似度计算商品名称初始差异度。例如,所述第二进销项商品中的一进项商品和一销项商品的商品名称的初始差异度与所述第二进销项商品中的一进项商品和一销项商品的相似度之和为1。述第二进销项商品中每一进项商品和每一销项物品的物品差异度组成所述第二物品差异度集合B。
3、第二获得模块202获得第三物品差异度集合的实现方式具体是:
根据所述第三进销项商品中的每个进项商品和每个销项商品的相似度,计算所述第三进销项商品中的每个进项商品和每个销项商品的商品名称的初始差异度矩阵;
根据所述初始差异度矩阵,利用匈牙利算法获得所述第三进销项商品中的每个进项商品和每个销项商品的商品名称的最佳匹配结果;
利用所述最佳匹配结果中的进销项商品的物品总金额差值对所述最佳匹配结果中的进销项商品的初始差异度进行加权处理,对加权处理后的结果进行归一化,获得所述第三物品差异度集合。
例如,对于总进销项商品,剔除掉商品名称完全相同的进项商品和销项商品,剔除掉商品名称相似度很低(例如小于相似度阈值0.2)的商品,剩余的进项商品和销项商品构成第三进销项商品,计算所述第三进销项商品中的每个进项商品和每个销项商品的商品名称的初始差异度矩阵,利用所述最佳匹配结果中的进销项商品的物品总金额差值对所述最佳匹配结果中的进销项商品的初始差异度进行加权处理,对加权处理后的结果进行归一化,获得所述第三物品差异度集合C。
在获得第一物品差异度集合A、第二物品差异度集合B以及第三物品差异度集合C之后,将第一物品差异度集合A、第二物品差异度集合B以及第三物品差异度集合C分别存储到差异度临时表“tmp”。
然后聚合模块203进行数据聚合,具体地,聚合模块通过纳税人识别号对表“tmp”进行聚合,得到最终的差异度结果吗,即得到商品差异度集合,利用商品差异度集合可以对纳税人的税务信息进行监控。
本发明实施例三提供了一种计算机装置,所述装置包括处理器,所述处理器用于执行存储器中存储的计算机程序时实现如实施例一所述方法的步骤。
本发明实施例四提供了一种计算机可读存储介质,其上存储有计算机程序,所述计算机程序被处理器执行时实现如实施例一所述方法的步骤。
上述本发明实施例中的技术方案,至少具有如下的技术效果或优点:
根据进销项商品的商品名称的相似度将进销项商品分为三个区间,这样就能够减少计算的复杂度,完全一致的商品和匹配度低的商品都可以提出单独计算。针对物品匹配的部分利用匈牙利算法,更有效准确的得到每个物品的最佳匹配,有效的提高数据的准确性。
尽管已描述了本发明的优选实施例,但本领域内的技术人员一旦得知了基本创造性概念,则可对这些实施例作出另外的变更和修改。所以,所附权利要求意欲解释为包括优选实施例以及落入本发明范围的所有变更和修改。
显然,本领域的技术人员可以对本发明进行各种改动和变型而不脱离本发明的精神和范围。这样,倘若本发明的这些修改和变型属于本发明权利要求及其等同技术的范围之内,则本发明也意图包含这些改动和变型在内。
Claims (10)
1.一种税务监控方法,其特征在于,所述方法包括:
获得总进销项商品对应的进项商品数据集合和销项商品数据集合;
获得所述进项商品数据集合中商品名称和所述销项商品数据集合中商品名称相同的第一进销项商品对应的第一物品差异度集合,获得所述进项商品数据集合中商品名称和所述销项商品数据集合中每个商品的商品名称的相似度均小于第一阈值的第二进销项商品对应的第二物品差异度集合,以及获得第三进销项商品对应的第三物品差异度集合,其中,所述总进销项商品由所述第一进销项商品、第二进销项商品和第三进销项商品组成;
利用纳税人识别号对所述第一物品差异度集合、所述第二物品差异度集合和所述第三物品差异度集合进行聚合,获得商品差异度集合。
2.如权利要求1所述的方法,其特征在于,获得所述进项商品数据集合中商品名称和所述销项商品数据集合中商品名称相同的第一进销项商品对应的第一物品差异度集合,包括:
对所述第一进销项商品中的商品名称相同的每一进销项商品进行以下操作:
确定商品名称相同的一进项商品和一销项商品为一进销项商品;
获得所述商品名称相同的一进项商品和一销项商品的商品名称的初始差异度;
获得所述商品名称相同的一进项商品和一销项商品的物品总金额差值;
利用所述物品总金额差值对所述初始差异度进行加权处理,对加权处理后的结果进行归一化,获得所述商品名称相同的一进项商品和一销项商品的物品差异度;其中,所述每一进销项商品的物品差异度组成所述第一物品差异度集合。
3.如权利要求1所述的方法,其特征在于,所述获得所述进项商品数据集合中商品名称和所述销项商品数据集合中每个商品的商品名称的相似度均小于第一阈值的第二进销项商品对应的第二物品差异度集合,包括:
对所述第二进销项商品中的每个进项商品和每个销项商品进行以下操作:
确定所述第二进销项商品中一进项商品和一销项商品;
获得所述第二进销项商品中一进项商品和一销项商品的商品名称的初始差异度;
获得所述第二进销项商品中一进项商品和一销项商品的物品总金额差值;
利用所述物品总金额差值对所述初始差异度进行加权处理,对加权处理后的结果进行归一化,获得所述第二进销项商品中一进项商品和一销项商品的物品差异度;其中,所述第二进销项商品中每一进项商品和每一销项物品的物品差异度组成所述第二物品差异度集合。
4.如权利要求1所述的方法,其特征在于,所述获得第三进销项商品对应的第三物品差异度集合,包括:
根据所述第三进销项商品中的每个进项商品和每个销项商品的相似度,计算所述第三进销项商品中的每个进项商品和每个销项商品的商品名称的初始差异度矩阵;
根据所述初始差异度矩阵,利用匈牙利算法获得所述第三进销项商品中的每个进项商品和每个销项商品的商品名称的最佳匹配结果;
利用所述最佳匹配结果中的进销项商品的物品总金额差值对所述最佳匹配结果中的进销项商品的初始差异度进行加权处理,对加权处理后的结果进行归一化,获得所述第三物品差异度集合。
5.一种税务监控装置,其特征在于,所述装置包括:
第一获得模块,用于获得总进销项商品对应的进项商品数据集合和销项商品数据集合;
第二获得模块,用于获得所述进项商品数据集合中商品名称和所述销项商品数据集合中商品名称相同的第一进销项商品对应的第一物品差异度集合,获得所述进项商品数据集合中商品名称和所述销项商品数据集合中每个商品的商品名称的相似度均小于第一阈值的第二进销项商品对应的第二物品差异度集合,以及获得第三进销项商品对应的第三物品差异度集合,其中,所述总进销项商品由所述第一进销项商品、第二进销项商品和第三进销项商品组成;
聚合模块,用于利用纳税人识别号对所述第一物品差异度集合、所述第二物品差异度集合和所述第三物品差异度集合进行聚合,获得商品差异度集合。
6.如权利要求5所述的装置,其特征在于,所述第一获得模块具体用于:
对所述第一进销项商品中的商品名称相同的每一进销项商品进行以下操作:
确定商品名称相同的一进项商品和一销项商品为一进销项商品;
获得所述商品名称相同的一进项商品和一销项商品的商品名称的初始差异度;
获得所述商品名称相同的一进项商品和一销项商品的物品总金额差值;
利用所述物品总金额差值对所述初始差异度进行加权处理,对加权处理后的结果进行归一化,获得所述商品名称相同的一进项商品和一销项商品的物品差异度;其中,所述每一进销项商品的物品差异度组成所述第一物品差异度集合。
7.如权利要求5所述的装置,其特征在于,所述第一获得模块具体用于:
对所述第二进销项商品中的每个进项商品和每个销项商品进行以下操作:
确定所述第二进销项商品中一进项商品和一销项商品;
获得所述第二进销项商品中一进项商品和一销项商品的商品名称的初始差异度;
获得所述第二进销项商品中一进项商品和一销项商品的物品总金额差值;
利用所述物品总金额差值对所述初始差异度进行加权处理,对加权处理后的结果进行归一化,获得所述第二进销项商品中一进项商品和一销项商品的物品差异度;其中,所述第二进销项商品中每一进项商品和每一销项物品的物品差异度组成所述第二物品差异度集合。
8.如权利要求5所述的装置,其特征在于,所述第一获得模块具体用于:
根据所述第三进销项商品中的每个进项商品和每个销项商品的相似度,计算所述第三进销项商品中的每个进项商品和每个销项商品的商品名称的初始差异度矩阵;
根据所述初始差异度矩阵,利用匈牙利算法获得所述第三进销项商品中的每个进项商品和每个销项商品的商品名称的最佳匹配结果;
利用所述最佳匹配结果中的进销项商品的物品总金额差值对所述最佳匹配结果中的进销项商品的初始差异度进行加权处理,对加权处理后的结果进行归一化,获得所述第三物品差异度集合。
9.一种计算机装置,其特征在于,所述装置包括处理器,所述处理器用于执行存储器中存储的计算机程序时实现如权利要求1-4中任一项所述方法的步骤。
10.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现如权利要求1-4中任一项所述方法的步骤。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201711402133.1A CN109978675B (zh) | 2017-12-22 | 2017-12-22 | 一种税务监控方法和装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201711402133.1A CN109978675B (zh) | 2017-12-22 | 2017-12-22 | 一种税务监控方法和装置 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN109978675A true CN109978675A (zh) | 2019-07-05 |
CN109978675B CN109978675B (zh) | 2022-06-07 |
Family
ID=67072127
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201711402133.1A Active CN109978675B (zh) | 2017-12-22 | 2017-12-22 | 一种税务监控方法和装置 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN109978675B (zh) |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN111881265A (zh) * | 2020-09-28 | 2020-11-03 | 成都数联铭品科技有限公司 | 报关单商品信息的处理方法及***、存储介质及电子设备 |
CN112258255A (zh) * | 2020-09-23 | 2021-01-22 | 河北航天信息技术有限公司 | 一种住宿业纳税人风险模型分析方法及装置 |
Citations (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN103839172A (zh) * | 2012-11-23 | 2014-06-04 | 阿里巴巴集团控股有限公司 | 商品推荐方法及*** |
CN103902545A (zh) * | 2012-12-25 | 2014-07-02 | 北京京东尚科信息技术有限公司 | 一种类目路径识别方法及*** |
CN104424613A (zh) * | 2013-09-04 | 2015-03-18 | 航天信息股份有限公司 | 一种增值税***的监控方法及其*** |
CN104424595A (zh) * | 2013-09-04 | 2015-03-18 | 航天信息股份有限公司 | 税务监控方法及其*** |
US20150120519A1 (en) * | 2013-10-28 | 2015-04-30 | Black Knight IP Holding Company LLC | System for estimating property taxes |
CN104636973A (zh) * | 2013-11-06 | 2015-05-20 | 航天信息股份有限公司 | 一种通过商品构成监控企业虚开***的方法及其*** |
CN104636341A (zh) * | 2013-11-06 | 2015-05-20 | 航天信息股份有限公司 | 一种用于增值税一号多名监控的数据清洗存储方法 |
-
2017
- 2017-12-22 CN CN201711402133.1A patent/CN109978675B/zh active Active
Patent Citations (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN103839172A (zh) * | 2012-11-23 | 2014-06-04 | 阿里巴巴集团控股有限公司 | 商品推荐方法及*** |
CN103902545A (zh) * | 2012-12-25 | 2014-07-02 | 北京京东尚科信息技术有限公司 | 一种类目路径识别方法及*** |
CN104424613A (zh) * | 2013-09-04 | 2015-03-18 | 航天信息股份有限公司 | 一种增值税***的监控方法及其*** |
CN104424595A (zh) * | 2013-09-04 | 2015-03-18 | 航天信息股份有限公司 | 税务监控方法及其*** |
US20150120519A1 (en) * | 2013-10-28 | 2015-04-30 | Black Knight IP Holding Company LLC | System for estimating property taxes |
CN104636973A (zh) * | 2013-11-06 | 2015-05-20 | 航天信息股份有限公司 | 一种通过商品构成监控企业虚开***的方法及其*** |
CN104636341A (zh) * | 2013-11-06 | 2015-05-20 | 航天信息股份有限公司 | 一种用于增值税一号多名监控的数据清洗存储方法 |
Non-Patent Citations (1)
Title |
---|
孙正密: "深化数据应用筑起税收风险新防线", 《中国税务》 * |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN112258255A (zh) * | 2020-09-23 | 2021-01-22 | 河北航天信息技术有限公司 | 一种住宿业纳税人风险模型分析方法及装置 |
CN111881265A (zh) * | 2020-09-28 | 2020-11-03 | 成都数联铭品科技有限公司 | 报关单商品信息的处理方法及***、存储介质及电子设备 |
CN111881265B (zh) * | 2020-09-28 | 2020-12-29 | 成都数联铭品科技有限公司 | 报关单商品信息的处理方法及***、存储介质及电子设备 |
Also Published As
Publication number | Publication date |
---|---|
CN109978675B (zh) | 2022-06-07 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN108960833B (zh) | 一种基于异构金融特征的异常交易识别方法,设备及存储介质 | |
CN103370722B (zh) | 通过小波和非线性动力学预测实际波动率的***和方法 | |
US9330160B2 (en) | Software application complexity analysis | |
US20140249776A1 (en) | System and Method for Multivariate Outlier Detection | |
KR102091417B1 (ko) | 인공 지능에 기초하여 자산의 가격을 예측하는 장치, 방법 및 컴퓨터 프로그램 | |
WO2023000794A1 (zh) | 保护数据隐私的业务预测模型训练的方法及装置 | |
CN110335144B (zh) | 个人电子银行账户安全检测方法及装置 | |
Rodríguez-Rosa et al. | Are social, economic and environmental well-being equally important in all countries around the world? A study by income levels | |
CN110458644A (zh) | 一种信息处理方法及相关设备 | |
CN107169869A (zh) | 信息处理方法和信息处理装置 | |
CN109978675A (zh) | 一种税务监控方法和装置 | |
US20190228472A1 (en) | System and method for quantifiable categorization of candidates for asset allocation | |
CN116739794B (zh) | 基于大数据及机器学习的用户个性化方案推荐方法及*** | |
Mojaddady et al. | Stock market prediction using twin Gaussian process regression | |
CN109977977A (zh) | 一种识别***的方法及对应装置 | |
Ugurlu | Nowcasting credit demand in turkey with *** trends data | |
Gligor et al. | Cluster structure of EU-15 countries derived from the correlation matrix analysis of macroeconomic index fluctuations | |
US20210073652A1 (en) | Systems and methods for generating hash trees and using neural networks to process the same | |
CN114493224A (zh) | 企业可持续发展程度评价方法和装置 | |
Mwesigye et al. | Population pressure, rural-to-rural migration and evolution of land tenure institutions: The case of Uganda | |
CN116089809B (zh) | 金融特征数据的筛选方法、装置、电子设备及存储介质 | |
Thakore et al. | Financial Impact of Certified ISO 14001 Environment Management Systems in the UK and Ireland | |
CN114330536A (zh) | 任务质检方法、装置及计算机存储介质 | |
Basu et al. | The four seasons of commodity futures: Insights from topological data analysis | |
Bereznyatskiy et al. | Macroeconomic Relationships for Russian Economic Regions |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |