CN110502497A - 一种电子***数据组织查询方法及*** - Google Patents
一种电子***数据组织查询方法及*** Download PDFInfo
- Publication number
- CN110502497A CN110502497A CN201910685577.3A CN201910685577A CN110502497A CN 110502497 A CN110502497 A CN 110502497A CN 201910685577 A CN201910685577 A CN 201910685577A CN 110502497 A CN110502497 A CN 110502497A
- Authority
- CN
- China
- Prior art keywords
- data
- module
- electronic invoice
- hoc queries
- invoice
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/10—File systems; File servers
- G06F16/13—File access structures, e.g. distributed indices
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/10—File systems; File servers
- G06F16/14—Details of searching files based on file metadata
- G06F16/148—File search processing
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/10—File systems; File servers
- G06F16/18—File system types
- G06F16/182—Distributed file systems
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Data Mining & Analysis (AREA)
- Databases & Information Systems (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Library & Information Science (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
本发明属于电子商务领域,具体涉及一种电子***数据组织查询方法,包括存储电子***数据、数据划分、对应存储、查询请求、获得结果五个步骤;一种电子***数据组织查询的***,包括HDFS数据库,所述数据源信号连接数据分析处理模块,所述数据分析处理模块信号连接数据存储模块,所述数据存储模块信号连接查询模块,所述查询模块包括关键词输入模块和数据处理模块,所述关键词输入模块信号连接数据处理模块,所述查询模块信号连接数据采集模块;本发明有效地解决了传统电子***数据的查询响应速度慢、开票效率低、容易影响客户体验、会给企业造成不必要损失以及会有税务风险的问题。
Description
技术领域
本发明属于电子商务领域,具体涉及一种电子***数据组织查询方法及***。
背景技术
电子***是信息时代的产物,同普通***一样,采用税务局统一发放的形式给商家使用,***号码采用全国统一编码,采用统一防伪技术,分配给商家,在电子***上附有电子税局的签名机制。
简单来说,***就是发生的成本、费用或收入的原始凭证。对于公司来讲,***主要是公司做账的依据,同时也是缴税的费用凭证;而对于员工来讲,***主要是用来报销的。
目前,电子***数据的存储和查询都是基于传统的关系型数据库,虽然能满足一般的开具***、查询***的业务需求,但是由于传统关系型数据库单表存储海量数据时,查询响应速度慢,高并发查询条件下很容易造成服务宕机,会影响开票效率,降低客户服务体验,给企业造成不必要的损失,而且会有税务风险。
发明内容
针对现有技术的不足,本发明公开了一种电子***数据组织查询方法及***,用于解决传统电子***数据的查询响应速度慢、开票效率低、容易影响客户体验、会给企业造成不必要损失以及会有税务风险的问题。
为实现以上目的,本发明通过以下技术方案予以实现:
一种电子***数据组织查询方法,包括以下步骤:
(1)存储电子***数据:将所有的电子***的信息存储在HDFS 数据库中;
(2)数据划分:HDFS数据库依照预存的单元结构和关键词对电子***中的数据进行划分;
(3)对应存储:将划分后的数据存入数据存储模块中;
(4)查询请求:接受电子***查询请求;
(5)获得结果:根据查询关键词获得对应电子***全部信息。
进一步的,所述步骤(1)中HDFS是一个分布式文件***,有高容错性的特点,并且设计用来部署在低廉的硬件上,而且它提供高吞吐量来访问应用程序的数据,适合用于有超大数据集的应用程序。
进一步的,所述步骤(2)中关键词和部分预存的结构单元相对应,其余预存结构单元用于存储其它信息,关键词包括***号码、购买方名称、购买方纳税人识别号、购买方地址电话,其它信息为除关键词之外的电子***的剩余信息。
进一步的,所述数据存储模块为HDFS组成的模块,拥有超大的数据容量,能够存储PB级数据。
进一步的,所述步骤(5)电子***全部信息包括***代码、***号码、开票日期、校验码、机器编号、购买方名称、购买方纳税人识别号、购买方地址电话、购买方开户行及账号货物或应税劳务服务名称、***金额、***税额、价税合计、销售方名称、销售方纳税人识别号、销售方地址电话、销售方开户行及账号。
一种电子***数据组织查询***,其特征在于,包括HDFS数据库,所述HDFS数据库信号连接数据分析处理模块,所述数据分析处理模块信号连接数据存储模块,所述数据存储模块信号连接查询模块,所述查询模块信号连接数据采集模块。
进一步的,所述电子***查询***是基于Hadoop***框架建立的。
进一步的,所述数据分析处理模块包括数据分析单元、结构单元和索引单元,所述结构单元信号连接数据分析单元,所述数据分析单元信号连接索引单元,所述数据分析单元根据结构单元提供的关键词将电子***的数据划分到不同的索引单元中。
进一步的,所述查询模块包括关键词输入模块和数据处理模块,所述关键词输入模块信号连接数据处理模块,输入关键词后通过数据处理模块对数据存储模块存储数据进行处理,能够迅速将相应结果查询出来。
进一步的,所述数据处理模块包括查询请求单元,所述查询请求单元信号连接数据处理单元,查询请求单元接受到关键词查询请求后给数据处理单元发送数据处理信号,数据处理单元接收到信号后对 HDFS数据库中数据进行处理;所述数据处理模块采用MapReduce编程模型,MapReduce是一种用于并行处理大数据集的软件框架,因为其采用并行的工作方式,因此能够大大提高数据处理效率。
进一步的,所述数据采集模块能够将查询***查询到的信息采集出来,供使用者查阅。
本发明具有如下有益效果:
1.采用Hadoop***框架,拥有超大的数据容量,能够存储PB级数据,同时采用并行工作方式,能够快速查询信息。
2.加快企业开票速度,提升企业开票服务体验,降低税务风险,避免损失。
附图说明
为了更清楚地说明本发明的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1为发明的工作流程图;
图2为一种电子***数据组织查询***结构图;
图3为数据分析处理模块结构图;
图4为查询模块结构图;
图5为数据处理模块结构图。
图中标号分别代表:
1-HDFS数据库,2-数据分析处理模块,3-数据存储模块,4-查询模块,5-数据采集模块,201-结构单元,202-数据分析单元,203-索引单元,401-关键词输入模块,402-数据处理模块,4021-查询请求单元, 4022-数据处理单元。
具体实施方式
为使本发明实施例的目的、技术方案和优点更加清楚,下面将结合本发明实施例,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
实施例1:
一种电子***数据组织查询的方法:
查询请求:接受电子***查询请求,在关键词输入模块401输入关键词***号码。
将所有的电子***的信息存储在HDFS数据库中,依照预存的结构单元201和关键词,通过数据分析单元202将电子***中的数据划分到对应的索引单元203中,然后将数据存入数据存储模块3,使用者在关键词输入模块401输入关键词***号码,数据处理模块402根据输入的***号码对数据存储模块3进行数据分析,数据采集模块5对分析出的数据进行采集,供使用者查阅。
实施例2:
一种电子***数据组织查询的方法:
查询请求:接受电子***查询请求,在关键词输入模块401输入关键词购买方纳税人识别号。
将所有的电子***的信息存储在HDFS数据库中,依照预存的结构单元201和关键词,通过数据分析单元202将电子***中的数据划分到对应的索引单元203中,然后将数据存入数据存储模块3,使用者在关键词输入模块401输入关键词购买方纳税人识别号,数据处理模块402根据输入的购买方纳税人识别号对数据存储模块3进行数据分析,数据采集模块5对分析出的数据进行采集,供使用者查阅。
实施例3:
一种电子***数据组织查询的方法:
查询请求:接受电子***查询请求,在关键词输入模块401输入关键词购买方地址电话。
将所有的电子***的信息存储在HDFS数据库中,依照预存的结构单元201和关键词,通过数据分析单元202将电子***中的数据划分到对应的索引单元203中,然后将数据存入数据存储模块3,使用者在关键词输入模块401输入关键词购买方地址电话,数据处理模块402 根据购买方地址电话对数据存储模块3进行数据分析,数据采集模块5 对分析出的数据进行采集,供使用者查阅。
需要说明的是,在本文中,诸如第一和第二等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来,而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括所述要素的过程、方法、物品或者设备中还存在另外的相同要素。
以上实施例仅用以说明本发明的技术方案,而非对其限制;尽管参照前述实施例对本发明进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本发明各实施例技术方案的精神和范围。
Claims (9)
1.一种电子***数据组织查询方法,其特征在于,包括以下步骤:
(1)存储电子***数据:将所有的电子***的信息存储在数据存储模块HDFS数据库中;
(2)数据划分:HDFS数据库依照预存的结构单元和关键词对电子***中的数据进行划分;
(3)对应存储:将划分后的数据存入数据存储模块中;
(4)查询请求:接受电子***查询请求;
(5)获得结果:根据查询关键词获得对应电子***全部信息。
2.根据权利要求1所述的一种获取电子***抬头信息的方法,其特征在于:所述步骤(2)中结构单元是根据电子***具有的数据信息划分的单元。
3.根据权利要求1所述的一种获取电子***抬头信息的方法,其特征在于:所述步骤(2)中关键词为***号码、购买方名称、购买方纳税人识别号、购买方地址电话中的任意一个。
4.根据权利要求1所述的一种获取电子***抬头信息的方法,其特征在于:所述步骤(3)中数据存储模块为HDFS组成的,有巨大存储容量的模块。
5.一种电子***数据组织查询***,其特征在于,包括HDFS数据库、数据分析处理模块、数据存储模块、查询模块以及数据采集模块,所述HDFS数据库信号连接数据分析处理模块,所述数据分析处理模块信号连接数据存储模块,所述数据存储模块信号连接查询模块,所述查询模块信号连接数据采集模块。
6.根据权利要求5所述的一种电子***数据组织查询***,其特征在于:所述电子***查询***是基于Hadoop***框架建立的。
7.根据权利要求5所述的一种电子***数据组织查询***,其特征在于:所述数据分析处理模块包括结构单元、数据分析单元和索引单元,所述结构单元信号连接数据分析单元,所述数据分析单元信号连接索引单元。
8.根据权利要求5所述的一种电子***数据组织查询***,其特征在于:所述查询模块包括关键词输入模块和数据处理模块,所述关键词查询模块信号连接数据处理模块,所述数据处理模块采用MapReduce编程模型。
9.根据权利要求5所述的一种电子***数据组织查询***,其特征在于:所述数据处理模块包括查询请求单元、数据处理单元,所述查询请求单元信号连接数据处理单元。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201910685577.3A CN110502497A (zh) | 2019-07-27 | 2019-07-27 | 一种电子***数据组织查询方法及*** |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201910685577.3A CN110502497A (zh) | 2019-07-27 | 2019-07-27 | 一种电子***数据组织查询方法及*** |
Publications (1)
Publication Number | Publication Date |
---|---|
CN110502497A true CN110502497A (zh) | 2019-11-26 |
Family
ID=68587655
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201910685577.3A Pending CN110502497A (zh) | 2019-07-27 | 2019-07-27 | 一种电子***数据组织查询方法及*** |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN110502497A (zh) |
Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN104598587A (zh) * | 2015-01-19 | 2015-05-06 | 深圳市华成峰数据技术有限公司 | ***真伪查询方法和*** |
CN106777397A (zh) * | 2017-03-02 | 2017-05-31 | 百望电子***数据服务有限公司 | 一种电子***数据组织查询方法及*** |
CN107392684A (zh) * | 2017-07-25 | 2017-11-24 | 百望电子***数据服务有限公司 | 一种获取电子***抬头信息的方法及相关*** |
CN107870971A (zh) * | 2017-09-19 | 2018-04-03 | 大象慧云信息技术有限公司 | 一种基于指纹识别查询个人电子***的***及方法 |
CN109767274A (zh) * | 2018-12-05 | 2019-05-17 | 航天信息股份有限公司 | 一种对海量***数据进行关联存储的方法及*** |
-
2019
- 2019-07-27 CN CN201910685577.3A patent/CN110502497A/zh active Pending
Patent Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN104598587A (zh) * | 2015-01-19 | 2015-05-06 | 深圳市华成峰数据技术有限公司 | ***真伪查询方法和*** |
CN106777397A (zh) * | 2017-03-02 | 2017-05-31 | 百望电子***数据服务有限公司 | 一种电子***数据组织查询方法及*** |
CN107392684A (zh) * | 2017-07-25 | 2017-11-24 | 百望电子***数据服务有限公司 | 一种获取电子***抬头信息的方法及相关*** |
CN107870971A (zh) * | 2017-09-19 | 2018-04-03 | 大象慧云信息技术有限公司 | 一种基于指纹识别查询个人电子***的***及方法 |
CN109767274A (zh) * | 2018-12-05 | 2019-05-17 | 航天信息股份有限公司 | 一种对海量***数据进行关联存储的方法及*** |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN108257043B (zh) | 一种政务信息资源梳理及目录管理***和方法 | |
CN104933112B (zh) | 分布式互联网交易信息存储处理方法 | |
CN105164674A (zh) | 涉及多个数据库和执行引擎的查询 | |
CN102831122B (zh) | 工作流表的数据保存方法、查询方法及装置 | |
CN102262640A (zh) | 一种全文检索文档数据库的方法及装置 | |
JP2003500741A (ja) | 単一の集計プロセスで複数のデータマートを実装するための方法および装置 | |
CN103345484A (zh) | 基于动态域的报表处理***及方法 | |
US20100250563A1 (en) | Profiling in a massive parallel processing environment | |
CN108509437A (zh) | 一种ElasticSearch查询加速方法 | |
CN106777397A (zh) | 一种电子***数据组织查询方法及*** | |
CN101963993B (zh) | 一种数据库单表记录快速查找的方法 | |
Farooq et al. | Real-time data warehousing for business intelligence | |
CN102208061A (zh) | 数据核销处理装置和数据核销处理方法 | |
CN110134511A (zh) | 一种OpenTSDB共享存储优化方法 | |
CN110502529B (zh) | 数据处理方法、装置、服务器及存储介质 | |
CN101650734A (zh) | 一种表单过滤方法、装置、表单处理***及信息处理设备 | |
US8229946B1 (en) | Business rules application parallel processing system | |
CN110502497A (zh) | 一种电子***数据组织查询方法及*** | |
CN111125045A (zh) | 一种轻量级etl处理平台 | |
CN115982205A (zh) | 一种海量多元数据智能归集***及归集方法 | |
CN114090686A (zh) | 一种出账加速方法及装置 | |
CN112214536B (zh) | 一种企业账目数据实时导入管理*** | |
US8270612B2 (en) | Mapping compound keys | |
CN114265887A (zh) | 一种维度数据处理方法、装置、存储介质及电子设备 | |
CN110597899B (zh) | 项目经费管理方法及*** |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |