CN103559217B - 一种面向异构数据库的海量组播数据入库实现方法 - Google Patents

一种面向异构数据库的海量组播数据入库实现方法 Download PDF

Info

Publication number
CN103559217B
CN103559217B CN201310488096.6A CN201310488096A CN103559217B CN 103559217 B CN103559217 B CN 103559217B CN 201310488096 A CN201310488096 A CN 201310488096A CN 103559217 B CN103559217 B CN 103559217B
Authority
CN
China
Prior art keywords
warehouse
data
data file
model
file
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
CN201310488096.6A
Other languages
English (en)
Other versions
CN103559217A (zh
Inventor
刘平原
高世伟
吕江花
马世龙
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beihang University
Original Assignee
Beihang University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beihang University filed Critical Beihang University
Priority to CN201310488096.6A priority Critical patent/CN103559217B/zh
Publication of CN103559217A publication Critical patent/CN103559217A/zh
Application granted granted Critical
Publication of CN103559217B publication Critical patent/CN103559217B/zh
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/27Replication, distribution or synchronisation of data between databases or within a distributed database system; Distributed database system architectures therefor
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/23Updating
    • G06F16/2365Ensuring data consistency and integrity

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Databases & Information Systems (AREA)
  • Data Mining & Analysis (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Computer Security & Cryptography (AREA)
  • Computing Systems (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Data Exchanges In Wide-Area Networks (AREA)

Abstract

本发明提供了一种面向异构数据库的海量组播数据入库实现方法,按照一定周期和数量限定接收组播报文,将所需报文存入一个一级缓存数据文件中,以信号量触发对一级缓存数据文件的解析,将报文存入对应型号的二级缓存数据文件,对各型号建立对应的二级缓存数据文件存储目录及相关数据文件和控制文件;各型号入库线程根据信号量可同步触发入库操作,解析待入库二级缓存数据文件,将解析后的数据通过调用SQL*Loader和入库控制文件数据录入对应的数据库。本发明实现了海量组播数据实时、稳定地接收处理,实现了多目标数据库同步高效地入库,提升了实际应用中对海量组播数据的处理能力,保证了数据的完整性,提高了应用***的效能。

Description

一种面向异构数据库的海量组播数据入库实现方法
技术领域
本发明属于计算机数据采集领域,具体涉及一种面向异构数据库的海量组播数据入库实现方法。
背景技术
在大型***多型号批量并行测试时,面临任务重、型号多和大量重复测试等情况,测试产生的海量测试数据需要实时地接收并保存到各型号的数据库中,这种海量数据的处理具有实时性强、数据量大、数据格式复杂和入库压力大的特点。
通常组播数据的入库按数据缓存方式的不同,有基于共享缓冲区和基于数据文件两种入库方式。基于共享缓冲区的入库,一般采用“生产者-消费者”模型或其变型,“生产者”将接收到的组播数据存入缓冲内存,“消费者”访问共享内存,取出数据解析后存入数据库。基于数据文件的入库,采用多线程异步操作的方式完成报文接收、解析和入库,接收线程监听网络端口,接收组播报文,按一定周期将报文写入缓存数据文件,生成原始数据文件;解析线程解析原始数据文件,生成入库准备文件;入库线程使用SQL*Loader技术将入库准备文件录入数据库。
在大型***多型号批量并行测试中,数据库有多个且异构,在这种情况下以上两种入库方式各有不足:
第一种基于共享缓冲区的入库,存在的缺陷是:缓存大小不易确定,容易溢出,特别是在大数据量时,***极不稳定,无法保证数据的完整性和安全性;共享缓冲区的读写是同步操作,效率低;数据入库效率不如采用SQL*Loader时效率高,在数据库是多个且异构的情况下,无法保证入库速率。
第二种基于数据文件的入库方式,虽然能保证数据的接收效率、稳定性和完整性,采用SQL*Loader技术录入数据,在入库效率也有所提升,但是在面对海量数据的解析和入库,特别是多个异构数据库的入库时,无法保证高效性。
发明内容
针对大型***多型号批量并行测试时,产生的海量组播数据需要录入多个异构数据库的情况,本发明提出一种面向异构数据库的海量组播数据入库实现方法。通过两级缓存数据文件对组播数据进行存储和分类,通过多线程入库的方式保证每个型号的数据的解析和入库都有专属入库线程完成,在提高了数据处理效率的同时,解决了多个异构数据库入库的问题。
本发明提供的一种面向异构数据库的海量组播数据入库实现方法,包括以下步骤:
步骤一:启动组播报文接收线程,开始接收组播报文;
步骤二:对接收到的组播报文首先进行完整性判断,如果不完整,继续接收;如果完整,则对报文的类型进行检验,如果不是所需要的类型,丢弃该报文,继续接收新的组播报文;如果是所需的报文,将报文存入当前待写入的一级缓存数据文件中;当接收组播报文的时间达到接收周期或接收的组播报文数量达到指定数量时,记录已完成接收的一级数据文件数,关闭并重命名当前待写入的一级缓存数据文件,同时生成新的待写入的一级缓存数据文件;
步骤三:判断是否有需要解析的一级缓存数据文件,若有,读取待解析一级缓存数据文件中的组播报文,开始预解析;否则,继续等待;
预解析的方法是:解析组播报文报头中的信息来源字段,获取报文所属的型号,判断该型号对应的信息是否已在型号队列中,如果不在型号队列中,则获取该型号的信息并添加到型号队列中,并创建该型号对应的二级缓存数据文件存储目录及相关数据文件和控制文件,将组播报文写入二级缓存数据文件,同时调用线程池,启动该型号入库线程;如果在型号队列中,则直接将组播报文写入对应二级缓存数据文件中;
当一个一级缓存数据文件预解析完成后,记录已完成解析的一级缓存数据文件数,关闭并重命名当前所有待写入二级缓存数据文件,更新型号队列中各型号对应的已完成保存二级缓存数据文件数,同时生成新的待写入二级缓存数据文件,等待下一次预解析时存储数据;
步骤四:各型号入库线程判断对应型号的已完成保存二级缓存数据文件数是否大于已入库二级缓存数据文件数,如果否,说明没有新的需要入库的数据,继续等待;如果是,根据已入库二级缓存数据文件数获取下一个待入库二级缓存数据文件,解析该二级缓存数据文件,将解析后的数据保存至对应型号的入库准备数据文件中,解析完成后,调用数据加载工具SQL*Loader和入库控制文件将入库准备数据文件中的数据录入对应数据库,同时更新型号队列中对应的已入库二级缓存数据文件数。
所述的步骤二中,当前待写入的一级缓存数据文件唯一且具有固定文件名;处于已完成写入状态的一级缓存数据文件的命名与已完成接收的一级缓存数据文件数相关。
所述的步骤三中,所述的型号的信息包括型号编号、对应的数据库用户名和密码、保存数据的表名、已完成保存二级缓存数据文件数以及已入库二级缓存数据文件数。所述的型号对应的相关数据文件和控制文件包括二级缓存数据文件、入库准备数据文件、入库控制文件和错误数据记录文件。
所述的步骤三中,根据已完成解析的一级缓存数据文件数获取下一个待解析一级缓存数据文件。在启动型号入库线程时,将该型号的信息作为参数传递给入库线程。
所述的入库控制文件,根据入库控制文件模版和对应型号的入库准备数据文件路径、数据表名和数据表中的属性名创建。
本发明的面向异构数据库的海量组播数据入库实现方法的优点在于:
(1)数据接收实时性:组播接收、组播报文预解析和入库操作异步工作,保证实时接受并保存组播报文;
(2)数据完整性:接收组播报文时的报文完整性判断保证单条报文的完整性,接收报文后直接将其存入一级缓存数据文件保证了数据接收的完整性;
(3)稳定性:以缓存文件的形式保存组播报文,而不是将其保存在内存中,屏蔽了内存管理的复杂性和可能出现的内存溢出等错误,增强了***的稳定性;
(4)屏蔽数据库异构性:根据异构数据库中数据表的不同结构,生成对应结构的入库准备数据文件,调用入库控制文件模版自动生成对应入库控制文件,实现了针对异构数据库的统一入库;
(5)数据入库高效性:采用多线程技术,使每一个型号都有专属入库线程进行数据解析和入库,同时采用SQL*Loader技术,保证了***入库的高效性。
附图说明
图1为实现本发明的面向异构数据库的海量组播数据入库实现方法的模块示意图;
图2为本发明的面向异构数据库的海量组播数据入库实现方法的流程图;
图3为本发明的面向异构数据库的海量组播数据入库实现方法的文件***示意图;
图4为本发明的面向异构数据库的海量组播数据入库实现方法中入库控制文件模板格式图。
具体实施方式
下文中将参考附图并结合实施例来详细说明本发明的技术方案。
本发明提出的面向异构数据库的海量组播数据入库实现方法,通过按照一定周期或数量限制接收组播数据,将数据分列缓存至一级缓存数据文件,并以信号量触发方式完成对一级缓存数据文件的预解析,根据目录索引分型号将数据缓存至二级缓存数据文件,运用线程池技术定制专属入库线程,以信号量触发方式完成对二级缓存数据文件的解析和入库,实现了海量组播数据实时稳定接收和保存。通过预解析将一级缓存数据文件按型号拆分成多个二级缓存数据文件,大大减轻报文解析的负担。使用多线程使型号、入库线程和数据库之间一一对应,避免了入库线程在数据库间频繁切换的问题,保证了***的稳定性和高效性。
如图1所示,本发明提供的一种面向异构数据库的海量组播数据入库实现方法,其所应用的软件***,包含组播接收模块1、组播报文预解析模块2和入库模块3。
组播接收模块1主要功能包括组播报文接收与过滤和组播报文保存。
组播报文接收与过滤:监听组播接收端口,对接收到的组包报文的类型进行鉴别,过滤掉不需要的报文。
组播报文保存:将所需报文保存到一级缓存数据文件。组播接收模块1按接收周期或接收组播数划分一级缓存数据文件,且当前处于写入状态的一级缓存数据文件具有固定文件名,处于已完成写入状态的一级缓存数据文件的命名与已完成接收的一级缓存数据文件数相关。
组播报文预解析模块2主要功能包括组播报文预解析与分发和型号队列管理。
组播报文预解析与分发:读取一级缓存数据文件中的组播报文,根据组播报文来源型号的不同将报文分别保存到各型号对应的二级缓存数据文件中。
型号队列管理:型号队列保存所有组播报文来源型号的信息,包括型号编号、对应数据库的用户名和密码、保存数据的表名、数据表属性、已完成保存二级数据文件数和已入库二级数据文件数,型号队列管理的主要功能是型号信息的查询、保存和删除,为入库模块3提供必要的数据支撑。
入库模块3的主要功能包括入库线程管理、组播报文解析、入库控制文件构造和SQL*Loader入库。
入库线程管理:维护入库线程池,控制入库线程创建、启动、挂起、恢复和回收。
组播报文解析:读取二级缓存数据文件,解析组播报文。
入库控制文件构造:调用入库控制文件模版,创建型号对应入库控制文件,根据型号队列中的信息,构造入库控制文件。
SQL*Loader入库:调用SQL*Loader和入库控制文件,将数据录入对应数据库。
结合图1和图2,对本发明的面向异构数据库的海量组播数据入库实现方法进行说明。
步骤一:启动组播报文接收线程,开始接收组播报文。入库程序读取配置信息,初始化组播接收模块1、组播报文预解析模块2和入库模块3,组播接收模块1启动组播报文接收线程,开始接收组播报文。本发明实施例中的数据组播通讯机制为UDP组播通信。所述的配置信息包括组播地址及端口、数据库地址、端口及SID(SecurityIdentifiers,安全标识符)。
步骤二:组播接收模块1监听网络端口,接收组播报文。首先进行完整性判断,如果组播报文不完整,则继续接收,直到接收完整;如果组播报文完整,则对接收到的组播报文的类型进行检验,如果不是所需要的类型,则丢弃报文,继续接收新的报文;如果是所需的报文,则将报文信息保存到当前指定的一级缓存数据文件中;当接收组播报文的时间达到接收周期或接收的组播报文数量达到指定数量,则关闭当前一级缓存数据文件,并按既定规则重命名该一级缓存数据文件,并记录已完成接收的一级数据文件数,同时生成新的一级缓存数据文件,等待新接收的组播报文数据的写入。
如图3所示,本发明中的文件目录分为两级,一级缓存数据文件属于一级目录下的文件。一级缓存数据文件按状态分为两类:
a)第一类是正在接收组播报文写入的缓存文件:在第一次有组播报文需要写入缓存文件时,由***自动生成,当组播报文接收周期或数量达到设定值时关闭;此类数据缓冲文件具有固定文件名,且唯一;
b)第二类是已完成数据写入的缓存文件:此类一级缓存数据文件在第一类一级缓存数据文件关闭时,根据已完成接收的一级数据文件数和既定命名规范重命名后产生,同时生成新的第一类一级缓存数据文件。
所述接收的组播报文包括报头和信息体。报头主要包括长度、型号编号、时间、信息类型、信息来源和信息目的等字段。
长度字段表示除长度字段外报文的长度,为无符号二进制数,占2个字节,低字节在前,高字节在后。
型号编号字段用于标识信息所属型号,占8字节。
时间字段用于表示该信息的产生时间,精确到0.1ms,无符号二进制数,占6个字节,各字节定义如下:
1-2字节用于表示基于2010年1月1日的积日,无符号整型,低字节在前;
3-6字节用于表示当日累计的0.1ms数,无符号短整型,低字节在前。
信息类型字段用于标识组播报文的类型和功能,占4个字节,用ASCII字符串表示。
信息来源字段用于标识组播报文的原始产生者,占3个字节。
信息目的字段用于标识组播报文的发送目的地,占3个字节。
信息体是一个变长的数据结构,为组播报文的具体内容,可由ASCII字符组成也可由二进制数组成,格式由报头中的信息类型确定。
步骤三:判断是否有待解析的一级缓存数据文件,若有,则预解析一级缓存数据文件,否则,继续等待。
组播报文预解析模块2判断步骤二中的已完成接收的一级缓存数据文件数是否大于已完成解析的一级缓存数据文件数,如果二者相等,说明没有新的需要处理的数据,继续等待;如果前者大于后者,则根据已完成解析的一级缓存数据文件数获取下一个待解析一级缓存数据文件,读取组播报文数据,开始预解析。预解析时,仅解析报头中的信息来源字段,获得产生该报文的型号,查询数据库获取该型号相关的数据库信息和数据表信息。
组播报文预解析模块2对第二类一级缓存数据文件进行预解析,按信息来源型号将报文分发并保存至各型号对应的二级缓存数据文件中。
组播报文预解析模块2解析组播报文报头中的信息来源字段,获取报文所属的型号,判断该型号的信息是否已在型号队列中,如果不在型号队列中,则获取该型号的信息并添加到型号队列中,创建该型号对应的二级缓存数据文件存储目录及相关数据文件和控制文件,将组播报文写入二级缓存数据文件,同时调用线程池,启动该型号入库线程;如果在型号队列中,则直接将组播报文写入该型号对应的二级缓存数据文件中。
所述的型号的信息包括型号编号、对应的数据库用户名和密码、保存数据的表名、已完成保存二级缓存数据文件数以及已入库二级缓存数据文件数。
所述的型号对应的相关数据文件和控制文件包括二级缓存数据文件、入库准备数据文件、入库控制文件和错误数据记录文件。
在启动型号入库线程时,将该型号信息作为参数传递给入库线程。
当一个一级缓存数据文件预解析完成后,记录已完成解析的一级缓存数据文件数,关闭所有当前待写入二级缓存数据文件,并按既定规则重命名二级缓存数据文件,更新型号队列中对应的已完成保存二级缓存数据文件数,同时生成新的二级缓存数据文件,等待下一次预解析时存储数据。
如图3所示,二级缓存数据文件属于文件目录中的数据文件,二级目录即是型号目录,型号队列中的每一个型号对应一个二级目录。二级目录包含对应型号的二级缓存数据文件、入库准备数据文件、入库控制文件和错误数据记录文件。
以某型号为例,二级缓存数据文件按状态分为两类:
a)第一类正在写入组播报文的缓存文件:此类二级缓存数据文件对应一个正在预解析的一级缓存数据文件,在创建该型号目录时,由***自动生成,当一级缓存数据文件预解析完毕后关闭,此类数据文件具有固定文件名,且唯一;
b)第二类是已完成数据写入的缓存文件:此类二级缓存数据文件是当第一类二级缓存数据文件关闭时,根据已完成接收的二级数据文件数和既定命名规范重命名后产生,同时生成新的第一类二级缓存数据文件。
步骤四:入库模块3对第二类二级缓存数据文件进行解析,并将解析后的数据保存到对应型号的入库准备数据文件中,调用数据加载工具SQL*Loader方法和入库控制文件,将入库准备数据文件中的数据录入型号对应的数据库。
各型号入库线程判断对应型号的已完成保存二级缓存数据文件数是否大于已入库二级缓存数据文件数,如果否,说明没有新的需要入库的数据,继续等待;如果是,根据已入库二级缓存数据文件数获取下一个待入库二级缓存数据文件,解析该二级缓存数据文件,将解析后的数据保存至对应型号的入库准备数据文件中,解析完成后,调用SQL*Loader和入库控制文件将入库准备数据文件中的数据录入对应数据库,同时更新型号队列中对应型号的已入库二级缓存数据文件数。采用多线程技术管理入库线程,使每一个型号都有专属入库线程进行数据解析和入库。
入库准备数据文件、错误数据记录文件和入库控制文件同属文件***中第二级目录下的文件,如图3所示。入库准备数据文件的格式与对应型号的数据库中的数据表结构一一对应,入库控制文件通过调用入库控制文件模版,根据对应型号的数据库的信息和具体数据表结构而创建,从而实现异构数据库的入库。
入库准备数据文件在创建该型号的二级缓存数据文件存储目录时,由***自动生成,根据对应数据库中数据表的格式,将解析出的数据写入入库准备数据文件,文件为csv格式,当该入库数据准备文件中的数据入库完成后,清空该文件;此类数据文件具有固定文件名,且在型号的二级缓存数据文件存储目录下唯一。
错误数据记录文件在创建该型号的二级缓存数据文件存储目录时,由***自动生成,当调用SQL*Loader将数据录入数据库时,如果出现错误数据,则将该数据写入错误数据记录文件。
入库控制文件在创建该型号的二级缓存数据文件存储目录时,根据入库控制文件模板和型号队列中对应型号的数据库相关信息,由***自动生成。
入库控制文件模版属于文件***中第一级目录下的文件,入库控制文件模版如图4所示,其中“$file_path$”、“$table_name$”和“$table_element$”分别代表待录入数据库的入库准备数据文件路径、数据表名和数据表中的属性名,在入库控制文件模版被调用生成具体的入库控制文件时,“$file_path$”、“$table_name$”和“$table_element$”将对应的被替换为实际值。

Claims (9)

1.一种面向异构数据库的海量组播数据入库实现方法,其特征在于,包括以下步骤:
步骤一:启动组播报文接收线程,开始接收组播报文;
步骤二:对接收到的组播报文首先进行完整性判断,如果不完整,则继续接收;如果完整,则对报文的类型进行检验,如果不是所需要的类型,丢弃该报文,继续接收新的组播报文;如果是所需的报文,将报文存入当前待写入的一级缓存数据文件中;当接收组播报文的时间达到接收周期或接收的组播报文数量达到指定数量时,记录已完成接收的一级缓存数据文件数,关闭并重命名当前待写入的一级缓存数据文件,同时生成新的待写入的一级缓存数据文件;
步骤三:判断是否有需要解析的一级缓存数据文件,若有,读取待解析一级缓存数据文件中的组播报文,开始预解析;否则,继续等待;
预解析的方法是:解析组播报文报头中的信息来源字段,获取报文所属的型号,判断该型号的信息是否已在型号队列中,如果不在型号队列中,则获取该型号的信息并添加到型号队列中,并创建该型号对应的二级缓存数据文件存储目录及相关数据文件和控制文件,将组播报文写入二级缓存数据文件中,同时调用线程池,启动该型号入库线程;如果在型号队列中,直接将组播报文写入对应型号的二级缓存数据文件中;所述的型号对应的相关数据文件和控制文件包括:二级缓存数据文件、入库准备数据文件、入库控制文件和错误数据记录文件;
当一个一级缓存数据文件预解析完成后,记录已完成解析的一级缓存数据文件数,关闭并重命名当前所有待写入二级缓存数据文件,更新型号队列中各型号对应的已完成保存二级缓存数据文件数,同时生成新的待写入二级缓存数据文件;
步骤四:各型号入库线程判断对应型号的已完成保存二级缓存数据文件数是否大于已入库二级缓存数据文件数,如果否,说明没有新的需要入库的数据,继续等待;如果是,根据已入库二级缓存数据文件数获取下一个待入库二级缓存数据文件,解析该待入库二级缓存数据文件,将解析后的数据保存至对应型号的入库准备数据文件中,解析完成后,调用数据加载工具SQL*Loader和入库控制文件将入库准备数据文件中的数据录入对应数据库,同时更新型号队列中对应型号的已入库二级缓存数据文件数。
2.根据权利要求1所述的一种面向异构数据库的海量组播数据入库实现方法,其特征在于,所述的步骤二中,当前待写入的一级缓存数据文件唯一且具有固定文件名,处于已完成写入状态的一级缓存数据文件的命名与已完成接收的一级缓存数据文件数相关。
3.根据权利要求1所述的一种面向异构数据库的海量组播数据入库实现方法,其特征在于,步骤二中所述的组播报文,包括报头和信息体;报头包括长度、型号编号、时间、信息类型、信息来源和信息目的字段;
报头的长度字段表示除长度字段外报文的长度,为无符号二进制数,占2个字节,低字节在前,高字节在后;
型号编号字段用于标识报文所属型号,占8个字节;
时间字段用于表示报文的产生时间,精确到0.1ms,为无符号二进制数,占6个字节,各字节定义如下:
1-2字节用于表示基于2010年1月1日的积日,为无符号整型,低字节在前;
3-6字节用于表示当日累计的0.1ms数,为无符号短整型,低字节在前;
信息类型字段用于标识报文的类型和功能,占4个字节,用ASCII字符串表示;
信息来源字段用于标识报文的原始产生者,占3个字节;
信息目的字段用于标识报文的发送目的地,占3个字节;
信息体是一个变长的数据结构,为报文的具体内容,由ASCII字符或二进制数组成,格式由报头中的信息类型确定。
4.根据权利要求1所述的一种面向异构数据库的海量组播数据入库实现方法,其特征在于,步骤三中所述的型号的信息包括型号编号、对应的数据库用户名和密码、保存数据的表名、已完成保存二级缓存数据文件数以及已入库二级缓存数据文件数。
5.根据权利要求1所述的一种面向异构数据库的海量组播数据入库实现方法,其特征在于,所述的步骤三,根据已完成解析的一级缓存数据文件数获取下一个待解析一级缓存数据文件。
6.根据权利要求1所述的一种面向异构数据库的海量组播数据入库实现方法,其特征在于,步骤三中所述的启动型号入库线程时,将该型号的信息作为参数传递给入库线程。
7.根据权利要求1所述的一种面向异构数据库的海量组播数据入库实现方法,其特征在于,步骤三和步骤四中所述的入库准备数据文件,该文件的格式与对应型号的数据库中的数据表结构一一对应,且各型号对应的入库准备数据文件唯一,并具有固定文件名。
8.根据权利要求1所述的一种面向异构数据库的海量组播数据入库实现方法,其特征在于,步骤三中所述的错误数据记录文件,在调用SQL*Loader将数据录入数据库出现错误数据时,将错误数据写入。
9.根据权利要求1所述的一种面向异构数据库的海量组播数据入库实现方法,其特征在于,步骤三和步骤四中所述的入库控制文件,根据入库控制文件模版和对应型号的入库准备数据文件路径、数据表名和数据表中的属性名创建。
CN201310488096.6A 2013-10-17 2013-10-17 一种面向异构数据库的海量组播数据入库实现方法 Expired - Fee Related CN103559217B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201310488096.6A CN103559217B (zh) 2013-10-17 2013-10-17 一种面向异构数据库的海量组播数据入库实现方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201310488096.6A CN103559217B (zh) 2013-10-17 2013-10-17 一种面向异构数据库的海量组播数据入库实现方法

Publications (2)

Publication Number Publication Date
CN103559217A CN103559217A (zh) 2014-02-05
CN103559217B true CN103559217B (zh) 2016-06-01

Family

ID=50013464

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201310488096.6A Expired - Fee Related CN103559217B (zh) 2013-10-17 2013-10-17 一种面向异构数据库的海量组播数据入库实现方法

Country Status (1)

Country Link
CN (1) CN103559217B (zh)

Families Citing this family (23)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104834635A (zh) * 2014-02-07 2015-08-12 ***通信集团广东有限公司 一种数据处理方法和装置
CN104077368A (zh) * 2014-06-18 2014-10-01 国电南瑞科技股份有限公司 一种调度监控***历史数据两级缓存多阶段提交方法
CN105808534B (zh) * 2014-12-27 2019-06-11 株洲中车时代电气股份有限公司 一种异构数据融合文件中提取原始数据的方法
CN104657462B (zh) * 2015-02-10 2017-12-22 北京宇航***工程研究所 一种海量测量数据准实时入库方法
CN104750814B (zh) * 2015-03-30 2019-03-05 大连理工大学 基于多传感器的多元异构数据流自动入库方法
CN105468705A (zh) * 2015-11-18 2016-04-06 广东南方通信建设有限公司 一种移动通信后台数据文件导入方法
CN105808778B (zh) * 2016-03-30 2019-04-26 中国银行股份有限公司 一种海量数据抽取、转换、加载方法及装置
CN106230916A (zh) * 2016-07-26 2016-12-14 深圳市乐唯科技开发有限公司 一种防用户界面卡死的数据接收及管理方法
CN107204939A (zh) * 2017-05-27 2017-09-26 南京南瑞继保电气有限公司 一种基于两级缓存的报文处理方法
CN107798138A (zh) * 2017-11-23 2018-03-13 广东电网有限责任公司电力科学研究院 一种实时数据装载方法及装置
CN108595511B (zh) * 2018-03-23 2022-04-01 中国人民解放军91977部队 一种多样化气象水文数据分类存储处理方法和***
CN109033289A (zh) * 2018-07-13 2018-12-18 天津瑞能电气有限公司 一种用于微电网的高频实时数据的存库方法
CN109657413B (zh) * 2019-01-23 2023-05-23 中国人民解放军国防科技大学 仿真组件模型入库方法、模型库、计算机设备和存储介质
CN112822090B (zh) * 2019-11-15 2023-03-31 北京新媒传信科技有限公司 一种适用于移动终端的即时通信工具的通信方法、装置和***
CN111221829A (zh) * 2019-11-15 2020-06-02 浙江鸿程计算机***有限公司 一种应对关系数据库入库瓶颈问题的处理方法
CN111245891A (zh) * 2019-12-27 2020-06-05 特瓦特能源科技有限公司 一种数据实时展示方法及装置
CN112328542A (zh) * 2020-11-25 2021-02-05 天津凯发电气股份有限公司 一种把异构数据文件中的数据导入到数据库的方法
CN112785284A (zh) * 2020-12-31 2021-05-11 银清科技有限公司 基于结构化文档的报文入库方法及装置
CN112764908B (zh) * 2021-01-26 2024-01-26 北京鼎普科技股份有限公司 网络数据采集处理方法、装置和电子设备
CN113032295B (zh) * 2021-02-25 2022-08-16 西安电子科技大学 一种数据包二级缓存方法、***及应用
CN113127551A (zh) * 2021-04-25 2021-07-16 在秀网络科技(深圳)有限公司 一种取代前端设备的数据承载平台数据调取方法及***
CN114422624B (zh) * 2022-01-25 2024-05-17 电信科学技术第五研究所有限公司 数据接收方法
CN116662037B (zh) * 2023-07-24 2023-10-20 杭州鉴智机器人科技有限公司 一种共享内存的处理方法、装置、电子设备及存储介质

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101277272A (zh) * 2008-05-16 2008-10-01 北京航空航天大学 一种海量广播数据入库的实现方法
CN102750377A (zh) * 2012-06-21 2012-10-24 深圳市谷米科技有限公司 海量数据存储和检索方法
CN102891873A (zh) * 2011-07-21 2013-01-23 腾讯科技(深圳)有限公司 一种存储日志数据的方法及日志数据存储***
CN102929951A (zh) * 2012-10-08 2013-02-13 深圳市博瑞得科技有限公司 一种数据绑定批量入库方法和装置
CN103237059A (zh) * 2013-04-02 2013-08-07 西安翔迅科技有限责任公司 交通信息数据与命令交互方法

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101350745B (zh) * 2008-08-15 2011-08-03 北京启明星辰信息技术股份有限公司 一种入侵检测方法及装置

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101277272A (zh) * 2008-05-16 2008-10-01 北京航空航天大学 一种海量广播数据入库的实现方法
CN102891873A (zh) * 2011-07-21 2013-01-23 腾讯科技(深圳)有限公司 一种存储日志数据的方法及日志数据存储***
CN102750377A (zh) * 2012-06-21 2012-10-24 深圳市谷米科技有限公司 海量数据存储和检索方法
CN102929951A (zh) * 2012-10-08 2013-02-13 深圳市博瑞得科技有限公司 一种数据绑定批量入库方法和装置
CN103237059A (zh) * 2013-04-02 2013-08-07 西安翔迅科技有限责任公司 交通信息数据与命令交互方法

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
航天器测试信息***数据资源管理平台的设计与实现;陈蔚文,马世龙;《2007中国控制与决策学术年会论文集》;20071231;第894-896+900页 *
面向航天器自动化测试的通用测试语言及***关键技术研究与应用;马世龙 等;《中国科技成果》;20121231(第13期);第62-63页 *

Also Published As

Publication number Publication date
CN103559217A (zh) 2014-02-05

Similar Documents

Publication Publication Date Title
CN103559217B (zh) 一种面向异构数据库的海量组播数据入库实现方法
CN108536761B (zh) 报表数据查询方法及服务器
CN104699718B (zh) 用于快速引入业务数据的方法和装置
CN103064933B (zh) 数据查询方法及***
CN107145537B (zh) 一种表格数据导入方法及***
US20130191523A1 (en) Real-time analytics for large data sets
CN103235820B (zh) 一种集群***中数据存储方法与装置
US20140046928A1 (en) Query plans with parameter markers in place of object identifiers
CN104572122A (zh) 一种软件应用数据的生成装置及方法
CN104573065A (zh) 一种基于元数据的报表展示引擎
CN103294710A (zh) 一种数据存取方法和装置
TW201800967A (zh) 分布式流式資料處理的方法和裝置
US11625412B2 (en) Storing data items and identifying stored data items
CN101277272A (zh) 一种海量广播数据入库的实现方法
CN104077420A (zh) 一种数据导入HBase数据库的方法和装置
CN111367975A (zh) 一种多协议数据转换处理方法及装置
CN114218218A (zh) 基于数据仓库的数据处理方法、装置、设备及存储介质
CN114328759A (zh) 一种数据仓库的数据构建与管理方法及终端
WO2024011829A1 (zh) 一种基于时空体系的综合智能平台数据管理方法及***
CN109344137A (zh) 一种日志存储方法及***
WO2017000592A1 (zh) 数据处理方法、装置及***
CN103440302B (zh) 实时数据交换的方法和***
CN106919607B (zh) 一种数据访问方法、装置及***
CN102685222B (zh) 一种用于电力***的云存储资源管理装置
CN111259082B (zh) 大数据环境下实现全量数据同步的方法

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
C14 Grant of patent or utility model
GR01 Patent grant
CF01 Termination of patent right due to non-payment of annual fee

Granted publication date: 20160601

Termination date: 20201017

CF01 Termination of patent right due to non-payment of annual fee