CN110909055A - 数据处理方法、装置、电子设备以及存储介质 - Google Patents

数据处理方法、装置、电子设备以及存储介质 Download PDF

Info

Publication number
CN110909055A
CN110909055A CN201911129851.5A CN201911129851A CN110909055A CN 110909055 A CN110909055 A CN 110909055A CN 201911129851 A CN201911129851 A CN 201911129851A CN 110909055 A CN110909055 A CN 110909055A
Authority
CN
China
Prior art keywords
file
abnormal
format conversion
processed
priority
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201911129851.5A
Other languages
English (en)
Inventor
余贤雷
单权强
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Zhongchang (hangzhou) Information Technology Co Ltd
China Mobile Communications Group Co Ltd
Original Assignee
Zhongchang (hangzhou) Information Technology Co Ltd
China Mobile Communications Group Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Zhongchang (hangzhou) Information Technology Co Ltd, China Mobile Communications Group Co Ltd filed Critical Zhongchang (hangzhou) Information Technology Co Ltd
Priority to CN201911129851.5A priority Critical patent/CN110909055A/zh
Publication of CN110909055A publication Critical patent/CN110909055A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/25Integrating or interfacing systems involving database management systems
    • G06F16/254Extract, transform and load [ETL] procedures, e.g. ETL data flows in data warehouses

Landscapes

  • Engineering & Computer Science (AREA)
  • Databases & Information Systems (AREA)
  • Theoretical Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明实施例涉及通信领域,公开了一种数据处理方法、装置、电子设备以及存储介质。本发明中的数据处理方法,用于对ETL过程中抽取的异常数据的处理,包括:获取待处理的异常数据,异常数据包括至少一个异常文件;确定异常数据中每个异常文件的优先级;选取优先级最高的异常文件作为目标文件,并对目标文件进行格式转换;若格式转换成功,则发送格式转换后得到的文件;若格式转换失败,则判断目标文件的已处理次数是否达到第一预设阈值,如果是,则丢弃目标文件,如果否,则更新目标文件的已处理次数并降低目标文件的优先级,使得ETL时对数据进行格式转换的效率提高、节省计算机硬件资源。

Description

数据处理方法、装置、电子设备以及存储介质
技术领域
本发明实施例涉及通信领域,特别涉及一种数据处理方法。
背景技术
ETL(ETL,Extraction-Transformation-Loading)是将业务***的数据经过抽取、格式转换之后加载到数据仓库的过程,目的是将企业中的分散、零乱、标准不统一的数据整合到一起,为企业的决策提供分析依据。
然而,发明人发现现有技术中至少存在如下问题:在对数据进行格式转换的过程中,对于转换失败的数据会进行多次重复处理,效率低、浪费计算机硬件资源。
发明内容
本发明实施方式的目的在于提供一种数据处理方法、装置、电子设备以及存储介质,使得ETL时对数据进行格式转换的效率提高、节省计算机硬件资源。
为解决上述技术问题,本发明的实施方式提供了一种数据处理方法,包括:获取待处理的异常数据,所述异常数据包括至少一个异常文件;确定所述异常数据中每个异常文件的优先级;选取优先级最高的异常文件作为目标文件,并对所述目标文件进行格式转换;若格式转换成功,则发送格式转换后得到的文件;若格式转换失败,则判断所述目标文件的已处理次数是否达到第一预设阈值,如果是,则丢弃所述目标文件,如果否,则更新所述目标文件的已处理次数并降低所述目标文件的优先级。
本发明的实施方式还提供了一种数据处理装置,包括:获取模块,用于获取待处理的异常数据,所述异常数据包括至少一个异常文件;确定模块,用于确定所述异常数据中每个异常文件的优先级;格式转换模块,用于选取优先级最高的异常文件作为目标文件,并对所述目标文件进行格式转换;发送模块,用于在格式转换成功时,发送格式转换后得到的文件;判断模块,用于在格式转换失败时,判断所述目标文件的已处理次数是否达到第一预设阈值,如果是,则丢弃所述目标文件,如果否,则更新所述目标文件的已处理次数并降低所述目标文件的优先级。
本发明的实施方式还提供了一种电子设备,包括:至少一个处理器;以及,与至少一个处理器通信连接的存储器;其中,存储器存储有可被至少一个处理器执行的指令,指令被至少一个处理器执行,以使至少一个处理器能够执行上述的数据处理方法。
本发明的实施方式还提供了一种计算机可读存储介质,存储有计算机程序,所述计算机程序被处理器执行时实现上述数据处理方法。
本发明实施方式相对于现有技术而言,数据处理过程中,确定异常数据中每个异常文件的优先级并根据优先级高低顺序对异常数据进行处理,并在每次处理失败后降低异常文件的优先级,通过滞后处理处理成功率低的异常文件,提高数据处理的效率;还对已处理次数达到预设阈值的异常文件进行丢弃,停止对处理成功率低于下限值的异常文件的资源投入,节省了计算机硬件资源。
另外,所述确定所述异常数据每个异常文件的优先级,包括:若所述异常文件未标记优先级,则根据所述异常文件的参数确定所述异常文件的优先级;若所述异常文件已标记优先级,则获取所述异常文件已标记的优先级。对于未标记优先级的异常文件,根据异常文件的参数设置异常文件的优先级,使得异常文件的优先级设置具备合理性。
另外,所述异常文件的参数包括:文件更新时间、文件大小和文件类型中的任意一者或任意组合。根据文件更新时间、文件大小或文件类型确定异常文件的优先级,使得设置的异常文件的优先级更具合理性。
另外,所述数据处理方法还包括:获取待处理文件,并对所述待处理文件进行格式转换;若格式转换成功,则发送格式转换后得到的文件;若格式转换失败,则根据判断所述目标的已处理次数是否达到第二预设阈值,如果是,则将所述待处理文件标记为所述待处理的异常数据,如果否,则更新所述待处理文件的已处理次数。如此设置,提供了进行ETL时对正常数据的处理方法,通过将正常数据中已处理次数达到阈值的文件归入异常数据,防止处理过程中因为重复处理转换失败的文件导致处理效率变低。
另外,所述发送格式转换后得到的文件,包括:通过虚拟文件***上的接收接口将所述格式转换后得到的文件发送至所述虚拟文件***,并由所述虚拟文件***的发送接口对所述格式转换后得到的文件进行发送;其中,所述接收接口与所述发送接口使用不同的通信协议。如此设置,通过虚拟文件***发送格式转换后得到的文件,并通过虚拟文件***上的接收接口和发送接口进行通信协议的切换,不用进行代码重写和补充,节省了人工成本。
另外,所述接收接口与所述发送接口使用不同的通信协议,包括:所述发送接口与所述接收接口使用不同的应用层协议。虚拟文件***支持对应用层协议进行切换,不用进行代码重写和补充,节省了人工成本。
另外,所述接收接口与所述发送接口使用不同的通信协议,包括:所述发送接口与所述接收接口使用不同的网络层协议。虚拟文件***支持对网络层协议进行切换,不用进行代码重写和补充,节省了人工成本。
附图说明
一个或多个实施例通过与之对应的附图中的图片进行示例性说明,这些示例性说明并不构成对实施例的限定。
图1是根据本发明第一实施方式的数据处理方法的流程示意图;
图2是根据本发明第二实施方式的数据处理方法的流程示意图;
图3是根据本发明第二实施方式的多线程执行多流水线的示意图;
图4是根据本发明第三实施方式的数据处理方法的流程示意图;
图5是根据本发明第四实施方式的数据处理装置的结构示意图;
图6是根据本发明第五实施方式的电子设备的结构示意图。
具体实施方式
为使本发明实施例的目的、技术方案和优点更加清楚,下面将结合附图对本发明的各实施方式进行详细的阐述。然而,本领域的普通技术人员可以理解,在本发明各实施方式中,为了使读者更好地理解本申请而提出了许多技术细节。但是,即使没有这些技术细节和基于以下各实施方式的种种变化和修改,也可以实现本申请所要求保护的技术方案。
在通信服务行业,给用户安装了网关或者机顶盒之后,为了更好的给用户提供服务,精准快速的解决用户的问题,通常会在用户的网关或者机顶盒中内置一个软探针插件用于收集网关或者机顶盒的运行状态信息,随后将这些运行状态信息上报至软探针平台,往往数据会有多个平台需要且为了减少传输压力,会对格式进行简化,如将JSON格式的数据转换成以“|”为分隔符的数据。通过软探针插件抽取数据,对数据进行格式转换以及将转换后的数据发送至软探针平台的整个过程就是一个ETL(ETL,Extraction-Transformation-Loading)的过程。
本发明的第一实施方式涉及一种数据处理方法,用于对ETL过程中抽取的异常数据的处理,本实施方式的核心在于获取待处理的异常数据,所述异常数据包括至少一个异常文件;确定所述异常数据中每个异常文件的优先级;选取优先级最高的异常文件作为目标文件,并对所述目标文件进行格式转换;若格式转换成功,则发送格式转换后得到的文件;若格式转换失败,则判断所述目标文件的已处理次数是否达到第一预设阈值,如果是,则丢弃所述目标文件,如果否,则更新所述目标文件的已处理次数并降低所述目标文件的优先级,使得ETL时对数据进行格式转换的效率提高、节省计算机硬件资源。下面对本实施方式的数据处理方法的实现细节进行具体的说明,以下内容仅为方便理解提供的实现细节,并非实施本方案的必须。
本实施方式中的数据处理方法的流程示意图如图1所示:
步骤101:获取待处理的异常数据,所述异常数据包括至少一个异常文件。
具体地说,待处理的异常数据一般为ETL过程中格式转换失败次数达到预设阈值(一般默认为1)的数据。
步骤102:确定所述异常数据中每个异常文件的优先级。
具体地说,确定所述异常数据每个异常文件的优先级,包括:若所述异常文件未标记优先级,则根据所述异常文件的参数确定所述异常文件的优先级;若所述异常文件已标记优先级,则获取所述异常文件已标记的优先级。
其中,异常文件的参数包括:文件更新时间、文件大小和文件类型中的任意一者或任意组合。
优选地,对于未标记优先级的异常文件,根据异常文件的文件更新时间确定其优先级。一般情况下,文件更新时间越早,距离当前时间越久的异常文件的优先级越高,并且在每次对异常文件处理后,更新其文件更新时间,其优先级也会随着文件更新时间的改变而改变。如此确定异常文件的优先级,可以优化调度性能。
步骤103:选取优先级最高的异常文件作为目标文件,并对所述目标文件进行格式转换。
具体地说,在本步骤中,将目标文件从JSON格式转换为软探针平台的定制格式,实际应用中,也可以对原格式是JSON格式以外的其他格式的目标文件进行格式转换,比如File、Zip、Jar、Tar和GZIP等格式。
步骤104:判断格式转换是否成功,如果是,进入步骤105,如果否,进入步骤106。
步骤105:发送格式转换后得到的文件。
具体地说,将格式转换后得到的文件发送至软探针平台。
步骤106:判断所述目标文件的已处理次数是否达到第一预设阈值,如果是,进入步骤107,如果否,进入步骤108。
步骤107:丢弃所述目标文件。
具体地说,对于已处理次数达到第一预设阈值的异常文件,进行丢弃(或者标记为不可处理文件),因为异常文件的已处理次数越多,即处理失败次数越多,代表该异常文件有问题的可能性越大,通过丢弃已处理次数达到阈值的异常文件,有利于减少对有问题文件的资源投入。
步骤108:更新所述目标文件的已处理次数并降低所述目标文件的优先级。
具体地说,因为异常文件的已处理次数越多代表该异常文件有问题的可能性越大,通过在每次处理失败后降低该异常文件的优先级,可以使得在步骤103中,优先获取到的是有问题的可能性比较小的异常文件,完成处理的成功率比较高,通过这样可以提高处理的效率。
需要说明的是,在本实施方式中,优选的,当步骤108执行完之后,返回步骤101。
与现有技术相比,本发明实施方式在数据处理过程中,确定异常数据中每个异常文件的优先级并根据优先级高低顺序对异常数据进行处理,并在每次处理失败后降低异常文件的优先级,通过滞后处理处理成功率低的异常文件,提高数据处理的效率;还对已处理次数达到预设阈值的异常文件进行丢弃,停止对处理成功率低于下限值的异常文件的资源投入,节省了计算机硬件资源。
本发明的第二实施方式涉及一种数据处理方法。第二实施方式与第一实施方式大致相同,不同之处在于,第二实施方式还提供了对源数据的处理方法,包括:获取待处理文件,并对所述待处理文件进行格式转换;若格式转换成功,则发送格式转换后得到的文件;若格式转换失败,则根据判断所述目标的已处理次数是否达到第二预设阈值,如果是,则将所述待处理文件标记为所述待处理的异常数据,如果否,则更新所述待处理文件的已处理次数。。
本实施方式中的数据处理方法的流程示意图如图2所示,具体包括:
步骤201:获取待处理文件,并对所述待处理文件进行格式转换。
具体的说,获取待处理文件即从待处理的源数据中抽取待处理文件,对所述待处理文件进行格式转换,这一过程将待处理文件从JSON格式转换为软探针平台的定制格式,实际应用中,也可以对原格式是JSON格式以外的其他格式的待处理文件进行格式转换。
步骤202:判断格式转换是否成功。
步骤203:发送格式转换后得到的文件。
具体地说,将格式转换后得到的文件发送至软探针平台。
步骤204:判断所述待处理文件的已处理次数是否达到第二预设阈值。
步骤205:将所述待处理文件标记为所述待处理的异常数据。
步骤206:更新所述待处理文件的已处理次数。
具体地说,步骤204至206中,将已处理次数达到第二预设阈值到的待处理文件标记为待处理的异常数据,也就是说,该文件本来由负责源数据处理的电路单元进行处理,通过标记,将该数据划分给负责异常数据处理的电路单元。如此,可以保证负责源数据处理的电路单元,不会因为重复某个异常文件导致其他正常文件被滞后处理,提高了处理效率。
需要说明的是,在本实施方式中,优选的,当步骤206执行完之后,返回步骤201。
步骤207:获取待处理的异常数据,所述异常数据包括至少一个异常文件。
步骤208:确定所述异常数据中每个异常文件的优先级。
步骤209:选取优先级最高的异常文件作为目标文件,并对所述目标文件进行格式转换。
步骤210:判断格式转换是否成功,如果是,进入步骤211,如果否,进入步骤212。
步骤211:发送格式转换后得到的文件。
步骤212:判断所述目标文件的已处理次数是否达到第一预设阈值,如果是,进入步骤213,如果否,进入步骤214。
步骤213:丢弃所述目标文件。
步骤214:更新所述目标文件的已处理次数并降低所述目标文件的优先级。
本实施方式中步骤207至步骤214分别与第一实施方式中步骤101至步骤108大致相同,为避免重复,在此不再一一赘述。
需要说明的是,在本实施方式中,优选的,当步骤214执行完之后,返回步骤207。
值得一提的是,在本实施方式中,步骤201至步骤202即对待处理文件进行格式转换的步骤(下称步骤A)、步骤203即发送格式转换成功的文件的步骤(下称步骤B)、以及步骤204至205即对已处理次数到达阈值的文件的处理步骤(下称步骤C),步骤206即对格式转换失败、且已处理次数未达到阈值文件的处理步骤(下称步骤D),在执行步骤A,B、C和D的时候采用流水线技术,在中央处理器CPU中设置四个分别负责步骤A、B、C和D的电路单元,在进行数据处理时,这四个电路单元分别同时控制执行各自负责的步骤(比如说负责步骤A的电路单元处理完文件1,文件1由负责步骤B的电路单元处理,在负责步骤B的电路单元处理文件1的同时,负责步骤A的电路单元处理文件2,以此类推),这样就能实现一个CPU时钟周期完成步骤A、B、C和D,提高CPU的运算速度。
同理,在本实施方式中,步骤207至步骤210即获取目标文件并对其进行格式转换的步骤(下称步骤E),步骤211即发送格式转换后得到文件的步骤(下称步骤F),步骤212至步骤213即对已处理次数达到阈值的文件的处理步骤(下称步骤G),步骤214即对格式转换失败、且已处理次数未达阈值的文件的处理步骤(下称H),其中,步骤F与步骤B可以由CPU同一电路单元负责,在执行步骤E、F、G和H时,采用流水线技术,具体细节如同步骤A、B、C和D的执行,在此不作赘述。
进一步的,在本实施方式中,如图3所示,步骤201至步骤206(不包括步骤203)即对正常流水线,步骤207至步骤214(不包括步骤211)即异常流水线,以及步骤203和步骤211即传输流水线之间并不限定先后关系,在实际应用中可以通过多线程同时执行上述步骤。
与现有技术相比,本发明实施方式中,提供了进行ETL时对正常数据的处理方法,通过将正常数据中已处理次数达到阈值的文件归入异常数据,防止处理过程中因为重复处理格式转换失败的文件导致处理效率变低。
本发明的第三实施方式涉及一种数据处理方法。第三实施方式与第一实施方式大致相同,不同之处在于,第三实施方式中,发送格式转换后得到的文件,包括:通过虚拟文件***上的接收接口将所述格式转换后得到的文件发送至所述虚拟文件***,并由所述虚拟文件***的发送接口对所述格式转换后得到的文件进行发送,其中,所述接收接口与所述发送接口使用不同的通信协议。
本实施方式中的数据处理方法如图4所示,具体包括:
步骤301:获取待处理的异常数据,所述异常数据包括至少一个异常文件。
步骤302:确定所述异常数据中每个异常文件的优先级。
步骤303:选取优先级最高的异常文件作为目标文件,并对所述目标文件进行格式转换。
步骤304:判断格式转换是否成功,如果是,进入步骤305,如果否,进入步骤306。
本实施方式中步骤301至步骤304与第一实施方式中步骤101至步骤104大致相同,为避免重复,在此不再一一赘述。
步骤305:通过虚拟文件***对所述格式转换后得到的文件进行发送。
具体地说,通过虚拟文件***上的接收接口将所述格式转换后得到的文件发送至所述虚拟文件***,并由所述虚拟文件***的发送接口对所述格式转换后得到的文件进行发送。所述接收接口与所述发送接口使用不同的通信协议,包括:所述发送接口与所述接收接口使用不同的应用层协议。接收接口和发送接口支持的应用层协议包括FTP(文件传输协议,File Transfer Protocol)、FTPS(加密版的FTP)、SFTP(安全文件传送协议,SecureFile Transfer Protocol)、HTTP(超文本传输协议,Hyper Text Transfer Protocol)和HTTPS(超文本传输安全协议,Hyper Text Transfer Protocol over SecureSocketLayer)。举个例子,接收接口接收文件使用的应用层协议为FTP,由于软探针平台使用的应用层协议为SFTP,虚拟文件***在通过接收接口接收文件后。可以通过支持SFTP的发送接口实现协议无缝切换。
此外,所述接收接口与所述发送接口使用不同的通信协议,还包括:所述发送接口与所述接收接口使用不同的网络层协议。发送接口支持的网络协议包括IPv4(互联网协议第4版,Internet Protocol Version 4)和IPv6(互联网协议第6版,Internet ProtocolVersion 6)。通过虚拟文件***进行文件发送,可以实现网络层协议的无缝切换。
步骤306:判断所述目标文件的已处理次数是否达到第一预设阈值,如果是,进入步骤307,如果否,进入步骤308。
步骤307:丢弃所述目标文件。
步骤308:更新所述目标文件的已处理次数并降低所述目标文件的优先级。
需要说明的是,本实施方式中对发送格式转换后文件这一步骤的改进,同样适用于第二实施方式中的步骤203。
本实施方式中步骤306至步骤308与第一实施方式中步骤106至步骤108大致相同,为避免重复,在此不再一一赘述。
需要说明的是,在本实施方式中,优选的,当步骤308执行完之后,返回步骤301。
与现有技术相比,本发明实施方式设置虚拟文件***发送格式转换后得到的文件,并通过虚拟文件***上的接收接口和发送接口进行通信协议的切换,不用进行代码重写和补充,节省了人工成本。
上面各种方法的步骤划分,只是为了描述清楚,实现时可以合并为一个步骤或者对某些步骤进行拆分,分解为多个步骤,只要包括相同的逻辑关系,都在本专利的保护范围内;对算法中或者流程中添加无关紧要的修改或者引入无关紧要的设计,但不改变其算法和流程的核心设计都在该专利的保护范围内。
本发明第四实施方式涉及一种网络切片的选择装置,包括:获取模块401、确定模块402、格式转换模块403、发送模块404以及判断模块405,具体结构如图5所示:
获取模块401,用于获取待处理的异常数据,所述异常数据包括至少一个异常文件;
确定模块402,用于确定所述异常数据中每个异常文件的优先级;
格式转换模块403,用于选取优先级最高的异常文件作为目标文件,并对所述目标文件进行格式转换;
发送模块404,用于在格式转换成功时,发送格式转换后得到的文件;
判断模块405,用于在格式转换失败时,判断所述目标文件的已处理次数是否达到第一预设阈值,如果是,则丢弃所述目标文件,如果否,则更新所述目标文件的已处理次数并降低所述目标文件的优先级。
不难发现,本实施方式为与第一实施方式相对应的装置实施例,本实施方式可与第一实施方式互相配合实施。第一实施方式中提到的相关技术细节在本实施方式中依然有效,为了减少重复,这里不再赘述。相应地,本实施方式中提到的相关技术细节也可应用在第一实施方式中。
值得一提的是,本实施方式中所涉及到的各模块均为逻辑模块,在实际应用中,一个逻辑单元可以是一个物理单元,也可以是一个物理单元的一部分,还可以以多个物理单元的组合实现。此外,为了突出本发明的创新部分,本实施方式中并没有将与解决本发明所提出的技术问题关系不太密切的单元引入,但这并不表明本实施方式中不存在其它的单元。
本发明第五实施方式涉及一种电子设备,如图6所示,包括至少一个处理器501;以及,与至少一个处理器501通信连接的存储器502;其中,存储器502存储有可被至少一个处理器501执行的指令,指令被至少一个处理器501执行,以使至少一个处理器501能够执行上述的数据处理方法实施例。
其中,存储器502和处理器501采用总线方式连接,总线可以包括任意数量的互联的总线和桥,总线将一个或多个处理器501和存储器502的各种电路连接在一起。总线还可以将诸如***设备、稳压器和功率管理电路等之类的各种其他电路连接在一起,这些都是本领域所公知的,因此,本文不再对其进行进一步描述。总线接口在总线和收发机之间提供接口。收发机可以是一个元件,也可以是多个元件,比如多个接收器和发送器,提供用于在传输介质上与各种其他装置通信的单元。经处理器501处理的数据通过天线在无线介质上进行传输,进一步,天线还接收数据并将数据传送给处理器501。
处理器501负责管理总线和通常的处理,还可以提供各种功能,包括定时、***接口、电压调节、电源管理以及其他控制功能。而存储器502可以被用于存储处理器501在执行操作时所使用的数据。
本发明的实施方式还提供了一种计算机可读存储介质,存储有计算机程序,所述计算机程序被处理器执行时实现上述数据处理方法实施例。
即,本领域技术人员可以理解,实现上述实施例方法中的全部或部分步骤是可以通过程序来指令相关的硬件来完成,该程序存储在一个存储介质中,包括若干指令用以使得一个设备(可以是单片机,芯片等)或处理器(processor)执行本申请各个实施例所述方法的全部或部分步骤。而前述的存储介质包括:U盘、移动硬盘、只读存储器(ROM,Read-OnlyMemory)、随机存取存储器(RAM,Random Access Memory)、磁碟或者光盘等各种可以存储程序代码的介质。
本领域的普通技术人员可以理解,上述各实施方式是实现本发明的具体实施例,而在实际应用中,可以在形式上和细节上对其作各种改变,而不偏离本发明的精神和范围。

Claims (10)

1.一种数据处理方法,其特征在于,包括:
获取待处理的异常数据,所述异常数据包括至少一个异常文件;
确定所述异常数据中每个异常文件的优先级;
选取优先级最高的异常文件作为目标文件,并对所述目标文件进行格式转换;
若格式转换成功,则发送格式转换后得到的文件;
若格式转换失败,则判断所述目标文件的已处理次数是否达到第一预设阈值,如果是,则丢弃所述目标文件,如果否,则更新所述目标文件的已处理次数并降低所述目标文件的优先级。
2.根据权利要求1所述的数据处理方法,其特征在于,所述确定所述异常数据每个异常文件的优先级,包括:
若所述异常文件未标记优先级,则根据所述异常文件的参数确定所述异常文件的优先级;
若所述异常文件已标记优先级,则获取所述异常文件已标记的优先级。
3.根据权利要求1所述的数据处理方法,其特征在于,所述异常文件的参数包括:文件更新时间、文件大小和文件类型中的任意一者或任意组合。
4.根据权利要求1所述的数据处理方法,其特征在于,还包括:
获取待处理文件,并对所述待处理文件进行格式转换;
若格式转换成功,则发送格式转换后得到的文件;
若格式转换失败,则根据判断所述目标的已处理次数是否达到第二预设阈值,如果是,则将所述待处理文件标记为所述待处理的异常数据,如果否,则更新所述待处理文件的已处理次数。
5.根据权利要求1或4所述的数据处理方法,其特征在于,所述发送格式转换后得到的文件,包括:
通过虚拟文件***上的接收接口将所述格式转换后得到的文件发送至所述虚拟文件***,并由所述虚拟文件***的发送接口对所述格式转换后得到的文件进行发送;
其中,所述接收接口与所述发送接口使用不同的通信协议。
6.根据权利要求5所述的数据处理方法,其特征在于,所述接收接口与所述发送接口使用不同的通信协议,包括:
所述发送接口与所述接收接口使用不同的应用层协议。
7.根据权利要求5所述的数据处理方法,其特征在于,所述接收接口与所述发送接口使用不同的通信协议,包括:
所述发送接口与所述接收接口使用不同的网络层协议。
8.一种数据处理装置,其特征在于,包括:
获取模块,用于获取待处理的异常数据,所述异常数据包括至少一个异常文件;
确定模块,用于确定所述异常数据中每个异常文件的优先级;
格式转换模块,用于选取优先级最高的异常文件作为目标文件,并对所述目标文件进行格式转换;
发送模块,用于在格式转换成功时,发送格式转换后得到的文件;
判断模块,用于在格式转换失败时,判断所述目标文件的已处理次数是否达到第一预设阈值,如果是,则丢弃所述目标文件,如果否,则更新所述目标文件的已处理次数并降低所述目标文件的优先级。
9.一种电子设备,其特征在于,包括:
至少一个处理器;以及,
与所述至少一个处理器通信连接的存储器;其中,
所述存储器存储有可被所述至少一个处理器执行的指令,所述指令被所述至少一个处理器执行,以使所述至少一个处理器能够执行如权利要求1至7中任一项所述的数据处理方法。
10.一种计算机可读存储介质,存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现权利要求1至7中任一项所述的数据处理方法。
CN201911129851.5A 2019-11-18 2019-11-18 数据处理方法、装置、电子设备以及存储介质 Pending CN110909055A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201911129851.5A CN110909055A (zh) 2019-11-18 2019-11-18 数据处理方法、装置、电子设备以及存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201911129851.5A CN110909055A (zh) 2019-11-18 2019-11-18 数据处理方法、装置、电子设备以及存储介质

Publications (1)

Publication Number Publication Date
CN110909055A true CN110909055A (zh) 2020-03-24

Family

ID=69817795

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201911129851.5A Pending CN110909055A (zh) 2019-11-18 2019-11-18 数据处理方法、装置、电子设备以及存储介质

Country Status (1)

Country Link
CN (1) CN110909055A (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113918770A (zh) * 2021-12-16 2022-01-11 上海冰鉴信息科技有限公司 字符串与时间字段的转换方法及装置

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP0332351A2 (en) * 1988-03-09 1989-09-13 Fujitsu Limited Direct memory access controller
CN102479113A (zh) * 2010-11-30 2012-05-30 ***通信集团黑龙江有限公司 异常自适应处理方法及***
CN106933872A (zh) * 2015-12-30 2017-07-07 阿里巴巴集团控股有限公司 一种通过传统文件***接口访问云存储服务的方法及装置
CN110347735A (zh) * 2019-06-17 2019-10-18 平安普惠企业管理有限公司 配置化的数据转发异常补处理方法、装置及可读存储介质

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP0332351A2 (en) * 1988-03-09 1989-09-13 Fujitsu Limited Direct memory access controller
CN102479113A (zh) * 2010-11-30 2012-05-30 ***通信集团黑龙江有限公司 异常自适应处理方法及***
CN106933872A (zh) * 2015-12-30 2017-07-07 阿里巴巴集团控股有限公司 一种通过传统文件***接口访问云存储服务的方法及装置
CN110347735A (zh) * 2019-06-17 2019-10-18 平安普惠企业管理有限公司 配置化的数据转发异常补处理方法、装置及可读存储介质

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113918770A (zh) * 2021-12-16 2022-01-11 上海冰鉴信息科技有限公司 字符串与时间字段的转换方法及装置

Similar Documents

Publication Publication Date Title
CN110120882B (zh) 策略驱动方法和装置
CN105677469B (zh) 定时任务执行方法及装置
CN110058987B (zh) 用于对计算***进行追踪的方法、设备和计算机可读介质
CN105814543A (zh) 用于增加负荷密度和改进能效的功率平衡
US10200240B2 (en) Method for configuring an M2M system
CN103346974A (zh) 一种业务流程的控制方法及网络设备
CN105052076B (zh) 一种基于云计算的网元管理***及网元管理方法
US10033546B2 (en) Method and system for reprogramming
CN104378234A (zh) 跨数据中心的数据传输处理方法及***
US20190053169A1 (en) Method for dynamic adaptation of a data rate
CN110909055A (zh) 数据处理方法、装置、电子设备以及存储介质
US8886913B2 (en) Apparatus and method for identifier management
EP3182232A1 (en) Signalling of specification information on an industrial device
CN106341433A (zh) 一种服务***、信号服务器和对讲服务器
CN112202896A (zh) 边缘计算方法、框架、终端和存储介质
CN111315026B (zh) 信道的选择方法、装置、网关及计算机可读存储介质
WO2017023332A1 (en) Difference datasets
CN107171915B (zh) 一种通信协议的变更方法及装置
WO2019011441A1 (en) TRANSFER OF PERFORMANCE INDICATORS OF MANAGEMENT PLAN
CN103368862B (zh) 一种负载均衡调度方法和负载均衡调度装置
CN102428673B (zh) 用于分配正交序列的控制电路和方法
CN112417015A (zh) 数据分发方法和装置、存储介质及电子装置
CN105187244A (zh) 一种支持多种管理模式的数字通信设备访问管理***
CN111240867A (zh) 一种信息通讯***及方法
CN110278265A (zh) 用户上传文件的处理方法、装置、存储介质和电子设备

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication
RJ01 Rejection of invention patent application after publication

Application publication date: 20200324