CN109739814A - 一种文件存储及下载方法、装置及设备 - Google Patents

一种文件存储及下载方法、装置及设备 Download PDF

Info

Publication number
CN109739814A
CN109739814A CN201910005177.3A CN201910005177A CN109739814A CN 109739814 A CN109739814 A CN 109739814A CN 201910005177 A CN201910005177 A CN 201910005177A CN 109739814 A CN109739814 A CN 109739814A
Authority
CN
China
Prior art keywords
file
merging
metamessage
source
storage medium
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201910005177.3A
Other languages
English (en)
Other versions
CN109739814B (zh
Inventor
张琦炜
李靖
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Advanced New Technologies Co Ltd
Advantageous New Technologies Co Ltd
Original Assignee
Alibaba Group Holding Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Alibaba Group Holding Ltd filed Critical Alibaba Group Holding Ltd
Priority to CN201910005177.3A priority Critical patent/CN109739814B/zh
Priority to CN202310755098.0A priority patent/CN116701317A/zh
Publication of CN109739814A publication Critical patent/CN109739814A/zh
Application granted granted Critical
Publication of CN109739814B publication Critical patent/CN109739814B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/10File systems; File servers
    • G06F16/16File or folder operations, e.g. details of user interfaces specifically adapted to file systems
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/10File systems; File servers
    • G06F16/13File access structures, e.g. distributed indices
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/10File systems; File servers
    • G06F16/17Details of further file system functions
    • G06F16/178Techniques for file synchronisation in file systems

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Databases & Information Systems (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Human Computer Interaction (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本说明书实施例公开了一种文件存储及下载方法、装置及设备。所述文件存储方法包括:接收待存储的多个源文件;将待存储的多个源文件进行合并,得到一个或多个合并文件,并生成与所述合并文件中的源文件对应的元信息;将合并文件存储于第一存储介质,元信息存储于第二存储介质。所述文件下载方法包括:接收文件下载请求;根据文件下载请求,获取文件下载请求对应的元信息;根据文件下载请求对应的元信息,定位文件下载请求对应的合并文件中的源文件;从文件下载请求对应的合并文件中,下载文件下载请求所对应的源文件。

Description

一种文件存储及下载方法、装置及设备
技术领域
本说明书涉及计算机技术领域,尤其涉及一种文件存储及下载方法、装置及设备。
背景技术
随着电商的发展,基于电商开展的支付业务越来越多,每天会生成上亿级的离线账单,产生海量数据。该离线账单需要存储到稳定且持久的存储介质中,以便用户下载使用。
在现有技术中,对于诸如离线账单等海量数据的存储,使用OSS(Object StorageService,对象存储)存储,能够实现数据的安全、可靠及低成本存储,但是该存储方式对小文件处理性能不高,由于需要对小文件单独进行I/O(input/output,输入/输出)操作,导致存储低效。离线账单等海量数据的存储也可以采用HBase进行存储,由于HBase是一个高可靠性、高性能、面向列、可伸缩的分布式存储***,因此能够较好的支持海量数据的存储,方便后续查询及下载,但是HBase需要较大的集群及相应的维护人员,因此存储成本较高。
基于现有技术,需要一种新的方法,能够满足海量小文件的存储需要,既能实现高效的存储,又能维持较低的存储成本,从而实现稳定、可靠、高效的文件存储及下载。
发明内容
本说明书实施例提供一种文件存储及下载方法、装置及设备,用于解决以下技术问题:能够满足海量小文件的存储需要,既能实现高效的存储,又能维持较低的存储成本,从而实现稳定、可靠、高效的文件存储及下载。
为解决上述技术问题,本说明书实施例是这样实现的:
本说明书实施例提供的一种文件存储方法,包括:
接收待存储的多个源文件;
将所述待存储的多个源文件进行合并,得到一个或多个合并文件,并生成与所述合并文件中的源文件对应的元信息,其中所述元信息用于记录所述源文件与所述合并文件之间的对应关系;
将所述合并文件存储于第一存储介质,所述信息存储于第二存储介质,其中,所述第一存储介质的存储成本低于所述第二存储介质,所述第二存储介质的存储效率高于所述第一存储介质。
本说明书实施例还提供一种文件下载方法,包括:
接收文件下载请求;
根据所述文件下载请求,获取所述文件下载请求对应的元信息;
根据所述文件下载请求对应的元信息,定位所述文件下载请求对应的合并文件中的源文件;
从所述文件下载请求对应的合并文件中,下载所述文件下载请求所对应的源文件。
本说明书实施例提供的一种文件存储装置,包括:
接收单元,用于接收待存储的多个源文件;
处理单元,将所述待存储的多个源文件进行合并,得到一个或多个合并文件,并生成与所述合并文件中的源文件对应的元信息,其中所述元信息用于记录所述源文件与所述合并文件之间的对应关系;
存储单元,将所述合并文件存储于第一存储介质,所述元信息存储于第二存储介质,其中,所述第一存储介质的存储成本低于所述第二存储介质,所述第二存储介质的存储效率高于所述第一存储介质。
本说明书实施例还提供一种文件下载装置,包括:
接收单元,用于接收文件下载请求;
查找单元,获取所述文件下载请求对应的元信息,根据所述文件下载请求对应的元信息,定位所述文件下载请求对应的合并文件中的源文件;
下载单元,从所述文件下载请求对应的合并文件中,下载所述文件下载请求所对应的源文件。
本说明书实施例还提供电子设备,包括:
至少一个处理器;以及,
与所述至少一个处理器通信连接的存储器;其中,
所述存储器存储有可被所述至少一个处理器执行的指令,所述指令被所述至少一个处理器执行,以使所述至少一个处理器能够实现文件存储和/或文件下载。
本说明书实施例采用的上述至少一个技术方案能够达到以下有益效果:
本实施例采用融合第一存储介质和第二存储介质的方法,通过合并存储进行文件存储,能够实现高效低成本存储;源文件在合并文件中的存储格式,能够恢复源文件对应的元信息,达到数据灾备的目的;在合并文件的合并过程中,生成元信息并进行存储,能够便于在文件下载时进行源文件的查询,保证文件下载的高效;在文件下载时,可以采用验证信息进行验证,从而保证文件下载的安全、可靠。
附图说明
为了更清楚地说明本说明书实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本说明书中记载的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。
图1为本说明书提供的一种文件存储的框架图;
图2为本说明书提供的一种文件存储方法的流程图;
图3为本说明书实施例提供的单个合并文件所包含的源文件与元信息的对应关系示意图;
图4为本说明书实施例提供的合并文件的合并过程示意图;
图5为本说明书实施例提供的源文件在合并文件中的存储格式示意图;
图6为本说明书实施例提供的合并文件的合并阶段异常处理的流程图;
图7为本说明书实施例提供的一种文件下载方法的流程图;
图8为本说明书实施例提供的一种文件存储装置的示意图;
图9为本说明书实施例提供的一种文件下载装置的示意图。
具体实施方式
为了使本技术领域的人员更好地理解本说明书中的技术方案,下面将结合本说明书实施例中的附图,对本说明书实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本申请一部分实施例,而不是全部的实施例。基于本说明书实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都应当属于本申请保护的范围。
图1为本说明书提供的一种文件存储的框架图,该框架图具体包括:
将待存储的源文件进行合并,生成合并文件,并产生元信息。然后将合并文件上传到第一存储介质中进行存储,将元信息存储到第二存储介质中,元信息位于第二存储介质中的元文件中。显而易见,合并文件与源文件的对应关系为一对多,即一个合并文件中包含多个源文件。
下面将基于图1所示的框架图,详细说明本说明书的实施例提供的文件存储过程,该过程具体包括以下步骤,如图2所示。图2为本说明书提供的一种文件存储方法的流程图,具体包括:
步骤S201:接收待存储的多个源文件。
对于诸如离线账单等海量数据,每天均需要进行存储,以方便用户后续进行查询、下载,这些待存储的数据是亿级的数据量,而且是小文件。
步骤S203:将待存储的多个源文件进行合并,得到一个或多个合并文件,并生成与所述合并文件中的源文件对应的元信息。
在本说明书中,前述步骤S201接收的待存储的源文件,为了实现高效低成本的存储效果,首先需要对待存储的源文件进行合并,生成合并文件,其目的是将大量的零散的源文件合并为一个文件进行处理。在源文件生成合并文件的过程中,会生成对应的元信息,元信息用于记录源文件与合并文件之间的对应关系。
如前述图1所述,一个合并文件中包含多个源文件。由于合并文件与源文件不再是一一对应的关系,所以本说明书中使用元信息记录源文件与合并文件的对应关系,具体如图3所示。图3为本说明书实施例提供的单个合并文件所包含的源文件与元信息的对应关系示意图。具体地,一个合并文件中含有多个源文件,源文件以合并文件的形式储存在第一存储介质中,同时,储存在第二存储介质中的元文件包含多个元信息,第二存储介质中的元信息与第一存储介质中合并文件的源文件一一对应。元信息用于记录源文件在合并文件中的位置信息,在本说明书的一个示意性说明中,元信息包括源文件的起止位置、源文件路径、合并文件路径,元信息是在合并文件的合并过程中生成的。
下面将详细介绍合并文件的形成过程,具体如图4所示,以更加容易理解元信息的生成。图4为本说明书实施例提供的合并文件的合并过程示意图,具体包括:
步骤S401:按照预设格式将待存储的源文件写入合并文件,并生成元信息。
本步骤中,源文件写入合并文件及生成元信息均是在内存中进行的。为了保证较好的性能,在合并文件的合并过程中,用于合并的源文件的数量、单个合并文件所占的存储容量、合并文件中的源文件对应的元信息所占的内存容量均需要进行限制。在本说明书的一个示意性说明中,将源文件的数量控制在5000个以内;合并文件的容量在64MB-256MB之间。
步骤S403:当合并文件超出预设界限时,新建合并文件。
如步骤S401所述,当合并文件的容量过大,或者写入合并文件的源文件的数量过多时,或者合并文件中的源文件对应的元信息所占的内存容量过大,则完成当前合并文件的合并,并新建合并文件,继续进行源文件的合并。预设界限是为合并多个源文件为一个合并文件的完成条件,在实际应用中,预设界限可以为源文件的数量控制在5000个以内和/或合并文件的容量在64MB-256MB之间和/或合并文件中的源文件对应的元信息所占的内存容量为一定数值。当完成一个合并文件的合并后,将内存中的合并文件及元信息保存到磁盘,同时删除源文件,此处,删除的源文件为存入磁盘的合并文件所对应的源文件。
步骤S405:将合并文件及元信息全部保存到磁盘。
按照步骤S403所示,在内存中,每完成一个合并文件的合并后,将合并文件及元信息存入磁盘,同时删除源文件。待所有源文件均完成合并后,将最后完成的一个合并文件及元信息保存到磁盘,并将位于磁盘的元信息的属性标记为不可上传到第二存储介质,同时删除源文件,此时删除的源文件是最后一个从内存上传到磁盘的合并文件所对应的源文件。特别需要说明的是,生成位于磁盘的合并文件和元信息的主要目的是为了用于后续存储,生成的位于磁盘的合并文件包括了所有待存储的源文件,生成的位于磁盘的元信息包含了所有待存储的源文件对应的元信息。
采用图4所示的流程图生成合并文件,在完成源文件合并完成后,即可删除,能够保证所有源文件均进行了合并,且不出现源文件重复合并的情况。
为了更好的理解合并文件的生成,下面对步骤S401中提到的源文件在合并文件中的预设格式进行示意性说明,具体如图5所示。图5为本说明书实施例提供的源文件在合并文件中的存储格式示意图,具体包括如下内容:
Version,Total Length,Header Length,Content Length,Headers,VC和Content。具体地,Version用于表明文件版本,以保证如果格式定义发生了变化,仍可以正常进行解析;Total Length用于记载源文件的总字节数;Header Length记录了头部信息的长度;Content Length保存了包含校验字段的源文件的长度;可以包含Headers记录头部信息,头部信息可以用来存储所有有用的非文件内容的辅助信息,如文件生成时上下文的信息,可用于各种目的,比如故障诊断,文件检索,文件恢复等,头部信息的具体格式根据业务场景及业务需求进行自定义;还可以包含VC(Validate Code)即验证信息,验证信息包含但不限于验证字符串的方式。验证信息是为了避免错误下载而引入的校验字段,验证信息是自定义的,具体实施时,可以使用唯一定位源文件的规则定义,在本说明书的一个实施例中,将验证信息定义为如源文件路径+源文件名+源文件类型定义为验证信息;Content是实际的源文件的内容。
源文件在合并文件中采用图5所示的存储格式,使合并文件中含有元信息。采用图5所示的格式,可以达到如下有益效果:由于头部信息中包含了文件的相关信息,因此,可方便的查询文件相关信息,且在发生元信息丢失,可以扫描合并文件,重建元信息,能够实现数据灾备;利用验证信息,可以在下载时,对源文件进行验证,从而保证下载的安全性。
步骤S205:将合并文件存储于第一存储介质,元信息存储于第二存储介质。
前述步骤S203生成的合并文件及元信息,需要上传到相应的存储介质中进行存储。具体地,将位于磁盘的合并文件存储到第一存储介质,并删除位于磁盘中的合并文件,将位于磁盘的元信息的属性标记为可上传到第二存储介质;然后将位于磁盘的可上传到第二存储介质的元信息存储到第二存储介质,并删除相应的位于磁盘的元信息。在具体实施过程中,第一存储介质可以是OSS等存储成本相对较低的存储介质,但不仅限于OSS;第二存储介质可以为HBase等存储效率较高的存储介质,但不仅限于HBase。
另外,需要特别说明的是,本说明书实施例提供的文件存储方法,理论上,可以实现海量数据的存储,但是为了达到较好的使用性能,源文件和合并文件的大小应该有一定的差别,在具体实施过程中,源文件和合并文件的大小差别在两个数量级以上为佳。
由于现有技术的文件存储方法,如使用传统数据库,采用分库分表的方式进行存储,实现大量数据的并发处理,且能够支持数据的结构化存储,但是在数据量过多时,该存储方式的可扩展性及维护性会比较差。也可以采用HDFS(Hadoop Distribute FileSystem)进行海量数据存储,该存储方法具有低成本、高容错、高吞吐等优点,但是由于缺乏元数据信息,查询难度较大,因此不利于记录级别的数据存储。尽管采用HBase能够较好的支持海量数据的存储,方便后续查询,但是HBase需要较大的集群及相应的维护人员,因此存储成本较高。OSS存储,实现数据的安全、可靠及低成本存储,但是该存储方式对小文件处理性能不高,导致存储低效。上述方法均不能实现高效低成本的存储效果,但是采用本说明书实施例提供的文件存储方法,进行文件存储,能够达到高效低成本的存储效果,适用于写多读少的存储场景;源文件在合并文件中的存储格式,能够在元信息发生丢失时,对元信息进行恢复,同时在源文件下载时,能够对文件进行验证,保证下载的安全、可靠性。
在合并文件及元信息进行存储的过程中,由于***异常,如程序异常,或者外部错误,如断电,诸多因素导致的异常,导致合并文件的合并阶段或合并文件存储于第一存储介质和/或元信息存储于第二存储介质的存储过程中发生异常中断。
对于合并文件的合并阶段发生的异常中断,可以采用图6所示的方法进行处理。图6为本说明书实施例提供的合并文件的合并阶段异常处理的流程图,具体过程如下:
在合并文件的合并阶段发生异常时,可能会出现某个合并文件的合并过程中断,或者某个合并文件已完成但未生成或者未全部生成与合并文件中的源文件对应的元信息,或者未进行合并的源文件亦即残留的源文件。因此需要进一步进行解析。具体地:
步骤S601:从已经生成的合并文件中获取合并文件中的源文件对应的元信息以替换已经生成的元信息。
为了保证元信息能够包括与所有已经生成的合并文件中的源文件之间的元信息,按照预设格式,从已经生成的合并文件中获取合并文件中的源文件对应的元信息以替换已经生成的元信息,同时可以获得与已经生成的合并文件对应的源文件并将源文件删除。具体地,从预设格式的头部信息中,获取合并文件中的源文件对应的元信息,从预设格式的Contents中,获得与合并文件对应的源文件。
步骤S603:对残留的源文件进行合并,得到新的合并文件,并生成与合并文件中的源文件对应的新的元信息。
具体实施过程中,可以采用图4所示的流程图中步骤S401及步骤S403所示的步骤,按照预设格式和/预设界限,对残留的源文件进行合并,生成新的合并文件及元信息,该过程是在内存中执行的。需要特别说明的是,由于残留的合并文件已经损坏,因此在进行源文件合并的过程中,残留的合并文件不会再增加新的文件。
步骤S605:将新的合并文件及元信息存储到磁盘。
采用步骤S603得到新的合并文件及元信息后,进一步地,采用图4所示的流程图中步骤S405所示的步骤,将新的合并文件及元信息存储到磁盘中,并删除存储到磁盘的合并文件对应的源文件。
步骤S607:将已经生成的合并文件及新的合并文件共同构成合并文件。
步骤S609:将替换得到的元信息及新的元信息共同构成元信息。
采用步骤S601-步骤S607即可完成合并文件合并阶段的异常处理,可用于存储到第一存储介质和第二存储介质,保证用于后续存储文件的准确性。
对于合并文件存储于第一存储介质和/或元信息存储于第二存储介质的存储过程中发生异常中断,则需要从残留文件的合并文件中,获取与残留的合并文件中的源文件对应的元信息,以替换所述残留文件中的元信息,然后将残留的合并文件和替换得到的元信息进行存储。
本说明书实施例提供了文件存储的方法,文件存储的主要目的是为了后续文件下载,因此,本说明书实施例还提供了一种文件下载方法,具体如图7所示。图7为本说明书实施例提供的一种文件下载方法的流程图,具体包括:
步骤S701:接收文件下载请求。
步骤S703:根据文件下载请求,获取文件下载请求对应的元信息。
具体地,通过步骤S701接收到文件下载请求后,根据文件下载请求,从第二存储介质中,获得文件下载请求对应的元信息。
步骤S705:根据文件下载请求对应的元信息,定位文件下载请求对应的合并文件中的源文件。
具体地,根据文件下载请求对应的元信息,从第一存储介质中,获得文件下载请求对应的合并文件中的源文件。
步骤S707:从文件下载请求对应的合并文件中,下载文件下载请求所对应的源文件。
在具体实施过程中,为了保下载文件的安全性,利用验证信息,对下载的源文件进行验证。如前述图5所示,源文件在合并文件的保存中,含有验证信息,可以根据该验证信息,对下载的源文件进行验证。若验证信息验证成功,则从所述文件下载请求对应的合并文件中,下载所述文件下载请求所对应的源文件;若验证信息验证失败,则终止下载。具体地,进行下载获取源文件内容时,源文件首位包含正确的验证信息才能允许下载。
采用本说明书实施例提供的文件下载方法,由于采用了验证信息进行验证,因此可以保证下载的安全性。
上述内容详细说明了一种文件存储方法,与之对应的,本说明书还提供了一种文件存储装置,如图8所示。图8为本说明书实施例提供的一种文件存储装置的示意图,具体包括:
接收单元801,用于接收待存储的多个源文件;
处理单元803,将待存储的多个源文件进行合并,得到一个或多个合并文件,并生成与合并文件中的源文件对应的元信息,其中元信息用于记录源文件与合并文件之间的对应关系;
存储单元805,将合并文件存储于第一存储介质,元信息存储于第二存储介质,其中,第一存储介质的存储成本低于第二存储介质,第二存储介质的存储效率高于第一存储介质。
上述内容还详细说明了一种文件下载方法,与之对应的,本说明书还提供了一种文件下载装置,如图9所示。图9为本说明书实施例提供的一种文件下载装置的示意图,具体包括:
接收单元901,用于接收文件下载请求;
查找单元903,获取文件下载请求对应的元信息,根据文件下载请求对应的元信息,定位文件下载请求对应的合并文件中的源文件;
下载单元905,从文件下载请求对应的合并文件中,下载文件下载请求所对应的源文件。
基于同样的思路,本说明书实施例还提供一种电子设备,包括:
至少一个处理器;以及,
与所述至少一个处理器通信连接的存储器;其中,
所述存储器存储有可被所述至少一个处理器执行的指令,所述指令被所述至少一个处理器执行,以使所述至少一个处理器能够实现文件存储和/或文件下载。
上述对本说明书特定实施例进行了描述。其它实施例在所附权利要求书的范围内。在一些情况下,在权利要求书中记载的动作或步骤可以按照不同于实施例中的顺序来执行并且仍然可以实现期望的结果。另外,在附图中描绘的过程不一定要求示出的特定顺序或者连续顺序才能实现期望的结果。在某些实施方式中,多任务处理和并行处理也是可以的或者可能是有利的。
本说明书中的各个实施例均采用递进的方式描述,各个实施例之间相同相似的部分互相参见即可,每个实施例重点说明的都是与其他实施例的不同之处。尤其,对于装置、电子设备、非易失性计算机存储介质实施例而言,由于其基本相似于方法实施例,所以描述的比较简单,相关之处参见方法实施例的部分说明即可。
本说明书实施例提供的装置、电子设备、非易失性计算机存储介质与方法是对应的,因此,装置、电子设备、非易失性计算机存储介质也具有与对应方法类似的有益技术效果,由于上面已经对方法的有益技术效果进行了详细说明,因此,这里不再赘述对应装置、电子设备、非易失性计算机存储介质的有益技术效果。
在20世纪90年代,对于一个技术的改进可以很明显地区分是硬件上的改进(例如,对二极管、晶体管、开关等电路结构的改进)还是软件上的改进(对于方法流程的改进)。然而,随着技术的发展,当今的很多方法流程的改进已经可以视为硬件电路结构的直接改进。设计人员几乎都通过将改进的方法流程编程到硬件电路中来得到相应的硬件电路结构。因此,不能说一个方法流程的改进就不能用硬件实体模块来实现。例如,可编程逻辑器件(Programmable Logic Device,PLD)(例如现场可编程门阵列(Field Programmable GateArray,FPGA))就是这样一种集成电路,其逻辑功能由用户对器件编程来确定。由设计人员自行编程来把一个数字***“集成”在一片PLD上,而不需要请芯片制造厂商来设计和制作专用的集成电路芯片。而且,如今,取代手工地制作集成电路芯片,这种编程也多半改用“逻辑编译器(logic compiler)”软件来实现,它与程序开发撰写时所用的软件编译器相类似,而要编译之前的原始代码也得用特定的编程语言来撰写,此称之为硬件描述语言(Hardware Description Language,HDL),而HDL也并非仅有一种,而是有许多种,如ABEL(Advanced Boolean Expression Language)、AHDL(Altera Hardware DescriptionLanguage)、Confluence、CUPL(Cornell University Programming Language)、HDCal、JHDL(Java Hardware Description Language)、Lava、Lola、MyHDL、PALASM、RHDL(RubyHardware Description Language)等,目前最普遍使用的是VHDL(Very-High-SpeedIntegrated Circuit Hardware Description Language)与Verilog。本领域技术人员也应该清楚,只需要将方法流程用上述几种硬件描述语言稍作逻辑编程并编程到集成电路中,就可以很容易得到实现该逻辑方法流程的硬件电路。
控制器可以按任何适当的方式实现,例如,控制器可以采取例如微处理器或处理器以及存储可由该(微)处理器执行的计算机可读程序代码(例如软件或固件)的计算机可读介质、逻辑门、开关、专用集成电路(Application Specific Integrated Circuit,ASIC)、可编程逻辑控制器和嵌入微控制器的形式,控制器的例子包括但不限于以下微控制器:ARC 625D、Atmel AT91SAM、Microchip PIC18F26K20以及Silicone Labs C8051F320,存储器控制器还可以被实现为存储器的控制逻辑的一部分。本领域技术人员也知道,除了以纯计算机可读程序代码方式实现控制器以外,完全可以通过将方法步骤进行逻辑编程来使得控制器以逻辑门、开关、专用集成电路、可编程逻辑控制器和嵌入微控制器等的形式来实现相同功能。因此这种控制器可以被认为是一种硬件部件,而对其内包括的用于实现各种功能的装置也可以视为硬件部件内的结构。或者甚至,可以将用于实现各种功能的装置视为既可以是实现方法的软件模块又可以是硬件部件内的结构。
上述实施例阐明的***、装置、模块或单元,具体可以由计算机芯片或实体实现,或者由具有某种功能的产品来实现。一种典型的实现设备为计算机。具体的,计算机例如可以为个人计算机、膝上型计算机、蜂窝电话、相机电话、智能电话、个人数字助理、媒体播放器、导航设备、电子邮件设备、游戏控制台、平板计算机、可穿戴设备或者这些设备中的任何设备的组合。
为了描述的方便,描述以上装置时以功能分为各种单元分别描述。当然,在实施本说明书一个或多个实施例时可以把各单元的功能在同一个或多个软件和/或硬件中实现。
本领域内的技术人员应明白,本说明书实施例可提供为方法、***、或计算机程序产品。因此,本说明书实施例可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。而且,本说明书实施例可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、CD-ROM、光学存储器等)上实施的计算机程序产品的形式。
本说明书是参照根据本说明书实施例的方法、设备(***)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器,使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。
这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读存储器中,使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品,该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。
这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上,使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理,从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。
在一个典型的配置中,计算设备包括一个或多个处理器(CPU)、输入/输出接口、网络接口和内存。
内存可能包括计算机可读介质中的非永久性存储器,随机存取存储器(RAM)和/或非易失性内存等形式,如只读存储器(ROM)或闪存(flash RAM)。内存是计算机可读介质的示例。
计算机可读介质包括永久性和非永久性、可移动和非可移动媒体可以由任何方法或技术来实现信息存储。信息可以是计算机可读指令、数据结构、程序的模块或其他数据。计算机的存储介质的例子包括,但不限于相变内存(PRAM)、静态随机存取存储器(SRAM)、动态随机存取存储器(DRAM)、其他类型的随机存取存储器(RAM)、只读存储器(ROM)、电可擦除可编程只读存储器(EEPROM)、快闪记忆体或其他内存技术、只读光盘只读存储器(CD-ROM)、数字多功能光盘(DVD)或其他光学存储、磁盒式磁带,磁带磁磁盘存储或其他磁性存储设备或任何其他非传输介质,可用于存储可以被计算设备访问的信息。按照本文中的界定,计算机可读介质不包括暂存电脑可读媒体(transitory media),如调制的数据信号和载波。
还需要说明的是,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、商品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、商品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括所述要素的过程、方法、商品或者设备中还存在另外的相同要素。
本说明书可以在由计算机执行的计算机可执行指令的一般上下文中描述,例如程序模块。一般地,程序模块包括执行特定任务或实现特定抽象数据类型的例程、程序、对象、组件、数据结构等等。也可以在分布式计算环境中实践说明书,在这些分布式计算环境中,由通过通信网络而被连接的远程处理设备来执行任务。在分布式计算环境中,程序模块可以位于包括存储设备在内的本地和远程计算机存储介质中。
本说明书中的各个实施例均采用递进的方式描述,各个实施例之间相同相似的部分互相参见即可,每个实施例重点说明的都是与其他实施例的不同之处。尤其,对于***实施例而言,由于其基本相似于方法实施例,所以描述的比较简单,相关之处参见方法实施例的部分说明即可。
以上所述仅为本说明书实施例而已,并不用于限制本申请。对于本领域技术人员来说,本申请可以有各种更改和变化。凡在本申请的精神和原理之内所作的任何修改、等同替换、改进等,均应包含在本申请的权利要求范围之内。

Claims (27)

1.一种文件存储方法,包括:
接收待存储的多个源文件;
将所述待存储的多个源文件进行合并,得到一个或多个合并文件,并生成与所述合并文件中的源文件对应的元信息,其中所述元信息用于记录所述源文件与所述合并文件之间的对应关系;
将所述合并文件存储于第一存储介质,所述元信息存储于第二存储介质,其中,所述第一存储介质的存储成本低于所述第二存储介质,所述第二存储介质的存储效率高于所述第一存储介质。
2.如权利要求1所述的方法,所述将所述待存储的多个源文件进行合并,得到一个或多个合并文件,并生成与所述合并文件中的源文件对应的元信息,具体包括:
在内存中按照预设格式将所述待存储的多个源文件进行合并,生成一个或多个合并文件,并生成与所述合并文件中的源文件对应的元信息,其中,所述预设格式为所述源文件在合并文件中的存储格式。
3.如权利要求2所述的方法,所述预设格式包含验证信息,用于从合并文件中下载源文件时对源文件进行验证,和/或包含头部信息,用于发生元信息丢失时,获取与合并文件中的源文件对应的元信息。
4.如权利要求1所述的方法,所述将所述待存储的多个源文件进行合并,得到一个或多个合并文件,并生成与所述合并文件中的源文件对应的元信息,进一步包括:
在内存中根据预设界限将所有的所述待存储的多个合并文件进行合并,生成一个或多个合并文件,并生成与所述合并文件中的源文件对应的元信息,其中,所述预设界限为合并多个源文件为一个合并文件的完成条件。
5.如权利要求4所述的方法,所述预设界限包括合并多个源文件过程中的源文件的数目和/或单个合并文件所占的存储容量和/或合并文件中的源文件对应的元信息所占的内存容量。
6.如权利要求1所述的方法,所述将所述待存储的多个源文件进行合并,得到一个或多个合并文件,并生成与所述合并文件中的源文件对应的元信息,进一步包括:
若在将所述待存储的多个源文件进行合并的过程中发生异常,则按照预设格式进行解析,从已经生成的合并文件中获取合并文件中的源文件对应的元信息以替换已经生成的元信息;
按照预设格式和/或预设界限对残留的源文件进行合并,得到一个或多个新的合并文件,并生成新的与所述合并文件中的源文件对应的元信息,其中,所述残留的源文件是所述待存储的多个源文件进行合并的过程中发生异常后未进行合并的源文件;
将所述已经生成的合并文件及所述新的合并文件共同构成合并文件,所述替换得到的元信息及所述新的元信息共同构成元信息。
7.如权利要求1所述的方法,所述将所述合并文件存储于第一存储介质,所述元信息存储于第二存储介质,具体包括:
将所述合并文件存储到第一存储介质,并将所述元信息的属性由不可上传到第二存储介质标记为可上传到第二存储介质;
将所述标记为可上传到第二存储介质的元信息存储到第二存储介质。
8.如权利要求1或7任一项所述的方法,所述将所述合并文件存储于第一存储介质,所述元信息存储于第二存储介质,进一步包括:
若在将所述合并文件存储于第一存储介质和/或所述元信息存储于第二存储介质的存储过程中发生异常,则按照预设格式解析残留文件后进行存储,其中,所述残留文件为所述存储过程中发生异常未进行存储的文件,所述残留文件包括合并文件和元信息。
9.如权利要求8所述的方法,所述若在将所述合并文件存储于第一存储介质和/或所述元信息存储于第二存储介质的存储过程中发生异常,则按照预设格式解析残留文件后进行存储,具体包括:
从所述残留文件的合并文件中,获取与残留的合并文件中的源文件对应的元信息,以替换所述残留文件中的元信息;
将所述残留的合并文件存储到第一存储介质,并将所述新的元信息的属性由不可上传到第二存储介质标记为可上传到第二存储介质;
将所述新的标记为可上传到第二存储介质的元信息存储到第二存储介质。
10.一种文件下载方法,包括:
接收文件下载请求;
根据所述文件下载请求,获取所述文件下载请求对应的元信息;
根据所述文件下载请求对应的元信息,定位所述文件下载请求对应的合并文件中的源文件;
从所述文件下载请求对应的合并文件中,下载所述文件下载请求所对应的源文件。
11.如权利要求10所述的方法,所述根据所述文件下载请求,获取所述文件下载请求对应的元信息,具体包括:
根据所述文件下载请求,从第二存储介质的元信息中,获取所述文件下载请求对应的元信息。
12.如权利要求10所述的方法,所述根据所述文件下载请求对应的元信息,定位所述文件下载请求对应的合并文件中的源文件,具体包括:
根据所述文件下载请求对应的元信息,从第一存储介质中,定位所述文件下载请求对应的合并文件中的源文件。
13.如权利要求10所述的方法,所述从所述文件下载请求对应的合并文件中,下载所述文件下载请求所对应的源文件,进一步包括:
下载所述文件下载请求所对应的源文件时,利用验证信息,对所述下载的源文件进行验证;
若所述验证信息验证成功,则从所述文件下载请求对应的合并文件中下载所述文件下载请求所对应的源文件;
若所述验证信息验证失败,则终止下载。
14.一种文件存储装置,包括:
接收单元,用于接收待存储的多个源文件;
处理单元,将所述待存储的多个源文件进行合并,得到一个或多个合并文件,并生成与所述合并文件中的源文件对应的元信息,其中所述元信息用于记录所述源文件与所述合并文件之间的对应关系;
存储单元,将所述合并文件存储于第一存储介质,所述元信息存储于第二存储介质,其中,所述第一存储介质的存储成本低于所述第二存储介质,所述第二存储介质的存储效率高于所述第一存储介质。
15.如权利要求14所述的装置,所述将所述待存储的多个源文件进行合并,得到一个或多个合并文件,并生成与所述合并文件中的源文件对应的元信息,具体包括:
在内存中按照预设格式将所述待存储的多个源文件进行合并,生成一个或多个合并文件,并生成与所述合并文件中的源文件对应的元信息,其中,所述预设格式为所述源文件在合并文件中的存储格式。
16.如权利要求15所述的装置,所述预设格式包含验证信息,用于从合并文件中下载源文件时对源文件进行验证,和/或包含头部信息,用于发生元信息丢失时,获取与合并文件中的源文件对应的元信息。
17.如权利要求14所述的装置,所述将所述待存储的多个源文件进行合并,得到一个或多个合并文件,并生成与所述合并文件中的源文件对应的元信息,进一步包括:
在内存中根据预设界限将所有的所述待存储的多个合并文件进行合并,生成一个或多个合并文件,并生成与所述合并文件中的源文件对应的元信息,其中,所述预设界限为合并多个源文件为一个合并文件的完成条件。
18.如权利要求17所述的装置,所述预设界限包括合并多个源文件过程中的源文件的数目和/或单个合并文件所占的存储容量和/或合并文件中的源文件对应的元信息所占的内存容量。
19.如权利要求14所述的装置,所述将所述待存储的多个源文件进行合并,得到一个或多个合并文件,并生成与所述合并文件中的源文件对应的元信息,进一步包括:
若在将所述待存储的多个源文件进行合并的过程中发生异常,则按照预设格式进行解析,从已经生成的合并文件中获取合并文件中的源文件对应的元信息以替换已经生成的元信息;
按照预设格式和/或预设界限对残留的源文件进行合并,得到一个或多个新的合并文件,并生成新的与所述合并文件中的源文件对应的元信息,其中,所述残留的源文件是所述待存储的多个源文件进行合并的过程中发生异常后未进行合并的源文件;
将所述已经生成的合并文件及所述新的合并文件共同构成合并文件,所述替换得到的元信息及所述新的元信息共同构成元信息。
20.如权利要求14所述的装置,所述将所述合并文件存储于第一存储介质,所述元信息存储于第二存储介质,具体包括:
将所述合并文件存储到第一存储介质,并将所述元信息的属性由不可上传到第二存储介质标记为可上传到第二存储介质;
将所述标记为可上传到第二存储介质的元信息存储到第二存储介质。
21.如权利要求14或20任一项所述的装置,所述将所述合并文件存储于第一存储介质,所述元信息存储于第二存储介质,进一步包括:
若在将所述合并文件存储于第一存储介质和/或所述元信息存储于第二存储介质的存储过程中发生异常,则按照预设格式解析残留文件后进行存储,其中,所述残留文件为所述存储过程中发生异常未进行存储的文件,所述残留文件包括合并文件和元信息。
22.如权利要求21所述的装置,所述若在将所述合并文件存储于第一存储介质和/或所述元信息存储于第二存储介质的存储过程中发生异常,则按照预设格式解析残留文件后进行存储,具体包括:
从所述残留文件的合并文件中,获取与残留的合并文件中的源文件对应的元信息,以替换所述残留文件中的元信息;
将所述残留的合并文件存储到第一存储介质,并将所述新的元信息的属性由不可上传到第二存储介质标记为可上传到第二存储介质;
将所述新的标记为可上传到第二存储介质的元信息存储到第二存储介质。
23.一种文件下载装置,包括:
接收单元,用于接收文件下载请求;
查找单元,获取所述文件下载请求对应的元信息,根据所述文件下载请求对应的元信息,定位所述文件下载请求对应的合并文件中的源文件;
下载单元,从所述文件下载请求对应的合并文件中,下载所述文件下载请求所对应的源文件。
24.如权利要求23所述的装置,所述根据所述文件下载请求,获取所述文件下载请求对应的元信息,具体包括:
根据所述文件下载请求,从第二存储介质中,获取所述文件下载请求对应的元信息。
25.如权利要求23所述的装置,所述根据所述文件下载请求对应的元信息,定位所述文件下载请求对应的合并文件中的源文件,具体包括:
根据所述文件下载请求对应的元信息,从第一存储介质中,定位所述文件下载请求对应的合并文件中的源文件。
26.如权利要求23所述的装置,所述从所述文件下载请求对应的合并文件中,下载所述文件下载请求所对应的源文件,进一步包括:
下载所述文件下载请求所对应的源文件时,利用验证信息,对所述下载的源文件进行验证;
若所述验证信息验证成功,则从所述文件下载请求对应的合并文件中下载所述文件下载请求所对应的源文件;
若所述验证信息验证失败,则终止下载。
27.一种电子设备,包括:
至少一个处理器;以及,
与所述至少一个处理器通信连接的存储器;其中,
所述存储器存储有可被所述至少一个处理器执行的指令,所述指令被所述至少一个处理器执行,以使所述至少一个处理器能够实现如权利要求1-9中任一项所述的文件存储和/或权利要求10-13中任一项所述的文件下载。
CN201910005177.3A 2019-01-03 2019-01-03 一种文件存储及下载方法、装置及设备 Active CN109739814B (zh)

Priority Applications (2)

Application Number Priority Date Filing Date Title
CN201910005177.3A CN109739814B (zh) 2019-01-03 2019-01-03 一种文件存储及下载方法、装置及设备
CN202310755098.0A CN116701317A (zh) 2019-01-03 2019-01-03 一种文件存储及下载方法、装置及设备

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201910005177.3A CN109739814B (zh) 2019-01-03 2019-01-03 一种文件存储及下载方法、装置及设备

Related Child Applications (1)

Application Number Title Priority Date Filing Date
CN202310755098.0A Division CN116701317A (zh) 2019-01-03 2019-01-03 一种文件存储及下载方法、装置及设备

Publications (2)

Publication Number Publication Date
CN109739814A true CN109739814A (zh) 2019-05-10
CN109739814B CN109739814B (zh) 2023-06-20

Family

ID=66363244

Family Applications (2)

Application Number Title Priority Date Filing Date
CN201910005177.3A Active CN109739814B (zh) 2019-01-03 2019-01-03 一种文件存储及下载方法、装置及设备
CN202310755098.0A Pending CN116701317A (zh) 2019-01-03 2019-01-03 一种文件存储及下载方法、装置及设备

Family Applications After (1)

Application Number Title Priority Date Filing Date
CN202310755098.0A Pending CN116701317A (zh) 2019-01-03 2019-01-03 一种文件存储及下载方法、装置及设备

Country Status (1)

Country Link
CN (2) CN109739814B (zh)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111597151A (zh) * 2020-05-20 2020-08-28 广州平云小匠科技有限公司 文件生成方法、装置、计算机设备和存储介质
CN113377424A (zh) * 2021-06-23 2021-09-10 支付宝(杭州)信息技术有限公司 一种安装包处理方法、装置以及设备
CN113377386A (zh) * 2021-06-23 2021-09-10 支付宝(杭州)信息技术有限公司 一种无解压的安装包安装方法、装置以及设备

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103678143A (zh) * 2012-09-25 2014-03-26 联想(北京)有限公司 文件存储方法、装置及电子设备
CN104731886A (zh) * 2015-03-12 2015-06-24 深圳市连用科技有限公司 一种海量小文件的处理方法及***
US20150237098A1 (en) * 2012-08-27 2015-08-20 Zte Corporation Method and system for content management
CN107729505A (zh) * 2017-10-23 2018-02-23 郑州云海信息技术有限公司 一种缓存中的小文件的获取方法、装置及可读存储介质

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20150237098A1 (en) * 2012-08-27 2015-08-20 Zte Corporation Method and system for content management
CN103678143A (zh) * 2012-09-25 2014-03-26 联想(北京)有限公司 文件存储方法、装置及电子设备
CN104731886A (zh) * 2015-03-12 2015-06-24 深圳市连用科技有限公司 一种海量小文件的处理方法及***
CN107729505A (zh) * 2017-10-23 2018-02-23 郑州云海信息技术有限公司 一种缓存中的小文件的获取方法、装置及可读存储介质

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111597151A (zh) * 2020-05-20 2020-08-28 广州平云小匠科技有限公司 文件生成方法、装置、计算机设备和存储介质
CN113377424A (zh) * 2021-06-23 2021-09-10 支付宝(杭州)信息技术有限公司 一种安装包处理方法、装置以及设备
CN113377386A (zh) * 2021-06-23 2021-09-10 支付宝(杭州)信息技术有限公司 一种无解压的安装包安装方法、装置以及设备
CN113377386B (zh) * 2021-06-23 2022-10-18 支付宝(杭州)信息技术有限公司 一种无解压的安装包安装方法、装置以及设备

Also Published As

Publication number Publication date
CN116701317A (zh) 2023-09-05
CN109739814B (zh) 2023-06-20

Similar Documents

Publication Publication Date Title
US11768636B2 (en) Generating a transformed dataset for use by a machine learning model in an artificial intelligence infrastructure
EP3862864B1 (en) Ensuring reproducibility in an artificial intelligence infrastructure
US10452444B1 (en) Storage system with compute resources and shared storage resources
US11966841B2 (en) Search acceleration for artificial intelligence
US11100420B2 (en) Input processing for machine learning
US20150379425A1 (en) Consistent filtering of machine learning data
CN108733546A (zh) 一种日志采集方法、装置及设备
US20190129818A1 (en) Calibration of flash channels in ssd
CN107038206A (zh) Lsm树的建立方法、lsm树的数据读取方法和服务器
CN109739814A (zh) 一种文件存储及下载方法、装置及设备
CN109615495A (zh) 一种数据的对账方法、装置、设备及***
CN104714858A (zh) 数据备份方法及装置、数据恢复方法及装置
CN109407964A (zh) 一种数据的迁移方法、装置及设备
CN110347651A (zh) 基于云存储的数据同步方法、装置、设备及存储介质
CN108334515A (zh) 一种处理崩溃文件中堆栈地址的方法、装置及***
CN109344348A (zh) 一种资源更新方法及装置
US10359964B2 (en) Reducing time to read many files from tape
CN107577697A (zh) 一种数据处理方法、装置及设备
CN109299096A (zh) 一种流水数据的处理方法、装置及设备
CN107016039A (zh) 数据库写入的方法和数据库***
CN107633008A (zh) Web工程数据处理方法、装置、服务器及***
Ganelin et al. Spark: Big data cluster computing in production
CN110134735A (zh) 分布式事务日志的存储方法及装置
CN109597678A (zh) 任务处理方法及装置
CN109166021A (zh) 记账方法、装置及业务财务一体化***

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
TA01 Transfer of patent application right
TA01 Transfer of patent application right

Effective date of registration: 20201014

Address after: Cayman Enterprise Centre, 27 Hospital Road, George Town, Grand Cayman Islands

Applicant after: Advanced innovation technology Co.,Ltd.

Address before: A four-storey 847 mailbox in Grand Cayman Capital Building, British Cayman Islands

Applicant before: Alibaba Group Holding Ltd.

Effective date of registration: 20201014

Address after: Cayman Enterprise Centre, 27 Hospital Road, George Town, Grand Cayman Islands

Applicant after: Innovative advanced technology Co.,Ltd.

Address before: Cayman Enterprise Centre, 27 Hospital Road, George Town, Grand Cayman Islands

Applicant before: Advanced innovation technology Co.,Ltd.

GR01 Patent grant
GR01 Patent grant