CN115408478A - 一种共享实验仪器的数据存储和管理***、方法 - Google Patents

一种共享实验仪器的数据存储和管理***、方法 Download PDF

Info

Publication number
CN115408478A
CN115408478A CN202211074151.2A CN202211074151A CN115408478A CN 115408478 A CN115408478 A CN 115408478A CN 202211074151 A CN202211074151 A CN 202211074151A CN 115408478 A CN115408478 A CN 115408478A
Authority
CN
China
Prior art keywords
data
instrument
experimental
folder
shared
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202211074151.2A
Other languages
English (en)
Other versions
CN115408478B (zh
Inventor
刘育恒
李南
杨吉健
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Westlake University
Original Assignee
Westlake University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Westlake University filed Critical Westlake University
Priority to CN202211074151.2A priority Critical patent/CN115408478B/zh
Publication of CN115408478A publication Critical patent/CN115408478A/zh
Application granted granted Critical
Publication of CN115408478B publication Critical patent/CN115408478B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/28Databases characterised by their database models, e.g. relational or object models
    • G06F16/283Multi-dimensional databases or data warehouses, e.g. MOLAP or ROLAP
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/10File systems; File servers
    • G06F16/17Details of further file system functions
    • G06F16/176Support for shared access to files; File sharing support
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/27Replication, distribution or synchronisation of data between databases or within a distributed database system; Distributed database system architectures therefor

Landscapes

  • Engineering & Computer Science (AREA)
  • Databases & Information Systems (AREA)
  • Theoretical Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Computing Systems (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本申请涉及一种共享实验仪器的数据存储和管理***、方法,管理员端响应于管理员的注册请求,使得在仪器端的本地存储路径自动构建该共享实验仪器的共享文件夹。仪器端响应于用户的仪器用户注册请求,在共享实验仪器的共享文件夹下创建该用户的同步文件夹。数据库保存定义各个平台下各个共享实验仪器的注册用户的信息项。数据仓库包括数据服务器,且以分布式存储方式保存从同步文件夹上传的实验数据,使得每次实验的实验数据作为节点无损且无畸变地存储。处理服务器根据数据服务器中的存储状况,确定同步文件夹的实验数据在数据服务器的上传地址并传输给仪器端。如此,能够进行统一高效的管理,增加数据的安全性,实现中央化数据管理。

Description

一种共享实验仪器的数据存储和管理***、方法
技术领域
本申请涉及数据存储技术领域,更具体地,涉及一种共享实验仪器的数据存储和管理***、方法。
背景技术
在高校、科研所、实验室等机构普遍存在大型实验设备,实验设备会产生实验数据,实验人员需要保存部分或全部的实验数据以便后续使用,在学术上,遇到质疑时最有力的回击方式之一就是提供原始实验数据。遗憾的是,并不是所有原始实验数据都能被很好地保存。一方面,实验数据往往记载在纸上,时间一长比较容易受损或者丢失。另一方面,在管理不善的情况下,实验数据或许会被实验同学有意无意的修改,没有办法给出最原始的那份数据。
传统方式采用U盘/移动硬盘进行数据的保存和传输,需要实验仪器开放USB口,用户带来的U盘会增加数据安全风险,如果发生中毒/数据泄露/数据锁定等安全事故时,会对实验仪器后续的使用造成较大的影响。当实验数据量过大时,传统U盘/移动硬盘无法承载庞大的数据量,如果保存不善,也会造成数据丢失。
目前大多数实验设备本身的存储能力有限,因此需要一个中央化的存储管理***及服务器,现有nas存储服务器可以解决此类问题,但使用nas服务器存储映射对网络状态要求较高,当网络不稳定或IO数据量较大时,会出现输出到网盘失败的情况,造成诸如网络驱动器掉线、输出软件崩溃的现象。如果是公共大型仪器设备,无法有效自动化的将数据分发到特定实验组或实验人员的手中,需要实验人员手动上传数据。公共实验设备的实验人员在上传数据时,互相之间容易发生登录登出不及时、上传至错误的用户账户下等问题。数据量较大时,上传和下载均需要比较长的时间,在没有自动化传输的情况下效率低下。实验人员比较多时,比如高校实验室等机构,大多采用网盘上传、U盘/移动硬盘存储等方式,管理混乱,数据找回时容易发生无法追溯到具体人员。
发明内容
提供了本申请以解决现有技术中存在的上述问题。需要一种共享实验仪器的数据存储和管理***、方法,其能够提高数据存储管理的便捷性和存储资源分配的合理性,能够增加数据的安全性,以实现中央化数据管理,方便数据运维。
根据本申请的第一方案,提供一种共享实验仪器的数据存储和管理***,包括管理员端、仪器端、数据仓库、数据库和至少一个处理服务器,其中,所述仪器端与所述共享实验仪器位于相同的通信区域内,使得两者之间的通信速度高于阈值,所述数据库设置于所述至少一个处理服务器或与之通信,所述管理员端配置为:响应于管理员的包含待注册的共享实验仪器的名称、所属平台和实验数据在所述仪器端的本地存储路径的仪器注册请求,使得在所述仪器端的所述本地存储路径自动构建该共享实验仪器的共享文件夹。所述仪器端配置为:响应于用户的仪器用户注册请求,在所述共享实验仪器的共享文件夹下创建该用户的同步文件夹;在所述用户的同步文件夹中,存储该用户使用所述共享实验仪器的各次实验生成的实验数据;通过与所述至少一个处理服务器进行定期通信,以无损且无畸变的方式,向所述数据仓库中的上传地址上传同步文件夹中的各个节点的实验数据。所述数据库配置为:保存定义各个平台下各个共享实验仪器的注册用户的信息项。所述数据仓库包括至少一个数据服务器,且以分布式存储方式保存从所述同步文件夹上传的实验数据,使得每次实验的实验数据作为节点无损且无畸变地存储。所述至少一个处理服务器配置为:根据所述至少一个数据服务器中的存储状况,确定所述同步文件夹的实验数据在所述至少一个数据服务器的上传地址并传输给所述仪器端。
根据本申请的第二方案,提供一种共享实验仪器的数据存储和管理方法,通过管理员端响应于管理员的包含待注册的共享实验仪器的名称、所属平台和实验数据在所述仪器端的本地存储路径的仪器注册请求,使得在所述仪器端的所述本地存储路径自动构建该共享实验仪器的共享文件夹。通过仪器端响应于用户的仪器用户注册请求,在所述共享实验仪器的共享文件夹下创建该用户的同步文件夹;在所述用户的同步文件夹中,存储该用户使用所述共享实验仪器的各次实验生成的实验数据。通过与所述至少一个处理服务器进行定期通信,以无损且无畸变的方式,向所述数据仓库中的上传地址上传同步文件夹中的各个节点的实验数据,所述仪器端与所述共享实验仪器位于相同的通信区域内,使得两者之间的通信速度高于阈值。通过数据库保存定义各个平台下各个共享实验仪器的注册用户的信息项,其中,所述数据库设置于至少一个处理服务器或与之通信;通过数据仓库的至少一个数据服务器,且以分布式存储方式保存从所述同步文件夹上传的实验数据,使得每次实验的实验数据作为节点无损且无畸变地存储。通过至少一个处理服务器根据所述至少一个数据服务器中的存储状况,确定所述同步文件夹的实验数据在所述至少一个数据服务器的上传地址并传输给所述仪器端。
与现有技术相比,本申请实施例的有益效果在于:
本申请实施例提供的数据存储和管理***,通过管理员端、仪器端、数据仓库、数据库和至少一个处理服务器的配合可以协助实验人员自动上传实验数据,同时,通过管理员端能够对不同用户、实验仪器以及实验数据等实验相关数据进行统一高效的管理,提高实验数据操作的灵活性,提升存储资源分配的合理性,增加数据的安全性,有效节约实验人员对数据的操作时间,实现中央化数据管理,方便数据运维。仪器端与所述至少一个处理服务器进行定期通信,以无损且无畸变的方式,向所述数据仓库中的上传地址上传同步文件夹中的各个节点的实验数据,以实现对实验原始数据的存储,并以各个节点有利于数据可控,提高资源利用效率。
上述说明仅是本申请技术方案的概述,为了能够更清楚了解本申请的技术手段,而可依照说明书的内容予以实施,并且为了让本申请的上述和其它目的、特征和优点能够更明显易懂,以下特举本申请的具体实施方式。
附图说明
在不一定按比例绘制的附图中,相同的附图标记可以在不同的视图中描述相似的部件。附图大体上通过举例而不是限制的方式示出各种实施例,并且与说明书以及权利要求书一起用于对所公开的实施例进行说明。在适当的时候,在所有附图中使用相同的附图标记指代同一或相似的部分。这样的实施例是例证性的,而并非旨在作为本装置或方法的穷尽或排他实施例。
图1示出根据本申请实施例的数据存储和管理***的框图。
图2示出根据本申请实施例的数据存储和管理***仪器注册界面图;
图3示出根据本申请实施例的数据存储和管理***的数据处理器的存储状态的界面示意图。
图4示出根据本申请实施例中的数据存储和管理***的数据库中存储的实验数据的存储表。
图5示出根据本申请实施例的共享实验仪器的数据存储和管理方法流程图。
具体实施方式
为使本领域技术人员更好的理解本申请的技术方案,下面结合附图和具体实施方式对本申请作详细说明。下面结合附图和具体实施例对本申请的实施例作进一步详细描述,但不作为对本申请的限定。本文中所描述的各个步骤,如果彼此之间没有前后关系的必要性,则本文中作为示例对其进行描述的次序不应视为限制,本领域技术人员应知道可以对其进行顺序调整,只要不破坏其彼此之间的逻辑性导致整个流程无法实现即可。
本申请中使用的“第一”、“第二”以及类似的词语并不表示任何顺序、数量或者重要性,而只是用来区分。本申请中使用的“包括”或者“包含”等类似的词语意指在该词前的要素涵盖在该词后列举的要素,并不排除也涵盖其他要素的可能。在本申请中,各个步骤在图中所示的箭头仅仅作为执行顺序的示例,而不是限制,本申请的技术方案并不限于实施例中描述的执行顺序,执行顺序中的各个步骤可以合并执行,可以分解执行,可以调换顺序,只要不影响执行内容的逻辑关系即可。
本申请使用的所有术语(包括技术术语或者科学术语)与本申请所属领域的普通技术人员理解的含义相同,除非另外特别定义。还应当理解,在诸如通用字典中定义的术语应当被解释为具有与它们在相关技术的上下文中的含义相一致的含义,而不应用理想化或极度形式化的意义来解释,除非这里明确地这样定义。对于相关领域普通技术人员已知的技术、方法和设备可能不作详细讨论,但在适当情况下,所述技术、方法和设备应当被视为说明书的一部分。
包含在说明书中并构成说明书的一部分的附图示出了本申请的实施例,并且与上面给出的对本申请的大致描述以及下面给出的对实施例的详细描述一起用于解释本申请的原理。
此后参照附图描述本申请的具体实施例;然而,应当理解,所公开的实施例仅仅是本申请的实例,其可采用多种方式实施。熟知和/或重复的功能和结构并未详细描述以避免不必要或多余的细节使得本申请模糊不清。因此,本文所公开的具体的结构性和功能性细节并非意在限定,而是仅仅作为权利要求的基础和代表性基础用于教导本领域技术人员以实质上任意合适的详细结构多样地使用本申请。
图1示出根据本申请实施例所述的数据存储和管理***的框图。所述数据存储和管理***100包括管理员端101、仪器端102、数据仓库103、数据库104和至少一个处理服务器105。其中,管理员端101、仪器端102、数据仓库103、数据库104可以通过局域网或广域网通信连接。局域网或广域网内可以包含多个实验平台(例如医学实验平台),每个实验平台包括多个实验(或科研)组,每个实验组包括多个实验人员,每个实验组可以采用多个实验仪器进行实验。
其中,所述仪器端102与所述共享实验仪器位于相同的通信区域内,使得两者之间的通信速度高于阈值。实验人员利用共享实验仪器进行实验时,比如操作显微镜等,会产生相应的实验数据,共享实验仪器产生的实验数据直接生成在对应的主机上,而不是将获得的实验数据直接存到数据仓库103。如此,仪器端102与共享实验仪器位于相同的通信区域内,比如处于局域网内,以使得两者之间的通信速度高于阈值,在此情况下,共享实验仪器产生的实验数据能够被及时的、迅速的传输到仪器端102,从而在诸如互联网的广域网断网的情况下也能够持续进行实验数据的传输,保存住共享实验仪器产生的实验数据,避免实验数据丢失。在一些实施例中,仪器端102也可以直接整合在共享实验仪器的主机中。
相比于将共享实验仪器产生的实验数据直接传输到数据仓库103,在同一个交换机下或者相同区域内,仪器端12和共享实验仪器之间的通信速度高于阈值,并保持实验数据传输速度的稳定,使得实验数据完整的保存下来。其中,所述阈值可以是用户设定的也可以是数据存储和管理***100默认的数值,对此不做限定。
所述数据库104设置于所述至少一个处理服务器105或与之通信,数据库104可以设置在一个或多个处理服务器上105上,也可以是独立设置且与处理服务器105进行通信,以使得处理服务器105能够获得数据库104中的数据,或者对其进行编辑和改写。
其中,所述管理员端101配置为响应于管理员的包含待注册的共享实验仪器的名称、所属平台和实验数据在所述仪器端102的本地存储路径的仪器注册请求,使得在所述仪器端102的所述本地存储路径自动构建该共享实验仪器的共享文件夹。比如,图2所示,管理员注册仪器用户,包括MACHINE NAME:输入该机器的名称,例如8_MPMS3;PATH:实验数据在所述仪器端102的本地存储路径,点击PATH(路径),选择或新建该共享实验仪器的共享文件夹。PLATFROM:选择共享实验仪器所在的平台。管理员端101在所述仪器端102的所述本地存储路径自动构建该共享实验仪器的共享文件夹,基于所述本地存储路径构建的共享文件夹,能够完整的保存实验数据,保存完之后再向联网的数据仓库103去上传。如果广域网突然断网,仪器端102不会停止继续生成和向本地的共享文件夹上传实验数据,而存储在本地的实验数据也不会因断网丢失。
所述仪器端102配置为响应于用户的仪器用户注册请求,在所述共享实验仪器的共享文件夹下创建该用户的同步文件夹,在所述用户的同步文件夹中,存储该用户使用所述共享实验仪器的各次实验生成的实验数据。具体来说,当各共享实验仪器接入数据存储和管理***100(比如接入对应的实验平台或实验组)后,用户在共享实验仪器上进行注册,注册完成后,仪器端102在共享文件夹下创建该用户的同步文件夹。实验用户在利用共享实验仪器进行实验的过程中,共享实验仪器不断的生成实验数据并将生成的实验数据存储在本地的同步文件夹,如此,能够对共享实验仪器生成的实验原始数据进行完整的保存。
所述仪器端102通过与所述至少一个处理服务器105进行定期通信,以无损且无畸变的方式,向所述数据仓库103中的上传地址上传同步文件夹中的各个节点的实验数据。比如,仪器端102向数据仓库103发送数据上传请求,数据仓库103在接收到该数据上传请求后,将数据上传请求转发至处理服务器105,处理服务器105根据共享实验仪器的IP地址、数据仓库103的存储容量等信息确定出仪器端102向数据仓库103的上传地址,并将该上传地址发送到仪器端102。仪器端102通过与处理服务器105之间的定期通信,获得包括上传地址在内的各项实验相关信息。基于所述上传地址,仪器端102以无损且无畸变的方式,将各个共享实验仪器产生的各个节点的实验数据无压缩的上传到数据仓库103,以实现仪器端102的本地存储与数据仓库103之间的实验数据的同步。
所述数据库104配置为保存定义各个平台下各个共享实验仪器的注册用户的信息项,其中,信息项包括但不限于各共享实验仪器的仪器数据以及与所述共享实验仪器相关的实验用户数据。共享实验仪器数据包括但不限于仪器名称、仪器所属平台、mac地址、所在IP、用户、组、文件地址信息等;共享实验用户数据可以包括实验用户的用户名、用户所在的实验组等实验用户数据。
所述数据仓库103包括至少一个数据服务器106,且以分布式存储方式保存从所述同步文件夹上传的实验数据,使得每次实验的实验数据作为节点无损且无畸变地存储。比如,数据服务器A、数据服务器B和数据服务器C共同用于构建数据仓库103,此时,数据仓库103获取实验数据并将实验数据以分布式存储的方式存储在数据服务器A、数据服务器B和数据服务器C中的至少一个中。具体地,可以基于数据服务器A、数据服务器B和数据服务器C的剩余存储空间,对实验数据进行分配,以使得保持数据服务器A、数据服务器B和数据服务器C存储空间的动态平衡。
在同一台共享实验仪器上,每一次实验得到的实验数据大小几乎是相同,因此,以每次实验的实验数据作为节点,以使得每个节点的存储量可控,如此,有利于在多个数据服务器106的存储上实现动态平衡,有利于充分利用各个数据服务器106,防止各个数据服务器106意外爆仓。各个用户在存储各实验原始数据的时候,管理存储和管理***100会记录各实验原始数据对应的文件路径。将每次实验的实验数据作为节点无损且无畸变地存储,不加密不做碎片化不做压缩,既能够对实验原始数据进行无损存储,又便于在数据库104发生损毁时,通过反推重建数据库104。
所述至少一个处理服务器105配置为根据所述至少一个数据服务器106中的存储状况,确定所述同步文件夹的实验数据在所述至少一个数据服务器106的上传地址并传输给所述仪器端102。用户在使用共享实验仪器时可以根据实验节点自动创建空白的同步文件夹,然后将生成的实验原始数据存储至同步文件夹中,并向数据仓库103发送数据上传请求,数据上传请求中携带有同步文件夹相关信息,处理服务器105根据数据仓库103接收的同步文件夹的相关信息(包括实验原始数据的大小)以及数据仓库103中各个数据服务器106的存储状况,确定用于存储该实验原始数据的数据服务器106的位置(上传地址),并将上传地址返回至仪器端102,仪器端102根据返回的上传地址,将实验节点对应的实验原始数据上传至数据仓库103,从而实现实验原始数据的网络存储。
在本申请的一些实施例中,所述至少一个数据仓库103包括至少两个数据服务器106(例如数据服务器106的数量也可以根据实际需求而动态增加,诸如通过动态扩展增添数据服务器106),并与处理服务器105通信连接,以满足大量实验相关数据的存储。所述至少一个处理服务器105进一步配置为获取各个数据服务器106中的存储剩余容量,确定存储剩余容量最多的数据服务器106中的存储地址。如图3所示,数据仓库103包括两个数据服务器106分别为数据服务器1和数据服务器2,其中,数据服务器1已占用存储容量仅为8.42%,而数据服务器2已占用存储容量13.08%,此时,数据服务器1的存储剩余容量最多,本地存储的同步文件夹中的实验数据将会被分配存储到数据服务器1中。如此类推,根据数据服务器106的剩余存储容量,对上传到数据仓库104中的实验数据进行合理分配的存储,能够保持数据仓库104中各个数据服务器106的存储的动态平衡,从而充分利用各个数据服务器106。
所述至少一个处理服务器105确定出存储剩余容量最多的数据服务器106中的存储地址,并确定与所述存储地址相对应的上传地址。其中,上传地址可以理解为将本地存储的同步文件夹中的实验数据上传到数据仓库104的网络地址,上传地址包括但不限于所述数据服务器106的传输端口、传输地址、传输ID等。而存储地址可以理解为将数据仓库104获取的实验数据存储在数据仓库104中的哪一个数据服务器106的哪一个单元的哪一个字段。
具体地,比如,处理服务器105可以是至少1台linux***计算服务器,***采用CentOS7,并配置处理服务器105的IP地址,服务器配置如下:
AMD EPYC 7502处理器*2颗、128G(64G*2)DDR4内存、2块*480GIntel 4610SSD、4G缓存超级电容模块、2端口万兆光口网卡(含光模块)、4端口千兆电口网卡。
配置好处理服务器105后,可以配置数据服务器106,数据服务器106可以是至少2台linux***存储服务器,***采用CentOS7,数据服务器106的所有服务器连接到同一台交换机上,并与处理服务器105连接到同一网络内,保证处理服务器105和数据服务器106之间的可靠连通。
配置数据服务器106的IP地址,服务器配置如下:处理器采用Intel Xeon4210(2.2GHz/10核)*2颗、128G(64G*2)DDR4 ECC内存、2块*480G Intel4610SSD、12块*12TBSATA 7.2K LFF硬盘、12Gb 2端口SAS RAID卡、4G缓存超级电容模块、2端口万兆光口网卡(含光模块)、4端口千兆电口网卡。
在本申请的一些实施例中,所述至少一个数据服务器106进一步配置为在确定上传地址后,在所述数据库104中添加对应的信息项,所述信息项包括所述同步文件夹在所述仪器端102的本地存储路径、各个节点的实验数据对应的存储地址、所述信息项的创建时间和更新时间。仪器端102的本地存储的实验数据上传到数据仓库103以后,会在数据库104中留下对应的信息项,至少记载本地存储的实验数据存储在数据服务器106中的位置。如图4所示,表中,path表示实验节点,dir表示数据存储的类型,如果是1,以目录的形式存储,如果是0,表示直接以文件的形式存储于对应的文件夹中,server表示数据存储的存储服务器型号。使用用户查看数据时,可以直接根据实验节点查看存储的数据,并进行数据的存取,方便实验数据的存储管理。所述信息项包括但不限于同步文件夹在所述仪器端102的本地存储路径(Path)、各个节点的实验数据对应的存储地址(storage1 or storage2)、所述信息项的创建时间(createtime)和更新时间(updatetime)。在每次确定上传地址之后,在数据库104中添加对应的信息项,以对数据库104进行更新。如此,如果数据库104中存在某一节点的实验数据的信息项,则能够知晓该节点的实验数据中已经被上传到数据仓库103。
在本申请的一些实施例中,所述至少一个处理服务器105进一步配置为在任何一个数据服务器106中的存储剩余容量低于预设容量的情况下,向所述仪器端102传输停止上传指令,其中,所述预设容量对应于节点的实验数据修改所需的容量增量。具体来说,比如图3中的数据服务器1或数据服务器2的存储剩余容量低于5%,此时,处理服务器105向仪器端102传输停止上传指令,仪器端102在接收到停止上传指令之后,停止向数据服务器1和数据服务器2上传实验数据。通过设置预设容量,以满足用户对节点的实验数据进行修改的需求。假设预设容量为5%,图3所示的数据服务器1或数据服务器2的存储剩余容量低于5%时,仪器端102不再向数据服务器1和数据服务器2上传实验数据,如果此时用户对10天前的节点的实验数据进行修改,修改后的节点的实验数据被同步到数据服务器1或数据服务器2,而原数据服务器1或数据服务器2的预设容量5%能够存储由于修改节点的实验数据增加的容量,增加的这部分容量即为容量增量。
在本申请的一些实施例中,所述至少一个数据仓库103包括至少两个数据服务器106,所述至少一个处理服务器105进一步配置为确定所述至少两个数据服务器106中是否存在与所述仪器端102处于相同的通信区域内的数据服务器106,如果有,则确定该相同的通信区域内的数据服务器106中的存储地址并确定与所述存储地址对应的上传地址,其中,所述相同的通信区域包括同个局域网内或通过同个交换机通信的区域。数据仓库103包括至少两个数据服务器106,在确定数据服务器106的存储地址的过程中,可以先确定存储剩余容量最多的数据服务器106中的存储地址,如果有两个数据服务器106的存储剩余容量最多且存储剩余容量相同,则判断这两个数据服务器106与仪器端102是否处于相同的通信区域内,并优先选择与仪器端102处于相同的通信区域内的数据服务器106中的存储地址。此外,也可以在确定数据服务器106的存储地址时,首先确定出与仪器端102处于相同通信区域的数据服务器106的存储地址,如果与仪器端102处于相同通信区域的数据服务器106有多个,则可以选择存储剩余容量最大的数据服务器106用于存储上传至数据仓库103的实验数据。具体来说,比如,学生在本校区的仪器端102完成实验并对实验数据进行上传,此时,优先选择本校区内的数据服务器106存储实验数据,相比于跨校区存储实验数据,数据传输的速度更快且稳定。
在本申请的一些实施例中,所述数据库104进一步配置为保存信息项,所述信息项包括所述同步文件夹在所述仪器端102的本地存储路径、各个节点的实验数据对应的存储地址、所述信息项的创建时间和更新时间,具体如上所述,在此不再赘述。所述仪器端102进一步配置为向所述至少一个处理服务器105请求共享实验仪器的注册用户信息,即仪器端102向处理服务器105发出请求,以获得该共享实验仪器的注册用户信息,比如所述注册用户信息包括但不限于注册用户名称和注册时间。
所述至少一个处理服务器105进一步核对在所述仪器端102的所述本地存储路径下的共享文件夹下的同步文件夹有无遗漏注册用户的同步文件夹,如果有则添加注册用户的同步文件夹。数据库104保存有信息项,所述信息项可以以列表的形式记录该共享实验仪器的注册用户。处理服务器105将从数据库104获取的信息项列表反馈给仪器端102,并由仪器端102对本地存储路径下的共享文件夹下的同步文件夹进行核对。如果数据库104中的信息项中记载有同步文件夹的存储信息项,则说明仪器端102的本地存储路径下的共享文件夹下的同步文件夹有遗漏,则需要在仪器端102的本地存储路径添加遗漏的注册用户的同步文件夹。
在本申请的一些实施例中,所述至少一个处理服务器105进一步配置为基于所述数据库104保存的所述信息项,确定所述信息项中包含的节点的实验数据在所述仪器端102中缺失的同步文件夹。基于缺失的同步文件夹对应的信息项的创建时间,来确定缺失相较于创建时间的发生时差,在发生时差在第一预定时间的范围内时,删除所述数据库104中的对应的信息项,但在第二预定时间内保留所述数据仓库104中对应存储地址的节点的实验数据,其中,所述第一预定时间使得能够完成所述共享实验仪器的单个实验。具体来说,仪器端102向所述数据库104请求信息项,并基于所述信息项核对仪器端102本地存储路径下的注册用户信息,以确定出仪器端102中缺失的同步文件夹。假设,如果该缺失的同步文件夹在数据库104中对应的信息项的创建时间(如图4所示的createtime)是2022-4-27 09:24:34,而在处理服务器105核对数据库104中的信息项和仪器端102的本地存储时,于2022-4-2719:24:34确定仪器端102存在缺失的同步文件夹,此时,确定缺失的同步文件夹发生的时间和缺失的同步文件夹对应的信息项的创建时间的时间差小于第一预定时间(假设第一预定时间为24小时),则认为用户故意删除了在仪器端102的该缺失的同步文件夹,删除的原因可能是实验有误导致实验数据无效。在第一预定时间内,用户故意删除了在仪器端102的同步文件夹,此时,直接删除数据库104中与被删除的同步文件夹对应的信息项即可。其中,核对可以基于信息项中的同步文件夹在所述仪器端的本地存储路径(path)和用户文件夹名,或者其他信息,对此不做具体限定,只要能够确定已经记载在数据库104中的信息项对应的同步文件夹在仪器端102发生缺失即可。
此外,仪器端102是将本地存储的同步文件夹中节点的实验数据上传到数据仓库103之后在数据库104中产生与该节点的实验数据对应的信息项。也就是说,先完成仪器端102与数据仓库103的同步,再对仪器端102与数据库104中的信息项进行核对。核对之后,如果发现在第一预定时间内仪器端102的本地缺失同步文件夹,此时,直接删除所述数据库104中对应的缺失同步文件夹的信息项。但是,却在第二预定时间(注意第二预定时间大于第一预定时间)内保留所述数据仓库103中对应存储地址的节点的实验数据,以防止误删本地的同步文件夹。比如,第一预定时间为24小时,第二预定时间为7天,如果在24小时内在仪器端102出现误删,此时,虽然会删除数据库104中删除的同步文件夹对应的信息项,但是,删除的同步文件夹节点的实验数据依然会在数据仓库103中保留7天,7天之后扫描删除已经被删除的同步文件夹节点的实验数据。
其中,所述第一预定时间和第二预定时间可以是用户自行设定的时间,也可以是***默认的时间,用户可以基于实际需要对其进行修改。对于第一预定时间和第二预定时间的具体数值不做限定。
在本申请的一些实施例中,所述仪器端102的所述本地存储路径下存储有第一文件和第二文件,所述第一文件存储有所述本地存储路径下的目录或文件夹的创建时间,所述第二文件存储有所述本地存储路径下的目录或文件夹的最新修改时间。具体地,第一文件为numcreate.sys,第二文件为num.sys。所述仪器端102进一步配置为在与所述至少一个处理服务器105进行定期通信的情况下,通过读取至少第二文件,来核对是否有目录或文件夹的最新修改时间在当前通信时间与先前通信时间之间,如果是才上传节点的实验数据,否则不上传。具体来说,比如仪器端102与处理服务器105每隔一段时间进行定期通信,核对数据库104中存在的信息项与仪器端102本地存储的注册用户信息是否对应以实现数据库104与仪器端102两者之间的信息同步。假设,仪器端102与处理服务器105在第一时间进行了通信,经过一段时间,在第二时间进行了通信。仪器端102在本地即可核对第二文件的最新修改时间,如果在第一时间和第二时间之间,第二文件的最新修改时间发生变化,即意味着对本地存储路径下的目录或文件夹进行了修改,此时,修改后的目录或文件夹包含最新实验数据,并将修改后的目录或文件夹节点的实验数据进行上传。如果在第一时间和第二时间之间,第二文件的目录或文件夹修改时间没有发生变化,则说明无需对实验数据进行更新,则不必上传在第一时间和第二时间之间的目录或文件夹节点的实验数据。
其中,在核对是否对目录或文件夹进行修改时,只需要进行本地校验第二文件的修改时间即可,仪器端102无需与处理服务器105通信,大幅度减少了仪器端102和处理服务器105之前的通信量,提高了通信效率。
在本申请的一些实施例中,所述至少一个处理服务器105进一步配置为获取所述第一文件中的目录或文件夹的创建时间和其中的数据删除情况,如果在目录或文件夹的创建时间起第一预定时间内发生了其中的数据删除,则使得所述数据仓库103中对应的存储地址也删除对应数据,如果在目录或文件夹的创建时间起第一预定时间期满后发生了其中的数据删除,则在第二预定时间(大于第一预定时间)内保留所述数据仓库103中对应的存储地址的对应数据。具体地,以第一预定时间为24小时,第二预定时间为7天为例进行说明。假设第一文件中的目录或文件夹的创建时间起24小时内发生了数据删除,则说明被删除的数据有误,为无效数据,此时,相应的,数据仓库103中对应的存储地址也删除对应数据。如果第一文件中目录或文件夹创建时间起24小时后删除了第一文件中的数据,则***能够识别出超过24小时之后的数据删除行为是为了清理本地存储空间,此时,数据仓库103仍然将对应的存储地址的对应数据保留7天,以防止用户反悔。
图5示出根据本申请实施例的共享实验仪器的数据存储和管理方法流程图。在步骤S501,通过管理员端响应于管理员的包含待注册的共享实验仪器的名称、所属平台和实验数据在所述仪器端的本地存储路径的仪器注册请求,使得在所述仪器端的所述本地存储路径自动构建该共享实验仪器的共享文件夹。在步骤S502,通过仪器端响应于用户的仪器用户注册请求,在所述共享实验仪器的共享文件夹下创建该用户的同步文件夹;在所述用户的同步文件夹中,存储该用户使用所述共享实验仪器的各次实验生成的实验数据;通过与所述至少一个处理服务器进行定期通信,以无损且无畸变的方式,向所述数据仓库中的上传地址上传同步文件夹中的各个节点的实验数据,所述仪器端与所述共享实验仪器位于相同的通信区域内,使得两者之间的通信速度高于阈值。在步骤503,通过数据库保存定义各个平台下各个共享实验仪器的注册用户的信息项,其中,所述数据库设置于至少一个处理服务器或与之通信。在步骤S504,通过数据仓库的至少一个数据服务器,且以分布式存储方式保存从所述同步文件夹上传的实验数据,使得每次实验的实验数据作为节点无损且无畸变地存储。在步骤S505,通过至少一个处理服务器根据所述至少一个数据服务器中的存储状况,确定所述同步文件夹的实验数据在所述至少一个数据服务器的上传地址并传输给所述仪器端。如此,通过管理员端、仪器端、数据仓库、数据库和至少一个处理服务器的配合可以协助实验人员自动上传实验数据,同时,通过管理员端能够对不同用户、实验仪器以及实验数据等实验相关数据进行统一高效的管理,提高实验数据操作的灵活性,提升存储资源分配的合理性,增加数据的安全性,有效节约实验人员对数据的操作时间,实现中央化数据管理,方便数据运维。
本申请的各个实施例中结合数据存储和管理***100(包括管理员端101、仪器端102、数据仓库103、数据库104和至少一个处理服务器105)说明的数据存储和管理方法的各个步骤均可以结合于此,形成数据存储和管理方法的对应实施例,在此不赘述。
此外,尽管已经在本文中描述了示例性实施例,其范围包括任何和所有基于本申请的具有等同元件、修改、省略、组合(例如,各种实施例交叉的方案)、改编或改变的实施例。权利要求书中的元件将被基于权利要求中采用的语言宽泛地解释,并不限于在本说明书中或本申请的实施期间所描述的示例,其示例将被解释为非排他性的。因此,本说明书和示例旨在仅被认为是示例,真正的范围和精神由以下权利要求以及其等同物的全部范围所指示。
以上描述旨在是说明性的而不是限制性的。例如,上述示例(或其一个或更多方案)可以彼此组合使用。例如本领域普通技术人员在阅读上述描述时可以使用其它实施例。另外,在上述具体实施方式中,各种特征可以被分组在一起以简单化本申请。这不应解释为一种不要求保护的公开的特征对于任一权利要求是必要的意图。相反,本申请的主题可以少于特定的公开的实施例的全部特征。从而,以下权利要求书作为示例或实施例在此并入具体实施方式中,其中每个权利要求独立地作为单独的实施例,并且考虑这些实施例可以以各种组合或排列彼此组合。本发明的范围应参照所附权利要求以及这些权利要求赋权的等同形式的全部范围来确定。
以上实施例仅为本申请的示例性实施例,不用于限制本发明,本发明的保护范围由权利要求书限定。本领域技术人员可以在本申请的实质和保护范围内,对本发明做出各种修改或等同替换,这种修改或等同替换也应视为落在本发明的保护范围内。

Claims (10)

1.一种共享实验仪器的数据存储和管理***,其特征在于,包括管理员端、仪器端、数据仓库、数据库和至少一个处理服务器,其中,所述仪器端与所述共享实验仪器位于相同的通信区域内,使得两者之间的通信速度高于阈值,所述数据库设置于所述至少一个处理服务器或与之通信,
所述管理员端配置为:响应于管理员的包含待注册的共享实验仪器的名称、所属平台和实验数据在所述仪器端的本地存储路径的仪器注册请求,使得在所述仪器端的所述本地存储路径自动构建该共享实验仪器的共享文件夹;
所述仪器端配置为:响应于用户的仪器用户注册请求,在所述共享实验仪器的共享文件夹下创建该用户的同步文件夹;在所述用户的同步文件夹中,存储该用户使用所述共享实验仪器的各次实验生成的实验数据;通过与所述至少一个处理服务器进行定期通信,以无损且无畸变的方式,向所述数据仓库中的上传地址上传同步文件夹中的各个节点的实验数据;
所述数据库配置为:保存定义各个平台下各个共享实验仪器的注册用户的信息项;
所述数据仓库包括至少一个数据服务器,且以分布式存储方式保存从所述同步文件夹上传的实验数据,使得每次实验的实验数据作为节点无损且无畸变地存储;
所述至少一个处理服务器配置为:根据所述至少一个数据服务器中的存储状况,确定所述同步文件夹的实验数据在所述至少一个数据服务器的上传地址并传输给所述仪器端。
2.根据权利要求1所述的数据存储和管理***,其特征在于,所述至少一个数据仓库包括至少两个数据服务器,所述至少一个处理服务器进一步配置为:获取各个数据服务器中的存储剩余容量;确定存储剩余容量最多的数据服务器中的存储地址,并确定与所述存储地址相对应的上传地址。
3.根据权利要求2所述的数据存储和管理***,其特征在于,所述至少一个数据服务器进一步配置为:在确定上传地址后,在所述数据库中添加对应的信息项,所述信息项包括所述同步文件夹在所述仪器端的本地存储路径、各个节点的实验数据对应的存储地址、所述信息项的创建时间和更新时间。
4.根据权利要求2所述的数据存储和管理***,其特征在于,所述至少一个处理服务器进一步配置为:在任何一个数据服务器中的存储剩余容量低于预设容量的情况下,向所述仪器端传输停止上传指令,其中,所述预设容量对应于节点的实验数据修改所需的容量增量。
5.根据权利要求1所述的数据存储和管理***,其特征在于,所述至少一个数据仓库包括至少两个数据服务器,所述至少一个处理服务器进一步配置为:确定所述至少两个数据服务器中是否存在与所述仪器端处于相同的通信区域内的数据服务器,如果有,则确定该相同的通信区域内的数据服务器中的存储地址并确定与所述存储地址对应的上传地址,其中,所述相同的通信区域包括同个局域网内或通过同个交换机通信的区域。
6.根据权利要求1或2所述的数据存储和管理***,其特征在于,所述数据库进一步配置为保存信息项,所述信息项包括所述同步文件夹在所述仪器端的本地存储路径、各个节点的实验数据对应的存储地址、所述信息项的创建时间和更新时间,
所述仪器端进一步配置为:向所述至少一个处理服务器请求共享实验仪器的注册用户信息;核对在所述仪器端的所述本地存储路径下的共享文件夹下的同步文件夹有无遗漏注册用户的同步文件夹,如果有则添加注册用户的同步文件夹。
7.根据权利要求6所述的数据存储和管理***,其特征在于,所述至少一个处理服务器进一步配置为:基于所述数据库保存的所述信息项,确定所述信息项中包含的节点的实验数据在所述仪器端中缺失的同步文件夹;基于缺失的同步文件夹对应的信息项的创建时间,来确定缺失相较于创建时间的发生时差;在发生时差在第一预定时间的范围内时,删除所述数据库中的对应的信息项,但在第二预定时间内保留所述数据仓库中对应存储地址的节点的实验数据,其中,所述第一预定时间使得能够完成所述共享实验仪器的单个实验。
8.根据权利要求3所述的数据存储和管理***,其特征在于,
所述仪器端的所述本地存储路径下存储有第一文件和第二文件,所述第一文件存储有所述本地存储路径下的目录或文件夹的创建时间,所述第二文件存储有所述本地存储路径下的目录或文件夹的最新修改时间,
所述仪器端进一步配置为:在与所述至少一个处理服务器进行定期通信的情况下,核对是否有目录或文件夹的最新修改时间在当前通信时间与先前通信时间之间,如果是才上传节点的实验数据,否则不上传。
9.根据权利要求3所述的数据存储和管理***,其特征在于,
所述仪器端的所述本地存储路径下存储有第一文件和第二文件,所述第一文件存储有所述本地存储路径下的目录或文件夹的创建时间,所述第二文件存储有所述本地存储路径下的目录或文件夹的最新修改时间,
所述至少一个处理服务器进一步配置为:获取所述第一文件中的目录或文件夹的创建时间和其中的数据删除情况;如果在目录或文件夹的创建时间起第一预定时间内发生了其中的数据删除,则使得所述数据仓库中对应的存储地址也删除对应数据;如果在目录或文件夹的创建时间起第一预定时间期满后发生了其中的数据删除,则在第二预定时间内保留所述数据仓库中对应的存储地址的对应数据。
10.一种共享实验仪器的数据存储和管理方法,其特征在于,
通过管理员端响应于管理员的包含待注册的共享实验仪器的名称、所属平台和实验数据在所述仪器端的本地存储路径的仪器注册请求,使得在所述仪器端的所述本地存储路径自动构建该共享实验仪器的共享文件夹;
通过仪器端响应于用户的仪器用户注册请求,在所述共享实验仪器的共享文件夹下创建该用户的同步文件夹;在所述用户的同步文件夹中,存储该用户使用所述共享实验仪器的各次实验生成的实验数据;通过与至少一个处理服务器进行定期通信,以无损且无畸变的方式,向所述数据仓库中的上传地址上传同步文件夹中的各个节点的实验数据,所述仪器端与所述共享实验仪器位于相同的通信区域内,使得两者之间的通信速度高于阈值;
通过数据库保存定义各个平台下各个共享实验仪器的注册用户的信息项,其中,所述数据库设置于至少一个处理服务器或与之通信;
通过数据仓库的至少一个数据服务器,且以分布式存储方式保存从所述同步文件夹上传的实验数据,使得每次实验的实验数据作为节点无损且无畸变地存储;
通过至少一个处理服务器根据至少一个数据服务器中的存储状况,确定所述同步文件夹的实验数据在所述至少一个数据服务器的上传地址并传输给所述仪器端。
CN202211074151.2A 2022-09-02 2022-09-02 一种共享实验仪器的数据存储和管理***、方法 Active CN115408478B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202211074151.2A CN115408478B (zh) 2022-09-02 2022-09-02 一种共享实验仪器的数据存储和管理***、方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202211074151.2A CN115408478B (zh) 2022-09-02 2022-09-02 一种共享实验仪器的数据存储和管理***、方法

Publications (2)

Publication Number Publication Date
CN115408478A true CN115408478A (zh) 2022-11-29
CN115408478B CN115408478B (zh) 2023-03-21

Family

ID=84164667

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202211074151.2A Active CN115408478B (zh) 2022-09-02 2022-09-02 一种共享实验仪器的数据存储和管理***、方法

Country Status (1)

Country Link
CN (1) CN115408478B (zh)

Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102096685A (zh) * 2009-12-11 2011-06-15 阿里巴巴集团控股有限公司 分布式数据同步到数据仓库的方法及装置
CN102497353A (zh) * 2011-10-28 2012-06-13 深圳第七大道科技有限公司 多服务器分布式数据处理方法、服务器及***
US20140304217A1 (en) * 2013-04-08 2014-10-09 Oracle International Corporation Method and system for implementing an on-demand data warehouse
US20150074053A1 (en) * 2013-09-12 2015-03-12 Sap Ag Cross System Analytics for In Memory Data Warehouse
CN107743124A (zh) * 2017-10-18 2018-02-27 优来博(重庆)科技有限公司 实验室资源共享与管理***及实验仪器或设备的监控方法
CN108599992A (zh) * 2018-03-21 2018-09-28 四川斐讯信息技术有限公司 一种数据处理***及方法
CN108694195A (zh) * 2017-04-10 2018-10-23 腾讯科技(深圳)有限公司 一种分布式数据仓库的管理方法及***
WO2019183547A1 (en) * 2018-03-22 2019-09-26 Datomia Research Labs Ou Distributed storage system data management and security

Patent Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102096685A (zh) * 2009-12-11 2011-06-15 阿里巴巴集团控股有限公司 分布式数据同步到数据仓库的方法及装置
CN102497353A (zh) * 2011-10-28 2012-06-13 深圳第七大道科技有限公司 多服务器分布式数据处理方法、服务器及***
US20140304217A1 (en) * 2013-04-08 2014-10-09 Oracle International Corporation Method and system for implementing an on-demand data warehouse
US20150074053A1 (en) * 2013-09-12 2015-03-12 Sap Ag Cross System Analytics for In Memory Data Warehouse
CN108694195A (zh) * 2017-04-10 2018-10-23 腾讯科技(深圳)有限公司 一种分布式数据仓库的管理方法及***
CN107743124A (zh) * 2017-10-18 2018-02-27 优来博(重庆)科技有限公司 实验室资源共享与管理***及实验仪器或设备的监控方法
CN108599992A (zh) * 2018-03-21 2018-09-28 四川斐讯信息技术有限公司 一种数据处理***及方法
WO2019183547A1 (en) * 2018-03-22 2019-09-26 Datomia Research Labs Ou Distributed storage system data management and security

Non-Patent Citations (3)

* Cited by examiner, † Cited by third party
Title
吴惠娜;: "数据仓库在铁路统计分析中的应用" *
张翅,唐谦: "高校实验室云桌面数据存储方案的探索与实践" *
禹禄君;: "基于大数据的信息***关键技术研究" *

Also Published As

Publication number Publication date
CN115408478B (zh) 2023-03-21

Similar Documents

Publication Publication Date Title
TWI476610B (zh) 同級間冗餘檔案伺服器系統及方法
US9128833B2 (en) Two level addressing in storage clusters
US9535630B1 (en) Leveraging array operations at virtualized storage processor level
US10210191B2 (en) Accelerated access to objects in an object store implemented utilizing a file storage system
CN103294710B (zh) 一种数据存取方法和装置
CN102662992B (zh) 一种海量小文件的存储、访问方法及装置
WO2017167171A1 (zh) 一种数据操作方法,服务器及存储***
US20130110961A1 (en) Cloud-based distributed persistence and cache data model
WO2014183708A1 (zh) 一种实现分布式文件***块存储的方法及***
CN103078898B (zh) 文件***、接口服务装置和数据存储服务提供方法
EP2534571B1 (en) Method and system for dynamically replicating data within a distributed storage system
CN111400312B (zh) 一种基于改进lsm树的边缘存储数据库
CN108319623A (zh) 一种数据重分布方法、装置及数据库集群
WO2022218160A1 (zh) 一种数据访问***、方法、设备以及网卡
JP2014529814A (ja) データメンテナンス用の方法
CN103501319A (zh) 一种低延迟的面向小文件的分布式存储***
US12032847B2 (en) Cross-platform replication of logical units
CN109542861A (zh) 一种文件管理方法、装置和***
CN109407975B (zh) 写数据方法与计算节点以及分布式存储***
CN107291876A (zh) 一种分布式数据管理方法
US8380806B2 (en) System and method for absolute path discovery by a storage virtualization system
CN109597903A (zh) 图像文件处理装置和方法、文件存储***及存储介质
CN104636441B (zh) 网络文件***实现方法和装置
CN104205730A (zh) 网元数据访问方法、装置以及网络管理***
CN104516687A (zh) 一种Linux块设备的Windows远程映射方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant