CN111885177A - 一种基于云计算技术的生物信息分析云计算方法、*** - Google Patents

一种基于云计算技术的生物信息分析云计算方法、*** Download PDF

Info

Publication number
CN111885177A
CN111885177A CN202010734237.8A CN202010734237A CN111885177A CN 111885177 A CN111885177 A CN 111885177A CN 202010734237 A CN202010734237 A CN 202010734237A CN 111885177 A CN111885177 A CN 111885177A
Authority
CN
China
Prior art keywords
analysis
cloud computing
server
cloud
result
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202010734237.8A
Other languages
English (en)
Other versions
CN111885177B (zh
Inventor
余育超
朱晓文
陈浩
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Hangzhou Shengwu Technology Co ltd
Original Assignee
Hangzhou Shengwu Technology Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Hangzhou Shengwu Technology Co ltd filed Critical Hangzhou Shengwu Technology Co ltd
Priority to CN202010734237.8A priority Critical patent/CN111885177B/zh
Publication of CN111885177A publication Critical patent/CN111885177A/zh
Application granted granted Critical
Publication of CN111885177B publication Critical patent/CN111885177B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L67/00Network arrangements or protocols for supporting network services or applications
    • H04L67/01Protocols
    • H04L67/02Protocols based on web technology, e.g. hypertext transfer protocol [HTTP]
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B50/00ICT programming tools or database systems specially adapted for bioinformatics
    • G16B50/30Data warehousing; Computing architectures
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L67/00Network arrangements or protocols for supporting network services or applications
    • H04L67/01Protocols
    • H04L67/10Protocols in which an application is distributed across nodes in the network
    • H04L67/1095Replication or mirroring of data, e.g. scheduling or transport for data synchronisation between network nodes
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L67/00Network arrangements or protocols for supporting network services or applications
    • H04L67/01Protocols
    • H04L67/12Protocols specially adapted for proprietary or special-purpose networking environments, e.g. medical networks, sensor networks, networks in vehicles or remote metering networks
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02ATECHNOLOGIES FOR ADAPTATION TO CLIMATE CHANGE
    • Y02A90/00Technologies having an indirect contribution to adaptation to climate change
    • Y02A90/10Information and communication technologies [ICT] supporting adaptation to climate change, e.g. for weather forecasting or climate simulation

Landscapes

  • Engineering & Computer Science (AREA)
  • Health & Medical Sciences (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Signal Processing (AREA)
  • Medical Informatics (AREA)
  • General Health & Medical Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Biophysics (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Biotechnology (AREA)
  • Evolutionary Biology (AREA)
  • Databases & Information Systems (AREA)
  • Bioethics (AREA)
  • Spectroscopy & Molecular Physics (AREA)
  • Computing Systems (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)
  • Investigating Or Analysing Biological Materials (AREA)

Abstract

一种基于云计算技术的生物信息分析云计算方法,包括以下步骤:创建一个常驻小型服务器ECS用于支持前端web交互以及发送管控调解指令;S2:在前端web交互端提交分析任务后,常驻小型服务器ECS发布指令创建一个适配该分析任务的运算分析配置的云服务器;S3:由步骤S2中创建的云服务器对分析任务进行计算分析,将分析结果进行存储后,最后返回完成信息至常驻小型服务器ECS并关闭云服务器;S4:常驻小型服务器ECS在接收到分析任务完成信息后,在前端web交互端将结果的下载信息交付给用户。本方案将单次使用的成本降到了最低,其创建的弹***器的配置和数量只跟云计算服务提供商的上限有关,可以满足多样本并行计算,最大效率节省时间成本。

Description

一种基于云计算技术的生物信息分析云计算方法、***
技术领域
本发明涉及生物信息学分析技术领域,具体涉及一种基于云计算技术的生物信息分析云计算方法、***。
背景技术
生物信息分析计算主要指处理当今生物检测技术产生的大量原始生物数据,包括基因数据、蛋白数据等。计算这些大数据需要使用专业的服务器进行计算,现有的计算技术方案主要是以下两种:
(1)本地架设服务器进行生物信息数据分析计算。根据计算数据需求的不同,采购各种类型的服务器来搭建本地的计算平台。例如塔式服务器、机架式服务器等。这种技术方案存在单次投入成本高、可扩展性差、日常维护成本高、回本时间长等问题。
(2)购买云服务商提供的云服务器、批量计算、高性能计算服务来进行生物信息数据计算。这种技术方案因为受行业整体发展领域比较前沿的制约,云服务商提供的这些服务存在行业适配度低,云计算资源浪费造成成本无较大优势的问题。
如专利公开号为CN109192248A的专利文件中公开了一种基于云平台的生物信息分析***、方法及云计算平台***,包括客户端、web服务器和云平台计算***;客户端和web服务器之间通过网络收发信息,web服务器和云平台计算***之间通过Nginx网页服务器交换数据;云平台web服务器包括生物信息分析请求接口;云平台计算***包括生物信息分析应用接口、生物信息分析组件、存储服务器、Mysql数据库、Mongo数据库、和若干计算节点;生物信息分析组件从生物信息分析请求接口接收生物信息分析请求及参数,根据参数判读计算类型而由不同对象进行分析;分析结果存到存储服务器,Mysql数据库存储分析记录等,Mongo数据库存储供云平台客户端展示的图表数据,实现分析***的自动化分析运作。
上述专利以及现有技术所表现出来的问题为:
1、本地配置高性能的服务器或云端购买高性能的云服务器,成本投入高,不具备泛用性。
2、生物信息学分析包含的种类比较繁多,服务器的***软件配置就比较复杂且不易于管理。
3、基因数据都是比较庞大的数据,采用本地硬盘存储和ftp来进行网络传输的方式,其数据的存储成本和流通时间成本高。
发明内容
为了解决上述问题,本发明提供了一种基于云计算技术的生物信息分析云计算方法、***,能够在发生计算任务的时创建弹性伸缩的服务器进行计算,将单次使用的成本降到了最低,其创建的弹***器的配置和数量只跟云计算服务提供商的上限有关,可以满足多样本并行计算,最大效率节省时间成本。
本发明的技术方案为:
一种基于云计算技术的生物信息分析云计算方法,包括以下步骤:
S1:用户在前端web的接口上传用于进行生物信息分析所需的原始数据;
S2:创建常驻小型服务器用于支持前端web交互以及发送管控调解指令;
S3:在前端web提交分析任务,由常驻小型服务器发布指令创建一个适配于所述分析任务的运算分析配置的云服务器;
S4:基于步骤S1中的原始数据,由步骤S2中创建的云服务器对分析任务进行计算分析,将分析结果以及原始数据进行存储后,返回计算完成信息至常驻小型服务器并关闭云服务器;
S5:常驻小型服务器在接收到计算完成信息的同时接收到结果下载地址,并显示于前端web,前端web用于根据下载地址来下载结果信息并交付给用户。
优选的,步骤S3中所述云服务器的配置方法为:根据数据分析所需的硬件要求,基于云计算技术弹性伸缩配置用于计算的云服务器,并在完成计算后释放。
优选的,所述步骤S3中还包括对服务器的***软件环境的配置:使用预制的对应分析快照进行部署,以构建适合分析的服务器***环境状态。
优选的,所述步骤S4还包括:利用云计算的文件存储的服务,由云服务器将步骤S1中所述的原始数据拷贝至挂载的文件存储中。
优选的,步骤S4中还包括采用云计算中的对象存储的存储服务来存储分析结果,并由对象存储将结果下载地址以及提取分析结果的账号密码发送至常驻小型服务器。
本发明还提供一种基于云计算技术的生物信息分析云计算***,使用到基于云计算技术的生物信息分析云计算方法,包括:
web交互模块:用于用户输入需要进行生物信息分析的原始数据以及提交分析任务;
管理模块:用于在管控节点发出调配指令,所述调配指令具体为根据用户选择的分析产品调用相应的存储、计算、网络云服务,并下达分析计算指令;
计算模块:用于根据用户输入的原始数据以及分析任务的内容进行分析计算,得出分析结果;
存储模块:用于存储用户输入的原始数据以及计算模块得出的分析结果;
数据交付平台:用于将云服务器计算得出的分析结果形成报告交付给用户。
本发明的有益效果为:
1、本发明中的常驻只需要一个小型服务器,初期投入成本低,只有在发生计算任务的时候再创建弹性伸缩的服务器进行计算,单次使用的成本降到了最低。
2、利用快照技术管理镜像,使每个生物信息分析产品所需要的***软件环境相互独立便于管理,部署更迅捷。
3、本发明所创建的弹***器的配置和数量只跟云计算服务提供商的上限有关,可以满足多样本并行计算,最大效率节省时间成本。
4、本发明使用文件存储来进行运算时的数据文件存储,可以挂载至所有的计算服务器中,从而释放网络带宽,提高分析性能,降低运行计算成本。
5、本发明使用对象存储的存储服务来上传原始数据和交付分析结果,拥有更高的数据传输速度和数据安全保护。
附图说明
图1为本发明实施例中各组成部分的示意图。
图2为本发明实施例提供的***组成框图。
具体实施方式
下面将结合说明书附图对本发明实施例进行详细的说明。
如图1所示,本发明实施例提供了一种基于云计算技术的生物信息分析云计算方法,包括以下步骤:创建一个常驻小型服务器ECS支持前端web交互和管控调解指令的发送。
当分析任务由前端web被提交以后,利用云计算的弹性计算ECS,常驻服务器发布指令将使用弹性伸缩服务创建一个适配该运算分析配置的云服务器,并利用预制的快照配置好***软件环境。计算云服务器对输入的分析任务进行计算。
根据数据分析所需的硬件要求,基于云计算技术弹性伸缩配置用于计算的云服务器,并在完成计算后释放。上述为本实施例基于对基因数据分析特性做出的适配性云服务器架构方案。基因数据计算是一种短期内的突发需求,对服务器要求高,需要使用完成计算后可以释放的业务模式。而长期租赁或者自购服务器都需要均摊空闲成本,本实施例的配置模式,可以降低空闲成本。
利用云计算对象存储、文件存储服务,新创建的分析计算服务器将用户提供的数据拷贝至挂载的文件存储中,并进行计算分析,完成后将结果交付至对象存储中存储,并返回完成信息,关闭服务器。
基因数据在分析需要访问一些数据量很大的参考数据库,本实施例的架构方案,利用了云计算技术的文件存储服务,可以只配置一份数据库,挂载至多个云计算服务器进行计算访问。
对象存储OSS服务用于进行用户数据的上传和结果交付,适应基因数据的数据大,访问频次低,隐私性强等特性,本实施例适用带AES加密的低频存储的方案,降低了存储成本,提高了数据传输效率。
常驻服务器在接收到完成信息后,在web交互端将结果的下载信息交付给用户。
上述方案基于云计算技术的web端实现,故各类具有浏览器的设备都可以访问并发布分析指令。
如图2所示,本发明还提供了一种基于云计算技术的生物信息分析云计算***,用于在硬件上支持基于云计算技术的生物信息分析云计算方法,包括:
web交互模块:用于用户输入数据在云端的相关位置和访问凭证以及选择需要的分析计算服务。
管理模块:用于在管控节点发出调配指令,所述调配指令具体为根据用户选择的分析产品调用相应的存储、计算、网络云服务,并下达分析计算指令;
计算模块:用于根据用户输入的原始数据以及分析任务的内容进行分析计算,得出分析结果;
存储模块:用于存储用户输入的原始数据以及计算模块得出的分析结果;
数据交付平台:用于将云服务器计算得出的分析结果形成报告交付给用户。
最后应说明的是:以上所述实施例,仅为本发明的具体实施方式,用以说明本发明的技术方案,而非对其限制,本发明的保护范围并不局限于此,尽管参照前述实施例对本发明进行了详细的说明,本领域的普通技术人员应当理解:任何熟悉本技术领域的技术人员在本发明揭露的技术范围内,其依然可以对前述实施例所记载的技术方案进行修改或可轻易想到变化,或者对其中部分技术特征进行等同替换;而这些修改、变化或者替换,并不使相应技术方案的本质脱离本发明实施例技术方案的精神和范围。都应涵盖在本发明的保护范围之内。因此,本发明的保护范围应所述以权利要求的保护范围为准。

Claims (6)

1.一种基于云计算技术的生物信息分析云计算方法,其特征在于,包括以下步骤:
S1:用户在前端web的接口上传用于进行生物信息分析所需的原始数据;
S2:创建常驻小型服务器用于支持前端web交互以及发送管控调解指令;
S3:在前端web提交分析任务,由常驻小型服务器发布指令创建一个适配于所述分析任务的运算分析配置的云服务器;
S4:基于步骤S1中的原始数据,由步骤S2中创建的云服务器对分析任务进行计算分析,将分析结果以及原始数据进行存储后,返回计算完成信息至常驻小型服务器并关闭云服务器;
S5:常驻小型服务器在接收到计算完成信息的同时接收到结果下载地址,并显示于前端web,前端web用于根据下载地址来下载结果信息并交付给用户。
2.根据权利要求1中所述的基于云计算技术的生物信息分析云计算方法,其特征在于,步骤S3中所述云服务器的配置方法为:根据数据分析所需的硬件要求,基于云计算技术弹性伸缩配置用于计算的云服务器,并在完成计算后释放。
3.根据权利要求1中所述的基于云计算技术的生物信息分析云计算方法,其特征在于,所述步骤S3中还包括对服务器的***软件环境的配置:使用预制的对应分析快照进行部署,以构建适合分析的服务器***环境状态。
4.根据权利要求1中所述的基于云计算技术的生物信息分析云计算方法,其特征在于,所述步骤S4还包括:利用云计算的文件存储的服务,由云服务器将步骤S1中所述的原始数据拷贝至挂载的文件存储中。
5.根据权利要求1中所述的基于云计算技术的生物信息分析云计算方法,其特征在于,步骤S4中还包括采用云计算中的对象存储的存储服务来存储分析结果,并由对象存储将结果下载地址以及用于提取分析结果的账号密码发送至常驻小型服务器。
6.一种基于云计算技术的生物信息分析云计算***,使用到权利要求1-5中任意一项所述的基于云计算技术的生物信息分析云计算方法,其特征在于,包括:
web交互模块:用于用户输入需要进行生物信息分析的原始数据以及提交分析任务;
管理模块:用于在管控节点发出调配指令,所述调配指令具体为根据用户选择的分析任务调用相应的存储、计算、网络云服务,并下达分析计算指令;
计算模块:用于根据用户输入的原始数据以及分析任务的内容进行分析计算,得出分析结果;
存储模块:用于存储用户输入的原始数据以及计算模块得出的分析结果;
数据交付平台:用于将云服务器计算得出的分析结果形成报告交付给用户。
CN202010734237.8A 2020-07-28 2020-07-28 一种基于云计算技术的生物信息分析云计算方法、*** Active CN111885177B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202010734237.8A CN111885177B (zh) 2020-07-28 2020-07-28 一种基于云计算技术的生物信息分析云计算方法、***

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202010734237.8A CN111885177B (zh) 2020-07-28 2020-07-28 一种基于云计算技术的生物信息分析云计算方法、***

Publications (2)

Publication Number Publication Date
CN111885177A true CN111885177A (zh) 2020-11-03
CN111885177B CN111885177B (zh) 2023-05-30

Family

ID=73201333

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202010734237.8A Active CN111885177B (zh) 2020-07-28 2020-07-28 一种基于云计算技术的生物信息分析云计算方法、***

Country Status (1)

Country Link
CN (1) CN111885177B (zh)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113326123A (zh) * 2021-04-30 2021-08-31 杭州绳武科技有限公司 一种基于容器技术的生物信息分析计算***及方法
CN114615567A (zh) * 2022-03-08 2022-06-10 东南大学 一种基于无线通信的固态纳米孔基因测序数据通信方法
CN117453417A (zh) * 2023-11-17 2024-01-26 广东美格基因科技有限公司 一种基于云服务的生信分析加速方法、***、介质及设备

Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102880515A (zh) * 2012-09-07 2013-01-16 浪潮电子信息产业股份有限公司 一种云海os中虚拟机快速部署方法
CN104021029A (zh) * 2014-06-13 2014-09-03 北京大学 一种空间信息云计算***及其实现方法
CN106022007A (zh) * 2016-06-14 2016-10-12 中国科学院北京基因组研究所 面向生物组学大数据计算的云平台***及方法
CN107734035A (zh) * 2017-10-17 2018-02-23 华南理工大学 一种云计算环境下的虚拟集群自动伸缩方法
CN108537008A (zh) * 2018-03-20 2018-09-14 常州大学 高通量基因测序大数据分析云平台***
CN108924217A (zh) * 2018-06-29 2018-11-30 中山大学 一种分布式云***自动化部署方法
CN109192248A (zh) * 2017-07-21 2019-01-11 上海桑格信息技术有限公司 基于云平台的生物信息分析***、方法及云计算平台***
KR20200058757A (ko) * 2018-11-20 2020-05-28 (주) 아이크로진 클라우드 기반 유전자 분석 서비스 방법 및 플랫폼

Patent Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102880515A (zh) * 2012-09-07 2013-01-16 浪潮电子信息产业股份有限公司 一种云海os中虚拟机快速部署方法
CN104021029A (zh) * 2014-06-13 2014-09-03 北京大学 一种空间信息云计算***及其实现方法
CN106022007A (zh) * 2016-06-14 2016-10-12 中国科学院北京基因组研究所 面向生物组学大数据计算的云平台***及方法
CN109192248A (zh) * 2017-07-21 2019-01-11 上海桑格信息技术有限公司 基于云平台的生物信息分析***、方法及云计算平台***
CN107734035A (zh) * 2017-10-17 2018-02-23 华南理工大学 一种云计算环境下的虚拟集群自动伸缩方法
CN108537008A (zh) * 2018-03-20 2018-09-14 常州大学 高通量基因测序大数据分析云平台***
CN108924217A (zh) * 2018-06-29 2018-11-30 中山大学 一种分布式云***自动化部署方法
KR20200058757A (ko) * 2018-11-20 2020-05-28 (주) 아이크로진 클라우드 기반 유전자 분석 서비스 방법 및 플랫폼

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
刘勤 等: "《XBRL知识体验 理论、方法与实践》", 30 November 2016, 上海:立信会计出版社 *

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113326123A (zh) * 2021-04-30 2021-08-31 杭州绳武科技有限公司 一种基于容器技术的生物信息分析计算***及方法
CN113326123B (zh) * 2021-04-30 2024-03-26 杭州绳武科技有限公司 一种基于容器技术的生物信息分析计算***及方法
CN114615567A (zh) * 2022-03-08 2022-06-10 东南大学 一种基于无线通信的固态纳米孔基因测序数据通信方法
CN114615567B (zh) * 2022-03-08 2024-07-05 东南大学 一种基于无线通信的固态纳米孔基因测序数据通信方法
CN117453417A (zh) * 2023-11-17 2024-01-26 广东美格基因科技有限公司 一种基于云服务的生信分析加速方法、***、介质及设备

Also Published As

Publication number Publication date
CN111885177B (zh) 2023-05-30

Similar Documents

Publication Publication Date Title
CN109478266B (zh) 对于数据库供应的资源分配
CN109074377B (zh) 用于实时处理数据流的受管理功能执行
CN111885177A (zh) 一种基于云计算技术的生物信息分析云计算方法、***
US8918761B1 (en) Elastic application framework for deploying software
US20120116743A1 (en) Optimizing storage cloud environments through adaptive statistical modeling
US10623470B2 (en) Optimizing internet data transfers using an intelligent router agent
US9590859B2 (en) Discovering resources of a distributed computing environment
CN109564527A (zh) 云计算节点的安全配置
US20170318129A1 (en) Generation and distribution of named, definable, serialized tokens
US20200278975A1 (en) Searching data on a synchronization data stream
US11165585B2 (en) Token repository and integration
CN108701130A (zh) 使用自动浏览群集更新提示模型
CN111831503B (zh) 一种基于监控代理的监控方法和监控代理装置
US11693909B2 (en) Data sharing tool for facilitating real-time access to current or updated datasets
US11237889B1 (en) Application infrastructure configuration based on annotated API schemas
US10693939B2 (en) Providing modified protocol responses
CN110928594A (zh) 服务开发方法和平台
CN111800511B (zh) 同步登录态的处理方法、***、设备及可读存储介质
CN110677307B (zh) 一种服务监测方法、装置、设备和存储介质
CN104021027A (zh) 提供虚拟装置的方法和设备
US10554770B2 (en) Dynamic cognitive optimization of web applications
CN115174248A (zh) 一种网络访问的控制方法及装置
CN107347024A (zh) 一种存储操作日志的方法和装置
CN115485677A (zh) 在分布式数据存储环境中的安全数据复制
Satsyk et al. Increasing the Speed and Performance of the Drupal CMS Server for Industrial IoT Technologies

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant