CN105224585A - 一种基于网络的处理高通量实验数据管理*** - Google Patents

一种基于网络的处理高通量实验数据管理*** Download PDF

Info

Publication number
CN105224585A
CN105224585A CN201510193293.4A CN201510193293A CN105224585A CN 105224585 A CN105224585 A CN 105224585A CN 201510193293 A CN201510193293 A CN 201510193293A CN 105224585 A CN105224585 A CN 105224585A
Authority
CN
China
Prior art keywords
information
high throughput
data management
experimental data
network high
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201510193293.4A
Other languages
English (en)
Inventor
童云广
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Individual
Original Assignee
Individual
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Individual filed Critical Individual
Publication of CN105224585A publication Critical patent/CN105224585A/zh
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q30/00Commerce
    • G06Q30/02Marketing; Price estimation or determination; Fundraising
    • G06Q30/0241Advertisements
    • G06Q30/0251Targeted advertisements
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/24Querying
    • G06F16/242Query formulation
    • G06F16/2425Iterative querying; Query formulation based on the results of a preceding query
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/25Integrating or interfacing systems involving database management systems
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/35Clustering; Classification
    • G06F16/353Clustering; Classification into predefined classes
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/35Clustering; Classification
    • G06F16/358Browsing; Visualisation therefor

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Databases & Information Systems (AREA)
  • Data Mining & Analysis (AREA)
  • General Engineering & Computer Science (AREA)
  • Business, Economics & Management (AREA)
  • Development Economics (AREA)
  • Strategic Management (AREA)
  • Finance (AREA)
  • Accounting & Taxation (AREA)
  • Mathematical Physics (AREA)
  • Marketing (AREA)
  • Entrepreneurship & Innovation (AREA)
  • General Business, Economics & Management (AREA)
  • Game Theory and Decision Science (AREA)
  • Economics (AREA)
  • Computational Linguistics (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明公开了本发明提供了一种基于网络的处理高通量实验数据管理***,包括:一个通信接口,一个数据库,一个数据库管理器,一个迭代数据库检索引擎和一个程序控制器,连接到上述的数据库管理器、迭代数据库检索引擎和通信端口。***提供了研究项目、分析过程和结果报告的信息创建框架式存储,提供了小平面搜索界面,使生物学家识别重要的实验结果信息。***还提供了3种的新的商业模块:销售模块、广告模块、营销模块,以帮助研究人员获得实验结果。

Description

一种基于网络的处理高通量实验数据管理***
技术领域
本发明涉及计算机辅助软件***,特别涉及一种利用网络大数据的基于网络的处理高通量实验数据管理***。
背景技术
技术的进步允许同时测量大量的检测,产生大量的检测结果,也称为原始数据。例如,利用微阵列技术可以用一个芯片检测超过20000个基因位点。新一代测序技术(NGS),进一步提高了传送率,在短短数天内产生数百万甚至数十亿的读取量(短序列信息)。高通量技术的发展向现有的数据存储、管理、搜索和显示发起挑战。
对检测结果(原始数据)进行分析,以确定检测的质量和信号强度。通过综合分析检测结果和实验因素,研究人员可以分析实验并获得实验检测结果。
目前用来管理和存储芯片原始数据和检测结果的***主要有两种(GEO和ArrayExpress)。标准数据格式已经被提出来用于存储从微阵列芯片研究项目得出的检测结果。但是,目前仍缺乏一个稳健的***来存储,管理,搜索和显示这些从高通量实验获得的实验结果。GEO和ArrayExpress主要是存储从微阵列实验得到的检测结果。在GEO***中唯一提及实验结果的存储和管理的功能的是GEO轮廓。
研究人员可以在芯片实验中搜索特定基因的轮廓。然而,GEO没有提供倍数变化或特定基因的P值,p值对科学家而言意义重大,它可以确定该信息是否有科学意义。ArrayExpress拥有一个基因表达图谱数据库,它允许用户搜索在一定的实验条件基因是上调或下调。ArrayExpress在结果中显示p值,但不显示倍数变化。
Oncomine和NextBio是两个专注于管理高通量研究项目得出的结果的***。Oncomine该***能存储和管理从癌症相关的微阵列实验获得的实验结果。它提出了一个方法来存储来自基因表达和DNA拷贝数这两个研究项目得出的结果。NextBio、是一个与之类似的平台,它允许企业用户上传私人结果和私人结果与高通量实验得出的公开结果整合后的结果。在专利US2007/0162411(科学信息知识管理的***和方法),US2009/0049019(定向表达为基础的科学信息知识管理),US2009/0222400(分类和科学数据的过滤),US2010/0318528(序列-中心的科学信息管理)下,Kupershmidt等人要求利用计算机实现的方法,以存储和管理从高通量的生物或化学阵列的提取的特征。
虽然有这些***来帮助管理实验结果,然而对于研究人员判定分析和详细结果的质量起到至关重要作用的各实验的分析过程和提供数据分析的细节,他们之中没有一款***能清楚界定。所有这些***都不允许研究人员购买单独结果报告或选择详细结果。另外,没有一种***能够使用所得的实验结果,指导厂商进行营销。最后,这些***都做不到使统计学家,研究人员和供应商之间的互动。
发明内容
针对以上缺陷,本发明目的如何提供以个***让研究者和商业者都可方便的利用互联网的大数据高通量实验数据,利于研究开发和商业应用。
为了实现上述目的,本发明提供了一种基于网络的处理高通量实验数据管理***,其特征在于包括:一个通信接口实现数据和指令以电信号的形式发送到或接收远程计算机或设备;一个数据库实现存储高通量实验导出的信息,所述信息包含:研究项目、结果报告、分析过程、每个研究项目对应的分析过程、每个分析过程对应的结果报告;一个可以对多个连接的远程计算机数据库的可读存储器进行数据创建和修改的数据库管理器;一个迭代数据库检索引擎,连接至上述数据库,引擎构造容许开展一次初始搜索和至少一个后续搜索,在第一个搜索或之前的搜索结果上进行后续搜索;一个程序控制器,连接到上述的数据库管理器、迭代数据库检索引擎和通信端口。
所述的基于网络的处理高通量实验数据管理***,其特征在于还包括从相应的分析过程得出的结果报告摘要和实验结果的列表。
所述的基于网络的处理高通量实验数据管理***,其特征在于还包含能从所述数据库中检索信息的网络接口,将信息呈现给用户。
所述的基于网络的处理高通量实验数据管理***,其特征在于还包括一个分面搜索***,该***包含:一个对所述高通量实验得出的资料进行分类的分面分类***;和一个对分类信息进行搜索和显示的分面搜索界面。
所述的基于网络的处理高通量实验数据管理***,其特征在于分面分类***对研究项目、分析过程和结果报告的信息进行分类,这些分类包含:搜索字段、研究项目类型、分析过程类型和实验样品类型。
所述的基于网络的处理高通量实验数据管理***,其特征在于所述的分面搜索接口是一个网页,包含:a)网页中显示搜索结果的中心对话框;b)至少一个用来输入搜索条件的对话框;c)至少一个显示类别信息的对话框。
所述的基于网络的处理高通量实验数据管理***,其特征在于还包括一个广告***,该***包括:a)一个通用名***,将结果报告中的检测结果统一成通用名,并使每个检测与相应的通用名关联;b)一种允许广告商输入广告信息并与之相关联到一个或多个选定的通用名上的模块;c)利用通用名将广告关联到检测结果,将检测结果和广告一起呈现给用户的一个界面。
所述的基于网络的处理高通量实验数据管理***,其特征在于所述通用名包括:基因符号、代谢物、化学制品和装置、实验结果可读的检测方法的名称。
所述的基于网络的处理高通量实验数据管理***,其特征在于进一步还包括一个访问控制***,该***包含:a)一个将信息放入一个访问控制库的模块;b)一种在预定条件授予用户访问信息权限的模块。
所述的基于网络的处理高通量实验数据管理***,其特征在于所述的预定条件:包括如下:a)一个赞助商设置一个赞助并将其通过通用名关联到结果,用户在试图访问实验结果时同意接受赞助商的赞助;b)每个结果单独定价,用户付费。
所述的基于网络的处理高通量实验数据管理***,其特征在于还包括一个营销***,所述营销***包括:为用户提供一个输入信息的接口;把信息存储到一个联机数据库,并设置成访问受限型数据库;为赞助商提供以下服务:1)输入赞助信息,2)把赞助与访问受限的信息相关联;将这2个信息发布到联机数据库上,在预定条件下,向赞助商收费,授予用户访问权限,并通知该交易的有关当事人。
所述的基于网络的处理高通量实验数据管理***,其特征在于将赞助与访问首先的信息关联须通过通用名实现,这些通用名包括:基因符号、代谢物、化学制品和装置、实验结果可读的检测方法的名称。
所述的基于网络的处理高通量实验数据管理***,其特征在于所述预定的条件包括1)呈现一个界面,以允许用户接受或拒绝赞助;2)用户接受赞助。
所述的基于网络的处理高通量实验数据管理***,其特征在于所述的赞助信息,包括:每个赞助的量,每一天的预算、赞助的标题。
所述的基于网络的处理高通量实验数据管理***,其特征在于还包括广告***,所述的广告***包括:提供一个接口用于检索检测的分析结果;把信息存储到联机数据库;把检测统一成通用名,并把两者对应相关。为广告客户提供一个接口来检索广告信息,并把广告信息与通用名相关;把广告信息和关联存储到联机数据库;在预定条件下,把检测结果和关联的广告一起呈现给用户。
所述的基于网络的处理高通量实验数据管理***,其特征在于于所述的预定条件是:用户浏览检测的分析结果。
所述的基于网络的处理高通量实验数据管理***,其特征在于所述的通用名,包含:基因符号、代谢物、化学制品和装置、实验结果可读的检测方法的名称。
本发明提供了一种基于网络的处理高通量实验数据管理***,提供了研究项目、分析过程和结果报告的信息创建框架式存储,提供了小平面搜索界面,使生物学家识别重要的实验结果信息。***还提供了3种的新的商业模块1)零售实验结果的销售模块;2)广告模块,能够使厂商在实验结果上附加广告;3)营销模块,能够使厂商提供赞助给研究者,以帮助研究人员获得实验结果。
附图说明
图1是本发明的工作流和信息存储***的示例性实施方案流程图;
图2是不同角色的用户如何在这个***中做生意的业务逻辑描绘示例性实施方案图;
图3是根据本发明设计的元素领域信息的示例性实施方案图
图4是一个供学习的输入接口的示例性实施方案流程图;
图5是一个供学习的输入接口的示例性实施方案流程补充图;
图6是一个供分析过程的输入接口的示例性实施方案图;
图7是一个供结果报告的输入接口的示例性实施方案图;
图8是一个提供结果报告的详细结果的输入接口的示例性实施方案图;
图9是一个显示学习界面的示例性实施方案图;
图10是一个显示分析过程界面的示例性实施方案图;
图11是一个显示结果报告界面的示例性实施方案图;
图12是一个显示的详细结果结果报告界面的示范性实施方案图;
图13是一个显示界面分类类别的示例性实施方案图;
图14是一个根据本发明研发的广告模块的的示例性实施方案图;
图15是一个广告输入接口的示例性实施方案图;
图16是一个通用名输入接口的示例性实施方案;
图17是一个显示通用名和广告的输入接口的示例性实施方案图;
图18是一个根据本发明研发的赞助模块的的示例性实施方案图;
图19是一个赞助输入借口的示例性实施方案;
图20是一个显示赞助界面的示例性实施方案;
图21是提供赞助界面的示例性实施方案;
图22是一个自费工作流的示例性实施方案;
图23是一个由赞助商付费的的工作流的示例性实施方案;
图24是为面搜索的索引结构的示例性实施方案;
图25是一个根据本发明研发的多平面的界面示例性实施方案;
图26是一个小平面的搜索界面的实施方案1示意图;
图27是一个小平面的搜索界面的实施方案2示意图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
本发明为促进管理和搜索实验结果可能包含新的消息格式,装置和数据结构。
本发明所提到的实验结果包括在,但又不局限于从生物高通量实验得出的结果。
应当理解的是,该***的使用可以通过用普通计算机的硬件作为一个网络站点来实现。通用硬件用Linux工作站或其他合适的计算机的形式会大有益处。硬件将依照不同的软件模块来陪着和定制。软件模块将包括常规用于互联网通信软件和一个数据库管理***。任何数量的免费的或市售的数据库管理***都可以被用来实现本发明。数据库管理应用编程领域中的普通技术人员根据本文公开内容都将能够制造和使用本发明。
本发明可以使用Web框架(如RubyonRails,Django,CakePHP或Symfony),或者内容管理***(如Joomla或Drupal)来更简单的实现。使用内容管理***会将实施过程更加容易,因为这些内容管理***已经包含一个完整的用户认证***,一个强大的授权模型,一种来定义“内容类型”的任意数量的方法,一种来存储内容对象和关系和柔性分类***的方法(可用于分类和标签内容)。
以下术语会在整个说明书中用到,为理解说明书提供帮助,但不必限定本发明的范围,高通量实验---一种使用高通量技术,其同时获得数百或数千检测结果的实验。
检测结果---也称为原始数据。检测结果是由检测传感器所产生。
实验结果---实验结果由通过分析基于实验设计的检测结果产生。
研究项目---研究项目被定义为高通量实验的信息,其包括但不限于:实验细节如实验方法,设计,平台,样本和样本大小。
分析过程---用于所述研究项目进行统计分析。分析的类型包括但不限于:T检验,方差分析和生存分析的。
结果报告-分析过程的结果。结果报告的信息包括但不限于:分析结果的临界值,详细的结果的指定临界值,以及实验结果的列表。
详细结果---详细结果属于结果报告。每个结果报告包括详细的成果,这是数百或数千检测过滤后的实验结果。在一个典型的基因表达的微阵列或下一代测序实验中,详细的结果通常是差异表达的基因列表。
GeneData---详细结果进行芯片或新一代测序分析时的别名。
通用名---用于代表在多个研究项目中某一类型的检测所对应的通用名称。如在基因表达微阵列或下一代测序实验的情况中,每一个实验结果的通用名称,通常是一个特定基因的基因标志。
研究员---经常做试验的人。一位研究人员通常要观察从高通量研究项目中得出的结果从而为特定的研究项目提供线索或预备数据。
统计学家---对高通量实验进行统计分析的人。典型的统计分析包括但不限于:t检验,方差分析(ANOVA)和Cox回归分析。
供应商---向研究人员出售实验资源的人。一个供应商通常要了解研究人员的需求,以便出售相应的实验资源,包括试剂和设备。供应商可以作为赞助商或广告商。
赞助商---为研究人员提供赞助,让他们可以获得一定的访问受限的信息。
广告商-想宣传自己的产品的人。
分面分类法---分面分类***允许一个对象对应多个特性(属性)的分配,使分类以多种方式来进行排序,而不是在以单一的,预定的,分类的顺序。
分面搜索---是根据分面分类***来访问信息的技术,使用户可以通过多个过滤器来探索收集信息。
在下文中,4.1描述对数据的存储,管理和搜索发明的一个***以及对应的示例性实施例;4.2描述详细的数据结构及其示例性实施例;4.3描述广告模块及其示范性实施例;4.4描述赞助模块的整合和其示范性实施例。4.5中描述索引结构,一个分面搜索接口和其对应的示范性实施例。
4.1。用于高通量研究项目的信息存储和管理***
图1是本发明的工作流和信息存储***的示例性实施方案流程图;图2是不同角色的用户如何在这个***中做生意的业务逻辑描绘示例性实施方案图;程序控制单元103将管理***的信息流通。允许用户101依靠通信端口102来访问网络。网络可以是通过任何数量的外部计算机***或直接或通过调制解调器连接其他已连接的计算机对局域网或广域网访问,根据优选方式实施。该***将包含用于存储数据库的数据库存储器。
数据库可以以数据文件中所包含的多个记录的形式表现,每个记录对应相应的项目,每个记录都会包含一定数量的含有普通类型参数和额外带有描述性信息的预定义字段
用户的建立访问,可以通过通信端口101呈现的各种菜单来实现。根据优选实施方式,通信可以通过超文本标记语言(HTML)网页,ASP,PHP,JSP或者其它语言网页来实现。
程序控制单元103把用户计算机上的指定字段信息通过通信端口102传递到所选择的数据库记录106中,用电子形式存储数据库。该数据库收集存储电子可读存储器中的记录。记录包括指定名称字段、包含描述性信息字段,按键功能的说明、确定的预定类别,特定术语的以及平常使用的描述,并叙述字段。记录中的字段可通过表格的形式来呈现给使用者并被填充。该记录还可以包括用户口令字段和用于指定该记录提交到一个可访问池的字段。
该***还包括一个连接到存储器的迭代数据库查询引擎104,一个连接到数据库管理器105、迭代数据库查询引擎和通信端口的程序控制器。项目库的记录可以包含多个搜索键字段。迭代数据库查询引擎包含的方法:为结果报告所有满足搜索条件的变量,在数据库中搜索包含多个搜索键字段,结果报告满足搜索条件的中一个或多个条件的记录。检索关键字段在预定的一组条目下可能会得到限制。
图3是根据本发明设计的元素领域信息的示例性实施方案图,数据库中包含的信息有:研究项目107,分析过程108,结果报告109,详细结果219,通用名218,广告217和赞助216,每个信息都包括多个字段。
图2是不同角色的用户如何在这个***中做生意的业务逻辑描绘示例性实施方案图;当访问***203时,用户须填写登记表205,在登记表中,他/她可以登记成不同的角色,如管理员,研究员,赞助商,广告商,厂商和统计学家。在需要时,还可以创建更多角色,同时一个用户可以拥有多个角色。所有注册用户101在登录后可以管理自己的配置文件。用户还可以通过接口206搜索信息。搜索的内容为***数据库中的记录,包括相关研究项目107的信息,分析过程108,结果报告109,GeneData219和基因218。
如果用户被分配为站点管理员207,通过管理员接口可以管理***设置208并注册会员209。站点管理员还能通过接口来管理内容214,包括在***数据库中添加/编辑/删除/搜索记录。管理员可以看到一个选项菜单。选项菜单也同样包括提交项目107,分析过程108,结果报告109,GeneData219或基因218至***数据库的选项。该选项进一步增加搜索、编辑和删除已提交记录的选项。
如果用户被分配为统计员220,在他的界面可以管理的内容包括在***数据库中添加/编辑/删除/搜索记录。统计员将看到一个选项菜单,该菜单包含提交项目107,分析过程108,结果报告109,和GeneData219至***数据库的选项。该方案进一步还包括搜索,编辑和删除已提交记录的选项。
注册后的用户101可获准提交项目107的许可。统计员220分析所提交的项目并输入该项目的分析过程108,结果报告109,GeneData219到数据库中。注册用户在预定条件下可以有权限查看统计员的录入。
该***还包括一个访问控制模块214,以便在在某些条件下,数据库中的一些信息只能为限定的用户浏览。当信息被提交到一个可访问的库,为保护私有财产,需要一种机制只让特定的人群才能访问,访问的限制可以通过在数据表标记特定人群来实现。这些特定人群包含但不限于:高级会员或购买信息的访客。
该***还包括一个销售者模块215,以允许厂商给用户提供与基因信息相关的赞助216或广告217。销售者模块的业务逻辑将在下面做进一步解释。
4.2研究项目、分析过程、报表字段、详细的结果、通用名(详细结果的)、赞助和广告的示范性实施方案。
该数据库包括有作107,分析过程108,结果报告109,详细结果219,GeneData实施例,通用名218,基因的基因符号实施例,赞助216与广告217的记录。每一个记录包括多个字段。这些字段有三个主要功能:1)存储记录之间的关系;2)分类记录;3)存储记录的主要信息。
***数据库中的记录的字段被设计成内部相关的方式,分析过程108与研究项目107相关。结果报告109与分析过程108相关。GeneData219与结果报告109相关。赞助216和广告217基因218相关。这种相关性是通过各类型记录的标识符ID来实现的,如研究项目ID,分析过程ID,结果报告ID,GeneDataID,基因ID,赞助ID和广告ID。
一个研究项目记录107包括字段:研究项目ID的字段107.1,分析过程ID108.1,研究项目名称107.2,研究项目描述107.3,分面分类221和价格107.4。
研究项目记录107中的分析过程ID108.1指向研究项目相关的分析过程。研究项目题目107.2和研究项目描述107.3是这研究项目的详细信息。分面分类的类别221被用于对该研究项目的信息进行分类,这将在分面搜索中应用到。
分析过程记录108包括:分析过程ID字段108.1,结果报告ID109.1,研究项目ID107.1,分析过程题目108.2,分析过程说明108.3,分面类别分类221和价格107.4。分析过程记录108中的研究项目ID107.1被用来确定哪个研究项目分析被执行。分析过程记录108中的结果报告ID109.1指向相关分析过程的结果报告。分析过程标题108.2和分析过程说明108.3是分析过程的详细信息。分析过程中的分面类别分类221被用来进行分析过程信息分类,这将在面搜索中使用。
结果报告记录109包括:结果报告ID字段109.1,分析过程ID108.1,GeneDataID219.1,结果报告标题109.2,结果报告描述109.3,分面类别分类221。结果报告记录中的分析过程ID108.1指向本结果报告的相关分析过程。GeneDataID219.1指向本结果报告中的相关GeneData。结果报告标题109.2和结果报告的说明109.3是该结果报告的详细信息。结果报告字段中的分面类别分类221被用来进行结果报告信息的分类,这将在面搜索中使用。
GeneData219记录包括:GeneDataID字段219.1,分面类别分类221,结果报告ID109.1,基因ID218.1,基因符号218.2,排名219.5,P值219.3和倍数变化219.4。在GeneData字段中的结果报告ID109.1指向有关的的GeneData结果报告。
基因的记录218包括:基因ID字段218.1,赞助ID216.1,广告ID217.1,GeneDataID219.1,基因符号218.2和基因标题218.3领域。
基因记录中的赞助ID216.1指向基因相关的赞助。基因记录中的广告ID217.1指向该基因相关的广告。基因记录中的GeneDataID219.1指向该基因相关的GeneData。
赞助记录216包括:赞助ID字段216.1,基因ID218.1,基因符号218.2,每次法案量216.4,每次赞助金额216.2,总预算额(当次赞助)216.3和厂商ID。该基因ID218.1指向赞助相关的基因。
广告217包括:广告ID217.1,基因ID218.1,基因符号218.2,广告标题217.2,每次点击价格217.3和总预算217.4。该基因ID218.1指向广告相关的基因。
除了上述所描述这些字段,可在需要时添加更多字段。图3是根据本发明设计的元素领域信息的示例性实施方案图,图4是一个供学***台、平台量,SKU、父SKU,价格,P值,倍数变化,排名,发布日期或作者。“样本量”描述了一个实验的总样本数。“平台”包含高通量技术平台的信息。“平台量”是在实验中使用的高通量技术的数目。“SKU”是记录的唯一标签。“父SKU”是SKU的信息来源。研究项目中的SKU来源于分析过程中的父SKU,“价格”是记录的价格信息。“倍数变化,排名,p值”描述GeneData信息。
用户可以通过接口来对字段信息进行检索。由于信息是相关的,可以把研究项目、分析过程、结果报告和GeneData的信息用一个相关联的方式提供给用户。当用户查看研究项目,研究项目信息将呈现给用户。除了该研究项目的信息外,该***将检索基于研究项目中的字段:分析过程ID108.1相关的分析过程信息,并进一步检索基于该分析过程相关字段:结果报告ID109.1相关联的结果报告信息。最终,所有的相关信息显示在一个网页上。
类似地,图9是一个显示学习界面的示例性实施方案图;若用户观看一个分析过程,该***用分析过程字段中的结果报告ID109.1和研究项目ID107.1检索相关的结果报告和研究项目信息。
若用户查看结果报告时,与之相关的研究项目、分析过程和详细结果(GeneData)信息可以被检索并与报表一起显示。
图11是一个显示结果报告界面的示例性实施方案图,当用户查看详细结果(GeneData)时,将显示相关研究项目、分析过程、结果报告的信息。
根据标准化,一个分面分类***221控制这些记录的类别,该***按多个明确的维度对每个信息元素进行分类。类别221设计成能够使分类能以多种形式被访问和下令。
图12是一个显示的详细结果报告界面的示范性实施方案图,目录按组织类型和疾病进行分类;实验类型分类按实验设计进行,如患病组织与正常组织,治疗组与未治疗组;结果报告按结果类型进行分类,包括拷贝数变异CNV,杂合性缺失LOH;分析过程类型分类按分析方法进行;信息的分类按信息层次进行,信息层次包含:转录组,基因组和表观基因组;生物体按提供标本的生物进行分类。
分面分类221在面搜索中使用,这将在4.5中进一步解释。
4.3本发明的广告模块示例
如图3根据本发明设计的元素领域信息的示例性实施方案图,基因218关联了GeneData和广告217的记录。广告中的字段基因ID,218.1指向相关的通用名,而通用名中的字段GeneDataID,219.1又指向相关的GeneData。同样,GeneData中的字段基因ID218.1指向相关的通用名称:基因218,而通用名:基因218包括的一个字段:广告ID,217.1指向广告。
图14是一个根据本发明研发的广告模块的的示例性实施方案图,图16是一个通用名输入接口的示例性实施方案;17是一个显示通用名和广告的输入接口的示例性实施方案图;进一步的举例说明,***允许厂商215把广告217输入到数据集并和基因相关联。图15是一个广告输入接口的示例性实施方案图;在***数据库中存储检索的广告信息。这些检索信息包含:广告标题,广告机构,通用名218.1,也指基因ID和标题,广告词217.6,每次行动量217.3,每日预算217.4,今日剩余217.5。
当用户101的要求查看实验记录结果219时,***会调用通用名检查模块301。该模块将检查与该实验结果相关的通用名基因,218是否关联了相关的广告,届时,用户101将看到需要的实验结果和相关广告。
是点击付费广告依靠每次行动量217.3,每日预算217.4,每日剩余217.5的信息。当用户点击广告时,***会从“今日剩余”里扣除“每次行动量”。“今日剩余”设定为每天预算,并在预定的周期复位。数据库表存储每一次的点击和相关交易信息,作为将来广告主支出广告费用的理由。该***可以通过预定的准则计算有效点击。
4.4本发明的赞助模块示例
基因218关联GeneData219和赞助216。赞助中的字段基因ID,218.1指向相关的通用名,而通用名中的一个字段:GeneDataID,219.1指向相关的GeneData219。同样,GeneData219,中的一个字段基因ID,218.1指向相关的通用名218,而通用名218中的一个字段赞助ID,217.1指向相关的赞助216。
图18是一个根据本发明研发的赞助模块的的示例性实施方案图;示例进一步体现了如何从赞助216关联到研究者101。根据图2的示例,厂商215将赞助信息216输入到记录字段中,并将相关的赞助关联到通用名基因,218,最终和分享共同一个通用名基因,218的某些实验结果219实现关联。
图19是一个赞助输入接口的示例性实施方案,图20是一个显示赞助界面的示例性实施方案;图21是提供赞助界面的示例性实施方案;赞助的输入接口,检索的赞助信息存储在数据库中。这些检索信息包括:赞助标题,赞助介绍,通用名218.1,也指作基因ID和标题,每次行为量217.3,每天预算217.4,今日剩余217.5。
按着图18的一个根据本发明研发的赞助模块的的示例性实施方案图,用户必须使用一个预付帐户才能使用该功能。
当用户(研究员)查看实验结果219时,***会调用访问权限检测模块402看用户是否有权限查看结果GeneData。如果用户确实有权限,***会直接呈现用户所请求的信息219;如果用户不具备该权限,***会调用获取访问模块404,用户可以选择自己付款405,随后***会出现一个付款界面并获得访问权;也可以查询通用名218来查找相关的赞助216,如果这个结果的通用名218有一个相关联的赞助216,用户可以用赞助预付费帐户中的一定数量的资金来付费,从而获得407访问权。一定的资金将来自扣除。作为回报,赞助者可以获得被赞助人(这里指研究人员)的信息。要求查看结果(GeneData)的用户是未来某些通用名基因,218相关产品的潜在买家。在本示例中,相关基因产物包括:抗体,siRNAs,引物和质粒。赞助商可以联系用户推广这些产品。为了实现即时交易,赞助商被要求预存一定数额的资金到本***的账户中。
图22是一个自费工作流的示例性实施方案;当用户选择自费模块时,***会首先检查该用户是否满足以下三个预定条件:1,该用户已登录;2,该用户无访问权限;3,用户的预付费账户中有足够的钱。如果这些条件都满足,则***将触发预定的动作:1),从用户帐户中扣钱;2)授予用户访问权限;和3)给用户显示交易信息。
图23是一个由赞助商付费的的工作流的示例性实施方案;当用户选择由赞助商(接受赞助)支付,***会首先做一个条件检查,以确保所有的预定条件得到满足。在此需要以下三个条件:1)用户已登录;2)用户无访问权限;3)请求的内容有赞助。如果这些条件都满足,则***将触发预定的操作。该操作是:1)如果很多个赞助商,选择资金最高者;2)从赞助商的账户中扣钱;3)授予用户访问权限;4)展示交易信息;5)电子邮件通知赞助商此次交易;6)电子邮件通知用户此次交易。
4.5分面搜索***示例。
图24是为面搜索的索引结构的示例性实施方案,研究项目、分析过程、结果报告和详细结果以两种不同的方式编入索引。一种索引是从研究项目到详细结果,另一种是从详细结果到研究项目。这两种索引都把研究项目,分析过程,结果报告和详细结果的相关信息和字段整合到一个大表中,当用这种形式把数据库中的记录编入索引,研究项目、分析过程、结果报告和详细结果的分面分类之间形成共享。例如,详细结果在研究项目中用类别分类,而研究项目类别中包括分析过程类型、目录和结果报告类型。
该***为用户提供搜索不同类型的内容的信息分面搜索界面,4.2中已经讲述了分面搜索采用用分面分类法的优势,搜索的内容选项包括:研究项目、分析过程、结果报告、详细结果(本示例的GeneData)和通用名(本示例的基因符号)。
图25是一个根据本发明研发的多平面的界面示例性实施方案,信息显示界面有3类,第1类501,类2别502和类3别503的界面的方式存在的信息,每一类都进一步包含多个子类别。搜索框502供用户填写搜索条件。用户可以选择搜索内容类型503,505,并输入关键字504,506。搜索结果将显示在509。每个分类的互动界面会根据搜索条件而及时更新信息。图26是一个小平面的搜索界面的实施方案1示意图;图27是一个小平面的搜索界面的实施方案2示意图,举例说明了按GeneData->结果报告->分析过程->研究项目的索引结构对详细结果GeneData的一个分面搜索界面。研究项目中的分面分类***可以用来分类索引记录。可以想象,如果分面搜索***用如ApacheSOLR(http://lucene.apache.org/solr/)这种搜索引擎服务器会更加有利。
可以访问万维网http://www.esophageal-cancer.org来了解本发明的***,该***已经参照优选的实施方式,特别适合用于对来自高通量生物实验得出的结果进行管理和搜索。同样,本发明的***也适用于其它包含高通量研究项目管理的应用。
本***不局限于使用在此描述的物理文件、记录、字段结构,其他和本发明逻辑相同的物理结构也是等同能使用的。
以上所揭露的仅为本发明一种实施例而已,当然不能以此来限定本之权利范围,本领域普通技术人员可以理解实现上述实施例的全部或部分流程,并依本发明权利要求所作的等同变化,仍属于本发明所涵盖的范围。

Claims (17)

1.一种基于网络的处理高通量实验数据管理***,其特征在于包括:一个通信接口实现数据和指令以电信号的形式发送到或接收远程计算机或设备;一个数据库实现存储高通量实验导出的信息,所述信息包含:研究项目、结果报告、分析过程、每个研究项目对应的分析过程、每个分析过程对应的结果报告;一个可以对多个连接的远程计算机数据库的可读存储器进行数据创建和修改的数据库管理器;一个迭代数据库检索引擎,连接至上述数据库,引擎构造容许开展一次初始搜索和至少一个后续搜索,在第一个搜索或之前的搜索结果上进行后续搜索;一个程序控制器,连接到上述的数据库管理器、迭代数据库检索引擎和通信端口。
2.根据权利要求1所述的基于网络的处理高通量实验数据管理***,其特征在于还包括从相应的分析过程得出的结果报告摘要和实验结果的列表。
3.根据权利要求1所述的基于网络的处理高通量实验数据管理***,其特征在于还包含能从所述数据库中检索信息的网络接口,将信息呈现给用户。
4.根据权利要求1所述的基于网络的处理高通量实验数据管理***,其特征在于还包括一个分面搜索***,该***包含:一个对所述高通量实验得出的资料进行分类的分面分类***;和一个对分类信息进行搜索和显示的分面搜索界面。
5.根据权利要求4所述的基于网络的处理高通量实验数据管理***,其特征在于分面分类***对研究项目、分析过程和结果报告的信息进行分类,这些分类包含:搜索字段、研究项目类型、分析过程类型和实验样品类型。
6.根据权利要求4所述的基于网络的处理高通量实验数据管理***,其特征在于所述的分面搜索接口是一个网页,包含:a)网页中显示搜索结果的中心对话框;b)至少一个用来输入搜索条件的对话框;c)至少一个显示类别信息的对话框。
7.根据权利要求1所述的基于网络的处理高通量实验数据管理***,其特征在于还包括一个广告***,该***包括:a)一个通用名***,将结果报告中的检测结果统一成通用名,并使每个检测与相应的通用名关联;b)一种允许广告商输入广告信息并与之相关联到一个或多个选定的通用名上的模块;c)利用通用名将广告关联到检测结果,将检测结果和广告一起呈现给用户的一个界面。
8.根据权利要求7所述的基于网络的处理高通量实验数据管理***,其特征在于所述通用名包括:基因符号、代谢物、化学制品和装置、实验结果可读的检测方法的名称。
9.根据权利要求1所述的基于网络的处理高通量实验数据管理***,其特征在于进一步还包括一个访问控制***,该***包含:a)一个将信息放入一个访问控制库的模块;b)一种在预定条件授予用户访问信息权限的模块。
10.根据权利要求9所述的基于网络的处理高通量实验数据管理***,其特征在于所述的预定条件:包括如下:a)一个赞助商设置一个赞助并将其通过通用名关联到结果,用户在试图访问实验结果时同意接受赞助商的赞助;b)每个结果单独定价,用户付费。
11.根据权利要求1所述的基于网络的处理高通量实验数据管理***,其特征在于还包括一个营销***,所述营销***包括:为用户提供一个输入信息的接口;把信息存储到一个联机数据库,并设置成访问受限型数据库;为赞助商提供以下服务:1)输入赞助信息,2)把赞助与访问受限的信息相关联;将这2个信息发布到联机数据库上,在预定条件下,向赞助商收费,授予用户访问权限,并通知该交易的有关当事人。
12.根据权利要求11所述的基于网络的处理高通量实验数据管理***,其特征在于将赞助与访问首先的信息关联须通过通用名实现,这些通用名包括:基因符号、代谢物、化学制品和装置、实验结果可读的检测方法的名称。
13.根据权利要求11所述的基于网络的处理高通量实验数据管理***,其特征在于所述预定的条件包括1)呈现一个界面,以允许用户接受或拒绝赞助;2)用户接受赞助。
14.根据权利要求1所述的基于网络的处理高通量实验数据管理***,其特征在于所述的赞助信息,包括:每个赞助的量,每一天的预算、赞助的标题。
15.根据权利要求1所述的基于网络的处理高通量实验数据管理***,其特征在于还包括广告***,所述的广告***包括:提供一个接口用于检索检测的分析结果;把信息存储到联机数据库;把检测统一成通用名,并把两者对应相关。为广告客户提供一个接口来检索广告信息,并把广告信息与通用名相关;把广告信息和关联存储到联机数据库;在预定条件下,把检测结果和关联的广告一起呈现给用户。
16.根据权利要求15所述的基于网络的处理高通量实验数据管理***,其特征在于于所述的预定条件是:用户浏览检测的分析结果。
17.根据权利要求1所述的基于网络的处理高通量实验数据管理***,其特征在于所述的通用名,包含:基因符号、代谢物、化学制品和装置、实验结果可读的检测方法的名称。
CN201510193293.4A 2014-08-27 2015-04-22 一种基于网络的处理高通量实验数据管理*** Pending CN105224585A (zh)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
US14/470722 2014-08-27
US14/470,722 US20160132923A1 (en) 2014-08-27 2014-08-27 System of using high throughput studies to guide research and marketing

Publications (1)

Publication Number Publication Date
CN105224585A true CN105224585A (zh) 2016-01-06

Family

ID=54993554

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201510193293.4A Pending CN105224585A (zh) 2014-08-27 2015-04-22 一种基于网络的处理高通量实验数据管理***

Country Status (3)

Country Link
US (1) US20160132923A1 (zh)
CN (1) CN105224585A (zh)
WO (1) WO2016029709A1 (zh)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109727646A (zh) * 2018-12-29 2019-05-07 北京优迅医学检验实验室有限公司 基因样本的处理方法及装置、移动终端
CN110140179A (zh) * 2016-10-26 2019-08-16 拜克门寇尔特公司 实验室仪器的远程监测

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106650319A (zh) * 2016-11-15 2017-05-10 上海派森诺生物科技股份有限公司 高通量Miseq测序数据自动化过滤方法

Family Cites Families (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7778874B1 (en) * 2005-11-14 2010-08-17 A9.Com, Inc. Automated generation of suggested online advertising campaign parameters
CN101499162A (zh) * 2009-03-05 2009-08-05 唐文超 医学科研数据管理***及其方法
CN101727644A (zh) * 2009-12-28 2010-06-09 兆信(中国)网络科技有限公司 商品数字身份识别精确定位网络广告方法及其***

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110140179A (zh) * 2016-10-26 2019-08-16 拜克门寇尔特公司 实验室仪器的远程监测
CN109727646A (zh) * 2018-12-29 2019-05-07 北京优迅医学检验实验室有限公司 基因样本的处理方法及装置、移动终端

Also Published As

Publication number Publication date
US20160132923A1 (en) 2016-05-12
WO2016029709A1 (zh) 2016-03-03

Similar Documents

Publication Publication Date Title
Stringham et al. A guide to using the Internet to monitor and quantify the wildlife trade
Grossman Data lakes, clouds, and commons: a review of platforms for analyzing and sharing genomic data
Daniel et al. Adoption of e-commerce by SMEs in the UK: towards a stage model
González-Barahona et al. On the reproducibility of empirical software engineering studies based on data retrieved from development repositories
US9064021B2 (en) Data source attribution system
CN106462337A (zh) 综合式消费者基因组服务
US20120316970A1 (en) System and method for providing targeted content
CN101238461A (zh) 能够访问开放网络内容的付费访问法律研究***
Wang et al. Database submission—market dynamics and user-generated content about tablet computers
Fast et al. Regulation of data-driven market power in the digital economy: Business value creation and competitive advantages from big data
Shah et al. Government big data ecosystem: definitions, types of data, actors, and roles and the impact in public administrations
Jalali et al. Evolution and reproducibility of simulation modeling in epidemiology and health policy over half a century
KR20220003056A (ko) 관리형 네트워크에 의해 사용되는 소프트웨어의 결정 및 조정
Bledsoe et al. Ensuring effective utilization of biospecimens: Design, marketing, and other important approaches
Pereira et al. Library as a consortium perspective: A systematic literature review
CN105224585A (zh) 一种基于网络的处理高通量实验数据管理***
Del Baldo et al. Funding, turnover, sustainability and digital technologies: a multicriteria research model for SMEs facing a challenging context
Musa et al. Marketing research trends using technology acceptance model (TAM): A comprehensive review of researches (2002–2022)
Passlick et al. Self-service business intelligence and analytics application scenarios: A taxonomy for differentiation
Desmal et al. Exploring the information quality of mobile government services: a literature review
Wasilewski Functional framework for multivariant e-commerce user interfaces
Abousalh‐Neto et al. Better together: Extending JMP® with open‐source software
Chandrashekaran et al. Estimating contagion on the Internet: evidence from the diffusion of digital/information products
Ramesh Kumar et al. Laying foundation for successful implementation of lean manufacturing through the elimination of non-value adding activities in conventional engineering products manufacturing companies
Liu et al. Intellectual structure in supply chain risk management from 2000 to 2022: A review based on text mining approach

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication

Application publication date: 20160106

RJ01 Rejection of invention patent application after publication