CN110431400A - 利用基质辅助激光解吸/离子化飞行时间质谱仪进行数据库管理 - Google Patents

利用基质辅助激光解吸/离子化飞行时间质谱仪进行数据库管理 Download PDF

Info

Publication number
CN110431400A
CN110431400A CN201780062818.8A CN201780062818A CN110431400A CN 110431400 A CN110431400 A CN 110431400A CN 201780062818 A CN201780062818 A CN 201780062818A CN 110431400 A CN110431400 A CN 110431400A
Authority
CN
China
Prior art keywords
data
sample
test data
spectrometer
method described
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201780062818.8A
Other languages
English (en)
Inventor
赵英俊
赵邀韩
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Highland Innovation Co
Original Assignee
Highland Innovation Co
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Highland Innovation Co filed Critical Highland Innovation Co
Publication of CN110431400A publication Critical patent/CN110431400A/zh
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/24Querying
    • G06F16/245Query processing
    • G06F16/2458Special types of queries, e.g. statistical queries, fuzzy queries or distributed queries
    • G06F16/2462Approximate or statistical queries
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16HHEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
    • G16H50/00ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics
    • G16H50/20ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics for computer-aided diagnosis, e.g. based on medical expert systems
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/40Information retrieval; Database structures therefor; File system structures therefor of multimedia data, e.g. slideshows comprising image and additional audio data
    • G06F16/43Querying
    • G06F16/432Query formulation
    • G06F16/434Query formulation using image data, e.g. images, photos, pictures taken by a user
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F17/00Digital computing or data processing equipment or methods, specially adapted for specific functions
    • G06F17/10Complex mathematical operations
    • G06F17/18Complex mathematical operations for evaluating statistical data, e.g. average values, frequency distributions, probability functions, regression analysis
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16CCOMPUTATIONAL CHEMISTRY; CHEMOINFORMATICS; COMPUTATIONAL MATERIALS SCIENCE
    • G16C20/00Chemoinformatics, i.e. ICT specially adapted for the handling of physicochemical or structural data of chemical particles, elements, compounds or mixtures
    • G16C20/20Identification of molecular entities, parts thereof or of chemical compositions
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16CCOMPUTATIONAL CHEMISTRY; CHEMOINFORMATICS; COMPUTATIONAL MATERIALS SCIENCE
    • G16C20/00Chemoinformatics, i.e. ICT specially adapted for the handling of physicochemical or structural data of chemical particles, elements, compounds or mixtures
    • G16C20/90Programming languages; Computing architectures; Database systems; Data warehousing
    • HELECTRICITY
    • H01ELECTRIC ELEMENTS
    • H01JELECTRIC DISCHARGE TUBES OR DISCHARGE LAMPS
    • H01J49/00Particle spectrometers or separator tubes
    • H01J49/0027Methods for using particle spectrometers
    • H01J49/0036Step by step routines describing the handling of the data generated during a measurement
    • HELECTRICITY
    • H01ELECTRIC ELEMENTS
    • H01JELECTRIC DISCHARGE TUBES OR DISCHARGE LAMPS
    • H01J49/00Particle spectrometers or separator tubes
    • H01J49/02Details
    • H01J49/04Arrangements for introducing or extracting samples to be analysed, e.g. vacuum locks; Arrangements for external adjustment of electron- or ion-optical components
    • H01J49/0409Sample holders or containers
    • H01J49/0418Sample holders or containers for laser desorption, e.g. matrix-assisted laser desorption/ionisation [MALDI] plates or surface enhanced laser desorption/ionisation [SELDI] plates
    • HELECTRICITY
    • H01ELECTRIC ELEMENTS
    • H01JELECTRIC DISCHARGE TUBES OR DISCHARGE LAMPS
    • H01J49/00Particle spectrometers or separator tubes
    • H01J49/02Details
    • H01J49/10Ion sources; Ion guns
    • H01J49/16Ion sources; Ion guns using surface ionisation, e.g. field-, thermionic- or photo-emission
    • H01J49/161Ion sources; Ion guns using surface ionisation, e.g. field-, thermionic- or photo-emission using photoionisation, e.g. by laser
    • H01J49/164Laser desorption/ionisation, e.g. matrix-assisted laser desorption/ionisation [MALDI]
    • HELECTRICITY
    • H01ELECTRIC ELEMENTS
    • H01JELECTRIC DISCHARGE TUBES OR DISCHARGE LAMPS
    • H01J49/00Particle spectrometers or separator tubes
    • H01J49/26Mass spectrometers or separator tubes
    • H01J49/34Dynamic spectrometers
    • H01J49/40Time-of-flight spectrometers
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16CCOMPUTATIONAL CHEMISTRY; CHEMOINFORMATICS; COMPUTATIONAL MATERIALS SCIENCE
    • G16C20/00Chemoinformatics, i.e. ICT specially adapted for the handling of physicochemical or structural data of chemical particles, elements, compounds or mixtures
    • G16C20/70Machine learning, data mining or chemometrics

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Chemical & Material Sciences (AREA)
  • Data Mining & Analysis (AREA)
  • Analytical Chemistry (AREA)
  • General Physics & Mathematics (AREA)
  • Databases & Information Systems (AREA)
  • Mathematical Physics (AREA)
  • Optics & Photonics (AREA)
  • Probability & Statistics with Applications (AREA)
  • General Engineering & Computer Science (AREA)
  • Health & Medical Sciences (AREA)
  • Software Systems (AREA)
  • Pure & Applied Mathematics (AREA)
  • Mathematical Optimization (AREA)
  • Computational Mathematics (AREA)
  • Mathematical Analysis (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Public Health (AREA)
  • Medical Informatics (AREA)
  • Biomedical Technology (AREA)
  • Plasma & Fusion (AREA)
  • Computing Systems (AREA)
  • Algebra (AREA)
  • Evolutionary Biology (AREA)
  • Operations Research (AREA)
  • General Health & Medical Sciences (AREA)
  • Primary Health Care (AREA)
  • Epidemiology (AREA)
  • Pathology (AREA)
  • Multimedia (AREA)
  • Fuzzy Systems (AREA)
  • Computational Linguistics (AREA)
  • Crystallography & Structural Chemistry (AREA)
  • Spectroscopy & Molecular Physics (AREA)
  • Other Investigation Or Analysis Of Materials By Electrical Means (AREA)

Abstract

一种设备、方法或计算机程序。可接收样本的光谱仪测试数据。可将收到的测试数据与参考库匹配,以通过使测试数据与参考库中的多个参考数据中的至少一个相关,确定样本的特征信息。基于该相关,利用测试数据作为新参考数据更新参考库。可在云计算***中执行该匹配。

Description

利用基质辅助激光解吸/离子化飞行时间质谱仪进行数据库 管理
相关申请的交叉引用
本申请要求2016年8月22日提交的第62/377,768号美国临时专利申请的优先权,其全部内容兹通过引用并入本案。
背景技术
生物标志物是存在于血液、其他体液或组织中的生物分子,其是正常过程或异常过程的或者病症或疾病的标志。例如,糖蛋白CA-125是指示存在癌症的生物标志物。因此,通常测量并且评估生物标志物,以认定特定疾病的存在或进展或者观察身体对疾病或病症的治疗的反应好不好。生物标志物在蛋白质、肽、脂质、聚糖或代谢物中的存在或其数量水平的变化能够由质谱仪测量。
在众多类型的质谱仪中,基质辅助激光解吸/离子化飞行时间质谱仪(MALDI-TOFMS)是采用软离子化技术的分析工具。样本埋置于基质中,并且可以对基质发射激光脉冲。基质吸收激光能量,并且基质的分子发生离子化。然后,电场使离子化分子加速通过真空管的一部分,并且然后,离子化分子在室内没有电场的其余地方飞行。测量飞行时间,以产生质荷比(m/z)。MALDI-TOF MS以非常高的准确性和亚皮克分子灵敏度对诸如肽、蛋白质、和大有机分子的生物分子提供快速认定。MALDI-TOF MS可在实验室环境下用于快速并且准确地分析生物分子并将其应用扩展到临床领域,诸如微生物检测和诸如癌症的疾病诊断。
然而,临床环境下利用MALDI-TOF MS进行疾病诊断存在一些问题。一个问题是质量分析数据的再现性差。特别是,样本制备过程是影响MALDI-TOFMS的数据再现性的主要因素,在MALDI-TOF MS中,从原始样本中提取特定目标材料,与基质混合,并且然后,装入样本板。处理过程不可避免地引入人工干预,其中人手动地将样本从一个处理步骤移动到另一个处理步骤并且/或者执行大量实验过程。这样使得数据容易受到不可控外部影响,这样导致样本的同质性或可分辨性差并且存在样本被污染的风险。
影响数据再现性的另一个因素是MALDI-TOF MS***本身的测量灵敏度或测量过程。虽然MALDI-TOF MS能够以高灵敏度快速分析样本,使得其成为临床应用的良好工具,其可能是较差的定量分析器,因为检测到的信号强度的相对标准偏差(RSD)由于采用有机基质的离子化过程的性质而较高。即使MALDI-TOF MS***采用5延迟提取技术,使质量的所有粒子在刚好进入室中的无电场区之前获得相同的动能存在挑战。其可以是不可避免的数据散布源。
除了再现性低的问题,在临床环境下利用MALDI-TOF进行疾病诊断还存在:成本问题、维护问题、和/或者样本准备困难。某些***可能太昂贵并且太笨重而不能用于临床环境中,并且/或者非常难以用于医护点测试(“POCT”)和/或就地护理。为了在临床和/或POCT/就地护理环境中使用,需要使整个***小型化、容易管理、能够产生更具再现性的数据、并且/或者具有较低的成本。
利用库数据库的诊断过程具有另一个挑战,在该诊断过程中,需要将测试样本的测试数据的匹配运算与较大的数据库进行比较。因为实际原因(例如,数据库大小、数据库的适合性、搜索数据库要求的处理能力等),在光谱仪内提供较大并且最新的数据库更有困难。这些困难可能对诊断***的操作具有性能影响。
发明内容
实施例涉及一种设备、方法或计算机程序。可接收样本的光谱仪测试数据。可将收到的测试数据与参考库匹配,以通过使测试数据与参考库中的多个参考数据中的至少一个相关,确定样本的特征信息。基于相关,将测试数据作为新参考数据更新参考库。在实施例中,在云计算***中执行该更新。
附图说明
示例性图1是根据实施例,样本处理单元、MALDI-TOF MS单元和诊断单元分别位于三个不同***中的疾病诊断实验室的布置。
示例性图2是根据实施例,包含集成到一个***中的样本处理单元、30 MALDI-TOFMS单元和诊断单元的***图。
示例性图3是根据实施例,将样本处理单元、MALDI-TOF MS单元和诊断单元包含在一个***中的集成***的***图。
示例性图4是根据实施例,包含集成于一个***中的样本处理单元和MALDI-TOFMS单元,而诊断单元作为独立单元提供的集成诊断***的***图。
示例性图5示出根据实施例,配置成通过网络106与质谱仪102和客户装置104a、104b通信的光谱识别器108。
示例性图6是根据实施例的计算装置(例如,***)的方框图,图2B示出根据实施例,布置为基于云的服务器***的计算群集器209a、209b和209c的网络106。
示例性图7示出根据实施例,用于光谱认定的示例性方法300。
示例性图8示出根据实施例,示例性输入光谱360和输入光谱360的峰的相应图362。
示例性图9示出根据实施例的示例性***和网络的方框图。
示例性图10示出根据实施例的云计算节点。
示例性图11示出根据实施例的云计算环境。
示例性图12示出根据实施例的抽象模型层。
具体实施方式
生物标志物是存在于血液、其他体液或组织中的生物分子,其是正常过程或异常过程的或者病症或疾病的标志。在众多类型的质谱仪中,基质辅助激光解吸/离子化飞行时间质谱仪(MALDI-TOF MS)是采用软离子化技术的分析工具。MALDI-TOF MS可在实验室环境下用于快速并且准确地分析生物分子并将其应用扩展到临床领域,诸如,微生物检测和诸如癌症的疾病诊断。
影响数据再现性的因素可以是MALDI-TOF MS***的测量灵敏度或测量过程和协议。虽然MALDI-TOF MS能够以高灵敏度快速分析样本,但可能存在定量分析复杂化问题,因为由于离子化过程中的瑕疵,检测到的分布布型的相对标准偏差(RSD)可能较高。在实施例中,可以使数据更可再现的方式校准、标准化、归一化并且/或者以其他方式操控光谱仪数据。
示例性图1示出疾病诊断实验室,根据实施例,在该疾病诊断实验室中,样本处理设施101包含彼此分开的多个样本处理工具、MALDI-TOF MS***102和诊断软件***103。例如,为了提取用于卵巢癌诊断的聚糖,将患者的血清加入到多孔板111内,以进行样本接收过程和蛋白质变性过程112,然后是采用酶的去糖基化过程113。然后,进行蛋白质去除过程114、干燥及离心过程、聚糖提取过程115和点样(spotting)过程116。MALDI-TOF MS***102分析所点样本,以产生至少一个聚糖布型。诊断软件103将该样本的聚糖布型与一个或多个预存聚糖布型进行比较,以认定存在卵巢癌和卵巢癌的进展。示例性图2是根据实施例的MALDI-TOF MS***的示意图。
示例性图3是根据实施例将样本处理单元、MALDI-TOF MS单元和诊断单元包含在一个***中的集成***的***图。样本可由样本处理单元中的所选模块进行组合处理。在样本制备***301中,在自动样本制备单元311中,根据诊断或筛选目的,样本经过预定的预设工序。在实施例中,对于聚糖提取,可选择多个处理模块,多个处理模块用于样本接收、蛋白质变性、去糖基化、蛋白质去除、干燥、离心、固相提取和/或点样。在样本制备后,样本加载器312将样本加载到板306上,并在样本干燥器307中干燥。
然后,根据实施例,可将样本提供给具有离子飞行室321和/或高电压真空发生器322的MALDI-TOF MS单元302。MALDI-TOF MS中的处理单元323可以认定离子化粒子的飞行时间和检测器检测到的相应强度分布。出于疾病诊断的目的,根据实施例,可以重新组织这样获取的飞行时间和强度数据,以建立标准飞行时间列表,在标准飞行时间列表中引入飞行时间分布中心的概念,对于每个标准飞行时间,该中心是强度平衡并且均衡之处。标准飞行时间列表可基于机器准确性和其他有关考虑因素。对每次激光照射存储的光谱数据也可用于建立标准飞行时间列表。然后,诊断单元303可将来自患者样本的光谱与预存的光谱进行比较,并分析两个光谱的布型差异。然后,诊断单元可以认定存在疾病及其进展。
示例性图4是根据实施例包含集成于一个***中的样本处理单元和MALDI-TOF MS单元,而诊断单元403作为独立单元提供的集成诊断***的***图。示例性图4示出根据实施例样本制备单元401和MALDI-TOF402集成在一起,而诊断单元403作为独立单元分开布置的集成疾病诊断***。
在实施例中,诊断单元可以使用参考库。参考库可与诊断单元安置在一起,也可与诊断单元分开。诊断单元可与光谱仪安置在一起,也可与光谱仪分开。在实施例中,参考库可存储于储存装置、基质辅助激光解吸/离子化飞行时间质谱仪(MALDI-TOF MS)、位于光谱仪中的数据储存装置、与光谱仪分开的数据储存装置、通过网络与光谱仪通信的数据储存装置、云储存***和/或通过互联网连接与光谱仪通信的数据储存装置中。
实施例涉及设备、方法或计算机程序。在实施例中,可以接收样本的光谱仪测试数据进行处理(例如,在诊断单元103、303和/或403处)。可将光谱仪测试数据与参考库匹配来确定样本的特征信息。参考库可包含以光谱仪过去检测到的预存参考样本的离子化粒子的时间和强度为单位的光谱仪样本数据。光谱仪参考数据具有匹配运算与接收到的光谱仪测试数据关联的已知特征。在实施例中,光谱仪测试数据是质谱仪测试数据并且/或者该光谱仪是质谱仪。在实施例中,光谱仪是基质辅助激光解吸/离子化飞行时间质谱仪(MALDI-TOFMS)。
在实施例中,样本包含生物分子并且/或者样本的特征信息包含样本的生物分析信息。生物分析信息可以是人、动物、植物和/或生物体的医学诊断。
例如,图5示出配置成通过网络506与质谱仪502和客户装置504a、504b通信的光谱识别器508。网络506可以是LAN、广域网(WAN)、企业内部网、公用互联网或配置成在联网的计算装置之间提供通信通路的任何类型的网络。网络506还可以是LAN、WAN、企业内部网和/或公用互联网中的一个或者多个的组合。
尽管图5仅示出两个客户装置,但是分布式应用架构可对数十、数百、数千的客户装置提供服务。此外,客户装置504a和504b(或任何其他客户装置)可以是任何一种计算装置,诸如,普通膝上型计算机、台式计算机、网络终端、无线通信装置(例如,蜂窝电话或智能电话)等。在某些实施例中,客户装置504a和504b能够专用于质谱仪和/或细菌学研究。在其他实施例中,客户装置504a和504b可用作通用计算机,其配置成执行许多任务,并且不需要专用于质谱仪或细菌学研究。在另外的其他实施例中,光谱识别器508和/或光谱数据库510的功能能够并入诸如客户装置504a和/或504b的客户装置中。在另外的其他实施例中,光谱识别器508和/或光谱数据库510的功能能够并入质谱仪502内。
质谱仪502能够配置成接收输入材料,例如,LA和/或LTA,并且产生一个或者多个光谱作为输出。例如,质谱仪502可以是电喷雾离子化(ESI)串联质谱仪或基于SAWN的质谱仪。在某些实施例中,能够将输出光谱提供给另一个装置,例如,光谱识别器508和/或光谱数据库510,也许用作装置的输入。在其他实施例中,输出光谱能够显示于质谱仪502、客户装置504a和/或504b、和/或光谱识别器508上。
光谱识别器508能够配置成通过网络506从质谱仪502和/或客户装置504a和/或504b接收一个或者多个光谱,作为输入。在某些实施例中,光谱识别器能够配置成通过对光谱识别器508击键、触摸屏或类似数据输入、到质谱仪502和/或(多个)客户装置504a和/或504b的(多个)硬布线连接、配置成存储输入光谱的访问储存介质(例如,光谱数据库510、闪速介质、压缩光盘、软盘、磁带)和/或直接对光谱识别器508提供输入光谱的任何其他技术直接接收输入光谱。
光谱识别器508可配置成通过将一个或者多个输入光谱与存储光谱512进行比较产生光谱认定结果。例如,存储光谱512可以是已知离子质谱光谱。如示例性图5所示,存储光谱512能够常驻于光谱数据库510中。当执行光谱认定时,光谱识别器508能够访问并且/或者查询光谱数据库510,以检索存储光谱512的一部分或全部。在一些实施例中,光谱识别器508能够直接执行比较任务;而在其他实施例中,也许通过对存储光谱512执行一个或者多个查询语言命令,光谱数据库510能够执行部分或全部光谱认定任务。
尽管图5示出直接连接的光谱识别器508和光谱数据库510,但是在其他实施例中,光谱识别器508能够包含光谱数据库510的功能,包含存储该存储光谱512。在另外的其他实施例中,光谱识别器508和光谱数据库510能够通过网络506连接。
认定了输入光谱后,光谱识别器508能够配置成根据客户装置504a和/或504b的请求提供至少与光谱认定结果有关的内容。与光谱认定结果有关的内容能够包含但并不局限于:网页、超文本、脚本、诸如编译软件的二进制数据、图像、音频和/或视频。该内容可包含压缩内容和/或非压缩内容。该内容能够被加密和解密。也可以是其他类型的内容。
示例性图6是根据示例性实施例的计算装置(例如,***)的方框图。特别是,图6所示的计算装置600能够配置成执行质谱仪602、客户装置604a、604b、网络606、光谱识别器608、光谱数据库610、和/或存储光谱512的功能。计算装置600可包含全部可通过***总线、网络或其他连接机制605链接在一起的:用户接口模块601、网络通信接口模块602、一个或者多个处理器603、以及数据储存器604。
用户接口模块601能够运行为将数据发送到外部用户输入/输出装置和/或从外部用户输入/输出装置接收数据。例如,用户接口模块601能够配置成将数据发送到用户输入装置并且/或者从用户输入装置接收数据,诸如,键盘、小键盘、触摸屏、计算机鼠标、跟踪球、游戏杆、摄像头、声音识别模块、和/或者其他类似装置。用户接口模块601还能够配置成将输出提供给用户显示装置,诸如,一个或者多个阴极射线管(CRT)、液晶显示器(LCD)、发光二极管(LED)、采用数字光处理(DLP)技术的显示器、打印机、灯泡、和/或现在已知的或将来开发的其他类似装置。用户接口模块601还能够配置成产生(多个)音频输出,诸如,扬声器、扬声器插孔、音频输出端口、音频输出装置、耳机、和/或其他类似装置。
网络通信接口模块602可包含一个或者多个无线接口607和/或一个或者多个无线接口608,无线接口607和无线接口608可配置成通过诸如示例性图5所示的网络506的网络通信。无线接口607可包含一个或者多个无线发射机、接收机和/或收发信机,诸如,蓝牙收发信机、Zigbee收发信机、Wi-Fi收发信机、WiMAX收发信机、和/或可配置成通过无线网络通信的其他类似类型的无线收发信机。无线接口608可包含一个或者多个无线发射机、接收机、和/或收发信机,诸如,以太网收发信机、通用串行总线(USB)收发信机、或可配置成通过对绞线、一个或者多个导线、同轴电缆、光纤链路、或到无线网络的类似物理连接通信的类似收发信机。
在实施例中,网络通信接口模块602可配置成提供可靠、安全并且/或者验证的通信。对于在此描述的每种通信,能够提供保证可靠通信(例如,有保证的消息传递),也可作为消息报头和/或报尾的一部分(例如,分组/消息排序信息、(多个)封装报头和/或(多个)封装报尾、大小/时间信息、以及诸如CRC和/或奇偶校验值的传输验证信息)。利用一个或者多个密码协议和/或算法,诸如但并不局限于:DES、AES、RSA、Diffie-Hellman、和/或DSA,能够使通信安全(例如,对通信编码或加密)并且/或者对通信解密/解码。为了安全(并且然后解密/解码)通信,还可以使用或者除了在此所列的还可以使用其他密码协议和/或其他算法。
处理器603可包含一个或者多个通用处理器和/或一个或者多个专用处理器(例如,数字信号处理器、专用集成电路等)。处理器603能够配置成执行包含于储存器604中的计算机可读程序指令606和/或在此描述的其他指令。
数据储存器604能够包含一个或者多个能够被至少一个处理器603读取和/或访问的计算机可读储存介质。一个或者多个计算机可读储存介质能够包含易失性和/或非易失性储存部件,诸如,光学的、磁性的、有机的或其他存储器或磁盘储存器,其能够全部或部分地与至少一个处理器603集成在一起。在某些实施例中,能够利用单个物理装置(例如,一个光学的、磁性的、有机的或其他存储器或磁盘储存单元)实现数据储存器604,而在其他实施例中,能够利用两个或者多个物理装置实现数据储存器604。
数据储存器604能够包含计算机可读程序指令606并且也许包含附加数据。例如,在实施例中,数据储存器604能够分别存储部分或全部光谱数据库和/或存储光谱,诸如,光谱数据库510和/或存储光谱512。在某些实施例中,数据储存器604还能够包含执行在此描述的方法和技术的至少一部分和/或在此描述的装置和网络的至少一部分功能要求的储存器。
在实施例中,能够将光谱识别器508和光谱数据库510处的数据和服务编码为计算机可读信息,该计算机可读信息存储于有形计算机可读介质(或计算机可读储存介质)中,并且能够被客户装置504a和504b和/或其他计算装置访问。在实施例中,光谱识别器508和/或光谱数据库510处的数据能够存储于单个磁盘驱动器或其他有形储存介质上,也能够在位于一个或者多个不同地理地点的多个磁盘驱动器或其他有形储存介质上实现。
示例性图7示出根据实施例,用于光谱认定的示例性方法700。在方框710,接收输入光谱。该输入光谱可采用任意光谱格式,诸如但并不局限于采用:行数据格式、JCAMP-DX、ANDI-MS、mzXML、mzData、和/或mzML。也能够采用或者代之于采用其他格式。在方框720,识别输入光谱中的一个或者多个峰。
图8示出示例性输入光谱860和输入光谱860的峰的相应图862。图8具体示出输入光谱860中的3个最高峰,分别是峰864a、864b、和864c,如峰图862所示。
回到图7,在方框730,执行输入光谱中的峰与一个或者多个存储光谱中的峰的比较。存储光谱能够以光谱的任意格式存储,诸如但并不局限于以数据行格式、JCAMP-DX、ANDI-MS、mzXML、mzData、和/或mzML储存。在实施例中,在进行比较之前或进行比较时,能够转换输入光谱和/或一些或全部存储光谱的格式。存储光谱还能够包含附加信息,诸如,化合物、分子、结构、物质、离子、片段或能够用于认定光谱的其他识别器的名称。例如,如果存储光谱是纯水的光谱,则存储光谱能够具有诸如“水”或“H2O”的附加消息,从而有助于认定该存储光谱。
如果输入光谱的峰与一个或者多个存储光谱中的峰匹配,则方法700进入方框734。否则,方法700进入方框732,在方框732,产生“不匹配”显示,并且显示该“不匹配”显示。完成方框732的过程后,方法700能够进入方框750。
在方框734,将输入光谱与在方框730认定的一个或者多个匹配存储光谱中的每个进行比较。如果认为两个光谱不匹配,则方法700进入方框732(图7中未示出的传送控制)。
在方框740,当发现匹配时,能够产生基于最佳匹配光谱的输出。例如,如果保持认定存储光谱的信息,该输出能够指出匹配光谱的样性(identity)。此外或者取而代之,输入光谱和/或匹配光谱能够显示为显示器的一部分。
可利用诸如用户接口模块601的用户接口模块和/或诸如网络通信接口模块602的网络通信接口模块的一些或全部部件提供输出。例如,能够将输出显示于显示器上,能够打印该输出、能够利用一个或者多个扬声器以声音方式发出该输出、并且/或者利用网络通信接口模块将该输出传送到另一个装置。其他示例也可行。
在方框750,确定是否存在要处理的另外输入光谱。如果存在要处理的另外光谱,则方法700进入方框710;否则,则方法700进入方框752,在方框752,方法700退出。
示例性图9示出实施例可采用的和/或者实施例的实现中可采用的示例性***和网络的方框图。图9所示的定位***951和/或第一移动装置955和/或第二移动装置957可采用对计算机901示出并且在计算机901内示出的既包含所示的硬件又包含所示的软件的一些或全部说明性架构。
说明性计算机901包含耦合到***总线905的处理器903。处理器903可采用一个或者多个处理器,每个处理器都具有一个或者多个处理器核。驱动或支持显示器909的视频适配器907也耦合到***总线905。***总线905通过总线桥接器911耦合到输入/输出(I/O)总线913。I/O接口915耦合到I/O总线913。I/O接口915提供与各种I/O装置的通信,I/O装置包含键盘917、鼠标919、介质托盘921(可包含诸如CD-ROM驱动器的储存装置、多媒体接口等)和(多个)外部USB端口925。尽管连接到I/O接口915的端口的格式为计算机架构技术领域内的技术人员所公知,但是在一个实施例中,这些端口中的一些或全部是通用串行总线(USB)端口。
此外,耦合到I/O接口915的是定位***951,该定位***951利用定位传感器953确定计算机901和/或其他装置的位置。定位传感器953可以是任何类型的传感器,其能够确定例如计算机901、第一移动装置955、第二移动装置957等的计算装置的位置。定位传感器953可以采用但并不局限于采用:基于卫星的定位装置(例如,基于全球定位***-GPS的装置)、加速度表(用于测量运动的变化)、气压表(用于测量海拔的变化)等。
如图所示,利用网络接口929,计算机901能够与第一移动装置955和/或第二移动装置957通信。网络接口929是诸如网络接口卡(NIC)等的硬件网络接口。网络927可以是诸如互联网的外部网络,也可以是诸如以太网或虚拟专用网络(VPN)的内部网络。在一个或者多个实施例中,网络927是无线网络,诸如,Wi-Fi网络、蜂窝式网络等。
硬盘驱动器接口931也耦合到***总线905。硬盘驱动器接口931与硬盘驱动器933对接。在一个实施例中,硬盘驱动器933驻于***存储器935中,***存储器935也耦合到***总线905。***存储器是计算机901中的最低水平的易失性存储器。该易失性存储器包含另外较高水平的易失性存储器(未示出),包含但并不局限于:高速缓冲存储器、寄存器或缓冲器。驻于***存储器935中的数据包含计算机901的操作***(OS)937和应用程序943。
操作***(OS)937包括外壳939,用于对诸如应用程序943的资源提供透明用户访问。一般地说,外壳939是在用户与操作***之间提供解释器和接口的程序。更具体地说,外壳939执行进入命令行用户接口的或者来自文件的命令。因此,还将外壳939称为命令处理器,其通常处于操作***软件分层结构的最高层,并且用作命令解释器。外壳提供***提示符、解释经键盘、鼠标或其他用户输入介质输入的命令、并且将经解释的(多个)命令发送到操作***的适当较低层(例如,内核141)进行处理。尽管外壳939是基于文本的、面向行的用户接口,但是本发明将同样很好地支持其他用户接口模式,诸如,图形模式、语音模式、手势模式等。
如图所示,OS 937还包含内核941,该内核941包含OS 937的较低层功能性,该功能性包括提供OS 937的其它部分和应用程序943要求的必要服务,这些必要服务包含存储器管理、进程和任务管理、磁盘管理、以及鼠标和键盘管理。
软件程序943包含以说明性方式示为浏览器945的呈现器(renderer)。浏览器945包含程序模块和指令,这些程序模块和指令利用超文本传输协议(HTTP)消息传输来使万维网(WWW)客户机(即,计算机101)能够将网络信息发送至互联网并且能够从互联网接收网络信息,因此能够与第一移动装置955、第二移动装置957、和/或其他***通信。
计算机901的***存储器中的应用程序943还包含用于管理到移动装置的通知的逻辑(LMNMD)947。
计算机901中所示的硬件组件不旨在详尽的,而是表示对本发明所要求的必不可少组件的强调。举例而言,计算机901可包含可选存储器储存装置,诸如,磁带盒、数字通用盘(DVD)、柏努利盒(Bernoullicartridge)等。这些和其它变型旨在在本发明的精神和范围内。
实施例可在云环境下实现。应当事先明白,尽管本公开包含对云计算的详细描述,但是在此阐述的教导的实现并不局限于云计算环境。相反,本发明的实施例能够结合现在已知的或者将来开发的任何其他类型的计算环境实现。
云计算是对可配置计算资源(例如,网络、网络带宽、服务器、处理、存储器、储存、应用、虚拟机和服务)的共享池实现方便地按需网络访问的服务传输模型,通过最小管理工作或与服务提供者的交互能够迅速提供和释放该可配置计算资源。该云模型可包含至少五种特性、至少三种服务模型和至少四种部署模型。
云消费者能够在不需要与服务提供者进行人员交互的情况下,根据需要自动地单方面地提供诸如服务器时间和网络储存的计算能力。宽网络访问可使得有能力通过网络,并且通过促进异构薄或厚客户机平台(例如,移动电话、膝上型计算机和PDA)的使用的标准机制被访问。资源成池可使得提供者的计算资源成池以使用多占用者模型来服务多个消费者,根据需要动态地分配和再分配不同的物理资源和虚拟资源。存在这样一种地点独立性的感觉,即,消费者一般对所提供的资源的确切地点没有控制能力或知识,但是能够在更高的抽象水平上规定地点(例如,国家、州或数据中心)。
迅速弹性可使得迅速地并且弹性地、在一些情况下可以自动地提供迅速地标出并且迅速地释放从而迅速地标入的能力。对于消费者,可用于提供的能力常常看起来是不受限制的,并且可在任何时间以任意的量被购买。
测量服务可使得云***通过在适于服务类型(例如,储存、处理、带宽和活动用户帐户)的一些抽象水平上平衡计量能力,自动地控制并且优化资源使用。可以监视、控制和报告资源使用,从而对所用服务的提供者和消费者都提供透明性。
软件即服务(SaaS)可使得提供给消费者的能力是使用在云基础设施上运行的提供者的应用。可通过诸如网络浏览器(例如,基于web的电子邮件)的薄客户界面从各种客户装置访问该应用。消费者不管理也不控制包含网络、服务器、操作***、储存器甚或单个应用能力的底层云基础设施,有限的用户特殊应用配置设定可能是例外。
平台即服务(PaaS)可包含提供给消费者的能力是将消费者利用提供者支持的编程语言和工具创建的或获取的应用部署到云基础设施上。消费者不管理也不控制包含网络、服务器、操作***或储存器的底层云基础设施,但对于部署的应用和主机环境配置的应用具有控制能力。
基础设施即服务(IaaS)可提供给消费者的能力是提供消费者能够部署和运行可包含操作***和应用的任意软件的处理、储存、网络和其它基础计算资源。消费者不管理也不控制底层云基础设施,但对操作***、储存、部署的应用具有控制能力,并可能对于选择联网部件(例如,主机防火墙)具有有限控制能力。
专用云可以是仅为一个组织工作的云基础设施。其可由该组织或第三方管理,并且可存在应急设备或备用设备。社区云可以是几个组织共享的云基础设施,并且其支持具有共同关注(例如,任务、安全需要、政策和符合性考虑)的特定社区。其可由这些组织或第三方管理,并且可存在应急设备或备用设备。公共云可以是使得云基础设施可用于一般公共团体或大型行业团体并且由出售云服务的组织拥有。混合云可以是由保持实体的唯一性但利用实现数据和应用便携性的标准化技术或专用技术(例如,用于云之间的负载均衡的云突发)接合在一起的两个或更多个云(专用云、社区云或公共云)构成的云基础设施。
云计算环境是通过关注无状态性、低耦合、模块性和语义互用性取向的服务。云计算的核心是包含互连节点的网络的基础设施。
现在参考图10,示出云计算节点的示例的示意图。云计算节点1010仅是适当云计算节点的一个示例,而不旨在暗示对在此公开的本发明的实施例的使用范围或功能性有任何限制。无论如何,云计算节点1010都能够被实现并且能够执行上面阐述的任意功能性。
在云计算节点1010中有计算机***/服务器1012,该计算机***/服务器1012可与大量其他通用或专用计算***环境或配置一起使用。可适合与计算机***/服务器1012一起使用的众所周知的计算***、环境和/或配置的示例包含但并不局限于:个人计算机***、服务器计算机***、薄客户机、厚客户机、手持装置、膝上型装置、多处理器***、基于微处理器的***、机顶盒、可编程消费类电子产品、网络PC、迷你计算机***、主机计算机***、以及包括上述***或装置等中的任何一个的分布式云计算环境。
可在计算机***执行的诸如程序模块的计算机***可执行指令的一般语境下描述计算机***/服务器1012。通常,程序模块可包含执行特定任务或者实现特定抽象数据类型的例程、程序、对象、部件、逻辑、数据结构等。计算机***/服务器1012可在通过通信网络链接的远程处理装置执行任务的分布式云计算环境中实施。在分布式云计算环境中,程序模块可位于包含存储器储存装置的本地或远程计算***储存介质中。
如图10所示,云计算节点1010中的计算机***/服务器1012以通用计算装置的形式示出。计算机***/服务器1012的部件可包含但并不限于:一个或者多个处理器或者处理单元1016、***存储器1028、以及将包含***存储器1028的各种***部件耦合到处理器1016的总线1018。
总线1018是几类总线结构中的任意一种或多种,包含存储器总线或存储器控制器、***总线、图形加速端口、以及采用多种总线架构中的任意总线架构的处理器或局部总线。作为示例而不作为限制,这些架构包含工业标准架构(ISA)总线、微通道架构(MAC)总线,增强型ISA(EISA)总线、视频电子标准协会(VESA)局部总线以及***部件互连(PCI)总线。
计算机***/服务器1012通常包含各种计算机***可读介质。这些介质可以是计算机***/服务器1012能够访问的任意可用介质,并且其包含易失性和非易失性介质、可移动介质和不可移动介质。***存储器1028可包含易失性存储器形式的计算机***可读介质,诸如,随机存取存储器(RAM)1030和/或高速缓存存储器1032。计算机***/服务器1012还可包含其它可移动/不可移动的、易失性/非易失性计算机***储存介质。仅作为示例,提供存储***1034,用于对不可移动的、非易失性磁介质(未显示并且通常称为“硬盘驱动器”)进行读和写。尽管未示出,但是可提供用于对可移动、非易失性磁盘(例如,“软盘”)进行读和写的磁盘驱动器和用于对诸如CD-ROM、DVD-ROM或其它光介质的可移动、非易失性光盘进行读或写的光盘驱动器。在这些情况下,每个驱动器可通过一个或者多个数据介质接口连接到总线1018。正如进一步示出和下面所描述的,存储器1028可包含至少一个程序产品,该程序产品具有一组(例如,至少一个)配置成执行本发明的实施例的能够的程序模块。
具有一组(至少一个)程序模块1042的程序/实用程序1040可存储于存储器1028中,作为示例而不作为限制,以及操作***、一个或者多个应用程序、其它程序模块以及程序数据。操作***、一个或者多个应用程序、其它程序模块以及程序数据或者它们的组合中的每个可包含联网环境的实现。程序模块1042通常执行在此描述的本发明的实施例的功能和/或方法。
计算机***/服务器1012还可与一个或多个诸如键盘、定向装置、显示器1024等的外部装置1014、一个或者多个使用户能与计算机***/服务器1012交互的装置、以及/或使计算机***/服务器1012能与一个或多个其它计算装置通信的任何装置(例如,网卡、调制解调器、等等)通信。这些通信能够通过输入/输出(I/O)接口1022进行。并且,计算机***/服务器1012还能够通过网络适配器1020与一个或者多个诸如局域网(LAN)、通用广域网(WAN)和/或公共网络(例如互联网)的网络通信。如图所示,网络适配器1020通过总线1018与计算机***/服务器1012的其它部件通信。应当明白,尽管未示出,但是可结合计算机***/服务器1012使用其它硬件和/或软件部件。示例包含但并不局限于:微代码、装置驱动器、冗余处理单元、外部磁盘驱动阵列、RAID***、磁带驱动器、以及数据归档储存***等。
现在参考图11,示出了说明性云计算环境1150。如图所示,云计算环境1150包括一个或者多个云计算节点1110,云消费者使用的本地计算装置诸如,例如,个人数字助理(PDA)或蜂窝式电话MA、台式计算机MB、膝上型计算机MC、以及/或者汽车计算机***MN可与云计算节点1110通信。节点1110可以相互通信。在一个或者多个网络中,可以物理方式或虚拟方式将节点1110编组(未示出),诸如,专用云、社区云、公共云或混合云,如上所述,或者它们的组合。这样使得云计算环境1150提供基础设施即服务、平台即服务和/或软件即服务,云消费者无需为此在本地计算装置上保留资源。应当明白,图11所示的各种类型的计算装置MA-N旨在仅是说明性的,并且计算节点1110和云计算环境1150能够通过任何类型的网络和/或网络可寻址连接(例如,利用网络浏览器)与任何类型的计算机化装置通信。
现在参考图12,示出了云计算环境1150(图11)提供的一组功能抽象层。应当事先明白,图12所示的部件、层和功能都旨在仅是说明性的,并且本发明的实施例并不局限于此。如图所示,提供下列层和相应功能:
硬件和软件层1260包含硬件和软件部件。硬件部件的示例包含:主机1261;基于RISC(精简指令集计算机)架构的服务器1262;服务器1263;刀片服务器1264;储存装置1265;以及网络和联网部件1266。在某些实施例中,软件部件包含网络应用服务器软件1267和数据库软件1268。
虚拟化层1270提供抽象层,下列虚拟实体的例子可由抽象层提供:虚拟服务器1271;虚拟储存器1272;包含虚拟专用网络的虚拟网络1273;虚拟应用及操作***1274;以及虚拟客户机1275。
在一个示例中,管理层1280可以提供下述功能。资源提供功能1281实现对在云计算环境中用于执行任务的计算资源和其它资源的动态获取。当在云计算环境中使用资源时,计量和定价功能1282提供成本跟踪,并且为这些资源的消耗提供帐单和***。在一个示例中,这些资源可包括应用软件许可。安全功能为云消费者和任务提供身份认证,为数据和其它资源提供保护。用户门户功能1283为消费者和***管理员提供对云计算环境的访问。服务水平管理功能1284提供云计算资源的分配和管理,使得满足要求的服务水平。服务水平协议(SLA)计划和履行功能1285为根据SLA预测其未来需求的云计算资源实现预安排和获取。
工作负载层1290提供可对其采用云计算环境的功能性的示例。该层可提供的工作负载和功能的示例包含:标测与导航1291;软件开发及生命周期管理1292;虚拟教室教学传递1293;数据分析处理94;交易处理1295;以及光谱仪数据的匹配处理1296。
实施例涉及一种设备、方法或计算机程序。可接收样本的光谱仪测试数据。可将接收到的测试数据与参考库进行匹配,以通过使该测试数据与参考库中的多个参考数据中的至少一个相关,确定样本的特征信息。基于相关,将测试数据作为新参考数据更新参考库。在实施例中,在云计算***中执行该匹配。
在实施例中,云计算***包含多个处理器,多个处理器通过网络耦合在一起,以执行数据处理或数据储存操作中的至少一个。在实施例中,参考库存储于通过云计算***耦合到光谱仪的至少一个数据中心中。在实施例中,从耦合到云计算***的光谱仪接收测试数据。在实施例中,光谱仪测试数据是质谱仪测试数据。在实施例中,光谱仪测试数据包括来自基质辅助激光解吸/离子化飞行时间质谱仪(MALDI-TOF MS)的信息。
在实施例中,在匹配之前对测试数据进行操控和/或处理中的至少一个。在实施例中,参考数据具有该匹配与接收到的测试数据关联的已知特征。在实施例中,测试数据和参考数据对应于离子化粒子在光谱仪中的质谱中的峰。
在实施例中,每个质谱的分布曲线中,分布曲线集合代入一个函数中。在实施例中,可调整两个函数之间的互相关。在实施例中,可确定两个函数之间的相似性系数。在实施例中,如果测试数据与库数据库之间的两个函数基本上重叠,则确定该测试数据与参考库中的多个参考数据中的至少一个匹配。
实施例涉及在测试数据中认定至少一个生物标志物。在实施例中,样本包含生物分子。样本的特征信息可包含样本的生物分析信息。生物分析信息可以是人、动物、植物和/或生物体中至少一个的医学诊断。
在实施例中,该匹配运算可由计算机算法优化。计算机算法可使库数据库经动态分析而逐步发展。动态分析可包含人工智能或深度学习算法。
在实施例中,接收到的测试数据包括与样本的源有关的元数据信息。可剥去元数据信息中与样本的源关联的个人信息。
在实施例中,离子化粒子可以由激光器产生,该激光器配置成照射靶区,以使放置于靶区中的样本离子化。飞行管的第一端可靠近至少一个电极,该电极配置成使离子化粒子加速进入飞行管内。飞行管的第二对置端可靠近检测器,该检测器测量通过飞行管的离子化粒子和离子化粒子的强度。
在实施例中,每个离子化粒子的属性包括下列中的至少一个:通过至少一个电极的每个离子化粒子的加速效率;进入飞行管的至少一个离子化粒子的延迟;飞行管内的至少一个离子化粒子的飞行路径的变化。
在实施例中,匹配包含下列中的至少一个:对样本的物理变化的补偿;优化数据再现性;最大化诊断准确性。
在实施例中,参考库存储于储存装置、基质辅助激光解吸/离子化飞行时间质谱仪(MALDI-TOF MS)、本地数据储存装置、执行该方法的设备外的远程数据储存装置、通过网络通信的数据储存装置、云储存***或通过互联网连接通信的数据储存装置中的至少一个中。
最近商业化的分析速度快灵敏度高的质谱仪已将其应用前景从高技术的研究扩展到医学诊断。质谱仪有替代现有医学诊断技术的潜能。然而,不同的疾病或疾病状态可能对身体、其细胞或细胞物质显示不同的症状和变化。因此,除非证明数据具有由其他疾病而非仅由原始目标疾病采集的信息,否则不应将仅存在特定疾病的生物标志物信息看作有效确定该疾病或其源的真实鉴定剂。
基于质谱仪的特别是基于MALDI-TOF MS的诊断对于解决因为关于其他疾病或疾病状态的信息不足而产生的这些问题有巨大潜力。该***能够采用基于数据库的库诊断的概念,在基于数据库的库诊断中,将关于其他疾病或状态的所有信息预建为参考数据库。
在某些情况下,校准并且调整了质量数据后,逐个地将其与参考数据库中的已知样性的样本的质量数据进行匹配。如果数据匹配,则确定该测试样本的样性为其所比较的样本的样性。目标诊断方法可采用个人经验推断与测试方法,直到发现正确匹配。然而,库诊断正在使用基于各种数据的预建数据库和通过优化计算机算法的有效验证,这样可产生更好的诊断。
实施例涉及基于预建参考数据库的库诊断,用于疾病诊断和/或疾病状态诊断,并且/或者可实现微生物识别。根据实施例,可将蛋白质、肽、脂质和/或微生物、疾病和/或疾病状态的其他目标的数据库预设为参考。
实施例涉及在MALDI-TOF***中使用库数据库。诊断技术可能有局限性,因为诊断技术涉及目标诊断,在目标诊断中,每次仅将测试样本与一个或者几个疾病或状态进行比较。目标诊断可能有局限性,因为其可能容易发生假阳性或假阴性错误,并且/或者不怎么有效。实施例涉及测试者(例如,订购测试的人)的指定,以具有要测试什么的一般想法,否则,诊断可能消耗过多时间并且/或者有不确定性。在实施例中,库数据库优于目标诊断,因为可将测试样本同时与许多不同疾病和状态进行比较,因此,降低了假阳性或假阴性错误的风险并且/或者提高效率。在实施例中,随着时间的推移,因为获取到更多的数据,因此,可利用越来越多的数据建立数据库,产生越来越好的分析。
实施例通过分析样本质谱中的显著峰认定样本。如果质谱中的峰表明质量强度穿过特定阈值,则可以认为该峰在样本认定中有意义。否则,则将一个或者多个峰看作更多噪声或无关信息。质谱中有意义的峰可用于认定未知样本。
用于样本认定和匹配的方法也可集中于认定这些有意义的峰。通常,可基于设定阈值选择未知样本的质谱中的有意义的峰。然后,可将有意义的或所谓有意义的一个或者多个峰与一个或者多个目标疾病、物种或菌株进行比较。可将该技术和类似技术称为目标诊断或目标ID。该ID是个顺序过程,该顺序过程重复其工作,直到发现要求的解决方案,并且不是与库数据库诊断相同的一次性诊断过程。
目标ID/诊断技术易出现假阴性错误,在样本实际上有病等情况下,当诊断错误地将测试样本认定为正常或健康时,发生假阴性错误。目标ID诊断可不保证测试样本绝对正常或健康,因为尽管测试样本对于其测试的单个疾病/菌株可以是阴性的,但是该样本可能含有与其测试的疾病或菌株不同的疾病或菌株。实施例可以包含将测试样本数据与疾病、疾病状态和菌株的库数据库的数据进行比较,而非仅与一个疾病或菌株的数据进行比较。实施例可减轻目标诊断的固有假阴性趋势。实施例可提供用于检测疾病的变化、不平衡和/或状态转移的方法。某些实施例可估计偏离疾病的任意确切状态的变化程度或不平衡程度,并且可优化诊断的可靠性。与仅疾病检测相比,实施例可要求更强的划类、聚类或分类以及匹配算法。
实施例涉及与对样本进行MALDI-TOF MS实验获得的质量分布曲线互相关,以发现作为滞后函数的两个函数之间的相似性。根据实施例,当对参考数据库和测试样本数据产生布型和函数时,可应用相同的计算过程。
对于连续函数,
对于离散函数,
实施例涉及将从质谱仪采集的每个质量的分布曲线的分布曲线集编译为一个函数。通过计算两个函数之差或重叠区的范数(距离),实施例调整两个函数之间的互相关,并且能够确定两个函数之间的相似性系数。根据实施例,如果样本数据与数据库数据之间的函数高度重叠,则这可说明所选样本具有高度似然性匹配。
由于诸如样本比较或质谱仪本身的误差的因素,质谱中通常存在漂移。这些漂移可要求消除这些不一致性实施校准过程。根据实施例具有较高准确性的互相关方法可代替准确性较低的校准技术。
互相关还可用于信号处理和摄影测量,以将信号和/或图像一起匹配。在实施例中,对质谱应用互相关有优点,因为质荷比的范围有限。根据实施例,所有强度输出为正可消除否则必需的归一化过程。根据实施例,因为这些优点,利用正确算法可迅速发现样本之间存在互相关。此外,实施例中有限范围的质谱输出可使得互相关函数/索引的范围可控。根据实施例,这样可产生额外约束,该额外约束反过来可使用于计算互相关系数的算法简化和加快。
利用VHDL(VHSIC硬件描述语言)程序和VHDL芯片可实现本公开所描述的任何方法。VHDL是用于现场可编程门阵列(FPGA)、专用集成电路(ASIC)以及其他类似电子装置的说明性设计录入语言。因此,在此描述的任何软件实现方法都可由基于硬件的VHDL程序模拟,然后,将其装入VHDL芯片,诸如,FPGA。
对所公开的实施例进行各种修改和变更对于本领域技术人员明显且显而易见。所公开的实施例旨在覆盖明显且显而易见的修改和变更,只要这些修改和变更在所附权利要求及其等同的范围内。

Claims (25)

1.一种方法包括:
接收样本的光谱仪测试数据;
将所述光谱仪测试数据与参考库匹配,以通过使所述光谱仪测试数据与所述参考库中的多个参考数据中的至少一个相关,确定所述样本的特征信息;并且
基于所述相关,利用所述光谱仪测试数据作为新参考数据更新所述参考库。
2.根据权利要求1所述的方法,其中在云计算***中执行所述方法。
3.根据权利要求2所述的方法,其中所述云计算***包括多个通过网络耦合在一起的处理器,以执行数据处理或数据储存操作中的至少一个。
4.根据权利要求2所述的方法,其中所述参考库存储于通过所述云计算***耦合到所述光谱仪的至少一个数据中心中。
5.根据权利要求2所述的方法,其中从耦合到所述云计算***的光谱仪接收所述测试数据。
6.根据权利要求1所述的方法,其中所述光谱仪测试数据是质谱仪测试数据。
7.根据权利要求6所述的方法,其中所述光谱仪测试数据包括来自基质辅助激光解吸/离子化飞行时间质谱仪(MALDI-TOF MS)的信息。
8.根据权利要求1所述的方法,其中在所述匹配之前,对所述光谱仪测试数据进行操控并且/或者处理中的至少一个。
9.根据权利要求1所述的方法,其中所述参考数据具有所述匹配与接收到的所述收到的光谱仪测试数据关联的已知特征。
10.根据权利要求1所述的方法,其中所述测试数据和所述参考数据对应于离子化粒子在光谱仪中的质谱中的峰。
11.根据权利要求10所述的方法,包括:
将每个质谱的所述分布曲线中的分布曲线集编译为一个函数;
调整两个函数之间的互相关;
确定两个函数之间的相似性系数;并且
如果所述测试数据与所述库数据库之间的所述两个函数基本上重叠,则确定所述测试数据和所述参考库中的多个参考数据中的至少一个匹配。
12.根据权利要求1所述的方法,包括根据所述光谱仪测试数据认定至少一个生物标志物。
13.根据权利要求1所述的方法,其中
所述样本包括分子;
所述样本的特征信息包括所述样本的生物分析信息。
14.根据权利要求13所述的方法,其中所述生物分析信息是人、动物、植物或生物体中至少一个的医学诊断。
15.根据权利要求1所述的方法,其中所述匹配由计算机算法优化。
16.根据权利要求15所述的方法,其中所述计算机算法使得所述库数据库通过动态分析逐步发展。
17.根据权利要求16所述的方法,其中所述动态分析包括人工智能或深度学习算法中的至少一个。
18.根据权利要求1所述的方法,其中接收到的测试数据包括与所述样本的源有关的元数据信息。
19.根据权利要求18所述的方法,其中从所述元数据信息剥下与所述样本的所述源有关的个人信息。
20.根据权利要求1所述的方法,其中
离子化粒子由激光器产生,所述激光器配置成照射靶区,以离子化放置于所述靶区中的所述样本;
飞行管的第一端靠近至少一个电极,所述电极配置成使离子化粒子加速进入所述飞行管内;以及
所述飞行管的第二对置端靠近检测器,所述检测器测量通过所述飞行管的所述离子化粒子和所述离子化粒子的强度。
21.根据权利要求20所述的方法,其中每个所述离子化粒子的所述属性包括下列中的至少一个:
每个离子化粒子通过至少一个电极的加速效率;
所述离子化粒子中的至少一个进入所述飞行管的延迟;或者
所述离子化粒子中的至少一个在所述飞行管内的飞行路径的变化。
22.根据权利要求1所述的方法,其中所述匹配包括下列中的至少一个:
补偿所述样本中的物理变化;
优化数据再现性;或者
最大化诊断准确性。
23.根据权利要求1所述的方法,其中所述参考库存储于下列中的至少一个中:储存装置、基质辅助激光解吸/离子化飞行时间质谱仪(MALDI-TOFMS)、位于执行所述方法的设备中的数据储存装置、位于执行所述方法的所述设备外的数据储存装置、通过网络与执行所述方法的所述设备通信的数据储存装置、云储存***或通过互联网连接与执行所述方法的所述设备通信的数据储存装置。
24.一种设备,包括:
至少一个处理器;
接收单元,所述接收单元配置成接收样本的光谱仪测试数据;
匹配单元,所述匹配单元配置成将所述光谱仪测试数据与参考库匹配,
以通过使所述光谱仪测试数据与所述参考库中的多个参考数据中的至少一个相关,确定所述样本的特征信息;以及
更新单元,所述更新单元配置成基于所述相关,将所述测试数据作为新参考数据更新所述参考库。
25.一种计算机程序产品,包括存储有计算机可读程序代码的计算机可读硬件储存装置,所述程序代码含有计算机***的一个或多个处理器可执行的指令,以实现对目标评估损坏的方法,所述方法包括:
接收样本的光谱仪测试数据;
将所述光谱仪测试数据与参考库匹配,以通过使所述光谱仪测试数据与所述参考库中的多个参考数据中的至少一个相关,确定所述样本的特征信息;并且
基于所述相关,利用所述光谱仪测试数据作为新参考数据更新所述参考库。
CN201780062818.8A 2016-08-22 2017-08-21 利用基质辅助激光解吸/离子化飞行时间质谱仪进行数据库管理 Pending CN110431400A (zh)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
US201662377768P 2016-08-22 2016-08-22
US62/377,768 2016-08-22
PCT/US2017/047840 WO2018039137A1 (en) 2016-08-22 2017-08-21 Database management using a matrix-assisted laser desorption/ionization time-of-flight mass spectrometer

Publications (1)

Publication Number Publication Date
CN110431400A true CN110431400A (zh) 2019-11-08

Family

ID=61191769

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201780062818.8A Pending CN110431400A (zh) 2016-08-22 2017-08-21 利用基质辅助激光解吸/离子化飞行时间质谱仪进行数据库管理

Country Status (5)

Country Link
US (1) US20180052893A1 (zh)
EP (1) EP3494382A4 (zh)
KR (1) KR20190076952A (zh)
CN (1) CN110431400A (zh)
WO (1) WO2018039137A1 (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111755065A (zh) * 2020-06-15 2020-10-09 重庆邮电大学 一种基于虚拟网络映射和云并行计算的蛋白质构象预测加速方法

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111610281B (zh) * 2020-07-14 2022-06-10 北京行健谱实科技有限公司 基于气相色谱质谱谱库鉴定的云平台构架的操作方法
CN113219042A (zh) * 2020-12-03 2021-08-06 深圳市步锐生物科技有限公司 一种用于人体呼出气体中各成分分析检测的装置及其方法

Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2004019003A2 (en) * 2002-08-23 2004-03-04 Efeckta Technologies Corporation Image processing of mass spectrometry data for using at multiple resolutions
CN101084419A (zh) * 2004-12-21 2007-12-05 福斯分析公司 校准光谱仪的方法
US20090012723A1 (en) * 2005-06-09 2009-01-08 Chemlmage Corporation Adaptive Method for Outlier Detection and Spectral Library Augmentation
US7515269B1 (en) * 2004-02-03 2009-04-07 The United States Of America As Represented By The Secretary Of The Army Surface-enhanced-spectroscopic detection of optically trapped particulate
CN101680872A (zh) * 2007-04-13 2010-03-24 塞昆纳姆股份有限公司 序列比较分析方法和***
CN101793821A (zh) * 2010-03-23 2010-08-04 北京交通大学 用于监测多点气体浓度的传感***
US8688384B2 (en) * 2003-05-12 2014-04-01 River Diagnostics B.V. Automated characterization and classification of microorganisms

Family Cites Families (23)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO1998037417A1 (en) * 1997-02-20 1998-08-27 The Regents Of The University Of California Plasmon resonant particles, methods and apparatus
US6265715B1 (en) * 1998-02-02 2001-07-24 Helene Perreault Non-porous membrane for MALDI-TOFMS
US6539102B1 (en) * 2000-09-01 2003-03-25 Large Scale Proteomics Reference database
US7583710B2 (en) * 2001-01-30 2009-09-01 Board Of Trustees Operating Michigan State University Laser and environmental monitoring system
WO2002101376A1 (fr) * 2001-06-06 2002-12-19 Mitsubishi Heavy Industries, Ltd. Dispositif et procede de detection de quantites infimes de composants organiques
US6983213B2 (en) * 2003-10-20 2006-01-03 Cerno Bioscience Llc Methods for operating mass spectrometry (MS) instrument systems
US7473892B2 (en) * 2003-08-13 2009-01-06 Hitachi High-Technologies Corporation Mass spectrometer system
WO2007022248A2 (en) * 2005-08-16 2007-02-22 Sloan Kettering Institute For Cancer Research Methods of detection of cancer using peptide profiles
US20070282537A1 (en) * 2006-05-26 2007-12-06 The Ohio State University Rapid characterization of post-translationally modified proteins from tandem mass spectra
US8375032B2 (en) * 2009-06-25 2013-02-12 University Of Tennessee Research Foundation Method and apparatus for predicting object properties and events using similarity-based information retrieval and modeling
US9528372B2 (en) * 2010-09-10 2016-12-27 Selman and Associates, Ltd. Method for near real time surface logging of a hydrocarbon or geothermal well using a mass spectrometer
US20120084016A1 (en) * 2010-09-30 2012-04-05 Lastek, Inc. Portable laser-induced breakdown spectroscopy system with modularized reference data
CN103270575B (zh) * 2010-12-17 2016-10-26 塞莫费雪科学(不来梅)有限公司 用于质谱法的数据采集***和方法
GB201100301D0 (en) * 2011-01-10 2011-02-23 Micromass Ltd Method of processing multidmensional mass spectrometry data
US9082600B1 (en) * 2013-01-13 2015-07-14 Matthew Paul Greving Mass spectrometry methods and apparatus
US9380475B2 (en) * 2013-03-05 2016-06-28 Comcast Cable Communications, Llc Network implementation of spectrum analysis
EP4006542A1 (en) * 2013-08-02 2022-06-01 Verifood Ltd. Spectrometer comprising sample illuminator
US9570277B2 (en) * 2014-05-13 2017-02-14 University Of Houston System System and method for MALDI-TOF mass spectrometry
GB2532430B (en) * 2014-11-18 2019-03-20 Thermo Fisher Scient Bremen Gmbh Method for time-alignment of chromatography-mass spectrometry data sets
WO2016094330A2 (en) * 2014-12-08 2016-06-16 20/20 Genesystems, Inc Methods and machine learning systems for predicting the liklihood or risk of having cancer
WO2016125164A2 (en) * 2015-02-05 2016-08-11 Verifood, Ltd. Spectrometry system applications
US20150272510A1 (en) * 2015-03-13 2015-10-01 Sarah Chin Sensor-activated rhythm analysis: a heuristic system for predicting arrhythmias by time-correlated electrocardiographic and non-electrocardiographic testing
US10319574B2 (en) * 2016-08-22 2019-06-11 Highland Innovations Inc. Categorization data manipulation using a matrix-assisted laser desorption/ionization time-of-flight mass spectrometer

Patent Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2004019003A2 (en) * 2002-08-23 2004-03-04 Efeckta Technologies Corporation Image processing of mass spectrometry data for using at multiple resolutions
US8688384B2 (en) * 2003-05-12 2014-04-01 River Diagnostics B.V. Automated characterization and classification of microorganisms
US7515269B1 (en) * 2004-02-03 2009-04-07 The United States Of America As Represented By The Secretary Of The Army Surface-enhanced-spectroscopic detection of optically trapped particulate
CN101084419A (zh) * 2004-12-21 2007-12-05 福斯分析公司 校准光谱仪的方法
US20090012723A1 (en) * 2005-06-09 2009-01-08 Chemlmage Corporation Adaptive Method for Outlier Detection and Spectral Library Augmentation
CN101680872A (zh) * 2007-04-13 2010-03-24 塞昆纳姆股份有限公司 序列比较分析方法和***
CN101793821A (zh) * 2010-03-23 2010-08-04 北京交通大学 用于监测多点气体浓度的传感***

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
KEVIN G. OWENS: "Application of Correlation Analysis Techniques to Mass Spectral Data", 《APPLIED SPECTROSCOPY REVIEWS》 *
PISETH SENG ET AL.: "MALDI-TOF-mass spectrometry applications in clinical microbiology", 《FUTURE MICROBIOL》 *

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111755065A (zh) * 2020-06-15 2020-10-09 重庆邮电大学 一种基于虚拟网络映射和云并行计算的蛋白质构象预测加速方法
CN111755065B (zh) * 2020-06-15 2024-05-17 重庆邮电大学 一种基于虚拟网络映射和云并行计算的蛋白质构象预测加速方法

Also Published As

Publication number Publication date
WO2018039137A1 (en) 2018-03-01
US20180052893A1 (en) 2018-02-22
EP3494382A1 (en) 2019-06-12
KR20190076952A (ko) 2019-07-02
EP3494382A4 (en) 2020-07-15

Similar Documents

Publication Publication Date Title
Banerjee Empowering clinical diagnostics with mass spectrometry
US20230296638A1 (en) Method and apparatus for detecting substances using substance detection routines
Xi et al. Statistical analysis and modeling of mass spectrometry-based metabolomics data
Wahl et al. Analysis of microbial mixtures by matrix-assisted laser desorption/ionization time-of-flight mass spectrometry
Mosmann et al. SWIFT—Scalable clustering for automated identification of rare cell populations in large, high‐dimensional flow cytometry datasets, part 2: biological evaluation
US20190187048A1 (en) Spectroscopic systems and methods for the identification and quantification of pathogens
Beretta Proteomics from the clinical perspective: many hopes and much debate
CN110431400A (zh) 利用基质辅助激光解吸/离子化飞行时间质谱仪进行数据库管理
Dexter et al. Generalization of machine learning approaches to identify notifiable conditions from a statewide health information exchange
US20230034559A1 (en) Automated prediction of clinical trial outcome
WO2019195971A1 (zh) 光谱分析方法、装置、电子设备及计算机可读存储介质
Prieto et al. PAnalyzer: a software tool for protein inference in shotgun proteomics
WO2022193973A1 (zh) 图像处理方法、装置、电子设备、计算机可读存储介质及计算机程序产品
Schessner et al. A practical guide to interpreting and generating bottom‐up proteomics data visualizations
CA2548842A1 (en) Method of diagnosing biological states through the use of a centralized, adaptive model, and remote sample processing
KR102658618B1 (ko) 바이오마커 분석을 기반으로 미래 피부 트렌드들을 시각화하기 위한 시스템들 및 방법들
JP2014122889A (ja) 複数の動作環境を有する、生体試料を分析するための分析システム
EP3301633B1 (en) Remote chemical assay classification
US11164657B2 (en) Accelerated pharmaceutical repurposing by finding anticorrelations and by text mining
IT201600103909A1 (it) Sistema e metodo di acquisizione, trasmissione ed elaborazione di dati ematochimici
Chen et al. Application of miniaturized near-infrared spectroscopy in pharmaceutical identification
Lopez-Fernandez et al. A comprehensive analysis about the influence of low-level preprocessing techniques on mass spectrometry data for sample classification
Sun et al. PPIRank-an advanced method for ranking protein-protein interations in TAP/MS data
Blow Mass spectrometry and proteomics: hitting the mark
JP2021025953A (ja) 質量分析データ処理方法、質量分析データ処理システム、及び質量分析データ処理プログラム

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication

Application publication date: 20191108

RJ01 Rejection of invention patent application after publication