CN103201621B - 基于由传感器测量出的数据找出候选的方法和装置 - Google Patents

基于由传感器测量出的数据找出候选的方法和装置 Download PDF

Info

Publication number
CN103201621B
CN103201621B CN201180052933.XA CN201180052933A CN103201621B CN 103201621 B CN103201621 B CN 103201621B CN 201180052933 A CN201180052933 A CN 201180052933A CN 103201621 B CN103201621 B CN 103201621B
Authority
CN
China
Prior art keywords
mentioned
data set
candidate
measurement
sensor
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
CN201180052933.XA
Other languages
English (en)
Other versions
CN103201621A (zh
Inventor
今井彰
佐藤友美
柏拉卡斯·斯里达尔·穆尔蒂
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Atonarp Inc
Original Assignee
Atonarp Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Atonarp Inc filed Critical Atonarp Inc
Publication of CN103201621A publication Critical patent/CN103201621A/zh
Application granted granted Critical
Publication of CN103201621B publication Critical patent/CN103201621B/zh
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G01MEASURING; TESTING
    • G01NINVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
    • G01N27/00Investigating or analysing materials by the use of electric, electrochemical, or magnetic means
    • G01N27/62Investigating or analysing materials by the use of electric, electrochemical, or magnetic means by investigating the ionisation of gases, e.g. aerosols; by investigating electric discharges, e.g. emission of cathode
    • G01N27/622Ion mobility spectrometry
    • G01N27/624Differential mobility spectrometry [DMS]; Field asymmetric-waveform ion mobility spectrometry [FAIMS]
    • BPERFORMING OPERATIONS; TRANSPORTING
    • B01PHYSICAL OR CHEMICAL PROCESSES OR APPARATUS IN GENERAL
    • B01DSEPARATION
    • B01D59/00Separation of different isotopes of the same chemical element
    • B01D59/44Separation by mass spectrography
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16CCOMPUTATIONAL CHEMISTRY; CHEMOINFORMATICS; COMPUTATIONAL MATERIALS SCIENCE
    • G16C20/00Chemoinformatics, i.e. ICT specially adapted for the handling of physicochemical or structural data of chemical particles, elements, compounds or mixtures
    • G16C20/20Identification of molecular entities, parts thereof or of chemical compositions
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16CCOMPUTATIONAL CHEMISTRY; CHEMOINFORMATICS; COMPUTATIONAL MATERIALS SCIENCE
    • G16C99/00Subject matter not provided for in other groups of this subclass
    • HELECTRICITY
    • H01ELECTRIC ELEMENTS
    • H01JELECTRIC DISCHARGE TUBES OR DISCHARGE LAMPS
    • H01J49/00Particle spectrometers or separator tubes
    • H01J49/26Mass spectrometers or separator tubes
    • H01J49/34Dynamic spectrometers
    • H01J49/42Stability-of-path spectrometers, e.g. monopole, quadrupole, multipole, farvitrons

Landscapes

  • Physics & Mathematics (AREA)
  • Chemical & Material Sciences (AREA)
  • Spectroscopy & Molecular Physics (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Theoretical Computer Science (AREA)
  • Engineering & Computer Science (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Computing Systems (AREA)
  • Chemical Kinetics & Catalysis (AREA)
  • Analytical Chemistry (AREA)
  • Crystallography & Structural Chemistry (AREA)
  • Electrochemistry (AREA)
  • Health & Medical Sciences (AREA)
  • Biochemistry (AREA)
  • General Health & Medical Sciences (AREA)
  • General Physics & Mathematics (AREA)
  • Immunology (AREA)
  • Pathology (AREA)
  • Other Investigation Or Analysis Of Materials By Electrical Means (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

提供一种装置(10),具有:接口(13),其接收由FAIMS(1)测量出的第一已测量数据集(51)和表示第一已测量数据集的测量环境的第一环境信息(60);生成单元(200),其将数据库(80)中已有的多个数据集(81)以由第一环境信息(60)控制的条件进行变换来生成多个虚拟数据集(71);以及输出单元(30),其从包括多个虚拟数据集(71)的暂定的集合中选择接近第一已测量数据集(51)的至少一个候选并输出该至少一个候选。

Description

基于由传感器测量出的数据找出候选的方法和装置
技术领域
本发明涉及一种利用从DIMS等传感器获得的数据找出作为传感器的测量对象的候选的技术。
背景技术
作为对空气中的物质进行检测的传感器,已知有不对称电场离子迁移率光谱仪(FAIMS)或者微分型电迁移率光谱仪(DMS)。这种光谱仪(传感器,以后统称为DMS)对高压-低压地变化的不对称电场输入离子化后的流体样品(例如气体、液体或蒸气),根据离子的电场迁移率输出对它们进行过滤后的结果。
在日本特表2008-508693号公报(国际公开WO2006/013396、文献1)中公开了一种对由于每种物质的离子迁移率的差异所引起的物理现象进行测量的装置。在该文献1中,特别记载了具有离子过滤器的离子迁移率光谱仪,该离子过滤器为至少一个离子通道的形状,该离子通道具有多个电极。该离子迁移率光谱仪由于施加于导电层的随时间变化的电位而能够使填充剂的离子种类选择性地进入。电位具有驱动电场成分和横电场成分,在优选的实施方式中,各个电极参与生成驱动电场和横电场这两个电场的成分。即使没有漂移气流也能够使用设备。在专利文献1中还记载了用于制造如作为光谱仪的各种用途那样的微量(microscale)光谱仪的微细加工技术。
在日本特表2007-513340号公报(国际公开WO2005/052546、文献2)中,一般公开了一种涉及用于分析样品的基于离子迁移率的***、方法以及装置的技术。例如公开了使用分散特性、样品离解、和/或虽然没有进行限定但是如流道(flowchannel)/过滤器电场状态中的变动那样的在样品处理时的变动来改进样品收集、过滤、检测、测量、识别和/或分析的若干事项。记载了以下内容:并没有对这样的条件做以下限定,但是这样的条件包括压力、温度、湿度、电场的强度以及占空比和/或频率、电场电压振幅及频率和/或占空比、检测器偏置电压大小和/或极性、和/或过滤器电场补偿电压的大小和/或极性。
在DMS中已知以下内容:能够通过使补偿电压Vc(Vcomp)相对于电场电压Vrf进行变化来获得二维谱图,并且能够通过改变电场电压Vrf来获得三维谱图。应该在该二维谱图和/或三维谱图中包含作为DMS的测量对象的离子化后的流体样品(以后统称为气体)的信息,能够通过对谱图进行解析来确定气体成分。在文献2中提供关于多个已知种类的谱特征的库,将未知种类的谱特征的至少一部分与保存在库中的一个以上的谱特征的至少一部分进行对比,来识别未知种类。
另外,在文献2中记载了以下内容:谱特征包括谱峰振幅、谱峰宽度以及谱峰梯度、谱峰间隔、谱峰个数、由处理条件变化所引起的谱峰的相对位移、谱不连续点、Vrf与Vcomp之间的特性、或者针对其它任意一个以上的上述条件绘制上述条件的其它任意的特性所得到的特性。
在这些信息中包含测量对象的气体或其成分所特有的离子迁移率的信息。然而,还已知离子迁移率的信息的出现根据压力、温度、湿度等而发生变化。
另外,还已知信息的出现取决于装置的不同而发生变化,在文献2中公开了以下技术:使用多个数据中的各数据,根据识别出它们的种类的固有的内在迁移率特性,得到所检测出的种类的可靠的识别。根据一个方式,能够与作为对象的装置所特有的参照库进行对比。另外,还能够与不取决于装置的通用的数据集进行对比。在文献2中还记载了在将***用于进行样品分析之前对该***进行校正。具体地说,制作特定的Vcomp和Vrf下的针对已知的离子种类的离子强度的库并保存到存储器中。根据一个方式,设为一旦对***进行了校正,就不再需要进行校正而能够连续地使用该***。例如记载了使用反应物离子峰(RIP)或掺杂剂的峰来对***进行校正。
在文献2中还记载了以下内容:为了判断数据对象(参照矢量)P与测量值矢量P′的调整性的程度,而例如在将P和P′的成分(Vcomp、a)视作是欧几里得几何空间中的数据点的情况下计算距离,选择与最小的欧几里得距离的对比作为最佳的调整。另外,记载了使用其它已知的图案识别算法、神经网络或者人工智能技术找出针对P′的最佳的调整的可能性。
发明内容
尽管关于DMS公开了这些方法,但是很难认定通过DMS确定气体或其成分的技术被广泛利用。
本发明的一个方式是一种装置,具有:接口,其接收由第一传感器测量出的第一已测量数据集和表示第一已测量数据集的测量环境的第一环境信息;生成单元,其以由第一环境信息控制的条件对数据库中已有的多个数据集进行变换来生成多个虚拟数据集;以及输出单元,其从包括多个虚拟数据集的暂定的集合中选择接近第一已测量数据集的至少一个候选并输出该至少一个候选。
本发明的另一个方式是处理装置对由第一传感器测量出的数据进行处理的方法,包括以下步骤。
·接收由第一传感器测量出的第一已测量数据集。
·以由第一环境信息控制的条件对已有的多个数据集进行变换来生成多个虚拟数据集。
·从包括多个虚拟数据集的暂定的集合中选择接近第一已测量数据集的至少一个候选。
在由DMS等第一传感器得到的数据集中,测量对象物(气体以及它们的成分)的特征的出现图案受到各种要素的影响。因而,在已有的数据集中包含本身受到这些要素的影响的数据集的概率小。并且,表示包含在已有的数据集中的测量对象的数据集是在非常接近受到各种要素的影响的已测量数据集的条件下测量出的数据集的可能性也低。因而,该方法是通过生成虚拟数据集,强制增加接近已测量数据集的数据集,结果减少搜索空间的大小,提高了从测量出的数据中检索或选择的候选是所期望的数据的可能性。
生成虚拟数据集的一个方法是利用将第一环境信息作为参数的模型对已有的多个数据集进行变换。模型的一例是将环境信息中包含的多个要素作为参数的函数模型。
生成虚拟数据集的另一个方法是将已有的多个数据集概率性地进行组合。即使在难以预测或估计表示包含在已有的数据集中的测量对象的数据集的基于各要素的出现图案的情况、无法事先得到对出现图案产生影响的所有要素的情况、没有完全明确对出现图案产生影响的所有要素及这些要素所产生的影响的情况下,也能够概率性地生成虚拟数据集。
在本发明的一个方式的方法中,通过将已有的多个数据集概率性地进行组合,来虚拟地扩大搜索对象(搜索空间),概率性地增加接近已测量数据集的虚拟(伪)数据集,在已测量数据集的附近配置测量对象物或接近该测量对象物的虚拟数据集。而且,通过在这样的搜索空间中进行搜索,即使无法事先得到对出现图案产生影响的所有要素,并且即使无法完全明确对出现图案产生影响的所有要素及这些要素所产生的影响,也有可能得到测量对象物或接近该测量对象物的候选,能够提高测量对象物的估计概率。
并且,在该方法中,设置有接收表示第一已测量数据集的测量环境的第一环境信息的步骤,优选的是生成多个虚拟数据集的步骤包括将已有的多个数据集按由第一环境信息控制的概率进行组合来生成多个虚拟数据集。由于存在能够通过第一环境信息限定生成伪数据集的范围的可能性,因此能够缩小搜索空间。
附图说明
图1是表示***概要的框图。
图2的(a)和(b)示出测量数据变化的情形。
图3是表示***的另一例的框图。
图4是表示进行估计的方法的概要的流程图。
具体实施方式
以基于通过FAIMS所得到的数据来估计气体成分(测量对象、对象)的***为例进一步说明本发明,该FAIMS是对空气中或气体中所包含的气体成分的离子迁移率进行测量的DMS之一。
图1示出对从FAIMS得到的数据进行解析的处理装置(***)的概要结构。该处理装置10既可以通过利用合适的通信单元、例如因特网9与传感器(FAIMS)1或搭载有传感器1的终端进行连接的服务器实现,也可以内置于终端,也可以通过软件(程序、程序产品)实现,还可以通过LSI或ASIC等硬件(半导体处理装置、处理装置)实现一部分或全部。
FAIMS1包括:离子化单元1a,其使目标化学物质(测量对象、对象)离子化;漂移室1b,其一边对离子化后的测量对象施加电场的影响一边使离子化后的测量对象移动;以及检测器1c,其对通过了漂移室1b的离子化后的测量对象(测量对象的电荷)进行检测。在漂移室1b中,由电极1e生成的软件控制的电场以特定的周期正、负地变动,通过该电场的过滤效果,过滤出检测目标的化学物质,该检测目标的化学物质在短期间、例如以msec水平碰撞检测器1c,作为电流而被测量出。
相反地,对于非测量对象的化学物质,能够通过软件改变漂移室1b内的电场的参数,来进行如不传送至检测器1c那样的过滤处理。也就是说,能够通过FAIMS1在短时间内集中进行检测、分析(检查)。另外,能够通过在某测量范围内执行FAIMS1的扫描,来进行大范围的化学物质分析。特别地,由于最近的MEMS技术的进步,而微细化得到推进,从而FAIMS1被安装于最新的LC(液相色谱)/MS(质谱)分析装置的预处理部分。以后,通过将软件技术与并行处理技术进行组合,应该可以期待加快分析装置的小型化,并广泛地应用于各种产业领域、医疗领域、普通家庭。
FAIMS1的一例是奥尔斯通(Owlstone)公司生产的传感器,在离子化单元1a中使用了Ni63(555MBq的β射线源、0.1μSv/hr)。关于能够通过该离子化单元1a进行离子化的化学物质,离子化结合能是67KeV以下,能够对大范围的化学物质进行检测、分析。作为离子化单元1a,正在研究使用UV(紫外线)的离子化单元、使用电晕放电的离子化单元等。
FAIMS1作为***物、危险物的检测、威胁检测、化学物质的检测和分析、实时地检测目标变化的环境化学物质的产品开发的平台是最佳的。尤其是对于检测ppm/ppb/ppt水平的微量物质表现出优秀的性能。如果目标物质明确、目标的个数为100种以下,则理论上能够在1~2秒内确定出。然而,根据环境条件的不同而测量容易性发生变化,因此需要确认背景条件。因而,在开展FAIMS1用于实际应用时重点之一在于,相对于根据各种环境变量的差异、状况的不同而发生变化的背景噪声等稳定地进行目标(对象、化学物质)的检测和分析,提高精确度,并且实时地或以接近实时的速度进行目标的检测和分析。
图2的(a)和(b)示出FAIMS1的测量结果的例子。虽然是同一样品,但是作为FAIMS1的测量结果,有时根据测量环境的不同而表现出一见不同的行为。图1所示的处理装置10是要通过SW(软件)处理技术实时地或以接近实时的速度进行数据处理来解决该问题这样的装置。处理装置10的功能例如能够通过一个或多个半导体集成电路来提供。该处理装置10被称为OLP(OLfactionProcessor:嗅觉处理器),作为实现化学物质的实时检测、分析、数据库登记的技术平台而由本申请人开发。期待该OLP在今后作为能够短期间、高效率、高品质地实现期待投入到扩大的新市场的各公司的产品开发的平台。能够开展包括FAIMS1的各种***99以及服务。
OLP10包括接口13和驱动器11,该接口13通过在FAIMS(传感器)1中设置测量条件55来从传感器1获取已测量的数据集(第一已测量数据集、以后称为IMS数据)51。从OLP10的驱动器11通过接口13向传感器1发送测量条件55。接口13可以是无线也可以是有线,可以是数字也可以是模拟。也可以是如下环境:传感器1自主地设定测量条件55,OLP10能够通过接口13自动地获取IMS数据51。
测量条件55包括电场电压Vf(以后称为电压Vf)和补偿电压Vc。IMS数据51的一例是通过在特定的电压Vf下的与补偿电压Vc的变动相对应地变化的电流(由检测装置1c检测出的电流)I来表现的谱图。IMS数据51可以是对上述谱图的特征点进行采样(提取)得到的数据,也可以是包括多个电压Vf的谱的数据。虽然取决于通信速度,但是有可能由于提取特征点而谱图所包含的数据量减少,因此期望OLP10获取的IMS数据51是对传感器1所获取的谱图进行AD转换得到的数据。
OLP10还具有:解析单元100,其对获取到的IMS数据51进行预解析;生成单元200,其经由网络9等从数据库80获取已有的多个数据集81,生成多个虚拟(伪)数据集71;选择单元40,其从已有的数据集81中理论选择适当的实际数据集76;输出单元30,其从包括虚拟数据集71和实际数据集76的候选数据库79中的候选数据集75中选择接近IMS数据51的一个或多个候选数据集75;以及登记单元300,其将已测量的IMS数据51作为已有的数据集81登记到数据库80中。
各个已有的数据集(已知的数据集、已得的数据集)81包括由过去的若干个类型的IMS(离子迁移率传感器、离子迁移率光谱仪)测量各成分和/或各产品(商品)得到的结果(数据)、根据已有的化学数据库(化学物质数据库)计算离子迁移率得到的结果等,表示能够与测量所使用的传感器1(在本例中是FAIMS)的测量结果(已测量数据集、IMS数据)51进行比较的已有的数据。已有的数据集81包括谱图信息82、表示特定的化学物质的特征的识别信息83、变动信息84。谱图信息82是用于生成与从传感器1获得的IMS数据51进行对比的谱图(在特定的电压Vf下通过补偿电压Vc的变动所表现的谱图)的信息,包括离子迁移率、典型的传感器类型的在代表性的电压Vf下的谱图样品等。识别信息83包括主要的名称、化学性信息(CAS登记编号、PUBCHEM、RTECS编号、化学式、摩尔质量、密度、其它物性等)、包含在产品中的可能性和比例、如果是产品则产品中所含的成分及其比例等。变动信息84包括表示对于作为IMS数据51出现时的环境信息(温度、湿度、压力、流量、电场强度、传感器类型等)的理论上的和/或实验上的依赖性的信息。
OLP10从已设置的传感器等接收表示得到IMS数据51的测量环境的环境信息(第一环境信息)60。环境信息60包括温度、湿度、压力、流量等物理性信息61以及应用信息62。能够从提供应用的应用服务服务器62s、搭载有FAIMS1的终端等获取应用信息62。应用信息62包括位置信息63、图像信息64以及用户输入信息65。此外,OLP10获取的环境信息60也可以包括这些信息的一部分或全部。
物理性信息61能够从设置在FAIMS1附近或者搭载有FAIMS1的终端中的传感器群69获取。传感器群(第二传感器)69包括适合测量温度、湿度、压力、流量等物理量的传感器。也能够根据位置信息63等应用信息62从定点观测温度、湿度等的其它***间接地获取FAIMS1周围的环境信息60。并且,如果环境信息60包括日期和时间,则也能够根据日期和时间估计某种程度的温度范围来作为物理性信息61进行利用。
生成单元200包括模拟器210和概率性生成单元220,该模拟器210利用模型来生成虚拟数据集71,该概率性生成单元220概率性地生成虚拟数据集71。在以后,主要说明由模拟器210生成虚拟数据集71的情况。
通过驱动器11获取到的IMS数据51首先在预解析单元100中进行预解析。预解析单元100包括前处理单元101,该前处理单元101进行去除IMS数据51的谱图所包含的背景噪声、将多个峰分离、获取使各个峰具有特征的参数等处理。预解析单元100还包括:特征点提取单元102,其在通过前处理单元101得到的数据中提取使IMS数据51具有特征的若干个点;特征选择单元103,其从所提取的特征点中选择作为IMS数据51的产生源(候选)的认为是化学物质的特征的配置文件(profile);以及背景文件配置单元104,其将IMS数据51的背景配置文件保存为辅助信息。
特征点提取单元102提取分离后的峰的位置(与电场电压Vf、补偿电压Vc之间的关系)、强度、顺序等作为特征点。特征选择单元103从若干个特征点中在理论上、实验上、还在经验(学习)上选择作为IMS数据51的产生源(候选)的认为是化学物质的特征的配置文件。背景文件配置单元104将从IMS51中去除被选择为IMS数据51的特征的配置文件后的背景配置文件保存为用于对候选的变动进行扩大或变更的辅助信息。
模拟器210包括:参照单元211,其根据由预解析单元100获得的特征点信息19,参照已有的数据库80,从已有的数据集81中选择特征点等相同的多个数据集;文件配置单元212,其基于由预解析单元100获得的特征点信息19和环境信息60,生成在预测模型中使用的参数;以及模拟器内核(Sim内核)213,其使用所生成的参数和预测模型生成虚拟数据集71。
该OLP10包括根据特征点信息19从已有数据库80中选择特征点相同的实际数据集76的单元40。在仅比较实际数据集76的情况下,无法在实际数据集之差较小时追加其它的特征点来增加数据数、或者在IMS数据51与实际数据集76之间的欧几里得距离大时缩减数据数。并且,如上所述那样,即使是相似性高的化学物质,也通过变更浓度、温度、电场强度使离子迁移率的差发生变化。
模拟器210通过使用环境变量(环境条件)60使已有的数据集81积极地发生变化,来构建用于确定作为IMS数据51的源(候选)的化学物质的数据库79。
关于模拟器内核213所采用的预测模型,已知离子迁移率取决于各化学物质的截面积、分子构造。因而,如果能够根据特征点信息19判断化学物质所属的基(官能团),则存在能够提高预测模型的精确度并大幅地削减搜索空间的可能性。除此之外,期望预测模型具有化学物质的截面积、分子量、离子化量、浓度、温度、湿度、背景物质等作为参数。针对这些参数,离子迁移率表现非线性行为的情形较多。因而,预测模型也可以是包括线性插值、外插/内插的模型,但是优选利用收敛快的非线性的函数模型。另外,为了用作预测模型,而期望是容易吸收与实测数据之间的偏差的模型。函数模型的一个候选是使用了样条函数的模型。函数模型也可以是以环境条件为参数的其它的非线性级数(函数)。另外,模拟器内核213也可以具备回归收敛功能。另外,期望预测模型能够针对存在于因特网9的多个已有数据库80中所包含的数据进行收敛。
这样,在OLP10中生成多个候选数据集75并建立候选数据库79,该多个候选数据集75是由生成单元200生成的多个虚拟数据集71和由选择单元40理论生成的一个或多个实际数据集76的集合。由生成单元200生成的多个虚拟数据集71与IMS数据51之间的欧几里得距离有可能比实际数据集76与IMS数据51之间的欧几里得距离短。因而,存在能够更高精确度地确定IMS数据51的产生源的化学物质的可能性。此外,在下面详细记述概率性生成单元220。
输出单元30包括:候选选择单元31,其选择作为IMS数据51的产生源(对象)的以某种程度的概率估计出的一个或多个候选数据集75;传感器控制单元32,其重新设定传感器1的测量条件;数据库或缓存39,其保存过去选择的候选的历史;历史检索单元38,其参照历史,从多个候选中选择假定概率最高的候选;以及显示转换单元33,其将所选择的候选数据集75转换为成分名或产品名并发送到用户的终端2。
候选选择单元31通过比特征点信息19还多的点来判断IMS数据51与候选数据库79的各候选数据集75之间的距离,选择作为IMS数据51的对象的以某种程度的概率估计出的一个或多个候选数据集75。在存在能够改变相同概率(次序)的多个候选数据集75的次序的传感器1的测量条件的情况下,传感器控制单元32将该条件55返回给驱动器11来使传感器1重新进行测量,从而能够获取能从多个候选中选择最佳的候选的IMS数据51。
历史检索单元38从记录在缓存39的历史中所包含的多个候选数据集75中选择最近或者针对连续获取到的IMS数据51所选择的相同的候选数据集75并进行输出。历史检索单元38例如将基于第一IMS数据51和第一环境信息60选择的多个候选数据集75与基于第二IMS数据51和第二环境信息60选择的多个候选数据集75中相同的候选数据集75作为最有可能的候选数据集75进行输出。
显示转换单元33基于被组合成候选数据集75的已有数据集81的识别信息83来选择或生成包括成分名或产品名的内容,将接近IMS数据51的候选数据集75作为内容提供至用户的终端2。显示转换单元33将候选数据集75作为能够显示在终端2的显示装置2d上的信息提供至终端2。显示转换单元33在候选数据集75作为香水的配方等而通过著作权、专利权或其它权利进行保护的情况下,将产品名而非成分名显示在显示装置2d上。
OLP10还包括将IMS数据51登记到已有的数据库80的登记单元300。登记单元300包括判断出IMS数据51的源(来源)的化学物质为未登记的单元301。在输出单元30中IMS数据51与包含在候选数据库79中的数据之间的欧几里得距离不在规定的范围内时,该单元301判断为提供IMS数据51的已有的数据集81未包含在数据库80中。被判断为未登记的IMS数据51与欧几里得距离相近的若干个候选数据集71和76一起登记到已有的数据库80中,往后已有的数据库80的数据量增加或等待通过改进模拟器210的预测模型来解决的机会。
登记单元300还包括将IMS数据51与特征点数据19相关联地登记到数据库80中的单元302、将IMS数据51作为实际模型登记到数据库80中的单元303以及将IMS数据51作为背景模型进行登记的单元304。作为实际模型进行登记的单元303将IMS数据51作为基于IMS数据51确定出的化学物质、成分或产品的代表性的数据(实际模型)登记到数据库80中。作为背景模型进行登记的单元304将IMS数据51作为基于IMS数据51确定出的化学物质、成分或产品的辅助性的数据登记到数据库80中。
图1所示的FAIMS1以及OLP10例如是与网络9相连接的移动观测***、定点观测***或者远程观测***。显示转换单元33包括使个人计算机等终端2经由网络9将IMS数据51显示为图像2a、将缓存39的数据显示为图像2b、还显示内容2c的功能。内容2c包括与多个候选数据集75相对应地在网络9上公开的多个信息2x、最有可能的候选的信息2y以及与有可能的候选的信息2y相关联的信息2z。
作为OLP10的功能,也能够搭载于进行已有的数据库80的服务的服务器400,也能够由服务器400经由网络9向终端2提供内容2c。
图3示出在终端2中搭载有传感器(FAIMS)1的***99的概要。作为对FAIMS1的数据进行解析的装置(***)的OLP10可以由通过适当的通信单元、例如因特网9与搭载有传感器1的终端2进行连接的服务器实现,也可以内置于终端2。
终端2也可以是能够进行从OLP10的驱动器11通过接口13提供传感器1的测量条件55的遥感的环境。另外,终端2还可以是自行设定测量条件55并能够由OLP10通过接口13自动地获取IMS数据51和测量条件55的环境。
OLP10如上所述那样包括预解析单元100、生成单元200、选择单元40以及登记单元300。生成单元200包括模拟器210和概率性生成单元220,该概率性生成单元220经由网络9等从数据库80获取已有的多个数据集81,概率性地生成多个虚拟(伪)数据集71。在以后,以概率性地生成虚拟数据集71的例子为中心进行说明。
OLP10从终端2或设置在其周围的传感器等接收表示能够得到IMS数据51的测量环境的环境信息(第一环境信息)60。环境信息60的温度、湿度、压力、流量等物理性信息61能够从搭载于终端2的传感器(第二传感器、传感器群)69获取。与上述同样地,也可以根据终端2的位置信息63,从定点观测温度、湿度等的其它***间接地获取物理性信息61。
应用信息62是用于缩小传感器1所测量出的对象的搜索范围的信息。位置信息63能够从搭载于终端2的GPS(第三传感器)68、基站信息等中获得。能够根据所获得的位置信息63估计由传感器1测量出的可能性高的对象(化学物质),缩小搜索范围。典型地说,图像信息64能够从搭载于终端2的照相机67获得。或者也能够基于位置信息63从定点监测器获得表示终端2的位置周围的图像。图像信息64用于估计由传感器1测量出的可能性高的对象的范围。
用户输入信息65能够从终端2的用户接口(外部输入接口)66、处于网络上(云(cloud))的用户信息等中获取。用户输入信息65包括具有用户想要的信息的领域、例如健康、食品、饮料、动物等的信息的各种分类的信息,通过综合这些信息,能够估计作为传感器1的测量对象的可能性高的对象的范围。
生成单元200的概率性生成单元220包括概率性处理单元20、保存有被处理单元20所参照的函数、模型、初始值等的库29以及作为处理单元20的作业区的临时候选数据库73。处理单元20包括概率性结合引擎21和迭代算法引擎22。概率性生成单元220的处理单元20概率性地组合从数据库80获得的已有的数据集81来生成虚拟数据集71。在本例中,处理单元20以两个阶段生成虚拟数据集71。首先,概率性结合引擎21生成临时候选数据库73,该临时候选数据库73包括根据环境信息60将多个已有的数据集81概率性地进行结合并在迭代算法引擎22中使用的多个临时候选数据集72。概率性结合引擎21还生成将临时候选数据集72进行组合的一个或多个函数(初始函数)25以及一个或多个初始条件26。
接着,迭代算法引擎22将由预解析单元100获得的IMS数据51的特征点信息19作为目标来通过元启发式(Meta-heuristics)方法概率性地找出接近IMS数据51的一个或多个虚拟数据集71。元启发式的迭代算法包括模拟退火法(simulatedannealing)、平均场退火法、遗传算法等。
概率性结合引擎21为了缩小后续处理中的搜索范围,而以由环境信息60控制的概率组合已有的数据集81。具体地说,概率性结合引擎21根据环境信息60、尤其是温度等物理性信息61,在理论上和/或实验上改变已有的数据集81来生成多个临时候选数据集(第一已变换数据集)72。概率性结合引擎21根据物理性信息61,在理论上和/或实验上改变已有的数据集81,因此能够利用已有的数据集81的变动信息84。
各分子的离子的平均移动速度vd在理论上与电场的强度E成比例,可以通过下面的式(1)提供。
vd=K×E···(1)
提供离子迁移率的移动系数K的逻辑式的一例通过动量转移理论而如下。
K=(3e/16N)
×(2π/μ·k·Teff)1/2((1+α)/Ωd(Teff))···(2)
在此,e是离子的电荷,N是缓冲气体的密度,k是波尔兹曼常数,μ是离子与缓冲气体分子的换算质量,Teff是缓冲气体的漂移管中的有效温度,α是校正项且通常远小于1。Ωd是碰撞截面积(碰撞积分),通过下面的式(3)提供。
Ωd=πr2Ω(1,1)×T···(3)
在此,r是分子半径,Ω(1,1)是分子固有的值,并且根据湿度、温度、缓冲气体(载气、漂移气体)等而变化。
因而,概率性结合引擎21能够利用这些逻辑式以及根据上述的逻辑式对大量实验结果进行解析得到的结果,来根据环境信息60改变已有的数据集81。
概率性结合引擎21也能够根据环境信息60、尤其是应用信息62,在已有的数据集81中将多个数据集以概率相对高的方式进行组合来生成多个临时候选数据集(第二已变换数据集)72。由于根据应用信息62对已有的数据集81进行组合,因此能够利用已有的数据集81的识别信息83。并且,该概率性结合引擎21通过将IMS数据51的特征点信息19***于初始值等中,使概率性估计出的范围收敛于IMS数据51的附近。
在该处理单元20中,由概率性结合引擎21主要根据应用信息62概率性地对已有的数据集81进行组合来生成临时候选数据集72。接着,根据物理性信息61生成在迭代算法引擎22中使用的初始函数25和初始条件26。并且,由迭代算法引擎22通过理论性的参数和/或实验性的参数组合临时候选数据集72来概率性地找出接近IMS数据51的多个虚拟数据集71。
概率性结合引擎21包括一个或多个结合引擎。在本例中,概率性结合引擎21包括贝叶斯结合引擎23以及启发式结合引擎24,将它们独立或者结合地使用。启发式结合引擎24是利用启发式搜索方法来通过非线性结合将任意的要素进行结合的引擎。在本例中,启发式结合引擎24使用理论性的规则和/或发现性的规则的任意的(概率性的)组合来对已有的数据集81进行组合。例如在国际公开WO2002/087259等中记载了使用启发式搜索方法的结合引擎。在国际公开WO2002/087259中公开了使用遗传算法的方法。
贝叶斯结合引擎23使用贝叶斯定理(贝叶斯网络)来对已有的数据集81进行组合。使用贝叶斯网络概率性地对要素进行组合的方法是公知的,例如在国际公开WO00/075863、WO2001/058145等中公开了该方法。
可在贝叶斯结合引擎23中使用的推论、可在启发式结合引擎24中使用的规则等被存储在库29中。库29的内容根据迭代算法引擎22的收敛状况来更新被这些引擎23和24使用的优先级。
因而,在处理单元20中,根据环境信息60以及IMS数据51的特征点信息19,在测量出IMS数据51的环境或接近该环境的条件下,生成接近IMS数据51的多个虚拟数据集71。而且,虚拟数据集71是添加概率性的要素而生成的,因此成为针对在理论上或实验上预测出的数据集不确定的或者具有波动的虚拟数据集71。因而,能够针对在理论上或实验上预测出的数据集准备更接近IMS数据51的虚拟数据集71。
并且,在处理单元20中,由于添加概率性的和发现性的要素来生成虚拟数据集71,因此即使在无法预测对象的出现图案时、环境信息60变化时、存在无法表现为环境信息60的变化的变化时、OLP10所获得的环境信息60存在限制时、进一步地说存在无法预测的变化时,能够生成接近IMS数据51的虚拟数据集71的可能性高。因而,能够以更高的概率估计出IMS数据51的对象。
迭代算法引擎22将IMS数据51的特征点信息19作为目标来生成虚拟数据集71。特征点信息19能够包含IMS数据51的谱图中所包含的主要的峰的位置、形状(半值宽度、高度、分散、角度等)、峰的间隔等,能够控制迭代算法引擎22所采用的作为目标的信息量。因而,能够根据概率性生成的多个初始函数25和初始值26以及作为目标的特征点信息19的信息量,生成若干个虚拟数据集71。即,在迭代算法引擎22中,使用由概率性结合引擎21生成的初始函数25和初始条件26,将特征点信息19作为目标,利用迭代算法将多个临时候选数据集72和/或已有的数据集81进行组合来生成虚拟数据集71。因而,能够概率性地找出接近IMS数据51的多个虚拟数据集71。
在迭代算法引擎22中,也能够反复利用迭代算法来使虚拟数据集71增加。即,将信息量少的特征点信息19作为目标来利用迭代算法(模拟退火法、平均场退火法、遗传算法等)生成若干个虚拟数据集71,但是迭代算法引擎22还可以将该虚拟数据集71作为初始值,将信息量比较多的特征点信息19作为目标,再次利用相同或不同的迭代算法生成虚拟数据集71。
通过这样,在OLP10中,生成多个候选数据集75并建立候选数据库79,该多个候选数据集75是由处理单元20概率性生成的多个虚拟数据集71和由选择单元40理论生成的一个或多个实际数据集76的集合。因而,在候选数据库79中包含与IMS数据51之间的欧几里得距离近的虚拟数据集71的可能性高。因此,输出单元30也能够添加比特征点信息19多的要素、例如谱图本身的相似性、背景配置文件等来判断IMS数据51与候选数据库79的各候选数据集75之间的距离。因此,能够以更高的概率估计出作为IMS数据51的对象的一个或多个候选数据集75。输出单元30的结构与图1所示的装置相同。
候选数据库79中所包含的多个虚拟数据集71是通过迭代算法引擎22将特征点信息19作为目标而某种程度上在熵(entropy)很低的状态下稳定的数据集,不包括与特征点信息19之间的距离(欧几里得距离)非常远的数据集。然而,是包括虽说接近IMS数据51但距离的次序各种各样的数据集的暂定的集合。另外,数据间的距离是如果进行比较的对象增加或者进行比较的对象不同则变化的信息。因而,即使是在特征点信息19的范围内非常接近IMS数据51的虚拟数据集71,在添加不包含在特征点信息19中的、或者并非为了概率性地生成若干个虚拟数据集71而包含在特征点信息19中的微小的峰或接近噪声的其它谱图的特征来重新评价与IMS数据51之间的距离的情况下,包括虚拟数据集71的候选数据集75与IMS数据51之间的距离(次序)有可能发生变化。选择单元31也可以包含这样的重新进行评价的功能。
另外,OLP10能够以传感器1的测量间隔(采样间隔)依次获取IMS数据51和环境信息60。在将多个传感器1连接在接口13上的情况下,OLP10能够以更短的间隔获取多个IMS数据51。选择单元31包括动态地从这些能够依次获取的IMS数据51和与其对应的虚拟数据集71中选择更接近对象的虚拟数据集71的功能。
由选择单元31选择的一个或多个候选数据集75被保存在缓存39中,历史检索单元38选择最有可能的候选数据集75。缓存39的信息也可以被反馈给选择单元31。即,OLP10从接口13接收由传感器(第一传感器)1测量出的第二已测量数据集(第二IMS数据)51和表示该第二IMS数据51的测量环境的第二环境信息60,由处理单元20生成虚拟数据集71。选择单元31添加被判断为与前一数据或者直到前一数据为止的IMS数据51接近的虚拟数据集71的历史,选择接近新获得的IMS数据51的虚拟数据集71,或者生成虚拟数据集71相对于新获得的IMS数据51的排序。
典型地说,将与前一数据或者直到前一数据为止所获得的IMS数据51接近的虚拟数据集71的成分或产品(候选)与接近新获得的IMS数据51的虚拟数据集71的成分或产品(候选)相同的虚拟数据集71的候选排序在接近对象的高位次。在传感器1被放置在封闭的环境中的情况下,OLP10依次获取的IMS数据51是相同对象的已测量的数据集的可能性高。因而,与前一数据或者直到前一数据为止所获得的IMS数据51接近的虚拟数据集71的共同性是对于选择对象重要的信息。
另一方面,在传感器1被放置在开放式的环境中的情况下,几乎不存在OLP10依次获取的IMS数据51是完全相同的对象的已测量数据集的可能性。在该OLP10中,使概率性处理单元20包含概率性的要素而生成虚拟数据集71。因而,在虚拟数据集71中包含有如下的数据集作为候选的可能性高,所述数据集包含有在开放式的环境中有可能包含的成分。因此,即使在开放式的环境中设置了传感器1的情况下,与前一数据或者直到前一数据为止所获得的IMS数据51接近的虚拟数据集71的共同性是对于选择对象重要的信息。
传感器控制单元32也可以包含由OLP10主动地控制传感器1来提高对象的估计精确度的功能。例如在存在多个由选择单元31选择为对对象来说相同程度的次序(位次)的候选数据集75的情况下,有可能通过搜索组合出候选数据集75的已有的数据集81的谱图信息82,能够选择一个或多个适合于将这些候选数据集75分离的电压Vf。传感器控制单元32将适于改变多个候选数据集75的排序的电压Vf作为测量条件55反馈给驱动器11,能够将后续的IMS数据51改变为对于更明确地确定候选数据集75的排序有用的数据。
这样,在该OLP10中,利用预测模型和/或添加概率性的要素来生成虚拟数据集71,由此增加作为搜索的对象的数据集71并扩大搜索空间。通过增加虚拟数据集71,根据预测模型和环境信息60,加入概率性的和发现性的理论来生成接近传感器1的对象的虚拟数据集71,由此使接近IMS数据51的虚拟数据集71增加,与此同时防止搜索空间无限制地扩大。因而,结果,接近IMS数据51的虚拟数据集71增加,实质要搜索的空间大幅地缩小,并能够在适当的时间内选择接近对象的一个或多个成分或产品,并能够排序地显示它们。
图4用流程图示出对由传感器1测量的对象进行估计的方法的一例。在步骤101中,设置传感器1的测量条件55。在FAIMS传感器的情况下,设定电场电压Vf以及占空比等决定传感器的基本动作的参数,并设定补偿电压Vc的变动范围,由此能够得到表示正电荷的离子和负电荷的离子的测量强度的谱图来作为测量结果。
已测量的数据集(IMS数据)51的一例是在某电压Vf下的谱图。IMS数据51可以是在多个电压Vf下得到的多个谱图的组合,也可以是将谱图的特征转换为数字数据后的信息。传感器1的测量条件55的设置可以由OLP10进行,也可以由终端2自动地设置合适的测量条件55。
在步骤102中,OLP10从终端2接收作为传感器1的已测量的数据集的IMS数据51和环境信息60。如上所述,OLP10也可以内置于终端2。期望在环境信息60中包含有包含在上述物理性信息61和应用信息62中的多种信息。然而,在该方法100和OLP10中,除了使用预测模型生成虚拟数据集71以外,还包括通过概率性的手段生成虚拟数据集71的情形。因此,即使是在限制了环境信息60所包含的信息量的情况下、或者几乎不能得到环境信息60的情况下,也有可能生成与传感器1所测量出的环境条件相匹配的虚拟数据集71。
首先,概率性生成单元220在步骤103中根据所得到的环境信息60和已有的数据集81来概率性地生成临时候选数据集72、初始函数25以及初始值26。即使是在终端2未搭载有任何传感器群69而无法得到物理性信息61的状况下,生成单元220也能够根据包含在应用信息62中的位置信息、日期和时间的信息等,尽可能地估计出物理性信息61。另外,OLP10通过向终端2的用户进行“热、冷”、“几度左右”、“天气”、“闷热”等的询问,虽然精确度低,但是能够获得物理性信息61。
概率性生成单元220还在步骤104中利用元启发式的迭代算法概率性地和发现性地生成虚拟数据集75。迭代算法包含模拟退火法、平均场退火法、遗传算法、免疫算法等,也可以使用它们中的任一个或将多个组合使用。
步骤103和104是概率性生成单元220概率性地求出虚拟数据集75的一例。在步骤103中,将已有的多个数据集81中适合第一环境信息60的多个数据集以相对高的概率组合来生成多个第二已变换数据集(临时候选数据集)72,在步骤104中,通过理论性的参数和/或实验性的参数对多个第二已变换数据集72进行组合,来以接近第一已测量数据集(IMS数据)的特征点信息19为目标,概率性地找出多个虚拟数据集71。
概率性地求出的步骤的另一例包括以下内容:
·生成根据第一环境信息60在理论上和/或实验上改变已有的多个数据集81得到的多个第一已变换数据集;以及
·概率性地组合多个第一已变换数据集来生成多个虚拟数据集71。生成多个虚拟数据集71的步骤也可以包括将多个第一已变换数据集组合来概率性地找出接近第一已测量数据集的多个虚拟数据集71。
概率性地求出的步骤的另一例包括将已有的多个数据集81中适合第一环境信息60的多个数据集以相对高的概率组合来生成多个虚拟数据集71。
在OLP10中,进一步地,模拟器210在步骤105中利用将第一环境信息60作为参数的模型对已有的多个数据集81进行变换来生成多个虚拟数据集71。在该步骤105中,也可以根据特征点信息19利用预测模型单独或者组合地对已有的多个数据集81中适当的一个或多个数据集进行变换,来生成虚拟数据集71。
步骤103和104的概率性生成虚拟数据集71的过程以及步骤105的利用预测模型生成虚拟数据集71的过程可以并行地执行,也可以选择任一个过程来生成虚拟数据集71。
OLP10进一步在步骤106中,能够使用输出单元30将包括虚拟数据集71的一个或多个候选数据集75按照接近对象的顺序进行排序并显示。在步骤105中,也可以将多个候选数据集75根据导出它们的过程、例如迭代算法引擎22中的收敛度等的信息进行排序,还可以不仅根据特征点而且重新计算原始的或者接近原始的IMS数据51与候选数据集75之间的距离来排序显示。
在该估计方法100中,包括以下内容:接收由传感器1测量出的IMS数据51(步骤102),概率性地对已得到的多个数据集81进行组合来生成多个虚拟数据集(步骤103和104),从包含多个虚拟数据集75的暂定的集合中选择接近IMS数据51的至少一个候选(步骤105)。
虽然不限定于对基于DMS等的离子迁移率的物理量进行测量的传感器,但是在由传感器得到的数据集中,测量对象物的特征的出现图案受到各种要素的影响。因而,在已有的数据集中包含有受到这些要素的影响的数据集的概率小。并且,表示包含在已有的数据集中的测量对象的数据集最接近受到各种要素的影响的已测量的数据集的可能性低。也许能够预测或估计表示包含在已有的数据集中的测量对象的数据集的基于各要素的出现图案。然而,对出现图案产生影响的所有要素都事先得到的情形较少。另外,完全明确对出现图案产生影响的所有要素以及这些要素所产生的影响的情形较少。
在该估计方法100中,通过概率性地对已有的多个数据集进行组合来虚拟地扩大搜索对象(搜索空间),使接近已测量的数据集的虚拟(伪)数据集概率性地增加,并在已测量的数据集附近配置测量对象物或者接近测量对象物的虚拟数据集。然后,通过搜索这样的搜索空间,即使无法事先得到对出现图案产生影响的所有要素,另外即使无法完全明确对出现图案产生影响的所有要素和这些要素所产生的影响,也有可能得到测量对象物或者接近测量对象物的候选,并能够提高测量对象物(对象)的估计概率。
并且,在该方法中,设置接收表示已测量的数据集的测量环境的环境信息60的步骤,生成多个虚拟数据集的步骤包括以下内容:将已有的多个数据集81按由环境信息60控制的概率进行组合来生成多个虚拟数据集71。由于存在能够通过环境信息60限定生成虚拟(伪)数据集71的范围的可能性,因此能够缩小搜索空间,并能够缩短估计对象所需要的时间。
上述所示的处理装置10和估计方法100是将FAIMS作为传感器时的一例,传感器不限定于FAIMS,对于DMS或TOF(飞行时间型)IMS等其它方式的IMS也能够应用。还能够广泛地应用于需要进行对若干个要素和/或因素复杂关联的***的输出进行测量的情形较多的传感器的测量以及对测量对象进行估计的***。
另外,处理装置10可以存在于网络上,也可以与传感器1一起搭载于终端2等装置,并且,处理装置10也可以搭载包括已有的数据集81的数据库80。另外,估计方法100和处理装置10能够作为硬件逻辑而被安装在LSI等硬件中。估计方法100和处理装置10还能够作为软件(程序、程序产品)记录在适当的记录介质中或者经由网络提供以由具有适当的硬件资源的计算机执行。
该处理装置10和方法100(以后是OLP)针对环境参数(温度、湿度、压力、流动速率等)的变动具有较高的搜索能力。因而,能够应用于包括防护、工程管理、监视在内的各种应用。另外,OLP还提供包括新的化学物质的登记、管理的数据库管理***。并且,OLP具有作为解析检索引擎模块的功能,提供用于容易地进行连续监视的异物检测等的基于GUI的解析检索引擎。另外,OLP具有作为数据收集模块的功能,该数据收集模块具备将数据采样点定制成最适合于检测对象物质的功能。并且,OLP提供与预处理和解析处理用的多种算法相对应的API。因而,能够通过今后开发的或者用户准备的解析算法对功能进行扩展。并且,OLP也能够提供一种面向云计算的API,能够构建利用因特网的服务器和客户端***。
能够应用OLP的领域多种多样,适合于实时分析、检测、威胁检测、香味分析、微量化学物质的确定等。包含食品加工过程监视、防护、香味行业、医用和医疗领域、嗅觉处理的研究领域、水处理领域、娱乐的内容开发。例如在饮料和食品质量管理、医药品的质量管理的领域中,对于食品来说检测、确定危险的物质、存在安全性上的问题的化学物质很重要,期待着应用OLP来进行解决。
在防护的领域中,某种程度的快速处理以及更快的可靠的检测很重要,存在通过应用OLP来减少错误动作从而能够提高检测准确度和精确度的可能性。另外,如应对***那样的***物质、危险物质检测要求始终针对最新信息进行DB更新、DB化来在短时间内高效地进行登记、管理的功能。OLP有可能包括来自实际的应用现场的反馈在内灵活性高地响应于这些要求。
在健康管理市场、室内空调机监视器的领域、例如呼吸监测中,指出了特定的疾病、顽症与作为生体反应的结果的呼气之间的因果关系,有可能通过应用OLP能够简单地提供监视功能。在除此以外的消费应用(consumerapplication)的领域中,OLP能够进行以半导体设备技术为基础的产品扩展和业务扩展,能够对各种用户提供能够轻松利用的分析技术。

Claims (22)

1.一种基于由传感器测量出的数据找出候选的装置,具有:
接口,其接收由第一传感器测量出的第一已测量数据集和表示上述第一已测量数据集的测量环境的第一环境信息;
生成单元,其以由上述第一环境信息控制的条件对数据库中已有的多个数据集进行变换来生成多个虚拟数据集;以及
输出单元,其从包括上述多个虚拟数据集的暂定的集合中选择接近上述第一已测量数据集的至少一个候选并输出该至少一个候选,
其中,上述生成单元包括模拟器,该模拟器利用将上述第一环境信息作为参数的模型对上述已有的多个数据集进行变换来生成上述多个虚拟数据集,该第一环境信息包括由与上述第一传感器不同的测量温度、湿度、压力以及流量中的至少一个的传感器获取到的多个不同的信息。
2.根据权利要求1所述的装置,其特征在于,
上述生成单元包括将从上述数据库获取到的上述已有的多个数据集按由上述第一环境信息控制的概率进行组合来生成上述多个虚拟数据集的单元。
3.根据权利要求1所述的装置,其特征在于,上述生成单元包括:
生成使上述已有的多个数据集基于上述第一环境信息理论上和/或实验上发生变化而得到的多个第一已变换数据集的单元;以及
将上述多个第一已变换数据集进行组合来概率性地找出接近上述第一已测量数据集的上述多个虚拟数据集的单元。
4.根据权利要求1所述的装置,其特征在于,
上述生成单元包括将上述已有的多个数据集中适合于上述第一环境信息的多个数据集以相对高的概率进行组合来生成上述多个虚拟数据集的单元。
5.根据权利要求1所述的装置,其特征在于,上述生成单元包括:
将上述已有的多个数据集中适合于上述第一环境信息的多个数据集以相对高的概率进行组合来生成多个第二已变换数据集的单元;以及
通过理论性的参数和/或实验性的参数将上述多个第二已变换数据集进行组合来概率性地找出接近上述第一已测量数据集的上述多个虚拟数据集的单元。
6.根据权利要求1所述的装置,其特征在于,
上述模拟器包括选择上述已有的多个数据集中的适合于上述第一环境信息的多个数据集以利用上述模型对其进行变换的单元。
7.根据权利要求1所述的装置,其特征在于,
还具有提取上述第一已测量数据集的特征点的单元,
上述模拟器包括选择上述已有的多个数据集中的上述特征点相同的多个数据集以利用上述模型对其进行变换的单元。
8.根据权利要求1所述的装置,其特征在于,
上述输出单元包括从上述接口输出接近第二已测量数据集的至少一个候选和接近上述第一已测量数据集的至少一个候选中相同的候选的单元,其中,上述接近第二已测量数据集的至少一个候选是根据由上述第一传感器测量出的第二已测量数据集和第二环境信息选择出的,该第二环境信息表示上述第二已测量数据集的测量环境。
9.根据权利要求1所述的装置,其特征在于,
上述第一环境信息包含由第二传感器测量出的表示上述第一传感器的测量环境的数据、由第三传感器测量出的位置信息以及通过照相机或外部输入接口输入的应用信息中的至少一个。
10.根据权利要求1所述的装置,其特征在于,
还具有传感器控制单元,该传感器控制单元对上述第一传感器输出测量条件。
11.根据权利要求1~10中的任一项所述的装置,其特征在于,
还具有上述第一传感器。
12.根据权利要求1所述的装置,其特征在于,
还具有上述数据库。
13.根据权利要求1所述的装置,其特征在于,
上述输出单元输出上述候选的产品名。
14.一种基于由传感器测量出的数据找出候选的方法,用于处理装置对由第一传感器测量出的数据进行处理,该方法包括以下步骤:
上述处理装置接收由上述第一传感器测量出的第一已测量数据集;
上述处理装置接收表示上述第一已测量数据集的测量环境的第一环境信息;
上述处理装置以由上述第一环境信息控制的条件对已有的多个数据集进行变换来生成多个虚拟数据集;以及
上述处理装置从包括上述多个虚拟数据集的暂定的集合中选择接近上述第一已测量数据集的至少一个候选,
上述生成的步骤包括:上述处理装置所包括的模拟器利用将上述第一环境信息作为参数的模型对上述已有的多个数据集进行变换来生成上述多个虚拟数据集,其中,该第一环境信息包括由与上述第一传感器不同的测量温度、湿度、压力以及流量中的至少一个的传感器获取到的多个不同的信息。
15.根据权利要求14所述的方法,其特征在于,
上述生成多个虚拟数据集的步骤包括以下步骤:将上述已有的多个数据集按由上述第一环境信息控制的概率进行组合来生成上述多个虚拟数据集。
16.根据权利要求14所述的方法,其特征在于,
上述生成多个虚拟数据集的步骤包括以下步骤:
生成使上述已有的多个数据集基于上述第一环境信息理论上和/或实验上发生变化而得到的多个第一已变换数据集;以及
概率性地对上述多个第一已变换数据集进行组合来生成上述多个虚拟数据集。
17.根据权利要求16所述的方法,其特征在于,
上述生成多个虚拟数据集的步骤包括以下步骤:将上述多个第一已变换数据集进行组合来概率性地找出接近上述第一已测量数据集的上述多个虚拟数据集。
18.根据权利要求14所述的方法,其特征在于,
上述生成多个虚拟数据集的步骤包括以下步骤:将上述已有的多个数据集中适合于上述第一环境信息的多个数据集以相对高的概率进行组合来生成上述多个虚拟数据集。
19.根据权利要求14所述的方法,其特征在于,
上述生成多个虚拟数据集的步骤包括以下步骤:
将上述已有的多个数据集中适合于上述第一环境信息的多个数据集以相对高的概率进行组合来生成多个第二已变换数据集;以及
通过理论性的参数和/或实验性的参数将上述多个第二已变换数据集进行组合,来概率性地找出接近上述第一已测量数据集的上述多个虚拟数据集。
20.根据权利要求14所述的方法,其特征在于,
利用上述模型进行变换来生成多个虚拟数据集的步骤包括以下步骤:利用上述模型对上述已有的多个数据集中的适合于上述第一环境信息的多个数据集进行变换来生成上述多个虚拟数据集。
21.根据权利要求14所述的方法,其特征在于,
利用上述模型进行变换来生成多个虚拟数据集的步骤包括以下步骤:
提取上述第一已测量数据集的特征点;以及
利用上述模型对上述已有的多个数据集中的上述特征点相同的多个数据集进行变换来生成上述多个虚拟数据集。
22.根据权利要求14~21中的任一项所述的方法,其特征在于,还包括以下步骤:
接收由上述第一传感器测量出的第二已测量数据集;
接收表示上述第二已测量数据集的测量环境的第二环境信息;
以由上述第二环境信息控制的条件对已有的多个数据集进行变换来生成多个虚拟数据集;
从包含上述多个虚拟数据集的暂定的集合中选择接近上述第二已测量数据集的至少一个候选;以及
选择接近上述第一已测量数据集的至少一个候选和接近上述第二已测量数据集的至少一个候选中相同的候选。
CN201180052933.XA 2010-08-31 2011-08-31 基于由传感器测量出的数据找出候选的方法和装置 Expired - Fee Related CN103201621B (zh)

Applications Claiming Priority (5)

Application Number Priority Date Filing Date Title
JP2010-193382 2010-08-31
JP2010193382 2010-08-31
JP2010193361 2010-08-31
JP2010-193361 2010-08-31
PCT/JP2011/004884 WO2012029312A1 (ja) 2010-08-31 2011-08-31 センサーにより測定されたデータから候補を見つける方法および装置

Publications (2)

Publication Number Publication Date
CN103201621A CN103201621A (zh) 2013-07-10
CN103201621B true CN103201621B (zh) 2015-11-25

Family

ID=45772435

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201180052933.XA Expired - Fee Related CN103201621B (zh) 2010-08-31 2011-08-31 基于由传感器测量出的数据找出候选的方法和装置

Country Status (6)

Country Link
US (1) US20130297276A1 (zh)
EP (1) EP2613141A4 (zh)
JP (1) JP5815534B2 (zh)
KR (1) KR20130103517A (zh)
CN (1) CN103201621B (zh)
WO (1) WO2012029312A1 (zh)

Families Citing this family (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP6209511B2 (ja) * 2012-04-25 2017-10-04 アトナープ株式会社 コンテンツを提供するシステム
KR102224714B1 (ko) * 2013-12-03 2021-03-08 삼성전자주식회사 신규 물질 탐색 시스템 및 그 탐색 방법
HUP1300737A2 (en) 2013-12-18 2015-06-29 Turbine Halozatelemzoe Kutatasi Fejlesztesi Kft Method, processor controlled device and program for intervention planning in a complex system
US10242388B2 (en) * 2016-01-05 2019-03-26 Amobee, Inc. Systems and methods for efficiently selecting advertisements for scoring
WO2017153726A1 (en) * 2016-03-07 2017-09-14 Micromass Uk Limited Spectrometric analysis
US10891311B2 (en) * 2016-10-14 2021-01-12 Red Hat, Inc. Method for generating synthetic data sets at scale with non-redundant partitioning
WO2019239456A1 (ja) * 2018-06-11 2019-12-19 三菱電機株式会社 環境情報管理システム、環境情報管理方法および環境情報管理プログラム
FR3087055B1 (fr) * 2018-10-04 2021-06-18 Voltalis Estimation d'une grandeur physique par un systeme de mesure distribue
CN113409548B (zh) * 2021-06-19 2022-08-12 厦门大学嘉庚学院 一种基于人工免疫算法的防溺水警报器***
CN117030828A (zh) * 2023-09-28 2023-11-10 生态环境部华南环境科学研究所(生态环境部生态环境应急研究所) 电化学传感器结合多元分析的全氟辛烷磺酸定量检测方法

Family Cites Families (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6421655B1 (en) 1999-06-04 2002-07-16 Microsoft Corporation Computer-based representations and reasoning methods for engaging users in goal-oriented conversations
US7399958B2 (en) * 1999-07-21 2008-07-15 Sionex Corporation Method and apparatus for enhanced ion mobility based sample analysis using various analyzer configurations
US7051352B1 (en) 2000-02-04 2006-05-23 Koninklijke Philips Electronics N.V. Adaptive TV program recommender
US7010159B2 (en) 2001-04-25 2006-03-07 Koninklijke Philips Electronics N.V. Apparatus and method for combining random set of video features in a non-linear scheme to best describe perceptual quality of video sequences using heuristic search methodology
CA2452128A1 (en) * 2001-06-30 2003-01-16 Sionex Corporation System for collection of data and identification of unknown ion species in an electric field
JP4802104B2 (ja) 2003-11-25 2011-10-26 サイオネックス コーポレイション サンプルの分析を改善するための分散特性、サンプル解離及び/又は圧力制御を用いた移動度ベースの装置及び方法
EP1779409A2 (en) 2004-08-02 2007-05-02 Owlstone Ltd Ion mobility spectrometer
JP4491299B2 (ja) * 2004-08-11 2010-06-30 株式会社日立ハイテクノロジーズ 質量分析装置
JP5643511B2 (ja) * 2006-09-28 2014-12-17 スミスズ ディテクション インコーポレイティド マルチ検出器によるガス同定システム
JPWO2011077731A1 (ja) * 2009-12-22 2013-05-02 アトナープ株式会社 化学物質を検出する装置

Also Published As

Publication number Publication date
US20130297276A1 (en) 2013-11-07
WO2012029312A1 (ja) 2012-03-08
EP2613141A1 (en) 2013-07-10
CN103201621A (zh) 2013-07-10
JPWO2012029312A1 (ja) 2013-10-28
EP2613141A4 (en) 2016-12-28
JP5815534B2 (ja) 2015-11-17
KR20130103517A (ko) 2013-09-23

Similar Documents

Publication Publication Date Title
CN103201621B (zh) 基于由传感器测量出的数据找出候选的方法和装置
Fedick et al. Forensic sampling and analysis from a single substrate: surface-enhanced raman spectroscopy followed by paper spray mass spectrometry
Ehsan et al. A novel modeling in mathematical biology for classification of signal peptides
US20190147983A1 (en) Systems and methods for de novo peptide sequencing from data-independent acquisition using deep learning
Sadygov et al. Large-scale database searching using tandem mass spectra: looking up the answer in the back of the book
Martinelli et al. An adaptive classification model based on the Artificial Immune System for chemical sensor drift mitigation
Zhang et al. A novel sensor selection using pattern recognition in electronic nose
Beegle et al. Effects of drift-gas polarizability on glycine peptides in ion mobility spectrometry
Fenyö et al. Mass spectrometric protein identification using the global proteome machine
Wang et al. Mass spectrometry-based protein identification by integrating de novo sequencing with database searching
Yu et al. Improving peak detection in high-resolution LC/MS metabolomics data using preexisting knowledge and machine learning approach
Mayer et al. Accuracy of ion mobility measurements dependent on the influence of humidity
WO2019240289A1 (ja) 化合物の構造を同定するための方法およびシステム
CN110657890B (zh) 对光谱模型的基于交叉验证的校准
Goodwin et al. Structural mass spectrometry: rapid methods for separation and analysis of peptide natural products
Shvartsburg et al. Pendular proteins in gases and new avenues for characterization of macromolecules by ion mobility spectrometry
Mamakos Methodology to quantify the ratio of multiple-to single-charged fractions acquired in aerosol neutralizers
Lemaire et al. Compact FTICR mass spectrometry for real time monitoring of volatile organic compounds
Guttenberg et al. Classification of the biogenicity of complex organic mixtures for the detection of extraterrestrial life
Moorthy et al. Pattern similarity measures applied to mass spectra
Mariano et al. Effect of space charge on resolving power and ion loss in ion mobility spectrometry
Donald et al. Advances in ion mobility-mass spectrometry: Fundamentals, instrumentation and applications
Sinatra et al. Differential mobility spectrometry–mass spectrometry for atomic analysis
Sun et al. BPDA2d—a 2D global optimization-based Bayesian peptide detection algorithm for liquid chromatograph–mass spectrometry
Laschober et al. Comparison of various nano-differential mobility analysers (nDMAs) applying globular proteins

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C14 Grant of patent or utility model
GR01 Patent grant
CF01 Termination of patent right due to non-payment of annual fee

Granted publication date: 20151125

Termination date: 20200831

CF01 Termination of patent right due to non-payment of annual fee