CN112951342A - 数据解析***以及数据解析方法 - Google Patents
数据解析***以及数据解析方法 Download PDFInfo
- Publication number
- CN112951342A CN112951342A CN202011386666.7A CN202011386666A CN112951342A CN 112951342 A CN112951342 A CN 112951342A CN 202011386666 A CN202011386666 A CN 202011386666A CN 112951342 A CN112951342 A CN 112951342A
- Authority
- CN
- China
- Prior art keywords
- data
- measurement data
- analysis
- feature
- training
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000007405 data analysis Methods 0.000 title claims abstract description 83
- 238000000034 method Methods 0.000 title claims abstract description 14
- 238000005259 measurement Methods 0.000 claims abstract description 229
- 238000004458 analytical method Methods 0.000 claims abstract description 166
- 238000012549 training Methods 0.000 claims abstract description 123
- 238000012545 processing Methods 0.000 claims abstract description 121
- 238000011156 evaluation Methods 0.000 claims abstract description 55
- 239000000463 material Substances 0.000 claims abstract description 53
- 238000004891 communication Methods 0.000 claims abstract description 25
- 238000000605 extraction Methods 0.000 claims description 33
- 238000007781 pre-processing Methods 0.000 claims description 31
- 230000005540 biological transmission Effects 0.000 claims description 5
- 239000000126 substance Substances 0.000 claims description 3
- 238000013500 data storage Methods 0.000 description 12
- 238000009499 grossing Methods 0.000 description 12
- 238000002441 X-ray diffraction Methods 0.000 description 5
- 238000010586 diagram Methods 0.000 description 4
- 238000010894 electron beam technology Methods 0.000 description 3
- 230000006870 function Effects 0.000 description 3
- 230000007935 neutral effect Effects 0.000 description 3
- 238000002056 X-ray absorption spectroscopy Methods 0.000 description 2
- 238000004833 X-ray photoelectron spectroscopy Methods 0.000 description 2
- 238000010521 absorption reaction Methods 0.000 description 2
- 239000013078 crystal Substances 0.000 description 2
- 238000003384 imaging method Methods 0.000 description 2
- 238000012284 sample analysis method Methods 0.000 description 2
- 238000000833 X-ray absorption fine structure spectroscopy Methods 0.000 description 1
- 238000009825 accumulation Methods 0.000 description 1
- 238000013528 artificial neural network Methods 0.000 description 1
- 238000002983 circular dichroism Methods 0.000 description 1
- 238000002591 computed tomography Methods 0.000 description 1
- 239000000284 extract Substances 0.000 description 1
- 230000001678 irradiating effect Effects 0.000 description 1
- 239000000203 mixture Substances 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 239000002245 particle Substances 0.000 description 1
- 230000000704 physical effect Effects 0.000 description 1
- 238000004445 quantitative analysis Methods 0.000 description 1
- 238000007637 random forest analysis Methods 0.000 description 1
- 238000002310 reflectometry Methods 0.000 description 1
- 239000007787 solid Substances 0.000 description 1
- 238000012706 support-vector machine Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16C—COMPUTATIONAL CHEMISTRY; CHEMOINFORMATICS; COMPUTATIONAL MATERIALS SCIENCE
- G16C20/00—Chemoinformatics, i.e. ICT specially adapted for the handling of physicochemical or structural data of chemical particles, elements, compounds or mixtures
- G16C20/70—Machine learning, data mining or chemometrics
-
- G—PHYSICS
- G01—MEASURING; TESTING
- G01N—INVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
- G01N23/00—Investigating or analysing materials by the use of wave or particle radiation, e.g. X-rays or neutrons, not covered by groups G01N3/00 – G01N17/00, G01N21/00 or G01N22/00
- G01N23/20—Investigating or analysing materials by the use of wave or particle radiation, e.g. X-rays or neutrons, not covered by groups G01N3/00 – G01N17/00, G01N21/00 or G01N22/00 by using diffraction of the radiation by the materials, e.g. for investigating crystal structure; by using scattering of the radiation by the materials, e.g. for investigating non-crystalline materials; by using reflection of the radiation by the materials
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/21—Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
- G06F18/213—Feature extraction, e.g. by transforming the feature space; Summarisation; Mappings, e.g. subspace methods
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/21—Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
- G06F18/214—Generating training patterns; Bootstrap methods, e.g. bagging or boosting
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N20/00—Machine learning
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N20/00—Machine learning
- G06N20/10—Machine learning using kernel methods, e.g. support vector machines [SVM]
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N5/00—Computing arrangements using knowledge-based models
- G06N5/01—Dynamic search techniques; Heuristics; Dynamic trees; Branch-and-bound
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16C—COMPUTATIONAL CHEMISTRY; CHEMOINFORMATICS; COMPUTATIONAL MATERIALS SCIENCE
- G16C60/00—Computational materials science, i.e. ICT specially adapted for investigating the physical or chemical properties of materials or phenomena associated with their design, synthesis, processing, characterisation or utilisation
-
- G—PHYSICS
- G01—MEASURING; TESTING
- G01N—INVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
- G01N2223/00—Investigating materials by wave or particle radiation
- G01N2223/30—Accessories, mechanical or electrical features
- G01N2223/303—Accessories, mechanical or electrical features calibrating, standardising
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Data Mining & Analysis (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Evolutionary Computation (AREA)
- Artificial Intelligence (AREA)
- Life Sciences & Earth Sciences (AREA)
- Software Systems (AREA)
- General Engineering & Computer Science (AREA)
- Computing Systems (AREA)
- Chemical & Material Sciences (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Bioinformatics & Computational Biology (AREA)
- Mathematical Physics (AREA)
- General Health & Medical Sciences (AREA)
- Health & Medical Sciences (AREA)
- Medical Informatics (AREA)
- Evolutionary Biology (AREA)
- Crystallography & Structural Chemistry (AREA)
- Pathology (AREA)
- Biochemistry (AREA)
- Immunology (AREA)
- Analytical Chemistry (AREA)
- Computational Linguistics (AREA)
- Biomedical Technology (AREA)
- Biophysics (AREA)
- Molecular Biology (AREA)
- Databases & Information Systems (AREA)
- Analysing Materials By The Use Of Radiation (AREA)
Abstract
本公开提供数据解析***以及数据解析方法,在避免测量数据的解析结果的偏差的同时,提高测量数据的解析精度。数据解析***(1)具备:测量数据取得部(21),取得经由通信部(10)接收到的、分析材料而得到的测量数据;数据解析部(22),使用已训练的机器训练模型来处理测量数据,输出测量数据的解析结果;储存处理部(27),将包括测量数据和处理测量数据而得到的处理结果的数据组作为解析结果数据组,储存到存储装置(30)的解析结果数据库(32);训练用数据组取得部(28),取得经由通信部(10)接收到的、包括根据解析结果数据组在外部进行的针对测量数据的处理结果的评价的结果的训练用数据组;以及训练部(29),根据训练用数据组,使机器训练模型再训练。
Description
技术领域
本发明涉及数据解析***以及数据解析方法。
背景技术
作为以往的试样分析方法,专利文献1中公开了如下方法:在利用X射线衍射法进行定量分析时,使用由与X射线源的标靶相同的材料构成的标准化试样来校正衍射X射线的强度。
现有技术文献
专利文献
专利文献1:日本特开2001-116705号公报
发明内容
然而,在上述以往的试样分析方法中,在解析由X射线衍射装置测量的材料(试样)的测量数据的阶段,存在需要由人工的解析者进行判断的部分,所以存在解析结果依赖于解析者的直觉、经验等而解析结果产生偏差的可能性,并且未进行针对解析者的解析结果的评价,所以存在无法确保解析精度的可能性。
本发明是着眼于这样的问题而完成的,其目的在于避免测量数据的解析结果的偏差,并且提高解析精度。
为了解决上述课题,本发明的一个方案的数据解析***具备:运算装置;存储装置,与运算装置连接;以及通信部,与运算装置连接,能够与外部的终端进行通信。运算装置具备:测量数据取得部,取得经由通信部接收到的、分析材料而得到的测量数据;数据解析部,使用已训练的机器训练模型来处理测量数据,输出测量数据的解析结果;储存处理部,将包括测量数据和处理测量数据而得到的处理结果的数据组作为解析结果数据组,储存到存储装置的解析结果数据库;训练用数据组取得部,取得经由通信部接收到的训练用数据组,该被预先训练为包括根据解析结果数据组在外部进行的针对测量数据的处理结果的评价结果;以及训练部,根据训练用数据组,使机器训练模型再训练。
另外,本发明的一个方案的数据解析方法,由数据解析***执行,该数据解析***具备:运算装置;存储装置,与运算装置连接;以及通信部,与运算装置连接,能够与外部的终端进行通信,其中,具备:测量数据取得工序,取得经由通信部接收到的、分析材料而得到的测量数据;数据解析工序,使用已训练的机器训练模型来处理测量数据,输出测量数据的解析结果;储存处理工序,将包括测量数据和处理测量数据而得到的处理结果的数据组作为解析结果数据组,储存到存储装置的解析结果数据库;训练用数据组取得工序,取得经由通信部接收到的训练用数据组,该被预先训练为包括根据解析结果数据组在外部进行的针对测量数据的处理结果的评价结果;以及训练工序,根据训练用数据组,使机器训练模型再训练。
根据本发明的这些方案,由于使用已训练的机器训练模型来处理测量数据,所以能够避免测量数据的解析结果依赖于解析测量数据的解析者的直觉、经验等而出现偏差。另外,由于根据包括针对测量数据的处理结果的评价结果的训练用数据组进行机器训练模型的再训练,所以进行测量数据的解析并积蓄解析结果数据组,作为其结果,随着训练用数据组的数量增多,能够提高机器训练模型的性能,从而提高测量数据的解析精度。
附图说明
图1是具备本发明的一个实施方式的数据解析***的材料信息取得***的概略结构图。
图2是示出材料信息***的动作序列的一个例子的图。
(符号说明)
1:数据解析***;2:用户用终端;3:评价者用终端;10:通信部;20:运算装置;21:测量数据取得部;22:数据解析部;23:预处理部;24:特征量提取处理部;25:特征量解析处理部;26:解析结果发送部;27:解析数据储存处理部(储存处理部);28:训练用数据组取得部;29:训练部;30:存储装置;100:材料信息取得***。
具体实施方式
以下,参照附图,详细说明本发明的实施方式。此外,在以下的说明中,对同样的构成要素附加同一参照编号。
图1是具备本发明的一个实施方式的数据解析***1的材料信息取得***100的概略结构图。
材料信息取得***100具备:数据解析***1;以及用户用终端2及评价者用终端3,构成为经由网络与数据解析***1连接,能够与数据解析***1相互通信。
材料信息取得***100构成为:能够通过使用已训练的机器训练模型的数据解析***1,对利用材料信息取得***100的一个或者多个用户操作用户用终端2而输入到数据解析***1的、由材料分析用的测量装置等测量出的测量数据(输入数据)进行解析,将作为测量数据的解析结果的与材料的构成成分、化学状态、化学构造、物性等有关的信息(以下称为“材料信息”)作为输出数据而输出到输入测量数据的用户的用户用终端2。
另外,材料信息取得***100构成为:能够根据评价者操作评价者用终端3而输入到数据解析***1的后述训练用数据组,使数据解析所使用的机器训练模型再训练,该评价者对由数据解析***1解析得到的测量数据的解析结果进行评价。
以下,参照图1,说明构成材料信息取得***100的数据解析***1、用户用终端2以及评价者用终端3的硬件结构。
用户用终端2是用于如下的装置:经由网络,在数据解析***1与利用材料信息取得***100的一个或者多个用户之间进行信息的交换。用户用终端2是例如设置于用户侧的、具备键盘和显示器等的计算机。此外,在存在多个利用材料信息取得***100的用户的情况下,能够针对每个用户设置用户用终端2。
评价者用终端3是用于如下的装置:经由网络,在数据解析***1与评价由数据解析***1解析得到的测量数据的解析结果的评价者之间进行信息的交换。评价者是例如以测量数据的解析为专长的专家人员。评价者用终端3例如是设置于评价者侧的、具备键盘和显示器等的计算机。此外,在本实施方式中,将对用户提供材料信息取得***100的***提供者侧的人员作为评价者,但也可以将用户侧的人员作为评价者。
数据解析***1具备通信部10、运算装置20以及存储装置30。
通信部10是用于如下的通信接口电路:经由网络,将数据解析***1与用户用终端2以及评价者用终端3的各个终端连接,能够在数据解析***1与各终端2、3之间相互进行通信。
运算装置20是执行储存于存储装置30的各种程序的装置,是例如CPU(CentralProcessing Unit,中央处理单元)等。运算装置20通过依照程序执行处理,从而作为测量数据取得部21、数据解析部22(预处理部23、特征量提取处理部24以及特征量解析处理部25)、解析结果发送部26、解析数据储存处理部27、训练用数据组取得部28以及训练部29发挥功能,作为实现预定的功能的功能部(模块)进行动作。在以下的说明中,在以各功能部为主语来说明处理的情况下,表示运算装置20执行实现该功能部的程序。各功能部21~29的详细情况后述。
存储装置30是储存由运算装置20执行的程序以及在执行程序时使用的数据的装置,例如,是存储器、HDD(Hard Disk Drive,硬盘驱动器)、SSD(Solid State Drive,固态硬盘)、RAM(Random Access Memory,随机存取存储器)以及ROM(Read Only Memory,只读存储器)等。储存于存储装置30的各数据库即特征量数据库31、解析结果数据库32以及训练用数据库33的数据的详细情况后述。
接下来,继续参照图1,说明材料信息取得***100的动作。
用户经由用户用终端2将在用户侧取得的材料的测量数据输入到数据解析***1,从而能够经由用户用终端2作为输出而取得由数据解析***1解析得到的、该测量数据的解析结果即材料信息。作为测量数据,能够使用通过用于分析材料的测量而得到的各种数据,例如通过对材料照射X射线或中性子线、电子射线而得到的数据(具体而言,通过X射线衍射(XRD)、X射线吸收微细构造解析(XAFS)、X射线光电子分光(XPS)、X射线吸收分光(XAS)、X射线吸收圆二色性、小角散射(SAS)、中性子衍射(SANS)、中性子反射率、非弹性散射、电子射线衍射等得到的测量数据)、通过显微镜等观察到的材料的图像数据(具体而言,通过X射线显微镜、光学显微镜、电子显微镜、原子力显微镜、计算机断层摄影、透射电子射线成像、扫描电子射线成像等得到的图像数据)等。
在本实施方式中,作为测量数据,由用户输入通过X射线衍射装置分析材料(试样)时的测量数据。
在由用户经由用户用终端2输入了测量数据时,数据解析***1提取该测量数据的特征量,并且根据提取出的特征量进行材料的解析。在本实施方式中,提取衍射峰值位置或强度、结晶相、相分率、峰值宽度等衍射图案,作为通过X射线衍射装置分析得到的材料的测量数据的特征量,根据提取出的衍射图案进行材料的解析(相确定等)。
以下,说明在数据解析***1中实施的具体处理的内容。即,说明通过运算装置20依照程序执行处理而实现的各功能部21~29的内容。
测量数据取得部21取得由用户输入的测量数据,并输出给数据解析部22以及解析数据储存处理部27。
作为数据解析部22的预处理部23、特征量提取处理部24以及特征量解析处理部25分别使用已训练的机器训练模型对测量数据进行处理,将作为解析结果的材料信息输出为最终的输出数据。数据解析部22中使用的机器训练模型没有特别限定,能够使用神经网络、支持向量机、随机森林等各种机器训练模型。
由测量数据取得部21取得的测量数据被输入到预处理部23。预处理部23对输入的测量数据实施例如平滑化(平滑处理)、背景去除等用于减少测量数据的噪声的预处理即用于提高信噪比(signal-noise ratio,信噪比SNR)的预处理,将实施预处理后的测量数据(以下称为“已预处理的测量数据”)输出给特征量提取处理部24以及解析数据储存处理部27。
预处理部23根据输入的测量数据被预先训练以能够进行适当的平滑化以及背景去除。例如,在预处理部23中,在通过核密度估计法对测量数据进行平滑化的情况下,需要根据例如数据数量等将用于平滑化的平滑化参数(带宽)的值设定为适当的值,所以预处理部23根据输入的测量数据被预先训练,以能够设定适当的平滑化参数的值并进行测量数据的平滑化。
已预处理的测量数据被输入到特征量提取处理部24。特征量提取处理部24根据输入的已预处理的测量数据被预先训练以能够提取测量数据的特征量,并将提取出的特征量输出给特征量解析处理部25以及解析数据储存处理部27。在本实施方式中,如上所述,提取衍射峰值位置或强度、结晶相、相分率、峰值宽度等衍射图案,来作为测量数据的特征量。此外,提取的特征量不限于此,也可以根据测量数据,例如,将材料的粒子径分布提取为特征量,或者在测量数据是图像的情况下,将图像中的几何学上的特征提取为特征量。
测量数据的特征量被输入到特征量解析处理部25。特征量解析处理部25根据输入的测量数据的特征量进行材料的解析,将其解析结果输出给解析结果发送部26以及解析数据储存处理部27。在本实施方式中,特征量解析处理部25被预先训练,以能够将作为测量数据的特征量而输入的衍射图案与既知材料的衍射图案进行对照,从既知材料的衍射图案中挑选出类似度高的衍射图案,将根据挑选出的衍射图案确定的材料信息作为解析结果输出给解析结果发送部26及解析数据储存处理部27,其中,上述该既知材料的衍射图案是储存于特征量数据库31的、关于既知材料的特征量的数据。
以往,例如,平滑化参数的值的设定是根据数据数量等通过解析者的直觉、经验等进行的,并且,同样地,测量数据的特征量的提取、基于提取出的特征量的材料解析等也是通过解析者的直觉、经验等进行的。相对于此,在本实施方式中,使用已训练的机器训练模型来处理测量数据。因此,能够避免平滑化参数的设定、测量数据的特征量的提取、基于特征量的材料的解析如以往那样地依赖于解析者。
解析结果发送部26将输入的解析结果即材料信息作为用户输入的测量数据的解析结果,发送给用户用终端2。
解析数据储存处理部27将输入到解析数据储存处理部27的各数据即测量数据、对该测量数据实施预处理得到的已预处理的测量数据、从该测量数据提取出的特征量以及该测量数据的解析结果(材料信息)关联起来,将它们作为解析结果数据组而储存到解析结果数据库32。
评价者通过操作评价者用终端3访问解析结果数据库32,取得解析结果数据组,对输入数据和输出数据的关系性进行分析,决定与从输入数据得到的输出数据的优劣对应的评价得分。然后,评价者操作评价者用终端3,将把输入数据、输出数据以及评价得分关联起来的训练用数据组输入到数据解析***1。
在本实施方式中,评价者参照测量数据和对该测量数据实施预处理得到的已预处理的测量数据,例如,评价是否对测量数据进行了适当的预处理,如作为平滑化参数是否设定了适当的值等,并对已预处理的测量数据赋予与评价结果对应的评价得分。此时,如果对测量数据进行了适当的预处理,则赋予高的评价得分。
另外,评价者参照测量数据(或者已预处理的测量数据)和从该测量数据提取出的特征量,例如,评价是否从测量数据适当地提取出特征量,如是否未将噪声提取为峰值等,对从测量数据提取出的特征量赋予与评价结果对应的评价得分。此时,如果从测量数据适当地提取出特征量,则赋予高的评价得分。
进而,评价者参照从测量数据提取出的特征量和基于该特征量得到的该测量数据的解析结果,例如,评价是否根据从测量数据提取出的特征量适当地进行了解析,如是否从特征量数据库31中适当地挑选出衍射峰值位置及其条数等与作为特征量而输入的衍射图案一致或者类似的类似度高的衍射图案等,并对测量数据的解析结果赋予与评价结果对应的评价得分。此时,如果根据从测量数据提取出的特征量适当地进行了解析,则赋予高的评价得分。
然后,评价者将测量数据、对该测量数据实施预处理的已预处理的测量数据、从该测量数据提取出的特征量、该测量数据的解析结果、对已预处理的测量数据赋予的评价得分、对特征量赋予的评价得分以及对解析结果赋予的评价得分关联起来,作为训练用数据组输入给数据解析***1。
通过训练用数据组取得部28取得这样输入到数据解析***1的训练用数据组,储存到存储装置30的训练用数据库33。即,训练用数据组取得部28取得由评价者输入的训练用数据组,将取得的训练用数据组储存到训练用数据库33。
训练部29根据储存于训练用数据库33的训练用数据组进行数据解析部22的机器训练模型的再训练,使机器训练模型最佳化。例如,训练部29在新储存到训练用数据库33的训练用数据组的数据数量为预定数以上时,进行数据解析部22的机器训练模型的再训练,更新机器训练模型中使用的各函数的系数的值,使机器训练模型最佳化。
在本实施方式中,作为用于训练预处理部23的训练用数据组,训练部29从训练用数据库33取得测量数据、对测量数据实施预处理得到的已预处理的测量数据以及对已预处理的测量数据赋予的评价得分,根据这些,以使输入新的测量数据时的已预处理的测量数据的评价得分最大化的方式,使预处理部23中使用的机器训练模型最佳化。由此,例如,在本实施方式中,用于计算在核密度估计时使用的平滑化参数的值的模型的各种参数被最佳化。
另外,作为用于训练特征量提取处理部24的训练用数据组,训练部29从训练用数据库33取得测量数据(或者已预处理的测量数据)、从测量数据提取出的特征量以及对特征量赋予的评价得分,根据这些,以使输入新的测量数时的特征量的评价得分最大化的方式,使特征量提取处理部24中使用的机器训练模型最佳化。
另外,作为用于训练特征量解析处理部25的训练用数据组,训练部29从训练用数据库33取得从测量数据提取出的特征量、基于特征量得到的测量数据的解析结果以及对解析结果赋予的评价得分,根据这些,以使输入新的特征量时的基于该特征量得到的测量数据的解析结果的评价得分最大化的方式,使特征量解析处理部25中使用的机器训练模型最佳化。
这样,在本实施方式中,由评价者来评价预处理部23、特征量提取处理部24以及特征量解析处理部25的各机器训练模型的性能,其评价结果被输入到数据解析***1。然后,能够利用输入的评价结果,使预处理部23、特征量提取处理部24以及特征量解析处理部25的各机器训练模型再训练。由此,每次通过数据解析***1解析测量数据、并利用其解析结果的评价结果来再训练各机器训练模型,都能够提高各机器训练模型的性能。
图2是示出材料信息取得***100的动作序列的一个例子的图。
在步骤S1中,在用户操作用户用终端2而输入测量数据后,经由网络将测量数据发送给数据解析***1。
在步骤S2中,数据解析***1取得经由通信部10接收的测量数据。
在步骤S3中,数据解析***1解析所取得的测量数据,输出作为解析结果的材料信息。
在步骤S4中,数据解析***1经由通信部10将作为解析结果的材料信息发送到输入测量数据的用户的用户用终端2。
在步骤S5中,数据解析***1将解析结果数据组储存到解析结果数据库32。
在步骤S6中,评价者操作评价者用终端3,经由网络,取得储存于解析结果数据库32的解析结果数据组。
在步骤S7中,评价者根据解析结果数据组评价由数据解析***1解析测量数据得到的解析结果,制作训练用数据组。
在步骤S8中,在评价者操作评价者用终端3而输入了训练用数据组时,将训练用数据组经由网络发送给数据解析***1。
在步骤S9中,数据解析***1取得经由通信部10接收到的训练用数据组,储存到训练用数据库33。
在步骤S10中,数据解析***1根据储存于训练用数据库33的训练用数据组,进行测量数据的解析中使用的机器训练模型的再训练。
以上说明的本实施方式的数据解析***1具备:运算装置20;存储装置30,与运算装置20连接;以及通信部10,与运算装置20连接,能够与外部的终端2、3通信。运算装置20具备:测量数据取得部21,取得经由通信部10接收到的、分析材料而得到的测量数据;数据解析部22,使用已训练的机器训练模型来处理测量数据,输出测量数据的解析结果;解析数据储存处理部27(储存处理部),将包括测量数据和处理测量数据而得到的处理结果的数据组作为解析结果数据组储存到存储装置30;训练用数据组取得部28,取得经由通信部10接收到的训练用数据组,该训练用数据组包括根据解析结果数据组在外部进行的、针对测量数据的处理结果的评价的结果;以及训练部29,根据训练用数据组,使机器训练模型再训练。
这样,本实施方式的数据解析***1使用已训练的机器训练模型来处理测量数据,所以能够避免测量数据的解析结果依赖于解析测量数据的解析者的直觉、经验等而出现偏差。另外,根据训练用数据组进行机器训练模型的再训练,所以进行测量数据的解析并积蓄解析结果数据组,作为其结果,随着而训练用数据组数量的增大,能够提高机器训练模型的性能,从而提高测量数据的解析精度,其中,上述训练用数据组包括根据解析结果数据组而在外部进行的、对测量数据的处理结果的评价的结果。
另外,在本实施方式中,运算装置20还具备解析结果发送部26,该解析结果发送部26将测量数据的解析结果发送到作为测量数据的发送源的外部的用户用终端2。因此,用户只要输入测量数据,就能够作为输出数据取得该测量数据的解析结果。
另外,本实施方式的数据解析部22具备:特征量提取处理部24,根据测量数据被预先训练以提取并输出测量数据的特征量;以及特征量解析处理部25,根据测量数据的特征量被预先训练以输出与特征量对应的测量数据的解析结果。而且,数据解析部22构成为:还具备预处理部23,该预处理部23对由测量数据取得部21取得的测量数据实施用于提高信噪比的处理,并被预先训练以输出已预处理的测量数据,将已预处理的测量数据作为输入数据而输入到特征量提取处理部24。
由此,能够根据提高了信噪比的测量数据即从测量数据中去除噪声后的已预处理的测量数据进行特征量的提取,所以能够进一步提高测量数据的解析精度。
另外,在本实施方式中,解析数据储存处理部27构成为:将测量数据、从预处理部23输出的已预处理的测量数据、从特征量提取处理部24输出的测量数据的特征量以及从特征量解析处理部25输出的测量数据的解析结果作为解析结果数据组储存到存储装置30。而且,在训练用数据组中,作为针对测量数据的处理结果的评价结果,包括根据从预处理部23、特征量提取处理部24以及特征量解析处理部25输出的各输出数据的优劣而数值化并赋予给各输出数据的评价得分,训练部29构成为:根据测量数据、从预处理部23输出的已预处理的测量数据以及对该已预处理的测量数据赋予的评价得分,使预处理部23再训练;根据测量数据、从特征量提取处理部24输出的测量数据的特征量以及对该特征量赋予的评价得分,使特征量提取处理部24再训练;根据测量数据、从特征量解析处理部25输出的测量数据的解析结果以及对该解析结果赋予的评价得分,使特征量解析处理部25再训练。
由此,能够使预处理部23、特征量提取处理部24以及特征量解析处理部25根据各个处理结果而再训练。因此,能够提高各处理部23~25的机器训练模型的性能,提高测量数据的解析精度。
另外,本实施方式的材料信息取得***100具备数据解析***1,并且,作为能够与数据解析***1通信的外部的终端,具备:用户用终端2(第1终端),用于由利用数据解析***的用户对数据解析***1输入测量数据,并且作为输出数据而接受测量数据的解析结果;以及评价者用终端(第2终端),用于从存储装置30取得解析结果数据组,并且将训练用数据组输入到数据解析***1,该训练用数据组包括根据所取得的解析结果数据组进行的、对测量数据的处理结果的评价的评价结果。
由此,用户只要将测量数据输入到用户用终端2,就能够容易地取得作为该测量数据的解析结果的材料信息。另外,根据需要,评价者只要操作评价者用终端3取得解析结果数据组,并将该解析结果的评价结果作为训练用数据组输入数据解析***1,就能够容易地提高数据解析***1的解析性能。
以上,说明了本发明的实施方式,但上述实施方式仅为本发明的应用例的一部分,并非旨在将本发明的技术范围限定于上述实施方式的具体的结构。
例如,在上述实施方式中,数据解析部22具备预处理部23,但在不需要对测量数据进行预处理的情况下,也可以省略预处理部23。此外,在该情况下,解析数据储存处理部27构成为:将测量数据、从特征量提取处理部24输出的测量数据的特征量以及从特征量解析处理部25输出的测量数据的解析结果作为解析结果数据组储存到存储装置30。而且,在训练用数据组中,作为对测量数据的处理结果的评价结果而包括根据从特征量提取处理部24以及特征量解析处理部25输出的各输出数据的优劣而数值化并赋予给各输出数据的评价得分,训练部29构成为:根据测量数据、从特征量提取处理部24输出的测量数据的特征量以及对该特征量赋予的评价得分,使特征量提取处理部24再训练;根据测量数据、从特征量解析处理部25输出的测量数据的解析结果以及对该解析结果赋予的评价得分,使特征量解析处理部25再训练。
另外,在上述实施方式中,评价者是专家人员,但也可以能够通过例如机器训练模型等机器地评价评价自身,并将其评价结果输入到数据解析***1。
Claims (8)
1.一种数据解析***,具备:
运算装置;
存储装置,与所述运算装置连接;以及
通信部,与所述运算装置连接,能够与外部的终端进行通信,
其中,
所述运算装置具备:
测量数据取得部,取得经由所述通信部接收到的、分析材料而得到的测量数据;
数据解析部,使用已训练的机器训练模型来处理所述测量数据,输出所述测量数据的解析结果;
储存处理部,将包括所述测量数据和处理所述测量数据而得到的处理结果的数据组作为解析结果数据组,储存到所述存储装置的解析结果数据库;
训练用数据组取得部,取得经由所述通信部接收到的训练用数据组,该训练用数据组包括根据所述解析结果数据组在外部进行的针对所述测量数据的处理结果的评价结果;以及
训练部,根据所述训练用数据组,使所述机器训练模型再训练。
2.根据权利要求1所述的数据解析***,其中,
所述运算装置还具备解析结果发送部,该解析结果发送部将所述测量数据的解析结果发送到作为所述测量数据的发送源的外部的所述终端。
3.根据权利要求1或者2所述的数据解析***,其中,
所述数据解析部具备:
特征量提取处理部,根据所述测量数据被预先训练以提取并输出所述测量数据的特征量;以及
特征量解析处理部,根据所述测量数据的特征量被预先训练以输出与特征量对应的所述测量数据的解析结果。
4.根据权利要求3所述的数据解析***,其中,
所述数据解析部还具备预处理部,该预处理部对由所述测量数据取得部取得的所述测量数据实施用于提高信噪比的处理,并被预先训练以输出已预处理的测量数据,
将所述已预处理的测量数据作为输入数据输入到所述特征量提取处理部。
5.根据权利要求3所述的数据解析***,其中,
所述储存处理部
将所述测量数据、从所述特征量提取处理部输出的所述测量数据的特征量以及从所述特征量解析处理部输出的所述测量数据的解析结果作为所述解析结果数据组,储存到所述解析结果数据库,
在所述训练用数据组中,作为针对所述测量数据的处理结果的评价结果,包括根据从所述特征量提取处理部以及所述特征量解析处理部输出的各输出数据的优劣而数值化并赋予给各输出数据的评价得分,
所述训练部
根据所述测量数据、从所述特征量提取处理部输出的所述测量数据的特征量以及对该特征量赋予的评价得分,使所述特征量提取处理部再训练,
根据所述测量数据、从所述特征量解析处理部输出的所述测量数据的解析结果以及对该解析结果赋予的评价得分,使所述特征量解析处理部再训练。
6.根据权利要求4所述的数据解析***,其中,
所述储存处理部
将所述测量数据、从所述预处理部输出的已预处理的测量数据、从所述特征量提取处理部输出的所述测量数据的特征量以及从所述特征量解析处理部输出的所述测量数据的解析结果作为所述解析结果数据组,储存到所述解析结果数据库,
在所述训练用数据组中,作为针对所述测量数据的处理结果的评价结果,包括根据从所述预处理部、所述特征量提取处理部以及所述特征量解析处理部输出的各输出数据的优劣而数值化并赋予给各输出数据的评价得分,
所述训练部
根据所述测量数据、从所述预处理部输出的所述已预处理的测量数据以及对该已预处理的测量数据赋予的评价得分,使所述预处理再训练,
根据所述测量数据、从所述特征量提取处理部输出的所述测量数据的特征量以及对该特征量赋予的评价得分,使所述特征量提取处理部再训练,
根据所述测量数据、从所述特征量解析处理部输出的所述测量数据的解析结果以及对该解析结果赋予的评价得分,使所述特征量解析处理部再训练。
7.一种材料信息取得***,具备权利要求1至6中的任意一项所述的数据解析***,其中,
所述材料信息取得***作为外部的所述终端具备:
第1终端,用于由利用所述数据解析***的用户对所述数据解析***输入所述测量数据,并且作为输出数据而接受所述测量数据的解析结果;以及
第2终端,用于从所述解析结果数据库取得所述解析结果数据组,并且将包括评价结果的所述训练用数据组输入到所述数据解析***,该评价结果是根据所取得的所述解析结果数据组进行的针对所述测量数据的处理结果的评价结果。
8.一种数据解析方法,由数据解析***执行,该数据解析***具备:
运算装置;
存储装置,与所述运算装置连接;以及
通信部,与所述运算装置连接,能够与外部的终端进行通信,
其中,所述数据解析方法具备:
测量数据取得工序,取得经由所述通信部接收到的、分析材料而得到的测量数据;
数据解析工序,使用已训练的机器训练模型来处理所述测量数据,输出所述测量数据的解析结果;
储存处理工序,将包括所述测量数据和处理所述测量数据而得到的处理结果的数据组作为解析结果数据组,储存到所述存储装置的解析结果数据库;
训练用数据组取得工序,取得经由所述通信部接收到的训练用数据组,该训练用数据组包括根据所述解析结果数据组在外部进行的针对所述测量数据的处理结果的评价结果;以及
训练工序,根据所述训练用数据组,使所述机器训练模型再训练。
Applications Claiming Priority (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2019223756A JP7188373B2 (ja) | 2019-12-11 | 2019-12-11 | データ解析システム及びデータ解析方法 |
JP2019-223756 | 2019-12-11 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN112951342A true CN112951342A (zh) | 2021-06-11 |
CN112951342B CN112951342B (zh) | 2024-04-16 |
Family
ID=73037707
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202011386666.7A Active CN112951342B (zh) | 2019-12-11 | 2020-12-02 | 数据解析***以及数据解析方法 |
Country Status (4)
Country | Link |
---|---|
US (1) | US20210182734A1 (zh) |
EP (1) | EP3835766B1 (zh) |
JP (1) | JP7188373B2 (zh) |
CN (1) | CN112951342B (zh) |
Families Citing this family (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US11703468B2 (en) * | 2021-07-01 | 2023-07-18 | Fei Company | Method and system for determining sample composition from spectral data |
CN113936183A (zh) * | 2021-09-10 | 2022-01-14 | 南方电网深圳数字电网研究院有限公司 | 基于模型训练的数据预测方法及装置 |
CN116010507B (zh) * | 2023-03-24 | 2023-06-23 | 厚普环保科技(苏州)有限公司 | 一种基于大数据的水污染监测方法及*** |
Citations (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101221415A (zh) * | 2007-01-10 | 2008-07-16 | 株式会社日立制作所 | 设备控制装置 |
CN106127506A (zh) * | 2016-06-13 | 2016-11-16 | 浙江大学 | 一种基于主动学习解决商品冷启动问题的推荐方法 |
CN109376061A (zh) * | 2018-09-03 | 2019-02-22 | 杭州东方通信软件技术有限公司 | 一种信息处理方法及*** |
CN109766930A (zh) * | 2018-12-24 | 2019-05-17 | 太原理工大学 | 一种基于dcnn模型的矿井机械设备的剩余寿命预测方法 |
CN109801256A (zh) * | 2018-12-15 | 2019-05-24 | 华南理工大学 | 一种基于感兴趣区域和全局特征的图像美学质量评估方法 |
CN110113638A (zh) * | 2019-05-10 | 2019-08-09 | 北京奇艺世纪科技有限公司 | 一种预测方法、装置及电子设备 |
CN110188331A (zh) * | 2019-06-03 | 2019-08-30 | 腾讯科技(深圳)有限公司 | 模型训练方法、对话***评价方法、装置、设备及存储介质 |
Family Cites Families (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US6118850A (en) * | 1997-02-28 | 2000-09-12 | Rutgers, The State University | Analysis methods for energy dispersive X-ray diffraction patterns |
JP3593478B2 (ja) | 1999-10-20 | 2004-11-24 | 株式会社リガク | X線回折法におけるx線強度の較正方法 |
KR100979071B1 (ko) * | 2002-02-22 | 2010-08-31 | 에이저 시스템즈 인크 | 이중 배향 다결정성 재료의 화학 기계적 연마 |
JPWO2018025618A1 (ja) | 2016-07-30 | 2019-09-19 | 株式会社リガク | 物質構造の探索方法とそれに用いるx線構造解析システム |
JP6489529B2 (ja) * | 2016-08-31 | 2019-03-27 | 株式会社日産アーク | 構造複合体の状態推定方法及びシステム |
US20180307979A1 (en) * | 2017-04-19 | 2018-10-25 | David Lee Selinger | Distributed deep learning using a distributed deep neural network |
EP3623793B1 (en) | 2017-05-07 | 2022-09-07 | Aipore Inc. | Identification classification analysis method and classification analysis device |
US10551297B2 (en) | 2017-09-22 | 2020-02-04 | Saudi Arabian Oil Company | Thermography image processing with neural networks to identify corrosion under insulation (CUI) |
WO2020075782A1 (ja) * | 2018-10-09 | 2020-04-16 | 株式会社スカイマティクス | 診断支援システム及びその方法 |
-
2019
- 2019-12-11 JP JP2019223756A patent/JP7188373B2/ja active Active
-
2020
- 2020-10-21 EP EP20203000.3A patent/EP3835766B1/en active Active
- 2020-10-29 US US17/084,096 patent/US20210182734A1/en active Pending
- 2020-12-02 CN CN202011386666.7A patent/CN112951342B/zh active Active
Patent Citations (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101221415A (zh) * | 2007-01-10 | 2008-07-16 | 株式会社日立制作所 | 设备控制装置 |
CN106127506A (zh) * | 2016-06-13 | 2016-11-16 | 浙江大学 | 一种基于主动学习解决商品冷启动问题的推荐方法 |
CN109376061A (zh) * | 2018-09-03 | 2019-02-22 | 杭州东方通信软件技术有限公司 | 一种信息处理方法及*** |
CN109801256A (zh) * | 2018-12-15 | 2019-05-24 | 华南理工大学 | 一种基于感兴趣区域和全局特征的图像美学质量评估方法 |
CN109766930A (zh) * | 2018-12-24 | 2019-05-17 | 太原理工大学 | 一种基于dcnn模型的矿井机械设备的剩余寿命预测方法 |
CN110113638A (zh) * | 2019-05-10 | 2019-08-09 | 北京奇艺世纪科技有限公司 | 一种预测方法、装置及电子设备 |
CN110188331A (zh) * | 2019-06-03 | 2019-08-30 | 腾讯科技(深圳)有限公司 | 模型训练方法、对话***评价方法、装置、设备及存储介质 |
Also Published As
Publication number | Publication date |
---|---|
US20210182734A1 (en) | 2021-06-17 |
EP3835766A1 (en) | 2021-06-16 |
JP2021092467A (ja) | 2021-06-17 |
JP7188373B2 (ja) | 2022-12-13 |
CN112951342B (zh) | 2024-04-16 |
EP3835766B1 (en) | 2024-05-01 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN112951342B (zh) | 数据解析***以及数据解析方法 | |
US10867384B2 (en) | System and method for automatically detecting a target object from a 3D image | |
Gurbani et al. | A convolutional neural network to filter artifacts in spectroscopic MRI | |
Zhang et al. | Classification of Alzheimer disease based on structural magnetic resonance imaging by kernel support vector machine decision tree | |
Shao et al. | Visible/near-infrared spectra for linear and nonlinear calibrations: a case to predict soluble solids contents and pH value in peach | |
Li et al. | Peak alignment of gas chromatography–mass spectrometry data with deep learning | |
CN115326783B (zh) | 拉曼光谱预处理模型生成方法、***、终端及存储介质 | |
Tillmann et al. | Cardinality minimization, constraints, and regularization: a survey | |
Beleites et al. | Assessing and improving the stability of chemometric models in small sample size situations | |
EP3817648A1 (en) | Method for diagnosing, predicting, determining prognosis, monitoring, or staging disease based on vascularization patterns | |
JP2016075624A (ja) | 検量線作成方法及び装置、目的成分検量方法及び装置、並びに、電子機器 | |
Ponomarev et al. | Digital technologies in non-destructive testing | |
Własiuk et al. | A likelihood ratio model for the determination of the geographical origin of olive oil | |
Rahimi et al. | iPick: Multiprocessing software for integrated NMR signal detection and validation | |
CN110648763A (zh) | 利用人工智能进行光谱分析以进行肿瘤评估的方法及设备 | |
Giguere et al. | A fully customized baseline removal framework for spectroscopic applications | |
CN116858789A (zh) | 食品安全检测***及其方法 | |
US11768265B2 (en) | Harmonizing diffusion tensor images using machine learning | |
CN111383217A (zh) | 大脑成瘾性状评估的可视化方法、装置及介质 | |
Lékó et al. | Uncertainty based adaptive projection selection strategy for binary tomographic reconstruction | |
Tetef et al. | Accelerating nano-XANES imaging via feature selection | |
Dihin et al. | Wavelet-Attention Swin for Automatic Diabetic Retinopathy Classification | |
Giguere et al. | An optimization perspective on baseline removal for spectroscopy | |
D'Isanto | Probabilistic photometric redshift estimation in massive digital sky surveys via machine learning | |
Рахимов et al. | Data preprocessing techniques in machine learning |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |