WO2019150573A1 - データ解析装置 - Google Patents

データ解析装置 Download PDF

Info

Publication number
WO2019150573A1
WO2019150573A1 PCT/JP2018/003757 JP2018003757W WO2019150573A1 WO 2019150573 A1 WO2019150573 A1 WO 2019150573A1 JP 2018003757 W JP2018003757 W JP 2018003757W WO 2019150573 A1 WO2019150573 A1 WO 2019150573A1
Authority
WO
WIPO (PCT)
Prior art keywords
data
analysis
processing unit
statistical analysis
samples
Prior art date
Application number
PCT/JP2018/003757
Other languages
English (en)
French (fr)
Inventor
真一 山口
Original Assignee
株式会社島津製作所
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 株式会社島津製作所 filed Critical 株式会社島津製作所
Priority to JP2019568538A priority Critical patent/JP6908136B2/ja
Priority to PCT/JP2018/003757 priority patent/WO2019150573A1/ja
Publication of WO2019150573A1 publication Critical patent/WO2019150573A1/ja

Links

Images

Classifications

    • GPHYSICS
    • G01MEASURING; TESTING
    • G01NINVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
    • G01N27/00Investigating or analysing materials by the use of electric, electrochemical, or magnetic means
    • G01N27/62Investigating or analysing materials by the use of electric, electrochemical, or magnetic means by investigating the ionisation of gases, e.g. aerosols; by investigating electric discharges, e.g. emission of cathode

Definitions

  • the present invention relates to a data analysis apparatus that analyzes data obtained by performing measurement or observation on a sample or a subject, and in particular, based on measurement data on a large number of samples obtained under various conditions. To extract useful information about these samples, or to extract useful information about the same sample based on multiple multidimensional measurement data obtained by different measurement and observation methods
  • the present invention relates to a suitable data analysis apparatus.
  • multivariate analysis which is one of statistical analysis methods, has been actively used to analyze data obtained by various analyzers such as mass spectrometers, chromatographs, and optical analyzers.
  • analyzers such as mass spectrometers, chromatographs, and optical analyzers.
  • multivariate analysis is very useful in finding differences between samples based on a vast amount of data obtained by analyzing different samples, and in finding factors related to such differences. It is a technique. An example of using multivariate analysis for analyzing data obtained by an analyzer will be briefly described.
  • mass spectrometers capable of performing mass spectrometry for each of a large number of measurement points in a two-dimensional measurement region on a sample such as a biological tissue section are known.
  • This type of mass spectrometer is called an imaging mass spectrometer, and the specific mass-to-charge ratio (m / z) on the same sample surface is measured while observing the fine form of the sample surface with an attached optical microscope. It is possible to acquire a mass spectrometry imaging image showing a two-dimensional intensity distribution of ions having the same.
  • the conventional analysis as described above is an analysis for only one sample, but if the analysis results for a large number of samples can be appropriately combined, the cause of a specific disease such as cancer can be investigated and more accurately determined. It is possible to obtain very useful information for research on simple diagnosis. For example, from the analysis results of a large number of samples with various degrees of progression of cancer, a compound that specifically expresses in the initial stage of the cancer rather than after it progresses, or a compound that reflects the degree of therapeutic effect There is a possibility that you can find. However, there has been no method that can easily realize data analysis for such a purpose.
  • the present invention has been made to solve these problems, and one of its main purposes is to perform analysis processing for comparing and associating a plurality of data obtained by different types of measurement and observation. Thus, it is to provide a data analysis apparatus that can acquire useful information that cannot be obtained by a conventional analysis method.
  • the data analysis apparatus which has been made to solve the above problems, aggregates data obtained for each predetermined parameter value by executing predetermined measurements on a plurality of samples, respectively.
  • the plurality of the plurality of samples are analyzed by an analysis process based on a first data group and a second data group obtained by collecting data obtained by executing measurement by a method different from the predetermined measurement for each of the plurality of samples.
  • a data analysis device that obtains information on general samples of a) Perform a predetermined statistical analysis process with the first data group as the explanatory variable and the second data group as the explained variable (object variable), and show the similarity or difference of the data in both data groups
  • a first statistical analysis processing unit for calculating a plurality of index values
  • a second statistical analysis processing unit that calculates a plurality of index values indicating similarity or difference between the index value and the other information
  • a display processing unit for creating and displaying a graph indicating the relationship between It is characterized by having.
  • the first data group is a mass using the mass-to-charge ratio as the predetermined parameter at each of a plurality of measurement points in a two-dimensional measurement region obtained by performing imaging mass spectrometry for each of a plurality of samples.
  • the second data group is image data indicating a predetermined signal intensity distribution in a two-dimensional measurement region obtained by a measurement method different from imaging mass spectrometry for each of a plurality of samples.
  • the first statistical analysis processing unit for each sample, resembles one or a plurality of images based on the second data group and a signal intensity distribution image at each mass-to-charge ratio based on the first data group.
  • the index value indicating the sex or the difference can be calculated.
  • the above “measurement methods different from imaging mass spectrometry” include Raman spectroscopic measurement, fluorescence measurement, and measurement of emission intensity of electromagnetic waves of various wavelengths (terahertz, far and near infrared, visible, ultraviolet, X-ray, etc.) And various measurements such as absorption measurement, PET (Positron Emission Tomography) measurement, MRI (Magnetic Resonance Imaging) measurement, ESR (Electron Spin Resonance) measurement, CT (Computed Tomography) measurement, surface analysis by EPMA (Electron Probe Probe MicroAnalyser) Either analysis or observation with an electron microscope or an optical microscope can be used.
  • the second data group includes image data obtained by the optical measurement method as described above, it may be image data constituting different images at each of a plurality of wavelengths, or one specific wavelength. May be image data constituting one image.
  • the first statistical analysis is performed. For each sample, the processing unit calculates an index value indicating the similarity or difference between the pixel value data and image in the sample and the distribution image indicating the distribution of the signal intensity of each mass-to-charge ratio.
  • the predetermined statistical analysis processing by the first statistical analysis processing unit may be, for example, partial least square regression (PLS regression) analysis.
  • a regression coefficient can be obtained for each mass-to-charge ratio as the index value. If a regression coefficient for each mass-to-charge ratio obtained for one sample is a coefficient matrix, a plurality of coefficient matrices are obtained for a plurality of samples.
  • the second statistical analysis processing unit further uses the plurality of coefficient matrices as explanatory variables, and other information respectively related to the plurality of samples as predetermined variables. Perform statistical analysis processing.
  • the “other information related to each of the plurality of samples” can be any information as long as it can be quantified, regardless of the content, depending on the purpose of the analysis.
  • the predetermined statistical analysis processing by the second statistical analysis processing unit may be the same method as the statistical analysis processing by the first statistical analysis processing unit, or may be a different method. Specifically, for example, partial least square regression (PLS regression) analysis or principal component regression analysis may be used.
  • the second By performing the PLS regression analysis in the statistical analysis processing unit, a regression coefficient indicating the similarity between the regression coefficient for each sample obtained in the first statistical analysis processing unit and the degree of progression of the disease can be obtained.
  • the regression coefficient indicates the relationship between the mass-to-charge ratio showing a distribution similar to the specific distribution appearing in the optical microscopic image, that is, the compound and the degree of progression of the disease.
  • the display processing unit creates a graph of an appropriate format indicating the relevance and displays it on the screen of the display unit. Thereby, for example, the user can easily and visually confirm whether or not a specific compound showing a distribution similar to the specific distribution appearing in the optical microscopic image is related to the degree of progression of the disease. .
  • the first stage statistical analysis process is executed for the second data group in which the data obtained by executing the measurement by the different method for each of the samples, and the same plurality of samples as the result are executed.
  • a second-stage statistical analysis process was performed on the third data, which is other relevant information.
  • the second-stage statistical analysis processing may be performed in order to make the results obtained by the first-stage statistical analysis processing easier to understand or to express more globally.
  • the data analysis apparatus includes a first data group in which data obtained for each predetermined parameter value is aggregated by executing predetermined measurements on a plurality of samples, A second data group in which data obtained by executing measurement by a method different from the predetermined measurement for a plurality of samples or data that is other information related to each of the plurality of samples is aggregated; A data analysis apparatus for obtaining information on the plurality of samples in general by an analysis process based on: a) Perform a predetermined statistical analysis process with the first data group as the explanatory variable and the second data group as the explained variable (object variable), and show the similarity or difference of the data in both data groups A first statistical analysis processing unit for calculating a plurality of index values; b) a second statistical analysis processing unit that performs a predetermined statistical analysis process for aggregating the plurality of index values calculated by the first statistical analysis processing unit into lower-dimensional information; c) a display processing unit for creating and displaying a graph showing a relationship between the second data
  • the predetermined statistical analysis processing by the first statistical analysis processing unit is, for example, partial least square regression analysis and Good.
  • the predetermined statistical analysis processing by the second statistical analysis processing unit can use principal component analysis, factor analysis, cluster analysis, and the like.
  • the sample is a biological sample
  • the first data group is the mass spectrum data obtained for each of the plurality of samples
  • the second data group is the sample. It is assumed that the information indicates each state.
  • each regression coefficient is calculated as an index value indicating the degree of strength of the relationship between the mass-to-charge ratio value and the state of each sample. can do.
  • the principal component analysis is performed on the plurality of regression coefficients obtained in this way, and when the display processing unit creates a score plot or a loading plot based on the result, the relationship between the state for each sample and the mass-to-charge ratio value is overlooked. To be able to observe.
  • useful information that cannot be obtained by a conventional analysis method is obtained by comparing or associating a plurality of data obtained by different types of measurement or observation. can do. Specifically, for example, finding a compound that is specifically expressed at an early stage after a specific disease such as cancer has progressed, or finding a compound that reflects the degree of treatment effect on such disease. May be possible.
  • FIG. 1 is a schematic configuration diagram of the imaging mass spectrometry system of this embodiment.
  • This system includes a measurement unit 1 including an optical microscope observation unit 11 and an imaging mass analysis unit 12, a data analysis unit 2, an input unit 3, and a display unit 4.
  • the optical microscopic observation unit 11 acquires an optical microscopic observation image of a measurement region on the sample.
  • the imaging mass analyzer 12 performs mass analysis over a predetermined mass-to-charge ratio range for each minute region (measurement point) obtained by finely dividing the measurement region on the same sample, and collects mass spectrum data respectively. It is.
  • the data analysis unit 2 includes a data input unit 21 that receives optical microscopic image data acquired by the optical microscopic observation unit 11 and mass spectrum data acquired by the imaging mass analysis unit 12, and a data storage unit that stores the received data. 22, a calculation data preprocessing unit 23, a first multivariate analysis processing unit 24, a second multivariate analysis processing unit 25, and an analysis result display processing unit 26 are provided as functional blocks.
  • the substance of the data analysis unit 2 is a personal computer or a workstation that is a higher performance computer, and the functions of each unit are realized by executing dedicated analysis software installed in the computer on the computer. Can be.
  • FIG. 2 is a conceptual diagram of characteristic data analysis processing in the imaging mass spectrometry system of the present embodiment
  • FIG. 3 is a flowchart showing the procedure of the data analysis processing.
  • sections cut from the same living tissue (for example, liver) of a large number of subjects (for example, mice) are used as samples.
  • the multiple samples are sections of substantially the same part of the same living tissue of different subjects.
  • the subject has developed cancer, the degree of progression (severity) of the cancer is various, and the severity is assumed to be numerical in advance and known for each sample.
  • the mass spectrometry data of the many measurement points in the measurement region (this is referred to as MS imaging data) is acquired by the imaging mass analysis unit 12.
  • a sample that can be regarded as the same as each of the above samples (a sample that is a continuous slice in the same subject and the same biological tissue) is fluorescently labeled for a specific protein, and then photographed by the optical microscope observation unit 11.
  • the data input unit 21 summarizes the MS imaging data and the fluorescence image data for the sample that can be regarded as the same acquired in this way, and further adds information indicating the severity of cancer of the sample, and specifically, It is stored in the data storage unit 22 as a data file. Therefore, the data storage unit 22 stores the same number of data files as the number of samples (two samples that can be regarded as being the same).
  • analysis processing is performed as follows in a state where the MS imaging data and fluorescence image data for a plurality of samples are stored in the data storage unit 22.
  • the calculation data preprocessing unit 23 in the data analysis unit 2 receives MS imaging data and fluorescent image data for one sample to be processed from the data storage unit 22. Read (step S1). As described above, when these data are stored in one data file, the data file may be read out.
  • the calculation data preprocessing unit 23 converts the data of each pixel of the fluorescent image into simple pixel value data according to preset conditions. For example, in a fluorescent image using hematoxylin / eosin (HE) or the like, the intensity value of the fluorescent color is converted into data as a pixel value. In addition, the calculation data preprocessing unit 23 adjusts the resolution to match the position adjustment processing for correcting the size, orientation, distortion, and the like of the same object image on the fluorescence microscopic image and the MS imaging image as necessary. Processing is executed (step S2).
  • HE hematoxylin / eosin
  • the MS imaging image is enlarged / reduced, rotated, and further deformed according to a predetermined algorithm with reference to the microscopic image, so that the positional relationship on the sample in both images is determined. Match roughly.
  • a technique described in Patent Document 1 can be used.
  • the imaging resolution (positional resolution) in the optical microscopic observation unit 11 is usually determined by the resolution of the imaging camera, whereas the resolution of the MS imaging image depends on the spot diameter of the laser light irradiated on the sample for ionization. Determined. Therefore, the resolution of the MS imaging image is often lower than the resolution of the optical image. Therefore, in order to perform multivariate analysis of the images, which will be described later, a resolution adjustment process for aligning the resolution of both images is performed.
  • a simple method for aligning the resolution is to reduce the resolution of the image with the higher resolution to match the image with a low resolution. For example, a binning process is useful as such a method.
  • the resolution of the lower resolution image may be increased to match the high resolution image.
  • upsampling processing is performed on a low-resolution image and the number of pixels is apparently added, and then interpolation processing using a plurality of pixel values adjacent to or close to a certain pixel is performed by upsampling. What is necessary is just to calculate and fill the pixel value of the newly inserted pixel.
  • the first multivariate analysis processing unit 24 creates the two-dimensional matrix created based on the MS imaging data for one sample based on the explanatory variable (X) and the pixel value data of the fluorescence image. PLS regression analysis is executed with the dimensional matrix as the explained variable (Y).
  • the two-dimensional matrix is a matrix having a mass-to-charge ratio value in one direction, a measurement point (pixel) position in another direction orthogonal to the one direction, and a signal intensity value as an element.
  • Bpis is a regression coefficient.
  • the regression coefficient is obtained for each mass-to-charge ratio, and the absolute value of the regression coefficient Bpls is obtained in the pattern of the fluorescence image, that is, the mass-to-charge ratio that is similar to the spatial distribution of the protein or a mass-to-charge ratio that is inverted from the distribution. growing.
  • This regression coefficient is a one-dimensional matrix (step S3).
  • the data analysis unit 2 determines whether or not data processing has been performed on all the samples to be processed (step S4), and if there is an unprocessed sample, the process returns from step S4 to S1. Therefore, by repeating the processing of steps S1 to S4, a regression coefficient matrix based on the data for all the samples designated as the processing target is obtained.
  • the number of regression coefficient matrices is the same as the total number of samples.
  • the value of one regression coefficient in this regression coefficient matrix is the distribution of ionic strength at the corresponding mass-to-charge ratio (that is, the distribution of compounds corresponding to that mass-to-charge ratio) and the distribution of fluorescently labeled compounds in the fluorescence image. Shows the similarity. Therefore, when it is desired to examine a compound showing a distribution similar to the distribution of the fluorescently labeled compound in one sample, the processing up to this point is sufficient.
  • the second multivariate analysis processing unit 25 uses the regression coefficient matrix that is the same as the number of samples as an explanatory variable (X), and the accompanying parameters for each sample.
  • PLS regression analysis is performed using information indicating the severity of cancer given as typical information as an explained variable (Y).
  • the severity of cancer is an index value representing the degree of cancer severity at a certain time. Since severity information is given for each sample, the matrix of severity is a one-dimensional matrix having the same number of elements as the number of samples.
  • a regression coefficient matrix that is a one-dimensional matrix having the same number of elements as the number of samples is obtained (step S5).
  • the regression coefficient in this regression coefficient matrix indicates the degree of relationship between the severity and the compound similar to the distribution of the fluorescence image. That is, it is estimated that the compound corresponding to the mass-to-charge ratio in which the absolute value of the regression coefficient at this time is large is strongly related to the degree of cancer severity.
  • the analysis result display processing unit 26 creates an appropriate graph determined in advance based on the regression coefficient matrix obtained in step S5, and displays it on the screen of the display unit 4 (steps S6 and S7).
  • a mass spectrum-like graph with the horizontal axis representing the mass-to-charge ratio and the vertical axis representing the coefficient value (with positive and negative polarity) based on the regression coefficient matrix obtained in step S5 may be created. .
  • the fluorescent image is converted into simple pixel value data.
  • the same processing can be performed even if the fluorescent image is a color image or an image including a plurality of wavelength components. In this case, there is not one fluorescent image for one sample, but there are fluorescent images corresponding to the number of wavelengths.
  • Y explained variable
  • step S3 there is only one explained variable (Y) in the PLS regression analysis in step S3 (one one-dimensional matrix), but when there are a plurality of fluorescent images, step S3 There are a plurality of explained variables (Y) in the PLS regression analysis. Therefore, the PLS regression analysis at this time may use the PLS2 algorithm.
  • the regression coefficient obtained at this time is a coefficient of each mass-to-charge ratio at each wavelength as shown in FIG. 4A, that is, a two-dimensional tabular form. Therefore, as shown in FIG. 4B, this is rearranged into a one-dimensional array in which the mass-to-charge ratio and the wavelength are combined, and in step S5, the coefficient matrix of the one-dimensional array prepared for the number of samples is used as the explanatory variable.
  • the regression coefficient matrix thus obtained is a matrix of coefficients for a set of mass-to-charge ratio and wavelength.
  • an image obtained by another measurement technique that visualizes the distribution of a specific compound in the sample may be used.
  • data indicating the degree of absorption of electromagnetic waves such as light having a specific wavelength and X-rays and distribution of radiation intensity
  • data indicating intensity distribution such as Raman scattered light and fluorescence
  • stained image data PET (positron emission tomography)
  • CT Computerized Tomography
  • MRI Nuclear Magnetic Resonance Image
  • ESR Electro Spin Resonance
  • image data using radioisotope labeling EPMA, SPM (Scanning Probe Microscope), etc.
  • the surface unevenness image data obtained in step 1 can be used as two-dimensional image data.
  • FIG. 5 shows a schematic configuration diagram of a mass spectrometry system according to this embodiment.
  • the system includes an imaging mass analysis unit 100, a data analysis unit 200, an input unit 300, and a display unit 400.
  • the data analysis unit 200 receives a mass spectrum data obtained by the imaging mass analysis unit 100.
  • 201, a data storage unit 202 that stores received data, an average mass spectrum calculation unit 203, a first multivariate analysis processing unit 204, a second multivariate analysis processing unit 205, and an analysis result display processing unit 206 Are provided as functional blocks.
  • FIG. 6 is a conceptual diagram of characteristic data analysis processing in the mass spectrometry system of the present embodiment.
  • NASH Non Alcoholic SteatoHepatitis
  • mass spectrometry is performed by the imaging mass spectrometer 100, and mass spectrum data is acquired for each measurement point.
  • an average mass spectrum calculation unit 203 calculates an average mass spectrum by calculating an average of mass spectrum data at all measurement points for each sample. Thereby, the same number of average mass spectra as the number of samples is obtained. Data constituting the average mass spectrum obtained in this way is used as an explanatory variable (X) for PLS regression analysis.
  • Y1 (1,2,3): Compound amount increases or decreases in proportion to severity
  • Y2 (1,2,1): Compound amount increases or decreases temporarily during the feeding period
  • Y3 (1 , 0, 0): compound is present only at the beginning of the feeding period, or no compound is present only at the beginning of the feeding period
  • Y4 (0, 1, 0): the compound is present only during the feeding period, or No compound is present only during the feeding period
  • Y5 (0,0,1): The compound is present only at the end of the feeding period, or no compound is present only at the end of the feeding period
  • the second multivariate analysis processing unit 205 performs principal component analysis on the regression coefficient matrix for all the characteristic values.
  • score plots and loading plots can be obtained as analysis results by performing principal component analysis.
  • the characteristic values Y1 to Y5 are positioned on a graph having two principal components (usually the first principal component and the second principal component) as orthogonal axes.
  • each mass-to-charge ratio value is positioned on a graph having the two principal components as orthogonal axes.
  • the analysis result display processing unit 206 creates such a graph and displays it on the screen of the display unit 400. Thereby, the user can grasp

Landscapes

  • Chemical & Material Sciences (AREA)
  • Chemical Kinetics & Catalysis (AREA)
  • Electrochemistry (AREA)
  • Physics & Mathematics (AREA)
  • Health & Medical Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Analytical Chemistry (AREA)
  • Biochemistry (AREA)
  • General Health & Medical Sciences (AREA)
  • General Physics & Mathematics (AREA)
  • Immunology (AREA)
  • Pathology (AREA)
  • Other Investigation Or Analysis Of Materials By Electrical Means (AREA)

Abstract

第1多変量解析処理部(24)は、一つの試料毎に、測定領域内の複数の測定点それぞれについて得られたマススペクトルデータを説明変数、特定の化合物を蛍光標識して撮影した蛍光画像において各測定点に対応する画素の画素値を被説明変数、とする一段階目のPLS回帰分析を実行し、回帰係数行列を求める。第2多変量解析処理部(25)は、複数の試料について得られた複数の1次元回帰係数行列を集約して説明変数とし、各試料の状態を示す情報として各試料の癌の重症度を示す情報を被説明変数とした二段階目のPLS回帰分析を実行し、再び回帰係数行列を求める。これにより、蛍光画像上の特定の化合物に類似した分布を示す化合物の中で癌の重症度に応じた量の変化を示す化合物等、従来手法では得られにくい新たな情報を取得することができる。

Description

データ解析装置
 本発明は、試料や被検体に対し測定や観察を行うことで得られたデータを解析するデータ解析装置に関し、特に、様々な条件の下で得られた多数の試料についての測定データに基づいてそれら試料についての有用な情報を引き出したり、同じ試料に対して異なる測定手法や観察手法で得られた複数の多次元的な測定データに基づいて該試料についての有用な情報を引き出したりするのに好適なデータ解析装置に関する。
 近年、質量分析装置、クロマトグラフ装置、光学分析装置といった様々な分析装置で得られたデータの解析に、統計的解析手法の一つである多変量解析が盛んに利用されるようになってきている。例えば異なる複数の試料についてそれぞれ分析を行うことで得られた膨大なデータに基づいて試料間の相違を見つけたり、そうした相違に関連する要因を見つけたりする際に、多変量解析は非常に有用な手法である。
 分析装置で得られるデータの解析に多変量解析を用いた一例を簡単に説明する。
 近年、生体組織切片などの試料上の2次元的な測定領域内の多数の測定点それぞれについて質量分析を実行することが可能な質量分析装置が知られている。この種の質量分析装置はイメージング質量分析装置と呼ばれており、付設された光学顕微鏡によって試料の表面の微細な形態を観察しながら、同じ試料表面における特定の質量電荷比(m/z)を有するイオンの2次元的な強度分布を示す質量分析イメージング画像を取得することが可能である。
 特許文献1に記載のイメージング質量分析装置では、光学顕微鏡で得られた顕微画像を分析者が確認して着目する部位(関心領域)を特徴付ける色を指定すると、顕微画像においてその色を示す部位の分布に類似したイオン強度分布を示す質量電荷比が相関分析や回帰分析によって抽出される。それにより、質量電荷比に基づく化合物の特定が可能であれば、試料上で分析者が着目する部位と類似した分布を示す化合物を特定することができる。
 もちろん、顕微画像で観測される分布と類似した分布を示す質量分析イメージング画像だけでなく、イオン強度分布が互いに類似している複数の質量電荷比も比較的容易に見つけることができる。これにより、同じ動態を示す複数の化合物を見いだしたり、同じ化合物に由来する複数の部分構造を見つけて化合物の構造を推定したりすることもできる。
国際公開第2017/002226号パンフレット 国際公開第2016/092608号パンフレット
 上記のような従来の解析は一つの試料についてのみの解析であるが、多数の試料についての解析結果を適切に結び付けることが可能であれば、癌などの特定の疾病の原因の究明やより的確な診断の研究などに非常に有用な情報が得られる可能性がある。例えば、癌の進行度合いが様々である多数の試料についての分析結果から、癌が進行したあとでなくその初期段階で特異的に発現する化合物を見つけたり、或いは治療の効果の程度を反映した化合物を見つけたりすることができる可能性がある。しかしながら、こうしたことを目的としたデータ解析を簡便に実現することができる手法は従来存在しなかった。
 また、そもそも一般に、多変量解析を行う従来のデータ解析装置により得られる解析結果は専門的な知識を有する者でないと把握することが難しく、十分に有用な情報をユーザに提供できていないという問題があった。
 本発明はこうした課題を解決するために成されたものであり、その主たる目的の一つは、異なる種類の測定や観察などによって得られた複数のデータを比較したり関連付けたりする解析処理を行うことで、従来の解析手法では得られない有用な情報を取得することができるデータ解析装置を提供することである。
 上記課題を解決するために成された本発明に係る第1の態様のデータ解析装置は、複数の試料についてそれぞれ所定の測定を実行することで所定のパラメータ値毎に得られたデータを集約した第1のデータ群と、該複数の試料についてそれぞれ前記所定の測定とは別の手法による測定を実行することで得られたデータを集約した第2のデータ群と、に基づく解析処理により前記複数の試料全般に関する情報を求めるデータ解析装置であって、
 a)第1のデータ群を説明変数、第2のデータ群を被説明変数(目的変数)とする所定の統計的解析処理を実施し、両データ群中のデータの類似性又は相違性を示す複数の指標値を算出する第1の統計的解析処理部と、
 b)前記第1の統計的解析処理部で算出された複数の指標値を説明変数、前記複数の試料にそれぞれ関連する他の情報を被説明変数(目的変数)とする所定の統計的解析処理を実施し、前記指標値と前記他の情報との類似性又は相違性を示す複数の指標値を算出する第2の統計的解析処理部と、
 c)前記第2の統計的解析処理部で算出された複数の指標値を用い、前記他の情報と前記第1のデータ群との関係、又は、前記他の情報と前記第2のデータ群との関係、を示すグラフを作成して表示する表示処理部と、
 を備えることを特徴としている。
 本発明に係る第1の態様のデータ解析装置における典型的な実施形態として、
 前記第1のデータ群は、複数の試料についてそれぞれイメージング質量分析を行うことで得られた、2次元的な測定領域内の複数の測定点それぞれにおける、質量電荷比を前記所定のパラメータとしたマススペクトルデータであり、
 前記第2のデータ群は、複数の試料についてそれぞれイメージング質量分析とは異なる測定手法で得られた、2次元的な測定領域内の所定の信号強度の分布を示す画像データであり、
 前記第1の統計的解析処理部は、試料毎に、前記第2のデータ群による一つ又は複数の画像と、前記第1のデータ群による各質量電荷比における信号強度の分布画像との類似性又は相違性を示す指標値を算出する構成とすることができる。
 上記「イメージング質量分析とは異なる測定手法」としては、ラマン分光測定、蛍光測定、様々な波長(テラヘルツ域、遠近赤外域、可視域、紫外域、X線域など)の電磁波の放出強度の測定や吸収測定、PET(Positron Emission Tomography)測定、MRI(Magnetic Resonance Imaging)測定、ESR(Electron Spin Resonance)測定、CT(Computed Tomography)測定、EPMA(Electron Probe MicroAnalyser)による表面分析などの各種の測定や分析、或いは、電子顕微鏡や光学顕微鏡による観察などのいずれかとすることができる。例えば第2のデータ群が上述したような光学的な測定手法で得られた画像データを含むものである場合、複数の波長それぞれにおいて異なる画像を構成する画像データであってもよいし特定の一つの波長における一つの画像を構成する画像データであってもよい。
 いま例えば第2のデータ群が一つのカラー画像をモノクロ化した光学顕微画像を構成する画像データ、つまりは測定点に対応する画素の画素値を示すデータ群である場合、第1の統計的解析処理部は、試料毎に、その試料における画素値データと画像と、各質量電荷比の信号強度の分布を示す分布画像との類似性又は相違性を示す指標値を計算する。この第1の統計的解析処理部による所定の統計的解析処理は例えば、部分最小二乗回帰(PLS回帰)分析とするとよい。
 上記データに対しPLS回帰分析を適用することにより、上記指標値として質量電荷比毎に回帰係数を求めることができる。一つの試料について求まる質量電荷比毎の回帰係数を係数行列とすれば、複数の試料について複数の係数行列が求まる。
 本発明に係る第1の態様のデータ解析装置ではさらに第2の統計的解析処理部が、この複数の係数行列を説明変数、複数の試料にそれぞれ関連する他の情報を被説明変数とする所定の統計的解析処理を実施する。ここで、「複数の試料にそれぞれ関連する他の情報」とは数値化可能な状態であれば特にその内容を問わず、解析の目的等に応じて適宜の情報を用いることができる。また、第2の統計的解析処理部による所定の統計的解析処理は第1の統計的解析処理部による統計的解析処理と同じ手法でもよいし、それとは異なる手法でもよい。具体的には例えば、部分最小二乗回帰(PLS回帰)分析又は主成分回帰分析を用いるとよい。
 例えば複数の試料が特定の疾病に罹患した被検体から採取された生体組織切片であり、試料毎にその疾病の進行度合や重篤度合などが他の情報として与えられている場合、第2の統計的解析処理部でPLS回帰分析を行うことで、第1の統計的解析処理部で得られた試料毎の回帰係数と疾病の進行度合との類似性を示す回帰係数を求めることができる。この場合、この回帰係数は、光学顕微画像に現れている特定の分布と類似した分布を示す質量電荷比、つまりは化合物と、疾病の進行度合いとの関連性を示している。表示処理部は例えばその関連性を示す適宜の形式のグラフを作成して表示部の画面上に表示する。これにより、ユーザは例えば、光学顕微画像に現れている特定の分布と類似した分布を示す特定の化合物が疾病の進行度合に関連しているか否かを簡便に且つ視覚的に確認することができる。
 上記本発明に係る第1の態様のデータ解析装置では、複数の試料についてそれぞれ所定の測定を実行することで所定のパラメータ値毎に得られたデータを集約した第1のデータ群と、同じ複数の試料についてそれぞれ別の手法による測定を実行することで得られたデータを集約した第2のデータ群と、について一段階目の統計的解析処理を実行し、その結果と同じ複数の試料にそれぞれ関連する他の情報である第3のデータとについて、二段階目の統計的解析処理を実施していた。これに対し、一段階目の統計的解析処理で得られた結果を分かり易く或いはより大局的に表現するために二段階目の統計的解析処理を実施するようにしてもよい。
 即ち、本発明に係る第2の態様のデータ解析装置は、複数の試料についてそれぞれ所定の測定を実行することで所定のパラメータ値毎に得られたデータを集約した第1のデータ群と、該複数の試料についてそれぞれ前記所定の測定とは別の手法による測定を実行することで得られたデータ又は該複数の試料にそれぞれ関連する他の情報であるデータを集約した第2のデータ群と、に基づく解析処理により前記複数の試料全般に関する情報を求めるデータ解析装置であって、
 a)第1のデータ群を説明変数、第2のデータ群を被説明変数(目的変数)とする所定の統計的解析処理を実施し、両データ群中のデータの類似性又は相違性を示す複数の指標値を算出する第1の統計的解析処理部と、
 b)前記第1の統計的解析処理部で算出された複数の指標値を、より低次元の情報に集約するための所定の統計的解析処理を実施する第2の統計的解析処理部と、
 c)前記第2の統計的解析処理部による結果に基づき、前記第2のデータ群と前記第1のデータ群における各パラメータ値との関係を示すグラフを作成して表示する表示処理部と、
 を備えることを特徴としている。
 本発明に係る第2の態様のデータ解析装置では上記第1の態様のデータ解析装置と同様に、第1の統計的解析処理部による所定の統計的解析処理は例えば、部分最小二乗回帰分析とするとよい。一方、第2の統計的解析処理部による所定の統計的解析処理は、主成分分析、因子分析、クラスター分析などを用いることができる。
 本発明に係る第2の態様のデータ解析装置において、例えば試料は生体由来の試料であり、第1のデータ群は、複数の試料についてそれぞれ得られたマススペクトルデータ、第2のデータ群は試料毎の状態を示す情報であるものとする。こうしたデータに対し第1の統計的解析処理部によりPLS回帰分析を実行すると、質量電荷比値とその試料毎の状態の関連性の強さの程度を示す指標値として、それぞれの回帰係数を算出することができる。そして、こうして得られた複数の回帰係数について主成分分析を行い、表示処理部がその結果に基づいてスコアプロット又はローディングプロットを作成すると、試料毎の状態と質量電荷比値との関係が俯瞰的に観察できるようになる。
 本発明に係るデータ解析装置によれば、例えば、異なる種類の測定や観察などによって得られた複数のデータを比較したり関連付けたりすることで、従来の解析手法では得られない有用な情報を取得することができる。具体的には例えば、癌などの特定の疾病が進行したあとでなくその初期段階で特異的に発現する化合物を見つけたり、或いはそうした疾病に対する治療の効果の程度を反映した化合物を見つけたりすることができる可能性がある。
本発明に係るデータ解析装置を用いたイメージング質量分析システムの一実施例の概略構成図。 本実施例のイメージング質量分析システムにおけるデータ解析処理の概念図。 本実施例のイメージング質量分析システムにおけるデータ解析の手順を示すフローチャート。 本実施例のイメージング質量分析システムにおけるデータ解析の変形例の説明図。 本発明に係るデータ解析装置を用いた質量分析システムの一実施例の概略構成図。 本実施例の質量分析システムにおけるデータ解析処理の概念図。
 [第1実施例]
 本発明に係るデータ解析装置を用いたイメージング質量分析システムの一実施例について、添付図面を参照して説明する。
 図1は本実施例のイメージング質量分析システムの概略構成図である。
 このシステムは、光学顕微観察部11とイメージング質量分析部12を含む測定部1、データ解析部2、入力部3、及び表示部4、を含む。
 光学顕微観察部11は試料上の測定領域についての光学的な顕微観察画像を取得するものである。一方、イメージング質量分析部12は、同じ試料上の測定領域を細かく区分した微小領域(測定点)毎にそれぞれ所定の質量電荷比範囲に亘る質量分析を実施し、それぞれマススペクトルデータを収集するものである。
 データ解析部2は、光学顕微観察部11で取得される光学顕微画像データ及びイメージング質量分析部12で取得されるマススペクトルデータを受け取るデータ入力部21と、受け付けられたデータを格納するデータ格納部22と、演算データ前処理部23と、第1多変量解析処理部24と、第2多変量解析処理部25と、解析結果表示処理部26と、を機能ブロックとして備える。
 なお、一般に、データ解析部2の実体はパーソナルコンピュータ又はより高性能なコンピュータであるワークステーションであり、そのコンピュータにインストールされた専用の解析ソフトウェアを該コンピュータで実行することにより各部の機能が実現されるものとすることができる。
 図2は本実施例のイメージング質量分析システムにおける特徴的なデータ解析処理の概念図、図3はそのデータ解析処理の手順を示すフローチャートである。
 ここでは、多数の被検体(例えばマウス)の同じ生体組織(例えば肝臓)からそれぞれ切り出された切片を試料とする。この多数の試料は異なる被検体の同じ生体組織のほぼ同じ部位の切片である。被検体は癌を発症しているが、その癌の進行の程度(重症度)は様々であり、その重症度は予め数値化されて試料毎に既知であるものとする。
 測定部1では、各試料についてそれぞれ、イメージング質量分析部12により、測定領域内の多数の測定点のマススペクトルデータ(これをMSイメージングデータという)を取得する。また、上記各試料とそれぞれ同じであるとみなせる試料(同じ被検体、同じ生体組織において連続した切片である試料)に対し特定のタンパク質についての蛍光標識を行ったうえで光学顕微観察部11で撮影を行い、蛍光画像データを取得する。データ入力部21はこうして取得された同じであるとみなせる試料についてのMSイメージングデータと蛍光画像データとをまとめ、さらに該試料の癌の重症度を示す情報を付加して、具体的には一つのデータファイルとしてデータ格納部22に格納する。したがって、データ格納部22には、試料の数(同じであるとみなせる二つの試料を一つとする)と同数のデータファイルが格納される。
 上述したように複数の試料についてのMSイメージングデータ及び蛍光画像データがデータ格納部22に格納されている状態で、以下のようにして解析処理が実施される。
 ユーザが入力部3から処理対象のデータ等を指示すると、データ解析部2において演算データ前処理部23は、データ格納部22から処理対象である一つの試料についてのMSイメージングデータ及び蛍光画像データを読み出す(ステップS1)。上述したようにそれらデータが一つのデータファイルに格納されている場合には、そのデータファイルを読み出せばよい。
 演算データ前処理部23は、予め設定されている条件に従って蛍光画像の各画素のデータを単純な画素値データに変換する。例えばヘマトキリシン・エオジン(HE)等による蛍光画像ではその蛍光色の強度値が画素値としてデータ化される。また、演算データ前処理部23は、必要に応じて、蛍光顕微画像上とMSイメージング画像上における同じ対象物の像の大きさ、向き、歪みなどを修正する位置合わせ処理と解像度を合わせる解像度調整処理を実行する(ステップS2)。
 位置合わせ処理では、具体的には、例えば顕微画像を基準としてMSイメージング画像について拡大・縮小、回転、さらには、所定のアルゴリズムに従った変形を行うことで両画像における試料上での位置関係をおおむね一致させる。この位置合わせには例えば特許文献1に記載の手法を利用することができる。
 また、光学顕微観察部11における撮像の解像度(位置分解能)は通常、撮像用カメラの解像度で決まるのに対し、MSイメージング画像の解像度はイオン化のために試料に照射されるレーザ光のスポット径によって決まる。そのため、MSイメージング画像の解像度は光学画像の解像度に比べて低いことが多い。そこで、後述する画像の多変量解析を行うために、両画像の解像度を揃える解像度調整処理を実施する。解像度を揃える簡単な方法は、解像度が高いほうの画像の解像度を落として低解像である画像に合わせる方法である。こうした方法としては例えばビニング処理が有用である。また、解像度が低いほうの画像の解像度を上げることで高解像である画像に合わせるようにしてもよい。そのためには、低解像の画像に対しアップサンプリング処理を行って画素数をみかけ上合わせたあとに、或る画素に隣接する又は近接する複数の画素値を利用した補間処理によって、アップサンプリングによって新たに挿入された画素の画素値を算出して埋めればよい。
 上述した位置合わせ処理及び解像度調整処理によって、蛍光画像から求めた輝度値分布の画像とMSイメージング画像との間で、2次元的に同じ位置にある画素同士を対応付けることができる。そのあと、第1多変量解析処理部24は、一つの試料についてのMSイメージングデータに基づいて作成された2次元行列を説明変数(X)、蛍光画像の画素値データに基づいて作成された1次元行列を被説明変数(Y)としてPLS回帰分析を実行する。2次元行列は、質量電荷比値を一つの方向、測定点(画素)の位置を上記一つの方向に直交する他の方向にとり、信号強度値を要素とする行列である。PLS回帰分析により、Y=Bpis・X+B0 で示される回帰モデルが作成される。ここで、Bpisは回帰係数である。回帰係数は質量電荷比毎に求まり、蛍光画像のパターン、つまりはタンパク質の空間分布と類似している質量電荷比又はその分布と反転した分布を示す質量電荷比では、回帰係数Bplsの絶対値が大きくなる。この回帰係数は1次元行列となる(ステップS3)。
 データ解析部2では、処理対象である全ての試料についてのデータ処理を実施したか否かを判定し(ステップS4)、未処理の試料があればステップS4からS1に戻る。したがって、ステップS1~S4の処理を繰り返すことで、処理対象として指定された全ての試料についてのデータに基づく回帰係数行列が求まる。回帰係数行列の数は試料の総数と同数である。この回帰係数行列中の一つの回帰係数の値は、該当する質量電荷比におけるイオン強度の分布(つまりはその質量電荷比に対応する化合物の分布)と蛍光画像中で蛍光標識された化合物の分布の類似性を示している。したがって、一つの試料において蛍光標識された化合物の分布に類似した分布を示す化合物を調べたい場合には、ここまでの処理で十分である。
 本実施例のイメージング質量分析システムでは、さらに、図2に示すように、第2多変量解析処理部25が、試料数と同数である回帰係数行列を説明変数(X)、各試料についての付随的な情報として与えられている癌の重症度を示す情報を被説明変数(Y)としたPLS回帰分析を実行する。癌の重症度は、或る時点での癌の重症の程度を表す指標値である。試料毎に重症度の情報が与えられているので、この重症度合いの行列は要素数が試料数と同数の1次元行列である。このPLS回帰分析ではステップS3の処理と同様に、その要素数が試料数と同数の1次元行列である回帰係数行列が得られる(ステップS5)。この回帰係数行列中の回帰係数は、重症度合いと蛍光画像の分布に類似した化合物との関係性の程度を示している。即ち、このときの回帰係数の絶対値が大きくなる質量電荷比に対応する化合物は、癌の重症度合いとの関連性が強いと推定される。
 解析結果表示処理部26は、ステップS5で求まった回帰係数行列に基づいて、予め決められた適宜のグラフを作成し、これを表示部4の画面上に表示する(ステップS6、S7)。例えば、最も簡単なグラフとしては、ステップS5で求まった回帰係数行列に基づき、横軸を質量電荷比、縦軸を係数値(ただし正負の極性あり)としたマススペクトル様のグラフを作成するとよい。これにより、蛍光標識された化合物と類似した2次元分布を示す化合物の中で、癌の重症度と関連性の強い化合物(化合物に対応する質量電荷比)を一目で確認することができる。
 なお、上記処理では、蛍光画像を単純な画素値データに変換していたが、蛍光画像がカラー画像又は複数の波長成分を含む画像であっても、同様の処理が可能である。この場合には、一つの試料に対して蛍光画像は一つではなく、波長の数だけ蛍光画像が存在することになる。蛍光画像が一つのみの場合には、ステップS3におけるPLS回帰分析の被説明変数(Y)は一つ(1次元行列が一つ)のみであったが、蛍光画像が複数ある場合、ステップS3におけるPLS回帰分析の被説明変数(Y)が複数になる。したがって、このときのPLS回帰分析はPLS2アルゴリズムを用いればよい。
 このときに得られる回帰係数は図4(a)に示すような各波長における各質量電荷比の係数、つまりは2次元的な表形式のものとなる。そこで、これを図4(b)に示すように、質量電荷比と波長とを合わせた1次元の配列に並び替え、ステップS5において、試料の数だけ用意した1次元配列の係数行列を説明変数(X)、癌の重症度を示す情報を被説明変数(Y)としたPLS回帰分析を実行すればよい。
 当然のことながら、こうして得られる回帰係数行列は、質量電荷比と波長との組に対する係数の行列である。
 また、上記例において、蛍光画像に代えて、試料中の特定の化合物の分布が可視化されるような別の測定手法による画像を用いてもよい。
 例えば、特定の波長を有する光やX線などの電磁波の吸収の度合いや放射強度の分布を示すデータ、ラマン散乱光や蛍光などの強度分布を示すデータや染色画像データ、PET(陽電子放出断層撮影)、CT(コンピュータ断層撮影)、MRI(核磁気共鳴画像)、ESR(電子スピン共鳴)などにより撮影された画像データ、放射線同位体標識を利用した画像データ、EPMAやSPM(Scanning Probe Microscope)などで取得された表面凹凸画像データなどを2次元画像データとして用いることができる。
 [第2実施例]
 第1実施例では、複数の試料からそれぞれ得られたMSイメージングデータ(測定領域内の複数の測定点それぞれで得られたマススペクトルデータ)について多変量解析を行っていたが、一つの試料から一つのマススペクトルデータが得られる場合にも本発明を適用することができる。この実施例による質量分析システムの概略構成図を図5に示す。このシステムは、イメージング質量分析部100、データ解析部200、入力部300、及び表示部400、を含み、データ解析部200は、イメージング質量分析部100で得られたマススペクトルデータを受け取るデータ入力部201と、受け付けられたデータを格納するデータ格納部202と、平均マススペクトル算出部203と、第1多変量解析処理部204と、第2多変量解析処理部205と、解析結果表示処理部206と、を機能ブロックとして備える。
 本実施例による質量分析システムにおける解析の例として、非アルコール性脂肪性肝炎と食事との関連について調べる場合の例について説明する。図6は本実施例の質量分析システムにおける特徴的なデータ解析処理の概念図である。
 試料は、特別な餌(以下「特別餌」という)を与えることで非アルコール性脂肪性肝炎(NASH=Non Alcoholic SteatoHepatitis)を発症させたマウスの肝臓、及び、通常の餌(以下「通常餌」という)を与えたマウスの肝臓(コントロール試料)であり、それぞれ給餌期間が4週、8週、16週と3段階に異なる、合計6種類である。なお、経験的に特別餌の給餌期間が長いほどNASHの炎症の重症度は上がることが分かっているため、給餌期間4週、8週、16週をそれぞれ重症度:1、2、3と記すこととする。また、NASHを発症していない状態を重症度:0と記すこととする。
 上記6種類の試料についてそれぞれイメージング質量分析部100で質量分析を実行し、測定点毎にマススペクトルデータを取得する。データ解析部200において平均マススペクトル算出部203は、試料毎に、全ての測定点におけるマススペクトルデータの平均を計算することで平均マススペクトルを算出する。これにより、試料数と同数の平均マススペクトルが得られる。こうして得られた平均マススペクトルを構成するデータをPLS回帰分析の説明変数(X)とする。
 一方、重症度の進行に応じた化合量の変化のパターンを被説明変数(Y)とするが、化合物量がどのように変化するのか不明であるため、ここでは、次の5種類のパターンを想定する。
   Y1=(1,2,3):重症度に比例して化合物量が増加又は減少
   Y2=(1,2,1):給餌期間の途中で一時的に化合物量が増加又は減少
   Y3=(1,0,0):給餌期間の初期にのみ化合物が存在する、又は給餌期間の初期にのみ化合物が存在しない
   Y4=(0,1,0):給餌期間の途中にのみ化合物が存在する、又は給餌期間の途中にのみ化合物が存在しない
   Y5=(0,0,1):給餌期間の末期にのみ化合物が存在する、又は給餌期間の末期にのみ化合物が存在しない
 複数の平均マススペクトル(X)に対してそれぞれY1~Y5の特性値(Y)を設定し、PLS回帰のためのデータセットを作成する。そして第1多変量解析処理部204はこうして作成されたデータセット毎にPLS回帰分析を実行し、回帰係数Bplsを算出する。したがって、この回帰係数Bplsは、特性値毎で質量電荷比値毎に求まる。つまり、特性値毎に、質量電荷比毎の回帰係数を並べた1次元行列が求まる。ただし、この結果だけを見ても、特性値(Y1~Y5)と各質量電荷比との全体像を把握することは難しい。
 そこで次に、第2多変量解析処理部205は、全ての特性値についての回帰係数行列を対象として主成分分析を実施する。よく知られているように、主成分分析を行うことで、解析結果としてスコアプロットとローディングプロットを求めることができる。この場合、スコアプロットでは、二つの主成分(通常は第1主成分及び第2主成分)を直交する軸とするグラフ上に、特性値Y1~Y5が位置付けられる。また、ローディングプロットでは、同じく二つの主成分を直交する軸とするグラフ上に、各質量電荷比値が位置付けられる。解析結果表示処理部206はこうしたグラフを作成して表示部400の画面上に表示する。これにより、ユーザは、特性値と特徴的な質量電荷比値との関係を俯瞰的に把握することができる。
 なお、上記実施例はいずれも本発明の一例にすぎず、上記記載した以外の点において、本発明の趣旨の範囲で適宜変形、修正、追加などを行っても本願特許請求の範囲に包含されることは明らかである。
1…測定部
11…光学顕微観察部
12、100…イメージング質量分析部
2、200…データ解析部
21、201…データ入力部
22、202…データ格納部
23…演算データ前処理部
203…平均マススペクトル算出部
24、204…第1多変量解析処理部
25、205…第2多変量解析処理部
26、206…解析結果表示処理部
3、300…入力部
4、400…表示部

Claims (7)

  1.  複数の試料についてそれぞれ所定の測定を実行することで所定のパラメータ値毎に得られたデータを集約した第1のデータ群と、該複数の試料についてそれぞれ前記所定の測定とは別の手法による測定を実行することで得られたデータを集約した第2のデータ群と、に基づく解析処理により前記複数の試料全般に関する情報を求めるデータ解析装置であって、
     a)第1のデータ群を説明変数、第2のデータ群を被説明変数(目的変数)とする所定の統計的解析処理を実施し、両データ群中のデータの類似性又は相違性を示す複数の指標値を算出する第1の統計的解析処理部と、
     b)前記第1の統計的解析処理部で算出された複数の指標値を説明変数、前記複数の試料にそれぞれ関連する他の情報を被説明変数(目的変数)とする所定の統計的解析処理を実施し、前記指標値と前記他の情報との類似性又は相違性を示す複数の指標値を算出する第2の統計的解析処理部と、
     c)前記第2の統計的解析処理部で算出された複数の指標値を用い、前記他の情報と前記第1のデータ群との関係、又は、前記他の情報と前記第2のデータ群との関係、を示すグラフを作成して表示する表示処理部と、
     を備えることを特徴とするデータ解析装置。
  2.  請求項1に記載のデータ解析装置において、
     前記第1のデータ群は、複数の試料についてそれぞれイメージング質量分析を行うことで得られた、2次元的な測定領域内の複数の測定点それぞれにおける、質量電荷比を前記所定のパラメータとしたマススペクトルデータであり、
     前記第2のデータ群は、複数の試料についてそれぞれイメージング質量分析とは異なる測定手法で得られた、2次元的な測定領域内の所定の信号強度の分布を示す画像データであり、
     前記第1の統計的解析処理部は、試料毎に、前記第2のデータ群による一つ又は複数の画像と、前記第1のデータ群による一つの質量電荷比における信号強度の分布画像との類似性又は相違性を示す指標値を算出することを特徴とするデータ解析装置。
  3.  請求項2に記載のデータ解析装置であって、
     前記第1の統計的解析処理部による所定の統計的解析処理は部分最小二乗回帰分析であることを特徴とするデータ解析装置。
  4.  請求項2に記載のデータ解析装置であって、
     前記第2の統計的解析処理部による所定の統計的解析処理は部分最小二乗回帰分析又は主成分回帰分析であることを特徴とするデータ解析装置。
  5.  複数の試料についてそれぞれ所定の測定を実行することで所定のパラメータ値毎に得られたデータを集約した第1のデータ群と、該複数の試料についてそれぞれ前記所定の測定とは別の手法による測定を実行することで得られたデータ又は該複数の試料にそれぞれ関連する他の情報であるデータを集約した第2のデータ群と、に基づく解析処理により前記複数の試料全般に関する情報を求めるデータ解析装置であって、
     a)第1のデータ群を説明変数、第2のデータ群を被説明変数(目的変数)とする所定の統計的解析処理を実施し、両データ群中のデータの類似性又は相違性を示す複数の指標値を算出する第1の統計的解析処理部と、
     b)前記第1の統計的解析処理部で算出された複数の指標値を、より低次元の情報に集約するための所定の統計的解析処理を実施する第2の統計的解析処理部と、
     c)前記第2の統計的解析処理部による結果に基づき、前記第2のデータ群と前記第1のデータ群における各パラメータ値との関係を示すグラフを作成して表示する表示処理部と、
     を備えることを特徴とするデータ解析装置。
  6.  請求項5に記載のデータ解析装置であって、
     前記第1の統計的解析処理部による所定の統計的解析処理は部分最小二乗回帰分析であることを特徴とするデータ解析装置。
  7.  請求項5に記載のデータ解析装置であって、
     前記第2の統計的解析処理部による所定の統計的解析処理は主成分分析、因子分析又はクラスター分析であることを特徴とするデータ解析装置。
PCT/JP2018/003757 2018-02-05 2018-02-05 データ解析装置 WO2019150573A1 (ja)

Priority Applications (2)

Application Number Priority Date Filing Date Title
JP2019568538A JP6908136B2 (ja) 2018-02-05 2018-02-05 データ解析装置
PCT/JP2018/003757 WO2019150573A1 (ja) 2018-02-05 2018-02-05 データ解析装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
PCT/JP2018/003757 WO2019150573A1 (ja) 2018-02-05 2018-02-05 データ解析装置

Publications (1)

Publication Number Publication Date
WO2019150573A1 true WO2019150573A1 (ja) 2019-08-08

Family

ID=67479214

Family Applications (1)

Application Number Title Priority Date Filing Date
PCT/JP2018/003757 WO2019150573A1 (ja) 2018-02-05 2018-02-05 データ解析装置

Country Status (2)

Country Link
JP (1) JP6908136B2 (ja)
WO (1) WO2019150573A1 (ja)

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113994203A (zh) * 2019-09-13 2022-01-28 株式会社岛津制作所 分析装置
US11276566B2 (en) 2018-05-30 2022-03-15 Shimadzu Corporation Imaging data processing device
US11709156B2 (en) 2017-09-18 2023-07-25 Waters Technologies Corporation Use of vapor deposition coated flow paths for improved analytical analysis
US11709155B2 (en) 2017-09-18 2023-07-25 Waters Technologies Corporation Use of vapor deposition coated flow paths for improved chromatography of metal interacting analytes
US11918936B2 (en) 2020-01-17 2024-03-05 Waters Technologies Corporation Performance and dynamic range for oligonucleotide bioanalysis through reduction of non specific binding

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2014175211A1 (ja) * 2013-04-22 2014-10-30 株式会社島津製作所 イメージング質量分析データ処理方法及びイメージング質量分析装置
WO2017002226A1 (ja) * 2015-07-01 2017-01-05 株式会社島津製作所 データ処理装置
JP2017224283A (ja) * 2016-06-09 2017-12-21 株式会社島津製作所 ビッグデータ解析方法及び該解析方法を利用した質量分析システム

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2014175211A1 (ja) * 2013-04-22 2014-10-30 株式会社島津製作所 イメージング質量分析データ処理方法及びイメージング質量分析装置
WO2017002226A1 (ja) * 2015-07-01 2017-01-05 株式会社島津製作所 データ処理装置
JP2017224283A (ja) * 2016-06-09 2017-12-21 株式会社島津製作所 ビッグデータ解析方法及び該解析方法を利用した質量分析システム

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
SHINMA, SHUICHI: "Analysis of cancer heterogeneity using imaging mass microscope", EXPERIMENTAL MEDICINE, vol. 36/2, 1 February 2018 (2018-02-01), pages 211 - 217 *

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US11709156B2 (en) 2017-09-18 2023-07-25 Waters Technologies Corporation Use of vapor deposition coated flow paths for improved analytical analysis
US11709155B2 (en) 2017-09-18 2023-07-25 Waters Technologies Corporation Use of vapor deposition coated flow paths for improved chromatography of metal interacting analytes
US11276566B2 (en) 2018-05-30 2022-03-15 Shimadzu Corporation Imaging data processing device
CN113994203A (zh) * 2019-09-13 2022-01-28 株式会社岛津制作所 分析装置
US11918936B2 (en) 2020-01-17 2024-03-05 Waters Technologies Corporation Performance and dynamic range for oligonucleotide bioanalysis through reduction of non specific binding

Also Published As

Publication number Publication date
JPWO2019150573A1 (ja) 2020-10-22
JP6908136B2 (ja) 2021-07-21

Similar Documents

Publication Publication Date Title
US11776799B2 (en) Data processing device
WO2019150573A1 (ja) データ解析装置
CN111952145B (zh) 成像质量分析数据处理方法以及成像质量分析装置
JP5565810B2 (ja) 質量分析データ処理方法及び装置
JP2011191222A (ja) 質量分析データ処理方法及び装置
JP6927416B2 (ja) イメージングデータ処理装置及びイメージングデータ処理プログラム
JPWO2014175211A1 (ja) イメージング質量分析データ処理方法及びイメージング質量分析装置
JP5246026B2 (ja) 質量分析データ処理装置
JP7004073B2 (ja) イメージングデータ処理装置
JP6179600B2 (ja) 質量分析データ解析装置
JP6477833B2 (ja) データ処理装置
WO2019150575A1 (ja) イメージング質量分析データ解析装置
CN111587374B (zh) 成像质谱分析用数据处理装置
WO2020166007A1 (ja) イメージング質量分析装置
US10304671B2 (en) Method for computer-assisted analysis of one or more tissue sections of the human or animal body
WO2019186998A1 (ja) データ解析装置及びデータ解析システム
WO2021095210A1 (ja) イメージング分析装置及びイメージングデータ解析方法
WO2019150574A1 (ja) イメージング質量分析装置

Legal Events

Date Code Title Description
121 Ep: the epo has been informed by wipo that ep was designated in this application

Ref document number: 18903286

Country of ref document: EP

Kind code of ref document: A1

ENP Entry into the national phase

Ref document number: 2019568538

Country of ref document: JP

Kind code of ref document: A

NENP Non-entry into the national phase

Ref country code: DE

122 Ep: pct application non-entry in european phase

Ref document number: 18903286

Country of ref document: EP

Kind code of ref document: A1