RU2765695C2 - Устройство определения поражения заболеванием, способ определения поражения заболеванием и программа определения поражения заболеванием - Google Patents

Устройство определения поражения заболеванием, способ определения поражения заболеванием и программа определения поражения заболеванием Download PDF

Info

Publication number
RU2765695C2
RU2765695C2 RU2019116786A RU2019116786A RU2765695C2 RU 2765695 C2 RU2765695 C2 RU 2765695C2 RU 2019116786 A RU2019116786 A RU 2019116786A RU 2019116786 A RU2019116786 A RU 2019116786A RU 2765695 C2 RU2765695 C2 RU 2765695C2
Authority
RU
Russia
Prior art keywords
lesion
disease
sample data
determination
diseases
Prior art date
Application number
RU2019116786A
Other languages
English (en)
Other versions
RU2019116786A3 (ru
RU2019116786A (ru
Inventor
Дайсуке ОКАНОХАРА
Кента ООНО
Нобуюки ОТА
Карим ХАМЗАУИ
Такуя АКИБА
Original Assignee
Приферд Нетворкс, Инк.
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Приферд Нетворкс, Инк. filed Critical Приферд Нетворкс, Инк.
Publication of RU2019116786A3 publication Critical patent/RU2019116786A3/ru
Publication of RU2019116786A publication Critical patent/RU2019116786A/ru
Application granted granted Critical
Publication of RU2765695C2 publication Critical patent/RU2765695C2/ru

Links

Images

Classifications

    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B40/00ICT specially adapted for biostatistics; ICT specially adapted for bioinformatics-related machine learning or data mining, e.g. knowledge discovery or pattern finding
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16HHEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
    • G16H50/00ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics
    • G16H50/20ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics for computer-aided diagnosis, e.g. based on medical expert systems
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12MAPPARATUS FOR ENZYMOLOGY OR MICROBIOLOGY; APPARATUS FOR CULTURING MICROORGANISMS FOR PRODUCING BIOMASS, FOR GROWING CELLS OR FOR OBTAINING FERMENTATION OR METABOLIC PRODUCTS, i.e. BIOREACTORS OR FERMENTERS
    • C12M1/00Apparatus for enzymology or microbiology
    • C12M1/34Measuring or testing with condition measuring or sensing means, e.g. colony counters
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01NINVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
    • G01N33/00Investigating or analysing materials by specific methods not covered by groups G01N1/00 - G01N31/00
    • G01N33/48Biological material, e.g. blood, urine; Haemocytometers
    • G01N33/50Chemical analysis of biological material, e.g. blood, urine; Testing involving biospecific ligand binding methods; Immunological testing
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B20/00ICT specially adapted for functional genomics or proteomics, e.g. genotype-phenotype associations
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B25/00ICT specially adapted for hybridisation; ICT specially adapted for gene or protein expression
    • G16B25/10Gene or protein expression profiling; Expression-ratio estimation or normalisation
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B40/00ICT specially adapted for biostatistics; ICT specially adapted for bioinformatics-related machine learning or data mining, e.g. knowledge discovery or pattern finding
    • G16B40/20Supervised data analysis
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16HHEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
    • G16H50/00ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics
    • G16H50/70ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics for mining of medical data, e.g. analysing previous cases of other patients
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6876Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes
    • C12Q1/6883Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes for diseases caused by alterations of genetic material
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6876Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes
    • C12Q1/6883Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes for diseases caused by alterations of genetic material
    • C12Q1/6886Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes for diseases caused by alterations of genetic material for cancer
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q2600/00Oligonucleotides characterized by their use
    • C12Q2600/178Oligonucleotides characterized by their use miRNA, siRNA or ncRNA

Landscapes

  • Health & Medical Sciences (AREA)
  • Engineering & Computer Science (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Chemical & Material Sciences (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Physics & Mathematics (AREA)
  • Medical Informatics (AREA)
  • General Health & Medical Sciences (AREA)
  • Biotechnology (AREA)
  • Data Mining & Analysis (AREA)
  • Public Health (AREA)
  • Biomedical Technology (AREA)
  • Organic Chemistry (AREA)
  • Biophysics (AREA)
  • Genetics & Genomics (AREA)
  • Wood Science & Technology (AREA)
  • Zoology (AREA)
  • Spectroscopy & Molecular Physics (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Evolutionary Biology (AREA)
  • Theoretical Computer Science (AREA)
  • Databases & Information Systems (AREA)
  • Molecular Biology (AREA)
  • Epidemiology (AREA)
  • Analytical Chemistry (AREA)
  • Biochemistry (AREA)
  • Microbiology (AREA)
  • Bioethics (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Software Systems (AREA)
  • Artificial Intelligence (AREA)
  • Evolutionary Computation (AREA)
  • Medicinal Chemistry (AREA)
  • Pathology (AREA)
  • Immunology (AREA)
  • General Engineering & Computer Science (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • Sustainable Development (AREA)
  • Hematology (AREA)
  • Urology & Nephrology (AREA)

Abstract

Настоящее изобретение относится к технологии для осуществления определения поражения заболеванием с использованием нейронной сети для того, чтобы осуществлять обучение с использованием данных об уровнях экспрессии мкРНК, и извлечения мкРНК, которая служит в качестве отличительного биомаркера для заболевания посредством нейронной сети. В результате заявленной группы решений получают данные образца, в которых соответствующие уровни экспрессии множества типов биомаркеров регистрируют для каждого индивидуума, генерируют обученную модель, в которой поражение заболеваниями получают с возможностью определения предварительно посредством выполнения машинного обучения с использованием обучающих данных, множество данных образцов, к которым прикрепляют маркировочную информацию о поражении заболеванием, вводят в обученную модель и осуществляют вычисление, количественно определяют степени важности соответствующего признака из множества биомаркеров, получаемого с использованием обученной модели, посредством вычисления определения поражения, для каждых данных образца, и извлекают предварительно определяемое число биомаркеров в качестве отличительных биомаркеров, относящихся к заболеванию на основе количественно определенных степеней важности всех данных образца для каждого биомаркера. Технический результат заключается в повышении точности диагноза посредством эффективного использования всех данных об уровнях экспрессии и возможности использования при установке диагноза большего количества типов мкРНК. 3 н. и 10 з.п. ф-лы, 6 ил.

Description

Область техники
[0001] Настоящее изобретение относится к технологии для осуществления определения поражения заболеванием с использованием нейронной сети для того, чтобы осуществлять обучение с использованием данных об уровнях экспрессии мкРНК, и извлечения мкРНК, которая служит в качестве отличительного биомаркера для заболевания посредством нейронной сети.
Уровень техники
[0002] Предложены стандартные приемы для диагностирования заболеваний, сосредоточенные на уровнях экспрессии микроРНК (мкРНК) в образце, полученном из организма. мкРНК представляет собой функциональную нуклеиновую кислоту, состоящую из одноцепочечной молекулы РНК длиной 21-25 оснований, и имеет функцию подавления трансляции различных генов, имеющих целевой участок, комплементарный ей, а также известно, что она управляет базовыми биологическими функциями, такими как образование, дифференцировка и пролиферация клетки, гибель клеток и т.п. В настоящее время обнаружено 2500 или больше типов мкРНК человека. Идут исследования по диагностированию и раннему обнаружению конкретных заболеваний, которые сосредоточены на том факте, что уровень экспрессии мкРНК, во всем многообразии мкРНК, варьирует между индивидуумом, пораженным конкретным заболеванием, и непораженным индивидуумом.
[0003] Патентная литература 1 представляет собой пример диагностического инструмента для диагностирования конкретного заболевания с использованием мкРНК. В патентной литературе 1 предложен способ использования конкретной мкРНК в качестве биомаркера подглоточной злокачественной опухоли, способ определения подглоточной злокачественной опухоли, набор для определения подглоточной злокачественной опухоли и т.п.
Список цитируемой литературы
Патентная литература
[0004] Патентная литература 1: JP 2011-72229 A
Краткое изложение
Техническая проблема
[0005] В патентной литературе 1 сравнивают мкРНК из ткани подглоточной злокачественной опухоли и мкРНК из нормальной подглоточной ткани, находят аномальную экспрессию конкретной мкРНК в ткани подглоточной злокачественной опухоли и используют конкретную мкРНК в качестве биомаркера для диагностирования подглоточной злокачественной опухоли. При стандартном диагностировании с использованием мкРНК находят и используют мкРНК, связанную с определенным заболеванием, и даже при данном диагностировании, диагностирование осуществляют на основе уровня экспрессии мкРНК, связанной с заболеванием.
[0006] Несмотря на то, что способ осуществления диагностирования, сосредоточенный только на мкРНК, связанной с заболеванием, позволяет выполнять диагностирование с определенной степенью точности, проблема состоит в том, что положительный случай заболевания может иметь место, даже когда значимое различие, которое можно диагностировать как положительное, не проявляется в значении мкРНК, представляющей интерес. Такая проблема может существовать, поскольку необходимо задавать пороговое значение около значения мкРНК, представляющей интерес, и проводить диагностирование, но можно сказать, что эта проблема возникает, когда диагностирование осуществляют, сосредоточившись только на некотором числе мкРНК. Однако существует такая проблема, что нелегко использовать все данные огромной мкРНК для диагностирования с использованием того же приема.
[0007] В патентной литературе 1 сравнивают мкРНК из ткани подглоточной злокачественной опухоли и мкРНК из нормальной подглоточной ткани и извлекают конкретную мкРНК, и такой способ нахождения отличительной мкРНК с помощью способа сравнения фактически пораженных тканей является эффективным. Однако усовершенствование точности диагноза посредством эффективного использования всех данных об уровнях экспрессии 2500 или больше типов мкРНК невозможно с помощью способа определения, с помощью человека, будь различие значимым, когда сравнивают уровни экспрессии индивидуальных мкРНК.
[0008] Настоящее изобретение выполнено ввиду вышеуказанной проблемы, и цель настоящего изобретения состоит в том, чтобы предоставлять прием определения поражения заболеванием, который делает возможным определение поражения заболеванием посредством нейронной сети, чтобы осуществлять обучение с использованием данных об уровнях экспрессии биомаркеров, таких как мкРНК, и предоставлять прием извлечения признака заболевания, который делает возможным извлечение отличительного биомаркера для заболевания посредством нейронной сети.
Решение проблемы
[0009] Устройство определения поражения заболеванием в соответствии с настоящим изобретением включает в себя блок получения данных образца, выполненный с возможностью получения данных образца, включающих в себя соответствующие уровни экспрессии биомаркеров, в том числе множества типов мкРНК, в полученном у человека образце, обученную модель, причем поражение заболеваниями получают с возможностью определения предварительно посредством выполнения машинного обучения с использованием обучающих данных, и блок определения поражения, выполненный с возможностью осуществлять определения поражения для данных образца на основе степени важности каждого биомаркера, используя обученную модель.
[0010] Устройство определения поражения заболеванием в соответствии с настоящим изобретением включает в себя блок получения данных образца, выполненный с возможностью получения данных образца, включая соответствующие уровни экспрессии биомаркеров, включая множество типов мкРНК, в полученном у человека образце, обученную модель, причем поражение заболеваниями получают с возможностью определения предварительно посредством выполнения машинного обучения с использованием обучающих данных, блок вычисления важности, выполненный с возможностью вводить данные образца в обученную модель, чтобы количественно определять степень важности каждого биомаркера, и блок определения поражения, выполненный с возможностью осуществлять определение поражения для данных образца по степени важности.
[0011] Кроме того, устройство определения поражения заболеванием в соответствии с настоящим изобретением включает в себя блок извлечения признака, выполненный с возможностью извлекать отличительный биомаркер, относящийся к заболеванию, на основе степени важности, причем определение поражения осуществляют на основе важности признака, которая представляет собой степень важности каждого отличительного биомаркера, в случае выполнения определения заболевания с использованием только извлеченного отличительного биомаркера.
[0012] Кроме того, устройство определения поражения заболеванием в соответствии с настоящим изобретением включает в себя блок извлечения признака, выполненный с возможностью извлекать отличительный биомаркер, относящийся к заболеванию, на основе степени важности, и блок вычисления важности признака, выполненный с возможностью количественно определять важность признака, которая представляет собой степень важности каждого отличительного биомаркера, в случае выполнения определения заболевания только с использованием извлеченного отличительного биомаркера, причем блок определения поражения выполняет определение поражения по важности признака.
[0013] Кроме того, в устройстве определения поражения заболеванием в соответствии с настоящим изобретением, блок вычисления важности количественно определяет степени важности признака соответствующих биомаркеров с помощью процесса вычисления функции потерь Li в отношении i-х данных образца, используя обученную модель, для каждых данных образца, процесса выполнения обратного распространения ошибки с использованием значения Li функции потерь в качестве начальной точки и вычисления градиента gij=∂Li/∂xj в отношении признака xj, соответствующего каждому из множества типов биомаркеров образца i, и процесса получения абсолютного значения суммы градиентов для всех образцов в качестве степени важности Sj=|Σ_{i}gij| признака.
[0014] Кроме того, в устройстве определения поражения заболеванием в соответствии с настоящим изобретением обучающие данные представляют собой данные образца, к которым прикрепляют маркировочную информацию в отношении того, поражены ли индивидуумы заболеваниями.
[0015] Кроме того, в устройстве определения поражения заболеванием в соответствии с настоящим изобретением, создание обученной модели осуществляют после осуществления процесса выбеливания, процесс выбеливания представляет собой линейное преобразование каждой размерности так, что усредненное по всем обучающим данным становится 0 и дисперсия становится 1, для каждой размерности вектора признаков из обучающих данных.
[0016] Способ определения поражения заболеванием в соответствии с настоящим изобретением включает стадии получения данных образца, включая соответствующие уровни экспрессии биомаркеров, включающих множество типов мкРНК, в полученном у человека образце, создания обученной модели, причем поражение заболеваниями получают с возможностью определения предварительно посредством выполнения машинного обучения с использованием обучающих данных, и выполнения определения поражения для данных образца на основе степени важности каждого биомаркера, используя обученную модель.
[0017] Устройство извлечения признака заболевания в соответствии с настоящим изобретением включает в себя блок получения данных образца, выполненный с возможностью получения данных образца, причем соответствующие уровни экспрессии биомаркеров, включая множество типов мкРНК, в полученном у человека образце регистрируют для каждого индивидуума, блок определения поражения, содержащий обученную модель, причем поражение заболеваниями получают с возможностью определения предварительно посредством выполнения машинного обучения с использованием обучающих данных, и блок извлечения признака, выполненный с возможностью вводить множество данных образцов, к которым прикрепляют маркировочную информацию о поражении заболеванием, в блок определения поражения для того, чтобы определять поражение, чтобы количественно определять степени важности соответствующего признака из множества биомаркеров, которые получают с использованием обученной модели посредством вычисления определения поражения, для каждых данных образца, и для того, чтобы извлекать предварительно определяемое число биомаркеров в качестве отличительных биомаркеров, относящихся к заболеванию, на основе числовых значений степени важности множества данных образцов, для каждого биомаркера.
[0018] Способ извлечения признака заболевания в соответствии с настоящим изобретением включает стадии получения данных образца, причем соответствующие уровни экспрессии биомаркеров, включая множество типов мкРНК, в полученном у человека образце регистрируют для каждого индивидуума, создания обученной модели, причем поражение заболеваниями получают с возможностью определения предварительно посредством выполнения машинного обучения с использованием обучающих данных, и ввода множества данных образцов, к которым прикрепляют маркировочную информацию о поражении заболеванием, в обученную модель для того, чтобы определять поражение, количественного определения степеней важности соответствующего признака множества биомаркеров, которые получают с использованием обученной модели посредством вычисления определения поражения, для каждых данных образца, и извлечения предварительно определяемого числа биомаркеров в качестве отличительных биомаркеров, относящихся к заболеванию, на основе числовых значений степени важности множества данных образцов, для каждого биомаркера.
Полезные эффекты изобретения
[0019] В соответствии с настоящим изобретением, обученную модель генерируют посредством выполнения машинного обучения, при этом обновляя параметры в процессе обучения с использованием нейронной сети. Следовательно, даже если человек не распознает существование мкРНК, связанной с заболеванием, предварительно, определение поражения можно осуществлять с высокой точностью.
[0020] Кроме того, в соответствии с настоящим изобретением, определение злокачественной опухоли и доброкачественной опухоли, что сложно с использованием стандартных способов тестирования, можно осуществлять с высокой точностью.
[0021] Кроме того, в соответствии с настоящим изобретением, множество данных образцов, к которым прикрепляют маркировочную информацию о пораженных индивидуумах, вводят в созданную обученную модель и вычисляют определение поражения, в процессе вычисления получают степень важности данных образца, получают абсолютное значение суммы степеней важности всех данных образца, ранжируют признак данных образца на основе абсолютного значения суммы степеней важности, и извлекают биомаркеры, соответствующие предварительно определяемому числу признака сверху в качестве отличительных биомаркеров, относящихся к заболеванию. Следовательно, важную мкРНК при определении поражения заболеванием можно извлекать в качестве отличительной мкРНК. Можно снижать производительность обработки, требуемую от компьютера, и можно усовершенствовать скорость обработки, при этом усовершенствуя точность определения поражения с использованием извлеченных отличительных биомаркеров.
Краткое описание фигур
[0022] На фиг. 1 представлена блочная диаграмма, иллюстрирующая конфигурацию устройства 10 определения поражения заболеванием в соответствии с настоящим изобретением.
На фиг. 2 представлена пояснительная диаграмма, иллюстрирующая идею обучения в нейронной сети.
На фиг. 3 представлена блок-схема, иллюстрирующая поток процесса обучения в устройстве 10 определения поражения заболеванием.
На фиг. 4 представлена блок-схема, иллюстрирующая поток процесса извлечения признака в устройстве 10 определения поражения заболеванием.
На фиг. 5 представлена таблица, иллюстрирующая точность определения поражения, когда настоящее изобретение применяют для различных заболеваний.
На фиг. 6 представлена блочная диаграмма, иллюстрирующая конфигурацию устройства 22 определения поражения заболеванием, в котором используют прием стэкинга.
Описание вариантов осуществления
[0023] [Первый вариант осуществления]
Далее, пример устройства определения поражения заболеванием в соответствии с первым вариантом осуществления будет описан со ссылкой на фиг. На фиг. 1 представлена блочная диаграмма, иллюстрирующая конфигурацию устройства 10 определения поражения заболеванием в соответствии с настоящим изобретением. Следует отметить, что устройство 10 определения поражения заболеванием может представлять собой устройство, разработанное в качестве специализированной машины, и поражение можно реализовать с помощью универсального компьютера. В этом случае устройство 10 определения поражения заболеванием снабжают центральным блоком обработки (CPU), блоком обработки графики (GPU), памятью и накопителем, таким как привод жесткого диска (не проиллюстрировано), которые предположительно обычно входят в универсальный компьютер. Не стоит и говорить, что различные процессы исполняют посредством программы для того, чтобы управлять этими универсальными компьютерами для того, чтобы выполнять функцию устройства 10 определения поражения заболеванием из данного примера.
[0024] Устройства 10 определения поражения заболеванием включает в себя по меньшей мере блок 11 получения данных образца, блок 12 определения поражения, блок 13 извлечения признака и блок 14 накопителя.
[0025] Блок 11 получения данных образца имеет функцию получения данных образца, в котором уровни экспрессии соответствующих биомаркеров, включая множество типов мкРНК, в полученном у человека образце, регистрируют для каждого индивидуума. Полученный у человека образец относится к образцу, полученному у человека, который может включают в себя биомаркеры, такие как мкРНК из крови, текучего вещества организма, среды клеточной культуры и т.п. Можно использовать любой прием для обнаружения биомаркеров, таких как мкРНК, из этих образцов, но прием, позволяющий обнаруживать все поддающиеся обнаружению биомаркеры, такие как мкРНК, насколько возможно, является более предпочтительным. Устройство обнаружения для биомаркеров может быть встроено в устройство 10 определения поражения заболеванием, или данные образца, обнаруживаемые вовне, можно получать посредством блока 11 получения данных образца через сеть связи. Данные образца для каждого индивидуума имеют, например, элементы данных для 2500 или более типов мкРНК, и каждый элемент мкРНК выполнен из числовых данных, представляющих уровень экспрессии на единичный объем.
[0026] Блок 12 определения поражения включает в себя обученную модель, в которой поражение заболеваниями получают с возможностью определения предварительно посредством выполнения машинного обучения с использованием обучающих данных, и имеет функцию для того, чтобы определять, поражены ли данные образца индивидуума заболеванием, используя обученную модель. Обучающие данные относится к данным образца, к которым прикрепляют маркировочную информацию в отношении поражения заболеваниями. Для того чтобы генерировать обученную модель, благоприятно иметь множество данных образцов пораженных индивидуумов и множество данных образцов непораженных индивидуумов. Следует отметить, что, в дальнейшем описании, описание приведено для случая, в котором машинное обучение представляет собой обучение с использованием нейронной сети в качестве примера, но вариант осуществления не ограничен этим случаем, и применимы различные типы машинного обучения.
[0027] На фиг. 2 представлена пояснительная диаграмма, иллюстрирующая идею обучения в нейронной сети. Как проиллюстрировано на фиг. 2, при обучении с использованием нейронной сети, нейронная сеть выполнена с возможностью получать обучающие данные (данные образца с маркировочной информацией) в качестве ввода и результат определения поражения в качестве вывода. В качестве современного обучения с использованием нейронной сети, например, можно рассматривать управление нейронной сетью для того, чтобы осуществлять процесс получения функции потерь, и обучение для того, чтобы осуществлять определение поражения заболеванием по значению функции потерь. Корректируют параметры нейронной сети по разности между вводимыми данными и результатом определения, осуществляют обучение для того, чтобы усовершенствовать точность определения, и получают обученную модель. Примеры нейронной сети, упоминаемой здесь, включают Feedforward, CNN, VAE, GAN и AAE.
[0028] Блок 18 вычисления важности имеет функцию для того, чтобы вычислять степень важности, которая служит в качестве ориентира того, насколько значение каждого биомаркера в данных образца влияет на определение поражения при выполнении определения поражения для данных образца, используя обученную модель, в блоке 12 определения поражения. Вычисление степени важности является таким же, как количественное определение степени важности в блоке 13 извлечения признака, описанном далее. Следует отметить, что, в случае, когда определение поражения в данных образца осуществляют в блоке 12 определения поражения, также возможно вводить данные образца в обученную модель и выводить только результат определения поражения заболеванием. Даже в этом случае вычисляют степень важности и выполняют определение в обученной модели, но может иметь место случай, когда блок 18 вычисления важности не функционирует независимо. То есть, в настоящем изобретении, случай, когда определение поражения осуществляют в блоке 12 определения поражения, включает случай, когда блок 18 вычисления важности выполняет функцию внутреннего процесса блока 12 определения поражения.
[0029] Блок 13 извлечения признака имеет функцию для того, чтобы извлекать отличительные биомаркеры, относящиеся к заболеваниям. Отличительный биомаркер представляет собой биомаркер, эффективный для определения пораженного индивидуума и непораженного индивидуума заболеванием. Способ извлечения отличительных биомаркеров представляет собой ввод множества данных образцов, к которым прикрепляют маркировочную информацию о поразивших заболеваниях, в обученную модель, обученную в блоке 12 определения поражения, и выполнение определения поражения, количественное определение степеней важности соответствующего признака для множества биомаркеров, которые получают в обученной модели, посредством вычисления определения поражения для каждых данных образца, получение суммы количественно определяемых признаков множества данных образцов для каждого биомаркера и извлечение предварительно определяемого числа биомаркеров из тех, которые имеют большое значение суммы, в качестве отличительных биомаркеров, относящихся к заболеванию.
[0030] Более конкретно, в блоке 13 извлечения признака, степени важности признака соответствующих биомаркеров количественно определяют с помощью процесса вычисления функции потерь Li в отношении i-х данных образца, используя обученную модель, для каждых данных образца, процесса выполнения обратного распространения ошибки со значением Li функции потерь в качестве начальной точки и вычисления градиента gij=∂Li/∂xj в отношении признака xj, соответствующего каждому из множества типов биомаркеров образца i, и процесса получения абсолютного значения суммы градиентов для всех образцов в качестве степени важности Sj=|Σ_{i}gij| признака, биомаркеры ранжируют в нисходящем порядке по степени важности и предварительно определяемое число биомаркеров сверху, например, 100 биомаркеров, извлекают в качестве отличительных биомаркеров.
[0031] Блок 19 вычисления важности признака имеет функцию для того, чтобы вычислять важность признака, которая служит в качестве ориентира того, насколько значение каждого отличительного биомаркера влияет на определение поражения, когда только извлеченный биомаркер используют в качестве элемента вводимых данных, и осуществляют определение поражения, когда отличительный биомаркер извлекают в блоке 13 извлечения признака. В случае, когда биомаркеры ранжируют в нисходящем порядке по степени важности и предварительно определяемое число биомаркеров сверху, например, 100 биомаркеров, извлекают в качестве отличительных биомаркеров, процесс выполнения определения поражения с использованием 100 биомаркеров в качестве ввода обучают посредством нейронной сети, генерируют обученную модель в случае 100 отличительных биомаркеров, и в случае, когда определение поражения в данных образца осуществляют посредством блока 12 определения поражения с использованием обученной модели, важность признака вычисляют посредством блока 19 вычисления важности признака, и осуществляют определение поражения. Также возможно вводить данные образца в обученную модель и выводить только результат определения поражения заболеванием, аналогичным образом случаю блока 18 вычисления важности, описанного выше. Даже в этом случае, вычисляют важность признака и выполняют определение в обученной модели, но могут иметь место случаи, когда блок 19 вычисления важности признака не функционирует независимо. То есть, в настоящем изобретении, случай, когда определение поражения осуществляют в блоке 12 определения поражения, включает случай, когда блок 19 вычисления важности признака выполняет функцию внутреннего процесса блока 12 определения поражения.
[0032] Блок 14 накопителя имеет функцию накопления данных, которые используют в устройстве 10 определения поражения заболеванием, и данных, получаемых в качестве результата обработки. Конкретно, как проиллюстрировано на фиг. 1, накапливают по меньшей мере данные 15 образца, получаемые в блоке 11 получения данных образца, обучающие данные 16, к которым прикрепляют маркировочную информацию в отношении поражения заболеваниями в данных образца, обученную модель 17, сгенерированную посредством машинного обучения с использованием обучающих данных, и т.п.
[0033] Далее поток обработки в устройстве 10 определения поражения заболеванием в соответствии с настоящим изобретением описан со ссылкой на фиг. На фиг. 3 представлена блок-схема, иллюстрирующая поток процесса обучения в устройстве 10 определения поражения заболеванием. Для того чтобы осуществлять определение поражения заболеваниями в блоке 12 определения поражения устройства 10 определения поражения заболеванием, обученную модель предварительно нужно генерировать посредством выполнения обучения посредством нейронной сети. Создание обученной модели можно осуществлять посредством блока 12 определения поражения или обученную модель, которую генерировали отдельно, можно использовать посредством блока 12 определения поражения после хранения в блоке 14 накопителя.
[0034] На фиг. 3, сначала создание обученной модели начинают с получения обучающих данных (стадия S11). Кроме того, тестовые данные также получают по мере необходимости. Тестовые данные представляют собой данные образца, с которыми прикрепляют маркировочную информацию в отношении поражения заболеваниями, подобно обучающим данным, и представляют собой данные образца, отличные от обучающих данных. Предварительную обработку осуществляют на полученных обучающих данных (стадия S12). При предварительной обработке, процесс выбеливания линейного преобразования каждой размерности выполняют так, что усредненное по всем обучающим данным становится 0 и дисперсия становится 1, для каждой размерности вектора признаков из обучающих данных. Затем каждый параметр нейронной сети инициализируют (стадия S13). В качестве способа инициализации, например, возможен способ инициализации каждого параметра с помощью случайного числа. После этого, обучающие данные вводят в инициализированную нейронную сеть и осуществляют обучение (стадия S14). Обучение осуществляют для того, чтобы усовершенствовать точность определения посредством надлежащей модификации параметров так, что результаты определения при определении поражения совпадают с маркировочной информацией обучающих данных. После обучения, чтобы измерять точность определения, перекрестную валидацию можно осуществлять с использованием тестовых данных (стадия S15). Обучение прекращают в момент, когда гарантированно получают обученную модель с определенной точностью определения, обученную модель выводят и процесс прекращают (стадия S16).
[0035] На фиг. 4 представлена блок-схема, иллюстрирующая поток процесса извлечения признака в устройстве 10 определения поражения заболеванием. На фиг. 4, при извлечении признака заболевания, сначала получают множество данных образцов, к которым маркировочная информация, обозначающая пораженных индивидуумов (стадия S21). Предварительную обработку осуществляют для множества полученных данных образцов (стадия S22). При предварительной обработке осуществляют процесс выбеливания при линейном преобразовании каждой размерности так, что усредненное по всем данных образца становится 0 и дисперсия становится 1, для каждой размерности вектора признаков в данных образца. Затем данные образца вводят в обученную модель и выполняют вычисление определения поражения (стадия S23). Вычисление определения поражения, например, представляет собой вычисление функции потерь. Для каждых данных образца, степень важности извлекают для каждого признака данных образца (стадия S24). При извлечении степени важности вычисляют градиент, относящийся к каждому признаку данных образца, и величину градиента количественно определяют в качестве степени важности, например. Затем, для каждого признака, вычисляют сумму степеней важности всех данных образца (стадия S25). Признак ранжируют в нисходящем порядке по абсолютному значению суммы степеней важности, и предварительно определяемое число признака извлекают сверху (стадия S26). Биомаркер, соответствующий извлеченному признаку, извлекают в качестве отличительного биомаркера, относящегося к заболеванию, и процесс прекращают (стадия S27).
[0036] Как описано выше, в соответствии с устройством 10 определения поражения заболеванием по настоящему изобретению, обученную модель генерируют посредством выполнения обучения посредством нейронной сети, используя обучающие данные, имеющие элементы данных множества типов (например, 2500 типов или больше) мкРНК, и определение поражения заболеванием осуществляют с использованием обученной модели и, таким образом, осуществляют обучение, при этом параметры обновляют так, что уровни экспрессии мкРНК, которые значимы для определения поражения в процессе обучения посредством нейронной сети, влияет на определение, в соответствии с чем определение поражения можно точно выполнять, даже если человек предварительно не распознает присутствие мкРНК, связанной с заболеванием.
[0037] Кроме того, в соответствии с устройством 10 определения поражения заболеванием по настоящему изобретению, множество данных образцов, к которым прикрепляют маркировочную информацию о пораженных индивидуумах, вводят в созданную обученную модель и вычисляют определение поражения, степень важности каждого признака данных образца получают в процессе вычисления, абсолютное значение суммы степеней важности всех данных образца получают для каждого признака, признак данных образца ранжируют на основе абсолютного значения суммы степеней важности и биомаркеры, соответствующие предварительно определяемому числу признака сверху, извлекают в качестве отличительных биомаркеров, относящихся к заболеванию, в соответствии с чем важную мкРНК при определении поражения заболеванием можно извлекать в качестве отличительной мкРНК.
[0038] Преимущество извлечения отличительного биомаркера состоит в том, что у компьютера можно снижать необходимую производительность обработки и скорость обработки можно усовершенствовать, при этом сохраняя точность определения поражения. В частности, например, обученная модель, которая выполняла обучение на основе данных об уровнях экспрессии 2500 или больше типов мкРНК, делает возможным высокоточное определение поражения с одной стороны, очень высокая производительность обработки необходима для компьютера для обработки вычислений и время обработки вычислений также велико с другой стороны. Следовательно, например, если верхние 100 отличительных мкРНК извлекают на основе степени важности, обучение осуществляют посредством нейронной сети с использованием данных образца, имеющих верхние 100 мкРНК в качестве элементов данных для того, чтобы генерировать обученную модель, и определение поражения осуществляют с использованием обученной модели, имеет место такое преимущество, что определение поражения можно осуществлять с точностью, сравнимой со случаем определения поражения на основе 2500 типов, можно снижать производительность обработки компьютера для обработки вычислений и можно укорачивать время обработки вычислений.
[0039] В качестве примера усовершенствования точности, в стандартном способе диагностирования злокачественной опухоли молочной железы с использованием пяти типов мкРНК, диагностическая точность составляла 89%, тогда как в приеме определения поражения в соответствии с настоящим изобретением с использованием 2500 типов мкРНК, достигают диагностирования злокачественной опухоли молочной железы с точностью 99,6%, и точность чрезвычайно усовершенствуют.
[0040] Кроме того, в соответствии с приемом определения поражения с использованием верхних 100 типов отличительной мкРНК, извлеченных посредством устройства определения поражения в соответствии с настоящим изобретением, используя 2500 типов мкРНК, диагноз злокачественной опухоли молочной железы возможен с точностью 99,57%, а определение поражения можно выполнять с точностью, сравнимой со случаем использования 2500 типов мкРНК.
[0041] [Второй вариант осуществления] В первом варианте осуществления дано описание с использованием вычисления для получения функции потерь Li в качестве вычисления для определения поражения заболеванием и градиента каждого признака функции потерь Li в качестве степени важности для извлечения признака. Однако настоящее изобретение не ограничено этим примером, и другие примеры описаны во втором варианте осуществления.
[0042] Во втором варианте осуществления, линейный классификатор обучают посредством локальных интерпретируемых независимых от модели объяснений (LIME) и в процессе обучения получают степень важности. Обучение осуществляют для получения обучающих данных в качестве ввода и линейный классификатор в качестве обученной модели в качестве вывода. Для каждых обучающих данных обучают линейное обучаемое средство, которое аппроксимирует обученный предиктор. В этом случае, шум добавляют в данные образца для того, чтобы создавать множество искусственных векторов признаков, и искусственный вектор признаков подают в обученный предиктор для получения виртуальной маркировки (или вероятности распределения для маркировки). Линейный классификатор обучают с использованием полученного искусственного вектора признаков и виртуальной маркировки. Линейный классификатор для маркировки y, полученный таким образом, можно выражать как fi(y|x)=Σjwijxj. По этому линейному классификатору вычисляют степень важности Sj. Например, степень важности Sj вычисляют как Sj=|Σiwij|. Ранжирование осуществляют на основе степени важности Sj, полученной таким образом, и извлекают отличительные биомаркеры, относящиеся к заболеванию.
[0043] Как описано выше, даже если степень важности вычисляют с использованием приема обучения линейного классификатора посредством LIME, можно осуществлять определение поражения с точностью и можно извлекать отличительные биомаркеры.
[0044] [Третий вариант осуществления]
При вычислении для извлечения признака можно получать степень важности каждого признака посредством вычисления посредством послойного распространения релевантности (LRP). Однако в этом приеме предполагают, что предиктор имеет следующие три свойства: (1) имеет нейронную сеть без ветвления; (2) имеет слои с различными размерностями на вводе/выводе размерностей, в слоях в нейронной сети, используемой для предиктора, представляющие собой только все связующие слои; и (3) выводит k-мерный вектор, соответствующий числу k типов маркировок, и i-й вывод, представляющий i-ую вероятность предсказания.
[0045] Степень важности Sij вычисляют для каждых данных образца i и каждого признака j. При вычислении сначала признак данных образца i подают в обученную нейронную сеть и осуществляют прямое распространение. Слои пересекают в обратном порядке от блока вывода и рекурсивно вычисляют вектор важности R, представляющий степень важности в каждом слое. Порядок обработки при вычислении схож со способом обратного распространения ошибки, но вычисление, фактически выполняемое в каждом слое, отличается. j-е значение вектора важности R в блоке ввода (который имеет ту же размерность, что и входной вектор признаков, аналогично способу обратного распространения ошибки) определяют как важность Sij для признака j. После завершения вычисления для всех данных образца, вычисляют степень важности Sj каждого признака j, например, как Sj=|ΣiSij|. Осуществляют ранжирование на основе степени важности Sj, полученной таким образом, и извлекают отличительные биомаркеры, относящиеся к заболеванию.
[0046] Как описано выше, даже если степень важности вычисляют с использованием приема обучения предиктора посредством LRP, можно осуществлять определение поражения с точностью и можно извлекать отличительные биомаркеры.
[0047] В вариантах осуществления с первого до третьего описаны примеры с использованием мкРНК в качестве биомаркеров. Однако что угодно может представлять собой биомаркеры до тех пор, пока их уровни экспрессии можно обнаруживать и количественно в полученном у человека образце. Наиболее значимый признак настоящего изобретения состоит в том, что биомаркеры можно использовать при определении поражения, без распознавания того, что биомаркер действует на заболевание, и, таким образом, не только мкРНК, но также определяемый качественно биомаркер можно использовать без каких-либо проблем.
[0048] В вариантах осуществления с первого до третьего, вычисление для получения абсолютного значения суммы степеней важности множества данных образцов выполняют для каждого признака, соответствующего биомаркеру, как вычисление для того, чтобы извлекать отличительный биомаркер, но настоящее изобретение не ограничено этим. Например, максимальные значения степени важности в множестве данных образцов извлекают для каждого признака, соответствующего биомаркеру, как степени важности признака, степени важности (максимальные значения) каждого извлеченного признака сравнивают, предварительно определяемое число биомаркеров сверху в нисходящем порядке по значению степени важности извлекают в качестве отличительных биомаркеров, относящихся к заболеванию.
[0049] Определение поражения и извлечение признака посредством устройства 10 определения поражения заболеванием, которое описано в вариантах осуществления с первого до третьего, применимы не только к иллюстративной злокачественной опухоли молочной железы, но также к диагностированию различных злокачественных опухолей, а также применимы к различным заболеваниям, отличным от злокачественной опухоли.
[0050] [Четвертый вариант осуществления]
Как описано в первом варианте осуществления, настоящее изобретение можно применять к определению поражения для различных заболеваний. На фиг. 5 представлена таблица, иллюстрирующая точность определения поражения, когда настоящее изобретение применяют для различных заболеваний. Фиг. 5 иллюстрирует результат случая, когда машинное обучение осуществляют на данных образцов пациентов, пораженных заболеваниями, и здоровых субъектов, и определение поражения осуществляют с использованием обученной модели, которая делает возможным определение поражения в множестве типов злокачественных опухолей. Здесь, в качестве примера, описан случай использования множества данных образцов пациентов, пораженных конкретным типом злокачественной опухоли, и множества данных образцов здоровых субъектов, в качестве данных образцов для обучения. Здесь, данные образца пациента, пораженного конкретным типом злокачественной опухоли, например, представляют собой «данные образца пациента, пораженного злокачественной опухолью молочной железы», «данные образца пациента, пораженного злокачественной опухолью предстательной железы», или тому подобное, и маркировку одного типа злокачественной опухоли прикрепляют к одним данным образца. Здесь множество типов злокачественных опухолей, таких как злокачественная опухоль молочной железы и злокачественная опухоль предстательной железы, определяют предварительно в качестве группы заболеваний, и для того, чтобы определять, имеет ли место поражение любым заболеванием в группе заболеваний или не имеет место поражение любым из заболеваний, которые определены в группе заболеваний, используют данные образца пациента, пораженного заболеванием, которое определено в группе заболеваний, и данные образца пациента, не пораженного любым из заболеваний, которые определены в группе заболеваний.
Пациента, не пораженного любым из заболеваний, которые определены в группе заболеваний, лечат как здорового субъекта. В этом случае маркировка, указывающая на тип злокачественной опухоли, не предоставлена, и вместо этого предоставлена маркировка, указывающая на здорового субъекта. (В случае, когда маркировка, указывающая на здорового субъекта, отдельно не предоставлена, и маркировка, указывающая на тип злокачественной опухоли, не предоставлена, данные образца можно определять как данные образца здорового субъекта. Однако, чтобы упрощать описание, взамен предоставляют маркировку, указывающую на здоровый субъект, не предоставляя маркировку, указывающую на тип злокачественной опухоли.)
В результате машинного обучения, когда определение поражения для данных образца конкретного пациента осуществляют с использованием полученной обученной модели, присутствие поражения для множества злокачественных опухолей, такое как «присутствие поражения злокачественной опухолью молочной железы, присутствие поражения злокачественной опухолью предстательной железы, присутствие поражения злокачественной опухолью поджелудочной железы...» определяют независимо и исключительно, и присутствие поражения определяют для одного из типов злокачественных опухолей. Например, для следующих трех злокачественных опухолей выполняют такое определение, как «интенсивность поражения злокачественной опухолью молочной железы составляет 70%, интенсивность поражения злокачественной опухолью предстательной железы составляет 20%, интенсивность поражения злокачественной опухолью предстательной железы составляет 10%, вероятность оказаться здоровым субъектом составляет 0%». Тогда, для этого пациента, выводят результат определения, что пациент поражен злокачественной опухолью молочной железы с наибольшей интенсивностью поражения. Между тем, в случае, когда выполняют определение, такое как «интенсивность поражения злокачественной опухолью молочной железы составляет 10%, интенсивность поражения злокачественной опухолью предстательной железы составляет 5%, интенсивность поражения злокачественной опухолью предстательной железы составляет 5% и вероятность оказаться здоровым субъектом составляет 80%». Пациента определяют, как здорового человека с наибольшей вероятностью. Такой прием в целом называют многоклассовым, и, когда вышеуказанные результаты определения суммируют, получают 100%. На фиг. 5 представлен список, в котором сведена точность определения для типов злокачественных опухолей и доброкачественных заболеваний с помощью такого способа. Следует отметить, что далее описаны подробности о доброкачественных заболеваниях и злокачественных заболеваниях.
Общее число образцов, используемых для определения, на фиг. 5 составляет приблизительно 5000. Как проиллюстрировано на фиг. 5, точность определения для здорового субъекта составляет 99,79%, точность определения для злокачественной опухоли молочной железы составляет 99,72%, точность определения для доброкачественного заболевания молочной железы составляет 100%, точность определения для злокачественной опухоли предстательной железы составляет 99,16%, точность определения для доброкачественного заболевания предстательной железы составляет 99,16%, точность определения для злокачественной опухоли поджелудочной железы составляет 99,10%, точность определения для злокачественной опухоли желчных путей составляет 99,06%, точность определения для злокачественной опухоли ободочной кишки составляет 99,61%, точность определения для злокачественной опухоли желудка составляет 99,61%, точность определения для злокачественной опухоли пищевода составляет 99,70%, точность определения для злокачественной опухоли печени составляет 99,85%, точность определения для доброкачественного панкреатического заболевания составляет 99,74%, и определение поражения для различных заболеваний можно осуществлять с очень высокой точностью.
[0051] Кроме того, в качестве признака настоящего изобретения, определение поражения можно осуществлять не только для злокачественных заболеваний, но также для доброкачественных заболеваний. Как проиллюстрировано на фиг. 5, взаимосвязи между злокачественной опухолью молочной железы и доброкачественным заболеванием молочной железы, между злокачественной опухолью предстательной железы и доброкачественным заболеванием предстательной железы, помимо злокачественной опухоли поджелудочной железы и злокачественной опухоли желчных путей и доброкачественного панкреатического заболевания, находятся во взаимосвязи между злокачественным заболеванием и доброкачественным заболеванием. То есть, если обучение осуществляют для множества заболеваний во взаимосвязи между злокачественным заболеванием и доброкачественным заболеванием в устройстве определения поражения заболеванием, и эти взаимосвязи определяют одновременно, имеет место эффект, позволяющий определять, представляет ли заболевание собой злокачественное заболевание или доброкачественное заболевание. Например, генерируют обученную модель, в которой можно определять и злокачественную опухоль молочной железы и доброкачественное заболевание молочной железы, используя множество обучающих данных, к которым прикрепляют маркировочную информацию в отношении поражения соответствующими заболеваниями с тем, чтобы можно было определять и злокачественную опухоль молочной железы, и доброкачественное заболевание молочной железы. Если определение поражения осуществляют с использованием этой обученной модели, злокачественную опухоль молочной железы и доброкачественное заболевание молочной железы можно различать и определять с высокой точностью. С помощью этого процесса можно точно различать злокачественное новообразование и доброкачественное новообразование. Например, при злокачественной опухоли молочной железы, очень сложно проводить различия между злокачественным новообразованием и доброкачественным новообразованием с помощью любого стандартного диагностического способа, в частности, это невозможно на ранней стадии. Следовательно, имеет место такая проблема, что молочная железа может подвергаться резекции, даже если имеет место возможность доброкачественного новообразования. Однако в соответствии с определением поражения заболеванием по настоящему изобретению, различают злокачественное новообразование и доброкачественное новообразование, чтобы тем самым осуществлять подходящее лечение без резекции частей, имеющих доброкачественные возможности. В этом отношении, можно говорить, что влияние на QOL пациента огромно, и это является прорывным изобретением.
[0052] Для того чтобы реализовать устройство определения поражения для осуществления определения поражения множеством заболеваний одновременно, множество данных образцов, к которым прикрепляют маркировочную информацию, указывающую на поражение любым из множества заболеваний, получают в качестве обучающих данных для генерации обученной модели. Например, как проиллюстрировано на фиг. 5, чтобы генерировать обученную модель для осуществления определения поражения одновременно для всех 12 типов, включая 11 типов заболеваний и 1 тип, обозначающий здорового субъекта, в том числе здоровье, злокачественную опухоль молочной железы, доброкачественное заболевание молочной железы, злокачественную опухоль предстательной железы, доброкачественное заболевание предстательной железы, злокачественную опухоль поджелудочной железы, злокачественную опухоль желчных путей, злокачественную опухоль ободочной кишки, злокачественную опухоль желудка, злокачественную опухоль пищевода, злокачественную опухоль печени, доброкачественное панкреатическое заболевание, получают множество данных образцов пациентов, пораженных любым из 11 типов заболеваний, и данные образца, к которым прикрепляют маркировочную информацию об 11 заболеваниях. Кроме того, также получают множество данных образцов здоровых пациентов, к которым маркировочную информацию прикрепляют только к маркировочному элементу для здорового субъекта, не пораженного 11 заболеваниями. Полагая, что маркировочную информацию выражают с помощью флагов «0» и «1» в данных образца пациента, пораженного злокачественной опухолью молочной железы, «1» задают только для маркировочного элемента злокачественной опухоли молочной железы и «0» задают для всех маркировочных элементов других 10 заболеваний.
[0053] Обучение осуществляют, чтобы иметь возможность выводить результат определения поражения, который является таким же, как маркировочная информация, используя множество данных образцов, к которым прикрепляют маркировочную информацию об 11 типах заболеваний, и множество данных образцов здоровых субъектов, в которых маркировочную информацию прикрепляют только к маркировочному элементу для здорового субъекта, не пораженного 11 типами заболеваний, полученным как описано выше, чтобы получать обученную модель. В процессе обучения, в случае нейронной сети, можно осуществлять многозадачное обучение, такое как совместное использование нижнего слоя (слоя, близкого ко вводу) нейронной сети для индивидуальных задач. При многозадачном обучении, знание, получаемое в задачах индивидуального предсказания, можно совместно использовать для нескольких задач и можно ожидать усовершенствования точности.
[0054] Следует отметить, что обученная модель не ограничена случаем выполнения определения поражения для всех 11 типов одновременно, и обученная модель может представлять собой обученную модель, в которой возможно определение поражения только двух типов злокачественной опухоли молочной железы и доброкачественного заболевания молочной железы, обученную модель, в которой возможно определение поражения только двумя типами злокачественной опухоли предстательной железы и доброкачественного заболевания предстательной железы, обученную модель, в которой возможно определение поражения тремя типами злокачественной опухоли поджелудочной железы, злокачественной опухоли желчных путей и доброкачественного панкреатического заболевания, или обученную модель, в которой возможно одновременное определение поражения большим числом заболеваний, чем 11 заболеваний.
[0055] Кроме того, в приведенном выше описании варианта осуществления, множество данных образцов, к которым прикрепляют маркировочную информацию, указывающую на поражение любым одним из множества заболеваний, получали в качестве обучающих данных для генерации обученной модели, и в этом случае определение поражения основано на допущении о том, что пациент поражен только конкретным типом из множества типов злокачественных опухолей, или пациент не поражен каким-либо из множества типов злокачественных опухолей. Однако существуют случаи, когда пациент поражен множеством типов злокачественных опухолей из-за метастатической злокачественной опухоли или тому подобного. В этом случае, определение поражения можно осуществлять посредством модификации способа создания маркировки данных образцов, подлежащих использованию в качестве обучающих данных, и применения приема, схожего с описанным выше вариантом осуществления. В качестве примера, в случае, когда пациент поражен злокачественной опухолью легких и злокачественной опухолью желудка, получают обучающие данные образца, имеющие маркировочные элементы, соответствующие злокачественной опухоли легких и злокачественной опухоли желудка, которые установлены на «1», и другие маркировочные элементы, которые установлены на «0», и обученную модель создают посредством машинного обучения, а определение поражения осуществляют с использованием обученной модели. Эти приемы называют множественной маркировкой, и они оказывают эффект на осуществление определения поражения для одной или нескольких злокачественных опухолей посредством одного определения, посредством прикрепления маркировок, указывающих на множество различных злокачественных заболеваний, к обучающим данным образцов и создания обученной модели посредством выполнения машинного обучения.
[0056] С использованием устройства определения поражения и обученной модели, полученной, как описано выше, определение поражения злокачественными заболеваниями и доброкачественными заболеваниями можно осуществлять одновременно, или определение поражения множеством заболеваний можно осуществлять одновременно при одном исследовании.
[0057] [Пятый вариант осуществления] Несмотря на то, что устройство определения поражения в вариантах осуществления с первого до четвертого может выводить заключения в отношении того, поражен ли пациент заболеванием, посредством ввода данных образца пациента в обученную модель, биомаркеры, которые влияют на определение для достижения заключения, не могут быть получены. Однако существует возможность роста потребности знать, какие биомаркеры влияют на определение, чтобы врач мог узнавать причину, на которой основано заключение, или чтобы врач мог объяснить пациенту причину, на которой основано заключение.
[0058] Следовательно, при вводе данных образца пациента, подлежащих определению поражения, в обученную модель и выполнении определения поражения, можно вычислять степень важности каждой размерности признака, соответствующей биомаркеру, и биомаркер, вносящий вклад в заключение об определении поражения, можно извлекать и выводить на основе величины значения степени важности.
[0059] Степень важности каждой размерности признака, соответствующей биомаркеру, вычисляют как градиент gj в отношении признака xj, с помощью процесса вычисления функции потерь L, используя обученную модель, для данных образца, и процесса выполнения обратного распространения ошибки с использованием значения L функции потерь в качестве начальной точки и вычисления градиента gj=∂L/∂xj для признака xj, соответствующего каждому из множества типов биомаркеров. Вычисление градиента здесь схоже с таковым для первого варианта осуществления. Однако здесь градиент отличается от первого варианта осуществления в том отношении, что градиент вычисляют только для данных образца одного пациента, вместо вычисления суммы множества данных образцов.
[0060] Кроме того, степень важности можно вычислять посредством обучения линейного классификатора посредством локальных интерпретируемых независимых от модели объяснений (LIME), и степень важности получают в процессе обучения. Как описано во втором вариант осуществления, линейный классификатор для маркировки y, полученный посредством выполнения обучения с помощью LIME, можно выражать как fi(y|x)=Σjwijxj. В случае, когда имеют место одни данные образца пациента, подлежащие определению поражения, i для числа образцов равно 1, и таким образом степень важности для признака xj можно вычислять с помощью wj. То есть, линейное обучаемое средство, которое аппроксимирует обученную модель в блоке 12 определения поражения, обучают с помощью LIME, и коэффициент линейного обучаемого средства, соответствующий размерности признака каждого биомаркера в случае, когда данные образца пациента, подлежащие определению поражения, вводят в линейное обучаемое средство, получают в качестве степени важности каждого биомаркера.
[0061] Кроме того, для вычисления степени важности, степень важности каждого признака можно получать, например, посредством вычисления с помощью послойного распространения релевантности (LRP). Как описано в третьем варианте осуществления, при вычислении посредством LRP, признак данных образца пациента, подлежащий определению поражения, предоставляют в обученную нейронную сеть и осуществляют прямое распространение. Слои пересекают в обратном порядке от блока вывода, и рекурсивно вычисляют вектор важности R, который представляет степень важности в каждом слое, в соответствии с чем вектор важности R можно вычислять в качестве степени важности каждой отличительной размерности признака для биомаркера.
[0062] Описанные выше три способа вычисления степени важности являются примерами, и другие способы можно использовать до тех пор, пока способы позволяют вычислять степень важности для каждого биомаркера данных образца пациента, подлежащих определению поражения.
[0063] Как описано выше, степень важности вычисляют для каждого биомаркера данных образца пациента, подлежащих определению поражения, биомаркер, вносящий вклад в заключение об определении поражения, извлекают на основе вычисляемой степени важности и маркер выводят из блока вывода определения вклада биомаркера. Извлечение биомаркеров, вносящих вклад в заключение, можно осуществлять посредством вывода предварительно определяемого числа биомаркеров сверху в нисходящем порядке по значению степени важности, или с использованием способа отображения тепловой карты, или можно рассматривать тому подобное.
[0064] Таким образом, биомаркер, вносящий вклад в заключение, выводят из блока вывода определения вклада биомаркера вместе с результатом определения поражения, в соответствии с чем биомаркер, который вносит вклад в определение поражения, может быть представлен каждому индивидуальному пациенту и, таким образом, биомаркер можно описывать как основу для определения, когда врач сообщает результат определения поражения пациенту. Кроме того, врач может узнавать причину, по которой сделано заключение. Кроме того, зная биомаркер, который является основой для определения поражения, также существует возможность использования в способе индивидуального выбора способа лечения в соответствии с биомаркером, вносящим вклад в определение в будущем.
[0065] [Шестой вариант осуществления]
В вариантах осуществления с первого до третьего способ вычисления на основе вычисления градиент, LIME, LRP и т.п. описаны в качестве способа вычисления степени важности в блоке 13 извлечения признака, а степень важности вычисляли посредством получения абсолютного значения суммы множества данных образцов. Однако способ вычисления не ограничен способом вычисления на основе абсолютного значения суммы. Например, степень важности можно вычислять с использованием способа вычисления нормы L1, нормы L2, нормы LP, которая является обобщением указанных выше норм, и т.п.
[0066] То есть в устройстве извлечения признака заболевания, в котором предусмотрен блок получения данных образца, выполненный с возможностью получения данных образца, причем соответствующие уровни экспрессии биомаркеров, включая множество типов мкРНК, в полученном у человека образце регистрируют для каждого индивидуума, блок определения поражения, содержащий обученную модель, причем поражение заболеваниями получают с возможностью определения предварительно посредством выполнения машинного обучения с использованием обучающих данных, и блок извлечения признака, выполненный с возможностью вводить множество данных образцов, к которым прикрепляют маркировочную информацию о поражении заболеванием, в блок определения поражения для того, чтобы определять поражение, чтобы получать степени важности соответствующего признака множества биомаркеров, полученных с использованием обученной модели, посредством вычисления определения поражения, для каждых данных образца, и чтобы извлекать предварительно определяемое число биомаркеров в качестве отличительных биомаркеров, относящихся к заболеванию, на основе числовых значений степени важности множества данных образцов, для каждого биомаркера, процесс извлечения предварительно определяемого числа биомаркеров, важных при определении поражения заболеванием, в нисходящем порядке на основе величины степени важности, например, верхних 100 биомаркеров, становится возможным при использовании не только абсолютного значения суммы, но также способа вычисления нормы L1, нормы L2 и нормы LP, которая представляет собой обобщение указанных выше норм, в качестве способа вычисления степени важности на основе вычисления градиента, LIME, LRP или тому подобного в блоке извлечения признака.
[0067] В качестве преимуществ извлечения важных биомаркеров при определении поражения заболеванием, можно ожидать эффект, оказываемый на нахождение биомаркера, специфичного для заболевания, посредством извлечения отличительного биомаркера каждого заболевания и выполнения сравнения среди множества заболеваний, и можно ожидать эффект триггера, оказываемый на нахождения неизвестной релевантности между отличительным биомаркером и заболеванием, в дополнение к эффекту снижения производительности обработки, которое необходимо для компьютера, и усовершенствования скорости обработки, при этом сохраняя точность определения поражения, описанную в первом варианте осуществления.
[0068] [Седьмой вариант осуществления]
В вариантах осуществления с первого до шестого описание дано на примере использования нейронной сети в качестве обучаемой машины, которая конфигурирует обученную модель, но обучаемая машина не ограничена нейронной сетью, и различные приемы, такие как градиентный бустинг, случайный лес (лес принятия решений), дополнительные деревья, способ опорных векторов, логистическая регрессия или способ K ближайших соседей, можно использовать в качестве обучаемой машины. В обучаемой машине, отличной от нейронной сети, способ обратного распространения ошибки нельзя применять при вычислении степени важности. Следовательно, в таком случае, степень важности можно вычислять посредством вычисления градиента посредством численного дифференцирования.
[0069] [Восьмой вариант осуществления]
В вариантах осуществления с первого до седьмого, описана конфигурация для того, чтобы вводить данные образца пациента, подлежащие определению поражения, в устройство определения поражения заболеванием, состоящем из одной обученной модели, и выполнять определение поражения в блоке 12 определения поражения, состоящем из обученной модели. Однако настоящее изобретение не ограничено этими примерами. Предсказание определения поражения можно осуществлять с помощью каждой из множества обучаемых машин, и результат определения поражения можно получать посредством стэкинговой обучаемой машины, которая выводит результат определения на основе множества получаемых результатов предсказания.
[0070] На фиг. 6 представлена блочная диаграмма, иллюстрирующая конфигурацию устройства 22 определения поражения заболеванием, в котором используют прием стэкинга. На фиг. 6 обучаемые машины 201, 202,... и 20n представляют собой различные типы обучаемых машин. Тип обучаемых машин 201, 202,... и 20n включает нейронную сеть, градиентный бустинг, случайный лес (лес принятия решений), дополнительные деревья, способ опорных векторов, логистическую регрессию, способ K ближайших соседей и т. п. Кроме того, обучаемая машина может различно использовать Feedforward, CNN, VAE, GAN, AAE и т. п., которые представляют собой нейронные сети. Обучаемые машины 201, 202,... и 20n конфигурируют по обученной модели, которую обучали предварительному определению поражения для того же заболевания, на основе тех же обучающих данных. Чтобы использовать прием стэкинга, нужно использовать по меньшей мере две или больше обучаемых машин различных типов.
[0071] Стэкинговую обучаемую машину 21 конфигурируют по обученной модели, которую предварительно обучали выводить конечный результат определения поражения относительно данных образца пациента, подлежащих определению поражения, с использованием множества результатов предсказания, выводимых соответствующими обучаемыми машинами 201, 202,... и 20n. Стэкинговая обучаемая машина 21 может представлять собой любое из нейронной сети, градиентного бустинга, случайного леса (леса принятия решений), дополнительных деревьев, способа опорных векторов, логистической регрессии, способа K ближайших соседей и т.п.
[0072] Как проиллюстрировано на фиг. 6, устройство 22 определения поражения заболеванием, в котором используют прием стэкинга, сначала вводит данные образца пациента, подлежащие определению поражения, в каждую из множества обучаемых машин 201, 202,... и 20n. Каждая из множества обучаемых машин 201, 202,... и 20n выводит результат предсказания в отношении поражения заболеванием на основе каждой обученной модели. Множество результатов предсказания вводят в стэкинговую обучаемую машину 21. Стэкинговая обучаемая машина 21 выводит конечный результат определения поражения на основе множества результатов предсказания.
[0073] Как описано выше, используя устройство 22 определения поражения заболеванием, в котором используют прием стэкинга, точность определения можно усовершенствовать по сравнению с определением поражения с помощью одной обучаемой машины. Это обусловлено тем, что обучаемые машины имеют возможность иметь сильные и слабые точки при улавливании признака данных образца в зависимости от типов обучаемых машин. В отличие от этого, в соответствии с устройством определения поражения 22, в котором используют стэкинг, стэкинговая обучаемая машина 21 обучается взаимодействию и сильным и слабым точкам соответствующих обучаемых машин, и, таким образом, можно осуществлять конечное определение поражения, отражающее взаимодействие и сильные и слабые точки, в соответствии с чем точность определения можно усовершенствовать по сравнению со случаем одной обучаемой машины, соответственно.
[0074] [Девятый вариант осуществления]
В вариантах осуществления с первого до седьмого дано описание устройства определения поражения заболеванием, содержащего одну обучаемую машину. Однако можно осуществлять комплексное обучение с использованием результатов предсказания, соответственно предсказанных с помощью множества обучаемых машин. Комплексное обучение представляет собой прием получения геометрического среднего вероятностей предсказания, соответственно, выводимых множеством обучаемых машин, и вывода конечного результата предсказания. Множество обучаемых машин могут быть одного и того же типа или можно использовать обучаемые машины различных типов. Посредством выполнения такого комплексного обучения можно усовершенствовать точность определения поражения заболеваниями. Кроме того, комплексное обучение можно применять в устройстве 22 определения поражения заболеванием, в котором используют прием стэкинга, описанный в восьмом варианте осуществления. В этом случае получают множество стэкинговых обучаемых машин 21, получают геометрическое среднее выводов результатов предсказания для множества стэкинговых обучаемых машин 21 и выводят конечный результат предсказания, в соответствии с чем точность определения поражения заболеваниями можно усовершенствовать.
[0075] В приведенном описании варианта осуществления дано описание с помощью мкРНК в реактиве, полученном у человека, в качестве репрезентативного организма, но разумеется, что человек, имеющий обычные знания в области, к которой относится изобретение, может повышать точность определения поражения схожими заболеваниями, используя прием, схожий с настоящим вариантом осуществления, в организмах, отличных от человека, таких как животные, включая домашних и сельскохозяйственных животных.
[0076] [Приложение]
Описанный выше вариант осуществления описан так, что человек, имеющий обычные знания в области, к которой относится изобретение, может выполнять изобретение.
[1] Устройство определения поражения заболеванием, содержащее:
блок получения данных образца, выполненный с возможностью получения данных образца, включающие соответствующие уровни экспрессии биомаркеров, в том числе множество типов мкРНК, в образце, полученном из индивидуального организма;
обученную модель, в которой поражение заболеваниями получают с возможностью определения предварительно посредством выполнения машинного обучения с использованием обучающих данных; и
блок определения поражения, выполненный с возможностью осуществлять определение поражения для данных образца на основе степени важности каждого биомаркера, используя обученную модель.
[2] Устройство определения поражения заболеванием, содержащее:
блок получения данных образца, выполненный с возможностью получения данных образца, включающих в себя соответствующие уровни экспрессии биомаркеров, включая множество типов мкРНК, в образце, полученном из индивидуального организма;
обученную модель, в которой определяется поражение заболеваниями, полученную предварительно посредством выполнения машинного обучения с использованием обучающих данных;
блок вычисления важности, выполненный с возможностью вводить данные образца в обученную модель для того, чтобы количественно определять степень важности каждого биомаркера; и
блок определения поражения, выполненный с возможностью осуществлять определение поражения для данных образца по степени важности.
[3] Устройство определения поражения заболеванием в соответствии с [1] или [2], содержащее:
блок извлечения признака, выполненный с возможностью извлекать отличительный биомаркер, относящийся к заболеванию, на основе степени важности, причем
определение поражения осуществляют на основе важности признака, которая представляет собой степень важности каждого отличительного биомаркера в случае выполнения определения заболевания с использованием только извлеченного отличительного биомаркера.
[4] Устройство определения поражения заболеванием в соответствии с [1] или [2], содержащее:
блок извлечения признака, выполненный с возможностью извлекать отличительный биомаркер, относящийся к заболеванию, на основе степени важности; и
блок вычисления важности признака, выполненный с возможностью количественно определять важность признака, которая представляет собой степень важности каждого отличительного биомаркера в случае выполнения определения заболевания с использованием только извлеченного отличительного биомаркера, причем
блок определения поражения выполняет определение поражения по важности признака.
[5] Устройство определения поражения заболеванием в соответствии с любым одним из [2]-[4], в котором
блок вычисления важности количественно определяет степени важности признаков соответствующих биомаркеров с помощью процесса вычисления функции потерь Li в отношении i-х данных образца, используя обученную модель, для каждых данных образца, процесса выполнения обратного распространения ошибки с использованием значения Li функции потерь в качестве начальной точки и вычисления градиента gij=∂Li/∂xj в отношении признака xj, соответствующего каждому из множества типов биомаркеров образца i, и процесса получения абсолютного значения суммы градиентов для всех образцов в качестве степени важности Sj=|Σ_{i}gij| признака.
[6] Устройство определения поражения заболеванием в соответствии с любым одним из [1]-[5], причем
обучающие данные представляют собой данные образца, к которым прикрепляют маркировочную информацию в отношении того, поражены ли индивидуумы заболеваниями.
[7] Устройство определения поражения заболеванием в соответствии с [6], причем
создание обученной модели осуществляют после осуществления процесса выбеливания, процесс выбеливания представляет собой линейное преобразование каждой размерности так, что усредненное по всем обучающим данным становится 0 и дисперсия становится 1, для каждой размерности вектора признаков из обучающих данных.
[8] Способ определения поражения заболеванием, включающий стадии:
получения данных образца, включающих в себя соответствующие уровни экспрессии биомаркеров, в том числе множества типов мкРНК, в образце, полученном из индивидуального организма;
генерации обученной модели, в которой определяется поражение заболеваниями, получаемой предварительно посредством выполнения машинного обучения с использованием обучающих данных; и
выполнения определения поражения для данных образца на основе степени важности каждого биомаркера, используя обученную модель.
[9] Способ определения поражения заболеванием, включающий стадии:
получения данных образца, включающих в себя соответствующие уровни экспрессии биомаркеров, в том числе множества типов мкРНК, в образце, полученном из индивидуального организма;
генерации обученной модели, в которой определяется поражение заболеваниями, получаемой предварительно посредством выполнения машинного обучения с использованием обучающих данных;
ввода данных образца в обученную модель для того, чтобы количественно определять степень важности каждого биомаркера; и
выполнения определения поражения для данных образца по степени важности.
[10] Способ определения поражения заболеванием в соответствии с [8] или [9], включающий стадию:
извлечения отличительного биомаркера, относящегося к заболеванию, на основе суммы степеней важности, причем
определение поражения осуществляют на основе важности признака, которая представляет собой степень важности каждого отличительного биомаркера, в случае выполнения определения заболевания с использованием только извлеченного отличительного биомаркера.
[11] Способ определения поражения заболеванием в соответствии с [8] или [9], включающий стадии:
извлечения отличительного биомаркера, относящегося к заболеванию, на основе суммы степеней важности; и
количественного определения важности признака, которая представляет собой степень важности каждого отличительного биомаркера, в случае выполнения определения заболевания с использованием только извлеченного отличительного биомаркера, причем
определение поражения осуществляют по важности признака на стадии выполнения определения поражения.
[12] Способ определения поражения заболеванием в соответствии с любым одним из [9]-[11], причем
на стадии вычисления степени важности, степени важности признаков соответствующих биомаркеров количественно определяют с помощью процесса вычисления функции потерь Li в отношении i-х данных образца, используя обученную модель, для каждых данных образца, процесса выполнения обратного распространения ошибки с использованием значения Li функции потерь в качестве начальной точки и вычисления градиента gij=∂Li/∂xj в отношении признака xj, соответствующего каждому из множества типов биомаркеров образца i, и процесса получения абсолютного значения суммы градиентов для всех образцов в качестве степени важности Sj=|Σ_{i}gij| признака.
[13] Способ определения поражения заболеванием в соответствии с любым одним из [8]-[12], в котором
обучающие данные представляют собой данные образца, к которым прикрепляют маркировочную информацию в отношении того, поражены ли индивидуумы заболеваниями.
[14] Способ определения поражения заболеванием в соответствии с [12], в котором
создание обученной модели осуществляют после осуществления процесса выбеливания, процесс выбеливания представляет собой линейное преобразование каждой размерности так, что усредненное по всем обучающим данным становится 0 и дисперсия становится 1, для каждой размерности вектора признаков из обучающих данных.
[15] Устройство извлечения признака заболевания, содержащее:
блок получения данных образца, выполненный с возможностью получения данных образца, в которых соответствующие уровни экспрессии биомаркеров, в том числе множества типов мкРНК, в образце, полученном из индивидуального организма, регистрируют для каждого индивидуума;
блок определения поражения, содержащий обученную модель, причем определяется поражение заболеваниями, полученную предварительно посредством выполнения машинного обучения с использованием обучающих данных; и
блок извлечения признака, выполненный с возможностью вводить множество данных образцов, к которым прикрепляют маркировочную информацию о поражении заболеванием, в блок определения поражения для того, чтобы определять поражение, чтобы количественно определять степени важности соответствующего признака множества биомаркеров, полученных с использованием обученной модели, посредством вычисления определения поражения, для каждых данных образца, и чтобы извлекать предварительно определяемое число биомаркеров в качестве отличительных биомаркеров, относящихся к заболеванию, на основе числовых значений степени важности множества данных образцов, для каждого биомаркера.
[16] Устройство извлечения признака заболевания в соответствии с [15], в котором блок извлечения признака количественно определяет степень важности признаков соответствующих биомаркеров с помощью процесса вычисления функции потерь Li в отношении i-х данных образца, используя обученную модель, для каждых данных образца, процесса выполнения обратного распространения ошибки с использованием значения Li функции потерь в качестве начальной точки и вычисления градиента gij=∂Li/∂xj в отношении признака xj, соответствующего каждому из множества типов биомаркеров образца i, и процесса получения абсолютного значения суммы градиентов для всех образцов в качестве степени важности Sj=|Σ_{i}gij| признака.
[17] Устройство извлечения признака заболевания в соответствии с любым одним из [15]-[16], в котором
обучающие данные представляют собой данные образца, к которым прикрепляют маркировочную информацию в отношении того, поражены ли индивидуумы заболеваниями.
[18] Устройство извлечения признака заболевания в соответствии с любым одним из [15]-[17], в котором
создание обученной модели осуществляют после осуществления процесса выбеливания, процесс выбеливания представляет собой линейное преобразование каждой размерности так, что усредненное по всем обучающим данным становится 0 и дисперсия становится 1, для каждой размерности вектора признаков из обучающих данных.
[19] Устройство извлечения признака заболевания в соответствии с [18], в котором
множество данных образцов, к которым прикрепляют маркировочную информацию о поражении заболеванием, которые используют в блоке извлечения признака, используют после осуществления процесса выбеливания, процесс выбеливания представляет собой линейное преобразование каждой размерности так, что усредненное по всем данных образца становится 0 и дисперсия становится 1, для каждой размерности вектора признаков.
[20] Способ извлечения признака заболевания, включающий стадии:
получения данных образца, в которых соответствующие уровни экспрессии биомаркеров, в том числе множества типов мкРНК, в образце, полученном из индивидуального организма, регистрируют для каждого индивидуума;
генерации обученной модели, в которой определяется поражение заболеваниями, получаемой предварительно посредством выполнения машинного обучения с использованием обучающих данных; и
ввода множества данных образцов, к которым прикрепляют маркировочную информацию о поражении заболеванием, в обученную модель для того, чтобы определять поражение, количественного определения степени важности соответствующего признака множества биомаркеров, полученного с использованием обученной модели, посредством вычисления определения поражения, для каждых данных образца, и извлечения предварительно определяемого числа биомаркеров в качестве отличительных биомаркеров, относящихся к заболеванию, на основе числовых значений степени важности множества данных образцов, для каждого биомаркера.
[21] Устройство определения поражения заболеванием, содержащее:
блок получения данных образца, выполненный с возможностью получения данных образца, включающих в себя соответствующие уровни экспрессии биомаркеров, в том числе множества типов мкРНК, в образце, полученном из индивидуального организма;
обученную модель, в которой определяется поражение заболеваниями, получаемую предварительно посредством выполнения машинного обучения с использованием множества обучающих данных, включая данные образца, каждые включают в себя элементы для идентификации присутствия или отсутствия поражения множеством заболеваний и к которым прикрепляют маркировочную информацию, маркировочная информация указывает, поражены ли индивидуумы любым из заболеваний; и
блок определения поражения, выполненный с возможностью осуществлять определение поражения в отношении того, поражены ли данные образца, подлежащие определению, множеством заболеваний, используя обученную модель.
[22] Устройство определения поражения заболеванием в соответствии с [21], которое дополнительно включает в себя:
блок вывода определения вклада биомаркера, выполненный с возможностью извлекать биомаркер, который вносит вклад в результат определения поражения заболеванием, из биомаркеров, включенных в данные образца, подлежащие определению поражения заболеванием, и выводить извлеченный биомаркер.
[23] Устройство определения поражения заболеванием в соответствии с [22], в котором
блок вывода определения вклада биомаркера вычисляет, с помощью процесса вычисления функции потерь L, используя обученную модель, для данных образца, и процесса выполнения обратного распространения ошибки с использованием значения L функции потерь в качестве начальной точки и вычисления градиента gj=∂L/∂xj для признака xj, соответствующего каждому из множества типов биомаркеров, степень важности каждой размерности признака, соответствующей биомаркеру, в виде градиента gj для признака xj, и извлекает предварительно определяемое число биомаркеров в качестве биомаркеров, которые вносят вклад в результат определения поражения заболеванием, на основе величины степени важности.
[24] Устройство определения поражения заболеванием в соответствии с [22], в котором
блок вывода определения вклада биомаркера обучает линейное обучаемое средство, которое аппроксимирует обученную модель в блоке определения поражения посредством LIME, вычисляет коэффициент линейного обучаемого средства, коэффициент соответствует размерности признака каждого биомаркера, когда данные образца, подлежащие определению поражения, вводят в линейное обучаемое средство, в качестве степени важности каждого биомаркера, и извлекает предварительно определяемое число биомаркеров в качестве биомаркеров, которые вносят вклад в результат определения поражения заболеванием, на основе величины степени важности.
[25] Устройство определения поражения заболеванием в соответствии с [22], в котором
блок вывода определения вклада биомаркера выполняет прямое распространение посредством предоставления признака данных образца пациента, подлежащих определению поражения, в обученную модель в блоке определения поражения посредством LRP, рекурсивно вычисляет вектор важности R, представляющий степень важности в каждом слое, пересекая слои в обратном порядке от блока вывода, вычисляет вектор важности R в качестве степени важности каждой размерности признака, соответствующей каждому биомаркеру, и извлекает предварительно определяемое число биомаркеров в качестве биомаркеров, которые вносят вклад в результат определения поражения заболеванием на основе величины степени важности.
[26] Устройство определения поражения заболеванием, содержащее:
блок получения данных образца, выполненный с возможностью получения данных образца, включающих в себя соответствующие уровни экспрессии биомаркеров, в том числе множества типов мкРНК, в образце, полученном из индивидуального организма;
по меньшей мере две или больше обучаемых машин, выполненных с возможностью осуществлять машинное обучение, обычно используя множество обучающих данных, включающих данные образца, каждые включают в себя элементы для идентификации присутствия или отсутствия поражения множеством заболеваний и к которым прикрепляют маркировочную информацию, маркировочная информация указывает, поражены ли индивидуумы любым из заболеваний, обучаемые машины, соответственно, включают различные типы обученных моделей, которые предварительно обучали для того, чтобы определять поражение одним и тем же заболеванием, обучаемые машины выполнены с возможностью вывода результата предсказания в отношении того, поражены ли данные образца, подлежащие определению поражения заболеванием, заболеванием; и
стэкинговую обучаемую машину, которую обучали предварительно для того, чтобы выводить конечный результат определения, используя результаты предсказания от множества обучаемых машин в качестве вводов, и выполненную с возможностью выводить результат определения в отношении того, поражены ли данные образца, подлежащие определению поражения, заболеванием, на основе результатов предсказания от множества обучаемых машин.
[27] Устройство определения поражения заболеванием в соответствии с любым одним из [21]-[26], причем
множество заболеваний включает по меньшей мере два типа злокачественной опухоли молочной железы, доброкачественного заболевания молочной железы, злокачественной опухоли предстательной железы, доброкачественного заболевания предстательной железы, злокачественной опухоли поджелудочной железы, злокачественной опухоли желчных путей, злокачественной опухоли ободочной кишки, злокачественной опухоли желудка, злокачественной опухоли пищевода, злокачественной опухоли печени и доброкачественного панкреатического заболевания.
[28] Устройство определения поражения заболеванием, содержащее:
множество данных образцов, соответственно полученных от индивидуальных организмов и включающих в себя соответствующие уровни экспрессии множества типов биомаркеров, в том числе мкРНК, в полученных от индивидуальных организмов образцах;
обученную модель, в которой определяется присутствие или отсутствие поражения множеством заболеваний, множество заболеваний выводят как результат машинного обучения с использованием, в качестве обучающих данных, данных образца с маркировочной информацией, в которой элементы для идентификации, поражен ли каждый индивидуальный организм множеством заболеваний, предоставлены в качестве маркировочной информации, для каждых из множества данных образцов; и
блок определения поражения, выполненный с возможностью определять присутствие или отсутствие поражения каждым из множества заболеваний, используя обученную модель, для данных образца, вновь полученных от другого организма, для которых определение поражения подлежит выполнению.
[29] Устройство определения поражения заболеванием, содержащее:
множество данных образцов, соответственно полученных от индивидуальных организмов и включающих в себя соответствующие уровни экспрессии множества типов биомаркеров, в том числе мкРНК, в образце, полученном из индивидуального организма;
обученную модель, в которой присутствие или отсутствие поражения предварительно определяемым заболеванием, предварительно определяемое заболевание выводят как результат машинного обучения с использованием, в качестве обучающих данных, данных образца с маркировочной информацией, в которой элементы для идентификации, поражен ли каждый индивидуальный организм любым одним из предварительно определяемой группы заболеваний, определяемой предварительно, или каждый индивидуальный организм не поражен любым из предварительно определяемой группы заболеваний, определяемой предварительно, в качестве информации, относящейся к заболеванию, при поражении заболеванием, или информации, показывающей, что индивидуальный организм не поражен, когда поражение отсутствует, в качестве маркировочной информации для каждых из множества данных образцов; и
блок определения поражения, выполненный с возможностью определять поражение любым одним из предварительно определяемой группы заболеваний или отсутствие поражения любым из предварительно определяемой группы заболеваний, используя обученную модель, для данных образца, вновь полученных от другого организма, для которых определение поражения подлежит выполнению.
[30] Способ определения поражения заболеванием, включающий стадии:
получения данных образца, включающих в себя соответствующие уровни экспрессии биомаркеров, в том числе множества типов мкРНК, в образце, полученном из индивидуального организма;
генерации обученной модели, в которой возможность поражения множеством заболеваний получают с возможностью определения предварительно посредством выполнения машинного обучения, используя множество обучающих данных, включающих в себя данные образца, каждые включают в себя элементы для идентификации присутствия или отсутствия поражения множеством заболеваний, и к которым прикрепляют маркировочную информацию, маркировочная информация показывает, поражены ли индивидуумы любым из заболеваний; и
выполнения определения поражения в отношении того, поражены ли данные образца, подлежащие определению, множеством заболеваний, используя обученную модель.
[31] Способ определения поражения заболеванием, включающий стадии:
получения данных образца, включающих в себя соответствующие уровни экспрессии биомаркеров, в том числе множества типов мкРНК, в образце, полученном из индивидуального организма;
получения множества результатов предсказания на основе по меньшей мере двух или больше обучаемых машин, выполненных с возможностью осуществлять машинное обучение, обычно используя множество обучающих данных, в том числе данные образца, каждые включают в себя элементы для идентификации присутствия или отсутствия поражения множеством заболеваний и к которым прикрепляют маркировочную информацию, маркировочная информация указывает, поражены ли индивидуумы любым из заболеваний, обучаемые машины, соответственно, включают в себя различные типы обученных моделей, которые обучали предварительно для того, чтобы определять поражение одним и тем же заболеванием, обучаемые машины выполняют с возможностью вывода результата предсказания в отношении того, поражены ли заболеванием данные образца, подлежащие определению поражения заболеванием; и
получения конечного результата определения на основе стэкинговой обучаемой машины, которую обучали предварительно для того, чтобы выводить конечный результат определения, используя результаты предсказания от множества обучаемых машин в качестве вводов, и которая выполнена с возможностью выводить результат определения в отношении того, поражены ли заболеванием данные образца, подлежащие определению поражения, на основе результатов предсказания от множества обучаемых машин.
[32] Способ определения поражения заболеванием, включающий стадии:
получения множества данных образцов, соответственно полученных от индивидуальных организмов и включающих в себя соответствующие уровни экспрессии множества типов биомаркеров, включая мкРНК, в полученных от индивидуальных организмов образцах;
генерации обученной модели, в которой присутствие или отсутствие поражения множеством заболеваний, множество заболеваний выводят как результат машинного обучения с использованием, в качестве обучающих данных, данных образца с маркировочной информацией, причем элементы для идентификации того, поражен ли каждый индивидуальный организм множеством заболеваний, предусмотрены в качестве маркировочной информации, для каждых из множества данных образцов; и
определения присутствия или отсутствия поражения каждым из множества заболеваний, используя обученную модель, для данных образца, вновь полученных от другого организма, для которых определение поражения подлежит выполнению.
[33] Способ определения поражения заболеванием, включающий стадии:
получения множества данных образцов, соответственно получаемых от индивидуальных организмов и включающих в себя соответствующие уровни экспрессии множества типов биомаркеров, включая мкРНК, в образце, полученном из индивидуального организма;
генерации обученной модели, в которой определяется присутствие или отсутствие поражения предварительно определяемым заболеванием, предварительно определяемое заболевание выводят как результат машинного обучения с использованием, в качестве обучающих данных, данных образца с маркировочной информацией, в которой элементы для идентификации, поражен ли каждый индивидуальный организм любым одним из предварительно определяемой группы заболеваний, определяемой предварительно, или каждый индивидуальный организм не поражен любым из предварительно определяемой группы заболеваний, определяемой предварительно, в качестве информации, относящейся к заболеванию, при поражении заболеванием, или информации, указывающей, что индивидуальный организм не поражен, когда поражение отсутствует, в качестве маркировочной информации для каждых из множества данных образцов; и
определения поражения любым одним из предварительно определяемой группы заболеваний или отсутствия поражения любым из предварительно определяемой группы заболеваний, используя обученную модель, для данных образца, вновь полученных от другого организма, для которых определение поражения подлежит выполнению.
[34] Программа определения поражения заболеванием для управления компьютером для того, чтобы реализовать процесс:
получения данных образца, включающих в себя соответствующие уровни экспрессии биомаркеров, в том числе множества типов мкРНК, в образце, полученном из индивидуального организма;
генерации обученной модели, в которой возможность поражения множеством заболеваний получают с возможностью определения предварительно посредством выполнения машинного обучения, используя множество обучающих данных, включающих в себя данные образца, каждые включают в себя элементы для идентификации присутствия или отсутствия поражения множеством заболеваний, и к которым прикрепляют маркировочную информацию, маркировочная информация показывает, поражены ли индивидуумы любым из заболеваний; и
выполнения определения поражения в отношении того, поражены ли данные образца, подлежащие определению, множеством заболеваний, используя обученную модель.
[35] Программа определения поражения заболеванием для управления компьютером для того, чтобы реализовать процесс:
получения данных образца, включающих в себя соответствующие уровни экспрессии биомаркеров, в том числе множества типов мкРНК, в образце, полученном из индивидуального организма;
получения множества результатов предсказания на основе по меньшей мере двух или больше обучаемых машин, выполненных с возможностью осуществлять машинное обучение, обычно используя множество обучающих данных, в том числе данные образца, каждые включают в себя элементы для идентификации присутствия или отсутствия поражения множеством заболеваний и к которым прикрепляют маркировочную информацию, маркировочная информация указывает, поражены ли индивидуумы любым из заболеваний, обучаемые машины, соответственно, включают в себя различные типы обученных моделей, которые обучали предварительно для того, чтобы определять поражение одним и тем же заболеванием, обучаемые машины выполняют с возможностью вывода результата предсказания в отношении того, поражены ли заболеванием данные образца, подлежащие определению поражения заболеванием; и
получения конечного результата определения на основе стэкинговой обучаемой машины, которую обучали предварительно для того, чтобы выводить конечный результат определения, используя результаты предсказания от множества обучаемых машин в качестве вводов, и которая выполнена с возможностью выводить результат определения в отношении того, поражены ли заболеванием данные образца, подлежащие определению поражения, на основе результатов предсказания от множества обучаемых машин.
[36] Программа определения поражения заболеванием для управления компьютером для того, чтобы реализовать процесс:
получения множества данных образцов, соответственно, полученных от индивидуальных организмов и включающих в себя соответствующие уровни экспрессии множества типов биомаркеров, включая мкРНК, в полученных от индивидуальных организмов образцах;
генерации обученной модели, в которой определяется присутствие или отсутствие поражения множеством заболеваний, множество заболеваний выводят как результат машинного обучения с использованием, в качестве обучающих данных, данных образца с маркировочной информацией, причем элементы для идентификации того, поражен ли каждый индивидуальный организм множеством заболеваний, предусмотрены в качестве маркировочной информации, для каждых из множества данных образцов; и
определения присутствия или отсутствия поражения каждым из множества заболеваний, используя обученную модель, для данных образца, вновь полученных от другого организма, для которых определение поражения подлежит выполнению.
[37] Программа определения поражения заболеванием для управления компьютером для того, чтобы реализовать процесс:
получения множества данных образцов, соответственно, полученных от индивидуальных организмов и включающих в себя соответствующие уровни экспрессии множества типов биомаркеров, включая мкРНК, в образце, полученном из индивидуального организма;
генерации обученной модели, в которой определяется присутствие или отсутствие поражения предварительно определяемым заболеванием, предварительно определяемое заболевание выводят как результат машинного обучения с использованием, в качестве обучающих данных, данных образца с маркировочной информацией, в которой элементы для идентификации, поражен ли каждый индивидуальный организм любым одним из предварительно определяемой группы заболеваний, определяемой предварительно, или каждый индивидуальный организм не поражен любым из предварительно определяемой группы заболеваний, определяемой предварительно, в качестве информации, относящейся к заболеванию, при поражении заболеванием, или информации, указывающей, что индивидуальный организм не поражен, когда поражение отсутствует, в качестве маркировочной информации для каждых из множества данных образцов; и
определения поражения любым одним из предварительно определяемой группы заболеваний или отсутствия поражения любым из предварительно определяемой группы заболеваний, используя обученную модель, для данных образца, вновь полученных от другого организма, для которых определение поражения подлежит выполнению.
Список ссылочных позиций
[0077]
10 Устройство определения поражения заболеванием
11 Блок получения данных образца
12 Блок определения поражения
13 Блок извлечения признака
14 Блок накопителя
15 Данные образца
16 Обучающие данные
17 Обученная модель
18 Блок вычисления важности
19 Блок вычисления важности признака
201, 202,..., 20n Обучаемая машина
21 Стэкинговая обучаемая машина
22 Устройство определения поражения заболеванием.

Claims (27)

1. Устройство определения поражения заболеванием для выполнения определения поражения множеством заболеваний, возникших во множестве областей тела, причем устройство содержит:
блок получения данных образца, выполненный с возможностью получения данных образца, включающих в себя уровни экспрессии множества типов мкРНК, в образце, полученном из индивидуального организма;
блок определения поражения, выполненный с возможностью ввода данных образца, подлежащих определению, и выполнения определения поражения в отношении того, поражены ли данные образца множеством заболеваний, возникших во множестве областей тела, с использованием обученной модели, в которой поражение для множества заболеваний является определимым и которая была получена заранее посредством выполнения машинного обучения с использованием обучающих данных, включающих в себя множество данных образца, каждые из которых включают в себя элементы для идентификации присутствия или отсутствия поражения множеством заболеваний во множестве областей тела.
2. Устройство определения поражения заболеванием по п. 1, причем:
блок определения поражения определяет, являются ли заболевания злокачественными или доброкачественными.
3. Устройство определения поражения заболеванием по п. 1 или 2, в котором
блок определения поражения выполняет комплексное обучение с использованием множества машин, обучающихся с использованием обученной модели соответственно.
4. Устройство определения поражения заболеванием по любому одному из пп. 1-3, содержащее
блок вывода определения вклада биомаркера, выполненный с возможностью извлекать по меньшей мере один биомаркер, который вносит вклад в определение поражения, из биомаркеров, включенных в данные образца, и выводить извлеченный биомаркер.
5. Устройство определения поражения заболеванием по любому одному из пп. 1-4, в котором блок определения поражения содержит:
по меньшей мере две или более обучаемых машины, каждая из которых сконфигурирована для вывода результатов прогнозирования относительно того, следует ли определять данные образца для заболеваний;
стэкинговую обучаемую машину, которую предварительно обучали для того, чтобы выводить конечный результат определения, используя результаты предсказания от множества обучаемых машин в качестве вводов, и которая выполнена с возможностью выводить результат определения в отношении того, поражены ли множеством заболеваний данные образца, подлежащие определению поражения, на основе результатов предсказания от множества обучаемых машин.
6. Устройство определения поражения заболеванием по любому одному из пп. 1-5, в котором
множество заболеваний включает в себя по меньшей мере два типа злокачественной опухоли молочной железы, доброкачественного заболевания молочной железы, злокачественной опухоли предстательной железы, доброкачественного заболевания предстательной железы, злокачественной опухоли поджелудочной железы, злокачественной опухоли желчных путей, злокачественной опухоли ободочной кишки, злокачественной опухоли желудка, злокачественной опухоли пищевода, злокачественной опухоли печени и доброкачественного панкреатического заболевания.
7. Устройство определения поражения заболеванием по любому одному из пп. 1-6, в котором блок определения поражения определяет
присутствие или отсутствие поражения каждым из множества заболеваний, используя обученную модель, для данных образца, вновь полученных от другого организма, для которых определение поражения подлежит выполнению.
8. Устройство определения поражения заболеванием по любому из пп. 1-7, в котором блок определения поражения определяет поражение любым одним из предварительно определяемой группы заболеваний или отсутствие поражения любым из предварительно определяемой группы заболеваний, используя обученную модель, для данных образца, вновь полученных от другого организма, для которых определение поражения подлежит выполнению.
9. Способ определения поражения заболеванием для выполнения определения поражения множеством заболеваний, возникших во множестве областей тела, осуществляемый компьютером, содержащий этапы:
получения данных образца, включающих в себя уровни экспрессии множества типов мкРНК, в образце, полученном из индивидуального организма; ввода данных образца, подлежащих определению;
выполнения определения поражения в отношении того, поражены ли данные образца множеством заболеваний, которые возникают во множестве областей тела, с использованием обученной модели, в которой поражение множеством заболеваний является определимым и которая была получена заранее посредством выполнения машинного обучения с использованием обучающих данных, включающих в себя множество данных образца, каждые из которых включают в себя элементы для идентификации присутствия или отсутствия поражения множеством заболеваний во множестве областей тела.
10. Способ определения поражения заболеванием по п.9, в котором этап выполнения определения поражения содержит этап
получения конечного результата определения на основе стэкинговой обучаемой машины, которую обучали предварительно для того, чтобы выводить конечный результат определения, используя результат предсказания от множества обучаемых машин в качестве вводов, и которая выполнена с возможностью выводить результат определения в отношении того, поражены ли множеством заболеваний данные образца, подлежащие определению поражения, на основе результатов предсказания от множества обучаемых машин.
11. Способ определения поражения заболеванием по п. 9 или 10, в котором этап выполнения определения поражения содержит этап
определения присутствия или отсутствия поражения каждым из множества заболеваний, используя обученную модель, для данных образца, вновь полученных от другого организма, для которых определение поражения подлежит выполнению.
12. Способ определения поражения заболеванием по любому одному из пп. 9-11, в котором этап выполнения определения поражения содержит этап
определения поражения любым одним из предварительно определяемой группы заболеваний или отсутствия поражения любым из предварительно определяемой группы заболеваний, используя обученную модель, для данных образца, вновь полученных от другого организма, для которых определение поражения подлежит выполнению.
13. Запоминающее устройство, в котором хранятся инструкции, сконфигурированные для побуждения процессора выполнять способ по любому из пп. 9-12.
RU2019116786A 2016-10-31 2017-10-31 Устройство определения поражения заболеванием, способ определения поражения заболеванием и программа определения поражения заболеванием RU2765695C2 (ru)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
JP2016213690 2016-10-31
JP2016-213690 2016-10-31
PCT/JP2017/039363 WO2018079840A1 (ja) 2016-10-31 2017-10-31 疾患の罹患判定装置、疾患の罹患判定方法及び疾患の罹患判定プログラム

Publications (3)

Publication Number Publication Date
RU2019116786A3 RU2019116786A3 (ru) 2020-11-30
RU2019116786A RU2019116786A (ru) 2020-11-30
RU2765695C2 true RU2765695C2 (ru) 2022-02-02

Family

ID=61195694

Family Applications (1)

Application Number Title Priority Date Filing Date
RU2019116786A RU2765695C2 (ru) 2016-10-31 2017-10-31 Устройство определения поражения заболеванием, способ определения поражения заболеванием и программа определения поражения заболеванием

Country Status (6)

Country Link
US (1) US20190267113A1 (ru)
EP (1) EP3534281A4 (ru)
JP (3) JP6280997B1 (ru)
CN (1) CN109923614A (ru)
RU (1) RU2765695C2 (ru)
WO (1) WO2018079840A1 (ru)

Families Citing this family (25)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP2430574A1 (en) 2009-04-30 2012-03-21 Patientslikeme, Inc. Systems and methods for encouragement of data submission in online communities
US11250340B2 (en) * 2017-12-14 2022-02-15 Microsoft Technology Licensing, Llc Feature contributors and influencers in machine learned predictive models
JP6879239B2 (ja) * 2018-03-14 2021-06-02 オムロン株式会社 異常検知システム、サポート装置およびモデル生成方法
WO2020008502A1 (ja) * 2018-07-02 2020-01-09 シンセティックゲシュタルト エルティーディー 情報処理システム、情報処理装置、サーバ装置、プログラム、又は方法
JP7362241B2 (ja) * 2018-11-02 2023-10-17 公益財団法人がん研究会 大腸がんの検査方法
EP3865872A4 (en) * 2018-11-19 2022-08-10 Canon Kabushiki Kaisha INFORMATION PROCESSING DEVICE, METHOD FOR CONTROLLING AN INFORMATION PROCESSING DEVICE, PROGRAM, CALCULATION DEVICE AND CALCULATION METHOD
US11151420B2 (en) * 2018-11-19 2021-10-19 International Business Machines Corporation Determination using learned model
US11894139B1 (en) * 2018-12-03 2024-02-06 Patientslikeme Llc Disease spectrum classification
CN110211690A (zh) * 2019-04-19 2019-09-06 平安科技(深圳)有限公司 疾病风险预测方法、装置、计算机设备及计算机存储介质
WO2020222287A1 (ja) * 2019-04-29 2020-11-05 株式会社Preferred Networks 訓練装置、罹患判定装置、機械学習方法、およびプログラム
JP6884810B2 (ja) * 2019-05-08 2021-06-09 キユーピー株式会社 情報提供装置、情報提供方法及びmiRNA重要度テーブル生成方法
CN110338843A (zh) * 2019-08-02 2019-10-18 无锡海斯凯尔医学技术有限公司 组织评价方法、装置、设备及计算机可读存储介质
CN110327074A (zh) * 2019-08-02 2019-10-15 无锡海斯凯尔医学技术有限公司 肝脏评价方法、装置、设备及计算机可读存储介质
JP7452990B2 (ja) * 2019-11-29 2024-03-19 東京エレクトロン株式会社 異常検知装置、異常検知方法及び異常検知プログラム
JP7412150B2 (ja) * 2019-11-29 2024-01-12 東京エレクトロン株式会社 予測装置、予測方法及び予測プログラム
WO2021142417A2 (en) * 2020-01-10 2021-07-15 Bisquertt Alejandro Systems for detecting alzheimer's disease
CN111312401B (zh) * 2020-01-14 2021-12-17 之江实验室 一种基于多标签学习的体检后慢性疾病预后***
US11468276B2 (en) * 2020-04-16 2022-10-11 Robert Bosch Gmbh System and method of a monotone operator neural network
CN111696662A (zh) * 2020-05-26 2020-09-22 平安科技(深圳)有限公司 疾病预测方法、装置及存储介质
CN112530595A (zh) * 2020-12-21 2021-03-19 无锡市第二人民医院 一种基于多分支链式神经网络的心血管疾病分类方法和装置
CN112685561A (zh) * 2020-12-26 2021-04-20 广州知汇云科技有限公司 一种跨病种的小样本临床医疗文本后结构化处理方法
JPWO2023053703A1 (ru) * 2021-09-29 2023-04-06
CN114613438B (zh) * 2022-03-08 2023-05-26 电子科技大学 一种miRNA与疾病的关联预测方法及***
KR20240092770A (ko) * 2022-12-15 2024-06-24 한국과학기술원 우울증 예측을 위한 인공지능 및 웹 기반 플랫폼
CN116578711B (zh) * 2023-07-06 2023-10-27 武汉楚精灵医疗科技有限公司 腹痛特征提取方法、装置、电子设备及存储介质

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20050048542A1 (en) * 2003-07-10 2005-03-03 Baker Joffre B. Expression profile algorithm and test for cancer prognosis
US20120143805A1 (en) * 2008-09-09 2012-06-07 Somalogic, Inc. Cancer Biomarkers and Uses Thereof
WO2012129378A1 (en) * 2011-03-22 2012-09-27 Keutgen Xavier M Distinguishing benign and malignant indeterminate thyroid lesions
RU2473555C2 (ru) * 2006-12-19 2013-01-27 ДжинГоу, Инк. Новые способы функционального анализа большого количества экспериментальных данных и групп генов, идентифицированных из указанных данных

Family Cites Families (24)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH11504739A (ja) * 1995-07-25 1999-04-27 ホルス ゼラピーティクス,インコーポレイテッド コンピュータ援用疾病診断方法
JP3480940B2 (ja) * 1996-02-09 2003-12-22 アデザ・バイオメデイカル・コーポレイシヨン ニューラルネットワーク関連アプリケーションを使用して医療診断テストおよび生化学診断テストを選択する方法
JP3525082B2 (ja) * 1999-09-16 2004-05-10 日本電信電話株式会社 統計モデル作成方法
JP2003006329A (ja) * 2001-06-26 2003-01-10 Hitachi Ltd 診断支援システム
JP3823192B2 (ja) * 2002-04-19 2006-09-20 学校法人慶應義塾 診療支援装置、診療支援方法、及び診療支援プログラム
US7774143B2 (en) * 2002-04-25 2010-08-10 The United States Of America As Represented By The Secretary, Department Of Health And Human Services Methods for analyzing high dimensional data for classifying, diagnosing, prognosticating, and/or predicting diseases and other biological states
AU2003300368A1 (en) * 2002-12-26 2004-07-29 Cemines, Llc. Methods and compositions for the diagnosis, prognosis, and treatment of cancer
EP1633234A4 (en) * 2003-06-03 2009-05-13 Physiosonics Inc SYSTEMS AND METHODS FOR DETERMINING INTRACRANIAL FA NON-INVASIVE PRESSURE AND ACOUSTIC TRANSDUCER ASSEMBLIES FOR USE THEREIN
JP5038671B2 (ja) * 2006-09-25 2012-10-03 株式会社東芝 検査項目選定装置、検査項目選定方法、及び検査項目選定プログラム
FI20070159A0 (fi) * 2007-02-23 2007-02-23 Teknillinen Korkeakoulu Menetelmä informaation integrointiin, valintaan ja esityksen oppimiseen
SI2340506T1 (sl) * 2008-09-09 2016-02-29 Somalogic, Inc. Biomarkerji za pljučni rak in njihove uporabe
JP2012508577A (ja) * 2008-11-12 2012-04-12 カリス ライフ サイエンシズ ルクセンブルク ホールディングス 表現型を決定するためのエキソソームの使用方法およびそのシステム
EP2239675A1 (en) 2009-04-07 2010-10-13 BIOCRATES Life Sciences AG Method for in vitro diagnosing a complex disease
CN101901345B (zh) * 2009-05-27 2013-02-27 复旦大学 一种差异蛋白质组学的分类方法
EP2517022A4 (en) * 2009-12-22 2013-07-10 Univ Michigan METABOLOMIC PROFILING OF PROSTATE CANCER
EP2354246A1 (en) * 2010-02-05 2011-08-10 febit holding GmbH miRNA in the diagnosis of ovarian cancer
JP2012051822A (ja) * 2010-08-31 2012-03-15 Institute Of Physical & Chemical Research 肺癌診断用ポリペプチド、肺癌の検出方法、および治療効果の評価方法
JP5637373B2 (ja) * 2010-09-28 2014-12-10 株式会社Screenホールディングス 画像の分類方法、外観検査方法および外観検査装置
JP5645761B2 (ja) * 2011-06-23 2014-12-24 登史夫 小林 医療データ解析方法、医療データ解析装置およびプログラム
CN104677999A (zh) 2013-11-29 2015-06-03 沈阳药科大学 血浆用于区分肝癌与肺癌的生物标记物
SG11201700944RA (en) 2014-08-07 2017-03-30 Agency Science Tech & Res Microrna biomarker for the diagnosis of gastric cancer
CN105243296A (zh) * 2015-09-28 2016-01-13 丽水学院 联合mRNA和microRNA表达谱芯片的肿瘤特征基因选择方法
CN105701365B (zh) * 2016-01-12 2018-09-07 西安电子科技大学 发现癌症相关基因的方法及相关***、药物制备方法
CN105550715A (zh) 2016-01-22 2016-05-04 大连理工大学 一种基于近邻传播聚类的集成分类器构建方法

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20050048542A1 (en) * 2003-07-10 2005-03-03 Baker Joffre B. Expression profile algorithm and test for cancer prognosis
RU2473555C2 (ru) * 2006-12-19 2013-01-27 ДжинГоу, Инк. Новые способы функционального анализа большого количества экспериментальных данных и групп генов, идентифицированных из указанных данных
US20120143805A1 (en) * 2008-09-09 2012-06-07 Somalogic, Inc. Cancer Biomarkers and Uses Thereof
WO2012129378A1 (en) * 2011-03-22 2012-09-27 Keutgen Xavier M Distinguishing benign and malignant indeterminate thyroid lesions

Also Published As

Publication number Publication date
EP3534281A1 (en) 2019-09-04
JP2018077814A (ja) 2018-05-17
RU2019116786A3 (ru) 2020-11-30
RU2019116786A (ru) 2020-11-30
EP3534281A4 (en) 2020-06-03
WO2018079840A1 (ja) 2018-05-03
JP2022024092A (ja) 2022-02-08
JP7411619B2 (ja) 2024-01-11
JPWO2018079840A1 (ja) 2019-09-19
JP7021097B2 (ja) 2022-02-16
CN109923614A (zh) 2019-06-21
US20190267113A1 (en) 2019-08-29
JP6280997B1 (ja) 2018-02-14

Similar Documents

Publication Publication Date Title
RU2765695C2 (ru) Устройство определения поражения заболеванием, способ определения поражения заболеванием и программа определения поражения заболеванием
Goldenberg et al. A new era: artificial intelligence and machine learning in prostate cancer
US11462325B2 (en) Multimodal machine learning based clinical predictor
Pannala et al. Artificial intelligence in gastrointestinal endoscopy
Chahal et al. A primer on artificial intelligence and its application to endoscopy
Iacucci et al. Artificial intelligence enabled histological prediction of remission or activity and clinical outcomes in ulcerative colitis
Hajabdollahi et al. Multiple abnormality detection for automatic medical image diagnosis using bifurcated convolutional neural network
Stoean et al. Ensemble of classifiers for length of stay prediction in colorectal cancer
Jiang et al. MHAttnSurv: Multi-head attention for survival prediction using whole-slide pathology images
He et al. Self-speculation of clinical features based on knowledge distillation for accurate ocular disease classification
Nalepa et al. Deep learning automates bidimensional and volumetric tumor burden measurement from MRI in pre-and post-operative glioblastoma patients
Sharma et al. Artificial intelligence in intestinal polyp and colorectal cancer prediction
Abdulkareem et al. Generalizable framework for atrial volume estimation for cardiac CT images using deep learning with quality control assessment
Abdulkareem et al. Predicting post-contrast information from contrast agent free cardiac MRI using machine learning: Challenges and methods
Freyre et al. Biomarker-based classification and localization of renal lesions using learned representations of histology—a machine learning approach to histopathology
Ghosh et al. Adam optimizer and categorical crossentropy loss function-based cnn method for diagnosing colorectal cancer
Tripathi et al. Tensor-based multimodal learning for prediction of pulmonary arterial wedge pressure from cardiac MRI
Bharathi et al. An efficient liver disease prediction based on deep convolutional neural network using biopsy images
CN115187580A (zh) 一种基于层级网络的可解释性超声图像结节识别方法
Singh Artificial intelligence in colorectal cancer: a review
Dey et al. Image examination system to detect gastric polyps from endoscopy images
Ramkumar Identification and Classification of Breast Cancer using Multilayer Perceptron Techniques for Histopathological Image
Balas et al. Soft Computing Applications: Proceedings of the 8th International Workshop Soft Computing Applications (SOFA 2018), Vol. II
Pandey et al. Bio-Marker Cancer Prediction System Using Artificial Intelligence
Shah et al. Recent Developments In Machine Learning Approach For Liver Disease Prediction