KR102241724B1 - 레이블 정보를 보정하는 방법 및 시스템 - Google Patents

레이블 정보를 보정하는 방법 및 시스템 Download PDF

Info

Publication number
KR102241724B1
KR102241724B1 KR1020200061582A KR20200061582A KR102241724B1 KR 102241724 B1 KR102241724 B1 KR 102241724B1 KR 1020200061582 A KR1020200061582 A KR 1020200061582A KR 20200061582 A KR20200061582 A KR 20200061582A KR 102241724 B1 KR102241724 B1 KR 102241724B1
Authority
KR
South Korea
Prior art keywords
label information
information item
patches
patch
corrected
Prior art date
Application number
KR1020200061582A
Other languages
English (en)
Inventor
박천성
Original Assignee
주식회사 루닛
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 주식회사 루닛 filed Critical 주식회사 루닛
Priority to KR1020200061582A priority Critical patent/KR102241724B1/ko
Priority to US16/953,693 priority patent/US11710552B2/en
Priority to KR1020210047603A priority patent/KR20210144567A/ko
Application granted granted Critical
Publication of KR102241724B1 publication Critical patent/KR102241724B1/ko

Links

Images

Classifications

    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16HHEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
    • G16H10/00ICT specially adapted for the handling or processing of patient-related medical or healthcare data
    • G16H10/40ICT specially adapted for the handling or processing of patient-related medical or healthcare data for data related to laboratory analysis, e.g. patient specimen analysis
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N20/00Machine learning
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods
    • G06N3/084Backpropagation, e.g. using gradient descent
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods
    • G06N3/088Non-supervised learning, e.g. competitive learning
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N5/00Computing arrangements using knowledge-based models
    • G06N5/04Inference or reasoning models
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T5/00Image enhancement or restoration
    • G06T5/50Image enhancement or restoration using two or more images, e.g. averaging or subtraction
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T7/00Image analysis
    • G06T7/0002Inspection of images, e.g. flaw detection
    • G06T7/0012Biomedical image inspection
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T7/00Image analysis
    • G06T7/10Segmentation; Edge detection
    • G06T7/11Region-based segmentation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/70Arrangements for image or video recognition or understanding using pattern recognition or machine learning
    • G06V10/77Processing image or video features in feature spaces; using data integration or data reduction, e.g. principal component analysis [PCA] or independent component analysis [ICA] or self-organising maps [SOM]; Blind source separation
    • G06V10/778Active pattern-learning, e.g. online learning of image or video features
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/98Detection or correction of errors, e.g. by rescanning the pattern or by human intervention; Evaluation of the quality of the acquired patterns
    • G06V10/987Detection or correction of errors, e.g. by rescanning the pattern or by human intervention; Evaluation of the quality of the acquired patterns with the intervention of an operator
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V20/00Scenes; Scene-specific elements
    • G06V20/60Type of objects
    • G06V20/69Microscopic objects, e.g. biological cells or cellular parts
    • G06V20/698Matching; Classification
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B40/00ICT specially adapted for biostatistics; ICT specially adapted for bioinformatics-related machine learning or data mining, e.g. knowledge discovery or pattern finding
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B45/00ICT specially adapted for bioinformatics-related data visualisation, e.g. displaying of maps or networks
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B50/00ICT programming tools or database systems specially adapted for bioinformatics
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16HHEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
    • G16H30/00ICT specially adapted for the handling or processing of medical images
    • G16H30/40ICT specially adapted for the handling or processing of medical images for processing medical images, e.g. editing
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16HHEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
    • G16H50/00ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics
    • G16H50/20ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics for computer-aided diagnosis, e.g. based on medical expert systems
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16HHEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
    • G16H50/00ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics
    • G16H50/70ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics for mining of medical data, e.g. analysing previous cases of other patients
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T2207/00Indexing scheme for image analysis or image enhancement
    • G06T2207/10Image acquisition modality
    • G06T2207/10056Microscopic image
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T2207/00Indexing scheme for image analysis or image enhancement
    • G06T2207/20Special algorithmic details
    • G06T2207/20081Training; Learning
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T2207/00Indexing scheme for image analysis or image enhancement
    • G06T2207/20Special algorithmic details
    • G06T2207/20084Artificial neural networks [ANN]
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T2207/00Indexing scheme for image analysis or image enhancement
    • G06T2207/30Subject of image; Context of image processing
    • G06T2207/30004Biomedical image processing
    • G06T2207/30024Cell structures in vitro; Tissue sections in vitro

Landscapes

  • Engineering & Computer Science (AREA)
  • Health & Medical Sciences (AREA)
  • Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Medical Informatics (AREA)
  • General Health & Medical Sciences (AREA)
  • General Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Public Health (AREA)
  • Software Systems (AREA)
  • Epidemiology (AREA)
  • Artificial Intelligence (AREA)
  • Evolutionary Computation (AREA)
  • Biomedical Technology (AREA)
  • Biophysics (AREA)
  • Computing Systems (AREA)
  • Primary Health Care (AREA)
  • Databases & Information Systems (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Mathematical Physics (AREA)
  • General Engineering & Computer Science (AREA)
  • Radiology & Medical Imaging (AREA)
  • Nuclear Medicine, Radiotherapy & Molecular Imaging (AREA)
  • Computational Linguistics (AREA)
  • Evolutionary Biology (AREA)
  • Molecular Biology (AREA)
  • Spectroscopy & Molecular Physics (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Biotechnology (AREA)
  • Multimedia (AREA)
  • Bioethics (AREA)
  • Quality & Reliability (AREA)
  • Pathology (AREA)
  • Image Analysis (AREA)

Abstract

본 개시는 적어도 하나의 컴퓨팅 장치에 의해 수행되는, 레이블 정보를 보정하는 방법에 관한 것이다. 복수의 패치를 포함하는, 병리 슬라이드 이미지를 획득하는 단계, 기계학습 모델을 이용하여, 획득된 병리 슬라이드 이미지에 포함된 복수의 패치에 대한 복수의 레이블 정보 아이템을 추론하는 단계, 추론된 복수의 레이블 정보 아이템을 병리 슬라이드 이미지에 적용하는 단계 및 추론된 복수의 레이블 정보 아이템이 적용된 병리 슬라이드 이미지를 어노테이터에 단말에 제공하는 단계를 포함할 수 있다.

Description

레이블 정보를 보정하는 방법 및 시스템{METHOD AND SYSTEM FOR REFINING LABEL INFORMATION}
본 개시는 레이블 정보에 대한 보정을 제공하는 방법에 관한 것이다. 보다 상세하게는, 기계학습 모델을 이용하여 목적 데이터에 대한 레이블 정보를 추론하고, 추론된 레이블 정보 아이템에 대한 응답을 기초로 기계학습 모델의 학습에 사용될 데이터를 결정할 수 있는 방법 및 시스템을 제공하는 것이다.
최근 프로세서, 메모리 및 카메라 등의 하드웨어가 급속히 발전됨에 따라, 인공지능(AI) 기술이 발전되고 각광받고 있다. 예를 들어, 이러한 AI 기술을 이미지 처리 분야에 적용하는 연구가 활발히 이루어지고 있다. 특히, 조직 샘플에 대한 병리 슬라이드 이미지의 레이블을 자동으로 생성 및 분석하는 분야에 AI 기술이 활용되고 있다.
한편, 지도 학습(supervised learning)이란, 레이블 정보가 주어진 데이터 세트를 학습하여, 입력 데이터에 대한 추론을 수행하는 인공신경망 모델을 구축하는 기계학습 방법이다. 학습 데이터 세트를 생성하기 위한, 레이블 정보를 태깅하는 어노테이션 작업은 보통 사람에 의해 수행되며, 대부분의 어노테이션 작업은 시간과 비용이 많이 소모될 뿐만 아니라, 어노테이션 작업 시에 일관성이 유지되기도 어려울 수 있다. 예를 들어, 병리 슬라이드 이미지에서 병변의 종류 또는 위치를 진단하는 인공신경망 모델의 학습 데이터는, 숙련된 전문의에 의해 어노테이션 작업이 수행되어야 한다. 그러나, 숙련된 전문의조차도 수백만 개의 세포가 들어있는 병리 슬라이드를 오류 없이, 일관성을 유지하면서 판독하는 것은 불가능에 가깝다.
한편, 목적 데이터(예를 들어, 종래의 병리 슬라이드 이미지)의 레이블을 자동으로 생성하기 위한 인공신경망 모델의 학습 데이터를 생성하는 과정에 있어서, 숙련된 전문가가 목적 데이터 전체(예를 들어, 병리 슬라이드 이미지 전체)에 대한 어노테이션 작업을 수행하는 것은 시간과 비용이 많이 들어 비효율적일 수 있다. 또한, 기계학습의 예측(prediction) 모델을 활용하여 레이블 정보를 추출하고, 재학습하는 방식의 준지도학습(semi-supervised learning)을 활용할 수도 있지만, 예측 모델을 직접 활용할 수 있는 태스크(task)가 한정적일 수 있다. 예를 들어, 레이블 정보가 분류(classification) 문제(예를 들어, 정답이 한 가지로 정해지는 문제)인 경우에는 예측 모델을 활용할 수 있지만, 레이블 정보가 분할(segmentation) 문제인 경우에는 성능 향상을 기대하기 어려울 수 있다.
본 개시의 일부 실시예에서는 상기와 같은 문제점을 해결하기 위한 목적 데이터에 대한 레이블 정보를 보정하는 방법을 제공한다.
본 개시의 일부 실시예에 따른 방법 및 시스템은, 복수의 패치 각각에 대한 컨피던스 스코어 또는 엔트로피 값 중 적어도 하나를 기초로 보정 대상 패치를 결정할 수 있다.
본 개시의 일부 실시예에 따른 방법 및 시스템은, 기계학습 모델을 이용하여 추론된 레이블 정보에 따라 적어도 하나의 패치에 대한 시각적 표시를 제공할 수 있다.
본 개시의 일부 실시예에 따른 방법 및 시스템은, 어노테이터에 의해 보정된 레이블 정보에 학습 가중치를 부여할 수 있다.
본 개시는 방법, 시스템 또는 명령어들을 저장하는 컴퓨터 판독가능 저장 매체, 컴퓨터 프로그램을 포함한 다양한 방식으로 구현될 수 있다.
본 개시의 일 실시예에 따른, 레이블 정보를 보정하는 방법은, 복수의 패치를 포함하는 병리 슬라이드 이미지를 획득하는 단계, 기계학습 모델을 이용하여, 획득된 병리 슬라이드 이미지에 포함된 복수의 패치에 대한 복수의 레이블 정보 아이템을 추론하는 단계, 추론된 복수의 레이블 정보 아이템을 병리 슬라이드 이미지에 적용하는 단계 및 추론된 복수의 레이블 정보 아이템이 적용된 병리 슬라이드 이미지를 어노테이터 단말에 제공하는 단계를 포함한다.
일 실시예에 따르면, 어노테이터 단말로부터 추론된 복수의 레이블 정보 아이템 중 적어도 하나의 레이블 정보 아이템에 대한 응답을 수신하는 단계를 더 포함한다. 여기서, 적어도 하나의 레이블 정보 아이템은 복수의 패치 중 적어도 하나의 패치와 연관될 수 있다.
일 실시예에 따르면, 어노테이터 단말로부터 추론된 복수의 레이블 정보 아이템 중 적어도 하나의 레이블 정보 아이템에 대한 응답을 수신하는 단계는, 적어도 하나의 레이블 정보 아이템의 확인(confirmation)을 수신하는 경우, 적어도 하나의 패치 및 적어도 하나의 레이블 정보 아이템을 기계학습 모델의 학습(training) 데이터 세트로 분류하는 단계를 포함한다.
일 실시예에 따르면, 어노테이터 단말로부터 추론된 복수의 레이블 정보 아이템 중 적어도 하나의 레이블 정보 아이템에 대한 응답을 수신하는 단계는, 적어도 하나의 패치에 대한 보정된 레이블 정보 아이템을 수신하는 단계 및 적어도 하나의 패치 및 보정된 레이블 정보 아이템을 기계학습 모델의 학습 데이터 세트로 분류하는 단계를 포함한다.
일 실시예에 따르면, 적어도 하나의 패치 및 보정된 레이블 정보 아이템을 기계학습 모델의 학습 데이터 세트로 분류하는 단계는, 기계학습 모델의 학습에 사용되는, 적어도 하나의 패치에 대한 보정된 레이블 정보 아이템에 가중치를 부여하는 단계를 더 포함한다.
일 실시예에 따르면, 추론된 복수의 레이블 정보 아이템이 적용된 병리 슬라이드 이미지를 어노테이터 단말에 제공하는 단계는, 병리 슬라이드 이미지의 압축된 이미지를 어노테이터 단말에 제공하는 단계, 적어도 하나의 패치에 대한 보정된 레이블 정보 아이템을 수신하는 단계는, 어노테이터 단말로부터, 압축된 이미지 내에서 선택된 제1 압축된 레이블 정보 아이템에 대응하는 적어도 하나의 레이블 정보 아이템에 대한 요청을 수신하는 단계, 적어도 하나의 레이블 정보 아이템을 어노테이터 단말에 제공하는 단계 및 제공된 적어도 하나의 레이블 정보 아이템에 대한 보정된 레이블 정보 아이템을 수신하는 단계를 포함한다. 여기서, 압축된 이미지는 복수의 레이블 정보 아이템의 압축된 레이블 정보 아이템과 연관될 수 있다.
일 실시예에 따르면, 기계학습 모델을 이용하여, 획득된 병리 슬라이드 이미지에 포함된 복수의 패치에 대한 복수의 레이블 정보 아이템을 추론하는 단계는, 복수의 패치의 각각에 대한 컨피던스 스코어 또는 엔트로피 값 중 적어도 하나를 산출하는 단계 및 산출된 컨피던스 스코어 또는 엔트로피 값 중 적어도 하나에 기초하여, 복수의 패치 중 적어도 하나의 제1 보정 대상 패치를 결정하는 단계를 포함한다.
일 실시예에 따르면, 추론된 복수의 레이블 정보 아이템을 병리 슬라이드 이미지에 적용하는 단계는, 결정된 적어도 하나의 제1 보정 대상 패치에 대한 시각적 표시(visual representation)를 출력하는 단계를 포함한다.
일 실시예에 따르면, 복수의 패치에 대한 복수의 레이블 정보 아이템은 복수의 패치와 연관된 복수의 클래스를 포함하고, 복수의 패치의 각각에 대한 컨피던스 스코어 또는 엔트로피 값 중 적어도 하나를 산출하는 단계는, 복수의 패치와 연관된 복수의 클래스 중 타겟 클래스에 대한 엔트로피 값에 가중치를 부여하는 단계를 포함한다.
일 실시예에 따르면, 복수의 패치 중 적어도 하나의 보정 대상 패치를 결정하는 단계는, 복수의 패치 중, 엔트로피 값에 가중치가 부여된 타겟 클래스와 연관된 적어도 하나의 제2 보정 대상 패치를 결정하는 단계를 포함하고, 추론된 복수의 레이블 정보 아이템을 병리 슬라이드 이미지에 적용하는 단계는, 결정된 적어도 하나의 제2 보정 대상 패치에 대한 시각적 표시(visual representation)를 출력하는 단계를 포함한다.
다른 실시예에 따르면, 하나 이상의 인스트럭션(instructions)을 저장하는 메모리, 저장된 하나 이상의 인스트럭션들을 실행함으로써, 복수의 패치를 포함하는 병리 슬라이드 이미지를 획득하고, 기계학습 모델을 이용하여, 획득된 병리 슬라이드 이미지에 포함된 복수의 패치에 대한 복수의 레이블 정보 아이템을 추론하고, 추론된 복수의 레이블 정보 아이템을 병리 슬라이드 이미지에 적용하고, 추론된 복수의 레이블 정보 아이템이 적용된 병리 슬라이드 이미지를 어노테이터 단말에 제공하도록 구성된 프로세서를 포함한다.
본 개시의 일부 실시예에 따르면, 노동 집약적인 데이터 어노테이션 과정을 반자동으로 수행하여, 인공신경망 학습용 데이터를 효율적으로 생성할 수 있다.
본 개시의 일부 실시예에 따르면, 기계학습 모델이 신뢰도가 낮다고 판단하여, 어노테이터에 의해 보정된 레이블 정보에 학습 가중치를 부여함으로써, hard negative mining 기법이 쉽게 구현될 수 있다. 이에 따라, 기계학습 모델이 추론하기 어려운 문제에 대한 학습 데이터 세트가 생성될 수 있다.
본 개시의 일부 실시예에 따르면, 기계학습 모델을 이용하여 추론된 레이블 정보에 따라 복수의 패치에 대한 시각적 표시를 제공하여, 레이블 정보를 선별적으로 보정할 수 있는 효과가 있다. 이에 따라, 어노테이터는 기계학습 모델이 불확실하다고 판단한 부분을 확인하여, 레이블 정보를 보정함으로써, 레이블 정보의 생성 시간과 비용을 줄일 수 있다.
본 개시의 효과는 이상에서 언급한 효과로 제한되지 않으며, 언급되지 않은 다른 효과들은 청구범위의 기재로부터 본 개시에 속하는 기술 분야에서 통상의 지식을 가진 자(이하, '통상의 기술자'라 함)에게 명확하게 이해될 수 있을 것이다.
본 개시의 실시예들은, 이하 설명하는 첨부 도면들을 참조하여 설명될 것이며, 여기서 유사한 참조번호는 유사한 요소들을 나타내지만, 이에 한정되지는 않는다.
도 1은 본 개시의 일 실시예에 따른 레이블 정보를 보정하는 시스템을 나타내는 예시적인 구성도이다.
도 2는 본 개시의 일 실시예에 따른 목적 데이터로서, 병리 슬라이드 이미지 및 병리 슬라이드 이미지에 포함된 적어도 하나의 패치에 대한 예시도이다.
도 3은 본 개시의 일 실시예에 따른 레이블 정보 아이템을 보정하는 방법을 나타내는 예시적인 흐름도이다.
도 4는 본 개시의 일 실시예에 따른 레이블 정보 아이템을 학습 데이터 세트로 분류하는 방법을 나타내는 예시적인 흐름도이다.
도 5는 본 개시의 일 실시예에 따른 인공신경망 모델을 나타내는 예시도이다.
도 6은 본 개시의 일 실시예에 따른 레이블 정보 아이템을 학습 데이터 세트로 분류하는 방법을 나타내는 예시적인 흐름도이다.
도 7은 본 개시의 일 실시예에 따른 제1 보정 대상 패치에 대한 시각적 표시를 출력하는 방법을 나타내는 예시적인 흐름도이다.
도 8은 본 개시의 일 실시예에 따른 제1 보정 대상 패치에 대한 레이블 정보 아이템의 보정에 대한 예시도이다.
도 9는 본 개시의 일 실시예에 따른 제2 보정 대상 패치에 대한 시각적 표시를 출력하는 방법을 나타내는 예시적인 흐름도이다.
도 10은 본 개시의 일 실시예에 따른 타겟 클래스에 대한 엔트로피 값에 가중치를 부여하는 방법을 나타내는 예시도이다.
도 11은 본 개시의 일 실시예에 따른 제2 보정 대상 패치에 대한 레이블 정보 아이템의 보정에 대한 예시도이다.
도 12는 본 개시의 일 실시예에 따른 레이블 정보 아이템을 보정하는 예시적인 시스템 구성도이다.
이하, 본 개시의 실시를 위한 구체적인 내용을 첨부된 도면을 참조하여 상세히 설명한다. 다만, 이하의 설명에서는 본 개시의 요지를 불필요하게 흐릴 우려가 있는 경우, 널리 알려진 기능이나 구성에 관한 구체적 설명은 생략하기로 한다.
첨부된 도면에서, 동일하거나 대응하는 구성요소에는 동일한 참조부호가 부여되어 있다. 또한, 이하의 실시예들의 설명에 있어서, 동일하거나 대응되는 구성요소를 중복하여 기술하는 것이 생략될 수 있다. 그러나 구성요소에 관한 기술이 생략되어도, 그러한 구성요소가 어떤 실시예에 포함되지 않는 것으로 의도되지는 않는다.
개시된 실시예의 이점 및 특징, 그리고 그것들을 달성하는 방법은 첨부되는 도면과 함께 후술되어 있는 실시예들을 참조하면 명확해질 것이다. 그러나 본 개시는 이하에서 개시되는 실시예들에 한정되는 것이 아니라 서로 다른 다양한 형태로 구현될 수 있으며, 단지 본 실시예들은 본 개시가 완전하도록 하고, 본 개시가 통상의 기술자에게 발명의 범주를 완전하게 알려주기 위해 제공되는 것일 뿐이다.
본 명세서에서 사용되는 용어에 대해 간략히 설명하고, 개시된 실시예에 대해 구체적으로 설명하기로 한다. 본 명세서에서 사용되는 용어는 본 개시에서의 기능을 고려하면서 가능한 현재 널리 사용되는 일반적인 용어들을 선택하였으나, 이는 관련 분야에 종사하는 기술자의 의도 또는 판례, 새로운 기술의 출현 등에 따라 달라질 수 있다. 또한, 특정한 경우는 출원인이 임의로 선정한 용어도 있으며, 이 경우 해당되는 발명의 설명 부분에서 상세히 그 의미를 기재할 것이다. 따라서 본 개시에서 사용되는 용어는 단순한 용어의 명칭이 아닌, 그 용어가 가지는 의미와 본 개시의 전반에 걸친 내용을 토대로 정의되어야 한다.
본 명세서에서의 단수의 표현은 문맥상 명백하게 단수인 것으로 특정하지 않는 한, 복수의 표현을 포함한다. 또한, 복수의 표현은 문맥상 명백하게 복수인 것으로 특정하지 않는 한, 단수의 표현을 포함한다. 명세서 전체에서 어떤 부분이 어떤 구성요소를 "포함"한다고 할 때, 이는 특별히 반대되는 기재가 없는 한 다른 구성요소를 제외하는 것이 아니라 다른 구성요소를 더 포함할 수 있음을 의미한다.
또한, 명세서에서 사용되는 '모듈' 또는 '부'라는 용어는 소프트웨어 또는 하드웨어 구성요소를 의미하며, '모듈' 또는 '부'는 어떤 역할들을 수행한다. 그렇지만 '모듈' 또는 '부'는 소프트웨어 또는 하드웨어에 한정되는 의미는 아니다. '모듈' 또는 '부'는 어드레싱할 수 있는 저장 매체에 있도록 구성될 수도 있고 하나 또는 그 이상의 프로세서들을 재생시키도록 구성될 수도 있다. 따라서, 일 예로서 '모듈' 또는 '부'는 소프트웨어 구성요소들, 객체지향 소프트웨어 구성요소들, 클래스 구성요소들 및 태스크 구성요소들과 같은 구성요소들과, 프로세스들, 함수들, 속성들, 프로시저들, 서브루틴들, 프로그램 코드의 세그먼트들, 드라이버들, 펌웨어, 마이크로 코드, 회로, 데이터, 데이터베이스, 데이터 구조들, 테이블들, 어레이들 또는 변수들 중 적어도 하나를 포함할 수 있다. 구성요소들과 '모듈' 또는 '부'들은 안에서 제공되는 기능은 더 작은 수의 구성요소들 및 '모듈' 또는 '부'들로 결합되거나 추가적인 구성요소들과 '모듈' 또는 '부'들로 더 분리될 수 있다.
본 개시의 일 실시예에 따르면 '모듈' 또는 '부'는 프로세서 및 메모리로 구현될 수 있다. '프로세서'는 범용 프로세서, 중앙 처리 장치(CPU), 마이크로프로세서, 디지털 신호 프로세서(DSP), 제어기, 마이크로제어기, 상태 머신 등을 포함하도록 넓게 해석되어야 한다. 몇몇 환경에서는, '프로세서'는 주문형 반도체(ASIC), 프로그램가능 로직 디바이스(PLD), 필드 프로그램가능 게이트 어레이(FPGA) 등을 지칭할 수도 있다. '프로세서'는, 예를 들어, DSP와 마이크로프로세서의 조합, 복수의 마이크로프로세서들의 조합, DSP 코어와 결합한 하나 이상의 마이크로프로세서들의 조합, 또는 임의의 다른 그러한 구성들의 조합과 같은 처리 디바이스들의 조합을 지칭할 수도 있다. 또한, '메모리'는 전자 정보를 저장 가능한 임의의 전자 컴포넌트를 포함하도록 넓게 해석되어야 한다. '메모리'는 임의 액세스 메모리(RAM), 판독-전용 메모리(ROM), 비-휘발성 임의 액세스 메모리(NVRAM), 프로그램가능 판독-전용 메모리(PROM), 소거-프로그램가능 판독 전용 메모리(EPROM), 전기적으로 소거가능 PROM(EEPROM), 플래쉬 메모리, 자기 또는 광학 데이터 저장장치, 레지스터들 등과 같은 프로세서-판독가능 매체의 다양한 유형들을 지칭할 수도 있다. 프로세서가 메모리로부터 정보를 판독하고/하거나 메모리에 정보를 기록할 수 있다면 메모리는 프로세서와 전자 통신 상태에 있다고 불린다. 프로세서에 집적된 메모리는 프로세서와 전자 통신 상태에 있다.
본 개시에서, '시스템'은 서버 장치와 클라우드 장치 중 적어도 하나의 장치를 포함할 수 있으나, 이에 한정되는 것은 아니다. 예를 들어, 시스템은 하나 이상의 서버 장치로 구성될 수 있다. 다른 예로서, 시스템은 하나 이상의 클라우드 장치로 구성될 수 있다. 또 다른 예로서, 시스템은 서버 장치와 클라우드 장치가 함께 구성되어 동작될 수 있다.
본 개시에서, '목적 데이터'는 기계학습 모델의 학습에 사용될 수 있는 임의의 데이터 또는 데이터 아이템을 지칭할 수 있으며, 예를 들어, 이미지를 나타내는 데이터, 음성 또는 음성 특징을 나타내는 데이터, 특정 정보(제조, 유통, 물류, 금융, 전략/유틸리티, 서비스, 교육, 자동차, 게임 공공산업 및 서비스, 마케팅/광고, 헬스케어, 미디어/통신, 소비재 등과 연관된 정보)를 나타내는 데이터 등을 포함하나, 이에 한정되지 않는다. 본 개시에서는 목적 데이터로서 병리 슬라이드 이미지의 전체 및/또는 병리 슬라이드 이미지에 포함된 복수의 패치를 이용하여 설명하고 있으나, 이는 한정되지 않으며, 기계 학습 모델의 학습에 사용될 수 있는 임의의 데이터가 목적 데이터에 해당될 수 있다. 또한, 목적 데이터는 어노테이션 작업을 통해 레이블 정보가 태깅될 수 있다.
본 개시에서, '병리 슬라이드 이미지'란, 인체에서 떼어낸 조직 등을 현미경으로 관찰하기 위해 일련의 화학적 처리과정을 거쳐 고정 및 염색된 병리 슬라이드를 촬영한 이미지를 가리킨다. 여기서, 병리 슬라이드 이미지는 전체 슬라이드에 대한 고 해상도의 이미지를 포함하는 전체 슬라이드 이미지(whole slide image)를 지칭할 수 있다. 예를 들어, 병리 슬라이드 이미지는 현미경을 이용하여 촬영된 디지털 이미지를 지칭할 수 있으며, 인체 내의 세포(cell), 조직(tissue) 및/또는 스트럭처(structure)에 대한 정보를 포함할 수 있다. 또한, 병리 슬라이드 이미지는 하나 이상의 패치를 포함할 수 있으며, 하나 이상의 패치에는 어노테이션 작업을 통해 레이블 정보가 적용(예: 태깅)될 수 있다.
본 개시에서, '패치'는 병리 슬라이드 이미지 내의 작은 영역을 지칭할 수 있다. 예를 들어, 패치는 병리 슬라이드 이미지에 대해 세그멘테이션을 수행함으로써 추출된 의미론적 객체에 대응하는 영역을 포함할 수 있다. 또 다른 예로서, 패치는 병리 슬라이드 이미지를 분석함으로써 생성된 레이블 정보와 연관된 픽셀들의 조합을 지칭할 수 있다.
본 개시에서, '기계학습 모델'은 주어진 입력에 대한 답을 추론하는데 사용하는 임의의 모델을 포함할 수 있다. 일 실시예에 따르면, 기계학습 모델은 입력 레이어(층), 복수 개의 은닉 레이어 및 출력 레이어를 포함한 인공신경망 모델을 포함할 수 있다. 여기서, 각 레이어는 하나 이상의 노드를 포함할 수 있다. 예를 들어, 기계학습 모델은 병리 슬라이드 이미지 및/또는 병리 슬라이드 이미지에 포함된 적어도 하나의 패치에 대해 레이블 정보를 추론하도록 학습될 수 있다. 이 경우, 어노테이션 작업을 통해 생성된 레이블 정보가 기계학습 모델을 학습시키는데 이용될 수 있다. 또한, 기계학습 모델은 기계학습 모델에 포함된 복수의 노드와 연관된 가중치를 포함할 수 있다. 여기서, 가중치는 기계학습 모델과 연관된 임의의 파라미터를 포함할 수 있다. 본 개시에서, 기계학습 모델은 인공신경망 모델을 지칭할 수 있으며, 인공신경망 모델은 기계학습 모델을 지칭할 수 있다.
본 개시에서, '학습'은 적어도 하나의 패치 및 레이블 정보를 이용하여 기계학습 모델에 포함된 가중치를 변경하는 임의의 과정을 지칭할 수 있다. 일 실시예에 따르면, 학습은 적어도 하나의 패치 및 레이블 정보를 이용하여 기계학습 모델을 한번 이상의 순방향 전파(forward propagation) 및 역방향 전자(backward propagation)을 통해 기계학습 모델과 연관된 가중치를 변경하거나 업데이트하는 과정을 지칭할 수 있다.
본 개시에서, '레이블 정보(label information)'란, 데이터 샘플의 정답 정보로써 어노테이션 작업의 결과로 획득된 정보이다. 또한, 레이블 정보는 기계학습 모델을 통해 추론된, 병리 슬라이드 이미지에 포함된 적어도 하나의 패치에 대한 레이블 정보를 지칭할 수 있다. 레이블은 당해 기술 분야에서 어노테이션(annotation), 태그 등의 용어와 혼용되어 사용될 수 있다. 여기서, 레이블 정보는 적어도 하나의 패치에 대한 클래스에 대한 정보 및 클래스에 대한 신뢰도 및/또는 엔트로피 값을 포함할 수 있다.
본 개시에서, '클래스(class)'는 패치 내의 세포(cell), 조직(tissue) 및/또는 스트럭처(structure)에 대한 분류화된 정보를 지칭할 수 있다. 예를 들어, 패치 내의 세포가 림프구에 해당하는 경우, 패치에 대한 클래스는 림프구 대응하는 클래스를 지칭할 수 있다.
본 개시에서, '컨피던스 스코어'는 병리 슬라이드 이미지에 포함된 복수의 패치의 각각에 대한 레이블 정보 아이템의 신뢰도를 나타내는 수치를 지칭할 수 있다. 예를 들어, 컨피던스 스코어는 하나의 패치에 대응된다고 추론된 하나 이상의 클래스의 각각에 대한 신뢰도 수치를 포함할 수 있다.
본 개시에서, '엔트로피 값'이란, 병리 슬라이드 이미지에 포함된 복수의 패치의 각각에 대한 레이블 정보 아이템의 불확실성을 나타내는 수치를 지칭할 수 있다. 일 실시예에 따르면, 엔트로피 값은 하나의 패치에 대응된다고 추론된 하나 이상의 클래스의 각각에 대한 컨피던스 스코어의 분포에 따라 결정될 수 있다. 예를 들어, 복수의 클래스의 각각의 컨피던스 스코어가 고르게 분포되는 경우, 엔트로피 값은 높을 수 있다. 이와 달리, 하나의 클래스의 컨피던스 스코어가 다른 클래스의 컨피던스 스코어에 비해 확연히 높다면, 엔트로피 값은 낮을 수 있다. 여기서, 엔트로피 값은 컨피던스 스코어와 연관된 클래스 별로 산출될 수 있다.
본 개시에서, '정보 아이템'은 정보를 지칭할 수 있고, 정보는 정보 아이템을 지칭할 수 있다.
본 개시에서, '어노테이션(annotation)'이란, 데이터 샘플에 레이블 정보를 태깅하는 작업 또는 태깅된 정보(즉, 주석) 그 자체를 의미한다. 어노테이션은 당해 기술 분야에서 태깅(tagging), 레이블링(labeling) 등의 용어와 혼용되어 사용될 수 있다.
본 개시에서, '유사'는 동일 또는 유사하다는 의미를 모두 포함할 수 있다. 예를 들어, 두 정보가 유사하다는 것은 두 정보가 서로 동일하거나 유사하다는 것을 지칭할 수 있다.
본 개시에서, '인스트럭션(instruction)'이란, 기능을 기준으로 묶인 일련의 명령어들로서 컴퓨터 프로그램의 구성 요소이자 프로세서에 의해 실행되는 것을 가리킨다.
도 1은 본 개시의 일 실시예에 따른 레이블 정보를 보정하는 시스템을 나타내는 예시적인 구성도이다. 도시된 바와 같이, 레이블 정보 아이템을 보정하는 시스템은 정보 처리 시스템(100), 어노테이터 단말(110) 및 저장 시스템(120)을 포함할 수 있다. 여기서, 정보 처리 시스템(100)은 어노테이터 단말(110) 및 저장 시스템(120)의 각각과 연결되어 통신가능하도록 구성될 수 있다. 도 1에서는 하나의 어노테이터 단말(110)이 도시되어 있으나, 이에 한정되지 않으며, 복수의 어노테이터 단말(110)이 정보 처리 시스템(100)과 연결되어 통신하도록 구성될 수 있다. 또한, 도 1에서는 정보 처리 시스템(100)이 하나의 컴퓨팅 장치로서 도시되어 있으나, 이에 한정되지 않으며, 정보 처리 시스템(100)은 복수의 컴퓨팅 장치를 통해 정보 및/또는 데이터를 분산 처리하도록 구성될 수 있다. 또한, 도 1에서는 저장 시스템(120)이 하나의 장치로서 도시되어 있으나, 이에 한정되지 않으며, 복수의 저장 장치로 구성되거나 클라우드(cloud)를 지원하는 시스템으로 구성될 수 있다. 또한, 도 1에서는 레이블 정보 아이템을 보정하는 시스템의 각각의 구성요소들은 기능적으로 구분되는 기능 요소들을 나타낸 것으로, 복수의 구성 요소가 실제 물리적 환경에서 서로 통합되는 형태로 구현될 수 있다.
정보 처리 시스템(100) 및 어노테이터 단말(110)은 목적 데이터(예: 병리 슬라이드 이미지에 포함된 적어도 하나의 패치)에 대한 레이블 정보를 생성 또는 추론하고, 레이블 정보를 보정하는데 이용되는 임의의 컴퓨팅 장치이다. 여기서 컴퓨팅 장치는, 컴퓨팅 기능이 구비된 임의의 종류의 장치를 지칭할 수 있으며, 예를 들어, 노트북, 데스크톱(desktop), 랩탑(laptop), 서버, 클라우드 시스템 등이 될 수 있으나, 이에 한정되지 않는다.
어노테이터 단말(110)은 정보 처리 시스템(100)으로부터 목적 데이터(예: 병리 슬라이드 이미지, 병리 슬라이드 이미지에 포함된 적어도 하나의 패치 등) 및 추론된 레이블 정보를 수신하고, 수신된 이미지 및 레이블 정보에 대한 응답을 수행할 수 있다. 일 실시예에 따르면, 어노테이터 단말(110)은 어노테이터(130)로부터 목적 데이터에 대한 확인(confirmation)을 수신할 수 있다. 예를 들어, 목적 데이터에 대한 확인은 적어도 하나의 패치에 대한 레이블 정보 아이템에 대한 확인을 지칭할 수 있다. 이러한 목적 데이터에 대한 레이블 정보 아이템에 대한 확인은 정보 처리 시스템(100)에 제공될 수 있다. 다른 실시예에 따르면, 어노테이터(130)는 목적 데이터(예: 수신된 병리 슬라이드 이미지 내의 적어도 하나의 패치)에 대한 어노테이션 작업을 수행할 수 있다. 이러한 어노테이션 작업을 통해 보정된 레이블 정보는 해당 목적 데이터(예: 패치)와 함께 정보 처리 시스템(100)에 제공될 수 있다.
정보 처리 시스템(100)은 어노테이터 단말(110)로부터 수신된 확인(confirmation)된 레이블 정보 및 보정된 레이블 정보를 기계학습 모델의 학습 데이터 세트로 분류하여, 저장 시스템(120)에 저장할 수 있다. 일 실시예에 따르면, 정보 처리 시스템(100)은, 수신된 확인 및/또는 보정된 레이블 정보와 연관된 적어도 하나의 패치를 기계학습 모델의 학습에 이용할 수 있다. 여기서, 보정된 레이블 정보는 기계학습 모델이 추론하기 어려운 문제에 대해, 어노테이터(130)가 직접 작업한 레이블 정보이므로, 기계학습 모델의 성능을 향상시키는데 도움이 될 수 있다. 이에 따라, 기계학습 모델의 학습 시, 목적 데이터(예: 적어도 하나의 패치)에 대한 보정된 레이블 정보 아이템은 가중치가 부여되어, 기계학습 모델의 성능 향상이 극대화될 수 있다.
저장 시스템(120)은 레이블 정보를 추론하기 위한 기계학습 모델과 연관된 각종 데이터를 저장하고 관리하는 장치 또는 클라우드 시스템이다. 데이터의 효율적인 관리를 위해, 저장 시스템(120)은, 데이터베이스를 이용하여 각종 데이터를 저장하고 관리할 수 있다. 여기서, 각종 데이터는 기계학습 모델과 연관된 임의의 데이터를 포함할 수 있으며, 예를 들어, 목적 데이터로서 병리 슬라이드 이미지의 파일, 병리 슬라이드 이미지의 메타 데이터(예를 들어, 이미지 형식, 연관된 병명, 연관된 조직, 연관된 환자 정보 등), 어노테이션 작업에 관한 데이터, 어노테이터에 관한 데이터, 어노테이션 작업 결과물인 레이블 정보, 기계학습 모델 등을 포함할 수 있으나, 이에 한정되지 않는다. 도 1에서는 정보 처리 시스템(100)과 저장 시스템(120)이 별도의 시스템으로 도시되어 있으나, 이에 한정되지 않으며, 하나의 시스템으로 통합되어 구성될 수 있다.
도 2는 본 개시의 일 실시예에 따른 목적 데이터로서, 병리 슬라이드 이미지 및 병리 슬라이드 이미지에 포함된 적어도 하나의 패치에 대한 예시도이다. 도시된 바와 같이, 병리 슬라이드 이미지(210)는 인체로부터 떼어낸 조직의 적어도 일부에 대한 일련의 화학적 처리 과정을 거쳐 염색 및/또는 고정된 병리 슬라이드를 현미경 및 카메라를 통해 촬영함으로써 생성된 디지털 이미지를 지칭할 수 있다. 도 2에서는 병리 슬라이드 이미지(210)가 H&E 염색(hematoxylin and eosin stain) 기법으로 염색된 것으로 도시되어 있으나, 이에 제한되지 않고, 이미 알려진 상이한 염색 기법으로 염색한 병리 슬라이드를 현미경 및 카메라를 통해 촬영함으로써 생성된 이미지를 포함할 수 있다.
병리 슬라이드 이미지(220)는, 이미지에 포함된 복수의 패치에 대한 복수의 레이블 정보 아이템을 포함할 수 있다. 일 실시예에 따르면, 레이블 정보 아이템은 사람(예: 어노테이터(130))에 의해 적어도 하나의 패치에 대한 어노테이션 작업이 수행됨으로써 생성될 수 있다. 다른 실시예에 따르면, 정보 처리 시스템(예: 정보 처리 시스템(100))이 병리 슬라이드 이미지(210)를 기계학습 모델을 이용하여 분석함(예: 추론)으로써, 병리 슬라이드 이미지에 포함된 복수의 패치에 대한 복수의 레이블 정보 아이템을 생성할 수 있다.
레이블 정보는 병리 판단을 하기 위해 병리 슬라이드 및/또는 패치에 포함된 대상을 구분할 수 있는 정보를 포함할 수 있다. 병리 슬라이드 이미지(220)는 특정 영역에 대한 레이블 정보를 포함할 수 있다. 일 실시예에 따르면, 병리 슬라이드 이미지(220) 내의 제1 영역(222)은 암 기질(cancer stroma)이라는 레이블 정보가 태깅될 수 있고, 제2 영역(224)은 암 상피(cancer epithelium)라는 레이블 정보가 태깅될 수 있다. 예를 들어, 도시된 바와 같이, 암 기질 영역에 해당하는 제1 영역(222)은 자주색으로 채색되고, 암 상피 영역에 해당하는 제2 영역(224)은 하늘색으로 채색되어 있으나, 이에 제한되지 않고, 레이블 정보는 영역, 도형, 다른 색 또는 텍스트 등의 다양한 시각적 표시로 표현될 수 있다. 또한, 채색된 영역의 전부 또는 적어도 일부는 하나 이상의 패치와 대응될 수 있다.
정보 처리 시스템은 어노테이터 단말의 요청에 의해 병리 슬라이드 이미지(220) 중 적어도 일부 영역(예: 패치)에 대한 확대된 이미지를 제공할 수 있다. 일 실시예에 따르면, 어노테이터 단말은 어노테이터의 입력을 통해 병리 슬라이드 이미지(220) 내의 일부 영역을 제1 패치(226)로서 선택할 수 있다. 이에 응답하여, 어노테이터 단말은 정보 처리 시스템으로부터 제1 패치(226)에 대한 확대된 이미지(230)를 획득할 수 있다. 예를 들어, 병리 슬라이드 이미지(220)는 현미경으로 촬영된 원본 이미지의 압축된 형태로 제공될 수 있으며, 압축된 이미지의 일부 영역이 패치로서 선택되면 패치에 대응하는 압축 해제된 이미지가 어노테이터 단말을 통해 어노테이터에게 제공될 수 있다. 이에 마찬가지로, 제1 패치에 대응하는 이미지(230)에 포함된 제2 패치(232)에 대한 확대된 이미지(240)가 획득될 수 있다. 도 2에서는, 제1 패치(226)에 대응하는 이미지(230) 및 제2 패치(232)에 대응하는 이미지(240)가 특정 배율로 확대되어 있으나, 이에 제한되지 않고, 병리 슬라이드 이미지 및/또는 이에 포함된 패치에 대응하는 이미지는 다양한 배율로 확대되거나 축소될 수 있다.
일 실시예에서, 림프구(242)가 병리 슬라이드 이미지 내의 패치에 레이블 정보로서 태깅될 수 있다. 병리 슬라이드 이미지(220)가 제2 패치(232)와 유사한 배율로 확대될 경우, 병리 슬라이드에 포함된 림프구(242)(예를 들어, 보조 T 세포(helper T cell), 세포독성 T 세포(killer T cell), 자연 살해 T 세포(natural killer T cell), 기억 T 세포(memory T cell), 조절 T 세포(suppressor T cell) 및 B 세포(B cell) 등)가 식별될 수 있으나, 이에 제한되지 않고, 정보 처리 시스템(100)은 낮은 배율의 이미지에 특정 레이블 정보에 해당하는 영역에 시각적 표시를 할 수도 있다. 또한, 레이블 정보에 림프구(242) 외의 호중구, 호산구, 호염기구, 단핵구, 적혈구, 혈소판 등의 병리 슬라이드의 대상물 내부에 포함되는 다양한 세포들도 포함될 수 있다.
병리 슬라이드 이미지(250)는 특정 영역에 대한 레이블 정보를 포함할 수 있다. 일 실시예에 따르면, 병리 슬라이드 이미지(250) 내의 제3 영역(252)은 불확실한(uncertain) 영역이라는 레이블 정보가 태깅될 수 있다. 예를 들어, 도시된 바와 같이, 정보 처리 시스템(100)의 기계학습 모델이 추론한 레이블 정보 중 불확실한 영역에 해당하는 제3 영역(252)은 녹색으로 표시되어 있으나, 이에 제한되지 않고, 레이블 정보는 영역, 도형, 다른 색 또는 텍스트 등의 다양한 시각적 표시로 표현될 수 있다. 또한, 채색된 영역의 전부 또는 적어도 일부는 하나 이상의 패치와 대응될 수 있다.
도 3은 본 개시의 일 실시예에 따른 레이블 정보 아이템을 보정하는 방법을 나타내는 예시적인 흐름도이다. 일 실시예에 따르면, 레이블 정보를 보정하는 방법(300)은 정보 처리 시스템(예: 정보 처리 시스템(100))에 의해 수행될 수 있다. 추가적으로 또는 대안적으로, 방법(300)은 어노테이터 단말(예: 어노테이터 단말(110))에 의해 수행될 수 있다. 도시된 바와 같이, 방법(300)은 복수의 패치를 포함하는 병리 슬라이드 이미지를 획득하는 단계(S310)로 개시될 수 있다.
그리고 나서, 단계(S320)에서, 복수의 패치에 대한 복수의 레이블 정보 아이템이 추론될 수 있다. 예를 들어, 단계(S310)에서 획득한 복수의 패치를 포함하는 병리 슬라이드 이미지를 기계학습 모델에 입력하여 복수의 패치에 대한 레이블 정보 아이템을 추출할 수 있다.
다음으로, 단계(S330)에서, 추론된 복수의 레이블 정보 아이템은 병리 슬라이드 이미지에 적용될 수 있다. 예를 들어, 정보 처리 시스템은 단계(S310)에서 획득된 복수의 패치를 포함하는 병리 슬라이드 이미지에, 단계(S320)에서 추론된 복수의 레이블 정보 아이템을 연관시킬 수 있다.
마지막으로, 단계(S340)에서, 추론된 복수의 레이블 정보 아이템이 적용된 병리 슬라이드 이미지는 어노테이터 단말에 제공될 수 있다. 이렇게 제공된 병리 슬라이드 이미지에 포함된 복수의 레이블 정보 아이템은 어노테이터에 의해 확인될 수 있으며, 적어도 일부의 정보 아이템은 보정될 수 있다.
도 4는 본 개시의 일 실시예에 따른 레이블 정보 아이템을 학습 데이터 세트로 분류하는 방법을 나타내는 예시적인 흐름도이다. 레이블 정보를 학습 데이터 세트로 분류하는 방법(400)은 정보 처리 시스템(100)에 의해 수행될 수 있다. 이 때, 정보 처리 시스템(100)은 이러한 방법(400)을 수행하기 위하여 어노테이터 단말(110)과 통신하도록 구성될 수 있다. 도시된 바와 같이, 레이블 정보를 학습 데이터 세트로 분류하는 방법(400)은 정보 처리 시스템(100)이 복수의 패치를 포함하는 병리 슬라이드 이미지를 획득하는 단계(S410)로 개시될 수 있다.
단계(S420)에서, 정보 처리 시스템(100)은 기계학습 모델을 이용하여, 획득된 병리 슬라이드 이미지에 포함된 복수의 패치에 대한 레이블 정보 아이템을 추론할 수 있다. 예를 들어, 단계(S410)에서 획득한 복수의 패치를 포함하는 병리 슬라이드 이미지를 기계학습 모델에 입력하여 복수의 패치에 대한 레이블 정보 아이템을 추출할 수 있다.
다음으로, 단계(S430)에서, 정보 처리 시스템(100)은 추론된 레이블 정보 아이템을 병리 슬라이드 이미지에 적용할 수 있다. 예를 들어, 정보 처리 시스템은 단계(S410)에서 획득된 복수의 패치를 포함하는 병리 슬라이드 이미지에, 단계(S420)에서 추론된 복수의 레이블 정보 아이템을 태깅할 수 있다.
다음으로, 단계(S440)에서, 정보 처리 시스템(100)은 어노테이터 단말(110)에게 추론된 레이블 정보 아이템이 적용된 병리 슬라이드 이미지를 제공할 수 있다. 그리고 나서, 단계(S450)에서, 어노테이터 단말(110)은 어노테이터(예: 어노테이터(130))로부터 입력된 레이블 정보에 대한 보정 필요 여부를 수신할 수 있다. 일 실시예에서, 정보 처리 시스템(100)은 어노테이터 단말(110)로부터 추론된 복수의 레이블 정보 아이템 중 적어도 하나의 레이블 정보 아이템에 대한 응답을 수신할 수 있다. 여기서, 적어도 하나의 레이블 정보 아이템은 복수의 패치 중 적어도 하나의 패치와 연관될 수 있다.
단계(S450)에서 레이블 정보 아이템의 보정이 필요할 경우, 어노테이터 단말(110)은 어노테이터로부터 보정된 레이블 정보 아이템을 수신할 수 있다(S460). 예를 들어, 어노테이터 단말(110)을 사용하는 어노테이터는 레이블 정보 아이템이 적용된 병리 슬라이드 이미지를 기초로, 레이블 정보 아이템을 보정하는 어노테이션 작업을 수행할 수 있다. 그리고 나서, 어노테이션 작업을 통해 보정된 레이블 정보 아이템 및 이와 연관된 적어도 하나의 패치는 정보 처리 시스템(100)에 제공될 수 있다.
단계(S470)에서, 정보 처리 시스템(100)은 단계(S460)에서 보정된 레이블 정보 아이템에 가중치를 부여할 수 있다. 이에 따라, 보정된 레이블 정보 아이템은 기계학습 모델의 학습 시 학습 데이터로서의 중요도가 향상될 수 있다. 그리고 나서, 단계(S480)로 진행하여, 보정된 레이블 정보 아이템은 학습 데이터 세트로 분류할 수 있다.
이와 달리, 단계(S450)에서, 레이블 정보 아이템의 보정이 필요하지 않을 경우, 단계(S480)로 진행할 수 있다. 일 실시예에서, 정보 처리 시스템(100)은 어노테이터 단말(110)으로부터 적어도 하나의 레이블 정보 아이템의 확인(confirmation)을 수신하는 경우, 적어도 하나의 패치 및 적어도 하나의 레이블 정보 아이템을 기계학습 모델의 학습 데이터 세트로 분류할 수 있다.
도 5는 본 개시의 일 실시예에 따른 인공신경망 모델을 나타내는 예시도이다. 인공신경망 모델(500)은, 기계학습(Machine Learning) 기술과 인지과학에서, 생물학적 신경망의 구조에 기초하여 구현된 통계학적 학습 알고리즘 또는 그 알고리즘을 실행하는 구조이다.
일 실시예에 따르면, 인공신경망 모델(500)은, 생물학적 신경망에서와 같이 시냅스의 결합으로 네트워크를 형성한 인공 뉴런인 노드(Node)들이 시냅스의 가중치를 반복적으로 조정하여, 특정 입력에 대응한 올바른 출력과 추론된 출력 사이의 오차가 감소되도록 학습함으로써, 문제 해결 능력을 가지는 기계학습 모델을 나타낼 수 있다. 예를 들어, 인공신경망 모델(500)은 기계 학습, 딥러닝 등의 인공지능 학습법에 사용되는 임의의 확률 모델, 뉴럴 네트워크 모델 등을 포함할 수 있다.
일 실시예에 따르면, 인공신경망 모델(500)은 병리 슬라이드 이미지 또는 병리 슬라이드 이미지에 포함된 적어도 하나의 패치를 입력하여 레이블 정보를 출력하도록 구성된 인공신경망 모델을 포함할 수 있다. 이 경우, 인공신경망 모델(500)을 이용하여 적어도 하나의 패치에 대한 레이블 정보 아이템을 추론할 시에 레이블 정보 아이템에 대한 컨피던스 스코어 및/또는 엔트로피 값이 산출될 수 있다. 이렇게 산출된 컨피던스 스코어 또는 엔트로피 값은 복수의 패치 중 보정 대상 패치를 결정하는데 사용될 수 있다.
인공신경망 모델(500)은 다층의 노드들과 이들 사이의 연결로 구성된 다층 퍼셉트론(MLP: multilayer perceptron)으로 구현된다. 본 실시예에 따른 인공신경망 모델(500)은 MLP를 포함하는 다양한 인공신경망 모델 구조들 중의 하나를 이용하여 구현될 수 있다. 도 5에 도시된 바와 같이, 인공신경망 모델(500)은, 외부로부터 입력 신호 또는 데이터(510)를 수신하는 입력층(520), 입력 데이터에 대응한 출력 신호 또는 데이터(550)를 출력하는 출력층(540), 입력층(520)과 출력층(540) 사이에 위치하며 입력층(520)으로부터 신호를 받아 특성을 추출하여 출력층(540)으로 전달하는 n개(여기서, n은 양의 정수)의 은닉층(530_1 내지 530_n)으로 구성된다. 여기서, 출력층(540)은 은닉층(530_1 내지 530_n)으로부터 신호를 받아 외부로 출력한다.
인공신경망 모델(500)의 학습 방법에는, 교사 신호(정답)의 입력에 의해서 문제의 해결에 최적화되도록 학습하는 지도 학습(Supervised Learning) 방법과, 교사 신호를 필요로 하지 않는 비지도 학습(Unsupervised Learning) 방법이 있다. 정보 처리 시스템은 학습 병리 슬라이드 이미지 또는 병리 슬라이드 이미지에 포함된 적어도 하나의 패치를 이용해 병리 슬라이드 이미지 또는 패치에 대한 레이블 정보 아이템을 출력하기 위하여 지도 학습(Supervised Learning)을 이용하여 입력 이미지에 대한 분석을 수행하고, 이미지에 대응되는 레이블 정보 아이템이 추론될 수 있도록 인공신경망 모델(500)을 학습시킬 수 있다. 이 경우, 정보 처리 시스템은 어노테이터로부터 병리 슬라이드 이미지 또는 병리 슬라이드 이미지에 포함된 적어도 하나의 패치에 대한 보정된 레이블 정보 아이템을 수신하고, 적어도 하나의 패치 및 보정된 레이블 정보 아이템을 이용하여 기계학습 모델의 지도학습을 수행할 수 있다.
이렇게 학습된 인공신경망 모델(500)은 저장 시스템(예: 저장 시스템(120))에 저장될 수 있으며, 통신 인터페이스 및/또는 어노테이터 단말(예: 어노테이터 단말(110)) 또는, 저장 시스템으로부터 수신된 병리 슬라이드 이미지 또는 병리 슬라이드 이미지에 포함된 적어도 하나의 패치의 입력에 응답하여 레이블 정보 아이템을 출력할 수 있다.
일 실시예에 따르면, 도 5에 도시된 바와 같이, 레이블 정보 아이템을 추출할 수 있는 인공신경망 모델(500)의 입력변수는, 병리 슬라이드 이미지 또는 병리 슬라이드 이미지에 포함된 적어도 하나의 패치가 될 수 있다. 예를 들어, 인공신경망 모델(500)의 입력층(520)에 입력되는 입력변수는, 학습 이미지를 하나의 벡터 데이터 요소로 구성한, 이미지 벡터(510)가 될 수 있다. 병리 슬라이드 이미지의 적어도 일부를 포함한 학습 이미지의 입력에 응답하여, 인공신경망 모델(500)의 출력층(540)에서 출력되는 출력변수는 레이블 정보 아이템을 나타내거나 특징화하는 벡터(550)가 될 수 있다. 예를 들어, 이러한 레이블 정보 아이템은 병리 슬라이드 이미지의 적어도 일부에 대한 클래스를 포함할 수 있다. 이에 더하여, 인공신경망 모델(500)의 출력층(540)은 출력된 레이블 정보 아이템(예: 클래스)에 대한 신뢰도 및/또는 정확도를 나타내는 벡터를 출력하도록 구성될 수 있다. 예를 들어, 이러한 출력에 대한 신뢰도 또는 정확도를 나타내는 벡터는 스코어(score)로서 해석되거나 표시될 수 있다. 본 개시에 있어서 인공신경망 모델(500)의 출력변수는, 이상에서 설명된 유형에 한정되지 않으며, 레이블 정보를 나타내는 임의의 정보/데이터를 포함할 수 있다. 이러한 클래스 별 컨피던스 스코어는 각 클래스 별 불확실성을 나타내는 엔트로피 값을 산출하는데 사용될 수 있다.
이와 같이 인공신경망 모델(500)의 입력층(520)과 출력층(540)에 복수의 입력변수와 대응되는 복수의 출력변수가 각각 매칭되고, 입력층(520), 은닉층(530_1 내지 530_n) 및 출력층(540)에 포함된 노드들 사이의 시냅스 값이 조정됨으로써, 특정 입력에 대응한 올바른 출력이 추출될 수 있도록 학습될 수 있다. 이러한 학습 과정을 통해, 인공신경망 모델(500)의 입력변수에 숨겨져 있는 특성을 파악할 수 있고, 입력변수에 기초하여 계산된 출력변수와 목표 출력 간의 오차가 줄어들도록 인공신경망 모델(500)의 노드들 사이의 시냅스 값(또는 가중치)를 조정할 수 있다. 이렇게 학습된 인공신경망 모델(500)을 이용하여, 입력된 병리 슬라이드 이미지 또는 병리 슬라이드 이미지에 포함된 적어도 하나의 패치에 응답하여, 입력 이미지에 대응하는 레이블 정보 아이템이 출력될 수 있다.
도 6은 본 개시의 일 실시예에 따른 레이블 정보 아이템을 학습 데이터 세트로 분류하는 방법을 나타내는 예시적인 흐름도이다. 레이블 정보 아이템을 학습 데이터 세트로 분류하는 방법(600)은 정보 처리 시스템(100)에 의해 수행될 수 있다. 이 때, 정보 처리 시스템(100)은 이러한 방법(600)을 수행하기 위하여 어노테이터 단말(110)과 통신하도록 구성될 수 있다. 도시된 바와 같이, 레이블 정보 아이템을 학습 데이터 세트로 분류하는 방법(600)은 정보 처리 시스템(100)이 병리 슬라이드 이미지의 압축된 이미지를 어노테이터 단말(110)에 제공하는 단계(S610)로 개시될 수 있다. 여기서, 압축된 이미지는 복수의 레이블 정보 아이템의 압축된 레이블 정보 아이템과 연관될 수 있다. 예를 들어, 압축되지 않은 원본 병리 슬라이드 이미지의 해상도가 상당히 크기 때문에, 어노테이터 단말(110)로의 전송 시간이 오래 걸릴 수 있다. 또한, 원본 병리 슬라이드 이미지의 해상도가 높기 때문에, 어노테이터가 원본 병리 슬라이드 이미지에 대응하는 매우 넓은 영역을 검토해야 한다. 이러한 점을 해결하기 위하여, 정보 처리 시스템(100)은 어노테이터 단말(110)에게 압축된 병리 슬라이드 이미지 및 압축된 레이블 정보 아이템을 송신할 수 있다.
단계(S620)에서, 정보 처리 시스템(100)은 어노테이터 단말(110)에게 압축된 레이블 정보 아이템이 적용된 압축된 병리 슬라이드 이미지를 제공할 수 있다.
그리고 나서, 단계(S630)에서, 어노테이터 단말(110)은 어노테이터(예: 어노테이터(130))로부터 압축된 레이블 정보 아이템에 대한 보정 필요 여부를 수신할 수 있다. 일 실시예에서, 정보 처리 시스템(100)은 어노테이터 단말(110)로부터 압축된 복수의 레이블 정보 아이템 중 적어도 하나의 압축된 레이블 정보 아이템에 대한 응답을 수신할 수 있다.
단계(S630)에서, 압축된 레이블 정보 아이템에 대한 보정이 필요하다고 판정된 경우, 단계(S640)로 진행할 수 있다. 단계(S640)에서, 어노테이터 단말(110)은 정보 처리 시스템(100)에 압축된 이미지 내에서 선택된 제1 압축된 레이블 정보 아이템에 대응하는 적어도 하나의 레이블 정보 아이템에 대한 요청을 송신할 수 있다. 예를 들어, 어노테이터는 어노테이터 단말(110)을 통해 수신한 압축된 병리 슬라이드 이미지 및 압축된 레이블 정보 아이템을 검토하여, 보정이 필요한 부분을 확인할 수 있다. 그리고, 어노테이터가 보정이 필요하다고 판단한 제1 압축된 레이블 정보 아이템을 보정하기 위해, 정보 처리 시스템(100)에 제1 압축된 레이블 정보 아이템에 대응하는 원본 해상도의 병리 슬라이드 이미지 내의 영역 및 이러한 영역 내의 적어도 하나의 레이블 정보 아이템을 요청할 수 있다. 여기서, 원본 영역 내에 포함된 레이블 정보 아이템의 개수는 압축된 영역 내에 포함된 레이블 정보의 개수는 많거나 동일할 수 있다.
다음으로, 단계(S650)에서, 정보 처리 시스템(100)은 적어도 하나의 레이블 정보 아이템을 어노테이터 단말(110)에 제공할 수 있다. 예를 들어, 정보 처리 시스템(100)은 송신한 압축된 이미지 내에서, 어노테이터 단말(110)에 의해 선택된 압축된 레이블 정보 아이템에 대응하는, 이와 연관된 원본 해상도의 병리 슬라이드 이미지 내의 영역 및 이러한 영역 내에 포함된 원본 레이블 정보 아이템을 어노테이터 단말(110)에 송신할 수 있다.
단계(S660)에서, 어노테이터 단말(110)은 어노테이터로부터 원본 해상도의 영역 내에 포함된 적어도 하나의 레이블 정보 아이템에 대한 보정된 레이블 정보 아이템을 수신할 수 있다. 그리고 나서, 단계(S670)에서, 정보 처리 시스템(100)은 어노테이터 단말(110)에 제공된 적어도 하나의 레이블 정보 아이템에 대한 보정된 레이블 정보 아이템을 수신할 수 있다. 보정된 레이블 정보 아이템을 수신하는 경우, 단계(S680)로 진행하여, 보정된 레이블 정보 아이템 및 이와 연관된 패치는 학습 데이터 세트로 분류될 수 있다.
이와 달리, 단계(S630)에서, 레이블 정보 아이템의 보정이 필요하지 않다고 판정되는 경우, 단계(S680)로 진행할 수 있다. 일 실시예에서, 정보 처리 시스템(100)은 어노테이터 단말(110)로부터 적어도 하나의 패치에 대한 적어도 하나의 레이블 정보 아이템의 확인(confirmation)을 수신하는 경우, 적어도 하나의 패치 및 적어도 하나의 레이블 정보 아이템을 기계학습 모델의 학습 데이터 세트로 분류할 수 있다.
일 실시예에 따르면, 정보 처리 시스템(100)은 레이블 정보의 재작업이 필요하지 않을 경우, 어노테이터 단말(110)을 통한 확인(confirmation)을 획득하지 않더라도 해당 레이블 정보를 기계학습 모델의 학습 세트로 분류할 수 있다.
도 7은 본 개시의 일 실시예에 따른 제1 보정 대상 패치에 대한 시각적 표시를 출력하는 방법을 나타내는 예시적인 흐름도이다. 일 실시예에 따르면, 보정 대상 패치에 대한 시각적 표시를 출력하는 방법(700)은 정보 처리 시스템(예: 정보 처리 시스템(100))에 의해 수행될 수 있다. 추가적으로 또는 대안적으로, 방법(700)은 어노테이터 단말(예: 어노테이터 단말(110))에 의해 수행될 수 있다. 도시된 바와 같이, 방법(700)은, 정보 처리 시스템에 의해 복수의 패치 각각에 대한 컨피던스 스코어 또는 엔트로피 값 중 적어도 하나를 산출하는 단계(S710)로 개시될 수 있다.
그리고 나서, 단계(S720)에서, 정보 처리 시스템은 산출된 컨피던스 스코어 또는 엔트로피 값 중 적어도 하나에 기초하여, 복수의 패치 중 적어도 하나의 제1 보정 대상 패치를 결정할 수 있다. 일 실시예에 따르면, 정보 처리 시스템은 특정 패치에 관련된 엔트로피 값이 높은 경우, 해당 패치를 제1 보정 대상 패치로 결정할 수 있다. 이 경우, 정보 처리 시스템은 특정 패치에 대해 추론된 클래스와 연관된 엔트로피 값을 기초로 특정 패치를 제1 보정 대상 패치로 결정할지 여부를 결정할 수 있다. 예를 들어, 특정 패치에 대해 결정된 클래스와 연관된 엔트로피 값이 미리 결정된 엔트로피 값보다 크다면, 특정 패치가 제1 보정 대상 패치로 결정될 수 있다.
마지막으로, 단계(S730)에서, 정보 처리 시스템은 결정된 제1 보정 대상 패치에 대한 시각적 표시를 출력할 수 있다. 예를 들어, 정보 처리 시스템은 결정된 제1 보정 대상 패치에 대한 시각적 표시를 결정하고, 제1 보정 대상 패치에 대한 시각적 표시가 적용된 병리 슬라이드 이미지 또는 그 일부가 어노테이터 단말에 제공될 수 있다.
도 8은 본 개시의 일 실시예에 따른 제1 보정 대상 패치에 대한 레이블 정보 아이템의 보정에 대한 예시도이다. 정보 처리 시스템(예: 정보 처리 시스템(100))은 기계학습 모델을 이용하여 병리 슬라이드 이미지(810)에 포함된 복수의 패치에 대한 복수의 레이블 정보 아이템을 추론할 수 있다. 이렇게 추론된 복수의 패치에 대한 복수의 레이블 정보 아이템은 병리 슬라이드 이미지(810)에 적용되어, 도시된 바와 같이, 병리 슬라이드 이미지(820)가 생성될 수 있다. 일 실시예에 따르면, 병리 슬라이드 이미지(820)에서, 추론된 복수의 패치에 대한 복수의 레이블 정보 아이템은 병리 슬라이드 이미지(810)에 포함된 복수의 패치와 연관되어 저장될 수 있다. 이러한 병리 슬라이드 이미지(820)는 어노테이터 단말(예: 어노테이터 단말(110))을 통해 어노테이터(130)에 제공될 수 있다. 어노테이터(130)가 병리 슬라이드 이미지(820) 중 적어도 일부 영역(예: 패치)을 선택하는 것에 응답하여, 정보 처리 시스템은 선택된 적어도 일부 영역(예: 패치)에 대한 확대된 이미지(830)를 어노테이터(130)에 제공할 수 있다.
일 실시예에 따르면, 정보 처리 시스템(100)은 기계학습 모델이 추론한 레이블 정보 아이템과 연관된 복수의 패치 각각의 컨피던스 스코어 및/또는 엔트로피 값을 산출하도록 구성될 수 있다. 예를 들어, 정보 처리 시스템(100)은 복수의 패치에 대응하는 복수의 클래스의 각각에 대한 컨피던스 스코어를 산출할 수 있다. 그리고 나서, 복수의 클래스의 각각에 대한 컨피던스 스코어에 기초하여, 해당 패치에 대한 각 클래스 별로 엔트로피 값(예를 들어, uncertainty level 등)이 산출될 수 있다. 이렇게 산출된 컨피던스 스코어 및/또는 엔트로피 값은 해당 병리 슬라이드 이미지에 적용될 수 있다. 예를 들어, 도시된 바와 같이, 병리 슬라이드 이미지(820) 및 확대된 이미지(830)의 각각에 복수의 패치에 대한 시각적 표시가 출력되어, 복수의 패치에 대해 추론된 클래스 및/또는 추론된 클래스가 불확실한 영역이 표시될 수 있다.
일 실시예에 따르면, 정보 처리 시스템(100)은 복수의 패치 각각에 대한 컨피던스 스코어 또는 엔트로피 값 중 적어도 하나에 기초하여, 복수의 패치 중 적어도 하나의 제1 보정 대상 패치(832)를 결정하도록 구성될 수 있다. 여기서, 복수의 패치에 대한 복수의 레이블 정보는 복수의 패치와 연관된 복수의 클래스에 대한 정보(여기서, 복수의 클래스, 각 클래스에 대한 컨피던스 스코어, 각 클래스에 대한 엔트로피 값 등)를 포함할 수 있다. 예를 들어, 제1 보정 대상 패치는, 클래스에 대한 컨피던스 스코어가 가장 높으나, 엔트로피 값이 높은 패치를 지칭할 수 있다. 또 다른 예로서, 제1 보정 대상 패치는 클래스에 대한 컨피던스 스코어가 낮은 패치를 지칭할 수 있다. 이러한 제1 보정 대상 패치(832)는 시각적 표시(visual representation)가 되어 어노테이터 단말(110)에 제공될 수 있다. 예를 들어, 도시된 바와 같이, 제1 보정 대상 패치(832)에 대응하는 영역이 녹색으로 표시될 수 있다.
어노테이터(130)는 어노테이터 단말(110)을 통해 기계학습 모델이 추론한 레이블 정보 중, 추론 레이블 정보가 불확실하다고 판단될 수도 있는 적어도 하나의 패치를 확인하고, 보정된 레이블 정보를 제공할 수 있다. 일 실시예에 따르면, 어노테이터(130)는 확대된 이미지(830)에서 제1 보정 대상 패치(832)에 대한 보정된 레이블 정보를 제공할 수 있다. 이에 따라, 보정된 레이블 정보가 포함된 이미지(840)가 생성되어 어노테이터 단말을 통해 어노테이터(130)에 제공될 수 있다. 예를 들어, 정보 처리 시스템의 인공신경망 모델(500)이 불확실한 영역이라고 판단한 제1 보정 대상 패치(832)는 어노테이터에 의해 보정되어, 암 기질(cancer stroma)이라는 레이블 정보가 태깅되는 제1 영역(842) 및 암 상피(cancer epithelium)라는 레이블 정보가 태깅되는 제2 영역(844)로 구분되어 표시될 수 있다.
도 9는 본 개시의 일 실시예에 따른 제2 보정 대상 패치에 대한 시각적 표시를 출력하는 방법을 나타내는 예시적인 흐름도이다. 일 실시예에 따르면, 제2 보정 대상 패치에 대한 시각적 표시를 출력하는 방법(900)은 정보 처리 시스템(예: 정보 처리 시스템(900))에 의해 수행될 수 있다. 추가적으로 또는 대안적으로, 방법(900)은 어노테이터 단말(예: 어노테이터 단말(110))에 의해 수행될 수 있다. 도시된 바와 같이, 방법(900)은, 복수의 패치 각각에 대한 컨피던스 스코어 또는 엔트로피 값 중 적어도 하나를 산출하는 단계(S910)로 개시될 수 있다. 여기서, 복수의 패치에 대한 복수의 레이블 정보 아이템은 복수의 패치와 연관된 복수의 클래스를 포함할 수 있다.
그리고 나서, 단계(S920)에서, 정보 처리 시스템은 복수의 패치와 연관된 복수의 클래스 중 타겟 클래스에 대한 엔트로피 값에 가중치를 부여할 수 있다. 일 실시예에서, 정보 처리 시스템은 복수의 패치와 연관된 복수의 클래스 별 엔트로피 값을 산출하고, 타겟 클래스에 대한 엔트로피 값에 가중치를 부여할 수 있다. 이러한 타겟 클래스는 어노테이터에 의해 미리 결정될 수 있다.
이에 따라, 단계(S930)에서, 정보 처리 시스템은 복수의 패치 중 엔트로피 값에 가중치가 부여된 타겟 클래스와 연관된 제2 보정 대상 패치를 결정할 수 있다. 그리고 나서, 단계(S940)에서, 정보 처리 시스템은 결정된 제2 보정 대상 패치에 대한 시각적 표시를 출력할 수 있다. 예를 들어, 정보 처리 시스템은 결정된 제2 보정 대상 패치에 대한 시각적 표시를 이러한 패치를 포함한 병리 슬라이드 이미지 또는 그 일부에 표시할 수 있다. 이렇게 표시된 병리 슬라이드 이미지 또는 그 일부는 정보 처리 시스템에 제공될 수 있다.
도 10은 본 개시의 일 실시예에 따른 타겟 클래스에 대한 엔트로피 값에 가중치를 부여하는 방법을 나타내는 예시도이다. 도시된 바와 같이, 병리 슬라이드 이미지(1010)는 인공신경망 모델(500)에 의해 병리 슬라이드 이미지(1010)에 포함된 적어도 하나의 패치에 대한 레이블 정보 아이템이 추론될 수 있다. 여기서, 레이블 정보 아이템은 클래스, 클래스의 컨피던스 스코어 및/또는 클래스 별 엔트로피 값을 포함할 수 있다.
일 실시예에 따르면, 정보 처리 시스템(예: 정보 처리 시스템(100))은 복수의 패치와 연관된 복수의 클래스 중 타겟 클래스에 대한 엔트로피 값에 가중치를 부여하여, 가중치가 부여된 타겟 클래스와 연관된 적어도 하나의 제2 보정 대상 패치를 결정하도록 구성될 수 있다. 예를 들어, 정보 처리 시스템은 복수의 클래스 중 어노테이터(예: 어노테이터(130))가 어노테이터 단말(예: 어노테이터 단말(110))을 통해 추론된 레이블 정보가 불확실하다고 판단할 수 있는(즉, 인공신경망 모델(500)의 추론 성능이 떨어진다고 예상되는) 타겟 클래스(예를 들어, 마크로파지 등)에 대한 엔트로피에 가중치를 부여하고, 타겟 클래스와 연관된 패치를 제2 보정 대상 패치로 결정할 수 있다.
복수의 패치의 각각의 클래스 및 클래스 별 컨피던스 스코어를 이용하여 클래스별 엔트로피 값(1030)이 산출될 수 있다. 도시된 바와 같이, 타겟 클래스(1032)는 엔트로피 값(1030)에 포함된 다른 클래스들(예를 들어, 클래스 1, 클래스 4)보다 엔트로피 값이 낮다. 이에 따라, 타겟 클래스(1032)는, 정보 처리 시스템에 의해 제2 보정 대상 패치로 결정되지 않을 수 있다. 일 실시예에 따르면, 정보 처리 시스템은 복수의 패치와 연관된 복수의 클래스 중 타겟 클래스에 대한 엔트로피 값에 가중치를 부여할 수 있다. 예를 들어, 정보 처리 시스템은 엔트로피 값(1030)에 포함된 복수의 클래스 중 타겟 클래스(1032)에만 가중치를 부여하여, 가중치가 부여된 엔트로피 값(1040)을 추출할 수 있다.
도시된 바와 같이, 가중치가 부여된 타겟 클래스(1042)는 가중치가 부여된 엔트로피 값(1040)에 포함된 다른 클래스들 보다 엔트로피 값이 높다. 이에 따라, 타겟 클래스(1042)는 엔트로피 값이 가장 높아, 정보 처리 시스템에 의해 제2 보정 대상 패치로 결정될 수 있다. 또한, 제2 보정 대상 패치로 결정된 타겟 클래스(1042)는, 복수의 레이블 정보 아이템이 병리 슬라이드 이미지에 적용될 때 함께 적용되어, 병리 슬라이드 이미지에 타겟 클래스(1042)에 대한 시각적 표시가 출력될 수 있다.
이렇게 결정된 제2 보정 대상 패치는 시각적 표시가 되어, 어노테이터 단말에 제공될 수 있다. 예를 들어, 병리 슬라이드 이미지(1010)에서 노란색으로 표시된 부분이 제2 보정 대상 패치와 연관될 수 있다. 또한, 병리 슬라이드 이미지(1020)에 노란색으로 표시된 부분이 제2 보정 대상 패치에 연관될 수 있다.
병리 슬라이드 이미지(1010)에 포함된 노란색으로 표시된 부분이 선택되는 경우, 정보 처리 시스템은 병리 슬라이드 이미지(1010) 중 적어도 일부 영역(예: 패치)에 대한 확대된 이미지(1020)를 제공할 수 있다. 또한, 확대된 이미지(1020)는 타겟 클래스와 연관된 복수의 패치(1022)를 포함할 수 있다. 어노테이터는 어노테이터 단말을 통해 인공신경망 모델(500)이 추론한 레이블 정보 중, 제2 보정 대상 패치에 대한 응답을 제공할 수 있다. 예를 들어, 어노테이터는 제2 보정 대상 패치에 대한 보정된 레이블 정보를 제공할 수 있다.
도 11은 본 개시의 일 실시예에 따른 제2 보정 대상 패치에 대한 레이블 정보 아이템의 보정에 대한 예시도이다. 도시된 바와 같이, 정보 처리 시스템(예: 정보 처리 시스템(100)은 인공신경망 모델(500)을 이용하여 병리 슬라이드 이미지(1110)에 포함된 적어도 하나의 패치에 대한 레이블 정보 아이템를 생성할 수 있다. 이렇게 생성된 정보 아이템을 포함하거나 연관시킨 병리 슬라이드 이미지(1120)가 생성될 수 있다. 정보 처리 시스템은 어노테이터 단말(예: 어노테이터 단말(110))의 요청에 의해 병리 슬라이드 이미지(1120) 중 노란색으로 표시된 영역(예: 타겟 클래스와 연관된 패치)에 대한 확대된 이미지(1130)를 제공할 수 있다.
확대된 이미지(1130)는 타겟 클래스와 연관된 복수의 패치(1132)를 포함할 수 있다. 여기서, 타겟 클래스는 림프구와 연관될 수 있다. 또한, 타겟 클래스와 연관된 복수의 패치(1132)는 노란색 원으로 표시되어 있으나, 이에 제한되지 않고, 영역, 도형, 다른 색 또는 텍스트 등의 다양한 시각적 표시로 표현될 수 있다. 또한, 채색된 영역의 전부 또는 적어도 일부는 하나 이상의 패치와 대응될 수 있다. 예를 들어, 타겟 클래스는 인공신경망 모델(500)에 의해 추론된 적어도 하나의 레이블 정보 아이템에 포함될 수 있다. 인공신경망 모델(500)은 확대된 이미지(1130) 내의 모든 림프구를 추론하지 못할 수 있다. 또는, 림프구로 추론된 패치가 실제 림프구가 아닐 수도 있다.
확대된 이미지(1130)는 어노테이터 단말을 이용하는 어노테이터(예: 어노테이터(130))에 의해 보정되어, 보정된 레이블 정보 아이템을 포함하는 이미지(1140)가 생성될 수 있다. 일 실시예에 따르면, 정보 처리 시스템은 어노테이터 단말로부터 타겟 클래스와 연관된 복수의 패치(1132) 중 적어도 하나의 패치에 대한 보정된 레이블 정보를 수신할 수 있다. 다른 실시예에서, 정보 처리 시스템은 어노테이터 단말로부터 타겟 클래스와 연관되지 않았다고 판단된 복수의 패치(1142)에 대한 보정된 레이블 정보 아이템을 수신할 수 있다. 이 때 보정된 레이블 정보 아이템은 타겟 클래스와 연관될 수 있으며, 이에 따라, 이미지(1140)에 포함된 복수의 패치(1142)가 노란색으로 표시될 수 있다.
도 12는 본 개시의 일 실시예에 따른 레이블 정보 아이템을 보정하는 예시적인 시스템 구성도이다. 도시된 바와 같이, 정보 처리 시스템(100)은 하나 이상의 프로세서(1210), 버스(1230), 통신 인터페이스(1240), 프로세서(1210)에 의해 수행되는 컴퓨터 프로그램(1260)을 로드(load)하는 메모리(1220) 및 컴퓨터 프로그램(1260)을 저장하는 저장 모듈(1250)을 포함할 수 있다. 다만, 도 12에는 본 개시의 실시예와 관련 있는 구성요소들만이 도시되어 있다. 따라서, 본 개시가 속한 기술분야의 통상의 기술자라면 도 12에 도시된 구성요소들 외에 다른 범용적인 구성 요소들이 더 포함될 수 있음을 알 수 있다.
프로세서(1210)는 정보 처리 시스템(100)의 각 구성의 전반적인 동작을 제어한다. 프로세서(1210)는 CPU(Central Processing Unit), MPU(Micro Processor Unit), MCU(Micro Controller Unit), GPU(Graphic Processing Unit) 또는 본 개시의 기술 분야에 잘 알려진 임의의 형태의 프로세서를 포함하여 구성될 수 있다. 또한, 프로세서(1210)는 본 개시의 실시예들에 따른 방법을 실행하기 위한 적어도 하나의 애플리케이션 또는 프로그램에 대한 연산을 수행할 수 있다. 정보 처리 시스템(100)은 하나 이상의 프로세서를 구비할 수 있다.
메모리(1220)는 각종 데이터, 명령 및/또는 정보를 저장할 수 있다. 메모리(1220)는 본 개시의 다양한 실시예들에 따른 방법/동작을 실행하기 위하여 저장 모듈(1250)로부터 하나 이상의 컴퓨터 프로그램(1260)을 로드할 수 있다. 메모리(1220)는 RAM과 같은 휘발성 메모리로 구현될 수 있으나, 본 개시의 기술적 범위는 이에 한정되지 아니한다.
버스(1230)는 정보 처리 시스템(100)의 구성 요소 간 통신 기능을 제공할 수 있다. 버스(1230)는 주소 버스(Address Bus), 데이터 버스(Data Bus) 및 제어 버스(Control Bus) 등 다양한 형태의 버스로 구현될 수 있다.
통신 인터페이스(1240)는 정보 처리 시스템(100)의 유무선 인터넷 통신을 지원할 수 있다. 또한, 통신 인터페이스(1240)는 인터넷 통신 외의 다양한 통신 방식을 지원할 수도 있다. 이를 위해, 통신 인터페이스(1240)는 본 개시의 기술 분야에 잘 알려진 통신 모듈을 포함하여 구성될 수 있다.
저장 모듈(1250)은 하나 이상의 컴퓨터 프로그램(1260)을 비임시적으로 저장할 수 있다. 저장 모듈(1250)은 ROM(Read Only Memory), EPROM(Erasable Programmable ROM), EEPROM(Electrically Erasable Programmable ROM), 플래시 메모리 등과 같은 비휘발성 메모리, 하드 디스크, 착탈형 디스크, 또는 본 개시가 속하는 기술 분야에서 잘 알려진 임의의 형태의 컴퓨터로 읽을 수 있는 기록 매체를 포함하여 구성될 수 있다.
컴퓨터 프로그램(1260)은 메모리(1220)에 로드될 때 프로세서(1210)로 하여금 본 개시의 다양한 실시예들에 따른 동작/방법을 수행하도록 하는 하나 이상의 인스트럭션들(instructions)을 포함할 수 있다. 즉, 프로세서(1210)는 하나 이상의 인스트럭션들을 실행함으로써, 본 개시의 다양한 실시예들에 따른 동작/방법들을 수행할 수 있다.
예를 들어, 컴퓨터 프로그램(1260)은 병리 슬라이드 이미지에 대한 정보를 얻는 동작, 병리 슬라이드 이미지 및/또는 병리 슬라이드 이미지에 포함된 적어도 하나의 패치에 대한 레이블 정보 아이템을 얻는 동작, 병리 슬라이드 이미지 및/또는 병리 슬라이드 이미지에 포함된 적어도 하나의 패치에 대한 결과값(예: 레이블 정보)을 추론하도록 기계학습 모델을 학습하는 동작, 학습된 기계학습 모델을 통해 병리 슬라이드 이미지 및/또는 병리 슬라이드 이미지에 포함된 적어도 하나의 패치에 대한 레이블 정보를 추론하는 동작, 병리 슬라이드 이미지 및/또는 병리 슬라이드 이미지에 포함된 적어도 하나의 패치에 대한 레이블 정보 아이템을 보정하는 동작을 수행하도록 하는 하나 이상의 인스트럭션들을 포함할 수 있다. 이와 같은 경우, 정보 처리 시스템(100)을 통해 본 개시의 몇몇 실시예들에 따른 레이블 정보 아이템을 보정하는 시스템이 구현될 수 있다.
본 개시의 앞선 설명은 통상의 기술자들이 본 개시를 행하거나 이용하는 것을 가능하게 하기 위해 제공된다. 본 개시의 다양한 수정예들이 통상의 기술자들에게 쉽게 자명할 것이고, 본원에 정의된 일반적인 원리들은 본 개시의 취지 또는 범위를 벗어나지 않으면서 다양한 변형예들에 적용될 수도 있다. 따라서, 본 개시는 본원에 설명된 예들에 제한되도록 의도된 것이 아니고, 본원에 개시된 원리들 및 신규한 특징들과 일관되는 최광의의 범위가 부여되도록 의도된다.
비록 예시적인 구현예들이 하나 이상의 독립형 컴퓨터 시스템의 맥락에서 현재 개시된 주제의 양태들을 활용하는 것을 언급할 수도 있으나, 본 주제는 그렇게 제한되지 않고, 오히려 네트워크나 분산 컴퓨팅 환경과 같은 임의의 컴퓨팅 환경과 연계하여 구현될 수도 있다. 또 나아가, 현재 개시된 주제의 양상들은 복수의 프로세싱 칩들이나 디바이스들에서 또는 그들에 걸쳐 구현될 수도 있고, 스토리지는 복수의 디바이스들에 걸쳐 유사하게 영향을 받게 될 수도 있다. 이러한 디바이스들은 PC들, 네트워크 서버들, 및 핸드헬드 디바이스들을 포함할 수도 있다.
본 명세서에서는 본 개시가 일부 실시예들과 관련하여 설명되었지만, 본 발명이 속하는 기술분야의 통상의 기술자가 이해할 수 있는 본 개시의 범위를 벗어나지 않는 범위에서 다양한 변형 및 변경이 이루어질 수 있다는 점을 알아야 할 것이다. 또한, 그러한 변형 및 변경은 본 명세서에서 첨부된 특허청구의 범위 내에 속하는 것으로 생각되어야 한다.
100: 정보 처리 시스템
110: 어노테이터 단말
120: 저장 시스템
130: 어노테이터
1210: 프로세서
1220: 메모리
1230: 버스
1240: 통신 인터페이스
1250: 저장 모듈
1260: 컴퓨터 프로그램

Claims (20)

  1. 적어도 하나의 컴퓨팅 장치에 의해 수행되는, 레이블 정보를 보정하는 방법에 있어서,
    복수의 패치를 포함하는 병리 슬라이드 이미지를 획득하는 단계;
    기계학습 모델을 이용하여, 상기 획득된 병리 슬라이드 이미지에 포함된 복수의 패치에 대한 복수의 레이블 정보 아이템을 추론하는 단계;
    상기 추론된 복수의 레이블 정보 아이템을 상기 병리 슬라이드 이미지에 적용하는 단계;
    상기 추론된 복수의 레이블 정보 아이템이 적용된 병리 슬라이드 이미지를 어노테이터 단말에 제공하는 단계;
    상기 어노테이터 단말로부터 상기 추론된 복수의 레이블 정보 아이템 중 적어도 하나의 레이블 정보 아이템에 대한 응답을 수신하는 단계 - 상기 응답은 상기 적어도 하나의 레이블 정보 아이템에 대한 확인(confirmation) 또는 상기 적어도 하나의 레이블 정보 아이템에 대한 보정된 레이블 정보 아이템을 포함함 -;
    상기 응답의 종류에 따라, 상기 복수의 패치 중 적어도 하나의 패치, 상기 적어도 하나의 레이블 정보 아이템 또는 상기 보정된 레이블 정보 아이템 중 적어도 일부를 상기 기계학습 모델의 학습 데이터 세트로 분류하는 단계; 및
    상기 응답의 종류에 기초하여, 상기 기계학습 모델의 학습 데이터 세트에 가중치를 부여할지 여부를 결정하는 단계
    를 포함하는, 레이블 정보를 보정하는 방법.
  2. 제1항에 있어서,
    상기 적어도 하나의 레이블 정보 아이템은 상기 복수의 패치 중 적어도 하나의 패치와 연관되는, 레이블 정보를 보정하는 방법.
  3. 제2항에 있어서,
    상기 복수의 패치 중 적어도 하나의 패치, 상기 적어도 하나의 레이블 정보 아이템 또는 상기 보정된 레이블 정보 아이템 중 적어도 일부를 상기 기계학습 모델의 학습 데이터 세트로 분류하는 단계는,
    상기 응답이 상기 적어도 하나의 레이블 정보 아이템에 대한 확인을 포함하는 경우, 상기 적어도 하나의 패치 및 상기 적어도 하나의 레이블 정보 아이템을 상기 기계학습 모델의 학습(training) 데이터 세트로 분류하는 단계
    를 포함하는, 레이블 정보를 보정하는 방법.
  4. 제2항에 있어서,
    상기 복수의 패치 중 적어도 하나의 패치, 상기 적어도 하나의 레이블 정보 아이템 또는 상기 보정된 레이블 정보 아이템 중 적어도 일부를 상기 기계학습 모델의 학습 데이터 세트로 분류하는 단계는,
    상기 응답이 상기 적어도 하나의 레이블 정보 아이템에 대한 보정된 레이블 정보 아이템을 포함하는 경우, 상기 적어도 하나의 패치 및 상기 보정된 레이블 정보 아이템을 상기 기계학습 모델의 학습 데이터 세트로 분류하는 단계
    를 포함하는, 레이블 정보를 보정하는 방법.
  5. 제4항에 있어서,
    상기 응답의 종류에 기초하여, 상기 기계학습 모델의 학습 데이터 세트에 가중치를 부여할지 여부를 결정하는 단계는,
    상기 기계학습 모델의 학습에 사용되는, 상기 적어도 하나의 패치에 대한 보정된 레이블 정보 아이템에 가중치를 부여하는 단계
    를 더 포함하는, 레이블 정보를 보정하는 방법.
  6. 제4항에 있어서,
    상기 추론된 복수의 레이블 정보 아이템이 적용된 병리 슬라이드 이미지를 어노테이터 단말에 제공하는 단계는, 상기 병리 슬라이드 이미지의 압축된 이미지를 상기 어노테이터 단말에 제공하는 단계를 포함하고 - 상기 압축된 이미지는 상기 복수의 레이블 정보 아이템의 압축된 레이블 정보 아이템과 연관됨 -,
    상기 어노테이터 단말로부터 상기 추론된 복수의 레이블 정보 아이템 중 적어도 하나의 레이블 정보 아이템에 대한 응답을 수신하는 단계는,
    상기 어노테이터 단말로부터, 상기 압축된 이미지 내에서 선택된 제1 압축된 레이블 정보 아이템에 대응하는 상기 적어도 하나의 레이블 정보 아이템에 대한 요청을 수신하는 단계;
    상기 적어도 하나의 레이블 정보 아이템을 상기 어노테이터 단말에 제공하는 단계; 및
    상기 제공된 적어도 하나의 레이블 정보 아이템에 대한 보정된 레이블 정보 아이템을 수신하는 단계
    를 포함하는, 레이블 정보를 보정하는 방법.
  7. 제1항에 있어서,
    상기 기계학습 모델을 이용하여, 상기 획득된 병리 슬라이드 이미지에 포함된 복수의 패치에 대한 복수의 레이블 정보 아이템을 추론하는 단계는,
    상기 복수의 패치의 각각에 대한 컨피던스 스코어 또는 엔트로피 값 중 적어도 하나를 산출하는 단계; 및
    상기 산출된 컨피던스 스코어 또는 엔트로피 값 중 적어도 하나에 기초하여, 상기 복수의 패치 중 적어도 하나의 제1 보정 대상 패치를 결정하는 단계
    를 포함하는, 레이블 정보를 보정하는 방법.
  8. 제7항에 있어서,
    상기 추론된 복수의 레이블 정보 아이템을 상기 병리 슬라이드 이미지에 적용하는 단계는, 상기 결정된 적어도 하나의 제1 보정 대상 패치에 대한 시각적 표시(visual representation)를 출력하는 단계
    를 포함하는, 레이블 정보를 보정하는 방법.
  9. 제7항에 있어서,
    상기 복수의 패치에 대한 복수의 레이블 정보 아이템은 상기 복수의 패치와 연관된 복수의 클래스를 포함하고,
    상기 복수의 패치의 각각에 대한 컨피던스 스코어 또는 엔트로피 값 중 적어도 하나를 산출하는 단계는,
    상기 복수의 패치와 연관된 복수의 클래스 중 타겟 클래스에 대한 엔트로피 값에 가중치를 부여하는 단계
    를 포함하는, 레이블 정보를 보정하는 방법.
  10. 제9항에 있어서,
    상기 복수의 패치 중, 상기 엔트로피 값에 상기 가중치가 부여된 타겟 클래스와 연관된 적어도 하나의 제2 보정 대상 패치를 결정하는 단계를 더 포함하고,
    상기 추론된 복수의 레이블 정보 아이템을 상기 병리 슬라이드 이미지에 적용하는 단계는, 상기 결정된 적어도 하나의 제2 보정 대상 패치에 대한 시각적 표시를 출력하는 단계를 포함하는, 레이블 정보를 보정하는 방법.
  11. 정보 처리 시스템에 있어서,
    하나 이상의 인스트럭션(instructions)을 저장하는 메모리; 및
    상기 저장된 하나 이상의 인스트럭션들을 실행함으로써,
    복수의 패치를 포함하는 병리 슬라이드 이미지를 획득하고, 기계학습 모델을 이용하여, 상기 획득된 병리 슬라이드 이미지에 포함된 복수의 패치에 대한 복수의 레이블 정보 아이템을 추론하고, 상기 추론된 복수의 레이블 정보 아이템을 상기 병리 슬라이드 이미지에 적용하고, 상기 추론된 복수의 레이블 정보 아이템이 적용된 병리 슬라이드 이미지를 어노테이터 단말에 제공하고, 상기 어노테이터 단말로부터 상기 추론된 복수의 레이블 정보 아이템 중 적어도 하나의 레이블 정보 아이템에 대한 응답을 수신하고 - 상기 응답은 상기 적어도 하나의 레이블 정보 아이템에 대한 확인 또는 상기 적어도 하나의 레이블 정보 아이템에 대한 보정된 레이블 정보 아이템을 포함함 -, 상기 응답의 종류에 따라, 상기 복수의 패치 중 적어도 하나의 패치, 상기 적어도 하나의 레이블 정보 아이템 또는 상기 보정된 레이블 정보 아이템 중 적어도 일부를 상기 기계학습 모델의 학습 데이터 세트로 분류하고, 상기 응답의 종류에 기초하여, 상기 기계학습 모델의 학습 데이터 세트에 가중치를 부여할지 여부를 결정하도록 구성된 프로세서를 포함하는,
    정보 처리 시스템.
  12. 제11항에 있어서,
    상기 적어도 하나의 레이블 정보 아이템은 상기 복수의 패치 중 적어도 하나의 패치와 연관되는,
    정보 처리 시스템.
  13. 제12항에 있어서,
    상기 프로세서는,
    상기 응답이 상기 적어도 하나의 레이블 정보 아이템에 대한 확인을 포함하는 경우, 상기 적어도 하나의 패치 및 상기 적어도 하나의 레이블 정보 아이템을 상기 기계학습 모델의 학습 데이터 세트로 분류하도록 더 구성되는,
    정보 처리 시스템.
  14. 제12항에 있어서,
    상기 프로세서는,
    상기 응답이 상기 적어도 하나의 레이블 정보 아이템에 대한 보정된 레이블 정보 아이템을 포함하는 경우, 상기 적어도 하나의 패치 및 상기 보정된 레이블 정보 아이템을 상기 기계학습 모델의 학습 데이터 세트로 분류하도록 더 구성되는,
    정보 처리 시스템.
  15. 제14항에 있어서,
    상기 프로세서는,
    상기 기계학습 모델의 학습에 사용되는, 상기 적어도 하나의 패치에 대한 보정된 레이블 정보 아이템에 가중치를 부여하도록 더 구성되는,
    정보 처리 시스템.
  16. 제14항에 있어서,
    상기 프로세서는,
    상기 병리 슬라이드 이미지의 압축된 이미지를 상기 어노테이터 단말에 제공하고, 상기 어노테이터 단말로부터, 상기 이미지 내에서 선택된 제1 압축된 레이블 정보 아이템에 대응하는 상기 적어도 하나의 레이블 정보 아이템에 대한 요청을 수신하고, 상기 적어도 하나의 레이블 정보 아이템을 상기 어노테이터 단말에 제공하고, 상기 제공된 적어도 하나의 레이블 정보 아이템에 대한 보정된 레이블 정보 아이템을 수신하도록 더 구성되는,
    정보 처리 시스템.
  17. 제11항에 있어서,
    상기 프로세서는,
    상기 복수의 패치의 각각에 대한 컨피던스 스코어 또는 엔트로피 값 중 적어도 하나를 산출하고, 상기 산출된 컨피던스 스코어 또는 엔트로피 값 중 적어도 하나에 기초하여, 상기 복수의 패치 중 적어도 하나의 제1 보정 대상 패치를 결정하도록 더 구성되는,
    정보 처리 시스템.
  18. 제17항에 있어서,
    상기 프로세서는,
    상기 결정된 적어도 하나의 제1 보정 대상 패치에 대한 시각적 표시를 출력하도록 더 구성되는,
    정보 처리 시스템.
  19. 제17항에 있어서,
    상기 복수의 패치에 대한 복수의 레이블 정보 아이템은 상기 복수의 패치와 연관된 복수의 클래스를 포함하고,
    상기 프로세서는,
    상기 복수의 패치와 연관된 복수의 클래스 중 타겟 클래스에 대한 엔트로피 값에 가중치를 부여하도록 더 구성되는,
    정보 처리 시스템.
  20. 제19항에 있어서,
    상기 프로세서는,
    상기 복수의 패치 중, 상기 엔트로피 값에 상기 가중치가 부여된 타겟 클래스와 연관된 적어도 하나의 제2 보정 대상 패치를 결정하고, 상기 결정된 적어도 하나의 제2 보정 대상 패치에 대한 시각적 표시를 출력하도록 더 구성되는,
    정보 처리 시스템.
KR1020200061582A 2020-05-22 2020-05-22 레이블 정보를 보정하는 방법 및 시스템 KR102241724B1 (ko)

Priority Applications (3)

Application Number Priority Date Filing Date Title
KR1020200061582A KR102241724B1 (ko) 2020-05-22 2020-05-22 레이블 정보를 보정하는 방법 및 시스템
US16/953,693 US11710552B2 (en) 2020-05-22 2020-11-20 Method and system for refining label information
KR1020210047603A KR20210144567A (ko) 2020-05-22 2021-04-13 레이블 정보를 보정하는 방법 및 시스템

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
KR1020200061582A KR102241724B1 (ko) 2020-05-22 2020-05-22 레이블 정보를 보정하는 방법 및 시스템

Related Child Applications (1)

Application Number Title Priority Date Filing Date
KR1020210047603A Division KR20210144567A (ko) 2020-05-22 2021-04-13 레이블 정보를 보정하는 방법 및 시스템

Publications (1)

Publication Number Publication Date
KR102241724B1 true KR102241724B1 (ko) 2021-04-19

Family

ID=75718632

Family Applications (2)

Application Number Title Priority Date Filing Date
KR1020200061582A KR102241724B1 (ko) 2020-05-22 2020-05-22 레이블 정보를 보정하는 방법 및 시스템
KR1020210047603A KR20210144567A (ko) 2020-05-22 2021-04-13 레이블 정보를 보정하는 방법 및 시스템

Family Applications After (1)

Application Number Title Priority Date Filing Date
KR1020210047603A KR20210144567A (ko) 2020-05-22 2021-04-13 레이블 정보를 보정하는 방법 및 시스템

Country Status (2)

Country Link
US (1) US11710552B2 (ko)
KR (2) KR102241724B1 (ko)

Families Citing this family (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
DE102020207324A1 (de) * 2020-06-12 2021-12-16 Robert Bosch Gesellschaft mit beschränkter Haftung Plausibilisierung der Ausgabe eines Bildklassifikators mit einem Generator für abgewandelte Bilder
WO2023156417A1 (en) * 2022-02-16 2023-08-24 Leica Instruments (Singapore) Pte. Ltd. Systems and methods for training and application of machine learning algorithms for microscope images
WO2024112121A1 (ko) * 2022-11-23 2024-05-30 (주) 노보믹스 위암 병리조직 이미지 판독 인공지능 소프트웨어
CN117593596B (zh) * 2024-01-19 2024-04-16 四川封面传媒科技有限责任公司 一种敏感信息检测方法、***、电子设备及介质

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2019521443A (ja) * 2016-06-30 2019-07-25 コニカ ミノルタ ラボラトリー ユー.エス.エー.,インコーポレイテッド 適応型追加学習を用いた細胞のアノテーション法及びアノテーションシステム
KR20200054138A (ko) * 2020-01-28 2020-05-19 주식회사 루닛 어노테이션 작업 관리 방법, 이를 지원하는 장치 및 시스템

Family Cites Families (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2003023366A2 (en) * 2001-09-12 2003-03-20 The State Of Oregon, Acting By And Through The State Board Of Higher Education On Behalf Of Oregon State University Method and system for classifying a scenario
US7471815B2 (en) * 2004-08-31 2008-12-30 Siemens Medical Solutions Usa, Inc. Candidate generation for lung nodule detection
JP6368779B2 (ja) * 2013-06-28 2018-08-01 コーニンクレッカ フィリップス エヌ ヴェKoninklijke Philips N.V. トモシンセシスデータからエッジ保存合成マンモグラムを生成するための方法
WO2015113895A1 (en) * 2014-01-28 2015-08-06 Ventana Medical Systems, Inc. Adaptive classification for whole slide tissue segmentation
EP3491504A4 (en) * 2016-11-16 2019-07-17 Samsung Electronics Co., Ltd. IMAGE MANAGEMENT PROCESS AND DEVICE THEREFOR
US11748877B2 (en) * 2017-05-11 2023-09-05 The Research Foundation For The State University Of New York System and method associated with predicting segmentation quality of objects in analysis of copious image data
WO2019108888A1 (en) * 2017-11-30 2019-06-06 The Research Foundation For The State University Of New York SYSTEM AND METHOD TO QUANTIFY TUMOR-INFILTRATING LYMPHOCYTES (TILs) FOR CLINICAL PATHOLOGY ANALYSIS
EP3895600A4 (en) * 2018-12-11 2022-03-02 Synergy A.I. Co. Ltd. METHOD FOR MEASURING THE VOLUME OF AN ORGAN BY MEANS OF AN ARTIFICIAL NEURONAL NETWORK, AND ASSOCIATED APPARATUS
US11972621B2 (en) * 2019-04-24 2024-04-30 Icahn School Of Medicine At Mount Sinai Systems and methods to label structures of interest in tissue slide images
US20210045716A1 (en) * 2019-08-13 2021-02-18 GE Precision Healthcare LLC Method and system for providing interaction with a visual artificial intelligence ultrasound image segmentation module
US11676701B2 (en) * 2019-09-05 2023-06-13 Pearl Inc. Systems and methods for automated medical image analysis
AU2021213741A1 (en) * 2020-01-28 2022-09-08 Paige. Ai, Inc. Systems and methods for delivery of digital biomarkers and genomic panels

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2019521443A (ja) * 2016-06-30 2019-07-25 コニカ ミノルタ ラボラトリー ユー.エス.エー.,インコーポレイテッド 適応型追加学習を用いた細胞のアノテーション法及びアノテーションシステム
KR20200054138A (ko) * 2020-01-28 2020-05-19 주식회사 루닛 어노테이션 작업 관리 방법, 이를 지원하는 장치 및 시스템

Also Published As

Publication number Publication date
US11710552B2 (en) 2023-07-25
KR20210144567A (ko) 2021-11-30
US20210366594A1 (en) 2021-11-25

Similar Documents

Publication Publication Date Title
KR102241724B1 (ko) 레이블 정보를 보정하는 방법 및 시스템
US20230195845A1 (en) Fast annotation of samples for machine learning model development
Beyeler Machine Learning for OpenCV
US11200483B2 (en) Machine learning method and apparatus based on weakly supervised learning
KR102246266B1 (ko) 레이블 정보에 대한 피드백을 제공하는 방법 및 시스템
US10692602B1 (en) Structuring free text medical reports with forced taxonomies
CN111242083B (zh) 基于人工智能的文本处理方法、装置、设备、介质
Chessel An overview of data science uses in bioimage informatics
WO2020023760A1 (en) System and method for clustering products by combining attribute data with image recognition
Khadangi et al. EM-stellar: benchmarking deep learning for electron microscopy image segmentation
KR20210136884A (ko) 병리 슬라이드 이미지에 대한 면역 표현형과 연관된 정보를 제공하는 방법 및 장치
US20230011970A1 (en) Method and an apparatus for predicting a future state of a biological system, a system and a computer program
CN114330499A (zh) 分类模型的训练方法、装置、设备、存储介质及程序产品
Elkins et al. Developing an app to interpret chest X-rays to support the diagnosis of respiratory pathology with artificial intelligence
KR102569285B1 (ko) 병리 슬라이드 이미지 내의 이상 영역을 검출하기 위한 기계학습 모델을 학습시키는 방법 및 시스템
Sharma et al. Machine Learning for OpenCV 4: Intelligent algorithms for building image processing apps using OpenCV 4, Python, and scikit-learn
Poklukar et al. Delaunay component analysis for evaluation of data representations
Pothineni Revolutionizing Blood Cell Analysis: The Emergence of EfficientNetB7-Enhanced Deep Learning Models
KR102601684B1 (ko) 힌트 기반의 머신러닝 모델을 통해 목적 데이터에 대한 어노테이션 정보를 제공하는 방법 및 시스템
CN110059743B (zh) 确定预测的可靠性度量的方法、设备和存储介质
ter Haar Romeny A deeper understanding of deep learning
CN113449775A (zh) 一种基于类激活映射机制的多标签图像分类方法和***
KR20220063052A (ko) 암 환자 치료에 대한 반응성을 예측하기 위한 방법 및 시스템
CN111582404A (zh) 内容分类方法、装置及可读存储介质
US20210390679A1 (en) Method and system for providing annotation information for 3d image

Legal Events

Date Code Title Description
A107 Divisional application of patent
GRNT Written decision to grant