KR101776094B1 - 네트워크 기반의 약제 효능 평가 장치 및 방법 - Google Patents

네트워크 기반의 약제 효능 평가 장치 및 방법 Download PDF

Info

Publication number
KR101776094B1
KR101776094B1 KR1020150020364A KR20150020364A KR101776094B1 KR 101776094 B1 KR101776094 B1 KR 101776094B1 KR 1020150020364 A KR1020150020364 A KR 1020150020364A KR 20150020364 A KR20150020364 A KR 20150020364A KR 101776094 B1 KR101776094 B1 KR 101776094B1
Authority
KR
South Korea
Prior art keywords
disease
drug
agent
adjacency
module
Prior art date
Application number
KR1020150020364A
Other languages
English (en)
Other versions
KR20160097903A (ko
Inventor
윤영미
오민
안재균
Original Assignee
가천대학교 산학협력단
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 가천대학교 산학협력단 filed Critical 가천대학교 산학협력단
Priority to KR1020150020364A priority Critical patent/KR101776094B1/ko
Priority to US14/926,685 priority patent/US20160232309A1/en
Publication of KR20160097903A publication Critical patent/KR20160097903A/ko
Application granted granted Critical
Publication of KR101776094B1 publication Critical patent/KR101776094B1/ko

Links

Images

Classifications

    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B5/00ICT specially adapted for modelling or simulations in systems biology, e.g. gene-regulatory networks, protein interaction networks or metabolic networks
    • G06F19/12
    • G06F19/24
    • G06F19/28
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N20/00Machine learning
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B40/00ICT specially adapted for biostatistics; ICT specially adapted for bioinformatics-related machine learning or data mining, e.g. knowledge discovery or pattern finding
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B50/00ICT programming tools or database systems specially adapted for bioinformatics
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16HHEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
    • G16H20/00ICT specially adapted for therapies or health-improving plans, e.g. for handling prescriptions, for steering therapy or for monitoring patient compliance
    • G16H20/10ICT specially adapted for therapies or health-improving plans, e.g. for handling prescriptions, for steering therapy or for monitoring patient compliance relating to drugs or medications, e.g. for ensuring correct administration to patients
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16HHEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
    • G16H50/00ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics
    • G16H50/20ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics for computer-aided diagnosis, e.g. based on medical expert systems

Landscapes

  • Engineering & Computer Science (AREA)
  • Health & Medical Sciences (AREA)
  • Medical Informatics (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Health & Medical Sciences (AREA)
  • Public Health (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Software Systems (AREA)
  • Data Mining & Analysis (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Epidemiology (AREA)
  • Primary Health Care (AREA)
  • Biomedical Technology (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Artificial Intelligence (AREA)
  • Evolutionary Computation (AREA)
  • Databases & Information Systems (AREA)
  • Biotechnology (AREA)
  • Computing Systems (AREA)
  • Medicinal Chemistry (AREA)
  • General Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • Spectroscopy & Molecular Physics (AREA)
  • Chemical & Material Sciences (AREA)
  • Evolutionary Biology (AREA)
  • Biophysics (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Mathematical Physics (AREA)
  • Bioethics (AREA)
  • Pathology (AREA)
  • Molecular Biology (AREA)
  • Physiology (AREA)
  • Investigating Or Analysing Biological Materials (AREA)

Abstract

본 발명은 네트워크 기반의 약제 효능 평가 장치 및 방법에 관한 것으로, 약제 및 질병 사이의 관련도를 약제 인접성 또는 질병 인접성에 근거한 추론 및 유전자 모듈과 질병의 거리에 근거한 추론 중 적어도 하나에 의하여 산출하는 단계, 상기 관련도를 피처로 삼는 학습 기법을 사용하여 약제 및 질병 사이의 관련 여부를 결정하는 분류기를 생성하는 단계 및 상기 분류기를 사용하여 약제 및 질병 사이의 관련 여부를 결정하는 단계를 포함하며, 단백질간 반응 데이터베이스 및 단백질과 유전자 관련성 데이터베이스에 근거하여 구축한 네트워크에 기반하여 약제가 효능을 보일 수 있는 약제 대 질병 관계를 검색하고 약제의 분자적 반응을 평가함으로써 보다 정밀하고 민감하게 약제의 새로운 효능을 발견할 수 있고, 신약 개발에 필요한 시간 및 비용을 절감할 수 있다.

Description

네트워크 기반의 약제 효능 평가 장치 및 방법{APPARATUS AND METHOD FOR ASSESSING EFFECTS OF DRUGS BASED ON NETWORKS}
본 발명은 네트워크 기반의 약제 효능 평가 장치 및 방법에 관한 것으로, 보다 상세하게는 단백질간 반응 데이터베이스 및 단백질과 유전자 관련성 데이터베이스에 근거하여 구축한 네트워크에 기반하여 약제가 효능을 보일 수 있는 약제 대 질병 관계를 검색하는 네트워크 기반의 약제 효능 평가 장치 및 방법에 관한 것이다.
약제(Drug)와 약제가 효능을 보이는 질병(Disease) 사이의 분자적 수준에서의 관계는 약제의 효용을 예측하는 데에 결정적인 역할을 하며, 이를 위해서는 약제가 어떻게 특정한 질병의 표현형(Phenotype)과 연관된 목표에 작용하는지, 어떻게 특정한 유전자 모듈이 비정상적인 표현형을 야기하는지, 어떻게 목표와 유전자가 상호작용하는지 이해하는 것이 중요하다. 잠재적인 약제-질병 관계를 예측하기 위한 계산적인 방법이 대두되고 있으며, 이를 위한 방법으로 질병중심적 접근, 약제중심적 접근 및 질병-약제 상호접근 방식이 제시되고 있다.
약제중심적 접근은 축적된 화학적 및 약학적 지식을 이용하여 약제의 목적을 재정의할 기회를 추구한다. 그러나 약제는 복잡하고 대체로 특징지워지지 않는 대사적 변형을 거쳐 대사되고 생리학적으로 배포되기 때문에 많은 경우 생리학적 효과는 화학적 성질 만으로 예측할 수 없다는 문제가 있다.
질병중심적 접근은 질병 처치, 병리학 및 증후학적 측면에서의 질병의 특징을 이용하여 접근한다. 이러한 접근 방법은 질병에 대한 확립된 지식을 통하여 질병의 그룹을 찾고 존재하는 약제와 연관된 질병의 공통 특징을 찾아낸다. 질병중심적 접근은 질병의 특징을 나타내는 데이터에 심하게 의존하기 때문에, 유전자 표현형의 프로파일 또는 질병 표현형의 프로파일을 측정하는 데 사용되는 수단에 결과가 제약된다는 문제가 있다.
질병-약제 상호접근 방식은 상술한 두 방식을 조합하여 접근한다. 이에 따르면 약제의 생분자 또는 화학적 성질, 또는 이러한 성질에 기반하여 처리된 데이터와 질병의 성질에 관한 또는 성질에 기반하여 처리된 데이터를 대응시킴으로써 약제와 질병 사이의 새로운 치료법적 관계를 추론할 수 있다. 약과 질병에 관한 정보를 모두 이용함으로써 알려지지 않았거나 부가적인 약제의 목표와 같은 약학적 지식의 공백을 극복할 수 있다.
이러한 질병-약제 상호접근 방식으로는 유전자 표현형의 미세배열(Microarray)을 사용하여 질병의 시그니처(Signature)와 약제의 시그니처를 생성하고 질병과 약제의 성질을 직접 대응시키는 방법이나, 질병-유전자-약제 관계를 표현하는 코-모듈(Co-Module)을 사용하는 방법이 제안되었다. 또한 유사한 약제가 유사한 질병에 작용한다는 관찰에 착안하여 질병간 및 약제간 유사성을 측정하고 질병 및 약제를 분류하는 방법이 제안되었으나, 이러한 방법은 모든 필요한 약제와 질병의 성질을 수집하여야 하는 한계가 있었다.
최근 유전자 기능 네트워크(Functional Genetic Network)는 보다 정확하고 완전해지고 있으며, 이러한 네트워크는 약제와 질병이 어떻게 연관되는지 분자 단위에서 이해하는 것을 가능케 할 수 있다고 기대되었다. 따라서 약제-질병 관계의 네트워크적 성질을 적절히 선택하여 현존하는 약제의 새로운 효능이나 부작용을 높은 정확도로 예측하고 보다 구체적인 증거를 제공할 수 있는 기술이 요망되었다.
한국공개특허 제10-2005-0085778호(등록일: 2005.08.29., 발명의 명칭 : 의료 데이터 처리 방법 및 데이터 처리 시스템, 청구범위 제1항)가 있다.
본 발명은, 단백질간 반응 데이터베이스 및 단백질과 유전자 관련성 데이터베이스에 근거하여 구축한 네트워크에 기반하여 약제가 효능을 보일 수 있는 약제 대 질병 관계를 검색하는 네트워크 기반의 약제 효능 평가 장치 및 방법을 제공하는 데 그 목적이 있다.
본 발명의 일 측면에 따른 네트워크 기반의 약제 효능 평가 방법은 약제 및 질병 사이의 관련도를 약제 인접성 또는 질병 인접성에 근거한 추론 및 유전자 모듈과 질병의 거리에 근거한 추론 중 적어도 하나에 의하여 산출하는 단계, 상기 관련도를 피처로 삼는 학습 기법을 사용하여 약제 및 질병 사이의 관련 여부를 결정하는 분류기를 생성하는 단계 및 상기 분류기를 사용하여 약제 및 질병 사이의 관련 여부를 결정하는 단계를 포함한다.
바람직하게는, 상기 약제 인접성에 근거한 추론은 제1 약제와 제1 질병이 관련이 있다면 상기 제1 약제와 인접한 제2 약제 및 상기 제1 질병이 관련이 있다고 추론한다.
바람직하게는, 상기 약제 인접성은 약제의 목표 단백질 및 유전적 네트워크 상에서 단백질 사이의 최단 거리에 근거하여 산출된다.
바람직하게는, 상기 약제 인접성은 제1 약제의 각 목표 단백질들 및 제2 약제의 각 목표 단백질들 사이의 상기 최단 거리의 합을 상기 제1 약제 및 제2 약제의 목표 단백질의 수에 근거하여 결정되는 비율 계수로 나누어 산출된다.
바람직하게는, 상기 질병 인접성에 근거한 추론은 제1 약제와 제1 질병이 관련이 있다면 상기 제1 약제 및 상기 제1 질병과 인접한 제2 질병이 관련이 있다고 추론한다.
바람직하게는, 상기 질병 인접성은 유전적 네트워크 상에서 질병의 질병 유전자 집합 및 유전적 네트워크 상에서 질병 유전자 사이의 최단 거리에 근거하여 산출된다.
바람직하게는, 상기 질병 인접성은 제1 질병의 질병 유전자 집합 내의 각 질병 유전자 및 제2 질병의 질병 유전자 집합 내의 각 질병 유전자 사이의 상기 최단 거리의 합을 상기 제1 질병 및 제2 질병의 질병 유전자 집합의 크기에 근거하여 결정되는 비율 계수로 나누어 산출된다.
바람직하게는, 상기 약제 및 질병의 관련도는 상기 약제의 다른 약제와의 최대 약제 인접성 및 상기 질병의 다른 질병과의 최대 질병 인접성의 기하평균으로 산출된다.
바람직하게는, 상기 유전자 모듈과 질병의 거리에 근거한 추론은 제1 약제와 제1 질병이 관련이 있을 경우 상기 제1 약제, 제2 약제 및 상기 제1 질병에 대하여 산출되는 모듈 거리 값이 기 설정된 기준 이상인 경우 상기 제2 약제 및 상기 제1 질병이 관련이 있다고 추론한다.
바람직하게는, 상기 모듈 거리 값은 상기 제1 약제 및 상기 제2 약제 사이의 공통 유전자 모듈에 포함된 단백질 및 상기 제1 질병의 유전자 집합에 포함된 유전자 사이의 유전적 네트워크 상에서 가능한 경로에 근거하여 결정된다.
바람직하게는, 상기 유전자 모듈과 질병의 거리에 근거한 추론은 제1 약제와 제1 질병이 관련이 있을 경우 상기 제1 약제, 상기 제1 질병 및 제2 질병에 대하여 산출되는 모듈 거리 값이 기 설정된 기준 이상인 경우 상기 제1 약제 및 상기 제2 질병이 관련이 있다고 추론한다.
바람직하게는, 상기 모듈 거리 값은 상기 제1 질병 및 상기 제2 질병 사이의 공통 유전자 모듈에 포함된 유전자 및 상기 제1 약제의 각 목표 단백질 사이의 유전적 네트워크 상에서 가능한 경로에 근거하여 결정된다.
바람직하게는, 상기 약제 및 질병의 관련도는 상기 약제와 다른 약제의 공통 유전자 모듈과 상기 질병 사이의 최대 모듈 거리 값 및 상기 질병과 다른 질병의 공통 유전자 모듈과 상기 약제 사이의 최대 모듈 거리 값의 기하평균으로 산출된다.
바람직하게는, 상기 분류기를 생성하는 단계에서, 상기 약제 인접성에 근거한 추론에 의하여 산출되는 점수인 제1 피처, 상기 질병 인접성에 근거한 추론에 의하여 산출되는 점수인 제2 피처, 상기 약제 인접성 및 질병 인접성을 조합한 추론에 의하여 산출되는 점수인 제3 피처 중 적어도 하나 이상을 피처로 하는 학습 기법을 사용한다.
바람직하게는, 상기 분류기를 생성하는 단계에서, 상기 유전자 모듈이 추출되는 레벨, 상기 유전자 모듈과 질병의 거리가 산출될 때 고려되는 유전적 네트워크 상의 경로의 길이 및 약제 모듈 거리 기반 추론, 질병 모듈 거리 기반 추론 및 상기 약제 모듈 거리 기반 추론과 상기 질병 모듈 거리 기반 추론을 조합한 추론 중 상기 유전자 모듈과 질병의 거리에 근거한 추론으로서 수행되는 추론, 의 조합에 대하여 산출되는 상기 관련도를 나타내는 점수 중 적어도 하나 이상을 피처로 하는 학습 기법을 사용한다.
본 발명의 일 측면에 따른 네트워크 기반의 약제 효능 평가 방법은 약제 및 질병 사이의 관련도를 약제 인접성 또는 질병 인접성에 근거한 추론 및 유전자 모듈과 질병의 거리에 근거한 추론 중 적어도 하나에 의하여 산출하는 관련도 산출부, 상기 관련도를 피처로 삼는 학습 기법을 사용하여 약제 및 질병 사이의 관련 여부를 결정하는 분류기를 생성하는 기계학습부 및 상기 분류기를 사용하여 약제 및 질병 사이의 관련 여부를 결정하는 관련여부 판단부를 포함한다.
본 발명에 따르면, 단백질간 반응 데이터베이스 및 단백질과 유전자 관련성 데이터베이스에 근거하여 구축한 네트워크에 기반하여 약제가 효능을 보일 수 있는 약제 대 질병 관계를 검색하고 약제의 분자적 반응을 평가함으로써 보다 정밀하고 민감하게 약제의 새로운 효능을 발견할 수 있고, 신약 개발에 필요한 시간 및 비용을 절감할 수 있다.
도 1은 본 발명의 일 실시예에 따른 네트워크 기반의 약제 효능 평가 방법의 동작을 도시한 순서도이다.
도 2는 본 발명의 일 실시예에 따른 네트워크 기반의 약제 효능 평가 방법에서 약제 인접성 또는 질병 인접성에 근거한 추론을 설명하는 도면이다.
도 3은 본 발명의 일 실시예에 따른 네트워크 기반의 약제 효능 평가 방법에서 유전자 모듈과 질병의 거리에 근거한 추론을 설명하는 도면이다.
도 4는 본 발명의 다른 실시예에 따른 네트워크 기반의 약제 효능 평가 장치의 블록도이다.
도 5는 본 발명에 의하여 결정한 약제 및 질병의 관련성의 예를 도시한 도면이다.
이하에서는 본 발명에 따른 네트워크 기반의 약제 효능 평가 장치 및 방법을 첨부된 도면들을 참조하여 상세하게 설명한다. 이러한 과정에서 도면에 도시된 선들의 두께나 구성요소의 크기 등은 설명의 명료성과 편의상 과장되게 도시되어 있을 수 있다. 또한, 후술되는 용어들은 본 발명에서의 기능을 고려하여 정의된 용어들로서 이는 사용자, 운용자의 의도 또는 관례에 따라 달라질 수 있다. 그러므로, 이러한 용어들에 대한 정의는 본 명세서 전반에 걸친 내용을 토대로 내려져야 할 것이다.
도 1은 본 발명의 일 실시예에 따른 네트워크 기반의 약제 효능 평가 방법의 동작을 도시한 순서도이다.
도 1에 도시된 바와 같이 본 발명의 일 실시예에 따른 네트워크 기반의 약제 효능 평가 방법에 따르면 먼저, 관련도 산출부(100)가 약제 및 질병 사이의 관련도를 약제 인접성(Drug Adjacency) 또는 질병 인접성(Disease Adjacency)에 근거한 추론 및 유전자 모듈과 질병의 거리에 근거한 추론 중 적어도 하나에 의하여 산출한다(S110). 이 때, 이러한 추론은 유전적 네트워크(Genetic Network)에 기반하여 이루어질 수 있으며, 유전적 네트워크는 유전자 또는 단백질 사이의 관계를 나타내는 네트워크로서 다양한 데이터베이스에 근거하여 형성될 수 있다. 이 때, 유전적 네트워크 내의 유전자 또는 단백질 사이의 관계는 각 단백질 사이의 직접 반응(Direct Interaction)을 나타낼 수도 있고, 각 단백질 사이의 간접 반응(Indirect Interaction)을 나타낼 수도 있다. 예컨대, Online Predicted human Interaction Database 에 근거하여 단백질-단백질 간 반응을 나타내는 네트워크를 구성할 수 있으며, Pathway Interaction Database 에 근거하여 단백질-단백질 간 반응을 나타내는 네트워크를 구성할 수 있다. 또한 이러한 복수의 데이터베이스로부터의 네트워크를 통합하기 위하여 UniPort ID 를 사용하여 단백질과 유전자를 대응시킬 수 있다. 또한 DrugBank 데이터베이스로부터 약제 및 약제의 목표 단백질 사이의 관계를 구할 수 있으며, Online Mendelian Inheritance in Man(OMIM) 으로부터 질병과 질병에 대하여 의심되는 유전자의 관계를 구할 수 있다. 또한 Compratative Toxicogenomics Database(CTD) 으로부터 알려진 약제-질병간 관련성을 구할 수 있다.
도 2는 본 발명의 일 실시예에 따른 네트워크 기반의 약제 효능 평가 방법에서 약제 인접성 또는 질병 인접성에 근거한 추론을 설명하는 도면이다.
도 2의 (a)는 약제 인접성 기반의 추론을 설명한다. 즉, 약제 인접성에 근거한 추론은 제1 약제와 제1 질병이 관련이 있다면 제1 약제와 인접한 제2 약제 및 제1 질병이 관련이 있다고 추론할 수 있다. 이 때, 약제 인접성은 약제의 목표 단백질 및 유전적 네트워크 상에서 단백질 사이의 최단 거리에 근거하여 산출될 수 있다. 또한 약제 인접성은 제1 약제의 각 목표 단백질들 및 제2 약제의 각 목표 단백질들 사이의 최단 거리의 합을 제1 약제 및 제2 약제의 목표 단백질의 수에 근거하여 결정되는 비율 계수(Scaling Factor)로 나누어 산출될 수 있다. 즉, d가 나타내는 제1 약제와 d'이 나타태는 제2 약제의 약제 인접성을 나타내는 Adj(d, d')는 다음의 수학식 1에 의하여 산출될 수 있다.
Figure 112015014177976-pat00001
상기 수학식 1에서, ti는 약제 d의 목표(Target) 단백질의 집합 T(d) 내의 단백질을 의미하며, tj는 약제 d'의 목표 단백질의 집합 T(d')내의 단백질을 의미하며,
Figure 112015014177976-pat00002
은 유전적 네트워크(Genetic Network) 상에서 ti 와 tj 사이의 최단 경로의 점수를 의미할 수 있다. 이 때, 비율 계수는 T(d)내의 단백질 수와 T(d')내의 단백질 수의 곱으로 설정되어 약제 인접성의 값이 0과 1 사이가 되도록 설정될 수 있다. 또한 ti 와 tj 사이의 최단 경로는 R0, R1, R2의 세 가지 타입으로 구분될 수 있다. 즉, R0는 ti 와 tj 가 동일한 단백질인 경우를 의미하고, R1은 ti 와 tj 가 서로 직접 반응하는 단백질인 경우를 의미하며, R1은 ti 와 tj 가 서로 간접적으로 반응하는 단백질인 경우를 의미한다. R0 타입의 경로의 점수는 네트워크의 차수(Degree)의 중간값(Median)의 역수로 결정될 수 있으며, 예컨대 1/6로 설정될 수 있다. 또한 R1 타입의 경로의 점수는 R0 타입의 경로의 점수의 제곱근으로, R2 타입의 경로의 점수는 R0 타입의 경로의 점수의 세제곱근으로 설정될 수 있다.
도 2의 (b)는 질병 인접성 기반의 추론을 설명한다. 즉, 질병 인접성에 근거한 추론은 제1 약제와 제1 질병이 관련이 있다면 제1 약제 및 상기 제1 질병과 인접한 제2 질병이 관련이 있다고 추론할 수 있다. 이 때, 질병 인접성은 유전적 네트워크 상에서 질병의 질병 유전자 집합 및 유전적 네트워크 상에서 질병 유전자 사이의 최단 거리에 근거하여 산출될 수 있다. 즉, 질병 인접성은 제1 질병의 질병 유전자 집합 내의 각 질병 유전자 및 제2 질병의 질병 유전자 집합 내의 각 질병 유전자 사이의 상기 최단 거리의 합을 상기 제1 질병 및 제2 질병의 질병 유전자 집합의 크기에 근거하여 결정되는 비율 계수로 나누어 산출될 수 있다. 즉, T(d)가 질병 d의 질병 유전자 집합이고, T(d')가 질병 d'의 질병 유전자 집합일 때 질병 인접성은 상기 수학식 1에 의하여 산출될 수 있다. 이 때
Figure 112015014177976-pat00003
의 의미는 상술한 바와 같다.
또한 도 2의 (c)에 도시된 바와 같이, 약제 인접성과 질병 인접성을 조합하여 추론함으로써 약제 및 질병 사이의 관련도를 산출할 수 있다.
이 때, 약제 d와 질병 p에 대해서 약제 인접성에 근거한 인접성 점수는 다음 수학식 2에 의하여 산출될 수 있다.
Figure 112015014177976-pat00004
상기 수학식 2에서 n은 질병 p와 관련성이 있다고 추론된 약제의 갯수을 나타낸다. 또한 상기 수학식 2와 유사한 방법으로 질병 인접성에 근거한 인접성 점수를 약제 d와 질병 p에 대해서 산출할 수 있다. 즉, 약제 인접성에 근거한 인접성 점수는 약제의 다른 약제와의 최대 약제 인접성으로 표현되며, 질병 인접성에 근거한 인접성 점수는 질병의 다른 질병과의 최대 질병 인접성으로 표현될 수 있고, 여기에서, 약제 및 질병의 관련도는 약제의 다른 약제와의 최대 약제 인접성 및 질병의 다른 질병과의 최대 질병 인접성의 기하평균으로 산출될 수 있다. 즉, 약제 및 질병의 관련도는 다음 수학식 3에 의하여 C(d,p)로 산출될 수 있다.
Figure 112015014177976-pat00005
이 때, AD(d,p)는 상기 수학식 2에 의하여 산출되는 최대 약제 인접성을 의미하고, AP(d,p)는 유사한 방법으로 산출되는 최대 질병 인접성을 의미한다.
도 3은 본 발명의 일 실시예에 따른 네트워크 기반의 약제 효능 평가 방법에서 유전자 모듈과 질병의 거리에 근거한 추론을 설명하는 도면이다. 모듈(Module)이란 위상학적으로 연관된 유전자 집합을 의미한다. 두 개의 약제에 대하여 공유되는 모듈이 특정한 질병에 대해 추출될 수 있다. 이 때 이러한 약제와 질병은 약제-질병 관련성이 알려진 하나의 약제와 후보 약제 중 하나인 다른 약제 및 질병일 수 있다. 이러한 두 약제가 공유하는 모듈을 약제 모듈(Drug-Drug Gene Module, d-Module)이라 한다. 또한 유사한 방법으로 두 질병 및 하나의 약제에 대해서 두 질병이 공유하는 모듈을 질병 모듈(Disease-Disease Gene Module, p-Module)이라 한다. 도 3의 (c) 및 (d)에 도시된 바와 같이, 모듈은 레벨 파라미터(Level Parameter) v에 따라 추출될 수 있으며, 이 때 v는 0 내지 2의 값을 가질 수 있다. 이 때, 레벨 0의 모듈은 두 약제 또는 질병에 대하여 공유되는 같은 단백질 또는 유전자로 구성되는 모듈이고, 레벨 1의 모듈은 두 약제 또는 질병에 대하여 공유되는 서로 직접 반응하는 단백질 또는 유전자를 포함하여 구성되는 모듈이며, 레벨 2의 모듈은 두 약제 또는 질병에 대하여 공유되는 서로 간접 반응하는 단백질 또는 유전자를 포함하여 구성되는 모듈이다.
도 3의 (a)는 약제 모듈(d-Module) 거리 기반 추론을 설명한다. 즉, 유전자 모듈과 질병의 거리에 근거한 추론은 제1 약제와 제1 질병이 관련이 있을 경우 제1 약제, 제2 약제 및 제1 질병에 대하여 산출되는 모듈 거리 값이 기 설정된 기준 이상인 경우 제2 약제 및 제1 질병이 관련이 있다고 추론할 수 있다.
이 때, 모듈 거리 값은 제1 약제 및 제2 약제 사이의 공통 유전자 모듈, 즉 약제 모듈에 포함된 단백질 및 제1 질병의 유전자 집합에 포함된 유전자 사이의 유전적 네트워크 상에서 가능한 경로에 근거하여 결정될 수 있다.
도 3의 (b)는 질병 모듈(p-Module) 거리 기반 추론을 설명한다. 즉, 유전자 모듈과 질병의 거리에 근거한 추론은 제1 약제와 제1 질병이 관련이 있을 경우 제1 약제, 제1 질병 및 제2 질병에 대하여 산출되는 모듈 거리 값이 기 설정된 기준 이상인 경우 제1 약제 및 상기 제2 질병이 관련이 있다고 추론할 수 있다. 이 때, 모듈 거리 값은 제1 질병 및 제2 질병 사이의 공통 유전자 모듈, 즉 질병 모듈에 포함된 유전자 및 상기 제1 약제의 각 목표 단백질 사이의 유전적 네트워크 상에서 가능한 경로에 근거하여 결정될 수 있다.
또한 도 3의 (c)에 도시된 바와 같이, 즉, 유전자 모듈과 질병의 거리에 근거한 추론은 상기 약제 모듈(d-Module) 거리 기반 추론과 질병 모듈(p-Module) 거리 기반 추론을 조합하여 추론할 수도 있다.
또한 모듈 거리 값은 상기 제1 약제 및 상기 제2 약제 사이의 공통 유전자 모듈에 포함된 단백질 및 상기 제1 질병의 유전자 집합에 포함된 유전자 사이의 유전적 네트워크 상에서 가능한 각 경로에 대한 경로 점수의 합을 상기 공통 유전자 모듈에 포함된 질병 수와 상기 제1 약제의 목표 단백질의 수의 곱에 근거하여 결정되는 비율 계수로 나누어 산출될 수 있다.
즉, 약제 d와 약제 d'에 대한 모듈 거리 값 Mdis(d,d')는 다음의 수학식 4에 의하여 산출될 수 있다.
Figure 112015014177976-pat00006
상기 수학식 4에서 ti는 약제 모듈 Modv(d,d')에 포함된 단백질이고, gj는 질병 p의 유전자이다. v는 모듈 Modv(d,d')이 추출되는 레벨(level)을 나타낸다. 비율 계수는 Modv(d,d')에 포함된 단백질의 수와 질병 p의 유전자 집합 T(p)에 포함된 유전자의 수의 곱으로 0과 1 사이의 값이 되도록 결정될 수 있다. 또한
Figure 112015014177976-pat00007
는 ti 와 gj 사이의 경로의 점수를 나타낸다. 이 때, k는 경로의 고정된 길이이다. k=0일 때, ti와 gj의 교집합만이 점수를 부여받고, k=1일 때, 길이가 1인 경로만이 점수를 부여받으며, k=일 때, 길이가 2인 경로만이 점수를 부여받을 수 있다.
또한 두 질병에 대한 모듈 거리 값도 유사한 방법으로 산출될 수 있다. 즉, 모듈 거리 값은 제1 질병 및 제2 질병 사이의 공통 유전자 모듈에 포함된 유전자 및 제1 약제의 각 목표 단백질 사이의 유전적 네트워크 상에서 각 경로에 대한 경로 점수의 합을 공통 유전자 모듈에 포함된 단백질 수와 질병의 유전자 집합에 포함되는 유전자의 수의 곱에 근거하여 결정되는 비율 계수로 나누어 산출될 수 있다.
이 때, 경로 점수의 값
Figure 112015014177976-pat00008
은 다음 수학식 5에 의하여 주어질 수 있다.
Figure 112015014177976-pat00009
이 때, 상기 수학식 5에서 R0는 네트워크의 차수의 중간값의 역수인 1/6로 결정될 수 있고, R1은 R0의 제곱근으로 결정될 수 있으며, R2는 R0의 세제곱근으로 결정될 수 있다. 즉, 경로 점수는 기 설정된 경로의 길이가 0인 경우 상기 유전적 네트워크의 차수의 중간값의 역수로 결정되고, 기 설정된 길이가 1인 경우 상기 차수의 중간값의 역수의 제곱근으로 결정되며, 기 설정된 길이가 2인 경우 상기 차수의 중간값의 역수의 세제곱근으로 결정될 수 있다.
여기에서, 복수의 약제에 대한 모듈 거리의 값 중 최대의 값이 약제 d 와 질병 p 사이의 관련성을 나타내는 점수가 될 수 있다. 즉, 약제 d 와 질병 p 사이의 관련성을 나타내는 점수는 다음 수학식 6에 의하여 표현될 수 있다.
Figure 112015014177976-pat00010
상기 수학식 6에서 n은 질병 p와 알려진 연관성을 가지는 약제의 갯수를 나타낸다. 약제 d와 d'의 약제 모듈이 질병 유전자에 밀접하게 관련되어 있다면, 두 약제가 유사한 생물학적 기능을 보여주리라 예상할수 있으며, 같은 질병에 연관되어 있을 가능성이 높다고 추론할 수 있다. 즉 상기 수학식 6은 약제 모듈 거리에 기반하여 산출하는 약제와 질병의 연관성을 나타낼 수 있다. 또한, 상기 수학식 6과 유사하게 복수의 질병에 대한 모듈 거리의 값 중 최대의 값을 약제 d 및 질병 p 사이의 관련성을 나타내는 점수로 산출할 수 있으며, 이는 질병 모듈 거리에 기반하여 산출하는 약제와 질병의 연관성을 나타낼 수 있다. 상기 수학식 6에 의하여 산출되는 약제 모듈 거리에 기반하여 산출하는 약제와 질병의 연관성을 MD(d,p), 상기 수학식 6과 유사한 방법으로 질병 모듈 거리에 기반하여 산출하는 약제와 질병의 연관성을 MP(d,p)로 나타낼 수 있다. 이 경우, 약제 모듈 거리 및 질병 모듈 거리를 조합하여 산출되는 약제 및 질병의 연관성은 다음 수학식 7에 의하여 표현될 수 있다.
Figure 112015014177976-pat00011
즉, 약제 및 질병의 관련도는 약제와 다른 약제의 공통 유전자 모듈과 질병 사이의 최대 모듈 거리 값 및 질병과 다른 질병의 공통 유전자 모듈과 약제 사이의 최대 모듈 거리 값의 기하평균으로 산출될 수 있다.
이어서, 기계학습부(200)가 관련도를 피처(Feature)로 삼는 학습 기법(Machine Learning)을 사용하여 약제 및 질병 사이의 관련 여부를 결정하는 분류기를 생성한다(S120). 이 때, 학습 기법이 분류기를 생성하기 위하여 사용하는 피처로 약제 인접성 또는 질병 인접성에 근거한 추론에 의하여 산출되는 상기 수학식 3의 AD(d,p), AP(d,p) 및 C(d,p)를 사용할 수 있다. 즉, 약제 인접성에 근거한 추론에 의하여 산출되는 점수인 제1 피처, 질병 인접성에 근거한 추론에 의하여 산출되는 점수인 제2 피처, 약제 인접성 및 질병 인접성을 조합한 추론에 의하여 산출되는 점수인 제3 피처 중 적어도 하나 이상을 피처로 하는 학습 기법을 사용할 수 있다.
또한 학습 기법이 분류기를 생성하기 위하여 사용하는 피처로서 유전자 모듈과 질병의 거리에 근거한 추론에 의하여 산출되는 상기 수학식 7의 MD(d,p), MP(d,p) 및 C(d,p)를 사용할 수 있다. 이 때, 상기 수학식 7의 세 가지 점수는, 레벨 파라미터 v 의 각 값과, 경로 길이 파라미터 k의 각 값에 대하여 별도의 피처로서 사용될 수 있다. 즉, 유전자 모듈이 추출되는 레벨, 유전자 모듈과 질병의 거리가 산출될 때 고려되는 유전적 네트워크 상의 경로의 길이 및 약제 모듈 거리 기반 추론, 질병 모듈 거리 기반 추론 및 약제 모듈 거리 기반 추론과 질병 모듈 거리 기반 추론을 조합한 추론 중 유전자 모듈과 질병의 거리에 근거한 추론으로서 수행되는 추론의 조합에 대하여 산출되는 관련도를 나타내는 점수 중 적어도 하나 이상을 피처로 하는 학습 기법을 사용할 수 있다.
이 때, 본 실시예에서, v가 0, 1, 2 중 하나의 값을 취할 수 있고, k가 0, 1, 2 중 하나의 값을 취할 수 있으며, 상술한 바와 같이 가능한 추론 방법이 3가지이므로, v, k 및 추론의 방법이라는 3가지 파라미터를 조합하여 산출되는, 유전자 모듈과 질병의 거리에 근거한 추론에 의하여 산출되는 피처는 모두 27가지일 수 있다. 이에 약제 인접성 또는 질병 인접성에 근거한 추론에 의하여 산출되는 제1 내지 제3 피처를 더하면, 상기 단계(S120)에서 학습 기법은 모두 30가지 피처를 사용하여 분류기를 생성할 수 있다.
이후 관련 여부 판단부(300)가 분류기를 사용하여 약제 및 질병 사이의 관련 여부를 결정하고 프로세스를 종료한다(S130). 이 때 관련 여부 판단부(300)는 주어진 하나의 약제 및 질병 사이의 관련 여부를 판단하는데 그치지 않고 데이터베이스로부터 주어진 약제와 다양한 질병의 쌍을 검색하여 이에 대한 관련 여부를 반복하여 결정함으로써 주어진 약제가 효능을 발휘할 수 있는 새로운 질병을 산출할 수 있다.
도 4는 본 발명의 다른 실시예에 따른 네트워크 기반의 약제 효능 평가 장치의 블록도이다. 도 4에 도시된 바와 같이, 본 발명에 따른 네트워크 기반의 약제 효능 평가 장치는 관련도 산출부(100), 기계학습부(200), 및 관련 여부 판단부(300)를 포함하여 이루어질 수 있다.
관련도 산출부(100)는 약제 및 질병 사이의 관련도를 약제 인접성 또는 질병 인접성에 근거한 추론 및 유전자 모듈과 질병의 거리에 근거한 추론 중 적어도 하나에 의하여 산출한다. 이 때 관련도 산출부는 약제 인접성에 근거하여 추론을 수행하는 제1 추론부(110), 질병 인접성에 근거하여 추론을 수행하는 제2 추론부(120) 및 유전자 모듈과 질병의 거리에 근거한 추론을 수행하는 제3 추론부(130)를 포함할 수 있다. 관련도 산출부(100)는 상술한 단계(S110)의 방법에 근거하여 약제 및 질병 사이의 관련도를 산출할 수 있다.
기계학습부(200)는 관련도를 피처로 삼는 학습 기법을 사용하여 약제 및 질병 사이의 관련 여부를 결정하는 분류기를 생성한다. 이 때, 기계학습부는 상술한 단계(S120)의 방법에 근거하여 분류기를 생성할 수 있다.
관련여부 판단부(300)는 분류기를 사용하여 약제 및 질병 사이의 관련 여부를 결정한다. 이 때, 관련여부 판단부(300)는 상술한 단계(S130)의 방법에 근거하여 약제 및 질병 사이의 관련 여부를 판단할 수 있다. 또한, 관련 여부 판단부(300)는 주어진 하나의 약제 및 질병 사이의 관련 여부를 판단하는데 그치지 않고 데이터베이스로부터 주어진 약제와 다양한 질병의 쌍을 검색하여 이에 대한 관련 여부를 반복하여 결정함으로써 주어진 약제가 효능을 발휘할 수 있는 새로운 질병을 산출할 수 있다.
도 5는 본 발명에 의하여 결정한 약제 및 질병의 관련성의 예를 도시한 도면이다. 도 5에 도시된 예에서, 텔미사르탄(Telmisartan)은 일반적으로 고혈압에 대하여 처방되는 약제이다. 도 5의 예와 같이 본 발명에 따라 텔미사르탄과 알츠하이머(Alzheimer) 병이 연관되어 있음을 결정할 수 있었으며, 이는 텔미사르탄이 알츠하이머 병에도 효능을 나타낼 수 있는 약제의 후보임을 의미한다.
이상 살펴본 바와 같이 본 발명에 따르면, 단백질간 반응 데이터베이스 및 단백질과 유전자 관련성 데이터베이스에 근거하여 구축한 네트워크에 기반하여 약제가 효능을 보일 수 있는 약제 대 질병 관계를 검색하고 약제의 분자적 반응을 평가함으로써 보다 정밀하고 민감하게 약제의 새로운 효능을 발견할 수 있고, 신약 개발에 필요한 시간 및 비용을 절감할 수 있다.
본 발명은 도면에 도시된 실시예를 참고로 하여 설명되었으나, 이는 예시적인 것에 불과하며, 당해 기술이 속하는 분야에서 통상의 지식을 가진 자라면 이로부터 다양한 변형 및 균등한 타 실시예가 가능하다는 점을 이해할 것이다. 따라서 본 발명의 기술적 보호범위는 아래의 특허청구범위에 의해서 정하여져야 할 것이다.
100 : 관련도 산출부 110 : 제1 추론부
120 : 제2 추론부 130 : 제3 추론부
200 : 기계학습부 300 : 관련 여부 판단부

Claims (16)

  1. 약제 및 질병 사이의 관련도를 약제 인접성 또는 질병 인접성에 근거한 추론 및 유전자 모듈과 질병의 거리에 근거한 추론 중 적어도 하나에 의하여 산출하는 단계;
    상기 관련도를 피처로 삼는 학습 기법을 사용하여 약제 및 질병 사이의 관련 여부를 결정하는 분류기를 생성하는 단계; 및
    상기 분류기를 사용하여 약제 및 질병 사이의 관련 여부를 결정하는 단계를 포함하고,
    상기 약제 인접성은 약제의 목표 단백질 및 유전적 네트워크 상에서 단백질 사이의 최단 거리에 근거하여 산출되는 것이고,
    제1 약제의 각 목표 단백질들 및 제2 약제의 각 목표 단백질들 사이의 상기 최단 거리의 합을 상기 제1 약제 및 제2 약제의 목표 단백질의 수에 근거하여 결정되는 비율 계수로 나누어 산출되는 것을 특징으로 하는 네트워크 기반의 약제 효능 평가 방법.
  2. 제 1항에 있어서,
    상기 약제 인접성에 근거한 추론은 제1 약제와 제1 질병이 관련이 있다면 상기 제1 약제와 인접한 제2 약제 및 상기 제1 질병이 관련이 있다고 추론하는 것을 특징으로 하는 네트워크 기반의 약제 효능 평가 방법.
  3. 삭제
  4. 삭제
  5. 제 1항에 있어서,
    상기 질병 인접성에 근거한 추론은 제1 약제와 제1 질병이 관련이 있다면 상기 제1 약제 및 상기 제1 질병과 인접한 제2 질병이 관련이 있다고 추론하는 것을 특징으로 하는 네트워크 기반의 약제 효능 평가 방법.
  6. 약제 및 질병 사이의 관련도를 약제 인접성 또는 질병 인접성에 근거한 추론 및 유전자 모듈과 질병의 거리에 근거한 추론 중 적어도 하나에 의하여 산출하는 단계;
    상기 관련도를 피처로 삼는 학습 기법을 사용하여 약제 및 질병 사이의 관련 여부를 결정하는 분류기를 생성하는 단계; 및
    상기 분류기를 사용하여 약제 및 질병 사이의 관련 여부를 결정하는 단계를 포함하고,
    상기 질병 인접성은 유전적 네트워크 상에서 질병의 질병 유전자 집합 및 유전적 네트워크 상에서 질병 유전자 사이의 최단 거리에 근거하여 산출되는 것이고, 제1 질병의 질병 유전자 집합 내의 각 질병 유전자 및 제2 질병의 질병 유전자 집합 내의 각 질병 유전자 사이의 상기 최단 거리의 합을 상기 제1 질병 및 제2 질병의 질병 유전자 집합의 크기에 근거하여 결정되는 비율 계수로 나누어 산출되는 것을 특징으로 하는 네트워크 기반의 약제 효능 평가 방법.
  7. 삭제
  8. 제 1항에 있어서,
    상기 약제 및 질병의 관련도는 상기 약제의 다른 약제와의 최대 약제 인접성 및 상기 질병의 다른 질병과의 최대 질병 인접성의 기하평균으로 산출되는 것을 특징으로 하는 네트워크 기반의 약제 효능 평가 방법.
  9. 약제 및 질병 사이의 관련도를 약제 인접성 또는 질병 인접성에 근거한 추론 및 유전자 모듈과 질병의 거리에 근거한 추론 중 적어도 하나에 의하여 산출하는 단계;
    상기 관련도를 피처로 삼는 학습 기법을 사용하여 약제 및 질병 사이의 관련 여부를 결정하는 분류기를 생성하는 단계; 및
    상기 분류기를 사용하여 약제 및 질병 사이의 관련 여부를 결정하는 단계를 포함하고,
    상기 유전자 모듈과 질병의 거리에 근거한 추론은 제1 약제와 제1 질병이 관련이 있을 경우 제2 약제와 상기 제1 약제 및 상기 제1 질병에 대하여 산출되는 모듈 거리 값이 기 설정된 기준 이상인 경우 상기 제2 약제 및 상기 제1 질병이 관련이 있다고 추론하는 것이고,
    상기 모듈 거리 값은 상기 제1 약제 및 상기 제2 약제 사이의 공통 유전자 모듈에 포함된 단백질 및 상기 제1 질병의 유전자 집합에 포함된 유전자 사이의 유전적 네트워크 상에서 가능한 경로에 근거하여 결정되는 것을 특징으로 하는 네트워크 기반의 약제 효능 평가 방법.

  10. 삭제
  11. 약제 및 질병 사이의 관련도를 약제 인접성 또는 질병 인접성에 근거한 추론 및 유전자 모듈과 질병의 거리에 근거한 추론 중 적어도 하나에 의하여 산출하는 단계;
    상기 관련도를 피처로 삼는 학습 기법을 사용하여 약제 및 질병 사이의 관련 여부를 결정하는 분류기를 생성하는 단계; 및
    상기 분류기를 사용하여 약제 및 질병 사이의 관련 여부를 결정하는 단계를 포함하고,
    상기 유전자 모듈과 질병의 거리에 근거한 추론은 제1 약제와 제1 질병이 관련이 있을 경우 제2 질병과 상기 제1 약제 및 상기 제1 질병에 대하여 산출되는 모듈 거리 값이 기 설정된 기준 이상인 경우 상기 제1 약제 및 상기 제2 질병이 관련이 있다고 추론하는 것이고,
    상기 모듈 거리 값은 상기 제1 질병 및 상기 제2 질병 사이의 공통 유전자 모듈에 포함된 유전자 및 상기 제1 약제의 각 목표 단백질 사이의 유전적 네트워크 상에서 가능한 경로에 근거하여 결정되는 것을 특징으로 하는 네트워크 기반의 약제 효능 평가 방법.
  12. 삭제
  13. 제 1항에 있어서,
    상기 약제 및 질병의 관련도는 상기 약제와 다른 약제의 공통 유전자 모듈과 상기 질병 사이의 최대 모듈 거리 값 및 상기 질병과 다른 질병의 공통 유전자 모듈과 상기 약제 사이의 최대 모듈 거리 값의 기하평균으로 산출되는 것을 특징으로 하는 네트워크 기반의 약제 효능 평가 방법.
  14. 약제 및 질병 사이의 관련도를 약제 인접성 또는 질병 인접성에 근거한 추론 및 유전자 모듈과 질병의 거리에 근거한 추론 중 적어도 하나에 의하여 산출하는 단계;
    상기 관련도를 피처로 삼는 학습 기법을 사용하여 약제 및 질병 사이의 관련 여부를 결정하는 분류기를 생성하는 단계; 및
    상기 분류기를 사용하여 약제 및 질병 사이의 관련 여부를 결정하는 단계를 포함하고,
    상기 분류기를 생성하는 단계에서,
    상기 약제 인접성에 근거한 추론에 의하여 산출되는 점수인 제1 피처;
    상기 질병 인접성에 근거한 추론에 의하여 산출되는 점수인 제2 피처; 및
    상기 약제 인접성 및 질병 인접성을 조합한 추론에 의하여 산출되는 점수인 제3 피처 중 적어도 하나 이상을 피처로 하는 학습 기법을 사용하는 것을 특징으로 하는 네트워크 기반의 약제 효능 평가 방법.
  15. 약제 및 질병 사이의 관련도를 약제 인접성 또는 질병 인접성에 근거한 추론 및 유전자 모듈과 질병의 거리에 근거한 추론 중 적어도 하나에 의하여 산출하는 단계;
    상기 관련도를 피처로 삼는 학습 기법을 사용하여 약제 및 질병 사이의 관련 여부를 결정하는 분류기를 생성하는 단계; 및
    상기 분류기를 사용하여 약제 및 질병 사이의 관련 여부를 결정하는 단계를 포함하고,
    상기 분류기를 생성하는 단계에서,
    상기 유전자 모듈이 추출되는 레벨;
    상기 유전자 모듈과 질병의 거리가 산출될 때 고려되는 유전적 네트워크 상의 경로의 길이; 및
    약제 모듈 거리 기반 추론, 질병 모듈 거리 기반 추론 및 상기 약제 모듈 거리 기반 추론과 상기 질병 모듈 거리 기반 추론을 조합한 추론 중 상기 유전자 모듈과 질병의 거리에 근거한 추론으로서 수행되는 추론;
    의 조합에 대하여 산출되는 상기 관련도를 나타내는 점수 중 적어도 하나 이상을 피처로 하는 학습 기법을 사용하는 것을 특징으로 하는 네트워크 기반의 약제 효능 평가 방법.
  16. 삭제
KR1020150020364A 2015-02-10 2015-02-10 네트워크 기반의 약제 효능 평가 장치 및 방법 KR101776094B1 (ko)

Priority Applications (2)

Application Number Priority Date Filing Date Title
KR1020150020364A KR101776094B1 (ko) 2015-02-10 2015-02-10 네트워크 기반의 약제 효능 평가 장치 및 방법
US14/926,685 US20160232309A1 (en) 2015-02-10 2015-10-29 Apparatus and method for assessing effects of drugs based on networks

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
KR1020150020364A KR101776094B1 (ko) 2015-02-10 2015-02-10 네트워크 기반의 약제 효능 평가 장치 및 방법

Publications (2)

Publication Number Publication Date
KR20160097903A KR20160097903A (ko) 2016-08-18
KR101776094B1 true KR101776094B1 (ko) 2017-09-07

Family

ID=56565992

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020150020364A KR101776094B1 (ko) 2015-02-10 2015-02-10 네트워크 기반의 약제 효능 평가 장치 및 방법

Country Status (2)

Country Link
US (1) US20160232309A1 (ko)
KR (1) KR101776094B1 (ko)

Families Citing this family (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106909807B (zh) * 2017-02-14 2019-02-01 同济大学 一种基于多元数据预测药物靶向蛋白互作的预测方法
CN107731309B (zh) * 2017-08-31 2020-01-21 武汉百药联科科技有限公司 一种药物活性的预测方法及其应用
CN108122005B (zh) * 2017-12-19 2021-09-21 浙江大学 一种临床药物层次分类的方法
US11475995B2 (en) * 2018-05-07 2022-10-18 Perthera, Inc. Integration of multi-omic data into a single scoring model for input into a treatment recommendation ranking
US11276494B2 (en) 2018-05-11 2022-03-15 International Business Machines Corporation Predicting interactions between drugs and diseases
US11574718B2 (en) 2018-05-31 2023-02-07 Perthera, Inc. Outcome driven persona-typing for precision oncology
US11721441B2 (en) * 2019-01-15 2023-08-08 Merative Us L.P. Determining drug effectiveness ranking for a patient using machine learning
KR102174764B1 (ko) * 2019-02-01 2020-11-05 가천대학교 산학협력단 통합 네트워크 기반의 약물-질병벡터를 이용한 신약 재창출 방법, 장치 및 컴퓨터-판독가능매체
US20220223225A1 (en) * 2019-05-24 2022-07-14 Northeastern University Chemical-disease perturbation ranking
CN112927766B (zh) * 2021-03-29 2022-11-01 天士力国际基因网络药物创新中心有限公司 一种疾病组合药物筛选的方法

Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2006146380A (ja) * 2004-11-17 2006-06-08 Hitachi Ltd 化合物の機能予測方法及び機能予測システム

Family Cites Families (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2001055951A2 (en) * 2000-01-25 2001-08-02 Cellomics, Inc. Method and system for automated inference of physico-chemical interaction knowl edge
US20040122787A1 (en) 2002-12-18 2004-06-24 Avinash Gopal B. Enhanced computer-assisted medical data processing system and method
EP2664644B1 (en) * 2005-10-17 2017-12-06 Advanced Composites International Pty Ltd Reinforced composite material
US20110287953A1 (en) * 2010-05-21 2011-11-24 Chi-Ying Huang Method for discovering potential drugs
JP5990862B2 (ja) * 2012-10-01 2016-09-14 国立研究開発法人科学技術振興機構 承認予測装置、承認予測方法、および、プログラム
US11037684B2 (en) * 2014-11-14 2021-06-15 International Business Machines Corporation Generating drug repositioning hypotheses based on integrating multiple aspects of drug similarity and disease similarity

Patent Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2006146380A (ja) * 2004-11-17 2006-06-08 Hitachi Ltd 化合物の機能予測方法及び機能予測システム

Also Published As

Publication number Publication date
US20160232309A1 (en) 2016-08-11
KR20160097903A (ko) 2016-08-18

Similar Documents

Publication Publication Date Title
KR101776094B1 (ko) 네트워크 기반의 약제 효능 평가 장치 및 방법
JP6609355B2 (ja) 細胞系ゲノミクスからの薬物応答の患者特異的予測のためのシステムおよび方法
Erten et al. DADA: degree-aware algorithms for network-based disease gene prioritization
Boulesteix et al. Stability and aggregation of ranked gene lists
Le et al. GPEC: a Cytoscape plug-in for random walk-based gene prioritization and biomedical evidence collection
Harper et al. The reduced graph descriptor in virtual screening and data-driven clustering of high-throughput screening data
Martínez et al. ProphNet: a generic prioritization method through propagation of information
Mukherjee et al. Identifying digenic disease genes via machine learning in the Undiagnosed Diseases Network
CN109411033B (zh) 一种基于复杂网络的药物疗效筛选方法
Jacob et al. A fuzzy guided genetic algorithm for operon prediction
JP2007034700A (ja) 予測プログラムおよび予測装置
Zhao et al. Laplacian normalization and random walk on heterogeneous networks for disease-gene prioritization
KR102316989B1 (ko) 신약 후보 물질의 발굴 시스템 및 그 방법
Yu et al. Efficient p-value evaluation for resampling-based tests
Li et al. Prioritizing disease genes by using search engine algorithm
JP2022524083A (ja) 薬物に依存しない患者固有の投薬レジメンのためのシステムおよび方法
Cheng et al. A novel weighted distance threshold method for handling medical missing values
CA2894566A1 (en) Detection device, method, and program for assisting network entropy-based detection of precursor to state transition of biological object
Patil et al. Approaches for network analysis in protein interaction network
JP2016099674A (ja) 薬剤探索装置、薬剤探索方法およびプログラム
Erten et al. Role of centrality in network-based prioritization of disease genes
Vroling et al. White paper: the helix pathogenicity prediction platform
Yassaee Meybodi et al. Predicting anti-cancer drug response by finding optimal subset of drugs
ES2456240T3 (es) Método y sistema informático para evaluar anotaciones de clasificación asignadas a secuencias de ADN
Birchall et al. Evolving interpretable structure− activity relationship models. 2. Using multiobjective optimization to derive multiple models

Legal Events

Date Code Title Description
A201 Request for examination
E902 Notification of reason for refusal
E701 Decision to grant or registration of patent right
GRNT Written decision to grant