KR20100091437A - 약물유전체 마커의 선택 방법 및 장치 - Google Patents

약물유전체 마커의 선택 방법 및 장치 Download PDF

Info

Publication number
KR20100091437A
KR20100091437A KR1020090010623A KR20090010623A KR20100091437A KR 20100091437 A KR20100091437 A KR 20100091437A KR 1020090010623 A KR1020090010623 A KR 1020090010623A KR 20090010623 A KR20090010623 A KR 20090010623A KR 20100091437 A KR20100091437 A KR 20100091437A
Authority
KR
South Korea
Prior art keywords
drug
genes
nodes
genomic markers
selecting
Prior art date
Application number
KR1020090010623A
Other languages
English (en)
Inventor
안태진
이규상
손대순
박경희
Original Assignee
삼성전자주식회사
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 삼성전자주식회사 filed Critical 삼성전자주식회사
Priority to KR1020090010623A priority Critical patent/KR20100091437A/ko
Priority to US12/623,675 priority patent/US20100204922A1/en
Publication of KR20100091437A publication Critical patent/KR20100091437A/ko

Links

Images

Classifications

    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B20/00ICT specially adapted for functional genomics or proteomics, e.g. genotype-phenotype associations
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B20/00ICT specially adapted for functional genomics or proteomics, e.g. genotype-phenotype associations
    • G16B20/20Allele or variant detection, e.g. single nucleotide polymorphism [SNP] detection

Landscapes

  • Bioinformatics & Cheminformatics (AREA)
  • Health & Medical Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Physics & Mathematics (AREA)
  • Engineering & Computer Science (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • Biotechnology (AREA)
  • Biophysics (AREA)
  • Genetics & Genomics (AREA)
  • Molecular Biology (AREA)
  • Chemical & Material Sciences (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Analytical Chemistry (AREA)
  • Evolutionary Biology (AREA)
  • General Health & Medical Sciences (AREA)
  • Medical Informatics (AREA)
  • Spectroscopy & Molecular Physics (AREA)
  • Theoretical Computer Science (AREA)
  • Apparatus Associated With Microorganisms And Enzymes (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

약물에 관련된 유전체 마커들을 선택하기 위한 방법 및 장치에 관한 것으로, 적어도 하나의 약물에 관련된 유전자들 각각의 유전체 마커들이 약물에 관련된 정도를 평가하기 위한 지표들을 계산하고, 이 평가 지표들에 기초하여 유전체 마커들 중 일부를 선택한다.

Description

약물유전체 마커의 선택 방법 및 장치 {The method and apparatus for selecting pharmacogenomic markers}
본 발명의 적어도 하나의 실시예는 약물에 관련된 유전체 마커들 중 일부를 선택하는 방법 및 장치에 관한 것이다.
유전체(genome)란 한 생물이 가지는 모든 유전 정보를 말한다. 개인의 유전체를 분석하는 여러 기술들이 개발되고 있으나, DNA(Deoxyribo Nucleic Acid) 칩(chip) 등과 같은 유전체 분석 장치가 상용화되었을 따름이다. 이와 같은 DNA 칩을 제조하는 회사와 개인별 유전체 분석 서비스를 제공하는 회사와의 연계를 통한 개인별 맞춤 약물 처방에 대한 연구가 진행되고 있다.
본 발명의 적어도 하나의 실시예가 이루고자 하는 기술적 과제는 특정 약물에만 포커싱(focusing)하여 보다 효율적이고 탁월한 성능을 발휘할 수 있는 유전체 분석 장치의 제조를 가능하게 하는 장치 및 방법을 제공하는데 있다. 또한, 그 방법을 컴퓨터에서 실행시키기 위한 프로그램을 기록한 컴퓨터로 읽을 수 있는 기록 매체를 제공하는데 있다. 본 발명의 적어도 하나의 실시예가 이루고자 하는 기술적 과제는 상기된 바와 같은 유전체 분석 장치에 관련된 기술적 과제들로 한정되지 않으며, 또 다른 기술적 과제들이 존재할 수 있다. 이것은 본 실시예가 속하는 기술 분야에서 통상적인 지식을 가진 자들이라면 아래의 기재로부터 명확하게 이해될 수 있다.
상기 기술적 과제를 해결하기 위한 일 실시예에 따른 약물유전체 마커 선택 방법은 적어도 하나의 약물에 관련된 유전자들 각각의 유전체 마커들이 상기 약물에 관련된 정도를 평가하기 위한 지표들을 계산하는 단계; 및 상기 계산된 평가 지표들에 기초하여 상기 유전체 마커들 중 일부를 선택하는 단계를 포함한다.
상기 다른 기술적 과제를 해결하기 위한 일 실시예는 상기된 약물유전체 마커 선택 방법을 컴퓨터에서 실행시키기 위한 프로그램을 기록한 컴퓨터로 읽을 수 있는 기록 매체를 제공한다.
상기 기술적 과제를 해결하기 위한 일 실시예에 따른 약물유전체 마커 선택 장치는 적어도 하나의 약물에 관련된 유전자들 각각의 유전체 마커들이 상기 약물에 관련된 정도를 평가하기 위한 지표들을 계산하는 계산부; 및 상기 계산된 평가 지표들에 기초하여 상기 유전체 마커들 중 일부를 선택하는 선택부를 포함한다.
상기된 바에 따르면, 약물에 관련된 유전자들 각각의 유전체 마커들의 평가 지표들에 기초하여 유전체 마커들 중 일부를 선택함으로써 해당 약물에만 포커싱하 여 보다 효율적이고 탁월한 성능을 발휘할 수 있는 유전체 분석 장치의 제조가 가능하게 된다.
이하에서는 도면을 참조하여 본 발명의 실시예들을 상세히 설명한다.
도 1은 본 발명의 일 실시예에 따른 약물유전체 마커 선택 장치(3)의 구성도이다. 도 1을 참조하면, 본 실시예에 따른 약물유전체 마커 선택 장치(3)는 통신부(31), 스토리지(32), 프로세서(33), 및 출력부(34)로 구성된다. 스토리지(32)는 제 1 데이터베이스(321), 제 2 데이터베이스(322), 제 3 데이터베이스(323)로 구성된다. 또한, 프로세서(33)는 데이터 확장부(331), 계산부(332), 및 선택부(333)로 구성된다. 이와 같은 데이터 확장부(331), 계산부(332), 및 선택부(333)로 구성된 프로세서(33)는 다수의 논리 게이트들의 어레이로 구현될 수도 있고, 범용적인 마이크로프로세서와 이 마이크로 프로세서에서 실행될 수 있는 프로그램이 저장된 메모리의 조합으로 구현될 수도 있다. 또한, 다른 형태의 하드웨어로 구현될 수도 있음을 본 실시예가 속하는 기술분야에서 통상의 지식을 가진 자라면 이해할 수 있다. 본 명세서에서는 본 실시예의 특징이 흐려지는 것을 방지하기 위하여 본 실시예에 관련된 하드웨어 구성요소(hardware component)들만을 기술하기로 한다. 다만, 도 1에 도시된 하드웨어 구성요소들 외에 다른 범용적인 하드웨어 구성 요소들이 포함될 수 있음을 본 실시예가 속하는 기술분야에서 통상의 지식을 가진 자라면 이해할 수 있다.
도 2는 본 발명의 일 실시예에 따른 약물유전체 마커 선택 방법의 흐름도이 다. 도 2를 참조하면, 본 실시예에 따른 약물유전체 마커 선택 방법은 도 1에 도시된 약물유전체 마커 선택 장치(3)에서 시계열적으로 처리되는 다음과 같은 단계들로 구성된다. 이하에서는 도 2에 도시된 흐름도를 참조하면서 도 1에 도시된 하드웨어 구성요소들의 동작들을 살펴보기로 하겠다.
21 단계에서 통신부(31)는 사용자 단말(1)로부터 적어도 하나의 약물에 관한 정보를 수신한다. 통신부(31)는 인터넷 등과 같은 광역 네트워크 또는 유무선 랜(LAN, Local Area Network) 등을 통하여 이와 같은 정보를 수신한다. 일반적으로, 통신부(31)는 이더넷(ethernet) 카드 등과 같은 네트워크 카드로 구현될 수 있다. 이하에서는 어느 하나의 약물에 대한 유전체 마커들이 선택되는 과정을 기술할 것이나, 이하의 기술 내용으로부터 복수 개의 약물들에 대한 유전체 마커들이 선택되는 과정이 용이하게 추론될 수 있음을 본 실시예가 속하는 기술분야에서 통상의 지식을 가진 자라면 이해할 수 있다.
개인에 대한 유전자적 측면에서의 어떤 약물의 안전성 등을 검사하기 위하여 개인의 혈액, 침 등을 이용하여 개인의 유전체 정보를 분석하는 유전체 분석 장치(2)가 활용되고 있다. 이와 같은 유전체 분석 장치(2)로는 일반적으로 DNA(Deoxyribo Nucleic Acid) 칩을 들 수 있으나, DNA 서열(sequencing)을 이용한 유전체 분석, 유전자 증폭 기술(PCR, Polymerase Chain Reaction)을 이용한 유전체 분석, 항체(antibody)를 이용한 유전체 분석을 수행하는 장치도 포함할 수 있다. 사용자가 특정 약물에 관련된 유전체 분석을 원하는 경우, 사용자는 이 약물에 대한 유전체 분석 장치를 주문 제작하여야 한다. 따라서, 이러한 유전체 분석 장 치(2)를 제작하는 회사에서 특정 약물에 대한 유전체 분석 장치를 제작하기 위해서는 이 약물이 무엇인지를 알아야 한다. 사용자는 이와 같은 약물이 무엇인지를 유전체 분석 장치를 제작하는 회사에 알리기 위하여 사용자 단말(1)에 특정 약물에 관한 정보를 입력한다.
도 3은 약물유전체 마커를 이용한 유전체 분석이 요구되는 약물의 일례를 도시한 도면이다. 도 3에는 항응고제(anticoagulant)의 일종인 와파린(Warfarin)에 대한 FDA 약물 라벨(drug label)이 도시되어 있다. 도 3의 도시된 라벨 중 참조번호 "1"은 해당 약물의 바이오마커(biomarker), 즉 약물유전체 마커에 대한 테스트가 요구됨(required)을 나타내고, "2"는 이와 같은 테스트가 추천됨(recommended)을 나타내고, "3"은 이와 같은 테스트에 상관없이 해당 약물의 정보만 참조하면 충분함을 나타낸다. 도 3에 도시된 바와 같이, 와파린의 참조번호는 "2"이기 때문에 와파린에 대한 약물유전체 마커 테스트가 실시되는 것이 바람직하다. 이와 같은 라벨을 확인한 사용자는 와파린에 대한 약물유전체 마커 테스트 서비스를 받기 위하여, 사용자 단말(1)에 와파린에 관한 정보를 입력한다. 이하에서는 약물을 와파린으로 특정하여 본 실시예를 설명하기로 하겠다.
22 단계에서 데이터 확장부(331)는 21 단계에서 통신부(31)에 수신된 정보가 지시하는 약물에 생물학적(biologically)으로 관련된 유전자들을 나타내는 노드들을 확장한다. 본 실시예에서 하나의 유전자 노드는 하나의 유전자를 나타내나, 단백질 또는 그 밖의 다른 물질을 나타낼 수도 있다. 이와 같은 유전자 노드는 유전자, 단백질 또는 다른 물질의 이름 등과 같은 식별자로 표기될 수 있다. 특히, 본 실시예에서 어떤 약물에 생물학적으로 관련된 유전자들을 나타내는 노드들 각각은 이 약물의 약물 작용점(drug target), 대사(metabolism), 수송(delivery), 독성(toxicity) 등에 관계되는 유전자, 단백질, 또는 다른 물질을 나타낸다.
도 4는 도 2에 도시된 22 단계의 상세 흐름도이다. 도 4를 참조하면, 도 2에 도시된 22 단계는 도 1에 도시된 데이터 확장부(331)에서 시계열적으로 처리되는 다음과 같은 단계들로 구성된다. 이하에서는 도 4에 도시된 흐름도를 참조하면서 도 1에 도시된 데이터 확장부(331)의 동작을 상세하게 살펴보기로 하겠다.
41 단계에서 데이터 확장부(331)는 스토리지(32)의 제 1 데이터베이스(321)를 참조하여 통신부(31)에 수신된 정보가 나타내는 약물에 생물학적으로 일차적 관계에 있는 시드 유전자들을 나타내는 노드들을 생성한다. 어떤 약물에 생물학적으로 일차적 관계에 있는 시드 유전자들을 나타내는 노드들 각각은 이 약물의 약물 작용점, 대사, 수송, 독성 등에 일차적으로 관계되는 유전자, 단백질, 또는 기타 다른 물질을 나타낸다. 제 1 데이터베이스(321)는 여러 가지 약물들 각각에 대한 생물학적으로 일차적 관계에 있는 시드 유전자들의 목록이 기록된 데이터베이스이다.
도 5는 도 1에 도시된 데이터 확장부(331)에 의해 생성된 시드 유전자 노드들을 도시한 도면이다. 도 5에 도시된 시드 유전자 노드들은 Ingenuity 사의 IPA(Ingenuity Pathways Analysis) 소프트웨어를 사용하여 생성된 것이다. 도 5에 도시된 영문자들 중 대문자는 유전자를 나타내고, 소문자는 단백질 또는 그 밖의 다른 물질을 나타낸다. 본 실시예에서는 유전자, 단백질 또는 그 밖의 다른 물질을 구별하지 않고 유전자로 통칭하기 한다. 도 5에 도시된 라인은 와파린과의 생물학적 관계를 나타낸다. 특히, 실선 라인은 문헌 등에서 그 관계가 밝혀진 것이고, 점선 라인은 IPA 등과 같이 생물학적 관계를 예측하는 알고리즘을 통하여 그 관계가 밝혀진 것이다.
42 단계에서 데이터 확장부(331)는 41 단계에서 생성된 시드 유전자 노드들을 시작점으로 하여 약물에 생물학적으로 관련된 유전자들을 나타내는 노드들을 확장한 횟수와 임계값을 비교하고, 그 결과 유전자 노드들의 확장 횟수가 임계값 미만이면 43 단계로 진행하고, 그렇지 않으면 44 단계로 진행한다. 여기에서, 임계값은 약물유전체 마커 선택 장치(3)의 설계자 또는 사용자가 원하는 유전자 노들의 확장 횟수이다. 이와 같은 임계값은 약물유전체 마커 선택 장치(3)의 설계자가 약물유전체 마커 선택 장치(3)의 하드웨어 사양을 고려하여 정하여질 수도 있고, 사용자가 어느 수준의 약물유전체 분석 서비스를 원하는지에 따라 정하여질 수도 있다. 임계값이 높을수록 약물유전체 마커의 선택이 보다 정밀해질 수 있으나, 약물유전체 마커 선택 장치(3)가 처리해야 하는 데이터 량은 크게 증가된다. 만약, 임계값이 0이라면 유전자 노드들의 확장 없이 바로 44 단계로 진행한다.
43 단계에서 데이터 확장부(331)는 스토리지(32)에 저장된 제 2 데이터베이스(322)를 참조하여 41 단계에서 생성된 시드 유전자 노드들을 시작점으로 하여 약물에 생물학적으로 관련된 유전자들을 나타내는 노드들을 확장한다. 우선, 43 단계에서 데이터 확장부(331)는 스토리지(32)에 저장된 제 2 데이터베이스(322)를 참조하여 41 단계에서 생성된 시드 유전자 노드들로부터 확장된 유전자 노드들을 생성 한다. 제 2 데이터베이스는 여러 가지 유전자들 각각에 생물학적으로 일차적 관계에 있는 유전자들의 목록이 기록된 데이터베이스이다. 따라서, 시드 유전자 노드들로부터 확장된 유전자 노드들은 약물에 대해서는 생물학적으로 이차적 관계에 있다고 볼 수 있다.
도 6은 도 1에 도시된 데이터 확장부(331)에 의해 시드 유전자 노드들로부터 일차적으로 확장된 유전자 노드들을 도시한 도면이다. 도 6에 도시된 유전자 노드들은 도 5에 도시된 시드 유전자 노드들과 이 시드 유전자 노드들 중 "vitamin k1 epoxide"로부터 확장된 유전자 노드들이다.
43 단계에서 데이터 확장부(331)는 상기된 바와 같은 유전자 노드 확장이 완료되면 42 단계로 되돌아간다. 만약 임계값이 2라면, 현재 43 단계에서의 유전자 노드들의 확장 횟수가 1회이기 때문에 42 단계에서 데이터 확장부(331)는 유전자 노드들의 확장 횟수와 임계값을 비교한 결과에 따라 43 단계로 진행한다. 43 단계에서 데이터 확장부(331)는 스토리지(32)의 제 2 데이터베이스(322)를 참조하여 이미 확장된 유전자 노드들로부터 다시 확장된 유전자 노드들을 생성한다. 이어서, 42 단계에서 데이터 확장부(331)는 43 단계에서의 유전자 노드들의 확장 횟수와 임계값을 비교한다. 그 결과, 현재 43 단계에서의 유전자 노드들의 확장 횟수가 2회로서 임계값 미만이 아니기 때문에 44 단계로 진행한다. 이와 같이, 임계값에 도달할 때까지 상기된 바와 같은 42-43 단계들에서의 유전자 노드들의 확장은 여러 차례 반복적으로 수행된다.
도 7은 도 1에 도시된 데이터 확장부(331)에 의해 시드 유전자 노드들로부터 이차적으로 확장된 유전자 노드들을 도시한 도면이다. 도 7에 도시된 유전자 노드들은 시드 유전자 노드들로부터 일차적으로 확장된 유전자 노드들 중 "vitamin k1 epoxide reductase"로부터 확장된 유전자 노드들이다.
44 단계에서 데이터 확장부(331)는 43 단계에서 확장된 유전자 노드들 중 약물과 관련된 유전자들만을 나타나내는 유전자 노드들을 추출한다. 도 8은 도 1에 도시된 데이터 확장부(331)에 의해 추출된 유전자 노드들을 도시된 도면이다. 본 실시예에서의 유전자 노드들 각각은 유전자, 단백질 또는 다른 물질을 나타낸다. 44 단계에서 데이터 확장부(331)는 이와 같은 유전자 노드들 중 유전자들만을 나타내는 유전자 노드들을 추출한다.
45 단계에서 데이터 확장부(331)는 스토리지(32)에 저장된 제 3 데이터베이스(323)를 참조하여 44 단계에서 추출된 유전자 노드들에 대응하는 유전자들 각각의 유전체 마커들의 정보를 수집한다. 제 3 데이터베이스(323)는 여러 가지 유전자들 각각의 유전체 마커들의 정보가 기록된 데이터베이스이다. 유전체 마커(genetic marker)는 염색체(chromosome) 상의 특정 위치의 유전자 또는 DNA 서열(sequence)로서 유전체 변이를 나타낸다. 대표적인 유전체 마커로 SNP(Single Nucleotide Polymorphism)를 들 수 있다. SNP는 염색체가 갖고 있는 30억 개의 염기 서열 중 개인의 편차를 나타내는 한 개 또는 수십 개의 염기변이를 의미한다. 그 밖의 유전체 마커로는 CNV(Copy Number Variation), STS(Sequence Tagged Site), STR(Short Tandem Repeat), LTR(Long Terminal Repeat) 등을 들 수 있다. 상기된 유전체 마커들 이외에 다른 유전체 마커들에도 본 실시예가 적용될 수 있음을 본 실시예가 속 하는 기술분야에서 통상의 지식을 가진 자라면 이해할 수 있다.
도 9는 도 1에 도시된 데이터 확장부(331)에 의해 수집된 유전체 마커 정보를 도시한 도면이다. 도 9를 참조하면, 유전자 "VKORC1"의 유전체 마커로서 SNP를 사용하였음을 알 수 있다. 유전자 "VKORC1"의 SNP들의 개수는 35개이고, 이 SNP들 각각의 정보가 도 9의 우측 표에 도시되어 있다. 유전체 마커 정보는 염기 서열 내에서의 유전체 마커의 위치 정보 등을 포함한다. 유전체 마커 정보의 다른 예는 이것이 활용되는 과정에서 살펴보기로 한다.
23 단계에서 계산부(332)는 22 단계에서 데이터 확장부(331)에 의해 확장된 유전자 노드들에 대응하는 유전자들 각각의 유전체 마커들이 약물에 관련된 정도를 평가하기 위한 지표들을 계산한다. 본 실시예에서는 이와 같은 평가 지표들로 유전체 마커들이 약물에 관련된 유전자들 각각의 유전체 변이 모두를 커버할 수 있는 확률인 커버리지(coverage)와 유전체 마커들이 약물에 관련된 유전자들 각각의 진정한 유전체 변이를 결정할 수 있는 확률인 검정력(statistical power)을 사용한다.
도 10은 도 2에 도시된 23 단계의 상세 흐름도이다. 도 10을 참조하면, 도 2에 도시된 23 단계는 도 1에 도시된 계산부(332)에서 시계열적으로 처리되는 다음과 같은 단계들로 구성된다. 이하에서는 도 10에 도시된 흐름도를 참조하면서 도 1에 도시된 계산부(332)의 동작을 상세하게 살펴보기로 하겠다.
101 단계에서 계산부(332)는 도 4에 도시된 45 단계에서 데이터 확장부(331)에 의해 수집된 유전체 마커들의 정보에 기초하여 이 유전체 마커들의 커버리지를 계산한다. 유전체 마커들의 정보는 인구 집단 내의 유전적 위치(genetic locus)에서의 대립인자(allele)의 상대적 비율(relative frequency)을 의미하는 대립인자 비율(allele frequency)을 포함한다. 일반적으로, 유전체 마커의 커버리지는 이와 같은 대립인자 비율과 공통적인 유전체 변이와의 관계를 이용하여 계산된다.
102 단계에서 계산부(332)는 도 4에 도시된 45 단계에서 수집된 유전체 마커들의 정보에 기초하여 이 유전체 마커들의 검정력을 계산한다. 유전체 마커들의 정보는 약물과 유전체와의 작용 관련성을 나타내는 값과 유전체 변이의 빈도를 나타내는 값을 포함한다. 일반적으로, 유전체 마커의 검정력은 약물과 유전체와의 작용 관련성을 나타내는 값과 유전체 변이의 빈도를 나타내는 값을 이용하여 계산된다.
유전체 마커의 커버리지 및 검정력의 계산 방법은 여러 가지가 알려져 있다. 예를 들면, 논문 "Coverage and Power in Genomewide Association Studies, written by Eric Jorgenson and John S. Witte", "Power to Detect Risk Alleles Using Genome-Wide Tag SNP Panels, written by Michael A. Eberle, Pauline C. Ng, Kenneth Kuhn etc", "Evaluating coverage of genome-wide association studies, written by Jeffrey C Barrett, Lon R Cardon" 등에 상세하게 설명되어 있다. 커버리지 및 검정력의 계산 방법 자체는 본 실시예의 요지가 아니기 때문에 자세한 설명은 생략하기로 한다.
도 11은 도 1에 도시된 계산부(332)에 의해 유전체 마커들 각각의 커버리지와 검정력이 계산된 일례를 도시한 도면이다. 도 11을 참조하면, 유전자 "VKORC1"의 SNP들의 개수는 35개이고, 이 SNP들 중 4 개가 선택되었을 때 4 개의 SNP들의 커버리지는 96%이고, 검정력은 86%이 된다는 것을 알 수 있다. 보다 많은 개수의 SNP들이 선택되면 커버리지와 검정력은 증가될 수 있으나, 유전체 분석 장치(2)에 의해 분석 가능한 전체 SNP들의 개수는 유전체 분석 장치(2)의 하드웨어 사양 등에 한정되기 때문에 다른 유전자의 SNP들의 개수를 고려하여 유전자 "VKORC1"의 SNP들의 개수는 적절하게 결정되어야 한다. 도 10에 도시된 101-102 단계에서의 계산의 대상이 유전체 마커들의 조합은 선택부(333)에 의해 결정되며, 계산부(332)와 선택부(333)는 가장 적절한 유전체 마커들을 선택하기 위하여 서로 연동되어 동작한다.
24 단계에서 선택부(333)는 23 단계에서 계산부(332)에 의해 계산된 평가 지표들에 기초하여 데이터 확장부(331)에 의해 확장된 유전자 노드들에 대응하는 유전자들 각각의 유전체 마커들 중 일부를 선택한다. 본 실시예에서는 이와 같은 평가 지표들로 유전체 마커들이 약물에 관련된 유전자들 각각의 유전체 변이 모두를 커버할 수 있는 비율인 커버리지(coverage)와 유전체 마커들이 약물에 관련된 유전자들 각각의 진정한 유전체 변이를 결정할 수 있는 확률인 검정력(statistical power)을 사용한다.
도 12는 도 2에 도시된 24 단계의 상세 흐름도이다. 도 12를 참조하면, 도 2에 도시된 24 단계는 도 1에 도시된 선택부(333)에서 시계열적으로 처리되는 다음과 같은 단계들로 구성된다. 이하에서는 도 12에 도시된 흐름도를 참조하면서 도 1에 도시된 선택부(333)의 동작을 상세하게 살펴보기로 하겠다.
121 단계에서 선택부(333)는 유전체 분석 장치(2)에 의해 분석 가능한 전체 SNP들의 개수 등을 고려하여 44 단계에서 데이터 확장부(331)에 의해 추출된 유전 자 노드들에 대응하는 유전자들 각각의 유전체 마커들의 모든 조합들에 대한 평가 지표들이 계산될 수 있는 지를 확인하고, 그 결과 유전체 마커들의 모든 조합들에 대한 평가 지표들의 계산이 가능하면 도 10에 도시된 101 단계로 진행하고, 가능하지 않으면 123 단계로 진행한다.
122 단계에서 선택부(333)는 101-102 단계에서 계산부(332)에 의해 계산된 커버리지와 검정력에 기초하여 44 단계에서 데이터 확장부(331)에 의해 추출된 유전자 노드들에 대응하는 유전자들 각각의 유전체 마커들의 모든 조합들 중 최적의 조합을 결정한다. 즉, 122 단계에서 선택부(333)는 44 단계에서 데이터 확장부(331)에 의해 추출된 유전자 노드들에 대응하는 유전자들 각각의 유전체 마커들의 모든 조합들 중 평균 커버리지와 검정력이 가장 높은 조합을 최적으로 조합으로 결정한다.
123 단계에서 선택부(333)는 유전체 분석 장치(2)에 의해 분석 가능한 전체 SNP들의 개수 등을 고려하여 데이터 확장부(331)에 의해 추출된 유전자 노드들에 대응하는 유전자들 각각의 유전체 마커들의 가능한 모든 조합들 중 일부를 선택한다. 유전체 마커들의 모든 조합에 대한 평가 지표들을 계산하는 것이 가장 정확한 유전체 마커들이 선택될 수 있어 바람직하나, 그 계산량이 많아짐으로 인하여 약물 약물유전체 마커 선택 장치(3)의 하드웨어 사양이 그와 같은 계산량을 지원할 수 없거나 그 처리 속도가 현저하게 떨어지는 경우에는 유전체 마커들의 가능한 모든 조합들 중 일부를 선택한다. 특히, 123 단계에서 선택부(333)는 여러 개의 조합들 중 최적의 조합을 찾아주는 기존의 탐색 기술을 이용하여 데이터 확장부(331)에 의 해 추출된 유전자 노드들에 대응하는 유전자들 각각의 유전체 마커들의 가능한 모든 조합들 중 일부를 선택할 수도 있다. 이와 같은 탐색 기술의 예로는 genetic algorithm, expectation maximization algorithm, simultaneous annealing algorithm 등을 들 수 있다. 123 단계에서의 유전자 조합 선택이 완료되면, 도 10에 도시된 101 단계로 진행한다.
124 단계에서 선택부(333)는 101-102 단계에서 계산부(332)에 의해 계산된 커버리지와 검정력에 기초하여 123 단계에서 선택된 조합이 최적의 조합인지를 결정하고, 그 결과 123 단계에서 선택된 조합이 최적의 조합이면 종료하고, 그렇지 않으면 123 단계로 되돌아간다. 후자의 경우에 123 단계에서 선택된 조합이 최적의 조합이 될 때까지 123-124 단계는 반복적으로 수행된다. 예를 들어, 124 단계에서 선택부(333)는 101-102 단계에서 계산부(332)에 의해 계산된 커버리지와 검정력이 현재까지 알려진 해당 유전자의 유전체 마커들의 커버리지와 검정력을 초과하면 123 단계에서 선택된 조합들이 최적의 조합인 것으로 결정한다.
도 11을 참조하면, 유전자 "VKORC1"의 SNP들의 개수는 35개이고, A안의 SNP 조합을 사용하여 이 SNP들 중 3개를 선택하면, 3개의 SNP들의 커버리지는 95%이고, 검정력은 75%이 된다는 것을 알 수 있다. 또한, B안의 SNP 조합을 사용하여 이 SNP들 중 2개를 선택하면, 3개의 SNP들의 커버리지는 83%이고, 검정력은 63%이 된다는 것을 알 수 있다. 124 단계에서 선택부(333)는 101-102 단계에서 계산부(332)에 의해 계산된 커버리지와 검정력이 A안 또는 B안 등의 미리 설정해 둔 커버리지와 검정력을 초과하면 122 단계에서 선택된 조합들이 최적의 조합인 것으로 결정한다. 123 단계에서 선택된 조합들이 최적의 조합인지를 결정하기 위한 기준은 상기된 예에 한정되지 않으며 다양한 기준이 채택 내지 포함될 수 있다. 예를 들어, 유전체 분석 장치(2)에 의해 분석 가능한 전체 SNP들의 개수 등도 기준이 될 수 있다.
25 단계에서 출력부(34)는 24 단계에서 선택된 최적 조합의 유전체 마커들의 정보를 유전체 분석 장치(2), 유전체 분석 장치(2)의 제조 회사의 서버 등으로 출력한다. 24 단계에서 선택된 최적 조합의 유전체 마커들의 정보는 유전체 분석 장치(2)의 제조 회사에 제공되며, 유전체 분석 장치(2)의 제조 회사는 24 단계에서 선택된 최적 조합의 유전체 마커들이 반영된 유전체 분석 장치(2), 예를 들면 DNA 칩을 제조하게 된다. 나아가, 24 단계에서 선택된 최적 조합의 유전체 마커들의 정보가 유전체 분석 장치(2)에 바로 입력되어 유전체 분석 장치(2)가 이러한 정보를 활용할 수도 있다. 상기된 바와 같은 본 실시예에 따르면, 어느 하나의 약물에 대한 최적 조합의 유전체 마커들이 선택될 수도 있고, 복수 개의 약물들에 대한 최적 조합의 유전체 마커들이 선택될 수도 있다. 어느 하나의 약물에 대한 최적 조합의 유전체 마커들은 유전적 측면에서의 개인별 맞춤 약물 처방에 활용될 수 있으며, 복수 개의 약물들에 대한 최적 조합의 유전체 마커들은 유전적 측면에서의 약물군의 복합 처방(combi-therapy)에 활용될 수 있다. 이와 같은 약물군의 예로는 특정 개인에게 투약이 고려되는 약물군, 특정 질병에 관련된 약물군, 특정 제약 회사의 파이프라인 약품(pipeline drug) 등이 될 수 있다.
상기된 바와 같은 실시예들에 따르면, 약물에 관련된 유전자들 각각의 유전체 마커들의 커버리지와 검정력에 기초하여 유전체 마커들의 조합들 중 최적의 조 합을 선택함으로써 해당 약물에만 포커싱(focusing)하여 보다 효율적이고 탁월한 성능을 발휘할 수 있는 유전체 분석 장치의 제작이 가능하게 된다. 또한, 약물에 관련된 유전자들을 나타내는 노드들을 확장함으로써 이 약물의 약물 작용점, 대사, 수송, 독성에 일차적으로 관계되는 유전자 등 이외에 이차적으로 또는 그 이상 관계되는 유전자들의 유전체 마커들을 고려할 수 있게 되어 이 약물에 관련된 거의 모든 유전자들이 반영된 유전체 분석 장치의 제작이 가능하게 된다. 또한, 일정 수준 이상의 커버리지와 검정력을 갖는 유전체 마커들만을 선택함으로써 특정 기준 내지 사용자 기준을 만족할 수 있는 충분한 성능의 유전체 분석 장치의 제작이 가능하게 된다.
한편, 상술한 본 발명의 실시예들은 컴퓨터에서 실행될 수 있는 프로그램으로 작성 가능하고, 컴퓨터로 읽을 수 있는 기록매체를 이용하여 상기 프로그램을 동작시키는 범용 디지털 컴퓨터에서 구현될 수 있다. 또한, 상술한 본 발명의 실시예에서 사용된 데이터의 구조는 컴퓨터로 읽을 수 있는 기록매체에 여러 수단을 통하여 기록될 수 있다. 상기 컴퓨터로 읽을 수 있는 기록매체는 마그네틱 저장매체(예를 들면, 롬, 플로피 디스크, 하드 디스크 등), 광학적 판독 매체(예를 들면, 시디롬, 디브이디 등)와 같은 저장매체를 포함한다.
이제까지 본 발명에 대하여 그 바람직한 실시예들을 중심으로 살펴보았다. 본 발명이 속하는 기술 분야에서 통상의 지식을 가진 자는 본 발명이 본 발명의 본질적인 특성에서 벗어나지 않는 범위에서 변형된 형태로 구현될 수 있음을 이해할 수 있을 것이다. 그러므로 개시된 실시예들은 한정적인 관점이 아니라 설명적인 관 점에서 고려되어야 한다. 본 발명의 범위는 전술한 설명이 아니라 특허청구범위에 나타나 있으며, 그와 동등한 범위 내에 있는 모든 차이점은 본 발명에 포함된 것으로 해석되어야 할 것이다.
도 1은 본 발명의 일 실시예에 따른 약물유전체 마커 선택 장치(3)의 구성도이다.
도 2는 본 발명의 일 실시예에 따른 약물유전체 마커 선택 방법의 흐름도이다.
도 3은 약물유전체 마커를 이용한 유전체 분석이 요구되는 약물의 일례를 도시한 도면이다.
도 4는 도 2에 도시된 22 단계의 상세 흐름도이다.
도 5는 도 1에 도시된 데이터 확장부(331)에 의해 생성된 시드 유전자 노드들을 도시한 도면이다.
도 6은 도 1에 도시된 데이터 확장부(331)에 의해 시드 유전자 노드들로부터 일차적으로 확장된 유전자 노드들을 도시한 도면이다.
도 7은 도 1에 도시된 데이터 확장부(331)에 의해 시드 유전자 노드들로부터 이차적으로 확장된 유전자 노드들을 도시한 도면이다.
도 8은 도 1에 도시된 데이터 확장부(331)에 의해 추출된 유전자 노드들을 도시된 도면이다.
도 9는 도 1에 도시된 데이터 확장부(331)에 의해 수집된 유전체 마커 정보를 도시한 도면이다.
도 10은 도 2에 도시된 23 단계의 상세 흐름도이다.
도 11은 도 1에 도시된 계산부(332)에 의해 유전체 마커들 각각의 커버리지 와 검정력이 계산된 일례를 도시한 도면이다.
도 12는 도 2에 도시된 24 단계의 상세 흐름도이다.

Claims (16)

  1. 적어도 하나의 약물에 관련된 유전자들 각각의 유전체 마커들이 상기 약물에 관련된 정도를 평가하기 위한 지표들을 계산하는 단계; 및
    상기 계산된 평가 지표들에 기초하여 상기 유전체 마커들 중 일부를 선택하는 단계를 포함하는 약물유전체 마커 선택 방법.
  2. 제 1 항에 있어서,
    상기 선택하는 단계는 상기 계산된 평가 지표들에 기초하여 상기 약물에 관련된 유전자들 각각의 유전체 마커들의 조합들 중 최적의 조합을 선택하는 약물유전체 마커 선택 방법.
  3. 제 2 항에 있어서,
    상기 선택하는 단계는 상기 계산된 평가 지표들에 기초하여 상기 약물에 관련된 유전자들 각각의 유전체 마커들의 모든 조합들 중 최적의 조합을 선택하는 약물유전체 마커 선택 방법.
  4. 제 2 항에 있어서,
    상기 선택하는 단계는 상기 약물에 관련된 유전자들 각각의 유전체 마커들의 모든 조합들 중 일부를 선택하는 단계; 및
    상기 계산된 평가 지표들에 기초하여 상기 선택된 일부 조합이 최적의 조합인지를 결정하는 단계를 포함하는 약물유전체 마커 선택 방법.
  5. 제 4 항에 있어서,
    상기 일부를 선택하는 단계 및 상기 최적의 조합인지를 결정하는 단계는 상기 선택된 일부 조합이 최적의 조합이 될 때까지 반복적으로 수행되는 약물유전체 마커 선택 방법.
  6. 제 1 항에 있어서,
    상기 약물에 관련된 유전자들을 나타내는 노드들을 확장하는 단계를 더 포함하고,
    상기 계산하는 단계는 상기 확장된 유전자 노드들에 대응하는 유전자들 각각의 유전체 마커들이 상기 약물에 관련된 정도를 평가하기 위한 지표들을 계산하는 약물유전체 마커 선택 방법.
  7. 제 6 항에 있어서,
    상기 유전자 노드들 각각은 상기 약물의 약물 작용점(drug target), 대사(metabolism), 수송(delivery) 및 독성(toxicity)의 적어도 하나 이상에 관계되는 유전자, 단백질, 또는 다른 물질을 나타내는 약물유전체 마커 선택 방법.
  8. 제 6 항에 있어서,
    상기 확장하는 단계는
    상기 약물에 생물학적으로 일차적 관계에 있는 시드 유전자들을 나타내는 노드들을 생성하는 단계; 및
    상기 생성된 시드 유전자 노드들을 시작점으로 하여 상기 약물에 생물학적으로 관련된 유전자들을 나타내는 노드들을 확장하는 단계를 포함하는 약물유전체 마커 선택 방법.
  9. 제 8 항에 있어서,
    상기 확장하는 단계는
    상기 생성된 시드 유전자 노드들로부터 확장된 유전자 노드들을 생성하는 단계; 및
    상기 확장된 유전자 노드들로부터 다시 확장된 유전자 노드들을 생성하는 단계를 포함하는 약물유전체 마커 선택 방법.
  10. 제 9 항에 있어서,
    상기 유전자 노드들을 확장하는 단계들은 상기 유전자들의 확장 횟수가 소정 임계값에 도달할 때까지 반복적으로 수행되는 약물유전체 마커 선택 방법.
  11. 제 1 항에 있어서,
    상기 평가 지표들은 상기 유전체 마커들이 상기 약물에 관련된 유전자들 각각의 유전체 변이 모두를 커버할 수 있는 비율인 커버리지(coverage)와 상기 유전체 마커들이 상기 약물에 관련된 유전자들 각각의 진정한 유전체 변이를 결정할 수 있는 확률인 검정력(statistical power) 중 적어도 하나를 포함하는 것을 특징으로 하는 약물유전체 마커 선택 방법.
  12. 제 1 항에 있어서,
    사용자 단말로부터 상기 약물에 관한 정보를 수신하는 단계를 더 포함하고,
    상기 계산하는 단계는 상기 정보가 지시하는 약물에 관련된 유전자들 각각의 유전체 마커들이 상기 약물에 관련된 정도를 평가하기 위한 지표들을 계산하는 약물유전체 마커 선택 방법.
  13. 제 1 항 내지 제 12 항 중에 어느 한 항의 방법을 컴퓨터에서 실행시키기 위한 프로그램을 기록한 컴퓨터로 읽을 수 있는 기록매체.
  14. 적어도 하나의 약물에 관련된 유전자들 각각의 유전체 마커들이 상기 약물에 관련된 정도를 평가하기 위한 지표들을 계산하는 계산부; 및
    상기 계산된 평가 지표들에 기초하여 상기 유전체 마커들 중 일부를 선택하는 선택부를 포함하는 약물유전체 마커 선택 장치.
  15. 제 14 항에 있어서,
    상기 선택부는 상기 계산된 평가 지표들에 기초하여 상기 약물에 관련된 유전자들 각각의 유전체 마커들의 조합들 중 최적의 조합을 선택하는 약물유전체 마커 선택 장치.
  16. 제 14 항에 있어서,
    상기 약물에 관련된 유전자들을 나타내는 노드들을 확장하는 데이터 확장부를 더 포함하고,
    상기 계산부는 상기 확장된 유전자 노드들에 대응하는 유전자들 각각의 유전체 마커들이 상기 약물에 관련된 정도를 평가하기 위한 지표들을 계산하는 약물유전체 마커 선택 장치.
KR1020090010623A 2009-02-10 2009-02-10 약물유전체 마커의 선택 방법 및 장치 KR20100091437A (ko)

Priority Applications (2)

Application Number Priority Date Filing Date Title
KR1020090010623A KR20100091437A (ko) 2009-02-10 2009-02-10 약물유전체 마커의 선택 방법 및 장치
US12/623,675 US20100204922A1 (en) 2009-02-10 2009-11-23 Method and apparatus for selecting pharmacogenomic markers

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
KR1020090010623A KR20100091437A (ko) 2009-02-10 2009-02-10 약물유전체 마커의 선택 방법 및 장치

Publications (1)

Publication Number Publication Date
KR20100091437A true KR20100091437A (ko) 2010-08-19

Family

ID=42541103

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020090010623A KR20100091437A (ko) 2009-02-10 2009-02-10 약물유전체 마커의 선택 방법 및 장치

Country Status (2)

Country Link
US (1) US20100204922A1 (ko)
KR (1) KR20100091437A (ko)

Family Cites Families (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20040121350A1 (en) * 2002-12-24 2004-06-24 Biosite Incorporated System and method for identifying a panel of indicators
US7107155B2 (en) * 2001-12-03 2006-09-12 Dnaprint Genomics, Inc. Methods for the identification of genetic features for complex genetics classifiers
WO2009062199A1 (en) * 2007-11-09 2009-05-14 Fox Chase Cancer Center EGFR/NEDD9/TGF-β LNTERACTOME AND METHODS OF USE THEREOF FOR THE IDENTIFICATION OF AGENTS HAVING EFFICACY IN THE TREATMENT OF HYPERPROLIFERATIVE DISORDERS

Also Published As

Publication number Publication date
US20100204922A1 (en) 2010-08-12

Similar Documents

Publication Publication Date Title
US20220115090A1 (en) Systems and methods for nucleic acid sequence assembly
Yao et al. CMfinder—a covariance model based RNA motif finding algorithm
Torarinsson et al. Multiple structural alignment and clustering of RNA sequences
WO2018061699A1 (ja) マルチプレックスpcrに供するプライマーの設計方法
Sun et al. Identifying splicing sites in eukaryotic RNA: support vector machine approach
Lindgreen et al. MASTR: multiple alignment and structure prediction of non-coding RNAs using simulated annealing
US20130317755A1 (en) Methods, computer-accessible medium, and systems for score-driven whole-genome shotgun sequence assembly
US20120041727A1 (en) Method, computer-accessible medium and systems for score-driven whole-genome shotgun sequence assemble
JP7319197B2 (ja) 標的核酸のシークエンシングデータをアライメントする方法
Esmaili-Taheri et al. Evolutionary solution for the RNA design problem
Blank Next-generation analysis of deep sequencing data: bringing light into the black box of SELEX experiments
Gao et al. TideHunter: efficient and sensitive tandem repeat detection from noisy long-reads using seed-and-chain
JPWO2018061693A1 (ja) マルチプレックスpcrに供するプライマーの設計方法
Sun et al. Tree-structured algorithm for long weak motif discovery
JP2005503535A (ja) 分子相互作用ネットワークの予測方法
WO2008112754A2 (en) Methods, computer-accessible medium, and systems for generating a genome wide haplotype sequence
EP3676846A1 (en) Site-specific noise model for targeted sequencing
KR20100091437A (ko) 약물유전체 마커의 선택 방법 및 장치
Muzio et al. networkGWAS: A network-based approach to discover genetic associations
EP2979168A1 (en) Systems, algorithms, and software for molecular inversion probe (mip) design
Dang et al. Determining 2-Optimality consensus for DNA structure
Yuryev PCR primer design using statistical modeling
Nicholls et al. Advances in the recovery of haplotypes from the metagenome
Heaton Computational methods for single cell RNA and genome assembly resolution using genetic variation
US20180082014A1 (en) Biomarker search device, biomarker search method, and non-transitory computer readable medium

Legal Events

Date Code Title Description
A201 Request for examination
E902 Notification of reason for refusal
E601 Decision to refuse application