KR102058996B1 - 췌장암 진단용 바이오마커, 이를 위한 컴퓨팅 장치 및 이의 제어 방법 - Google Patents

췌장암 진단용 바이오마커, 이를 위한 컴퓨팅 장치 및 이의 제어 방법 Download PDF

Info

Publication number
KR102058996B1
KR102058996B1 KR1020130042329A KR20130042329A KR102058996B1 KR 102058996 B1 KR102058996 B1 KR 102058996B1 KR 1020130042329 A KR1020130042329 A KR 1020130042329A KR 20130042329 A KR20130042329 A KR 20130042329A KR 102058996 B1 KR102058996 B1 KR 102058996B1
Authority
KR
South Korea
Prior art keywords
gene
scores
microrna
pancreatic cancer
genes
Prior art date
Application number
KR1020130042329A
Other languages
English (en)
Other versions
KR20140124601A (ko
Inventor
최형석
허지연
송시영
정다운
Original Assignee
엘지전자 주식회사
연세대학교 산학협력단
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 엘지전자 주식회사, 연세대학교 산학협력단 filed Critical 엘지전자 주식회사
Priority to KR1020130042329A priority Critical patent/KR102058996B1/ko
Priority to US14/784,550 priority patent/US20160055297A1/en
Priority to PCT/KR2014/003300 priority patent/WO2014171730A1/en
Priority to CN201480019133.1A priority patent/CN105102637B/zh
Publication of KR20140124601A publication Critical patent/KR20140124601A/ko
Application granted granted Critical
Publication of KR102058996B1 publication Critical patent/KR102058996B1/ko

Links

Images

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/11DNA or RNA fragments; Modified forms thereof; Non-coding nucleic acids having a biological activity
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01NINVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
    • G01N33/00Investigating or analysing materials by specific methods not covered by groups G01N1/00 - G01N31/00
    • G01N33/48Biological material, e.g. blood, urine; Haemocytometers
    • G01N33/50Chemical analysis of biological material, e.g. blood, urine; Testing involving biospecific ligand binding methods; Immunological testing
    • G01N33/53Immunoassay; Biospecific binding assay; Materials therefor
    • G01N33/574Immunoassay; Biospecific binding assay; Materials therefor for cancer
    • G01N33/57407Specifically defined cancers
    • G01N33/57438Specifically defined cancers of liver, pancreas or kidney
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q2537/00Reactions characterised by the reaction format or use of a specific feature
    • C12Q2537/10Reactions characterised by the reaction format or use of a specific feature the purpose or use of
    • C12Q2537/165Mathematical modelling, e.g. logarithm, ratio
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q2600/00Oligonucleotides characterized by their use
    • C12Q2600/178Oligonucleotides characterized by their use miRNA, siRNA or ncRNA

Landscapes

  • Health & Medical Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Engineering & Computer Science (AREA)
  • Biomedical Technology (AREA)
  • Molecular Biology (AREA)
  • Genetics & Genomics (AREA)
  • Chemical & Material Sciences (AREA)
  • Urology & Nephrology (AREA)
  • Immunology (AREA)
  • Biotechnology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Hematology (AREA)
  • Microbiology (AREA)
  • General Health & Medical Sciences (AREA)
  • Wood Science & Technology (AREA)
  • General Engineering & Computer Science (AREA)
  • Zoology (AREA)
  • Physics & Mathematics (AREA)
  • Organic Chemistry (AREA)
  • Biochemistry (AREA)
  • Medicinal Chemistry (AREA)
  • General Physics & Mathematics (AREA)
  • Pathology (AREA)
  • Analytical Chemistry (AREA)
  • Biophysics (AREA)
  • Food Science & Technology (AREA)
  • Plant Pathology (AREA)
  • Cell Biology (AREA)
  • Oncology (AREA)
  • Hospice & Palliative Care (AREA)
  • Gastroenterology & Hepatology (AREA)
  • Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)

Abstract

본 발명은 ANO1, C19orf33, EIF4E2, FAM108C1, IL1B, ITGA2, KLF5, LAMB3, MLPH, MMP11, MSLN, SFN, SOX4, TMPRSS4, TRIM29 및 TSPAN1을 포함하는 췌장암 진단용 바이오마커를 개시한다.

Description

췌장암 진단용 바이오마커, 이를 위한 컴퓨팅 장치 및 이의 제어 방법 {BIOMARKER FOR DIAGNOSSIS OF PANCREATIC CANCER USING TARGET GENES OF MICRORNA}
본 발명은 췌장암 진단용 바이오마커, 이를 위한 컴퓨팅 장치 및 이의 제어 방법에 관한 것이다.
췌장은 위장의 뒤쪽, 몸의 가운데에 있으며 길이가 20cm 정도로 길다. 위, 십이지장, 소장, 대장, 간, 담낭, 비장 등의 장기에 둘러싸여 있다. 전체 길이는 약 15 내지 20 cm, 무게는 100g 정도이고, 두부(頭部), 체부(體部), 미부(尾部)로 구분된다. 췌장은 섭취한 음식물 중의 탄수화물, 지방, 단백질을 분해하는 소화 효소를 분비하는 외분비 기능과 혈당을 조절하는 인슐린과 글루카곤 등의 호르몬을 분비하는 내분비 기능을 갖는다.
췌장암(pancreatic cancer)이란 췌장에 생긴 암세포로 이루어진 종괴(종양덩어리)이다. 췌장암에는 여러 가지 종류가 있는데 췌관세포에서 발생한 췌관 선암종이 90% 정도를 차지하고 있어 일반적으로 췌장암이라고 하면 췌관 선암종을 말한다. 그 외에 낭종성암(낭선암), 내분비종양 등이 있다.
췌장암은 특별한 초기 증상이 없기 때문에, 조기발견하기 어렵다. 식욕이 떨어지거나, 체중감소 등이 나타나지만 췌장암의 특징적인 증상이 아니라 다른 질환에서도 충분히 나타날 수 있다.
또한 췌장은 두께가 2 cm 정도로 얇으며 피막만으로 싸여 있는데다가 소장에 산소를 공급하는 상장간막 동맥과 장에서 흡수한 영양분을 간으로 운반하는 간문맥 등과 밀착되어 있어 암의 침윤이 쉽게 일어난다. 또한 췌장 후면의 신경 다발과 임파선에도 조기에 전이가 발생하는 특징이 있다. 특히 췌장 암세포는 성장 속도가 빠르다. 발병시 4개월 내지 8개월밖에 살지 못하는 경우가 대부분으로, 예후가 좋지 않고, 수술에 성공하여 증상이 나아진다고 해도 5년 이상 생존하는 비율이 17∼24% 정도로 적은 편이다.
췌장암의 진단은 초음파검사, 전산화단층촬영(CT), 자기공명영상(MRI), 내시경적 역행성담췌관조영술(ERCP), 내시경적 초음파검사(EUS) 및/또는 양성자방출단층촬영(PET)을 통해 이루어질 수 있다. 그러나, 이러한 화상진단기술은 진단에 고비용이 들고 복잡하며 사실상 조기 진단용으로는 소용이 없기 때문에, 간단하고 비용이 경제적이며, 조기 진단이 가능한 수단이 필요하다.
이와 관련하여, 지난 20년 동안 다른 암종에 대한 수십 개의 바이오마커가 나왔으며 췌장암의 바이오마커로는 단백질 바이오마커인 CA19-9, CEA 등이 알려져 있으나, 이들 단백질 바이오마커들은 민감도와 특이도가 60% 수준이어서 실제 진단에서 활용도가 매우 낮은 실정이다. 특히, 조직 특이성이 부족하고, 루이스 항원을 발현하지 않는 혈액형에서는 증가하지 않는 문제점이 있다. 따라서, 민감도와 특이도가 높아서 신뢰할만한 진단을 내릴 수 있는 바이오마커의 개발이 절실하다.
본 발명에서는 높은 특이성 및 민감성을 갖춘 췌장암의 진단용 바이오마커를 제공하고자 한다. 또한, 본 발명에서는 췌장암 진단용 바이오마커를 발굴하는 방법을 제공하고자 한다.
본 발명에서 이루고자 하는 기술적 과제들은 이상에서 언급한 기술적 과제들로 제한되지 않으며, 언급하지 않은 또 다른 기술적 과제들은 아래의 기재로부터 본 발명이 속하는 기술분야에서 통상의 지식을 가진 자에게 명확하게 이해될 수 있을 것이다.
본 발명의 일예에 따른 췌장암 진단용 바이오마커는 ANO1, C19orf33, EIF4E2, FAM108C1, IL1B, ITGA2, KLF5, LAMB3, MLPH, MMP11, MSLN, SFN, SOX4, TMPRSS4, TRIM29 및 TSPAN1을 포함한다.
본 발명의 일예에 따른 췌장암 진단용 바이오마커 추출 방법은, 마이크로 RNA와 유전자 사이 상보 결합 정도를 수치화한 인터랙션 점수를 연산하는 단계; 상기 인터랙션 점수가 높은 n 개의 마이크로 RNA 및 유전자 페어를 결정하는 단계; 및 상기 n 개의 마이크로 RNA 및 유전자 페어 중 췌장암 환자에게서 특이발현되는 유전자와 공통되는 유전자를 추출하는 단계를 포함한다.
본 발명에서 제시하는 해결 수단은 이상에서 언급한 해결 수단들로 제한되지 않으며, 언급하지 않은 또 다른 해결 수단들은 아래의 기재로부터 본 발명이 속하는 기술분야에서 통상의 지식을 가진 자에게 명확하게 이해될 수 있을 것이다.
본 발명에서는 높은 특이성 및 민감성을 갖춘 췌장암의 진단용 바이오마커를 제공할 수 있다. 또한, 본 발명에서는 췌장암 진단용 바이오마커를 발굴하는 방법을 제공할 수 있다.
본 발명에서 이루고자 하는 기술적 효과들은 이상에서 언급한 기술적 효과들로 제한되지 않으며, 언급하지 않은 또 다른 기술적 효과들은 아래의 기재로부터 본 발명이 속하는 기술분야에서 통상의 지식을 가진 자에게 명확하게 이해될 수 있을 것이다.
도 1은 본 발명에 따른 컴퓨팅 장치의 블록도이다.
도 2는 miRNA와 유전자 사이의 인터랙션 점수를 연산하는 것의 일예를 설명하기 위한 개념도다.
도 3은 인터랙션 점수의 연산 방법의 흐름도이다.
도 4는 유사도 데이터베이스를 이용하여 유사 miRNA 및 특정 유전자 사이의 상관관계 값을 연산하는 방법을 설명하기 위한 개념도이다.
도 5는 유사도 데이터베이스를 이용하여 유사 miRNA 및 유전자 사이의 상관관계 값을 연산하는 방법의 흐름도이다.
도 6은 miRNA 클러스터 데이터베이스를 이용하여 인접 miRNA 및 특정 유전자 사이의 상관관계 값을 연산하는 방법을 설명하기 위한 개념도이다.
도 7은 miRNA 클러스터 데이터베이스를 이용하여 인접 miRNA 및 특정 유전자 사이의 가중치 값을 연산하는 방법의 흐름도이다.
도 8은 전사인자 데이터베이스를 이용하여 특정 miRNA 및 전사조절 유전자 사이의 상관관계 값을 연산하는 방법을 설명하기 위한 개념도이다.
도 9는 전사인자 데이터베이스를 이용하여 특정 miRNA 및 전사조절 유전자 사이의 가중치 값을 연산하는 방법의 흐름도이다.
도 10은 바이오마커 발굴용 통합 분석 알고리즘을 기초로 췌장암 환자용 바이오마커를 발굴하는 방법의 흐름도이다.
도 11 및 도 12는 각각 데이터 GSE28735을 이용하였을 때의 주성분 분석 결과를 플롯한 도면 및 계층적 군집분석 결과를 히트 맵으로 도시한 도면이다.
도 13 및 도 14는 각각 데이터 GSE15471을 이용하였을 때의 주성분 분석 결과를 플롯한 도면 및 계층적 군집분석 결과를 히트 맵으로 도시한 도면이다.
이하, 본 발명과 관련된 컴퓨팅 장치에 대하여 도면을 참조하여 보다 상세하게 설명한다.
이하의 설명에서 사용되는 구성요소에 대한 접미사 "모듈" 및 "부"는 명세서 작성의 용이함만이 고려되어 부여되거나 혼용되는 것으로서, 그 자체로 서로 구별되는 의미 또는 역할을 갖는 것은 아니다.
본 발명에서는 바이오마커 발굴용 통합 분석 알고리즘을 적용한 컴퓨팅 장치(100) 및 상기 컴퓨팅 장치(100)를 통해 발굴된 마이오마커를 개시한다. 여기서, 설명하는 컴퓨팅 장치(100)는 개인용 컴퓨터, 워크 스테이션, 수퍼 컴퓨터 등 전자 회로를 이용한 고속의 연산 처리 장치를 포함할 수 있다. 비단, 컴퓨터, 워크 스테이션, 수퍼 컴퓨터 등의 고정형 장치가 아니더라도, 중앙 처리 장치(Central Processing Unit)를 포함하고 연산 처리를 수행할 수 있는 스마트 폰, PDA, 랩탑 등의 이동형 장치도 컴퓨팅 장치에 포함될 수 있다.
도 1은 본 발명에 따른 컴퓨팅 장치의 블록도이다. 도 1을 참조하면, 본 발명에 따른 컴퓨팅 장치(100)는 저장부(110), 사용자 입력부(120), 통신부(130) 및 제어부(140)를 포함할 수 있다.
저장부(110)는 제어부(140)의 동작을 위한 프로그램을 저장할 수 있고, 입/출력되는 데이터들(예를 들어, 데이터베이스 등)을 임시 저장할 수도 있다. 나아가 저장부(110)는 통신부(130)가 통신을 수행하면서 송수신하는 데이터들을 저장할 수도 있다.
저장부(110)는 플래시 메모리 타입(flash memory type), 하드디스크 타입(hard disk type), 멀티미디어 카드 마이크로 타입(multimedia card micro type), 카드 타입의 메모리(예를 들어 SD 또는 XD 저장부(110) 등), 램(Random Access Memory, RAM), SRAM(Static Random Access Memory), 롬(Read-Only Memory, ROM), EEPROM(Electrically Erasable Programmable Read-Only Memory), PROM(Programmable Read-Only Memory), 자기 저장부(110), 자기 디스크, 광디스크 중 적어도 하나의 타입의 저장매체를 포함할 수 있다.
사용자 입력부(120)는 사용자로부터 사용자 입력을 수신하는 역할을 수행한다. 사용자 입력부(120)는 키보드, 마우스 등을 포함할 수 있다.
통신부(130)는 통신을 통해 외부로부터 데이터를 수신하거나 외부로 데이터를 송신하는 역할을 수행한다. 본 발명에 의한 통신부(130)는 원격 서버로부터 각종 데이터베이스를 수신하는 역할을 수행할 수 있다.
제어부(140)는 컴퓨팅 장치(100)의 전반적인 동작을 제어하고, 각종 연산을 수행한다. 본 발명에 의한 제어부(140)는 후술할 인터랙션 점수 및 상관관계 값(Correlation Coefficient) 등을 연산하고, 췌장암 진단용 바이오마커를 추출하기 위한 연산을 수행할 수 있다.
본 발명에 의한 컴퓨팅 장치(100)는 정보의 출력을 위한 디스플레이부(150)를 더 포함할 수도 있다. 디스플레이부(150)는 사용자의 입력을 표시하고, 제어부(140)의 연산 결과를 출력하는 출력 장치로의 역할을 수행할 수 있다. 디스플레이부(150)는 컴퓨팅 장치(100)를 보조하는 모니터 등의 장치일 수 있다.
상술한 컴퓨팅 장치(100)를 이용하여, 췌장암 진단용 바이오마커 발굴 방법에 대해 상세히 설명하기로 한다.
본 발명에서 설명하는 바이오마커 발굴용 통합 분석 알고리즘은 차등 발현 유전자(Differentially Expressed Genes) 분석 알고리즘과 마이크로 RNA 표적 유전자 분석 알고리즘이 병합되어 구성된 형태일 수 있다.
먼저 차등 발현 유전자 알고리즘에 대해 설명하기로 한다. 차등 발현 유전자 알고리즘은 췌장암 환자에게서 정상인과 다르게 과발현(over-expression)되거나, 저발현(low-expression)되는 유전자를 통계적으로 유의미하게 찾아내기 위한 알고리즘으로써, 다양한 요인들을 고려할 수 있는 고급 통계 방법 중 하나인 선형 모형(linear model)을 이용하여 정상인 그룹과 환자 그룹을 구분할 수 있는 유전자들을 찾는 것을 목적으로 한다(참고문헌 Statistical Applications in Genetics and Molecular Biology, Vol. 3, No. 1, Article 3).
차등 발현 유전자 분석 알고리즘은 크게 데이터 표준화(normalization) 단계와 통계 분석 단계로 구분될 수 있다. 데이터 표준화 단계는 정상인 그룹과 환자 그룹으로부터 얻어진 인간의 전체 유전자에 대한 마이크로어레이 데이터를 통합하고 보정하는 단계이다. 데이터 표준화를 위해, 로버스트 멀티 칩 평균(Robust Multichip Average, RMA) 알고리즘이 이용될 수 있다(참고문헌 Biostatistics, Vol. 4, No. 2, 249-264).
통계분석 단계는 표준화된 데이터를 선형모형을 이용하여 두 그룹(즉, 정상인 그룹과 환자 그룹) 사이에서 통계적으로 유의미하게 발현량에 차이가 나는 유전자를 선별하는 단계이다. 통계적 유의 확률은 FDR (False Discovery) 방법(참고문헌 Journal of the Royal Statistical Society , Series B ( Methodological ), Vol. 57, No. 1, 289-300)을 이용하여 보정된 p-value인 q-value가 0.01 이하인 유전자를 선택할 수 있다.
본 발명의 컴퓨팅 장치(100)는 췌장암 진단용 바이오마커를 발굴하기 위해, 차등 발현 유전자 분석 알고리즘을 이용한 췌장암 환자에게서 특이발현(과발현 또는 저발현)되는 유전자 목록을 이용할 수 있다. 차등 발현 유전자 분석 알고리즘을 이용하여 췌장암 환자에게서 특이발현되는 유전자 목록을 발굴하는 것은 이미 공지의 기술이므로, 이에 대한 상세한 설명은 생략한다.
다음으로 마이크로 RNA 표적 유전자 분석 알고리즘에 대해 설명하기로 한다. 본 발명에서 설명하는 마이크로 RNA 표적 유전자 분석 알고리즘은 기존의 마이크로 RNA 데이터베이스에서 얻어진 마이크로 RNA 표적 유전자 예측 계산값, 마이크로어레이 실험을 통해 얻어진 마이크로 RNA와 유전자의 발현양상에 대한 상관관계 계산값 및 생물학적 메커니즘에 따른 가중치 계산값 중 적어도 하나를 이용하여 마이크로 RNA의 표적 유전자를 정확하게 찾아내는 통계 방정식을 제공하기 위한 것이다.
이하에서는, 마이크로 RNA 표적 유전자 예측 계산값(또는 인터랙션 점수), 상관관계 계산값 및 가중치 계산값의 연산 방법에 대해 상세히 설명하기로 한다. 설명의 편의를 위해, 본 발명에서 miRNA 및 gene이라 기재된 것은 각각 마이크로 RNA 및 유전자와 동등한 의미인 것으로 가정한다.
마이크로 RNA 표적 유전자 예측값 연산
본 발명에 따른 컴퓨팅 장치(100)는 마이크로 RNA와 이의 표적 유전자 사이의 상보 결합 정도를 수치화한 인터랙션 점수(Interaction Score)를 연산할 수 있다. 인터랙션 점수를 통해 마이크로 RNA와 이의 표적 유전자 사이의 상보 결합이 발생할 가능성의 고저를 판단할 수 있다. 후술되는 도면을 참조하여 인터랙션 점수의 연산 방법에 대해 상세히 설명한다.
도 2는 miRNA와 유전자 사이의 인터랙션 점수를 연산하는 것의 일예를 설명하기 위한 개념도이고, 도 3은 인터랙션 점수의 연산 방법의 흐름도이다.
도 2 및 도 3을 참조하면, 먼저, 컴퓨팅 장치(100)는 적어도 하나 이상의 miRNA 타겟 예측(miRNA Target Prediction) 툴을 이용하여 miRNA와 유전자 사이의 예측 점수(Prediction score)를 통계화한 데이터 베이스를 획득할 수 있다(S310).
miRNA 타겟 예측 툴은 표적 유전자와, 상기 표적 유전자에 상보적으로 결합하여 표적 유전자가 단백질로 만들어지는 과정을 억제할 수 있는 miRNA 페어(pair)의 결합의 정도를 수치화한 소프트웨어적 툴을 의미할 수 있다. 유전자-miRNA 페어들의 예측 점수를 획득하기 위한 miRNA 타겟 예측 툴로는, Targetscan, miRDB, DIANA-microT, PITA, miRanda MicroCosm, RNAhybrid, PicTar, RNA22 등이 포함될 수 있다. 각각의 miRNA 타겟 예측 툴에 대한 간략한 설명이 표 1에 기재되어 있다.
툴 이름 툴 설명(이용 정보) 참조 사이트
Targetscan 서열 유사성(sequence similarity) 정보와 보존(conservation) 정보 이용 http://www.ncbi.nlm.nih.gov/ pubmed /18955434
miRDB 서열 유사성 정보, 열역학적 안정성(thermodynamic stability) 정보 및, 보존(conservation) 정보 이용 http://www.ncbi.nlm.nih.gov/ pubmed /18426918
DIANA-microT 서열 유사성 정보 및 열역학적 안정성 정보 이용 http://www.ncbi.nlm.nih.gov/ pubmed /15131085
PITA 서열 유사성 정보 및 열역학적 안정성 정보 이용 http://www.ncbi.nlm.nih.gov/ pubmed /17893677
miRanda 열역학적 안정성 및 보존 정보 이용 http://www.ncbi.nlm.nih.gov/ pubmed /14709173
MicroCosm 열역학적 안정성 정보 및 보존 정보 이용 http://www.ebi.ac.uk/enright- srv / microcosm / htdocs / targets / v5 / info . html
RNAhybrid 열역학적 안정성 정보 이용 http://www.ncbi.nlm.nih.gov/ pubmed /15383676
PicTar 서열 유사성 정보와 보존 정보 이용 http://www.ncbi.nlm.nih.gov/ pubmed /15806104
RNA22 서열 패턴(sequence pattern) 정보 이용 http://www.ncbi.nlm.nih.gov/ pubmed /16990141
타겟 예측 툴을 이용하면, miRNA와 상보 결합할 수 있는 다양한 유전자 사이의 예측 점수가 스코어링 될 수 있다. 예측 점수가 작을수록 miRNA와 유전자 사이의 상보 결합 가능성이 낮아지는 것을 의미할 수 있다.
타겟 예측 툴은 본 발명에 의한 컴퓨팅 장치(100)에 의해 구동되고, 제어부(140)의 연산 처리에 의해 miRNA-유전자 페어의 예측 점수를 통계화한 데이터 베이스가 획득될 수도 있으나, 이에 한정되는 것은 아니다. 본 발명에 의한 컴퓨팅 장치(100)는 타겟 예측 툴을 이용하는 원격의 서버로부터 miRNA-유전자 페어의 예측 점수를 통계화한 데이터 베이스를 획득할 수도 있다.
miRNA-유전자 페어 사이의 예측 점수의 신뢰성을 높이기 위해, 하나의 타겟 예측 툴을 이용하는 것 보다 복수의 타겟 예측 툴을 이용하여 복수의 데이터베이스를 획득하는 것이 바람직하다. 도 2에서는 타겟 예측 툴로, PITA, DIANA-microT, TargetScan, MicroCosm, miRDB 및 miRanda가 이용된 것으로 예시되었다.
복수의 타겟 예측 툴을 이용하여, miRNA-유전자 페어의 예측 점수를 통계화한 복수의 데이터 베이스를 획득한 경우, 데이터베이스의 정규화(normalization)하기 위해, 제어부(140)는 miRNA-유전자 페어의 예측 점수의 순위를 기초로, 정규화된 점수를 연산할 수 있다(S320).
표 1에 도시된 예에서와 같이, miRNA 타겟 예측 툴이 이용하는 정보들이 다르고, 각 데이터베이스마다 예측 점수를 매기는데 서로 다른 단위가 적용될 수 있기 때문에, 복수의 데이터 베이스를 이용하고자 하는 경우 이의 정규화가 필수적이라 할 것이다. miRNA-유전자 페어의 예측 점수를 정규화 하기 위해, 제어부(140)는 각 데이터베이스별로 miRNA-유전자 페어들의 예측 점수를 기준으로 순위를 매긴 뒤, 이를 표준 점수로 변환하고, 각 데이터베이스에서의 miRNA-유전자 페어들의 표준 점수를 합하여 정규화된 점수를 획득할 수 있다. 수학식 1은 정규화된 점수를 획득하는데 이용되는 수학식을 예시한 것이다.
Figure 112013033523914-pat00001
수학식 1에서, i는 i번째 데이터 베이스, n은 데이터 베이스의 개수(일예로, 도 2에서는 6개의 예측 툴을 통해 6개의 데이터 베이스를 획득하였으므로, n은 6으로 설정될 수 있을 것임), Ti는 i번째 데이터 베이스에서 miRNA-유전자 페어의 총 개수, Ri ,j는 i번째 데이터베이스에서, j번째 miRNA-유전자 페어의 순위를 의미하는 것일 수 있다.
예컨대, 100개의 miRNA-유전자 페어가 존재하는 제 1 데이터베이스에서, miRNA1-gene1 페어의 예측 점수가 100개의 페어 중 20위에 해당한다면, 제 1 데이터베이스에 miRNA1-gene1 페어의 표준 점수는 (100+1-20)/100=0.81 이 될 것이다. 제어부(140)는, 제 2 내지 제 n 데이터베이스에서 miRNA1-geng1 페어의 표준 점수를 합하여, miRNA1-gene1 페어의 정규화 점수를 연산할 수 있다.
이후, 제어부(140)는 정규화 점수를 기초로, 특정 유전자에 대한 miRNA 들의 순위 및 특정 miRNA에 대한 유전자들의 순위를 매길 수 있다(S330).
예컨대, gene1과 상보결합 가능한 miRNA가 miRNA1, miRNA3, miRNA4 일때, 제어부(140)는 gene1-miRNA1, gene1-miRNA3 및 gene1-miRNA4 각각의 정규화 점수를 기초로, gene1과의 상보적인 결합력이 강한(즉, 정규화 점수가 높은) 순서대로 miRNA의 순위를 결정할 수 있다. 도 2에서는 miRNA1-gene1 사이의 정규화 점수가 0.4이고, miRNA3-gene1 사이의 정규화 점수가 0.6으로 설정되어, gene1에 대해 miRNA1은 두번째 순위를 갖고, miRNA3은 첫번째 순위를 갖는 것으로 예시되었다.
이와 같은 방법으로 특정 miRNA에 대한 유전자들의 순위를 결정할 수 있다. 예컨대, miRNA1과 상보결합 가능한 gene이 gene1 및 gene3인 경우, 제어부(140)는 miRNA1-gene1 및 miRNA1-gene3 각각의 정규화 점수를 기초로, miRNA1과의 상보적인 결합력이 강한(즉, 정규화 점수가 높은) 순서대로 gene의 순위를 결정할 수 있다. 도 2에서는 miRNA1-gene1 사이의 정규화 점수가 0.4이고, miRNA1-gene3 사이의 정규화 점수가 0.5로 설정되어, miRNA1에 대해 gene1은 두번째 순위를 갖고, gene3은 첫번째 순위를 갖는 것으로 예시되었다.
이후, 제어부(140)는 유전자 및 miRNA 들의 순위를 기초로, 유전자-miRNA 사이의 인터랙션 점수(Interaction Score)를 연산할 수 있다(S340). 수학식 2는 인터랙션 점수를 연산하기 위해 이용되는 수학식을 예시한 것이다.
Figure 112013033523914-pat00002
tmi는 i번째 miRNA의 유전자와의 페어의 수(number of miRNAi-gene), tgj는 j번째 gene의 miRNA와의 페어의 수(number of genej-miRNA), rmi는 j번째 유전자에 대한 i번째 miRNA의 정규화 점수 순위, rgj는 i번째 miRNA에 대한 j번째 유전자의 정규화 점수 순위를 의미할 수 있다.
상관관계 연산
상술한 타겟 miRNA 예측 툴이 인체의 모든 miRNA 및 모든 유전자와 관련된 데이터베이스를 갖고 있지는 않다. 본 발명에서는 miRNA 사이의 유사도, miRNA 사이의 주변 영향력 및 유전자 들의 전사인자 등을 이용하여, 타겟 miRNA 예측 툴로부터 예측될 수 없는 다양한 miRNA 및 유전자 들의 인터랙션 점수를 획득할 수도 있다.
실시예 1 - 상관관계에 기인한 가중치 연산
본 발명에 의한 컴퓨팅 장치(100)는 마이크로어레이 실험을 통해 얻어진 특정 miRNA와 특정 유전자의 발현 양상에 대한 상관관계 값을 획득하고, 특정 miRNA와 유사한 유사 miRNA와 특정 유전자 사이의 상관관계 값을 예측할 수 있다. 후술되는 도면을 참조하여, 유사 miRNA와 특정 유전자 사이의 상관관계 값의 연산에 대해 상세히 설명한다.
도 4는 유사도 데이터베이스를 이용하여 유사 miRNA 및 특정 유전자 사이의 상관관계 값을 연산하는 방법을 설명하기 위한 개념도이고, 도 5는 유사도 데이터베이스를 이용하여 유사 miRNA 및 유전자 사이의 상관관계 값을 연산하는 방법의 흐름도이다.
먼저, 마이크로어레이 실험을 통해 얻어진 유전자 발현 프로파일(Genes Expression Profiles) 및 miRNA 발현 프로파일(miRNAs Expression Profiles)을 포함하는 실험 데이터가 입력되면(S510), 제어부(140)는 입력된 실험 데이터를 기초로, 특정 miRNA와 특정 유전자 사이의 상관관계(Correlation)를 연산할 수 있다(S520).
우선적으로 마이크로어레이 실험에 대해 설명하면, 유전자 마이크로어레이(microarray)란, 생명체의 유전자 전체 또는 일부에 대해 유전자 발현 양을 측정할 수 있는 도구로서, DNA 마이크로어레이라고도 한다. 유전자 마이크로어레이의 도입으로 유전자의 관찰 능력이 개개 유전자 수준에서 생명체 전체로 확장되어, 생명체를 하나의 시스템으로 연구할 수 있다. 또한 유전자 마이크로어레이는 기본적으로 기존의 유전자 검출 기법을 병렬화해서 대규모로 수행하는 것이므로, 데이터를 처리하고 분석하는 방식에도 획기적인 변화를 가져왔다. 유전자 마이크로어레이의 수행 방법은 일반적으로 먼저 1㎠ 정도의 슬라이드 표면에 수천 내지 수만 종류의 유전자 서열을 고정시킨 후, 다양한 실험 조건에서 채취한 세포의 RNA를 추출하고 DNA로 역전사하여 형광 물질로 표지한다. 이어서, 표지된 DNA를 마이크로어레이에 혼성화(hybridization)시키고, 이를 스캐닝하여 이미지로 형상화한 후 이미지 분석 프로그램으로 유전자 위치마다 형광 물질에 따른 발색 강도를 측정함으로써, 유전자 발현 여부 및 발현 정도를 수학, 통계 그리고 컴퓨터 공학과 같은 정보학을 이용하여 정량화된 유전자 발현 수치 데이터와 대조 분석한다.
위와 같은 마이크로어레이 실험을 통해, 특정 miRNA와 특정 유전자 사이의 발현 정도가 수치화 될 수 있다. 특정 miRNA와 특정 유전자 사이의 상관관계는 피어슨 상관관계(Pearson's Correlation)로, 특정 유전자의 발현량 증가에 따른, 특정 miRNA의 발현량의 증감의 상대량을 나타내는 것일 수 있다.
이후, 컴퓨팅 장치(100)는 miRNA 유사도 데이터베이스(miRNA Similarity DataBase)를 이용하여 특정 miRNA와 유사한 유사 miRNA의 유사도값을 획득할 수 있다(S530). miRNA 유사도 데이터베이스는 miRNA 사이의 기능적 유사도를 수치화한 유사도 값을 포함할 수 있다. miRNA 유사도 데이터베이스는 이미 공지된 BLAST 또는 BLAT 툴을 통해 획득된 것일 수 있다.
이후, 컴퓨팅 장치(100)는 유사도 값을 이용하여 유사 miRNA와 특정 유전자 사이의 상관관계를 연산할 수 있다(S540). 유사 miRNA와 유전자 사이의 가중치를 연산하는 데에는 유사도 값을 이용한 선형 회귀 분석(Linear regression model)이 사용될 수 있다.
실시예 2 - miRNA 주변 영향력을 고려한 상관관계 연산
본 발명에 따른 컴퓨팅 장치(100)는 특정 miRNA와 클러스터를 형성하는 인접 miRNA에 대한 상관관계 값을 연산할 수도 있다. miRNA 들 사이의 영향력을 고려하여 상관관계 값을 연산하는 것에 대해서는 후술되는 도면을 참조하기로 한다.
도 6은 miRNA 클러스터 데이터베이스를 이용하여 인접 miRNA 및 특정 유전자 사이의 상관관계 값을 연산하는 방법을 설명하기 위한 개념도이고, 도 7은 miRNA 클러스터 데이터베이스를 이용하여 인접 miRNA 및 특정 유전자 사이의 가중치 값을 연산하는 방법의 흐름도이다.
먼저, 마이크로어레이 실험을 통해 얻어진 유전자 발현 프로파일(Genes Expression Profiles) 및 miRNA 발현 프로파일(miRNAs Expression Profiles)을 포함하는 실험 데이터가 입력되면(S710), 제어부(140)는 입력된 실험 데이터를 기초로, 특정 miRNA와 특정 유전자 사이의 상관관계(Correlation)를 연산할 수 있다(S720).
이후, 컴퓨팅 장치(100)는 miRNA 클러스터 데이터베이스(miRNA Cluster DataBase)를 이용하여 실험 데이터로 입력된 특정 miRNA와 영향력 있는 유효 거리 이내에 위치하는 인접 miRNA를 추출할 수 있다(S730). miRNA 클러스터 데이터베이스는 miRNA 들 사이의 거리 데이터를 포함하는 것으로, 컴퓨팅 장치(100)는 특정 miRNA과 10kb(kilobase) 이내에 위치하는 miRNA가 영향력 있는 유효 거리에 있는 것으로 판단할 수 있다. 다만, 유효 거리가 반드시 10kb로 설정되어야 하는 것은 아니며, 이는 선택에 따라 얼마든지 달라질 수 있다.
이후, 컴퓨팅 장치(100)는 특정 miRNA와 영향력 있는 유효 거리 이내에 인접 위치하는 인접 miRNA과 유전자 사이의 상관관계 값 연산할 수 있다(S740). 일예로, 도 6에 도시된 예에서, miRNAl이 miRNAi의 인접 miRNA일 경우, 컴퓨팅 장치(100)는 miRNAl-genem에 대한 상관관계 값을 연산할 수 있다.
실시예 3 - 전사인자( Transcription Factor )를 고려한 상관관계 연산
본 발명에 따른 컴퓨팅 장치(100)는 유전자들 사이의 전사인자를 고려하여 상관관계 값을 연산할 수 있다. 유전자들 사이의 전사인자를 고려하여 상관관계 값을 연산하는 것에 대해서는 후술되는 도면을 참조하기로 한다.
도 8은 전사인자 데이터베이스를 이용하여 특정 miRNA 및 전사조절 유전자 사이의 상관관계 값을 연산하는 방법을 설명하기 위한 개념도이고, 도 9는 전사인자 데이터베이스를 이용하여 특정 miRNA 및 전사조절 유전자 사이의 가중치 값을 연산하는 방법의 흐름도이다.
먼저, 마이크로어레이 실험을 통해 얻어진 유전자 발현 프로파일(Genes Expression Profiles) 및 miRNA 발현 프로파일(miRNAs Expression Profiles)을 포함하는 실험 데이터가 입력되면(S910), 제어부(140)는 입력된 실험 데이터를 기초로, 특정 miRNA와 특정 유전자 사이의 상관관계(Correlation)를 연산할 수 있다(S920).
이후, 컴퓨팅 장치(100)는 전사인자 데이터베이스(Transcription Factor DataBase)로부터 특정 유전자의 전사조절 부위 DNA에 특이절으로 결합하여 특정 유전자의 전사를 활성화시키거나 억제하는 전사조절 유전자의 존부를 확인할 수 있다(S930).
특정 유전자의 전사조절 유전자가 존재하면, 컴퓨팅 장치(100)는 전사조절 유전자와 miRNA 사이의 상관관계 값을 연산할 수 있다(S940). 일예로, 도 8에 도시된 예에서, genem의 전사조절 유전자가 genen 인 경우, 컴퓨팅 장치(100)는 miRNAa-genen 사이의 상관관계 값을 기초로, miRNAa-genem 사이의 상관관계 값을 연산할 수 있다.
실시예 1-3을 통해 연산된 상관관계 값을 기초로, 컴퓨팅 장치(100)는 유사 miRNA의 유전자에 대한 인터랙션 점수, 인접 miRNA의 유전자에 대한 인터랙션 점수, 전사조절 유전자의 miRNA에 대한 인터랙션 점수를 연산할 수 있다.
마이크로 RNA 표적 유전자 분석 알고리즘을 통해 miRNA-유전자 사이의 인터랙션 점수가 도출되면, 컴퓨팅 장치(100)는 차등 발현 유전자 분석 알고리즘을 이용한 췌장암 환자의 특이 발현 유전자 목록을 이용하여 바이오마커를 검출할 수 있다.
상술한 바이오마커 발굴용 통합 분석 알고리즘을 기초로 췌장암 환자용 바이오마커를 분석하는 방법에 대해 상세히 설명한다.
도 10은 바이오마커 발굴용 통합 분석 알고리즘을 기초로 췌장암 환자용 바이오마커를 발굴하는 방법의 흐름도이다. 설명의 편의를 위해, 컴퓨팅 장치(100)는 이후, 컴퓨팅 장치(100)는 차등 발현 유전자 분석 알고리즘을 이용한 췌장암 환자에게서 정상인과 다르게 특이발현(예컨대, 과발현 또는 저발현)되는 유전자 목록을 저장하고 있는 상태라 가정한다.
도 10을 참조하면, 컴퓨팅 장치(100)는 마이크로 RNA 표적 유전자 분석 알고리즘을 이용하여 miRNA-유전자 사이의 인터랙션 점수를 연산할 수 있다(S1010). 인터랙션 점수를 연산하는 단계는 앞서 도 4 내지 도 9를 통해 설명한 바와 같으므로, 이에 대한 상세한 설명은 생략한다.
이후, 컴퓨팅 장치(100)는 인터랙션 점수가 상위 n 번째 이내인 miRNA-유전자 페어를 선택하고(S1020), 선택된 miRNA-유전자 페어에서의 유전자와 차등 발현 유전자 분석 알고리즘을 기초로 췌장암 환자에게서 정상인과 다르게 특이발현되는 유전자 목록의 교집합을 췌장암 진단용 바이오마커로 결정할 수 있다(S1030). 즉, 인터랙션 점수가 높으면서 차등 발현 유전자 분석 알고리즘에서도 췌장암 환자에게서 정상인과 다르게 특이발현되는 유전자를 췌장암 진단용 바이오마커로 결정할 수 있다.
또 다른 예로, 컴퓨팅 장치(100)는 miRNA-유전자 페어의 인터랙션 점수가 높은 순으로 m 개의 유전자를 결정하고, 차등 발현 유전자 분석 알고리즘을 기초로 췌장암 환자에게서 정상인과 다르게 특이발현되는 유전자 목록의 교집합을 췌장암 진단용 바이오마커로 결정할 수도 있다.
miRNA 예측 툴로, Targetscan, miRDB, DIANA-microT, PITA, miRanda, MicroCosm 의 6개를 이용하고, miRNA-유전자 페어의 인터랙션 점수 중 상위 n 개의 유전자(q-value가 0.05 이하이면서 동시에 상관관계 값이 -0.5 이하)를 산정하였을 때, ANO1, C19orf33, EIF4E2, FAM108C1, IL1B, ITGA2, KLF5, LAMB3, MLPH, MMP11, MSLN, SFN, SOX4, TMPRSS4, TRIM29 및 TSPAN1이 췌장암 진단용 바이오마커로 결정될 수 있다.
상술한 바이오마커의 개별적인 특징은 다음과 같다.
ANO1(anoctamin 1, calcium activated chloride channel)는 칼슘 활성화된 클로라이드 채널로서 작용한다.
C19orf33(chromosome 19 open reading frame 33)는 인간 염색체 19번에 위치한 유전자로서, 기능은 아직 알려지지 않았다.
EIF4E2(eukaryotic translation initiation factor 4E family member 2)는 단백질 합성의 시작에서 초기 단계 동안 7-메틸구아노신-함유 mRNA 캡을 인식하고 결합하고, mRNA의 이차 구조의 풀림을 유도함으로써 라이보좀(ribosome) 결합을 용이하게 한다.
FAM108C1(family with sequence similarity 108, member C1)은 세린-유형 펩티다아제 활성 및 가수분해효소 활성을 갖는다.
IL1B(interleukin 1, beta)는 활성화된 마크로파지에 의해 생성되고, IL-1은 IL-2 방출, B-세포 성숙 및 증식 및 섬유아세포(fibroblast) 성장 인자 활성을 유도함으로써 흉선세포(thymocyte) 증식을 자극한다. IL-1 단백질은 염증 반응에 관여되고, 내생성 발열인자로서 확인되고, 활막세포(synovial cell)로부터 프로스타글란딘 및 콜라게나아제의 방출을 자극하는 것으로 보고된다.
ITGA2(integrin, alpha 2 (CD49B, alpha 2 subunit of VLA-2 receptor))는 라미닌, 콜라겐, 콜라겐 C-프로펩타이드, 파이브로넥틴 및 E-카드헤린에 대한 수용체인 인테그린 알파-2/베타-1이다. 콜라겐에서 프롤린-하이드록실화된 서열 G-F-P-G-E-R로 인식된다. 혈소판 및 다른 세포의 콜라겐으로 부착, 콜라겐 및 콜라게나아제 유전자 발현의 조정, 힘 발생 및 새로 합성된 세포외 기질의 구성을 담당한다.
KLF5(Kruppel-like factor 5(intestinal))는 GC 박스 프로모터 구성요소에 결합하는 전사인자다. 이들 유전자의 전사를 활성화시킨다.
LAMB3(laminin, beta 3)은 높은 친화도 수용체를 통해 세포에 결합하고, 라미닌은 다른 세포외 기질 성분과 상호작용함으로써 배아 발달 동안 조직으로 세포의 부착, 이동 및 구성을 매개하는 것으로 여겨진다.
MLPH(melanophilin)는 멜라노좀(melanosome) 수송에 관여하는 Rab 이펙터(effector) 단백질이다.
MMP11(matrix metallopeptidase 11(stromelysin 3))은 상피 악성종양의 진행에 중요한 역할을 한다.
MSLN(mesothelin)은 막-고정된 형태는 세포 부착에서 역할을 할 수 있다.
SFN(stratifin)은 1) G2/M 진행의 p53-조절된 억제제이고, 2) 일반적인 신호 전달 경로 및 특수한 신호전달 경로 둘 다에서 다양한 조절에 연루된 어댑터(adapter) 단백질이다. 보통 포스포세린 또는 포스포트레오닌 모티프를 인식함으로써 수많은 파트너에 결합한다. 결합은 일반적으로 결합 파트너의 활성을 조정하는 결과를 야기한다. KRT17에 결합한 경우, Akt/mTOR 경로를 자극함으로써 단백질 합성 및 상피 세포 성장을 조절한다.
SOX4(SRY (sex determining region Y)-box 4)는 T-세포 인핸서(enhancer) 모티프인 5'-AACAAAG-3' 모티프에 높은 친화도로 결합하는 전사 활성자이다.
TMPRSS4(transmembrane protease, serine 4)는 단백질 분해효소(protease)일 것이다. ENaC를 활성화시킬 수 있는 것으로 보인다.
TRIM29(tripartite motif-containing 29)는 운동 실조 모세관 확장증(AT, ataxia telangiectasia) 섬유아세포 세포주의 방사능 감수성 결함을 보충할 수 있다.
TSPAN1(tetraspanin 1)은 세포 발달, 활성화, 성장 및 이동의 조절에 역할을 하는 신호 전달 사건을 매개한다.
상기 결과에 의해 획득된 췌장암 진단용 바이오마커의 실험 과정 및 결과에 대해 상세히 설명한다.
췌장암 환자 샘플 및 마이크로어레이 실험
모든 작업은 미국 캘리포니아대학교 로스앤젤러스 캠퍼스(UCLA) 연구소의 임상시험심사위원회(Institutional Review Board)의 승인을 얻어 수행되었다. 3개의 독립적이고 겹치지 않는 환자 집단이 이 연구에 사용되었다. 수술시 스냅 동결된 42개의 PDAC 종양 및 7개의 양성 췌장 샘플의 시작 테스트 집단이 마이크로어레이에 사용되었다. 이들 중, 종양 세포를 30% 이상 함유한 샘플만이, 활동중인 위장관 병리학자(DWD)에 의해 대표적인 헤마톡시린 및 에오신(H&E, hematoxylin and eosin) 선택으로 결정된 최종 멀티플랫폼 분석(n = 25)을 위해 선택되었다. 두 번째 환자 그룹(n = 42)은 포르말린 고정된 파라핀-엠베디드(FFPE) 조직 블록으로부터 단리되고, 정량 PCR(qPCR)을 위한 확인 집단으로 사용되는 종양이다. 세 번째 환자 그룹 데이터 세트(n = 148)는 면역조직화학(IHC, immunohistochemistry) 확인 집단으로서 사용되는 TMA(tissue microarray) 상의 종양이다. 각 환자 집단에 대한 모든 임상병리 및 생존 정보는 장래에 유지되는 췌장 환자의 UCLA 수술 데이터베이스로부터 추출되었다. 질환 유병율은 생검, 방사선 증거 또는 사망에 의거하여 판정되었다. 전자 의료 기록이 관련된 임상적 및 병리적 특징뿐만 아니라, 질환 관련성 없는(disease-free) 생존 및 질환 특이적 생존(DSS)을 결정하기 위해 사용되었다. 사회 안전 죽음 지수의 조사는 전체 생존율을 결정하기 위해 사용되었다. 조직 마이크로어레이(TMA) 집단의 생존 분석은 전체 생존에 대해 한정되었다. 질병 관련성 없는, 질병 특이적 및 전체 생존 시간이 마이크로어레이 및 qPCR 확인 집단에 대해 조사되었다. 생존 간격은 수술 날짜로부터 확인된 사망 또는 가장 최근의 환자 연락 날짜까지 계산되었다(Clinical Cancer Research, Vol. 18, No. 5, 1352-1363.).
본 발명의 바이오마커 세트의 검증
본 발명의 바이오마커 세트의 췌장암 판정의 검증은 췌장암 환자 84명 및 정상인 84명으로 총 168명을 대상으로 하였다. 상기 대상으로부터 채취한 혈액을 이용하여, GEO(Gene Expression Omnibus) 데이터 GSE28735 및 GSE15471을 사용하여 주성분 분석(principal component analysis) 및 계층적 군집분석 방법(hierarchical clustering, euclidean distance, complete method)으로 판정하였다.
그 결과, 췌장암에 대한 민감도(sensitivity)가 83%(70/84) 및 특이도(specificity)가 81%(68/84)로 나타났다. 도 11 및 도 12는 각각 데이터 GSE28735을 이용하였을 때의 주성분 분석 결과를 플롯(Plot)한 도면 및 계층적 군집분석 결과를 히트 맵(Heat map)으로 도시한 도면이고, 도 13 및 도 14는 각각 데이터 GSE15471을 이용하였을 때의 주성분 분석 결과를 플롯한 도면 및 계층적 군집분석 결과를 히트 맵으로 도시한 도면이다. 도 11 및 도 13에서 가로축의 component 1은 제 1 주성분(PC 1)을 의미하고, 세로축의 component 2는 제 2 주성분(PC 2)을 의미할 수 있다. 나아가, 삼각형으로 표현된 개체는 암환자를 의미하고, 원으로 표현된 객체는 정상인을 의미하는 것일 수 있다. 도 12 및 도 14에서 히트 맵 상단에 위치한 붉은색 바(Bar)는 암환자를 의미하고, 파란색 바는 정상인을 의미할 수 있다.
본 발명의 일실시예에 의하면, 전술한 방법들은, 프로그램이 기록된 매체에 프로세서가 읽을 수 있는 코드로서 구현하는 것이 가능하다. 프로세서가 읽을 수 있는 매체의 예로는, ROM, RAM, CD-ROM, 자기 테이프, 플로피 디스크, 광 데이터 저장장치 등이 있으며, 캐리어 웨이브(예를 들어, 인터넷을 통한 전송)의 형태로 구현되는 것도 포함한다.
상기와 같이 설명된 컴퓨팅 장치(100)는 상기 설명된 실시예들의 구성과 방법이 한정되게 적용될 수 있는 것이 아니라, 상기 실시예들은 다양한 변형이 이루어질 수 있도록 각 실시예들의 전부 또는 일부가 선택적으로 조합되어 구성될 수도 있다.
100 : 컴퓨팅 장치
110 : 저장부
120 : 사용자 입력부
130 : 통신부
140 : 제어부
150 : 디스플레이부

Claims (10)

  1. 삭제
  2. 마이크로 RNA들 및 유전자들 사이의 상보 결합 정도를 수치화한 인터랙션 점수들을 연산하는 단계;
    상기 인터랙션 점수들 중 특정 점수보다 높은 인터랙션 점수를 가지는 n 개의 마이크로 RNA-유전자 페어들을 결정하는 단계; 및
    췌장암 환자에게 특이발현되는 유전자 또는 상기 n 개의 마이크로 RNA-유전자 페어들로부터 상기 췌장암 환자에서 특이발현되는 상기 유전자와 페어를 이루는 마이크로 RNA와 공통되는 유전자를 바이오 마커로 추출하는 단계;를 포함하고,
    상기 인터랙션 점수들을 연산하는 단계는,
    상기 마이크로 RNA들 및 상기 유전자들 사이의 예측 점수로부터 통계적으로 획득된 데이터 베이스들을 획득하는 단계;
    상기 예측 점수들로부터 정규화된 점수들을 연산하는 단계;
    상기 정규화된 점수들을 기초로, 각 유전자에 대한 상기 마이크로 RNA들의 제1 결합 순위 및 각 마이크로 RNA에 대한 상기 유전자들의 제2 결합 순위를 연산하는 단계; 및
    상기 연산된 제1 및 제2 결합 순위를 기초로, 상기 인터랙션 점수들을 연산하는 단계;를 포함하고,
    상기 정규화된 점수들 각각은, 상기 데이터 베이스들 내의 마이크로 RNA-유전자 페어들의 예측 점수의 순위를 기초로 연산되는 것을 특징으로 하는 췌장암 진단용 바이오마커 추출 방법.
  3. 삭제
  4. 제 2 항에 있어서,
    상기 데이터 베이스들은, 마이크로 RNA 타겟 예측 툴을 이용하여 생성되는 것을 특징으로 하는 췌장암 진단용 바이오마커 추출 방법.
  5. 제 4 항에 있어서,
    상기 마이크로 RNA 타겟 예측 툴은 Targetscan, miRDB, DIANA-microT, PITA, miRanda MicroCosm, RNAhybrid, PicTar 및 RNA22 중 적어도 하나를 포함하는 것을 특징으로 하는 췌장암 진단용 바이오마커 추출 방법.
  6. 삭제
  7. 제 2 항에 있어서,
    상기 정규화된 점수들 각각은, 하기 수학식에 의거 연산되는 것을 특징으로 하는 췌장암 진단용 바이오마커 추출 방법.
    [수학식]
    Figure 112019046184366-pat00003

    (i는 i번째 데이터 베이스, n은 데이터 베이스의 개수, Ti는 i번째 데이터 베이스에서 마이크로 RNA-유전자 페어의 총 개수, Ri,j는 i번째 데이터베이스에서, j번째 마이크로 RNA-유전자 페어의 예측 점수 순위를 의미함)
  8. 삭제
  9. 제 2 항에 있어서,
    상기 인터랙션 점수들 각각은, 하기 수학식에 의거 연산되는 것을 특징으로 하는 췌장암 진단용 바이오마커 추출 방법.
    [수학식]
    Figure 112019046184366-pat00004

    (tmi는 i번째 마이크로 RNA의 유전자와의 페어의 수(number of microRNAi-gene), tgj는 j번째 유전자의 마이크로 RNA와의 페어의 수(number of genej-microRNA), rmi는 j번째 유전자에 대한 i번째 마이크로 RNA의 정규화 점수 순위, rgj는 i번째 마이크로 RNA에 대한 j번째 유전자의 정규화 점수 순위를 의미함)
  10. 데이터를 저장하기 위한 저장부; 및
    연산을 위한 제어부를 포함하고,
    상기 제어부는,
    마이크로 RNA들 및 유전자들 사이의 상보 결합 정도를 수치화한 인터랙션 점수들을 연산하고, 상기 인터랙션 점수들 중 특정 점수보다 높은 인터랙션 점수를 가지는 n 개의 마이크로 RNA-유전자 페어들을 결정하며, 췌장암 환자에게 특이발현되는 유전자 또는 상기 n 개의 마이크로 RNA-유전자 페어들로부터 상기 췌장암 환자에서 특이발현되는 상기 유전자와 페어를 이루는 마이크로 RNA와 공통되는 유전자를 바이오 마커로 추출하고,
    상기 제어부는,
    상기 마이크로 RNA들 및 상기 유전자들 사이의 예측 점수로부터 통계적으로 획득된 데이터 베이스들을 획득하고, 상기 예측 점수들로부터 정규화된 점수들을 연산하고, 상기 정규화된 점수들을 기초로, 각 유전자에 대한 상기 마이크로 RNA들의 제1 결합 순위 및 각 마이크로 RNA에 대한 상기 유전자들의 제2 결합 순위를 연산하며, 상기 연산된 제1 및 제2 결합 순위를 기초로, 상기 인터랙션 점수들을 연산함으로써, 상기 인터랙션 점수들을 연산하고,
    상기 정규화된 점수들 각각은,
    상기 데이터 베이스들 내의 마이크로 RNA-유전자 페어들의 예측 점수의 순위를 기초로 연산되는 것을 특징으로 하는 컴퓨터 장치.
KR1020130042329A 2013-04-17 2013-04-17 췌장암 진단용 바이오마커, 이를 위한 컴퓨팅 장치 및 이의 제어 방법 KR102058996B1 (ko)

Priority Applications (4)

Application Number Priority Date Filing Date Title
KR1020130042329A KR102058996B1 (ko) 2013-04-17 2013-04-17 췌장암 진단용 바이오마커, 이를 위한 컴퓨팅 장치 및 이의 제어 방법
US14/784,550 US20160055297A1 (en) 2013-04-17 2014-04-16 Method for extracting biomarker for diagnosing pancreatic cancer, computing device therefor, biomarker for diagnosing pancreatic cancer and device for diagnosing pancreatic cancer including the same
PCT/KR2014/003300 WO2014171730A1 (en) 2013-04-17 2014-04-16 Method for extracting biomarker for diagnosing pancreatic cancer, computing device therefor, biomarker for diagnosing pancreatic cancer and device for diagnosing pancreatic cancer including the same
CN201480019133.1A CN105102637B (zh) 2013-04-17 2014-04-16 提取胰腺癌诊断生物标志物的方法、用于该方法的计算装置、胰腺癌诊断生物标志物以及包含该生物标志物的胰腺癌诊断装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
KR1020130042329A KR102058996B1 (ko) 2013-04-17 2013-04-17 췌장암 진단용 바이오마커, 이를 위한 컴퓨팅 장치 및 이의 제어 방법

Publications (2)

Publication Number Publication Date
KR20140124601A KR20140124601A (ko) 2014-10-27
KR102058996B1 true KR102058996B1 (ko) 2019-12-24

Family

ID=51994788

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020130042329A KR102058996B1 (ko) 2013-04-17 2013-04-17 췌장암 진단용 바이오마커, 이를 위한 컴퓨팅 장치 및 이의 제어 방법

Country Status (1)

Country Link
KR (1) KR102058996B1 (ko)

Families Citing this family (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US11187696B2 (en) 2015-08-18 2021-11-30 Korea Institute Of Radiological & Medical Sciences Pharmaceutical composition for treating or preventing obesity
CN112599202B (zh) * 2020-12-24 2024-04-26 南华大学 疾病相关miRNA预测***
CN114566218B (zh) * 2022-03-16 2022-10-25 皖南医学院第一附属医院(皖南医学院弋矶山医院) 快速筛选人源hsa-miR-576-3p与启动子结合靶点的方法

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2006024283A2 (de) 2004-08-31 2006-03-09 Technische Universität Dresden Verbindungen und methoden zur behandlung, diagnose und prognose bei pankreaserkrankungen
US20120196764A1 (en) 2009-06-25 2012-08-02 The Regents Of The University Of California Salivary transcriptomic and microbial biomarkers for pancreatic cancer
WO2012155918A2 (en) 2011-05-17 2012-11-22 Herlev Hospital Microrna biomarkers for prognosis of patients with pancreatic cancer
US20130072393A1 (en) 2009-12-24 2013-03-21 Micromedmark Biotech Co., Ltd. Pancreatic cancer markers, and detecting methods, kits, biochips thereof

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR101343616B1 (ko) * 2010-10-08 2013-12-20 연세대학교 산학협력단 췌장암 치료용 약제학적 조성물 및 췌장암 치료제 스크리닝 방법

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2006024283A2 (de) 2004-08-31 2006-03-09 Technische Universität Dresden Verbindungen und methoden zur behandlung, diagnose und prognose bei pankreaserkrankungen
WO2006024283A3 (de) 2004-08-31 2006-08-31 Univ Dresden Tech Verbindungen und methoden zur behandlung, diagnose und prognose bei pankreaserkrankungen
US20120196764A1 (en) 2009-06-25 2012-08-02 The Regents Of The University Of California Salivary transcriptomic and microbial biomarkers for pancreatic cancer
US20130072393A1 (en) 2009-12-24 2013-03-21 Micromedmark Biotech Co., Ltd. Pancreatic cancer markers, and detecting methods, kits, biochips thereof
WO2012155918A2 (en) 2011-05-17 2012-11-22 Herlev Hospital Microrna biomarkers for prognosis of patients with pancreatic cancer

Non-Patent Citations (5)

* Cited by examiner, † Cited by third party
Title
AE Szafranska et al, Oncogene (2007), vol 26, pp 4442-4452.
Akira Mori et al, Mol Cancer Res (2009), vol 7, no 8, pp 1390-1398.
Andrea Bisognin et al, Nucleic Acids Research (2012), vol 40, Web Server issue, pp W13-W21.
Yang et al, Chinese Science Bulletin (2010), vol 55, no 31, pp 3576-3589.
Zhang et al, Bioinformatics (2011), vol 27, no 13, pp i401-i409.

Also Published As

Publication number Publication date
KR20140124601A (ko) 2014-10-27

Similar Documents

Publication Publication Date Title
US20160055297A1 (en) Method for extracting biomarker for diagnosing pancreatic cancer, computing device therefor, biomarker for diagnosing pancreatic cancer and device for diagnosing pancreatic cancer including the same
CN111128299B (zh) 一种结直肠癌预后显著相关ceRNA调控网络的构建方法
CN103562409B (zh) 肺癌的生物标志物
JP2024016039A (ja) 相同組換え欠損を推定するための統合された機械学習フレームワーク
CN106834462B (zh) 一组胃癌基因的应用
JP2021521536A (ja) 生体試料の多検体アッセイのための機械学習実装
Schramm et al. Review and cross-validation of gene expression signatures and melanoma prognosis
CN105074005A (zh) 使用靶基因表达的线性组合评价细胞信号传导途径活性
CN105121665A (zh) 使用多重细胞信号传导途径活性的治疗应答的医学预后和预测
US20110224908A1 (en) Gene signature for diagnosis and prognosis of breast cancer and ovarian cancer
US20230175058A1 (en) Methods and systems for abnormality detection in the patterns of nucleic acids
CN104140967A (zh) 与结直肠癌肝转移相关的长链非编码rna clmat1及其应用
KR102058996B1 (ko) 췌장암 진단용 바이오마커, 이를 위한 컴퓨팅 장치 및 이의 제어 방법
Shi et al. LncRNA CADM1-AS1 serves as a new prognostic biomarker for gastric cancer.
Butz Circulating Noncoding RNAs in Pituitary Neuroendocrine Tumors—Two Sides of the Same Coin
Sfakianakis et al. On the identification of circulating tumor cells in breast cancer
Liu et al. Pan-cancer analysis predicts FOXS1 as a key target in prognosis and tumor immunotherapy
Morgan et al. Long non-coding RNAs and their potential impact on diagnosis, prognosis, and therapy in prostate cancer: Racial, ethnic, and geographical considerations
Kim et al. Statistical methods of translating microarray data into clinically relevant diagnostic information in colorectal cancer
KR102161511B1 (ko) 담도암 진단용 바이오마커의 추출 방법, 이를 위한 컴퓨팅 장치, 담도암 진단용 바이오마커 및 이를 포함하는 담도암 진단 장치
CN113234823B (zh) 胰腺癌预后风险评估模型及其应用
KR102138517B1 (ko) 췌장암 진단용 바이오마커의 추출 방법, 이를 위한 컴퓨팅 장치, 췌장암 진단용 바이오마커 및 이를 포함하는 췌장암 진단 장치
Jing et al. Clinical significance and potential regulatory mechanisms of serum response factor in 1118 cases of thyroid cancer based on gene chip and RNA-sequencing data
US20190385696A1 (en) Method for predicting disease risk based on analysis of complex genetic information
Gevaert et al. Prediction of cancer outcome using DNA microarray technology: past, present and future

Legal Events

Date Code Title Description
N231 Notification of change of applicant
A201 Request for examination
E902 Notification of reason for refusal
E701 Decision to grant or registration of patent right
GRNT Written decision to grant