KR20220006268A - Apparaus and method for designing primer for target pathogen - Google Patents

Apparaus and method for designing primer for target pathogen Download PDF

Info

Publication number
KR20220006268A
KR20220006268A KR1020200084026A KR20200084026A KR20220006268A KR 20220006268 A KR20220006268 A KR 20220006268A KR 1020200084026 A KR1020200084026 A KR 1020200084026A KR 20200084026 A KR20200084026 A KR 20200084026A KR 20220006268 A KR20220006268 A KR 20220006268A
Authority
KR
South Korea
Prior art keywords
primer
site
score
nucleotide sequence
target pathogen
Prior art date
Application number
KR1020200084026A
Other languages
Korean (ko)
Other versions
KR102440175B1 (en
Inventor
김민진
강병규
Original Assignee
제노플랜코리아 주식회사
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 제노플랜코리아 주식회사 filed Critical 제노플랜코리아 주식회사
Priority to KR1020200084026A priority Critical patent/KR102440175B1/en
Publication of KR20220006268A publication Critical patent/KR20220006268A/en
Application granted granted Critical
Publication of KR102440175B1 publication Critical patent/KR102440175B1/en

Links

Images

Classifications

    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B25/00ICT specially adapted for hybridisation; ICT specially adapted for gene or protein expression
    • G16B25/30Microarray design
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N20/00Machine learning
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B20/00ICT specially adapted for functional genomics or proteomics, e.g. genotype-phenotype associations
    • G16B20/20Allele or variant detection, e.g. single nucleotide polymorphism [SNP] detection
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B20/00ICT specially adapted for functional genomics or proteomics, e.g. genotype-phenotype associations
    • G16B20/30Detection of binding sites or motifs
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B5/00ICT specially adapted for modelling or simulations in systems biology, e.g. gene-regulatory networks, protein interaction networks or metabolic networks

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Health & Medical Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Theoretical Computer Science (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Molecular Biology (AREA)
  • General Health & Medical Sciences (AREA)
  • Medical Informatics (AREA)
  • Biophysics (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Biotechnology (AREA)
  • Evolutionary Biology (AREA)
  • Spectroscopy & Molecular Physics (AREA)
  • Genetics & Genomics (AREA)
  • Software Systems (AREA)
  • Artificial Intelligence (AREA)
  • Mathematical Physics (AREA)
  • Analytical Chemistry (AREA)
  • Chemical & Material Sciences (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • Data Mining & Analysis (AREA)
  • Evolutionary Computation (AREA)
  • Computing Systems (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Computational Linguistics (AREA)
  • Biomedical Technology (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Physiology (AREA)
  • Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)

Abstract

The present invention relates to a method for designing a primer for detecting a target pathogen, which designs a primer set specifically detecting a target pathogen, and an apparatus thereof. According to one embodiment of the present invention, the method comprises the following steps: collecting nucleic acid sequence information of a target pathogen; comparing the nucleic acid sequence of the target pathogen with nucleic acid sequences of humans and at least one other pathogen to calculate an independence score for at least one region forming the nucleic acid sequence of the target pathogen; comparing a first site having the calculated independence score equal to or greater than a predetermined first score with a corresponding site of the nucleic acid sequence of at least one mutant pathogen of the target pathogen to calculate a conservation score for the first site; and designing at least one primer set for detecting the target pathogen on the basis of the nucleic acid sequence of a second site in which the calculated conservation score is equal to or greater than a predetermined second score.

Description

목표 병원체를 검출하기 위한 프라이머의 설계 방법 및 장치{APPARAUS AND METHOD FOR DESIGNING PRIMER FOR TARGET PATHOGEN}Design method and apparatus of a primer for detecting a target pathogen

본 개시(disclosure)는 프라이머의 설계 방법 및 장치에 관한 것으로, 보다 상세하게는, 목표 병원체를 특이적으로 검출하기 위한 프라이머의 설계 방법 및 장치에 관한 것이다. The present disclosure relates to a method and apparatus for designing a primer, and more particularly, to a method and apparatus for designing a primer for specifically detecting a target pathogen.

인간의 게놈 지도가 완성됨에 따라 질병에 대한 위험도 측정, 질병의 진단 또는 예진, 및 약물에 대한 반응의 예측을 보다 광범위하게 할 수 있다는 가능성이 제시되었고, 최근에는 다양한 유전자들에 대한 기능들이 밝혀지고 있다.As the human genome map is completed, the possibility of measuring the risk of a disease, diagnosing or prognosis of a disease, and predicting a response to a drug more broadly has been suggested. have.

이러한 다양한 유전자들에 대한 기능 규명에 따라 생명체에 질병 또는 감염을 일으키는 다른 병원체, 예를 들어, 바이러스 등의 유전자 변이 분석을 통하여 해당 바이러스가 특정 치료 약물에 대해 내성을 갖는지 여부를 분석할 수 있고, 이러한 유전자형 분석을 통하여 병원체의 특정 치료 약물에 대한 반응을 예측함으로써 환자 개인별 맞춤형 치료방법을 개발할 수 있다.According to the functional identification of these various genes, it is possible to analyze whether the virus has resistance to a specific therapeutic drug through gene mutation analysis of other pathogens that cause disease or infection in living things, for example, viruses, Through this genotyping analysis, it is possible to develop a personalized treatment method for each patient by predicting the response of a pathogen to a specific therapeutic drug.

한편, 인간을 비롯한 생명체의 유전자 변이와 질병과의 관계를 명확하게 규명하기 위해서는 염기 서열 정보를 분석하여야 할 뿐만 아니라, 서열의 변이들을 특이도 및 민감도를 모두 만족시키면서 정확하고 효과적으로 분석할 수 있어야 한다. 특히, 최근에는 감염병을 매개하는 종의 다양한 유전체 서열이 보고됨에 따라서 변이종을 고려한 진단용 유전자증폭용 프라이머의 설계가 핵심적인 기술로 부각되고 있는 실정이다.On the other hand, in order to clearly identify the relationship between genetic mutations and diseases in living organisms including humans, it is necessary to not only analyze nucleotide sequence information, but also to accurately and effectively analyze sequence mutations while satisfying both specificity and sensitivity. . In particular, recently, as various genome sequences of species mediating infectious diseases have been reported, the design of a diagnostic primer for gene amplification in consideration of a mutant species is emerging as a key technology.

일반적으로 분자유전학적 분석이나 임상진단을 위하여 찾고자 하는 DNA 또는 RNA 염기서열은 DNA 중합효소를 이용한 중합효소 연쇄반응 방법(이하, "PCR"이라 함)을 이용하여 증폭한 후, 샘플 내에 그 존재여부를 결정하게 된다. PCR 기술을 이용하여 샘플 내에 찾고자 하는 DNA 또는 RNA 염기 서열, 즉 표적 뉴클레오티드가 존재하는지 여부를 검출하는 다양한 방법들이 개발되어 있다.In general, the DNA or RNA base sequence to be found for molecular genetic analysis or clinical diagnosis is amplified using a polymerase chain reaction method (hereinafter referred to as "PCR") using a DNA polymerase, and then whether it exists in the sample will decide Various methods have been developed for detecting whether a DNA or RNA nucleotide sequence to be found, ie, a target nucleotide, is present in a sample using PCR technology.

이와 같이, PCR을 통해 각종 질병의 원인을 진단하기 위해서는 원인이 되는 유전자나 질병 매개종(strain)의 유전 정보를 바탕으로 한 진단용 프라이머 설계가 매우 중요하다. As described above, in order to diagnose the cause of various diseases through PCR, it is very important to design a diagnostic primer based on genetic information of a causative gene or a disease strain.

그런데, 기존의 프라이머에 대한 설계 방식은 신규한 병원체의 발생 시 이를 검출하기 위한 프라이머를 신속하고 자동적으로 설계하지 못하며, 특히, 코로나 바이러스와 같이 유전자에 돌연변이가 빈번히 발생하는 병원체에 적합한 프라이머를 신속히 설계할 수 없는 한계를 가지고 있었다. 더하여, 설계된 프라이머의 검출 성능을 오로지 실제 증폭 실험을 통해서만 확인을 가능함으로 인해, 병원체의 검출에 적합한 프라이머의 선택에 많은 시간이 소요된다는 문제점 또한 가지고 있었다.However, the existing primer design method cannot quickly and automatically design a primer for detecting the occurrence of a new pathogen. There were limits to what I could do. In addition, since the detection performance of the designed primer can be confirmed only through an actual amplification experiment, there is also a problem that it takes a lot of time to select a primer suitable for the detection of a pathogen.

본 개시의 일 실시예에 따른 프라이머의 설계 방법 및 장치가 이루고자 하는 기술적 과제는, 목표 병원체를 특이적으로 검출하는 프라이머 세트를 설계하고, 각 프라이머 세트의 목표 병원체에 대한 검출 성능을 미리 예측할 수 있도록 하는데 있다.A technical problem to be achieved by the method and apparatus for designing a primer according to an embodiment of the present disclosure is to design a primer set that specifically detects a target pathogen, and to predict the detection performance of each primer set for the target pathogen in advance. is doing

본 개시의 일 실시예에 따른 프라이머의 설계 방법 및 장치가 이루고자 하는 기술적 과제는 이상에서 언급한 과제로 제한되지 않으며, 언급되지 않은 또 다른 과제는 아래의 기재로부터 당업자에게 명확하게 이해될 수 있을 것이다.The technical problem to be achieved by the primer design method and apparatus according to an embodiment of the present disclosure is not limited to the above-mentioned tasks, and another task not mentioned will be clearly understood by those skilled in the art from the following description. .

본 개시의 일 실시예에 따른 프라이머의 설계 방법은, 목표 병원체의 염기 서열 정보를 수집하는 단계; 상기 목표 병원체의 염기 서열을 인간 및 적어도 하나의 다른 병원체의 염기 서열과 비교하여 상기 목표 병원체의 염기 서열을 구성하는 적어도 하나의 부위에 대하여 독립성 점수(Independence score)를 산출하는 단계; 산출된 상기 독립성 점수가 소정의 제 1 점수 이상인 제 1 부위를 상기 목표 병원체의 적어도 하나의 변이 병원체의 염기 서열의 대응 부위와 비교하여 상기 제 1 부위에 대한 보존성 점수(conserve score)를 산출하는 단계; 및 산출된 상기 보존성 점수가 소정의 제 2 점수 이상인 제 2 부위의 염기 서열을 기초로, 상기 목표 병원체를 검출하기 위한 적어도 하나의 프라이머 세트를 설계하는 단계를 포함할 수 있다. A primer design method according to an embodiment of the present disclosure includes collecting nucleotide sequence information of a target pathogen; comparing the nucleotide sequence of the target pathogen with the nucleotide sequences of humans and at least one other pathogen to calculate an independence score for at least one region constituting the nucleotide sequence of the target pathogen; Comparing the first site having the calculated independence score equal to or greater than a predetermined first score with the corresponding site of the nucleotide sequence of at least one mutant pathogen of the target pathogen, calculating a conservation score for the first site ; and designing at least one primer set for detecting the target pathogen based on the nucleotide sequence of the second site in which the calculated conservation score is equal to or greater than a predetermined second score.

일 실시예에서, 상기 독립성 점수를 산출하는 단계는, 상기 적어도 하나의 부위에 대하여 상기 인간 및 상기 적어도 하나의 다른 병원체의 염기 서열과 불일치 정도를 소정의 기준에 따라 점수화함으로써 수행될 수 있다. In an embodiment, the calculating of the independence score may be performed by scoring the degree of mismatch with the nucleotide sequence of the human and the at least one other pathogen with respect to the at least one site according to a predetermined criterion.

일 실시예에서, 상기 보존성 점수를 산출하는 단계는, 상기 제 1 부위에 대하여 상기 적어도 하나의 변이 병원체의 염기 서열의 대응 부위와 일치 정도를 소정의 기준에 따라 점수화함으로써 수행될 수 있다.In an embodiment, the calculating of the conservation score may be performed by scoring the degree of agreement with the corresponding site of the base sequence of the at least one mutant pathogen with respect to the first site according to a predetermined criterion.

일 실시예에서, 상기 적어도 하나의 프라이머 세트를 설계하는 단계는, 상기 보존성 점수가 상기 제 2 점수 이상인 상기 제 2 부위를 검출하는 단계; 상기 보존성 점수가 소정의 제 3 점수 이하인 제 3 부위를 검출하는 단계; 및 상기 제 2 부위의 염기 서열 중 적어도 일부와 상기 제 3 부위의 염기 서열 중 적어도 일부를 소정의 규칙에 따라 배열하여 상기 적어도 하나의 프라이머 세트를 설계하는 단계를 포함하며, 상기 프라이머 세트에 포함된 프라이머는 상기 제 2 부위로부터 기초한 염기 서열의 길이가 상기 제 3 부위로부터 기초한 염기 서열의 길이보다 길 수 있다.In one embodiment, the designing of the at least one primer set may include: detecting the second site in which the conservation score is equal to or greater than the second score; detecting a third site in which the conservation score is equal to or less than a predetermined third score; and designing the at least one primer set by arranging at least a portion of the nucleotide sequence of the second site and at least a portion of the nucleotide sequence of the third site according to a predetermined rule, In the primer, the length of the base sequence based on the second site may be longer than the length of the base sequence based on the third site.

일 실시예에서, 상기 적어도 하나의 프라이머 세트를 설계하는 단계에서는, 상기 프라이머 세트를 구성하는 적어도 하나의 프라이머의 염기 서열, 길이(length), 핵산의 2중 나선 구조가 풀리는온도(Tm), 어닐닝 온도(Ta), GC 함량 및 전사 길이(transcript length) 중 적어도 하나에 대한 설계를 수행할 수 있다. In one embodiment, in the step of designing the at least one primer set, the nucleotide sequence of at least one primer constituting the primer set, the length, the temperature at which the double helix of the nucleic acid is unwound (Tm), Design for at least one of the anealing temperature (Ta), the GC content, and the transcription length may be performed.

일 실시예에서, 설계된 상기 프라이머 세트 중 적어도 하나에 대한 증폭 실험에서 산출된 실험 데이터를 수집하는 단계; 상기 프라이머 세트에 대한 설계 데이터 및 상기 실험 데이터를 기초로 기계 학습 모델을 훈련시키는 단계; 및 상기 훈련된 기계 학습 모델을 통해 상기 목표 병원체와 상이한 제 2 목표 병원체에 대하여 설계된 적어도 하나의 제 2 프라이머 세트의 검출 성능을 예측하는 단계를 더 포함할 수 있다.In an embodiment, collecting experimental data calculated in an amplification experiment for at least one of the designed primer sets; training a machine learning model based on the design data for the primer set and the experimental data; and predicting the detection performance of at least one second primer set designed for a second target pathogen different from the target pathogen through the trained machine learning model.

일 실시예에서, 설계된 상기 프라이머 세트를 적어도 하나의 프라이머 그룹으로 그룹화하는 단계를 더 포함할 수 있다. In one embodiment, the method may further include grouping the designed primer set into at least one primer group.

일 실시예에서, 상기 그룹화하는 단계는, 상기 프라이머 세트를 구성하는 프라이머 간의 다이머 테스트(dimer test)를 기초로 수행될 수 있다.In an embodiment, the grouping may be performed based on a dimer test between primers constituting the primer set.

일 실시예에서, 상기 프라이머 그룹 중 적어도 하나에 대한 증폭 실험에서 산출된 실험 데이터를 수집하는 단계; 상기 프라이머 그룹에 포함된 프라이머 세트에 대한 설계 데이터 및 상기 실험 데이터를 기초로 기계 학습 모델을 훈련시키는 단계; 및 상기 훈련된 기계 학습 모델을 통해, 상기 목표 병원체와 상이한 제 2 목표 병원체에 대하여 설계된 적어도 하나의 제 2 프라이머 세트를 포함하는 적어도 하나의 제 2 프라이머 그룹에 대하여 검출 성능을 예측하는 단계를 더 포함할 수 있다.In an embodiment, collecting experimental data calculated in an amplification experiment for at least one of the primer groups; training a machine learning model based on design data for a primer set included in the primer group and the experimental data; and predicting detection performance for at least one second primer group including at least one second primer set designed for a second target pathogen different from the target pathogen through the trained machine learning model. can do.

본 개시의 일 실시예에 따른 프라이머의 설계 장치는, 프라이머를 설계하기 위한 프로그램을 저장하는 메모리; 및 상기 프로그램을 실행함으로써, 목표 병원체의 염기 서열 정보를 수집하고, 상기 목표 병원체의 염기 서열을 인간 및 적어도 하나의 다른 병원체의 염기 서열과 비교하여 상기 목표 병원체의 염기 서열을 구성하는 적어도 하나의 부위에 대하여 독립성 점수(Independence score)를 산출하며, 산출된 상기 독립성 점수가 소정의 제 1 점수 이상인 제 1 부위를 상기 목표 병원체의 적어도 하나의 변이 병원체의 염기 서열의 대응 부위와 비교하여 상기 제 1 부위에 대한 보존성 점수(conserve score)를 산출하고, 산출된 상기 보존성 점수가 소정의 제 2 점수 이상인 제 2 부위의 염기 서열을 이용하여, 상기 목표 병원체를 검출하기 위한 적어도 하나의 프라이머 세트를 설계하도록 제어하는 프로세서를 포함할 수 있다. A primer design apparatus according to an embodiment of the present disclosure includes: a memory for storing a program for designing a primer; and at least one region constituting the nucleotide sequence of the target pathogen by collecting the nucleotide sequence information of the target pathogen by executing the program, and comparing the nucleotide sequence of the target pathogen with the nucleotide sequences of humans and at least one other pathogen calculates an independence score with respect to , and compares a first site in which the calculated independence score is equal to or greater than a predetermined first score with a corresponding site in the nucleotide sequence of at least one mutant pathogen of the target pathogen, and the first site Calculate a conservation score for , and control to design at least one primer set for detecting the target pathogen using the nucleotide sequence of the second site in which the calculated conservation score is equal to or greater than a predetermined second score It may include a processor that

일 실시예에서, 상기 프로세서는, 상기 적어도 하나의 부위에 대하여 상기 인간 및 상기 적어도 하나의 다른 병원체의 염기 서열과 불일치 정도를 소정의 기준에 따라 점수화함으로써 상기 독립성 점수를 산출하도록 제어할 수 있다. In an embodiment, the processor may control to calculate the independence score by scoring the degree of mismatch with the nucleotide sequence of the human and the at least one other pathogen with respect to the at least one site according to a predetermined criterion.

일 실시예에서, 상기 프로세서는, 상기 제 1 부위에 대하여 상기 적어도 하나의 변이 병원체의 염기 서열의 대응 부위와 일치 정도를 소정의 기준에 따라 점수화함으로써 상기 보존성 점수를 산출하도록 제어할 수 있다. In an embodiment, the processor may control to calculate the conservation score by scoring the degree of agreement with the corresponding site of the base sequence of the at least one mutant pathogen with respect to the first site according to a predetermined criterion.

일 실시예에서, 상기 프로세서는, 상기 보존성 점수가 상기 제 2 점수 이상인 상기 제 2 부위를 검출하고, 상기 보존성 점수가 소정의 제 3 점수 이하인 제 3 부위를 검출하며, 상기 제 2 부위의 염기 서열 중 적어도 일부와 상기 제 3 부위의 염기 서열 중 적어도 일부를 소정의 규칙에 따라 배열하여 상기 적어도 하나의 프라이머 세트를 설계하도록 제어하되, 상기 프라이머 세트에 포함된 프라이머는 상기 제 2 부위로부터 기초한 염기 서열의 길이가 상기 제 3 부위로부터 기초한 염기 서열의 길이보다 길 수 있다.In one embodiment, the processor detects the second site having the conservation score equal to or greater than the second score, and detecting a third site having the conservation score equal to or less than a predetermined third score, and the nucleotide sequence of the second site Control to design the at least one primer set by arranging at least a part of the nucleotide sequence and at least a part of the nucleotide sequence of the third site according to a predetermined rule, wherein the primers included in the primer set include a nucleotide sequence based on the second site The length of may be longer than the length of the base sequence based on the third site.

일 실시예에서, 상기 프로세서는, 상기 프라이머 세트를 구성하는 적어도 하나의 프라이머의 염기 서열, 길이(length), 핵산의 2중 나선 구조가 풀리는 온도(Tm), 어닐닝 온도(Ta), GC 함량 및 전사 길이(transcript length) 중 적어도 하나에 대한 설계를 수행하도록 제어할 수 있다. In an embodiment, the processor includes a nucleotide sequence, length, unwinding temperature (Tm) of a double helix structure of a nucleic acid, annealing temperature (Ta), GC content of at least one primer constituting the primer set and at least one of a transcription length may be controlled to be designed.

일 실시예에서, 상기 프로세서는, 설계된 상기 프라이머 세트 중 적어도 하나에 대한 증폭 실험에서 산출된 실험 데이터를 수집하고, 상기 프라이머 세트에 대한 설계 데이터 및 상기 실험 데이터를 기초로 기계 학습 모델을 훈련시키며, 상기 훈련된 기계 학습 모델을 통해 상기 목표 병원체와 상이한 제 2 목표 병원체에 대하여 설계된 적어도 하나의 제 2 프라이머 세트의 검출 성능을 예측하도록 제어할 수 있다. In one embodiment, the processor collects experimental data calculated in an amplification experiment for at least one of the designed primer sets, trains a machine learning model based on the design data for the primer set and the experimental data, Through the trained machine learning model, it is possible to control to predict the detection performance of at least one second primer set designed for a second target pathogen different from the target pathogen.

일 실시예에서, 상기 프로세서는, 상기 프로세서는, 설계된 상기 프라이머 세트를 적어도 하나의 프라이머 그룹으로 그룹화하도록 제어할 수 있다. In an embodiment, the processor may control the processor to group the designed primer set into at least one primer group.

일 실시예에서, 상기 프로세서는, 상기 프라이머 세트를 구성하는 프라이머 간의 다이머 테스트(dimer test)를 기초로 상기 그룹화를 수행하도록 제어할 수 있다. In an embodiment, the processor may control to perform the grouping based on a dimer test between primers constituting the primer set.

일 실시예에서, 상기 프로세서는, 상기 프라이머 그룹 중 적어도 하나에 대한 증폭 실험에서 산출된 실험 데이터를 수집하고, 상기 프라이머 그룹에 포함된 프라이머 세트에 대한 설계 데이터 및 상기 실험 데이터를 기초로 기계 학습 모델을 훈련시키며, 상기 훈련된 기계 학습 모델을 통해, 상기 목표 병원체와 상이한 제 2 목표 병원체에 대하여 설계된 적어도 하나의 제 2 프라이머 세트를 포함하는 적어도 하나의 제 2 프라이머 그룹에 대하여 검출 성능을 예측하도록 제어할 수 있다.In an embodiment, the processor collects experimental data calculated in an amplification experiment for at least one of the primer groups, and a machine learning model based on the design data and the experimental data for a primer set included in the primer group. control to predict detection performance for at least one second primer group including at least one second primer set designed for a second target pathogen different from the target pathogen through the trained machine learning model can do.

본 개시의 일 실시예에 따른 프라이머의 설계 방법 및 장치에 따르면, 목표 병원체를 특이적으로 검출하는 프라이머 세트를 설계하고, 각 프라이머 세트의 목표 병원체에 대한 검출 성능을 예측할 수 있다.According to the primer design method and apparatus according to an embodiment of the present disclosure, it is possible to design a primer set specifically detecting a target pathogen, and predict the detection performance of each primer set for the target pathogen.

본 개시의 일 실시예에 따른 프라이머의 설계 방법 및 장치가 얻을 수 있는 효과는 이상에서 언급한 효과로 제한되지 않으며, 언급하지 않은 또 다른 효과들은 아래의 기재로부터 본 개시가 속하는 기술분야에서 통상의 지식을 가진 자에게 명확하게 이해될 수 있을 것이다.Effects that can be obtained by the method and apparatus for designing a primer according to an embodiment of the present disclosure are not limited to the above-mentioned effects, and other effects not mentioned are common in the art to which the present disclosure belongs from the description below. It can be clearly understood by those with knowledge.

본 개시에서 인용되는 도면을 보다 충분히 이해하기 위하여 각 도면의 간단한 설명이 제공된다.
도 1은 본 발명의 일 실시예에 따른 프라이머의 설계 방법을 나타내는 순서도이다.
도 2는 본 발명의 일 실시예에 따른 프라이머의 설계 방법을 나타내는 순서도이다.
도 3은 본 발명의 일 실시예에 따른 프라이머의 설계 방법을 나타내는 순서도이다.
도 4는 본 발명의 일 실시예에 따른 프라이머의 설계 방법에 있어서, 독립성 점수를 산출하는 예시를 나타내는 도면이다.
도 5는 본 발명의 일 실시예에 따른 프라이머의 설계 방법에 있어서, 보존성 점수를 산출하는 예시를 나타내는 도면이다.
도 6은 본 발명의 일 실시예에 따른 프라이머의 설계 방법에 따라, 설계된 프라이머 세트의 예시를 나타내는 도면이다.
도 7은 본 발명의 일 실시예에 따른 프라이머의 설계 방법에 따라, 설계된 프라이머 그룹의 예시를 나타내는 도면이다.
도 8은 본 발명의 일 실시예에 따른 프라이머의 설계 장치의 내부 구성을 나타내는 블럭도이다.
In order to more fully understand the drawings cited in this disclosure, a brief description of each drawing is provided.
1 is a flowchart illustrating a primer design method according to an embodiment of the present invention.
2 is a flowchart illustrating a primer design method according to an embodiment of the present invention.
3 is a flowchart illustrating a primer design method according to an embodiment of the present invention.
4 is a diagram illustrating an example of calculating an independence score in a primer design method according to an embodiment of the present invention.
5 is a diagram illustrating an example of calculating a conservation score in a primer design method according to an embodiment of the present invention.
6 is a diagram illustrating an example of a primer set designed according to a primer design method according to an embodiment of the present invention.
7 is a diagram illustrating an example of a primer group designed according to a primer design method according to an embodiment of the present invention.
8 is a block diagram showing the internal configuration of a primer design apparatus according to an embodiment of the present invention.

본 개시의 기술적 사상은 다양한 변경을 가할 수 있고 여러 가지 실시예를 가질 수 있는 바, 특정 실시 예들을 도면에 예시하고 이를 상세히 설명하고자 한다. 그러나, 이는 본 개시의 기술적 사상을 특정한 실시 형태에 대해 한정하려는 것이 아니며, 본 개시의 기술적 사상의 범위에 포함되는 모든 변경, 균등물 내지 대체물을 포함하는 것으로 이해되어야 한다.Since the technical spirit of the present disclosure may have various changes and may have various embodiments, specific embodiments will be illustrated in the drawings and described in detail. However, this is not intended to limit the technical spirit of the present disclosure to specific embodiments, and it should be understood to include all changes, equivalents or substitutes included in the scope of the technical spirit of the present disclosure.

본 개시의 기술적 사상을 설명함에 있어서, 관련된 공지 기술에 대한 구체적인 설명이 본 개시의 요지를 불필요하게 흐릴 수 있다고 판단되는 경우 그 상세한 설명을 생략한다. 또한, 본 개시의 설명 과정에서 이용되는 숫자(예를 들어, 제1, 제2 등)는 하나의 구성요소를 다른 구성요소와 구분하기 위한 식별기호에 불과하다.In describing the technical idea of the present disclosure, if it is determined that a detailed description of a related known technology may unnecessarily obscure the subject matter of the present disclosure, the detailed description thereof will be omitted. In addition, numbers (eg, first, second, etc.) used in the description process of the present disclosure are only identification symbols for distinguishing one component from other components.

또한, 본 개시에서, 일 구성요소가 다른 구성요소와 "연결된다" 거나 "접속된다" 등으로 언급된 때에는, 상기 일 구성요소가 상기 다른 구성요소와 직접 연결되거나 또는 직접 접속될 수도 있지만, 특별히 반대되는 기재가 존재하지 않는 이상, 중간에 또 다른 구성요소를 매개하여 연결되거나 또는 접속될 수도 있다고 이해되어야 할 것이다.In addition, in the present disclosure, when a component is referred to as “connected” or “connected” with another component, the one component may be directly connected or directly connected to the other component, but in particular It should be understood that, unless there is a description to the contrary, it may be connected or connected through another element in the middle.

또한, 본 개시에 기재된 "~부", "~기", "~자", "~모듈" 등의 용어는 적어도 하나의 기능이나 동작을 처리하는 단위를 의미하며, 이는 프로세서(Processor), 마이크로 프로세서(Micro Processer), 마이크로 컨트롤러(Micro Controller), CPU(Central Processing Unit), GPU(Graphics Processing Unit), APU(Accelerate Processor Unit), DSP(Digital Signal Processor), ASIC(Application Specific Integrated Circuit), FPGA(Field Programmable Gate Array) 등과 같은 하드웨어나 소프트웨어 또는 하드웨어 및 소프트웨어의 결합으로 구현될 수 있다.In addition, terms such as "~ unit", "~ group", "~ character", and "~ module" described in the present disclosure mean a unit that processes at least one function or operation, which is a processor, a micro Processor (Micro Processor), Micro Controller (Micro Controller), CPU (Central Processing Unit), GPU (Graphics Processing Unit), APU (Accelerate Processor Unit), DSP (Digital Signal Processor), ASIC (Application Specific Integrated Circuit), FPGA (Field Programmable Gate Array) may be implemented as hardware or software, or a combination of hardware and software.

그리고 본 개시에서의 구성부들에 대한 구분은 각 구성부가 담당하는 주기능 별로 구분한 것에 불과함을 명확히 하고자 한다. 즉, 이하에서 설명할 2개 이상의 구성부가 하나의 구성부로 합쳐지거나 또는 하나의 구성부가 보다 세분화된 기능별로 2개 이상으로 분화되어 구비될 수도 있다. 그리고 이하에서 설명할 구성부 각각은 자신이 담당하는 주기능 이외에도 다른 구성부가 담당하는 기능 중 일부 또는 전부의 기능을 추가적으로 수행할 수도 있으며, 구성부 각각이 담당하는 주기능 중 일부 기능이 다른 구성부에 의해 전담되어 수행될 수도 있음은 물론이다.In addition, it is intended to clarify that the classification of the constituent units in the present disclosure is merely a division for each main function that each constituent unit is responsible for. That is, two or more components to be described below may be combined into one component, or one component may be divided into two or more for each more subdivided function. In addition, each of the constituent units to be described below may additionally perform some or all of the functions of other constituent units in addition to the main function it is responsible for. Of course, it can also be performed by being dedicated to it.

이하, 본 개시의 실시예들을 차례로 상세히 설명한다.Hereinafter, embodiments of the present disclosure will be described in detail in turn.

도 1은 본 발명의 일 실시예에 따른 프라이머의 설계 방법을 나타내는 순서도이다. 1 is a flowchart illustrating a primer design method according to an embodiment of the present invention.

S110 단계에서, 프라이머의 설계 장치는, 목표 병원체의 염기 서열 정보를 수집할 수 있다. 여기서 목표 병원체는, 바이러스, 박테리아, 세균, RNA 바이러스, DNA 바이러스 등을 포함할 수 있으나, 이에 한정되는 것은 아니며, 질병의 원인이 되는 다양한 병원체가 포함될 수 있다. In step S110, the primer design device may collect nucleotide sequence information of the target pathogen. Here, the target pathogen may include, but is not limited to, viruses, bacteria, bacteria, RNA viruses, DNA viruses, and the like, and various pathogens that cause diseases may be included.

일 실시예에서, 목표 병원체의 염기 서열 정보는 외부 장치로부터 수신될 수도 있고, 메모리에 저장된 정보를 획득할 수도 있다. 염기 서열 정보를 외부 장치로부터 수신하는 경우, 염기 서열 정보는 미리 구축된 서버로부터 수신할 수도 있고, 네트워크를 통해 공개 데이터 베이스로부터 수신할 수도 있다. 예를 들어, 공개 데이터 베이스는 BLAST , MOTIF, EMBL-EBI, Pfam, ExPASy, SMART, InterPro, CDD, P2RP, MEROPS, COG, KAAS, GYM, iDNA -Prot, DP -Bind, CEP, PSP 중 적어도 하나를 포함할 수 있다.In an embodiment, the nucleotide sequence information of the target pathogen may be received from an external device or information stored in a memory may be acquired. When receiving the nucleotide sequence information from an external device, the nucleotide sequence information may be received from a pre-established server or from a public database through a network. For example, the public database is at least one of BLAST, MOTIF, EMBL-EBI, Pfam, ExPASy, SMART, InterPro, CDD, P2RP, MEROPS, COG, KAAS, GYM, iDNA-Prot, DP-Bind, CEP, PSP. may include

일 실시예에서, 염기 서열 정보는 목표 병원체의 전체 염기 서열에 대한 정보를 포함할 수 있다.In an embodiment, the nucleotide sequence information may include information on the entire nucleotide sequence of the target pathogen.

이어서, S120 단계에서, 프라이머의 설계 장치는, 목표 병원체의 염기 서열을 인간 및 적어도 하나의 다른 병원체의 염기 서열과 비교하여 목표 병원체의 염기 서열을 구성하는 적어도 하나의 부위에 대하여 독립성 점수(Independence score)를 산출할 수 있다. 일 실시예에서, S120 단계는, 목표 병원체의 전체 염기 서열을 인간 및 적어도 하나의 다른 병원체의 전체 염기 서열과 비교함으로써 수행될 수 있다.Subsequently, in step S120, the primer design device compares the nucleotide sequence of the target pathogen with the nucleotide sequences of humans and at least one other pathogen to obtain an independence score for at least one site constituting the nucleotide sequence of the target pathogen. ) can be calculated. In one embodiment, step S120 may be performed by comparing the entire nucleotide sequence of the target pathogen with the total nucleotide sequence of humans and at least one other pathogen.

여기서 독립성 점수는 목표 병원체의 염기 서열을 구성하는 복수의 부위 중 목표 병원체를 특이적으로 식별하는데 적합한 염기 서열을 갖는 부위를 검출하기 위한 지표를 지칭할 수 있다. 예를 들어, 독립성 점수는 목표 병원체의 전체 염기 서열 중 적어도 하나의 부위 각각에 대하여 인간 및 적어도 하나의 다른 병원체의 전체 염기 서열과 불일치 정도를 소정의 기준에 따라 점수화함으로써 산출될 수 있다. 상기 부위는 목표 병원체의 염기 서열을 소정의 단위 길이를 기준으로 복수로 분할한 것일 수 있으며, 예를 들어, 상기 단위 길이는 사용자 입력에 따라 상이하게 설정될 수 있으며, 바람직하게는, 15bp 이상으로 설정될 수 있다.Herein, the independence score may refer to an index for detecting a site having a base sequence suitable for specifically identifying the target pathogen among a plurality of sites constituting the base sequence of the target pathogen. For example, the independence score may be calculated by scoring the degree of mismatch with the entire nucleotide sequence of a human and at least one other pathogen with respect to each of at least one region of the total nucleotide sequence of the target pathogen according to a predetermined criterion. The site may be a plurality of divisions of the nucleotide sequence of the target pathogen based on a predetermined unit length. For example, the unit length may be set differently according to a user input, and preferably, 15 bp or more. can be set.

본 발명에 따르면, 다른 병원체 이외에 인간의 전체 염기 서열을 목표 병원체와 비교함으로써, 인간의 핵산이 목표 병원체와 함께 추출됨으로 인하여 발생되는 오류를 방지할 수 있다.According to the present invention, by comparing the entire human nucleotide sequence with the target pathogen in addition to other pathogens, it is possible to prevent an error caused by extraction of human nucleic acids with the target pathogen.

도 4를 참조하면, 프라이머의 설계 장치가 목표 병원체의 전체 염기 서열을 구성하는 복수의 부위에 대하여 독립성 점수를 산출하는 예시가 도시된다.Referring to FIG. 4 , an example in which the primer design device calculates independence scores for a plurality of sites constituting the entire nucleotide sequence of a target pathogen is illustrated.

도시되는 바와 같이, 목표 병원체는 바이러스일 수 있으며, 프라이머의 설계 장치는, 해당 바이러스의 전체 염기 서열을 인간, 특정 박테리아, 진균 및/또는 다른 바이러스의 전체 염기 서열과 상호 비교하여 염기 서열 간의 불일치도에 따라 독립성 점수를 산출할 수 있다. As shown, the target pathogen may be a virus, and the primer design device compares the entire nucleotide sequence of the virus with the entire nucleotide sequence of a human, a specific bacterium, a fungus and/or another virus to obtain a degree of mismatch between the nucleotide sequences. The independence score can be calculated according to

일 실시예에서, 프라이머의 설계 장치는, 사용자의 입력값에 기초하여 독립성 점수의 기준값(예를 들어, 80점)을 설정할 수 있으며, 이에 기초하여, 목표 병원체의 염기 서열 중 상기 기준값 이상의 독립성 점수를 가지는 부위와 나머지 부위를 구분할 수 있다. 이때, 상기 기준값은 이하 설명되는 S130 단계에서, 보존성 점수의 산출의 대상을 구별하는 제 1 점수와 동일한 값일 수 있다.In one embodiment, the primer design apparatus may set a reference value (eg, 80 points) of the independence score based on the user's input value, and based on this, the independence score greater than or equal to the reference value among the nucleotide sequences of the target pathogen It is possible to distinguish the part with and the remaining part. In this case, the reference value may be the same value as the first score for discriminating the target for calculating the preservation score in step S130 to be described below.

다시 도 1의 설명으로 돌아가면, S130 단계에서, 프라이머의 설계 장치는, S120 단계를 통해 산출된 독립성 점수가 소정의 제 1 점수 이상인 제 1 부위를 목표 병원체의 적어도 하나의 변이 병원체의 염기 서열과 비교하여 제 1 부위에 대한 보존성 점수(conserve score)를 산출할 수 있다. Returning to the description of FIG. 1 again, in step S130, the primer design device compares the first site in which the independence score calculated in step S120 is equal to or greater than a predetermined first score with the nucleotide sequence of at least one mutant pathogen of the target pathogen. By comparison, it is possible to calculate a conservation score for the first site.

여기서 보존성 점수는 목표 병원체의 염기 서열 중 특이도가 높은 부위들(즉, 독립성 점수가 높은 제 1 부위) 중에서 변이가 잘 발생되지 않은 염기 서열 부위를 검출하기 위한 지표를 지칭할 수 있다. 예를 들어, 보존성 점수는 제 1 부위에 대하여 적어도 하나의 변이 병원체의 염기 서열의 대응 부위와 염기 서열 간의 일치 정도를 소정의 기준에 따라 점수화함으로써 산출될 수 있다. Here, the conservation score may refer to an index for detecting a nucleotide sequence region in which mutation is not easily generated among regions with high specificity among nucleotide sequences of a target pathogen (ie, a first region with a high independence score). For example, the conservation score may be calculated by scoring the degree of correspondence between the base sequence and the corresponding site of the base sequence of at least one mutant pathogen with respect to the first site according to a predetermined criterion.

일 실시예에서, 보존성 점수는 제 1 부위 전체에 대하여 산출되거나, 제 1 부위를 소정의 단위 길이를 기준으로 나눈 다음 각각의 분할된 부위에 대하여 개별적으로 산출될 수 있다. 예를 들어, 상기 단위 길이는 사용자 입력에 따라 상이하게 설정될 수 있으며, 바람직하게는, 15bp 이상으로 설정될 수 있다.In an embodiment, the conservation score may be calculated for the entire first portion, or may be calculated individually for each divided portion after dividing the first portion based on a predetermined unit length. For example, the unit length may be set differently according to a user input, and preferably, set to 15 bp or more.

도 5를 참조하면, 프라이머의 설계 장치가 목표 병원체의 염기 서열 중 제 1 부위에 대하여 보존성 점수를 산출하는 예시가 도시된다.Referring to FIG. 5 , an example in which the primer design device calculates the conservation score for the first site among the nucleotide sequences of the target pathogen is shown.

도시되는 바와 같이, 목표 병원체가 바이러스인 경우, 적어도 하나의 변이 바이러스의 염기 서열 중에서 제 1 부위와 대응하는 부위의 염기 서열과 목표 병원체의 제 1 부위의 염기 서열을 상호 비교하여 염기 서열 간의 일치도에 따라 보존성 점수를 산출할 수 있다.As shown, when the target pathogen is a virus, the nucleotide sequence of the first site and the corresponding site among the base sequences of at least one mutant virus is compared with the base sequence of the first site of the target pathogen to determine the degree of correspondence between the base sequences. Conservation score can be calculated accordingly.

일 실시예에서, 프라이머의 설계 장치는, 사용자의 입력값에 기초하여 보존성 점수의 기준값(예를 들어, 90점)을 설정할 수 있으며, 이에 기초하여, 목표 병원체의 염기 서열 중 상기 기준값 이상의 보존성 점수를 가지는 부위와 나머지 부위를 구분할 수 있다. 이때, 상기 기준값은 이하 설명되는 S140 단계에서, 프라이머 설계에 이용되는 제 2 부위를 검출하는 제 2 점수와 동일한 값일 수 있다.In one embodiment, the primer design apparatus may set a reference value (eg, 90 points) of the conservation score based on the user's input value, and based on this, a conservation score greater than or equal to the reference value among the nucleotide sequences of the target pathogen. It is possible to distinguish the part with and the remaining part. In this case, the reference value may be the same value as the second score for detecting the second site used for primer design in step S140 to be described below.

다시 도 1의 설명으로 돌아가면, S140 단계에서, 프라이머의 설계 장치는, S130 단계를 통해 산출된 보존성 점수가 소정의 제 2 점수 이상인 제 2 부위의 염기 서열을 기초로, 목표 병원체를 검출하기 위한 적어도 하나의 프라이머 세트를 설계할 수 있다. 여기서, 프라이머 세트 각각에는 정방향(forward) 프라이머와 역방향(reverse) 프라이머가 포함될 수 있다.Returning to the description of FIG. 1 again, in step S140, the primer design device is configured to detect a target pathogen based on the nucleotide sequence of the second site in which the conservation score calculated in step S130 is equal to or greater than a predetermined second score. At least one primer set can be designed. Here, each of the primer sets may include a forward primer and a reverse primer.

일 실시예에서, 프라이머의 설계 장치는, 프라이머 세트를 구성하는 적어도 하나의 프라이머의 염기 서열, 길이(length), 핵산의 2중 나선 구조가 풀리는 온도(Tm), 어닐닝 온도(Ta), GC 함량 및 전사 길이(transcript length) 중 적어도 하나에 대한 설계를 수행할 수 있다.In one embodiment, the primer design apparatus includes a nucleotide sequence, a length, a temperature at which a double helix of a nucleic acid is unwinding (Tm), an annealing temperature (Ta), GC of at least one primer constituting a primer set. Design for at least one of content and transcript length may be performed.

일 실시예에서, 프라이머 설계 장치는, 제 2 부위의 염기 서열 중 적어도 일부를 포함하도록 정방향 프라이머를 설계하고, 다른 제 2 부위의 염기 서열 중 적어도 일부와 상보적인 염기 서열을 포함하도록 역방향 프라이머를 설계할 수 있다.In one embodiment, the primer design device designs a forward primer to include at least a portion of the nucleotide sequence of the second site, and designs a reverse primer to include a nucleotide sequence complementary to at least a portion of the nucleotide sequence of another second site. can do.

일 실시예에서, 프라이머 설계 장치는, 제 2 부위의 염기 서열을 이용하여 염기 서열을 설계하되, 일부의 염기를 이노신 등의 염기로 치환하거나, 일부 염기의 사이에 이노신 등의 염기를 배치할 수 있다. 이러한 이노신 등의 염기는, 주형에 결함됨이 없이 프라이머에 고리(loop)를 형성할 수 있다.In one embodiment, the primer design device may design a nucleotide sequence using the nucleotide sequence of the second site, but may substitute some bases with bases such as inosine, or place bases such as inosine between some bases. have. Such bases such as inosine can form a loop in the primer without being defective in the template.

일 실시예에서, 프라이머의 설계 장치는, 제 2 부위와 함께, 보존성 점수가 소정의 제 3 점수 이하인 제 3 부위를 이용하여 프라이머 또는 프라이머 세트를 설계할 수 있다. 이때, 제 3 점수는 제 2 부위를 검출하는 제 2 점수와 동일하거나 이보다 낮을 수 있다. 예를 들어, 프라이머의 설계 장치는, 제 2 부위의 염기 서열 중 적어도 일부와 제 3 부위의 염기 서열 중 적어도 일부를 소정의 규칙에 따라 배열하여 프라이머 또는 프라이머 세트를 설계하되, 제 2 부위로부터 기초한 염기 서열의 길이가 제 3 부위로부터 기초한 염기 서열의 길이보다 길도록 프라이머 또는 프라이머 세트를 설계할 수 있다.In one embodiment, the primer design apparatus may design a primer or primer set using a third site having a conservation score equal to or less than a predetermined third score along with the second site. In this case, the third score may be the same as or lower than the second score for detecting the second site. For example, the primer design device aligns at least a portion of the nucleotide sequence of the second site and at least a portion of the nucleotide sequence of the third site according to a predetermined rule to design a primer or a primer set, but based on the second site A primer or primer set may be designed such that the length of the base sequence is longer than the length of the base sequence based on the third site.

도 2는 본 발명의 일 실시예에 따른 프라이머의 설계 방법을 나타내는 순서도이다. 2 is a flowchart illustrating a primer design method according to an embodiment of the present invention.

도 2를 참조하면, 방법(200)은 도 1을 참조하여 상술한 방법(100)에 S210 내지 S230 단계를 더 포함할 수 있다.Referring to FIG. 2 , the method 200 may further include steps S210 to S230 in the method 100 described above with reference to FIG. 1 .

S210 단계에서, 프라이머의 설계 장치는, S140 단계를 통해, 설계된 프라이머 세트 중 적어도 하나에 대한 증폭 실험에서 산출된 실험 데이터를 수집할 수 있다. 예를 들어, 프라이머 세트를 각각 또는 적어도 2 이상의 조합을 이용하여 목표 병원체의 유전자에 대한 실시간 PCR(Polymerase Chain Reaction)을 수행하고, 유전자 증폭 결과 및 실험 조건에 대한 데이터를 포함하는 실험 데이터를 수집할 수 있다. 여기서, 증폭 결과에는 프라이머 세트 각각을 통한 목표 병원체에 대한 유전자 증폭의 성공 여부, 유전자 증폭량(또는, 증폭 신호값), 증폭 곡선, 유전자 증폭량이 설정된 역가(threshold)에 도달할 때까지의 싸이클(cycle) 수 등의 데이터가 포함될 수 있으며, 실험 조건에 대한 데이터에는 실험에 사용된 버퍼(buffer), 프라이머(primer), 목표 서열(target sequences), 택 중합효소(Taq polymerase), dNTPs 등에 대한 데이터를 포함될 수 있다.In step S210 , the primer design apparatus may collect experimental data calculated in an amplification experiment for at least one of the designed primer sets through step S140 . For example, real-time PCR (Polymerase Chain Reaction) is performed on the gene of the target pathogen by using each primer set or a combination of at least two or more, and experimental data including data on the gene amplification result and experimental conditions can be collected. can Here, the amplification result includes the success or failure of gene amplification for the target pathogen through each primer set, the gene amplification amount (or amplification signal value), the amplification curve, and the cycle until the gene amplification amount reaches a set threshold. ) number, etc., and data on the experimental conditions include data on buffers, primers, target sequences, Taq polymerase, dNTPs, etc. used in the experiment. may be included.

이어서, S220 단계에서, 프라이머 설계 장치는, 프라이머 세트에 대한 설계 데이터 및 실험 데이터를 기초로 기계 학습 모델을 훈련시킬 수 있다. Subsequently, in step S220 , the primer design apparatus may train a machine learning model based on design data and experimental data for the primer set.

일 실시예에서, 설계 데이터에는 프라이머 세트 각각을 구성하는 적어도 하나의 프라이머의 염기 서열, 길이(length), 핵산의 2중 나선 구조가 풀리는 온도(Tm), 어닐닝 온도(Ta), GC 함량, 전사 길이(transcript length), 전사 유전자 등의 데이터가 포함될 수 있다. In one embodiment, the design data includes a nucleotide sequence, length, unwinding temperature (Tm) of a double helix structure of a nucleic acid, annealing temperature (Ta), GC content of at least one primer constituting each primer set, Data such as a transcription length and a transcription gene may be included.

또한, 일 실시예에서, 기계 학습 모델은 Deep Belief Network, Autoencoder, CNN(Convolutional Neural Network), RNN(Recurrent Nerural Network), Deep Q-Network 등의 신경망 네트워크를 포함할 수 있으나, 이에 한정되는 것은 아니며, 실시예에 따라, 다양한 신경망 네크워크가 적용될 수 있다.In addition, in one embodiment, the machine learning model may include a neural network such as Deep Belief Network, Autoencoder, Convolutional Neural Network (CNN), Recurrent Neural Network (RNN), Deep Q-Network, etc., but is not limited thereto. , depending on the embodiment, various neural networks may be applied.

예를 들어, 프라이머 설계 장치는, 프라이머 세트 각각의 설계 데이터와 해당 프라이머 세트를 이용한 증폭 실험의 실험 데이터를 입력받아 설계 데이터의 특성과 유전자 증폭 결과 간의 연관도 등을 학습할 수 있다.For example, the primer design apparatus may receive design data of each primer set and experimental data of an amplification experiment using the corresponding primer set, and learn a degree of correlation between characteristics of the design data and a gene amplification result.

이어서, S230 단계에서, 프라이머 설계 장치는, 훈련된 기계 학습 모델을 통해, 목표 병원체와 상이한 제 2 목표 병원체에 대하여 설계된 적어도 하나의 제 2 프라이머 세트의 검출 성능을 예측할 수 있다. Subsequently, in step S230 , the primer designing apparatus may predict the detection performance of at least one second primer set designed for a second target pathogen different from the target pathogen through the trained machine learning model.

일 실시예에서, 제 2 프라이머 세트의 설계는 도 1을 참조하여 상술한 방법(100)과 동일한 단계를 통해 수행될 수 있으며, 프라이머 설계 장치는, 훈련된 기계 학습 모델에 제 2 프라이머 세트 각각의 설계 데이터를 입력하여 제 2 프라이머 세트 각각의 제 2 목표 병원체에 대한 검출 성능(즉, 유전자 증폭 가능성)을 예측할 수 있다.In one embodiment, the design of the second primer set may be performed through the same steps as those of the method 100 described above with reference to FIG. 1 , and the primer design apparatus is configured to apply each of the second primer sets to the trained machine learning model. The design data may be input to predict the detection performance (ie, gene amplification potential) for the second target pathogen of each of the second primer sets.

도 3은 본 발명의 일 실시예에 따른 프라이머의 설계 방법을 나타내는 순서도이다. 3 is a flowchart illustrating a primer design method according to an embodiment of the present invention.

도 3을 참조하면, 방법(300)은 도 1을 참조하여 상술한 방법(100)에 S310 내지 S340 단계를 더 포함할 수 있다.Referring to FIG. 3 , the method 300 may further include steps S310 to S340 in the method 100 described above with reference to FIG. 1 .

S310 단계에서, 프라이머의 설계 장치는, S140 단계를 통해, 설계된 프라이머 세트를 적어도 하나의 프라이머 그룹으로 그룹화할 수 있다.In step S310 , the primer design apparatus may group the designed primer set into at least one primer group through step S140 .

일 실시예에서, S310 단계는, 다이머 테스트(dimer test)에 기초하여 수행될 수 있다. 즉, 프라이머의 설계 장치는, 동일한 프라이머 그룹에 포함된 프라이머가 서로 상보적인 염기 서열로 인하여 프라이머 다이머(primer dimer, 즉, 프라이머 간의 부착으로 형성된 분자)를 형성함으로써, 목표 병원체의 유전자에 대한 PCR 증폭을 억제하는 것을 방지하기 위해, 다이머 테스트(dimer test)에 기초하여, 프라이머 세트를 적어도 하나의 프라이머 그룹으로 그룹화할 수 있다. In an embodiment, step S310 may be performed based on a dimer test. That is, the primer design device forms a primer dimer (that is, a molecule formed by adhesion between primers) due to nucleotide sequences in which primers included in the same primer group are complementary to each other, thereby PCR amplifying the gene of the target pathogen. In order to prevent inhibition of , based on a dimer test, the primer set may be grouped into at least one primer group.

또한, 일 실시예에서, 프라이머의 설계 장치는, 프라이머 그룹에 속하는 프라이머 세트의 개수, 핵산의 2중 나선 구조가 풀리는 평균온도(Tm) 등에 기초하여 각 프라이머 그룹에 대한 우선 순위를 부여할 수 있다.Also, in one embodiment, the primer design apparatus may give priority to each primer group based on the number of primer sets belonging to the primer group, the average temperature (Tm) at which the double helix structure of the nucleic acid is unwound, etc. .

이어서, S320 단계에서, 프라이머의 설계 장치는, 프라이머 그룹 중 적어도 하나에 대한 증폭 실험에서 산출된 실험 데이터를 수집할 수 있다. 즉, 프라이머 그룹 별로 이에 속하는 프라이머 세트를 동시 주입하여 목표 병원체의 유전자에 대한 실시간 PCR을 수행하고, 유전자 증폭 결과 및 실험 조건에 대한 데이터를 포함하는 실험 데이터를 수집할 수 있다.Subsequently, in step S320 , the primer design device may collect experimental data calculated in an amplification experiment for at least one of the primer groups. That is, it is possible to simultaneously inject a primer set belonging to each primer group to perform real-time PCR on a gene of a target pathogen, and to collect experimental data including data on a gene amplification result and experimental conditions.

여기서, 유전자 증폭 결과에는 프라이머 그룹에 속하는 프라이머 세트 각각을 통한 목표 병원체에 대한 유전자 증폭의 성공 여부, 유전자 증폭량(또는, 증폭 신호값), 증폭 곡선, 유전자 증폭량이 설정된 역가(threshold)에 도달할 때까지의 싸이클(cycle) 수 등의 데이터가 포함될 수 있으며, 실험 조건에 대한 데이터에는 실험에 사용된 버퍼(buffer), 프라이머(primer), 목표 서열(target sequences), 택 중합효소(Taq polymerase), dNTPs 등에 대한 데이터를 포함될 수 있다.Here, the gene amplification result includes the success or failure of gene amplification for the target pathogen through each primer set belonging to the primer group, the gene amplification amount (or amplification signal value), the amplification curve, and when the gene amplification amount reaches a set threshold Data such as the number of cycles until Data on dNTPs and the like may be included.

이어서, S330 단계에서, 프라이머의 설계 장치는, 프라이머 그룹에 포함된 프라이머 세트에 대한 설계 데이터 및 실험 데이터를 기초로 기계 학습 모델을 훈련시킬 수 있다.Subsequently, in step S330 , the primer design apparatus may train a machine learning model based on design data and experimental data for a primer set included in the primer group.

일 실시예에서, 설계 데이터에는 프라이머 그룹에 속하는 프라이머 세트를 구성하는 적어도 하나의 프라이머의 염기 서열, 길이(length), 핵산의 2중 나선 구조가 풀리는 온도(Tm), 어닐닝 온도(Ta), GC 함량, 전사 길이(transcript length), 전사 유전자 등의 데이터가 포함될 수 있다. In one embodiment, the design data includes the nucleotide sequence, length, unwinding temperature (Tm) of the double helix structure of the nucleic acid, the annealing temperature (Ta) of at least one primer constituting the primer set belonging to the primer group, Data such as GC content, transcript length, and transcribed genes may be included.

또한, 일 실시예에서, 기계 학습 모델은 Deep Belief Network, Autoencoder, CNN(Convolutional Neural Network), RNN(Recurrent Nerural Network), Deep Q-Network 등의 신경망 네트워크를 포함할 수 있으나, 이에 한정되는 것은 아니며, 실시예에 따라, 다양한 신경망 네크워크가 적용될 수 있다.In addition, in one embodiment, the machine learning model may include a neural network such as Deep Belief Network, Autoencoder, Convolutional Neural Network (CNN), Recurrent Neural Network (RNN), Deep Q-Network, etc., but is not limited thereto. , depending on the embodiment, various neural networks may be applied.

예를 들어, 프라이머 설계 장치는, 프라이머 그룹 별로 이에 속하는 프라이머 세트 각각의 설계 데이터와 해당 프라이머 그룹을 이용한 증폭 실험의 실험 데이터를 입력받아 프라이머 세트에 대한 그룹화 특성, 프라이머 세트 각각의 설계 데이터의 특성과 유전자 증폭 결과 간의 연관도 등을 학습할 수 있다.For example, the primer design device receives design data of each primer set belonging to each primer group and experimental data of an amplification experiment using the corresponding primer group, and provides grouping characteristics for the primer set, characteristics of the design data of each primer set, and The degree of association between gene amplification results can be learned.

이어서, S340 단계에서, 프라이머 설계 장치는, 목표 병원체와 상이한 제 2 목표 병원체에 대하여 설계된 적어도 하나의 제 2 프라이머 세트를 포함하는 적어도 하나의 제 2 프라이머 그룹에 대하여 제 2 목표 병원체에 대한 검출 성능을 예측할 수 있다.Subsequently, in step S340 , the primer designing apparatus determines the detection performance of the second target pathogen with respect to at least one second primer group including at least one second primer set designed for a second target pathogen different from the target pathogen. predictable.

일 실시예에서, 제 2 프라이머 세트의 설계는 도 1을 참조하여 상술한 방법(100)과 동일한 단계를 통해 수행될 수 있으며, 제 2 프라이머 그룹은 S310 단계와 동일한 과정을 통해 수행될 수 있다. In one embodiment, the design of the second primer set may be performed through the same steps as in the method 100 described above with reference to FIG. 1 , and the second primer group may be designed through the same process as the step S310 .

프라이머 설계 장치는, 훈련된 기계 학습 모델에 제 2 프라이머 그룹 별로 이에 속하는 제 2 프라이머 세트의 설계 데이터를 입력하여 제 2 프라이머 그룹 각각의 제 2 목표 병원체에 대한 검출 성능(즉, 유전자 증폭 가능성)을 예측할 수 있다.The primer design device inputs design data of a second primer set belonging to each second primer group to the trained machine learning model, and detects performance (that is, gene amplification potential) of the second target pathogen of each second primer group. predictable.

한편, 도시되어 있지는 않지만, 일 실시예에서, 프라이머 설계 장치는, 훈련된 기계 학습 모델을 통해, 제 2 프라이머 세트를 적어도 하나의 제 2 프라이머 그룹으로 자동 그룹화하도록 구현될 수 있으며, 또한, 기존에 다이머 테스트를 통해 그룹화된 제 2 프라이머 그룹에 속하는 제 2 프라이머 세트 중 적어도 일부를 재그룹화하도록 구현될 수 있다. 즉, 기계 학습 모델은 각각의 프라이머 그룹별로 이에 속하는 프라이머 세트의 설계 데이터와 실제 증폭 결과를 통해 어떠한 설계 데이터 상의 특성이 있는 프라이머 세트를 동일 프라이머 그룹으로 그룹화하였을 때, 검출 성능이 좋은지를 학습할 수 있으며, 프라이머 설계 장치는, 훈련된 기계 학습 모델을 통해, 제 2 목표 병원체에 대해 설계된 제 2 프라이머 세트를 그룹화하거나, 재그룹화할 수 있다.Meanwhile, although not shown, in one embodiment, the primer design apparatus may be implemented to automatically group the second primer set into at least one second primer group through a trained machine learning model, and also It may be implemented to regroup at least a part of the second primer set belonging to the second primer group grouped through the dimer test. That is, the machine learning model can learn whether the detection performance is good when a primer set having certain design data characteristics is grouped into the same primer group through the design data and actual amplification results of the primer sets belonging to each primer group. In addition, the primer design apparatus may group or regroup the second primer set designed for the second target pathogen through the trained machine learning model.

도 6 및 도 7은 본 발명의 일 실시예에 따른 프라이머의 설계 방법에 따라, 설계된 프라이머 세트 및 프라이머 그룹의 예시를 각각 도시한다.6 and 7 respectively show examples of primer sets and primer groups designed according to the primer design method according to an embodiment of the present invention.

먼저, 도 6을 참조하면, 프라이머 세트는 정방향 프라이머와 역방향 프라이머를 포함할 수 있다. 상술한 바와 같이, 각각의 프라이머는 목표 병원체의 염기 서열 중 독립성 점수 및 보존성 점수가 각각 소정의 점수 이상인 적어도 하나의 부위에 기초하여 설계될 수 있다.First, referring to FIG. 6 , a primer set may include a forward primer and a reverse primer. As described above, each primer may be designed based on at least one site in the nucleotide sequence of the target pathogen having an independence score and a conservation score of a predetermined score or higher, respectively.

프라이머의 설계 장치는, 설계된 프라이머 세트 각각에 대응하여, 이에 속하는 프라이머 각각의 설계 데이터를 저장할 수 있다. 설계 데이터는, 예를 들어, 프라이머의 염기 서열, 길이(length), 핵산의 2중 나선 구조가 풀리는 온도 (Tm), 어닐닝 온도(Ta), GC 함량, 전사 길이(transcript length), 전사 유전자 등의 데이터를 포함할 수 있다.The primer design apparatus may store design data of each primer belonging to each of the designed primer sets. Design data, for example, the base sequence of the primer, the length (length), the double helix unwinding temperature (Tm) of the nucleic acid, the annealing temperature (Ta), the GC content, the transcription length (transcript length), the transcription gene data may be included.

도 7을 참조하면, 프라이머 세트는 적어도 하나의 프라이머 그룹으로 그룹화될 수 있다. 상술한 바와 같이, 프라이머 세트는, 프라이머 다이머의 형성을 방지하기 위해 다이머 테스트에 기초하여, 적어도 하나의 그룹으로 그룹화될 수 있다. 프라이머의 설계 장치는, 각각의 프라이머 그룹에 대응하여, 이에 속하는 프라이머 세트 및 프라이머 세트의 설계 데이터를 저장할 수 있다.Referring to FIG. 7 , a primer set may be grouped into at least one primer group. As described above, the primer sets may be grouped into at least one group based on a dimer test to prevent the formation of primer dimers. The primer design apparatus may store a primer set belonging to each primer group and design data of the primer set.

또한, 프라이머 그룹은, 프라이머 그룹에 속하는 프라이머 세트의 개수, 핵산의 2중 나선 구조가 풀리는 온도(Tm)의 평균값 등에 기초하여 상이한 우선 순위가 부여될 수 있다.In addition, different priorities may be given to the primer group based on the number of primer sets belonging to the primer group, the average value of the temperature (Tm) at which the double helix structure of the nucleic acid is unwound, and the like.

도 8은 본 발명의 일 실시예에 따른 프라이머의 설계 장치의 내부 구성을 나타내는 블럭도이다. 8 is a block diagram showing the internal configuration of a primer design apparatus according to an embodiment of the present invention.

도 8을 참조하면, 본 발명의 일 실시예에 따른 프라이머의 설계 장치(800)는 그 하드웨어 구성에 따라 프로세서(810) 및 메모리(820)를 포함할 수 있다. 이는 일 예에 불과하며, 프라이머의 설계 장치(800)의 구성이 이에 한정되는 것은 아니다. 예를 들어, 프라이머의 설계 장치(800)는 다른 구성을 더 포함하거나, 도 8에 개시된 구성 중 일부를 포함하지 않을 수도 있다. Referring to FIG. 8 , the primer design apparatus 800 according to an embodiment of the present invention may include a processor 810 and a memory 820 according to the hardware configuration thereof. This is only an example, and the configuration of the primer design apparatus 800 is not limited thereto. For example, the primer design apparatus 800 may further include other components or may not include some of the components illustrated in FIG. 8 .

일 실시예에서, 프로세서(810)는 프라이머의 설계 장치(800)의 전반적인 동작을 제어할 수 있다. 프로세서(810)는 메모리(820)에 저장되는 하나 이상의 프로그램들을 실행할 수 있다. 프로세서(810)는 메모리(820)에 저장된 프라이머 설계를 위한 프로그램을 실행함으로써, 목표 병원체의 염기 서열 정보를 수집하고, 목표 병원체의 염기 서열을 인간 및 적어도 하나의 다른 병원체의 염기 서열과 비교하여 목표 병원체의 염기 서열을 구성하는 적어도 하나의 부위에 대하여 독립성 점수(Independence score)를 산출하며, 산출된 독립성 점수가 소정의 제 1 점수 이상인 제 1 부위를 목표 병원체의 적어도 하나의 변이 병원체의 염기 서열의 대응 부위와 비교하여 제 1 부위에 대한 보존성 점수(conserve score)를 산출하고, 산출된 보존성 점수가 소정의 제 2 점수 이상인 제 2 부위의 염기 서열을 이용하여, 목표 병원체를 검출하기 위한 적어도 하나의 프라이머 세트를 설계하도록 제어할 수 있다. In an embodiment, the processor 810 may control the overall operation of the primer design apparatus 800 . The processor 810 may execute one or more programs stored in the memory 820 . The processor 810 collects nucleotide sequence information of the target pathogen by executing a primer design program stored in the memory 820, and compares the nucleotide sequence of the target pathogen with the nucleotide sequence of humans and at least one other pathogen to achieve the target. An independence score is calculated with respect to at least one site constituting the base sequence of the pathogen, and the calculated independence score is equal to or greater than a predetermined first score of the first site of the base sequence of at least one mutant pathogen of the target pathogen. At least one method for detecting a target pathogen by calculating a conservation score for the first site compared with the corresponding site, and using the nucleotide sequence of the second site for which the calculated conservation score is equal to or greater than a predetermined second score You can control the design of the primer set.

메모리(820)는 프라이머의 설계 장치(800)를 구동하고 제어하기 위한 다양한 데이터, 프로그램 또는 어플리케이션을 저장할 수 있다. 메모리(820)에 저장되는 프로그램은 하나 이상의 인스트럭션들을 포함할 수 있다. 메모리(820)에 저장된 프로그램(하나 이상의 인스트럭션들) 또는 어플리케이션은 프로세서(810)에 의해 실행될 수 있다. The memory 820 may store various data, programs, or applications for driving and controlling the primer design apparatus 800 . A program stored in the memory 820 may include one or more instructions. A program (one or more instructions) or an application stored in the memory 820 may be executed by the processor 810 .

또한, 도 8에는 도시하지 않았으나, 프라이머의 설계 장치(800)는 통신부, 출력부, 디스플레이부, 사용자 입력부 등을 더 포함할 수 있다. In addition, although not shown in FIG. 8 , the primer design apparatus 800 may further include a communication unit, an output unit, a display unit, a user input unit, and the like.

통신부는 유무선 통신부를 포함할 수 있다. 통신부가 유선 통신부를 포함하는 경우, 통신부는 근거리 통신망(Local Area Network; LAN), 광역 통신망(Wide Area Network; WAN), 부가가치 통신망(Value Added Network; VAN), 이동 통신망(mobile radio communication network), 위성 통신망 및 이들의 상호 조합을 통하여 통신을 하게 하는 하나 이상의 구성요소를 포함할 수 있다. 또한, 통신부가 무선 통신부를 포함하는 경우, 통신부는 셀룰러 통신, 무선랜(예를 들어, 와이-파이(Wi-Fi)) 등을 이용하여 무선으로 데이터 또는 신호를 송수신할 수 있다. 일 실시예에서, 통신부는 프로세서(810)의 제어에 의해 외부 장치 또는 외부 서버와 데이터(예를 들어, 목표 병원체, 인간, 다른 병원체 및/또는 변이 병원체 등의 염기 서열 정보 등) 또는 신호를 송수신할 수 있다. The communication unit may include a wired/wireless communication unit. When the communication unit includes a wired communication unit, the communication unit includes a local area network (LAN), a wide area network (WAN), a value added network (VAN), a mobile radio communication network, It may include one or more components that allow communication through a satellite communication network and a combination thereof. In addition, when the communication unit includes the wireless communication unit, the communication unit may wirelessly transmit and receive data or signals using cellular communication or a wireless LAN (eg, Wi-Fi). In one embodiment, the communication unit transmits and receives data (eg, target pathogen, human, nucleotide sequence information of another pathogen and/or mutant pathogen, etc.) or a signal with an external device or an external server under the control of the processor 810 . can do.

출력부는 시각, 청각, 진동 등과 관련된 출력을 발생시키기 위한 것으로, 디스플레이부, 음향 출력부, 모터 등을 포함할 수 있다.The output unit is for generating an output related to sight, sound, vibration, and the like, and may include a display unit, a sound output unit, a motor, and the like.

디스플레이부는 디스플레이 모듈을 포함할 수 있다. 디스플레이 모듈은 디스플레이 패널, 디스플레이 구동부 및 터치 패널을 포함할 수 있다. The display unit may include a display module. The display module may include a display panel, a display driver, and a touch panel.

사용자 입력부는 사용자가 장치의 동작을 위한 입력 데이터를 발생시킨다. 사용자 입력부는 키 패드(key pad) 돔 스위치 (dome switch), 터치 패드(정압/정전), 조그 휠, 조그 스위치 등으로 구성될 수 있다.The user input unit generates input data for the user to operate the device. The user input unit may include a keypad, a dome switch, a touch pad (static pressure/capacitance), a jog wheel, a jog switch, and the like.

일 실시예에 따른 프라이머의 설계 방법은 다양한 컴퓨터 수단을 통하여 수행될 수 있는 프로그램 명령 형태로 구현되어 컴퓨터 판독 가능 매체에 기록될 수 있다. 상기 컴퓨터 판독 가능 매체는 프로그램 명령, 데이터 파일, 데이터 구조 등을 단독으로 또는 조합하여 포함할 수 있다. 상기 매체에 기록되는 프로그램 명령은 본 발명을 위하여 특별히 설계되고 구성된 것들이거나 컴퓨터 소프트웨어 당업자에게 공지되어 사용 가능한 것일 수도 있다. 컴퓨터 판독 가능 기록 매체의 예에는 하드 디스크, 플로피 디스크 및 자기 테이프와 같은 자기 매체(magnetic media), CD-ROM, DVD와 같은 광기록 매체(optical media), 플롭티컬 디스크(floptical disk)와 같은 자기-광 매체(magneto-optical media), 및 롬(ROM), 램(RAM), 플래시 메모리 등과 같은 프로그램 명령을 저장하고 수행하도록 특별히 구성된 하드웨어 장치가 포함된다. 프로그램 명령의 예에는 컴파일러에 의해 만들어지는 것과 같은 기계어 코드뿐만 아니라 인터프리터 등을 사용해서 컴퓨터에 의해서 실행될 수 있는 고급 언어 코드를 포함한다.The primer design method according to an embodiment may be implemented in the form of program instructions that can be executed through various computer means and recorded in a computer-readable medium. The computer-readable medium may include program instructions, data files, data structures, etc. alone or in combination. The program instructions recorded on the medium may be specially designed and configured for the present invention, or may be known and available to those skilled in the art of computer software. Examples of the computer-readable recording medium include magnetic media such as hard disks, floppy disks and magnetic tapes, optical media such as CD-ROMs and DVDs, and magnetic such as floppy disks. - includes magneto-optical media, and hardware devices specially configured to store and execute program instructions, such as ROM, RAM, flash memory, and the like. Examples of program instructions include not only machine language codes such as those generated by a compiler, but also high-level language codes that can be executed by a computer using an interpreter or the like.

또한, 개시된 실시예들에 따른 프라이머의 설계 방법은 컴퓨터 프로그램 제품(computer program product)에 포함되어 제공될 수 있다. 컴퓨터 프로그램 제품은 상품으로서 판매자 및 구매자 간에 거래될 수 있다.In addition, the primer design method according to the disclosed embodiments may be provided included in a computer program product (computer program product). Computer program products may be traded between sellers and buyers as commodities.

컴퓨터 프로그램 제품은 S/W 프로그램, S/W 프로그램이 저장된 컴퓨터로 읽을 수 있는 저장 매체를 포함할 수 있다. 예를 들어, 컴퓨터 프로그램 제품은 전자 장치의 제조사 또는 전자 마켓(예, 구글 플레이 스토어, 앱 스토어)을 통해 전자적으로 배포되는 S/W 프로그램 형태의 상품(예, 다운로더블 앱)을 포함할 수 있다. 전자적 배포를 위하여, S/W 프로그램의 적어도 일부는 저장 매체에 저장되거나, 임시적으로 생성될 수 있다. 이 경우, 저장 매체는 제조사의 서버, 전자 마켓의 서버, 또는 SW 프로그램을 임시적으로 저장하는 중계 서버의 저장매체가 될 수 있다.The computer program product may include a S/W program and a computer-readable storage medium in which the S/W program is stored. For example, computer program products may include products (eg, downloadable apps) in the form of S/W programs distributed electronically through manufacturers of electronic devices or electronic markets (eg, Google Play Store, App Store). have. For electronic distribution, at least a portion of the S/W program may be stored in a storage medium or may be temporarily generated. In this case, the storage medium may be a server of a manufacturer, a server of an electronic market, or a storage medium of a relay server temporarily storing a SW program.

컴퓨터 프로그램 제품은, 서버 및 클라이언트 장치로 구성되는 시스템에서, 서버의 저장매체 또는 클라이언트 장치의 저장매체를 포함할 수 있다. 또는, 서버 또는 클라이언트 장치와 통신 연결되는 제3 장치(예, 스마트폰)가 존재하는 경우, 컴퓨터 프로그램 제품은 제3 장치의 저장매체를 포함할 수 있다. 또는, 컴퓨터 프로그램 제품은 서버로부터 클라이언트 장치 또는 제3 장치로 전송되거나, 제3 장치로부터 클라이언트 장치로 전송되는 S/W 프로그램 자체를 포함할 수 있다.The computer program product, in a system consisting of a server and a client device, may include a storage medium of the server or a storage medium of the client device. Alternatively, if there is a third device (eg, a smart phone) that is communicatively connected to the server or the client device, the computer program product may include a storage medium of the third device. Alternatively, the computer program product may include the S/W program itself transmitted from the server to the client device or the third device, or transmitted from the third device to the client device.

이 경우, 서버, 클라이언트 장치 및 제3 장치 중 하나가 컴퓨터 프로그램 제품을 실행하여 개시된 실시예들에 따른 방법을 수행할 수 있다. 또는, 서버, 클라이언트 장치 및 제3 장치 중 둘 이상이 컴퓨터 프로그램 제품을 실행하여 개시된 실시예들에 따른 방법을 분산하여 실시할 수 있다.In this case, one of the server, the client device and the third device may execute the computer program product to perform the method according to the disclosed embodiments. Alternatively, two or more of a server, a client device, and a third device may execute a computer program product to distribute the method according to the disclosed embodiments.

예를 들면, 서버(예로, 클라우드 서버 또는 인공 지능 서버 등)가 서버에 저장된 컴퓨터 프로그램 제품을 실행하여, 서버와 통신 연결된 클라이언트 장치가 개시된 실시예들에 따른 방법을 수행하도록 제어할 수 있다.For example, a server (eg, a cloud server or an artificial intelligence server) may execute a computer program product stored in the server to control a client device communicatively connected with the server to perform the method according to the disclosed embodiments.

이상에서 실시예들에 대하여 상세하게 설명하였지만 본 발명의 권리범위는 이에 한정되는 것은 아니고 다음의 청구범위에서 정의하고 있는 본 발명의 기본 개념을 이용한 당업자의 여러 변형 및 개량 형태 또한 본 발명의 권리범위에 속한다.Although the embodiments have been described in detail above, the scope of the present invention is not limited thereto, and various modifications and improvements by those skilled in the art using the basic concept of the present invention as defined in the following claims are also included in the scope of the present invention. belongs to

800: 프라이머의 설계 장치
810: 프로세서
820: 메모리
800: design device of the primer
810: processor
820: memory

Claims (19)

목표 병원체를 검출하기 위한 프라이머의 설계 방법에 있어서,
목표 병원체의 염기 서열 정보를 수집하는 단계;
상기 목표 병원체의 염기 서열을 인간 및 적어도 하나의 다른 병원체의 염기 서열과 비교하여 상기 목표 병원체의 염기 서열을 구성하는 적어도 하나의 부위에 대하여 독립성 점수(Independence score)를 산출하는 단계;
산출된 상기 독립성 점수가 소정의 제 1 점수 이상인 제 1 부위를 상기 목표 병원체의 적어도 하나의 변이 병원체의 염기 서열의 대응 부위와 비교하여 상기 제 1 부위에 대한 보존성 점수(conserve score)를 산출하는 단계; 및
산출된 상기 보존성 점수가 소정의 제 2 점수 이상인 제 2 부위의 염기 서열을 기초로, 상기 목표 병원체를 검출하기 위한 적어도 하나의 프라이머 세트를 설계하는 단계를 포함하는, 방법.
A method for designing a primer for detecting a target pathogen, the method comprising:
collecting nucleotide sequence information of the target pathogen;
comparing the nucleotide sequence of the target pathogen with the nucleotide sequences of humans and at least one other pathogen to calculate an independence score for at least one region constituting the nucleotide sequence of the target pathogen;
Comparing the first site having the calculated independence score equal to or greater than a predetermined first score with the corresponding site of the nucleotide sequence of at least one mutant pathogen of the target pathogen, calculating a conservation score for the first site ; and
and designing at least one primer set for detecting the target pathogen based on the nucleotide sequence of the second site in which the calculated conservation score is equal to or greater than a predetermined second score.
제 1 항에 있어서,
상기 독립성 점수를 산출하는 단계는,
상기 적어도 하나의 부위에 대하여 상기 인간 및 상기 적어도 하나의 다른 병원체의 염기 서열과 불일치 정도를 소정의 기준에 따라 점수화함으로써 수행되는, 방법.
The method of claim 1,
The step of calculating the independence score comprises:
The method is performed by scoring the degree of mismatch with the nucleotide sequence of the human and the at least one other pathogen with respect to the at least one site according to a predetermined criterion.
제 1 항에 있어서,
상기 보존성 점수를 산출하는 단계는,
상기 제 1 부위에 대하여 상기 적어도 하나의 변이 병원체의 염기 서열의 대응 부위와 일치 정도를 소정의 기준에 따라 점수화함으로써 수행되는, 방법.
The method of claim 1,
The step of calculating the conservation score comprises:
The method is performed by scoring the degree of agreement with the corresponding site of the base sequence of the at least one mutant pathogen with respect to the first site according to a predetermined criterion.
제 1 항에 있어서,
상기 적어도 하나의 프라이머 세트를 설계하는 단계는,
상기 보존성 점수가 상기 제 2 점수 이상인 상기 제 2 부위를 검출하는 단계;
상기 보존성 점수가 소정의 제 3 점수 이하인 제 3 부위를 검출하는 단계; 및
상기 제 2 부위의 염기 서열 중 적어도 일부와 상기 제 3 부위의 염기 서열 중 적어도 일부를 소정의 규칙에 따라 배열하여 상기 적어도 하나의 프라이머 세트를 설계하는 단계를 포함하며,
상기 프라이머 세트에 포함된 프라이머는 상기 제 2 부위로부터 기초한 염기 서열의 길이가 상기 제 3 부위로부터 기초한 염기 서열의 길이보다 긴, 방법.
The method of claim 1,
The step of designing the at least one primer set,
detecting the second site in which the conservation score is equal to or greater than the second score;
detecting a third site in which the conservation score is equal to or less than a predetermined third score; and
designing the at least one primer set by arranging at least a portion of the nucleotide sequence of the second site and at least a portion of the nucleotide sequence of the third site according to a predetermined rule,
In the primers included in the primer set, the length of the base sequence based on the second site is longer than the length of the base sequence based on the third site.
제 1 항에 있어서,
상기 적어도 하나의 프라이머 세트를 설계하는 단계에서는,
상기 프라이머 세트를 구성하는 적어도 하나의 프라이머의 염기 서열, 길이(length), 핵산의 2중 나선 구조가 풀리는 온도(Tm), 어닐닝 온도(Ta), GC 함량 및 전사 길이(transcript length) 중 적어도 하나에 대한 설계를 수행하는, 방법.
The method of claim 1,
In the step of designing the at least one primer set,
At least one of a nucleotide sequence, a length, a temperature at which the double helix of a nucleic acid unwinds (Tm), an annealing temperature (Ta), a GC content, and a transcription length of at least one primer constituting the primer set How to do a design for one.
제 1 항에 있어서,
설계된 상기 프라이머 세트 중 적어도 하나에 대한 증폭 실험에서 산출된 실험 데이터를 수집하는 단계;
상기 프라이머 세트에 대한 설계 데이터 및 상기 실험 데이터를 기초로 기계 학습 모델을 훈련시키는 단계; 및
상기 훈련된 기계 학습 모델을 통해 상기 목표 병원체와 상이한 제 2 목표 병원체에 대하여 설계된 적어도 하나의 제 2 프라이머 세트의 검출 성능을 예측하는 단계를 더 포함하는, 방법.
The method of claim 1,
collecting experimental data calculated in an amplification experiment for at least one of the designed primer sets;
training a machine learning model based on the design data for the primer set and the experimental data; and
predicting the detection performance of at least one second primer set designed for a second target pathogen different from the target pathogen through the trained machine learning model.
제 1 항에 있어서,
설계된 상기 프라이머 세트를 적어도 하나의 프라이머 그룹으로 그룹화하는 단계를 더 포함하는, 방법.
The method of claim 1,
The method further comprising grouping the designed primer set into at least one primer group.
제 7 항에 있어서,
상기 그룹화하는 단계는,
상기 프라이머 세트를 구성하는 프라이머 간의 다이머 테스트(dimer test)를 기초로 수행되는, 방법.
8. The method of claim 7,
The grouping step is
A method that is performed based on a dimer test between primers constituting the primer set.
제 7 항에 있어서,
상기 프라이머 그룹 중 적어도 하나에 대한 증폭 실험에서 산출된 실험 데이터를 수집하는 단계;
상기 프라이머 그룹에 포함된 프라이머 세트에 대한 설계 데이터 및 상기 실험 데이터를 기초로 기계 학습 모델을 훈련시키는 단계; 및
상기 훈련된 기계 학습 모델을 통해, 상기 목표 병원체와 상이한 제 2 목표 병원체에 대하여 설계된 적어도 하나의 제 2 프라이머 세트를 포함하는 적어도 하나의 제 2 프라이머 그룹에 대하여 검출 성능을 예측하는 단계를 더 포함하는, 방법.
8. The method of claim 7,
collecting experimental data calculated in an amplification experiment for at least one of the primer groups;
training a machine learning model based on design data for a primer set included in the primer group and the experimental data; and
Predicting detection performance with respect to at least one second primer group including at least one second primer set designed for a second target pathogen different from the target pathogen through the trained machine learning model , Way.
목표 병원체를 검출하기 위한 프라이머의 설계 장치에 있어서,
프라이머를 설계하기 위한 프로그램을 저장하는 메모리; 및
상기 프로그램을 실행함으로써, 목표 병원체의 염기 서열 정보를 수집하고, 상기 목표 병원체의 염기 서열을 인간 및 적어도 하나의 다른 병원체의 염기 서열과 비교하여 상기 목표 병원체의 염기 서열을 구성하는 적어도 하나의 부위에 대하여 독립성 점수(Independence score)를 산출하며, 산출된 상기 독립성 점수가 소정의 제 1 점수 이상인 제 1 부위를 상기 목표 병원체의 적어도 하나의 변이 병원체의 염기 서열의 대응 부위와 비교하여 상기 제 1 부위에 대한 보존성 점수(conserve score)를 산출하고, 산출된 상기 보존성 점수가 소정의 제 2 점수 이상인 제 2 부위의 염기 서열을 이용하여, 상기 목표 병원체를 검출하기 위한 적어도 하나의 프라이머 세트를 설계하도록 제어하는 프로세서를 포함하는, 장치.
A primer design device for detecting a target pathogen, comprising:
a memory storing a program for designing a primer; and
By executing the program, the nucleotide sequence information of the target pathogen is collected, and the nucleotide sequence of the target pathogen is compared with the nucleotide sequence of humans and at least one other pathogen to at least one site constituting the nucleotide sequence of the target pathogen. An independence score is calculated for the first site, and the calculated independence score is compared with a corresponding site of the nucleotide sequence of at least one mutant pathogen of the target pathogen to the first site. control to calculate a conservation score for the target pathogen and design at least one primer set for detecting the target pathogen using the nucleotide sequence of the second site in which the calculated conservation score is equal to or greater than a predetermined second score A device comprising a processor.
제 10 항에 있어서,
상기 프로세서는,
상기 적어도 하나의 부위에 대하여 상기 인간 및 상기 적어도 하나의 다른 병원체의 염기 서열과 불일치 정도를 소정의 기준에 따라 점수화함으로써 상기 독립성 점수를 산출하도록 제어하는, 장치
11. The method of claim 10,
The processor is
Controlling to calculate the independence score by scoring the degree of mismatch with the nucleotide sequence of the human and the at least one other pathogen with respect to the at least one site according to a predetermined criterion
제 10 항에 있어서,
상기 프로세서는,
상기 제 1 부위에 대하여 상기 적어도 하나의 변이 병원체의 염기 서열의 대응 부위와 일치 정도를 소정의 기준에 따라 점수화함으로써 상기 보존성 점수를 산출하도록 제어하는, 장치.
11. The method of claim 10,
The processor is
and controlling to calculate the conservation score by scoring the degree of agreement with the corresponding site of the base sequence of the at least one mutant pathogen with respect to the first site according to a predetermined criterion.
제 10 항에 있어서,
상기 프로세서는,
상기 보존성 점수가 상기 제 2 점수 이상인 상기 제 2 부위를 검출하고, 상기 보존성 점수가 소정의 제 3 점수 이하인 제 3 부위를 검출하며, 상기 제 2 부위의 염기 서열 중 적어도 일부와 상기 제 3 부위의 염기 서열 중 적어도 일부를 소정의 규칙에 따라 배열하여 상기 적어도 하나의 프라이머 세트를 설계하도록 제어하되,
상기 프라이머 세트에 포함된 프라이머는 상기 제 2 부위로부터 기초한 염기 서열의 길이가 상기 제 3 부위로부터 기초한 염기 서열의 길이보다 긴, 장치.
11. The method of claim 10,
The processor is
detecting the second site having the conservation score equal to or greater than the second score, detecting a third site having the conservation score equal to or less than a predetermined third score, and detecting at least a portion of the nucleotide sequence of the second site and the third site Control to design the at least one primer set by arranging at least a part of the nucleotide sequence according to a predetermined rule,
In the primers included in the primer set, the length of the base sequence based on the second site is longer than the length of the base sequence based on the third site.
제 10 항에 있어서,
상기 프로세서는,
상기 프라이머 세트를 구성하는 적어도 하나의 프라이머의 염기 서열, 길이(length), 핵산의 2중 나선 구조가 풀리는 온도(Tm), 어닐닝 온도(Ta), GC 함량 및 전사 길이(transcript length) 중 적어도 하나에 대한 설계를 수행하도록 제어하는, 장치.
11. The method of claim 10,
The processor is
At least one of a nucleotide sequence, a length, a temperature at which the double helix of a nucleic acid unwinds (Tm), an annealing temperature (Ta), a GC content, and a transcription length of at least one primer constituting the primer set A device that controls to perform a design for one.
제 10 항에 있어서,
상기 프로세서는,
설계된 상기 프라이머 세트 중 적어도 하나에 대한 증폭 실험에서 산출된 실험 데이터를 수집하고, 상기 프라이머 세트에 대한 설계 데이터 및 상기 실험 데이터를 기초로 기계 학습 모델을 훈련시키며, 상기 훈련된 기계 학습 모델을 통해 상기 목표 병원체와 상이한 제 2 목표 병원체에 대하여 설계된 적어도 하나의 제 2 프라이머 세트의 검출 성능을 예측하도록 제어하는, 장치.
11. The method of claim 10,
The processor is
Collecting experimental data calculated in an amplification experiment for at least one of the designed primer sets, training a machine learning model based on the design data for the primer set and the experimental data, and using the trained machine learning model and controlling to predict the detection performance of the at least one second primer set designed for a second target pathogen different from the target pathogen.
제 10 항에 있어서,
상기 프로세서는,
설계된 상기 프라이머 세트를 적어도 하나의 프라이머 그룹으로 그룹화하도록 제어하는, 장치.
11. The method of claim 10,
The processor is
Controlling to group the designed primer set into at least one primer group.
제 16 항에 있어서,
상기 프로세서는,
상기 프라이머 세트를 구성하는 프라이머 간의 다이머 테스트(dimer test)를 기초로 상기 그룹화를 수행하도록 제어하는, 장치.
17. The method of claim 16,
The processor is
An apparatus for controlling to perform the grouping based on a dimer test between primers constituting the primer set.
제 16 항에 있어서,
상기 프로세서는,
상기 프라이머 그룹 중 적어도 하나에 대한 증폭 실험에서 산출된 실험 데이터를 수집하고, 상기 프라이머 그룹에 포함된 프라이머 세트에 대한 설계 데이터 및 상기 실험 데이터를 기초로 기계 학습 모델을 훈련시키며, 상기 훈련된 기계 학습 모델을 통해, 상기 목표 병원체와 상이한 제 2 목표 병원체에 대하여 설계된 적어도 하나의 제 2 프라이머 세트를 포함하는 적어도 하나의 제 2 프라이머 그룹에 대하여 검출 성능을 예측하도록 제어하는, 장치.
17. The method of claim 16,
The processor is
Collecting experimental data calculated in an amplification experiment for at least one of the primer groups, training a machine learning model based on the experimental data and design data for a primer set included in the primer group, and the trained machine learning Controlling the model to predict detection performance for at least one second primer group including at least one second primer set designed for a second target pathogen different from the target pathogen through the model.
제 1 항 내지 제 9 항 중 어느 한 항의 방법을 실행하도록 하는 프로그램이 저장된 기록매체를 포함하는 컴퓨터 프로그램 제품.A computer program product comprising a recording medium in which a program for executing the method of any one of claims 1 to 9 is stored.
KR1020200084026A 2020-07-08 2020-07-08 Apparaus and method for designing primer for target pathogen KR102440175B1 (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
KR1020200084026A KR102440175B1 (en) 2020-07-08 2020-07-08 Apparaus and method for designing primer for target pathogen

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
KR1020200084026A KR102440175B1 (en) 2020-07-08 2020-07-08 Apparaus and method for designing primer for target pathogen

Publications (2)

Publication Number Publication Date
KR20220006268A true KR20220006268A (en) 2022-01-17
KR102440175B1 KR102440175B1 (en) 2022-09-05

Family

ID=80051642

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020200084026A KR102440175B1 (en) 2020-07-08 2020-07-08 Apparaus and method for designing primer for target pathogen

Country Status (1)

Country Link
KR (1) KR102440175B1 (en)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN116092585A (en) * 2023-01-30 2023-05-09 上海睿璟生物科技有限公司 Multiple PCR amplification optimization method, system, equipment and medium based on machine learning

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20170138890A (en) * 2016-06-08 2017-12-18 동아대학교 산학협력단 Method and primer set for selecting cylindrocarpon destructans
KR20180015690A (en) * 2018-01-30 2018-02-13 재단법인대구경북과학기술원 Method for rapid design of valid high-quality primers and probes for multiple target genes in qPCR experiments
KR20200029787A (en) * 2018-09-11 2020-03-19 한국과학기술정보연구원 Polymerase chain reaction primer designing method for target gene detection

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20170138890A (en) * 2016-06-08 2017-12-18 동아대학교 산학협력단 Method and primer set for selecting cylindrocarpon destructans
KR20180015690A (en) * 2018-01-30 2018-02-13 재단법인대구경북과학기술원 Method for rapid design of valid high-quality primers and probes for multiple target genes in qPCR experiments
KR20200029787A (en) * 2018-09-11 2020-03-19 한국과학기술정보연구원 Polymerase chain reaction primer designing method for target gene detection

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
Matthias Doring 외, Modeling the Amplification of Immunoglobulins through Machine Learning on Sequence-Specific Features, Scientific Reports, 2019.07.24., pp.1-11.* *

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN116092585A (en) * 2023-01-30 2023-05-09 上海睿璟生物科技有限公司 Multiple PCR amplification optimization method, system, equipment and medium based on machine learning
CN116092585B (en) * 2023-01-30 2024-04-19 上海睿璟生物科技有限公司 Multiple PCR amplification optimization method, system, equipment and medium based on machine learning

Also Published As

Publication number Publication date
KR102440175B1 (en) 2022-09-05

Similar Documents

Publication Publication Date Title
Caruso et al. Performance of microbiome sequence inference methods in environments with varying biomass
FR2863274B1 (en) METHOD FOR QUANTITATIVE EVALUATION OF REARRANGEMENT OR TARGETED GENETIC RECOMBINATION OF AN INDIVIDUAL AND APPLICATIONS THEREOF
KR102440175B1 (en) Apparaus and method for designing primer for target pathogen
JP2010532055A5 (en)
KR100614827B1 (en) MATURE microRNA PREDICTION METHOD USING BIDIRECTIONAL HIDDEN MARKOV MODEL AND MEDIA RECORDING THE PROGRAM TO PERFORM THIS METHOD
Karagöz et al. Taxonomic classification of metagenomic sequences from Relative Abundance Index profiles using deep learning
CA2981913A1 (en) Method and apparatus for estimating the quantity of microorganisms within a taxonomic unit in a sample
Bartoszewicz et al. Deep learning-based real-time detection of novel pathogens during sequencing
Pandey et al. Computational analysis of plant RNA Pol-II promoters
AU2020382701A1 (en) Identification of host RNA biomarkers of infection
JP7208230B2 (en) Single-molecule sequencing and unique molecular identifiers for characterizing nucleic acid sequences
Fleming et al. Leading edge analysis of transcriptomic changes during pseudorabies virus infection
KR102187429B1 (en) Polymerase chain reaction primer designing method for target gene detection
CN114144843A (en) Method for epidemiological identification and monitoring of bacterial outbreaks
Nassa et al. Splice site detection in DNA sequences using probabilistic neural network
Zhang et al. Multiple Sequence Alignment based on deep Q network with negative feedback policy
CN114999572A (en) Method, device, readable medium and device for designing primer
JP2019532410A5 (en)
JP7456485B2 (en) Observation efficiency improvement device, observation efficiency improvement method and program
JP2020178562A (en) Method for determining the risk of atrial fibrillation and/or ventricular fibrillation
US20070128613A1 (en) PCR based capsular typing method
JP7097849B2 (en) How to Determine the Risk of Irritable Bowel Syndrome
CA3108755C (en) Dilution tagging for quantification of biological targets
JP2000157271A (en) Detection of signal sequence
WO2023068220A1 (en) Prediction method and biomarker

Legal Events

Date Code Title Description
E902 Notification of reason for refusal
E701 Decision to grant or registration of patent right
GRNT Written decision to grant