JP2006293481A - 遺伝子データ解析方法プログラム - Google Patents
遺伝子データ解析方法プログラム Download PDFInfo
- Publication number
- JP2006293481A JP2006293481A JP2005110027A JP2005110027A JP2006293481A JP 2006293481 A JP2006293481 A JP 2006293481A JP 2005110027 A JP2005110027 A JP 2005110027A JP 2005110027 A JP2005110027 A JP 2005110027A JP 2006293481 A JP2006293481 A JP 2006293481A
- Authority
- JP
- Japan
- Prior art keywords
- data
- gene
- editing
- genotype
- locus
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 108090000623 proteins and genes Proteins 0.000 title claims abstract description 112
- 238000000034 method Methods 0.000 title claims abstract description 44
- 238000007405 data analysis Methods 0.000 title claims abstract description 23
- 102000054766 genetic haplotypes Human genes 0.000 claims abstract description 49
- 238000004458 analytical method Methods 0.000 claims abstract description 26
- 230000002068 genetic effect Effects 0.000 claims description 38
- 238000012545 processing Methods 0.000 description 37
- 210000000349 chromosome Anatomy 0.000 description 17
- 230000015654 memory Effects 0.000 description 15
- 230000008569 process Effects 0.000 description 12
- 108700028369 Alleles Proteins 0.000 description 8
- 238000002474 experimental method Methods 0.000 description 8
- 238000013500 data storage Methods 0.000 description 5
- 230000008859 change Effects 0.000 description 4
- 238000012217 deletion Methods 0.000 description 3
- 230000037430 deletion Effects 0.000 description 3
- 230000006798 recombination Effects 0.000 description 3
- 238000005215 recombination Methods 0.000 description 3
- 241000894007 species Species 0.000 description 3
- 101150036080 at gene Proteins 0.000 description 2
- 239000003795 chemical substances by application Substances 0.000 description 2
- 238000010586 diagram Methods 0.000 description 2
- 201000010099 disease Diseases 0.000 description 2
- 208000037265 diseases, disorders, signs and symptoms Diseases 0.000 description 2
- 230000006870 function Effects 0.000 description 2
- 238000011160 research Methods 0.000 description 2
- 239000004065 semiconductor Substances 0.000 description 2
- 238000007476 Maximum Likelihood Methods 0.000 description 1
- 241001465754 Metazoa Species 0.000 description 1
- 108091092878 Microsatellite Proteins 0.000 description 1
- 208000035199 Tetraploidy Diseases 0.000 description 1
- 208000026487 Triploidy Diseases 0.000 description 1
- 230000005540 biological transmission Effects 0.000 description 1
- 238000004364 calculation method Methods 0.000 description 1
- 238000004891 communication Methods 0.000 description 1
- 238000012937 correction Methods 0.000 description 1
- 230000002950 deficient Effects 0.000 description 1
- 239000004973 liquid crystal related substance Substances 0.000 description 1
- 230000021121 meiosis Effects 0.000 description 1
- 239000002773 nucleotide Substances 0.000 description 1
- 125000003729 nucleotide group Chemical group 0.000 description 1
- 230000004044 response Effects 0.000 description 1
- 230000003936 working memory Effects 0.000 description 1
Images
Landscapes
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
【課題】 遺伝子データ編集の手間を軽減し、ハプロタイプ解析をスムーズに行うことができる装置を提供すること。
【解決手段】 遺伝子データ解析方法は、データベースからHTML形式の遺伝子データを読み出す遺伝子データ読み出しステップと、上記HTML形式の遺伝子データを用いて、個体名の項目欄と遺伝子座の項目欄の交差点に遺伝子型を記載した遺伝子型表を表示装置の画面に表示する表示ステップと、入力装置を介して指示された命令に従って上記HTML形式の遺伝子型データを編集する編集ステップと、上記入力装置からの指示に従って編集後の遺伝子型データに基いてハプロタイプ解析を行う解析ステップと、を有する。
【選択図】 図2
【解決手段】 遺伝子データ解析方法は、データベースからHTML形式の遺伝子データを読み出す遺伝子データ読み出しステップと、上記HTML形式の遺伝子データを用いて、個体名の項目欄と遺伝子座の項目欄の交差点に遺伝子型を記載した遺伝子型表を表示装置の画面に表示する表示ステップと、入力装置を介して指示された命令に従って上記HTML形式の遺伝子型データを編集する編集ステップと、上記入力装置からの指示に従って編集後の遺伝子型データに基いてハプロタイプ解析を行う解析ステップと、を有する。
【選択図】 図2
Description
本発明は、ハプロタイプを解析するための遺伝子データ解析方法プログラムに関する。
ヒトや動植物のゲノム解読が進み、それに基いて、遺伝子の機能を解析する研究が活発に行われている。そのなかでも特に注目されているのが、ハプロタイプを解析することによって、ゲノムの中から個体の疾患や外形的特徴などの表現型(形質)に関与している遺伝子を探索する研究である。以下、ハプロタイプ解析について説明する。
ハプロタイプ解析
まず、図23を参照しながら、同種の生物の個体A〜Z間でゲノムを比較した場合を考えてみる。通常、同種の生物の個体はほぼ似通った塩基配列を有しているが、いくつかの個所では異なった塩基を有している。図23に示す例では、個体A〜Zは遺伝子座1及び遺伝子座2において異なる塩基を有している。ここで、遺伝子座(locus)とは、ゲノムの塩基配列における特定の位置のことを言う。
まず、図23を参照しながら、同種の生物の個体A〜Z間でゲノムを比較した場合を考えてみる。通常、同種の生物の個体はほぼ似通った塩基配列を有しているが、いくつかの個所では異なった塩基を有している。図23に示す例では、個体A〜Zは遺伝子座1及び遺伝子座2において異なる塩基を有している。ここで、遺伝子座(locus)とは、ゲノムの塩基配列における特定の位置のことを言う。
このように個体間でゲノム上の単一の塩基に多型性が見られることをSNP(Single Nucleotide Polymorphism)と言う。通常は、1つの遺伝子座に2種類の塩基(例えばA、T)が存在しているが、ごくまれに3種類以上の塩基(例えばA、T、G)が存在していることもある。図23に示す例では、遺伝子座1にTを持つ個体が多いので、遺伝子座1ではTがメジャーでありAがマイナーであると言う。同様に、遺伝子座2では、GがメジャーでありCがマイナーであるということになる。
ところで、図24に示すように、多くの生物の個体は、雌性配偶子と雄性配偶子に由来する1組の染色体を有している。1組の染色体上の互いに対応する部位に存在する遺伝子を、それぞれ対立遺伝子(allele)と言い、これらの組み合わせを遺伝子型(genotype)と言う。上記したように、ゲノム上には個体間で塩基配列が異なる部分が存在するので、2つの対立遺伝子は、同じである場合と異なっている場合がある。図24に示す例では、個体Aは、遺伝子座1において同種の塩基Aを有している一方で、遺伝子座2においては異なる塩基G及びCを有している。特定の部位の遺伝子に着目したとき、同じ種類の対立遺伝子を2つ持っている状態をホモ接合、異なる種類の対立遺伝子を1つずつ持っている状態をヘテロ接合と言う。
染色体が親から子に伝わる際、減数***によって1組の染色体が交叉しながら伝わるため、遺伝子の組換えが起こる。一般的に、染色体上で距離が離れた2つの遺伝子は組換えが起こりやすく、染色体上で距離が近い2つの遺伝子は組換えが起こりにくいと考えられている。染色体上の2つの遺伝子座における遺伝子が繋がったまま親から子に伝わる傾向があるとき、2つの遺伝子座は連鎖(linkage)していると言う。
雌性又は雄性配偶子由来の1本の染色体上において、複数の連鎖する遺伝子座に存在する対立遺伝子の組み合わせをハプロタイプと言う。例えば、図24において、個体Aの染色体の遺伝子座1と遺伝子座2とが連鎖している場合には、一方の染色体上ではA−Gというハプロタイプを持ち、他方の染色体上ではA−Cというハプロタイプを持つこととなる。このように、1組2本の染色体を有する個体は、常に1組2つのハプロタイプを持つこととなる。
連鎖する複数の遺伝子座において、ハプロタイプ頻度が患者と健常者との間で有意に違いが認められる場合、そのハプロタイプは疾患に関与していると考えられる。
ハプロタイプの推定
ところで、遺伝子の解析を行う際には、通常、遺伝子座ごとに1組の対立遺伝子、すなわち遺伝子型が特定されるのであるが、この解析結果からは必ずしもハプロタイプが分かるとは限らない。例えば、図24に示す例において、個体Aの遺伝子座1にはA/Aという遺伝子型、遺伝子座2にはG/Cという遺伝子型が存在することが解析されると、一方の染色体上のハプロタイプはA−Gであり、他方はA−Cであることが分かる。しかしながら、個体Bの遺伝子座1にはT/Aという遺伝子型、遺伝子座2にはC/Gという遺伝子型が存在することが解析されても、この解析結果から個体Bが有するハプロタイプを一意に特定することはできない。図25は、これを表に纏めたものである。
ところで、遺伝子の解析を行う際には、通常、遺伝子座ごとに1組の対立遺伝子、すなわち遺伝子型が特定されるのであるが、この解析結果からは必ずしもハプロタイプが分かるとは限らない。例えば、図24に示す例において、個体Aの遺伝子座1にはA/Aという遺伝子型、遺伝子座2にはG/Cという遺伝子型が存在することが解析されると、一方の染色体上のハプロタイプはA−Gであり、他方はA−Cであることが分かる。しかしながら、個体Bの遺伝子座1にはT/Aという遺伝子型、遺伝子座2にはC/Gという遺伝子型が存在することが解析されても、この解析結果から個体Bが有するハプロタイプを一意に特定することはできない。図25は、これを表に纏めたものである。
一般的に、個体の遺伝子型がすべて特定されたとしても、その個体が持つハプロタイプが分かるとは限らない。このことを「相(phase)が特定できない」と言う。直接的にハプロタイプを特定する実験を行うことはできるが、高度で複雑な実験のため多大な時間とコストを要することになってしまう。そこで、ハプロタイプ解析を行う際には、ソフトウェアを用いたハプロタイプを推定する手法が用いられている。ハプロタイプを推定するアルゴリズムとしては、EMアルゴリズムやClarkアルゴリズムなどが知られている。
非特許文献1及び非特許文献2には、ハプロタイプの推定方法が記載されている。また、ハプロタイプ推定をコンピュータ上で行うためのソフトウェアとしては、「ARLEQUIN」などが知られている。
図26を参照しながら、実際に研究所等で行われているハプロタイプ解析の処理を説明する。まず実験によって求められた複数個体の遺伝子型データが記述された遺伝子データを実験結果データベース2600に登録する。登録された遺伝子データは、タブ区切りのテキストファイル2602、及び、Webページ形式のデータであるHTML(HyperText Markup Language) ファイル2603として、WWWサーバ2601に格納される。図27は、タブ区切りのテキストファイル2602として格納された遺伝子データの例を示す。研究者は、遺伝子データ解析装置2604上で、WWWサーバ2601にあるHTMLファイル形式の遺伝子データ2603を確認し、タブ区切りのテキストファイル形式の遺伝子データ2602をダウンロードして解析する。
L. Excoffier and M. Slatkin: Maximum-Likelihood Estimation of Molecular Haplotype Frequencies in a Diploid Population: Mol. Biol. Evol., 12(5): 921-927 (1995)
A. G. Clark: Inference of Haplotypes from PCR-amplified Samples of Diploid Populations: Mol. Biol. Evol., 7(2): 111-122 (1990)
上述のように、ハプロタイプの解析にはハプロタイプ解析用のソフトウエアが用いられるが、解析対象となる遺伝子データに欠陥があると、正確な解析が行われない。従って、実際には、解析の前に、遺伝子データを修正、削除等の編集を行う必要がある。これを図28から図30を用いて説明する。図28では、個体(person1)の遺伝子座(locus1)の遺伝子型はA/Zとなっている。しかし、対立遺伝子はA、T、G、Cしかないため実験者が登録ミスをしたと考えられる。このようなデータが存在するとハプロタイプ推定が適切に行われない可能性があり、修正する必要がある。
図29では、個体person3の遺伝子座の欄に0/0が多く記述されている。これは実験の失敗などにより、一部の遺伝子型データが欠損したことを示している。このような個体のデータは、適切にハプロタイプ推定ができない可能性があり、削除する必要がある。
図30では、locus2において極端にマイナーな対立遺伝子Gが存在する。このような遺伝子座のデータは、実験ミスが原因であると疑われるため、削除する必要がある。
以上説明したように、ハプロタイプの解析を行う前に遺伝子データを編集する必要があることが多い。遺伝子データの編集作業は、図27に示したテキストファイル形式の遺伝子データを、テキストエディタ等で編集する。こうして編集済の遺伝子データをテキストファイル形式からHTMLファイル形式に変換して保存する。
従って、従来の遺伝子データ解析装置では、図26に示したように、遺伝子データを、テキストファイル形式とHTMLファイル形式の2つの形式のファイルとして保存する必要ある。
本発明の目的は、ハプロタイプの推定を行う遺伝子データ解析装置において、遺伝子データの編集作業を簡単化することを目的とする。
本発明によると、遺伝子データ解析方法は、データベースからWebページ形式の遺伝子型データを読み出す遺伝子型データ読み出しステップと、
上記Webページ形式の遺伝子型データを用いて、個体名の項目欄と遺伝子座の項目欄の交差点に遺伝子型を記載した遺伝子型表を表示装置の画面に表示する表示ステップと、
入力装置を介して指示された命令に従って上記Webページ形式の遺伝子型データを編集する編集ステップと、
上記入力装置からの指示に従って編集後の遺伝子型データに基いてハプロタイプ解析を行う解析ステップと、
を有し、
上記編集ステップは、上記遺伝子型表のうち、特定の遺伝子型が選択された場合には、該遺伝子型に対応するWebページ形式データが編集の対象となり、特定の個体名が選択された場合には、該個体名に対応するWebページ形式データが編集の対象となり、特定の遺伝子座が選択された場合には、該遺伝子座に対応するWebページ形式データが編集の対象となる。
上記Webページ形式の遺伝子型データを用いて、個体名の項目欄と遺伝子座の項目欄の交差点に遺伝子型を記載した遺伝子型表を表示装置の画面に表示する表示ステップと、
入力装置を介して指示された命令に従って上記Webページ形式の遺伝子型データを編集する編集ステップと、
上記入力装置からの指示に従って編集後の遺伝子型データに基いてハプロタイプ解析を行う解析ステップと、
を有し、
上記編集ステップは、上記遺伝子型表のうち、特定の遺伝子型が選択された場合には、該遺伝子型に対応するWebページ形式データが編集の対象となり、特定の個体名が選択された場合には、該個体名に対応するWebページ形式データが編集の対象となり、特定の遺伝子座が選択された場合には、該遺伝子座に対応するWebページ形式データが編集の対象となる。
本発明は、この遺伝子データ解析方法をコンピュータに実行させるためにコンピュータによって読み取り可能なプログラムである。
本発明によると、遺伝子データの編集作業を容易に行うことができるから、適切にハプロタイプ解析を行うことができる。
以下、添付図面を参照しながら、本発明の遺伝子データの解析装置及び方法を実施するための最良の形態を詳細に説明する。図1から図22は、本発明の実施の形態を例示する図である。
遺伝子データ解析システム及び遺伝子データ解析装置の構成
図1は、本発明の遺伝子データ解析システムの全体構成を示す。遺伝子データ解析システムは、実験結果データベース100、WWWサーバ101、及び、遺伝子データ解析装置103を有する。実験結果データベース100には、実験により判明した複数の個体の遺伝子データが記憶されている。具体的には、各個体の染色体上のSNPが表れる遺伝子座と、そこに存在する遺伝子型とが記憶されている。また、実際の実験データには、実験の失敗などにより一部の遺伝子型データが欠損している場合があるが、欠損データは0/0として記憶されている。WWWサーバ101には、遺伝子データ102がHTMLファイルとして保持されている。遺伝子データ解析装置103は、WWWサーバ101にアクセスして、HTML形式の遺伝子データ102を取得し、編集作業を行う。本実施の形態ではWebページ形式のデータとしてHTMLファイルを例としてあげているが、本発明はこれに限定されるものではない。
図1は、本発明の遺伝子データ解析システムの全体構成を示す。遺伝子データ解析システムは、実験結果データベース100、WWWサーバ101、及び、遺伝子データ解析装置103を有する。実験結果データベース100には、実験により判明した複数の個体の遺伝子データが記憶されている。具体的には、各個体の染色体上のSNPが表れる遺伝子座と、そこに存在する遺伝子型とが記憶されている。また、実際の実験データには、実験の失敗などにより一部の遺伝子型データが欠損している場合があるが、欠損データは0/0として記憶されている。WWWサーバ101には、遺伝子データ102がHTMLファイルとして保持されている。遺伝子データ解析装置103は、WWWサーバ101にアクセスして、HTML形式の遺伝子データ102を取得し、編集作業を行う。本実施の形態ではWebページ形式のデータとしてHTMLファイルを例としてあげているが、本発明はこれに限定されるものではない。
図2は、図1の遺伝子データ解析装置103の構成を概略的に示す。遺伝子データ解析装置103は、中央処理装置200、プログラムメモリ210、データメモリ220、遺伝子データ格納データベース230、表示装置240、キーボード241、マウス242などの入出力デバイスを有する。
中央処理装置200は、CPUやMPUなどから構成される処理装置であり、本装置の各構成部分の動作を制御し、所定の演算処理を行い、各構成部分間のデータ通信を制御する。中央処理装置200は、プログラムメモリ210に記憶された動作用プログラムに従い、データメモリ220をワーキングメモリとして使用して、必要な制御、演算及びデータ送受信の処理を実行することができる。
プログラムメモリ210は、中央処理装置200の動作用プログラムや、制御データ等の固定データなどを記憶するメモリであり、典型的には、半導体メモリ素子などから構成される読み取り専用メモリ(ROM)である。
プログラムメモリ210は、遺伝子データを表示装置240において表示する処理を行う遺伝子データ表示処理部211と、ユーザからの操作入力に応じて遺伝子データの編集処理を行う遺伝子データ編集処理部212と、ハプロタイプ推定を行うハプロタイプ推定処理部216を含む。遺伝子データ編集処理部212は、さらに、遺伝子型データを編集する遺伝子型データ編集処理部213と、個体のデータを編集する個体データ編集処理部214と、遺伝子座のデータを編集する遺伝子座データ編集処理部215とを含む。
データメモリ220は、中央処理装置200が利用するデータ等を一時的に記憶するメモリであり、典型的には、半導体メモリ素子や磁気記憶素子などから構成される書き換え可能なメモリ(RAM)である。データメモリ220は、遺伝子データを編集する際に、遺伝子データ格納データベース230からHTML形式の遺伝子データを取得し、遺伝子データ221として記憶している。
遺伝子データ格納データベース230は、遺伝子データ解析装置103がWWWサーバ101にアクセスして取得したHTML形式の遺伝子データが保持されている。
表示装置240は、ユーザに遺伝子データを表示するための出力デバイスであり、CRTや液晶ディスプレイなどを用いることができる。キーボード241及びマウス242は、ユーザから本装置への操作入力を受け付ける入力デバイスである。
遺伝子データの編集方法
以上のように構成された本発明の遺伝子データ解析装置において、遺伝子データを編集および表示する方法を説明する。
以上のように構成された本発明の遺伝子データ解析装置において、遺伝子データを編集および表示する方法を説明する。
図3は、遺伝子データ編集及び表示処理の概要を示すフローチャートである。まず、ステップ300にて、遺伝子データ解析装置103を起動する。それにより、遺伝子データ表示処理部211は、図4に示す初期画面を表示する。ステップ301にて、解析対象の遺伝子データを取得するために、WWWサーバ上のHTML形式の遺伝子データ存在するURLにアクセスする。実際の処理では、ユーザは、初期画面のアドレス欄400にURLを入力する。ステップ302にて、遺伝子データ編集処理部212は、図5に示すような遺伝子データをtableタグで表現したHTML形式のデータを遺伝子データ格納データベース230に保存し、データメモリ220の中の遺伝子データ221として読み込む。
ステップ303にて、遺伝子データ表示処理部211は、図6に示す遺伝子データの表示画面を表示する。この画面では、図5のHTML形式のデータは、表形式のデータ600として表示される。ステップ304は、ユーザが編集処理を行うか否かの判定ステップである。編集処理を行う場合には、ステップ306に進み、編集処理を行わない場合には、ステップ305に進む。
ステップ306にて、ユーザは、図6の遺伝子データの表示画面にて、編集処理を行うことができる。遺伝子データ編集処理部212は、(1)遺伝子型データ、(2)個体データ、(3)遺伝子座データ、の3つのデータに関して編集操作を行うことができる。編集処理が終了すると、ステップ303、304に戻る。
ステップ305にて、ハプロタイプ推定処理部216は、ハプロタイプ推定を行う。ユーザは、図6の遺伝子データの表示画面のボタン601を押す。それにより、遺伝子データ表示処理部211は、図22に示すハプロタイプ推定の結果表示画面を表示する。
以下、(1)遺伝子型データの編集方法を、図28、図7から図11を参照して説明し、(2)個体データの編集方法を、図29、図12から図16を参照して説明し、(3)遺伝子座データの編集方法を、図30、図17から図21を参照しながら説明する。
遺伝子型データの編集方法
図28の遺伝子データにおいて、person1のlocus1に記述されているA/ZをA/Tに修正する場合を例にとり、図7のフローチャートを説明する。尚、図8の編集手順画面、図9の編集前HTML形式遺伝子データ、図10の編集後HTML形式遺伝子データ、図11の編集結果画面、を随時参照する。
図28の遺伝子データにおいて、person1のlocus1に記述されているA/ZをA/Tに修正する場合を例にとり、図7のフローチャートを説明する。尚、図8の編集手順画面、図9の編集前HTML形式遺伝子データ、図10の編集後HTML形式遺伝子データ、図11の編集結果画面、を随時参照する。
ステップ700にて、ユーザは、図8の編集手順画面上にて、マウスポインタ800を編集したい画面要素上の位置に移動させて、マウスの右ボタンを押す。ここでは、A/ZをA/Tに修正するのでA/Zの場所にマウスポインタ800を移動し、マウスの右ボタンを押す。ステップ701にて、遺伝子型データ編集処理部213は、図9のHTML形式の遺伝子データの内、マウスポインタ800が指示した座標を含むタグで挟まれた画面要素の内の最下位の階層にある画面要素を選択する。つまり、図9の参照符号900の部分<td>A/Z</td>を選択する。一方、図8の編集手順画面では、ダイアログ801が表示される。ステップ702にて、ユーザはこのダイアログ801上にて編集作業を行う。ここで、空欄802にA、空欄803にTを入力してOKボタンを押す。遺伝子型データ編集処理部213は、図9のHTMLデータから図10のHTMLデータに変更する。図10の編集後HTML形式遺伝子データの参照符号1000に示すように、A/ZがA/Tに変更されている。編集後のHTMLデータは保存される。図11の編集結果画面に示すように、person1のlocus1に記述されているA/ZがA/Tに修正されている。
個体データの編集方法
図29の遺伝子データにおいて、person3のデータを削除する場合を例にとり、図12のフローチャートを説明する。尚、図13の編集手順画面、図14の編集前HTML形式遺伝子データ、図15の編集後HTML形式遺伝子データ、図16の編集結果画面、を随時参照する。
図29の遺伝子データにおいて、person3のデータを削除する場合を例にとり、図12のフローチャートを説明する。尚、図13の編集手順画面、図14の編集前HTML形式遺伝子データ、図15の編集後HTML形式遺伝子データ、図16の編集結果画面、を随時参照する。
ステップ1200にて、ユーザは、図13の編集手順画面上にて、マウスポインタ1300を編集したい画面要素上の位置に移動させて、マウスの右ボタンを押す。ここでは、person3の行を編集するのでperson3の場所にマウスポインタ1300を移動し、マウスの右ボタンを押す。ステップ1201にて、個体データ編集処理部214は、図14のHTML形式の遺伝子データの内、マウスポインタ1300が指示した座標を含むタグで挟まれた画面要素の内の最下位の階層にある画面要素を選択する。つまり、図14の参照符号1400の部分<td>person3</td>を選択する。一方、図13の編集手順画面では、ダイアログ1301が表示される。ユーザはこのダイアログ1301上にて編集作業を行う。ステップ1202は、編集作業が個体データの削除か又は個体名の変更かの判定ステップである。
単に、個体名を変更する場合は、ステップ1203にて、ユーザは、ダイアログ1301上のラジオボタン1302にチェックして、空欄1303に変更後の個体名を入力し、OKボタンを押す。person3の個体データを削除する場合は、ステップ1204にて、ユーザは、ダイアログ1301上のラジオボタン1304にチェックして、OKボタンを押す。個体データ編集処理部214は、図14のHTML形式の遺伝子データの内、マウスポインタ1300が指示した要素1400である<td>person3</td>の1階層上の画面要素1401の部分<tr aling=center>...</tr>)を選択して削除する。図15の編集後HTML形式遺伝子データでは、図14の画面要素1401の部分が削除されている。編集後のHTMLデータは保存される。図16の編集結果画面に示すように、person3の個体データが削除されている。
遺伝子座データの編集方法
図30の遺伝子データにおいて、locus2のデータを削除する場合を例にとり、図17のフローチャートを説明する。尚、図18の編集手順画面、図19の編集前HTML形式遺伝子データ、図20の編集後HTML形式遺伝子データ、図21の編集結果画面、を随時参照する。
図30の遺伝子データにおいて、locus2のデータを削除する場合を例にとり、図17のフローチャートを説明する。尚、図18の編集手順画面、図19の編集前HTML形式遺伝子データ、図20の編集後HTML形式遺伝子データ、図21の編集結果画面、を随時参照する。
ステップ1700にて、ユーザは、図18の編集手順画面上にて、マウスポインタ1800を編集したい画面要素上の位置に移動させて、マウスの右ボタンを押す。ここでは、locus2の列を編集するのでlocus2の場所にマウスポインタ1800を移動し、マウスの右ボタンを押す。ステップ1701にて、遺伝子座データ編集処理部215は、図19のHTML形式の遺伝子データの内、マウスがポイントした座標を含むタグで挟まれた画面要素の内の最下位の階層にある画面要素を選択する。つまり、図19の参照符号1900の部分<th>locus2</th>を選択する。一方、図18の編集手順画面では、ダイアログ1801が表示される。ユーザはこのダイアログ1801上にて編集作業を行う。ステップ1202は、編集作業が遺伝子座データの削除か又は遺伝子座名の変更かの判定ステップである。
単に、遺伝子座名を変更する場合は、ステップ1703にて、ユーザは、ダイアログ1801上のラジオボタン1802にチェックして、空欄1803に変更後の遺伝子座名を入力し、OKボタンを押す。locus2の遺伝子座データを削除する場合は、ステップ1704にて、ユーザは、ダイアログ1801上のラジオボタン1804にチェックして、OKボタンを押す。遺伝子座データ編集処理部215は、図19のHTML形式の遺伝子データの内、マウスポインタ1800が指示した要素1900に基いて、繰り返し要素1901、1902、...1907、...を選択して削除する。
具体的には、HTMLタグの位置情報を示すXpathを使って繰り返し要素を取得し、削除する。つまり、1900のXpathであるhtml,0/body,0/table,0/tr,0/th,2/を基準として、1901なら、html,0/body,0/table,0/tr,1/td,2/、1902なら、html,0/body,0/table,0/tr,2/td,2/、...というように、html,0/body,0/table,0/tr,x/td,2/(xは繰り返し回数)という繰り返し部分を取得して削除する。
図20の編集後HTML形式遺伝子データでは、図19の要素1900〜1907の部分が削除されている。編集後のHTMLデータは保存される。図21の編集結果画面に示すように、locus2のデータが削除されている。
ハプロタイプ推定
上述の編集処理後、ハプロタイプ推定をした結果、図22のハプロタイプ推定結果画面が表示される。ハプロタイプ推定結果によると、person1は、「A-G-T」と「A-C-C」を、person2は、「T-G-T」と「A-C-T」を、person3は、「A-C-T」と「A-C-T」を、person4は、「T-G-T」と「A-C-T」を、ハプロタイプとして持つと推定されたことを示している。
上述の編集処理後、ハプロタイプ推定をした結果、図22のハプロタイプ推定結果画面が表示される。ハプロタイプ推定結果によると、person1は、「A-G-T」と「A-C-C」を、person2は、「T-G-T」と「A-C-T」を、person3は、「A-C-T」と「A-C-T」を、person4は、「T-G-T」と「A-C-T」を、ハプロタイプとして持つと推定されたことを示している。
以上、本発明の遺伝子データの編集及び表示装置について、具体的な実施の形態を示して説明したが、本発明はこれらに限定されるものではない。当業者であれば、本発明の要旨を逸脱しない範囲内において、上記各実施形態又は他の実施形態にかかる発明の構成及び機能に様々な変更・改良を加えることが可能である。
本発明の遺伝子データの編集及び表示装置は、ヒト、ヒト以外の動植物、その他の生物種であって染色体が2倍体、3倍体、4倍体等を形成するものでも利用することができる。
また、SNPだけではなくマイクロサテライトでも利用することができる。
また、SNPだけではなくマイクロサテライトでも利用することができる。
100…実験結果データベース、101…WWWサーバ、102…遺伝子データ、103…遺伝子データ解析装置、200…中央処理装置、210…プログラムメモリ、211…遺伝子データ表示処理部、212…遺伝子データ編集処理部、213…遺伝子型データ編集処理部、214…個体データ編集処理部、215…遺伝子座データ編集処理部、216…ハプロタイプ推定処理部、220…データメモリ、221…遺伝子データ、230…遺伝子データ格納データベース、240…表示装置、241…キーボード、242…マウス
Claims (1)
- データベースからWebページ形式の遺伝子データを読み出す遺伝子データ読み出しステップと、
上記Webページ形式の遺伝子データを用いて、個体名の項目欄と遺伝子座の項目欄の交差点に遺伝子型を記載した遺伝子型表を表示装置の画面に表示する表示ステップと、
入力装置を介して指示された命令に従って上記Webページ形式形式の遺伝子データを編集する編集ステップと、
上記入力装置からの指示に従って編集後の遺伝子データに基いてハプロタイプ解析を行う解析ステップと、
を有し、
上記編集ステップは、上記遺伝子型表のうち、特定の遺伝子型が選択された場合には、該遺伝子型データに対応するWebページ形式データを編集の対象とし、特定の個体名が選択された場合には、該個体名データに対応するWebページ形式データを編集の対象とし、特定の遺伝子座が選択された場合には、該遺伝子座データに対応するWebページ形式データを編集の対象とすることを特徴とする遺伝子データ解析方法をコンピュータに実行させるためにコンピュータによって読み取り可能なプログラム。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2005110027A JP2006293481A (ja) | 2005-04-06 | 2005-04-06 | 遺伝子データ解析方法プログラム |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2005110027A JP2006293481A (ja) | 2005-04-06 | 2005-04-06 | 遺伝子データ解析方法プログラム |
Publications (1)
Publication Number | Publication Date |
---|---|
JP2006293481A true JP2006293481A (ja) | 2006-10-26 |
Family
ID=37414022
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2005110027A Pending JP2006293481A (ja) | 2005-04-06 | 2005-04-06 | 遺伝子データ解析方法プログラム |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP2006293481A (ja) |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2002086161A1 (fr) * | 2001-04-19 | 2002-10-31 | Hubit Genomix, Inc. | Procede permettant d'evaluer le diplotype du genotype d'un individu |
JP2004234580A (ja) * | 2003-01-31 | 2004-08-19 | Fujitsu Ltd | ゲノム情報解析支援方法、ゲノム情報解析支援プログラムおよびゲノム情報解析支援装置 |
JP2004287645A (ja) * | 2003-03-20 | 2004-10-14 | Sangaku Renkei Kiko Kyushu:Kk | データベース入力サーバ装置及びデータベース入力システム |
JP2005044073A (ja) * | 2003-07-25 | 2005-02-17 | Ns Solutions Corp | 遺伝子解析装置、遺伝子解析方法およびそのプログラム |
-
2005
- 2005-04-06 JP JP2005110027A patent/JP2006293481A/ja active Pending
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2002086161A1 (fr) * | 2001-04-19 | 2002-10-31 | Hubit Genomix, Inc. | Procede permettant d'evaluer le diplotype du genotype d'un individu |
JP2004234580A (ja) * | 2003-01-31 | 2004-08-19 | Fujitsu Ltd | ゲノム情報解析支援方法、ゲノム情報解析支援プログラムおよびゲノム情報解析支援装置 |
JP2004287645A (ja) * | 2003-03-20 | 2004-10-14 | Sangaku Renkei Kiko Kyushu:Kk | データベース入力サーバ装置及びデータベース入力システム |
JP2005044073A (ja) * | 2003-07-25 | 2005-02-17 | Ns Solutions Corp | 遺伝子解析装置、遺伝子解析方法およびそのプログラム |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Lange et al. | Mendel: the Swiss army knife of genetic analysis programs | |
NCBI Resource Coordinators | Database resources of the national center for biotechnology information | |
Zweig et al. | UCSC genome browser tutorial | |
Liu et al. | PowerMarker: an integrated analysis environment for genetic marker analysis | |
Bernal et al. | Genomes OnLine Database (GOLD): a monitor of genome projects world-wide | |
Stein et al. | The generic genome browser: a building block for a model organism system database | |
Frazer et al. | VISTA: computational tools for comparative genomics | |
Gupta et al. | Gramene database: navigating plant comparative genomics resources | |
McGuffin et al. | The ModFOLD4 server for the quality assessment of 3D protein models | |
Blankenberg et al. | Galaxy: a web‐based genome analysis tool for experimentalists | |
Lamesch et al. | Using the Arabidopsis information resource (TAIR) to find information about Arabidopsis genes | |
Cheng et al. | SCRATCH: a protein structure and structural feature prediction server | |
Hillman‐Jackson et al. | Using galaxy to perform large‐scale interactive data analyses | |
Dubchak et al. | VISTA family of computational tools for comparative analysis of DNA sequences and whole genomes | |
Basu et al. | dicty B ase 2015: Expanding data and annotations in a new software environment | |
Grove et al. | Using WormBase: a genome biology resource for Caenorhabditis elegans and related nematodes | |
Bailey et al. | GAIA: framework annotation of genomic sequence | |
Dong et al. | Comparative EST analyses in plant systems | |
Hu et al. | Using TWINSCAN to predict gene structures in genomic DNA sequences | |
Tu et al. | Bioinformatics for analysis of poxvirus genomes | |
Karolchik et al. | Comparative genomic analysis using the UCSC genome browser | |
Li et al. | How to run the pharmacogenomics clinical annotation tool (PharmCAT) | |
US20040117348A1 (en) | Sequence display method and homology search method for facilitating access to information relating to regions of mutation and regions of similarity between plurality of sequences | |
Yuan et al. | Databases for wheat genomics and crop improvement | |
Mah et al. | A gentle introduction to SNP analysis: resources and tools |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20071221 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20101102 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20101221 |
|
A02 | Decision of refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A02 Effective date: 20110621 |