明 細 書 タンパク質構造解析方法、 タンパク質構造解析装置、 プログラム、 および、 記録媒体 技術分野
本発明 タンパク質構造解析方法、 タンパク質構造解析装置、 プログラム、 および、 記録媒体に関レ 特に計算手法により求めたタンパク質の立体構造データを生化学 的な実験手法により求めたデータにより補完することができるタンパク質構造解析方 ¾ タンパク質構造解析装置、 プログラム、 および、 記録媒体に関する。 背景技術
ヒトを始め多くの生物種において全ゲノム配列解析が進められ その配列情報がデー タベースィ匕されてレヽる (Ge r a r d o J i me n e z— S a n c h e z, Na t u r e 409, 853— 855 (200 1) ) 。 ここで、 ゲノム配列より、 遺伝子の 機能を特定、 予測することがある程度可能であるが、 配列情報のみでは機能を予測でき ない遺伝子が非常に多く存在する。 遺伝子 ί その DN Α配列から翻訳されたタンパク 質が実際に機能を担っている。 機能未知の遺伝子の場合において まずタンパク質の アミノ酸配列の相同性の高い機能既知のタンパク質を探し出すことにより、 その機能 を予測することが行われている。 しかしながら、機能既知のタンパク質が存在しない場 合が多くある。 その場合 f 立体構造の類似性の高いタンパク質を探し出し また ¾ 新 たに (d e n o v o) 立体構造を予測し機能予測をすることが可能である。
タンパク質が機能を発揮するために ¾ それにふさわしレ、立体構造を有していることが 不可欠である。 従って、アミノ酸配列の相同性を比較するよりも、 立 ί材冓造の相同性を 比較したほうが、 より精密な機能推定をすることができる。
立 «冓造未知のタンパク質アミノ酸配列から、 その立体構造を予測する方法として ホモロジーモデリング法が一般的である。 これは主に次の 4つのステップよりなる計 算科学的手法である。
(1) 任意のアミノ酸配列 (目的配列) が与えられたとき、 目的配列と類似の配列を
有するタンパク質 (参照タンパク質) を PDB (P r o t e i n Da t a Ba n k) のような立体構造データベースから、 単数もしくは複数検索 (ホモロジ一検索) し 目的配列と類似配列の間のァライメント (配列を並置したもの) を与える。
このデータベース検索、 ァライメントを行うために FASTA、 PS I -B L A ST、 L I BRAなどのコンピュータソフトがある。 FASTAは 20種類の天然ァ ミノ酸を意味する 20種のアルファべット文字配列のマッチングを行うプログラムで あり、 高ホモロジ一 (アミノ酸の一致度約 30%以上、 FAS T Aの e値では約 0. 01以下に相当) の参照タンパク質に対して立体構造構築をすると、 «性の高いモ デノレが構築出来るとされている。
ま PS I— BLASTで 同じように文字配列のマッチングを行う力 文字が一 致しているか否かの情報ではなく、 プロフアイノレと呼ばれる文字の一致の度合レ、を類縁 タンパク質の文字配列上部位ごとの置換行列として算出レ 更に繰り返し計算を行うこと によりァライメントを最適化する性質を持っている。
ま L I 8尺八は30—10法 (t h r e a d i n g法ともいう) に基づくプログ ラムであり、 既知立体構造をプローブにして類似配列を検索するため、 FASTA P S I—B LASTとは検索アルゴリズムが明らかに異なる。 そのため、 FASTAや P S I—B LASTとは異なる種類の配列間類似性を指摘できる場合がある。
(2) FASTA, PS I— BLAST、 L I B R Aなどにより算出したァライメン トを用いれ 目的配列と類似配列間のアミノ酸ごとの対応関係が決まるので、 この関 係に基づき、 参照タンパク質の 3次元座標から目的配列上のァミノ酸ごとの 3次元座 標を作成する。
( 3 ) 目的配列側に対応するァミノ酸が存在しなレ、場合に it 参照タンパク質側のそ の位置のァミノ酸座標は用いず、 逆に 参照タンパク質側に対応するァミノ酸が存在 しなレ、場合には その位置の目的配列上のァミノ酸座標 予め用意してぉレ、たタンパ ク質断片座標データベースから適切なものを検索して作成する。
(4) 上述の (2) および (3) によるタンパク質座標の構築で ί¾アミノ酸残基間 に構造的に不適切な隙間や衝突や歪みが生じることがあるので、 エネルギー極小化計算 により、 これらの構造的な歪みを解消する。 モデリングソフトによっては、この構造的
な歪みの解消をスムーズに行うため、 (2) 〜 (4) の計算及び検索処理をタンパク 質全原子に対して同時に行うのではなぐ段階的に行うものもある。 即ち、まずタンパク 質の骨格を形成する α炭素原子にっレ、て行い、次いで α炭素原子を含む主鎖原子につ いて行い、 最後に側鎖原子を含むタンパク質原子全体について行うものである。
以上により、 目的配列に対するァライメントが得られれば その立体構造を予測構 築することができる。
しかしながら、 計算科学により I n S i 1 i c oで構築されたタンパク質の立体構 造は実験による検証が全くなされていない。 ここで; タンパク質の立体構造情報を実験 的に測定する方法として〖 X線結晶構造解析、電子顕微敏 NMRなどがあるが、 いず れの方法も構造を求めるために 技術的に困難な上 時間と労力を要する作業を必 要とする。
ここで、 近年、 水素一重水素 (H/D) 交換反応と質量分析 (MS) を用いて、 タン パク質の立体構造情報を得る方法が報告されている。 例えば H/D交換反応を用いた 技術 特許出願 WO 00/39326 (Me t h o d s f o r qu a n t i f y i n g h e a v y h y d r o g e n l e v e l s a t s p e c i f i c p e p t i d e am i d e l i n k a g e s i n p r o t e i n a n d p e p t i d e) 、 および、文献 (Z h a n g, Z. a n d Sm i t h, D. L. , (1 993) P r o t e i n S c i . , 2, 522— 53 1. ) により開示さ れている。
これらの方法 ί 重水から調製した溶液に溶解したタンパク質を経時的にサンプリン ダレ これを酸性溶液中でペプシン消化を行レ、、得られたぺプチドを L C Sで測定 することにより、 ペプチドの質量変化速度より、 素化速度を算出する。 これにより、 重水素化速度が速 、ところは溶媒接触率が高レ、か揺らぎが大きレ、部位であり、 遅いとこ ろは溶媒接触率が低レ、部位であることがわかる。
しかしながら、 この方法においても、 多数のサンプリングの実施と測定時間の長い LC ZMSを行わなくてはならないという問題点がある。 ます ペプシン消化及び LC/MS 測定時において、 タンパク質の立体構造が著しく変化し これによりペプチド内、 ぺプチ ド間の H/Dスクランブリングが生じる可能性が高いという問題点もある。 後者の問
題点について ί 近年、 FT I CR— MS (フーリエ変換イオンサイクロトロン型質 量分析計) による断片化法であるキヤビラリ一スキマー C I D法を用いて、 ペプシン の代わりにタンパク質を断片化し H/D交換と併せてタンパク質一タンパク質相互 作用部位情報を得たという報告がある (Ak a s h i, S. , a n d Ta k i o, K. , (2000) P r o t e i n Sc i, 9, 2497— 2505. 、 明石知子 1¾48回 質量分析総合討論会 要旨集 p. 208 (2000) ) 力 依然として多 数のサンプリングの実施が必要であるという問題点が存在している。
ま 山田ら i FT I CR—MSによる断片化 ¾ 水素—重水素交換法 (HZD交 換法) とァフィ二ティークロマトグラフィーを組み合わせた方法により、 タンパク質 —タンパク質相互作用部位情報を得た報告がなされた (Y a ma d a N. , S u z uk i E. , H i r a y a m a K. , (2002) Ra p i d C o mm u n . Ma s s Sp e c t r om. , 16, 293— 299. )。 この方法で i 少ないサ ンプリングで相互作用部位情報を得ることができ ¾
前述のように 従来のタンパク質立体構造予測において アミノ酸配列から計算機 を利用して立体構造を構築していくが、 あくまでも仮想構造であり、 実験による検証がさ れていないため、 予測構造を実際の立体構造と比べて評価するために ί¾ X線結晶構造 解析や NMRなどを用いて構造解析を行わなくてはならない。 そのためにば; 大量のタ ンパク質の調製や、 結晶ィ 安定同位体ラベル化等を行わなければならず、 非常に手間 と時間を要する。
ま MSと H/D交換反応とを組み合わせる方法 ί 精度は低いが高感度でタンパ ク質の立体構造情報を得ることができる手法であるが、 依然として実験の手間と時間の かかる方法である。
¾έ て、 本発明 立体構造予測結果の評価や、 構造予測に有用な構造情報の提供が 可能であり、 高感度力つ迅速な立体構造情報の実測技術を提供することを目的としてい る。 発明の開示
本発明者 上記課題を解決するために タンパク質の立体構造情報を迅速にかつ高
感度で取得する方法を開発すべく、 質量分析 (MS) による断片化技術とそこから得ら れる構造情報について詳細に検討し その結果、 HZD交換反応による従来法 多 数のサンプリングが必要であること、および H/Dのスクランプリングが生じること 等の課題がまだあつ
そこで MSによるフラグメンテーションについて、 He X a p o 1 e a s s i s t e d c a p i l l a r y s k i mm e r C I D法 (以下、 「へキサポーノレ C I D¾| という。 ) と、赤外多光子解離 (I n f r a r e d mu l t i p h o t o n d i s s o c i a t i o n) 法 (以下、 「I RMPD という。 ) の測定法の検討と、 そ の手法により得られる断片化スぺクトルを鋭意検討した結果、 タンパク質の 2次構造、 3次構造、 揺らぎ等を反映した断片化が生じていることがわ力
よわ タンパク質の構造のうち aヘリックスや ]3ストランドなどの 2次構造をも つ強固な部分は断片化が起こりにくく、ノ プなど運動性の高い部位は断片化が生じや すいことが見出され
さらに 立体構造を知りたいタンパク質のアミノ酸配列から、 30— 10法を用ぃて 順位付けをした立体構造既知の候補タンパク質の 2次構造と比較することにより、 立体 構造予測に利用する候補タンパク質を絞り込むことができ
ま 計算手法による予測構造に MSによるタンパク質の断片化データを照会する ことにより、 予測構造を評価することができ
これらの各種の知見に基づいて本発明が完成されるに到っ
±3Φした目的を達成するため、 本発明にかかるタンパク質構造解析方法、 タンパク質 構造解析装置、および、 プログラム 立体構造を予測する対象タンパク質について断 片化して断片化スぺク トルを測定する断片化スぺク トル測定ステップ (断片化スぺク トル測定手段) と、 上記断片化スぺク トル測定ステップ (断片化スぺク トル測定手 段) により測定された上記断片化スぺクトルに基づいて、 上記対象タンパク質のアミ ノ酸配列に対する上記断片化ィオンの帰属情報を決定する帰属情報決定ステツプ
(帰属情報決定手段) と、上記帰属情報決定ステップ (帰属情報決定手段) により決 定された上記断片化イオンの上記帰属情報により、 上記対象タンパク質の上記ァミノ 酸配列にぉレ、て上記断片化ィオンに断片化された箇所を特定し 当該箇所に従って上記
対象タンパク質の上記ァミノ酸配列における切断容易領域情報を決定する切断容易 領域情報決定ステップ (切断容易領域情報決定手段) と、 上記対象タンパク質につい て立体構造を予測する立体構造予測ステップ (立体構造予測手段) と、上記立体構造 予測ステップ (立体構造予測手段) により予測された立体構造予測データと、 上記切 断容易領域情報決定ステップ (切断容易領域情報決定手段) により決定された上記切 断容易領域情報とを対応させて出力する処理結果出力ステップ (処理結果出力手段) とを含む (備える) ことを特徴とする。
この紘 装置、 および、 プログラムによれば、立 冓造を予測する対象タンパク質 についてエレクトロスプレーィオン化法などによりィオン化したィオンをへキサポー ル C I D法などにより断片化イオンに断片化し 断片化スぺクトルを測定し測定され た断片化スぺク トルに基づいて、 ¾ ^タンパク質のアミノ酸配列に対する断片化ィォ ンの帰属情報を決定し決定された断片化イオンの帰属情報により、 ^タンパク質 のァミノ酸配列にぉレ、て断片化イオンに断片化された箇所を特定し当該箇所に従って 対象タンパク質のアミノ酸配列における切断容易領域情報を決定レ対象タンパク質 について立体構造を予測し 予測された立体構造予測データと決定された切断容易領域 情報とを対応させて出力する (例えば グラフィック表 テーブルによる一覧表示な ど) ので、 立体構造未知のタンパク質 (これをコードする遺伝子を含む) の立体構造 予測を行う場合、 実測した立体構造情報を加味することにより、 精度の高い予測を行うこ とができるようになる。
つぎの発明にかかるタンパク質構造解析方& タンパク質構造解析装置、 および、 プ ログラム〖 上記に記載のタンパク質構造解析方法、 タンパク質構造解析装置、 およ び、 プログラムにおいて、上記処理結果出力ステップ (処理結果出力手段) 上記立 体構造予測データを針金モデル、 リボンモデル、パイプモデル、 ボールァンドスティ ックモデル、 また ί 空間充填モデルのうちいずれかのモデルによりグラフィック表示 し 上記切断容易領域情報を対応する上記立体構造予測データの表示部分に関連付け て表示することを特徴とする。
これは処理結果出力の一例を一層具体的に示すものである。 この方法、装置、および プログラムによれ ί 立体構造予測データを針金モデル、 リボンモデル、パイプモデ
ノレ、 ボールアンドスティックモデル、 また 空間充填モデルのうちいずれかのモデル によりグラフィック表示レ 切断容易領域情報を対応する立体構造予測データの表示 部分に関連付けて表示する (例えば リンクを設定、 モデル上に表 モデル上に切断 容易領域情報に対応する網掛けや斜線などの特定のパターン模様を表示など) ので、' これらの情報を視覚的に分かり易く表示することができるようになり、利用者が立体構 造予測データの信頼性を直感的に判断することができるようになる。
つぎの発明にかかるタンパク質構造解析方 タンパク質構造解析装置、 および、 プ ログラム ί 上記に記載のタンパク質構造解析方 タンパク質構造解析装置、 およ び、 プログラムにおいて、上記処理結果出力ステップ (処理結果出力手段) ί 上記切 断容易領域情報に従って対応する上記立体構造予測データの表示部分を色分けして表 示することを特 ί教とする。
これは処理結果出力の一例を一層具体的に示すものである。 この方法、装置、 および、 プログラムによれ ί グラフィック表示やテーブル表示を行う際に 切断容易領域情 報に従って対応する上記立体構造予測データの表示部分を色分けして表示するので、 こ れらの情報を視覚的に分かり易く表示することができるようになり、 禾 IJ用者が立体構造 予測データの信頼性を直感的に判断することができるようになる。
つぎの発明にかかるタンパク質構造解析方 タンパク質構造解析装置、 および、 プ ログラム ί 上記に記載のタンパク質構造解析方 タンパク質構造解析装置、 およ び、 プログラムにおいて、上記立体構造予測ステップ (立体構造予測手段) により予 測された立体構造予測データと、 上記切断容易領域情報決定ステップ (切断容易領域 情報決定手段) により決定された上記切断容易領域情報とを比較して、上記切断容易 領域情報により特定された切断容易領域に対応する予測構造部分について評価を行い 予測構造評価情報を決定する予測構造評価情報決定ステツプ (予測構造評価情報決 定手段) と、 上記予測構造評価情報決定ステップ (予測構造評価情報決定手段) によ り決定された予測構造評価情報を出力する予測構造評価情報出力ステップ (予測構造 評価情報出力手段) とをさらに含む (備える) ことを特徴とする。
この方 & 装置、 および、 プログラムによれば、予測された立体構造予測データと、決 定された切断容易領域情報とを比較して、 切断容易領域情報により特定された切断容易
領域に対応する予測構造部分について評価を行い予測構造評価情報を決定し決定さ れた予測構造評価情報を出力するので、 計算機により予測された予測構造を生化学実 験データに基づレ、て評価を行うことができるようになり、 予測精度を著しく向上させること ができるようになる。
ま これにより、 ゲノム配列解析、 DNAチップを用いた発現プロフアイリング解 析、 プロテオーム解析などで見つ力 た興味深レ、遺伝子'タンパク質の機能解析を行う 場合、 立体構造を基準とした機能予測の精度が格段に向上するようになり、 ま ゲノム 配列解析において 機能未知の遺伝子'タンパク質の立体構造を考慮した機能予測 を行うことにより効率的に機能を推定することができるようになる。 さらに、 これにより、 阻害剤などのドラッグデザィンゃ蛋白質工学による活性向上や機能改変体のデザィ ンを効率的に行うことができるようになる。
つぎの発明にかかるタンパク質構造解析方法、 タンパク質構造解析装置、 および、 プ ログラム 上記に記載のタンパク質構造解析方法、 タンパク質構造解析装置、 およ び プログラムにおいて、上記対象タンパク質について基準振動計算を行う基準振動計 算ステップ (基準振動計算手段) をさらに含み (備え) 、 上記処理結果出力ステップ (処理結果出力手段) 上記基準振動計算ステップ (基準振動計算手段) による計 算結果を対応する上記立体構造予測データの表示部分に関連付けて表示することを特 徴とする。
この方& 装置、 および、 プログラムによれば、文檢タンパク質について基準振動計算 を行い、 基準振動計算結果 (例えば 揺らぎの情報など) を対応する立体構造予測デ —タの表示部分に関連付けて表示する (例えば 立体構造モデル上にべクトル表示を 行う) ので、 切断容易領域として揺らぎの情報を考慮することができるようになる。 すな わ ¾ 基準振動計算結果により揺らぎ情報を求め、 M S実測デ一タと比較することによ り予測モデルの評価を行うことができるようになる。
つぎの発明にかかるタンパク質構造解析方 タンパク質構造解析装置、 および プ ログラム ί 上記に記載のタンパク質構造解析方法、 タンパク質構造解析装置、 およ び プログラムにおいて、上記断片化スぺクトル測定ステップ (断片化スぺクトル測 定手段) へキサポール C I D¾ ノズノレスキマー C I D法、 キヤビラリースキマ
一 C I D法、 S O R I - C I D法、 および、 マルチポールストァー補助キヤビラリ一 スキマー C I D法を含む衝突活性化解離 (C I D) & I RMP D法、インソース分 解 (I S D) 法、 ボストソース分解 (P S D) & 表面誘起解離 (S I D) 法、 E C Dife および、 B I R D法のうち少なくとも一つの方法により上記対象タンパク質につ いて断片化イオンに断片化し上記断片化スぺク トルを測定することを特徴とする。
これは断片化スぺク トル測定の一例を一層具体的に示すものである。 この方& 装置、 および、 プログラムによれば 立体構造を予測する対象タンパク質についてへキサポ —ノレ C I 去、 ノズルスキマー C I D キヤビラリースキマ一 C I D S O R I — C I D¾ および、 マルチポ一ルストァー補助キヤビラリースキマー C I D法を含 む衝突活性化解離 (C I D) 法、 I RM P D法、 インソース分解 (I S D) 法、 ポス トソース分解 (P S D) 表面誘起解離 ( S I D) & E C D¾ および、 B I R D 法のうち少なくとも一つの方法により上記対象タンパク質について断片化イオンに断片 化し上記断片化スぺクトルを測定するので、 タンパク質の立体構造を反映した断 片化イオンを効率的に作成することができるようになる。
つぎの発明にかかるタンパク質構造解析方法、 タンパク質構造解析装置、 および、 プ ログラム 上記に記載のタンパク質構造解析方 タンパク質構造解析装置、 およ び、 プログラムにおいて、上記断片化スぺクトル測定ステップ (断片化スぺクトル測 定手段) 酵素反応により上記対象タンパク質について断片化を行い上記断片化ス ぺク トルを測定することを特徴とする。
これは断片化スぺク トル測定の一例を一層具体的に示すものである。 この方法、 装置、 および、 プログラムによれば、 酵素反応により対象タンパク質につレ、て断片化を行い 断片化スぺク トルを測定するので、 対象タンパク質の立体構造を反映した断片化を効 率的に行うことができるようになる。
つぎの発明にかかるタンパク質構造解析方& タンパク質構造解析装置、 および、 プ ログラム ί 立体構造を予測する対象タンパク質について断片化して断片化スぺクト ルを測定する断片化スぺクトル測定ステップ (断片化スぺク トル測定手段) と、 上記 断片化スぺク トル測定ステップ (断片化スぺク トル測定手段) により測定された上記 断片化スぺク トルに基づいて、 上記対象タンパク質のアミノ酸配列に対する上記断片
化イオンの帰属情報を決定する帰属情報決定ステップ (帰属情報決定手段) と、 上記 断片化スペク トル測定ステップ (断片化スペク トル測定手段) により測定された上記 断片化スぺクトル、 および、 上記帰属情報決定ステップ (帰属情報決定手段) により 決定された上記断片化ィオンの上記帰属情報に従って、 上記対象タンパク質の上記ァ ミノ酸配列において溶媒に接触している箇所を特定レ 当該箇所に従って上記対象タン パク質の上記ァミノ酸配列における溶媒接触残基情報を決定する溶媒接触残基情報 決定ステツプ (溶媒接触残基情報決定手段) と、上記対象タンパク質にっレ、て立体構 造を予測する立体構造予測ステップ (立体構造予測手段) と、 上記立体構造予測ステ ップ (立体構造予測手段) により予測された立体構造予測データと、 上記溶媒接触残 基情報決定ステップ (溶媒接触残基情報決定手段) により決定された上記溶媒接触残 基情報とを対応させて出力する処理結果出力ステップ (処理結果出力手段) とを含む
(備える) ことを特徴とする。 '
この方 ¾ 装置、 および、 プログラムによれば、立術冓造を予測する対象タンパク質 について断片化レ 断片化スぺク トルを測定し測定された断片化スぺク トルに基づい て、 ¾^タンパク質のアミノ酸配列に対する断片化イオンの帰属情報を決定レ 測定さ れた断片化スぺク トル、および、 決定された断片化イオンの帰属情報に従って、 ¾*タ ンパク質のアミノ酸配列において溶媒に接触している箇所を特定レ 当該箇所に従って 対象タンパク質のァミノ酸配列における溶媒接触残基情報を決定し対象タンパク質 について立体構造を予測レ 予測された立体構造予測データと決定された溶媒接触残基 情報とを対応させて出力する (例え ί グラフィック表 テーブルによる一覧表示な ど) ので、 立体構造未知のタンパク質 (これをコードする遺伝子を含む) の立体構造 予測を行う^、 実測した立体構造情報を加味することにより、 精度の高い予測を行うこ とができるようになる。
つぎの発明にかかるタンパク質構造解析方法、 タンパク質構造解析装置、 および、 プ ログラム ί 上記に記載のタンパク質構造解析方法、 タンパク質構造解析装置、 およ び、 プログラムにおいて、上記処理結果出力ステップ (処理結果出力手段) 上記立 体構造予測データを針金モデル、 リポンモデル、パイプモデル、 ボールアンドスティ ックモデル、 また ί 空間充填モデルのうちいずれかのモデルによりグラフィック表示
し 上記溶媒接触残基情報を対応する上記立体構造予測データの表示部分に関連付け て表示することを特徴とする。
これは処理結果出力の一例を一層具体的に示すものである。 この方法、装置、 および、 プログラムによれば、 立体構造予測データを針金モデル、 リボンモデル、パイプモデ ノレ、 ボールァンドスティックモデル、 また ¾ 空間充填モデルのうちレ、ずれかのモデル によりグラフィック表示レ溶媒接触残基情報を対応する立体構造予測データの表示 部分に関連付けて表示する (例えば リンクを設定、 モデノレ上に表承モデル上に溶媒 接触領域情報に対応する網掛けや斜線などの特定のパターン模様を表示など) ので、 これらの情報を視覚的に分かり易く表示することができるようになり、利用者が立体構 造予測データの信頼性を直感的に判断することができるようになる。
つぎの発明にかかるタンパク質構造解析方法、 タンパク質構造解析装置、 および、 プ ログラム f¾ 上記に記載のタンパク質構造解析方法、 タンパク質構造解析装置、 およ び、 プログラムにおいて、 上記処理結果出力ステップ (処理結果出力手段) 上記溶 媒接触残基情報に従って対応する上記立体構造予測データの表示部分を色分けして表 示することを特徴とする。
これは処理結果出力の一例を一層具体的に示すものである。 この方法、装置、 および プログラムによれば グラフィック表示やテーブル表示を行う際に 接触残基情 報に従って対応する上記立体構造予測データの表示部分を色分けして表示するので、 こ れらの情報を視覚的に分かり易く表示することができるようになり、 禾 ϋ用者が立体構造 予測データの信頼性を直感的に判断することができるようになる。
つぎの発明にかかるタンパク質構造解析方法、 タンパク質構造解析装置、 および、 プ ログラム 上記に記載のタンパク質構造解析方 タンパク質構造解析装置、 およ び、 プログラムにおいて、 上記立体構造予測ステップ (立体構造予測手段) により予 測された立体構造予測データと、 上記溶媒接触残基情報決定ステップ (溶媒接触残基 情報決定手段) により決定された上記溶媒接触残基情報とを比較して、上記溶媒接触 残基情報により特定された溶媒接触残基に対応する予測構造部分にっレ、て評価を行い 予測構造評価情報を決定する予測構造評価情報決定ステツプ (予測構造評価情報決 定手段) と、 上記予測構造評価情報決定ステップ (予測構造評価情報決定手段) によ
り決定された予測構造評価情報を出力する予測構造評価情報出力ステップ (予測構造 評価情報出力手段) とをさらに含む (備える) ことを特徴とする。
この方& 装置、 および、 プログラムによれば、予測された立体構造予測データと、 決 定された溶媒接触残基情報とを比較して、溶媒接触残基情報により特定された溶媒接触 残基に対応する予測構造部分について評価を行い予測構造評価情報を決定レ決定さ れた予測構造評価情報を出力するので、 計算機により予測された予測構造を生化学実 験データに基づいて評価を行うことができるようになり、 予測精度を著しく向上させること ができるようになる。
ま これにより、 ゲノム配列解析、 D NAチップを用いた発現プロフアイリング解 析、 プロテオーム解析などで見つ力つた興味深い遺伝子,タンパク質の機能解析を行う 場合、 立体構造を基準とした機能予測の精度が格段に向上するようになり、 また、 ゲノム 配列解析において 機能未知の遺伝子 ·タンパク質の立体構造を考慮した機能予測 を行うことにより効率的に機能を推定することができるようになる。 さらに、これにより、 阻害剤などのドラッグデザィンゃ蛋白質工学による活性向上や機能改変体のデザィ ンを効率的に行うことができるようになる。
つぎの発明にかかるタンパク質構造解析方法、 タンパク質構造解析装置、 および プ ログラム ί¾ 上記に記載のタンパク質構造解析方法、 タンパク質構造解析装置、 およ び、 プログラムにおいて、上記対象タンパク質について基準振動計算を行う基準振動計 算ステップ (基準振動計算手段) をさらに含み (備え) 、 上記処理結果出力ステップ (処理結果出力手段) ί 上記基準振動計算ステップ (基準振動計算手段) による計 算結果を対応する上記立体構造予測データの表示部分に関連付けて表示することを特 徴とする。
この方 ¾ 装置、 および、 プログラムによれば、 タンパク質について基準振動計算 を行い、 基準振動計算結果 (例えば 揺らぎの情報など) を対応する立体構造予測デ ータの表示部分に関連付けて表示する (例え f 立体構造モデル上にべクトル表示を 行う) ので、溶媒接触領域として揺らぎの情報を考慮することができるようになる。 すな わ^ 基準振動計算結果により揺らぎ情報を求め、 M S実測データと比較することによ り予測モデルの評価を行うことができるようになる。
つぎの発明にかかるタンパク質構造解析方& タンパク質構造解析装置、 および、 プ ログラム 上記に記載のタンパク質構造解析方 ¾ タンパク質構造解析装置、 およ び、 プログラムにおいて、上記断片化スぺクトル測定ステップ (断片化スぺクトル測 定手段) i 上記対象タンパク質につレ、て水素—重水素交換反応を行った後、 断片化し 上記断片化スぺクトルを測定レ 上記溶媒接触残基情報決定ステップ (溶媒接触残基 情報決定手段) ί 上記断片化スぺクトル測定ステップ (断片化スぺクトル測定手 段) により測定された上記断片化スぺク トル、 および、 上記帰属情報決定ステップ
(帰属情報決定手段) により決定された上記断片化ィオンの上記帰属情報に従って、 上記対象タンパク質の上記ァミノ酸配列中の各ァミノ酸残基における重水素化速度 を決定し 当該重水素化速度に従って上記対象タンパク質の上記ァミノ酸配列におい て溶媒に接触している箇所を特定レ 当該箇所に従って上記対象タンパク質の上記ァミ ノ酸配列における溶媒接触残基情報を決定することを特徴とする。
これは断片化スぺク トル測定の一例を一層具体的に示すものである。 この方 & 装置、 および プログラムによれば 対象タンパク質について水素一重水素交換反応を行った 後、 断片化し断片化スぺク トルを測定し 測定された断片化スぺク トル、および、 決定さ れた断片化イオンの帰属情報に従って、 ^タンパク質のァミノ酸配列中の各ァミノ 酸残基における重水素化速度を決定し 当該重水素化速度に従って対象タンパク質の ァミノ酸配列において溶媒に接触している箇所を特定し 当該箇所に従って対象タンパ ク質の上記ァミノ酸配列における溶媒接触残基情報を決定するので、効率的に溶媒接 触情報を求めることができるようになる。
つぎの発明にかかるタンパク質構造解析方法、 タンパク質構造解析装置、 および、 プ ログラム ¾ 上記に記載のタンパク質構造解析方法、 タンパク質構造解析装置、 およ び、 プログラムにおいて、上記断片化スぺクトル測定ステップ (断片化スぺクトル測 定手段) 上記対象タンパク質について化学修飾を行った後、 断片化し上記断片化ス ぺクトルを測定し 上記溶媒接触残基情報決定ステップ (溶媒接触残基情報決定手 段) 上記断片化スぺク トル測定ステップ (断片化スぺク トル測定手段) により測 定された上記断片化スぺク トル、 および、 上記帰属情報決定ステップ (帰属情報決定 手段) により決定された上記断片化イオンの上記帰属情報に従って、 上記対象タンパ
ク質の上記ァミノ酸配列中の各ァミノ酸残基における化学修飾部分を決定し 当該ィ匕 学修飾部分に従って上記対象タンパク質の上記ァミノ酸配列において溶媒に接触して いる箇所を特定し 当該箇所に従って上記対象タンパク質の上記ァミノ酸配列におけ る溶媒接触残基情報を決定することを特徴とする。
これは断片化スぺク トル測定の一例を一層具体的に示すものである。 この方 装置、 および、 プログラムによれば 対象タンパク質について化学修飾を行った後、 断片化し 断片化スぺクトルを測定し 測定された断片化スぺクトル、 および、 決定された断片化 イオンの帰属情報に従って、 タンパク質のアミノ酸配列中の各アミノ酸残基にお ける化学修飾部分を決定し 当該化学修飾部分に従って対象タンパク質のアミノ酸配 列において溶媒に接触している箇所を特定し 当該箇所に従って対象タンパク質のアミ ノ酸配列における溶媒接触残基情報を決定するので、 効率的に溶媒接触情報を求める ことができるようになる。
つぎの発明にかかるタンパク質構造解析方 タンパク質構造解析装置、 および、 プ ログラム 上記に記載のタンパク質構造解析方法、 タンパク質構造解析装置、 およ び、 プログラムにおいて、上記断片化スぺクトル測定ステップ (断片化スぺクトル測 定手段) ί へキサポール C I D& ノズルスキマー C I D法、 キヤビラリ一スキマ 一 C I D法、 S O R I— C I D& および、 マルチポールス トァー補助キヤビラリ一 スキマー C I D法を含む衝突活性化解離 (C I D) & I RMP D法、インソース分 解 (I S D) 法、 ボストソース分解 (P S D) 法、 表面誘起解離 (S I D) 法、 E C D法、 および、 B I R D法のうち少なくとも一つの方法により上記対象タンパク質につ いて断片化イオンに断片化し上記断片化スぺク トルを測定することを特徴とする。
これは断片化スぺクトル測定の一例を一層具体的に示すものである。 この方& 装置、 および プログラムによれば、 立体構造を予測する対象タンパク質についてへキサポ 一ノレ C I ノズノレスキマー C I D法、 キヤビラリースキマー C I D法、 S O R I - C I D& および、 マルチポールストァ一補助キヤビラリースキマ一 C I D法を含 む衝突活性化解離 (C I D) 法、 I RMP D法、インソース分解 ( I S D) & ボス トソース分解 (P S D) 法、 表面誘起解離 (S I D) 法、 E C D¾ および、 B I R D 法のうち少なくとも一つの方法により上記対象タンパク質について断片化イオンに断片
化し上記断片化スぺク トルを測定するので、 ^タンパク質の立体構造を反映した断 片化ィオンを効率的に作成することができるようになる。
つぎの発明にかかるタンパク質構造解析方 ¾ タンパク質構造解析装置、 および、 プ ログラム 上記に記載のタンパク質構造解析方 タンパク質構造解析装置、 およ び、 プログラムにおいて、上記断片化スぺク トル測定ステップ (断片化スぺク トル測 定手段) ί 酵素反応により上記対象タンパク質につレ、て断片化を行い上記断片化ス ぺクトルを測定することを特徴とする。
これは断片化スぺク トル測定の一例を一層具体的に示すものである。 この方 ¾ 装置、 および、 プログラムによれ 酵素反応により対象タンパク質について断片化を行い、 H/D交換法や化学修飾法を組み合わせることにより、 溶媒接触部位情報等を効率的 に得ることができるようになる。
つぎの発明にかかるタンパク質構造解析方法、 タンパク質構造解析装置、 および、 プ ログラム ί 立体構造を予測する対象タンパク質と化合物との複合体について断片化レ 断片化スぺク トルを測定する断片化スぺク トル測定ステップ (断片化スぺク トル測 定手段) と、 上記断片化スぺク トル測定ステップ (断片化スぺク トル測定手段) によ り測定された上記断片化スぺク トルに基づいて、 上記対象タンパク質および Ζまたは 上記化合物に対する断片化イオンの帰属情報を決定する帰属情報決定ステップ (帰 属情報決定手段) と、 上記断片化スぺクトル測定ステップ (断片化スぺクトル測定手 段) により測定された上記断片化スぺク トル、 および、 上記帰属情報決定ステップ
(帰属情報決定手段) により決定された上記断片化ィオンの上記帰属情報に従って、 上記对象タンパク質および/または上記化合物に関する相互作用界面情報を決定する 相互作用界面情報決定ステップ (相互作用界面情報決定手段) と、 上記対象タンパク 質および/または上記化合物について立体構造を予測する立体構造予測ステップ (立 体構造予測手段) と、 上記立体構造予測ステップ (立体構造予測手段) により予測さ れた立体構造予測データと、 上記相互作用界面情報決定ステップ (相互作用界面情報 決定手段) により決定された上記相互作用界面情報とを対応させて出力する処理結果 出力ステップ (処理結果出力手段) とを含む (備える) ことを特徴とする。
この方 & 装置、 および、 プログラムによれば、立體造を予測する対象タンパク質と
化合物 (例えば タンパク質や低分子化合物や核酸など) との複合体について断片化し 断片化スぺク トルを測定レ 測定された断片化スぺク トルに基づいて、対象タンパク質 および Zまたは化合物に対する断片化イオンの帰属情報を決定レ 測定された断片化 スぺクトル、 および、 決定された断片化イオンの帰属情報に従って、 ¾ タンパク質お よび または化合物に関する相互作用界面情報を決定し 対象タンパク質および Zま たは化合物について立体構造を予測し 予測された立体構造予測データと、決定された 相互作用界面情報とを対応させて出力する (例えば グラフィック表示、テーブルによ る一覧表示など) ので、立体構造未知のタンパク質 (これをコードする遺伝子を含 む) の立体構造予測を行う場合、 実測した立体構造情報を加味することにより、 精度の 高い予測を行うことができるようになる。
つぎの発明にかかるタンパク質構造解析方法、 タンパク質構造解析装置、 および、 プ ログラム ί 上記に記載のタンパク質構造解析方法、 タンパク質構造解析装置、 およ び、 プログラムにおいて、上記処理結果出力ステップ (処理結果出力手段) 上記立 体構造予測データを針金モデル、 リボンモデル、 ノ ィプモデル、 ボールァンドスティ ックモデル、 また 空間充填モデルのうちいずれかのモデルにより上記対象タンパク 質および または上記化合物についてグラフィック表示レ 上記相互作用界面情報を 対応する上記立体構造予測データの表示部分に関連付けて表示することを特徴とする。 これは処理結果出力の一例を一層具体的に示すものである。 この方法、装置、 および、 プログラムによれ ί 立体構造予測データを針金モデル、 リボンモデル、パイプモデ ノレ、 ボールアンドスティックモデル、 または 空間充填モデルのうちいずれかのモデル により対象タンパク質および Ζまたは化合物についてグラフィック表示 (例えば ド ッキングシミュレーションなども含む) レ相互作用界面情報を対応する立体構造予 測データの表示部分に関連付けて表示する (例えば リンクを設定、モデル上に表^ モデル上に相互作用界面情報に対応する網掛けや斜線などの特定のパターン模様を表 示など) ので、 これらの情報を視覚的に分かり易く表示することができるようになり、禾 iJ 用者が立体構造予測データの信頼性を直感的に判断することができるようになる。
つぎの発明にかかるタンパク質構造解析方法、 タンパク質構造解析装置、 および、 プ ログラム ί 上記に記載のタンパク質構造解析方 タンパク質構造解析装置、 およ
び、 プログラムにおいて、上記処理結果出力ステップ (処理結果出力手段) 上記相 互作用界面情報に従って上記対象タンパク質および Zまたは上記化合物の対応する上 記立体構造予測データの表示部分を色分けして表示することを特徴とする。
これは処理結果出力の一例を一層具体的に示すものである。 この方法、装置、 および、 プログラムによれば グラフィック表示やテーブル表示を行う際に 相互作用界面情 報に従って対象タンパク質および/または化合物の対応する上記立体構造予測データ の表示部分を色分けして表示するので、 これらの情報を視覚的に分かり易く表示するこ とができるようになり、利用者が立体構造予測データの信頼性を直感的に判断すること ができるようになる。
つぎの発明にかかるタンパク質構造解析方法、 タンパク質構造解析装置、 および プ ログラム ί 上記に記載のタンパク質構造解析方 タンパク質構造解析装置、 およ び、 プログラムにおいて、上記立体構造予測ステップ (立体構造予測手段) により予 測された立体構造予測データと、 上記相互作用界面情報決定ステップ (相互作用界面 情報決定手段) により決定された上記相互作用界面情報とを比較して、上記相互作用 界面情報により特定された相互作用界面に対応する予測構造部分について評価を行い 予測構造評価情報を決定する予測構造評価情報決定ステップ (予測構造評価情報決 定手段) と、 上記予測構造評価情報決定ステップ (予測構造評価情報決定手段) によ り決定された予測構造評価情報を出力する予測構造評価情報出カステツプ (予測構造 評価情報出力手段) とをさらに含む (備える) ことを特徴とする。
この方 ¾ 装置、 および、 プログラムによれば、予測された立体構造予測データと、決 定された相互作用界面情報とを比較して、 相互作用界面情報により特定された相互作用 界面に対応する予測構造部分にっレ、て評価を行い予測構造評価情報を決定し 決定さ れた予測構造評価情報を出力するので、 計算機により予測された予測構造を生化学実 験データに基づいて評価を行うことができるようになり、 予測精度を著しく向上させること ができるようになる。
ます これにより、 ゲノム配列解析、 D NAチップを用いた発現プロフアイリング解 析、 プロテオ一ム解析などで見つ力、つた興味深い遺伝子'タンパク質の機能解析を行う 場合、 立体構造を基準とした機能予測の精度が格段に向上するようになり、 ま ゲノム
配列解析において f¾機能未知の遺伝子' タンパク質の立体構造を考慮した機能予測 を行うことにより効率的に機能を推定することができるようになる。 さらに、モデル構造 と活性部位 (相互作用部位) 情報から、 阻害剤などのドラッグデザインや蛋白質工学 による活性向上 機能改変体のデザィンが可能とな ¾
つぎの発明にかかるタンパク質構造解析方法、 タンパク質構造解析装置、 および、 プ ログラム 上記に記載のタンパク質構造解析方法、 タンパク質構造解析装置、 およ び、 プログラムにおいて、上記対象タンパク質および Zまたは上記化合物について基準 振動計算を行う基準振動計算ステップ (基準振動計算手段) をさらに含み (備え) 、 上記処理結果出力ステップ (処理結果出力手段) 上記基準振動計算ステップ (基 準振動計算手段) による計算結果を対応する上記立体構造予測データの表示部分に 関連付けて表示することを特徴とする。
この方 装置、 および、 プログラムによれば、舰タンパク質および Zまたは化合物 について基準振動計算を行い、 基準振動計算結果 (例えば 揺らぎの情報など) を対応 する立体構造予測データの表示部分に関連付けて表示する (例え ί 立体構造モデル 上にべクトル表示を行う) ので、 相互作用界面領域として揺らぎの情報を考慮すること ができるようになる。 すなわ 基準振動計算結果により揺らぎ情報を求め、 M S実測 データと比較することにより予測モデルの評価を行うことができるようになる。
つぎの発明にかかるタンパク質構造解析方法、 タンパク質構造解析装置、 および、 プ ログラム ί 上記に記載のタンパク質構造解析方法、 タンパク質構造解析装置、 およ び、 プログラムにおいて、上記断片化スぺクトル測定ステップ (断片化スぺク トル測 定手段) 上記対象タンパク質と上記化合物との上記複合体について水素一重水素 交換反応を行った後、 断片化し上記断片化スぺク トルを測定レ上記相互作用界面情報 決定ステップ (相互作用界面情報決定手段) 上記断片化スぺク トル測定ステップ (断片化スぺク トル測定手段) により測定された上記断片化スぺク トル、 および、 上 記帰属情報決定ステップ (帰属情報決定手段) により決定された上記断片化イオンの 上記帰属情報に従って、上記対象タンパク質および Ζまたは上記化合物における重水 素化速度を決定し 当該重水素化速度に従って上記対象タンパク質および Ζまたは上 記化合物において相互作用界面を特定し 当該相互作用界面に従って上記対象タンパ
ク質および/または上記化合物における相互作用界面情報を決定することを特徴とす る。
これは断片化スぺクトル測定の一例を一層具体的に示すものである。 この方法、 装置、 および プログラムによれ 対象タンパク質と化合物との複合体について水素一重水 素交換反応を行った後、断片化し上記断片化スぺク トルを測定し 測定された断片化ス ぺク トル、 および、 決定された断片化イオンの帰属情報に従って、 雕タンパク質およ び または化合物における重水素化速度を決定し 当該重水素化速度に従って対象タン パク質および Zまたは化合物において相互作用界面を特定レ 当該相互作用界面に従つ て対象タンパク質および zまたは化合物における相互作用界面情報を決定するので、 効率的に相互作用界面情報を求めることができるようになる。
つぎの発明にかかるタンパク質構造解析方 ¾ タンパク質構造解析装置、 および、 プ ログラム 上記に記載のタンパク質構造解析方 タンパク質構造解析装置、 およ び、 プログラムにおいて、上記断片化スぺクトル測定ステップ (断片化スぺクトル測 定手段) 上記対象タンパク質と上記化合物との上記複合体について化学修飾を行 つた後、 断片化し上記断片化スぺク トルを測定レ上記相互作用界面情報決定ステップ (相互作用界面情報決定手段) ί 上記断片化スぺク トル測定ステップ (断片化スぺ クトル測定手段) により測定された上記断片化スぺクトル、 および、上記帰属情報決 定ステップ (帰属情報決定手段) により決定された上記断片化イオンの上記帰属情報 に従って、 上記対象タンパク質および または上記化合物における化学修飾部分を決 定し 当該ィヒ学修飾部分に従って上記対象タンパク質および Ζまたは上記化合物におい て相互作用界面を特定し、 当該相互作用界面に従って上記対象タンパク質および また は上記化合物における相互作用界面情報を決定することを特徴とする。
これは断片化スぺク トル測定の一例を一層具体的に示すものである。 この方法、 装置、 および、 プログラムによれ ί 対象タンパク質と化合物との複合体について化学修飾を 行った後、 断片化し断片化スぺクトルを測定し測定された断片化スぺク トル、 および、 決定された断片化イオンの帰属情報に従って、対象タンパク質および/または化合物に おける化学修飾部分を決定し 当該化学修飾部分に従って対象タンパク質および,また は化合物において相互作用界面を特定レ 当該相互作用界面に従って対象タンパク質
および/または化合物における相互作用界面情報を決定するので、 効率的に相互作用 界面情報を求めることができるようになる。
つぎの発明にかかるタンパク質構造解析方法、 タンパク質構造解析装置、 および、 プ ログラムは 上記に記載のタンパク質構造解析方法、 タンパク質構造解析装置、 およ び、 プログラムにおいて、上記断片化スぺク トル測定ステップ (断片化スぺクトル測 定手段) へキサポール C I D法、 ノス'ノレスキマ一 C I D法、 キヤビラリースキマ 一 C I SOR I— C I D¾ および、 マルチポールストァー補助キヤビラリ一 スキマー C I D法を含む衝突活性化解離 (C I D) & I RMPD法、インソース分 解 U SD) 法、 ポストソース分解 (PSD) 法、 表面誘起解離 (S I D) & EC D法、 および、 B I RD法のうち少なくとも一つの方法により上記対象タンパク質と上 記化合物との上記複合体について断片化イオンに断片化し上記断片化スぺク トルを測 定することを特 ί敷とする。
これは断片化スぺク トル測定の一例を一層具体的に示すものである。 この方 ¾ 装置、 および、 プログラムによれ 立体構造を予測する対象タンパク質についてへキサポ ール C I D¾ ノズルスキマ一 C I D法、 キヤビラリースキマー C I D法、 SOR I -C I D¾ および、 マルチポールストァー補助キヤビラリースキマー C I D法を含 む衝突活性化解離 (C I D) 法、 IRMPD法、インソース分解 (I SD) 法、 ボス トソース分解 (P SD) 法、 表面誘起解離 (S I D) 法、 ECDife および、 B I RD 法のうち少なくとも一つの方法により対象タンパク質と化合物との複合体について断片 化イオンに断片化し上記断片化スぺクトルを測定するので、 ¾ "^タンパク質の立体構 造を反映した断片化イオンを効率的に作成することができるようになる。
つぎの発明にかかるタンパク質構造解析方& タンパク質構造解析装置、 および、 プ ログラム 上記に記載のタンパク質構造解析方法、 タンパク質構造解析装置、 およ び、 プログラムにおいて、上記断片化スぺク トル測定ステップ (断片化スぺクトル測 定手段) ί 酵素反応により上記対象タンパク質と上記化合物の上記複合体について 断片化を行い上記断片化スぺク トルを測定することを特徴とする。
これは断片化スぺクトル測定の一例を一層具体的に示すものである。 この方法、 装置、 および プログラムによれば、 酵素反応により対象タンパク質と化合物の複合体につ
いて断片化を行い、 HZD交換法や化学修飾法を組み合わせることにより、 相互作用界 面情報等を効率的に得ることができるようになる。
また本発明は記録媒体に関するものであり、 本発明かかる記録媒体 ί 上記に記載さ れたプログラムをコンピュータに実行させるための記録媒体であることを特徴とする。 この記録媒体によれば、 当該記録媒体をコンピュータに読み取らせて実行することに よって、 上記に記載されたプログラムをコンピュータを利用して実現することができ、 こ れら各プログラムと同様の効果を得ることができ ¾ 図面の簡単な説明
第 1図 本発明の基本原理を示す原理構成図であり、 第 2図 本発明が適用され る本システムの構成の一例を示すブロック図であり、 第 3図は 本実施形態における 本システムのメイン処理の一例を示すフローチャートであり、 第 4図 ί 本実施形態 におけるへキサポール C I D法により断片化スぺク トルを測定する場合の一例を示す フローチャートであり、第 5図は 本実施形態における I RM P D法により断片化ス ぺクトルを測定する場合の一例を示すフローチャートであり、 第 6図 ヒ卜のイン タ一ロイキン— 6 ( I L - 6 ) について断片化イオンの帰属情報を求め切断容易領 域情報を決定する際の概念図であり、 第 7図は、本実施形態における水素—重水素交 換法により断片化スぺクトルを測定する場合の一例を示すフローチャートであり、 第 8図 本実施形態における水素一重水素交換法によりタンパク質をそのまま M Sで 断片化し断片化スぺクトルを測定する場合の一例を示すフローチャートであり、 第 9 図^ 本実施形態における水素一重水素交換法によりタンパク質の複合体を断片化し 断片化スぺクトルを測定する場合の一例を示すフローチャートであり、 第 1 0図 本実施形態における水素一重水素交換法によりタンパク質 Aと Bの複合体を断片化し 断片化スぺクトルを測定する場合の一例を示すフローチャートであり、 第 1 1図 ί 本実施例において断片化スぺク トルを解析する場合の一例を示すフローチャートであ り、 第 1 2図 ヒトのインターロイキン _ 6 ( I L - 6 ) について、立体構造予測 データをリボンモデルによりダラフィック表示し切断容易領域情報に従って対応す る上記立体構造予測データの表示部分を色分けして表示する場合の表示画面の一例を
示す図であり、 第 1 3図 ί 本発明における本システムの実施例 1の一例を示すフロ 一チャートであり、 第 1 4図 ί¾ 本発明における本システムの実施例 2の一例を示す フローチャートであり、第 1 5図 本発明における本システムの実施例 3の一例を 示すフローチャートであり、 第 1 6図 f 本発明における本システムの実施例 4の一 例を示すフローチヤ一トであり、 第 1 7図 処理結果についてテーブルによる一覧 表示を行う場合の表示画面の一例を示す図であり、 第 1 8図 実施例 5における処理 結果の一例を示す図であり、 第 1 9図 f ヒトのインターロイキン— 6 ( I L - 6 ) と、抗 I L一 6抗体との複合体 (c o m p l e x ) について、 水素一重水素交換反応を 行い、 エレクトロスプレーイオン化法により断片化イオンに断片化し断片化スぺク トルを測定する際の概念図であり、 第 2 0図は、 7素—重水素交換反応を行ったヒト の I L一 6の断片化スぺクトルから重水素化速度を求める際の概念図であり、 第 2 1 図 本発明における本システムの実施例 8の一例を示すフローチャートであり、 第 2 2図 本発明における本システムの実施例 8の D N Aマイクロアレイによる発現 量の違いを色別に表示した表示画面の一例を示す図であり、 第 2 3図は、本発明におけ る本システムの実施例 8の利用者が選択した遺伝子情報を表示する画面であり、 第 2 4図 本発明における本システムの実施例 8のァライメントの表示画面であり、 第 2 5図 it 本発明における本システムの実施例 8のグラフィックソフトウエアによる 立体構造の表示画面であり、 第 2 6図 本発明における本システムの実施例 6にお けるゥシ由来ュビキチンの立体構造の一例を示す図であり、 第 2 7図 ί 本発明にお ける本システムの実施例 7における酵母由来アルコール脱水素酵素の立体構造の一 例を示す図である。 発明を実施するための最良の形態
以下に本発明にかかるタンパク質構造解析方法、 タンパク質構造解析装置、 プログ ラム、 および 記録媒体の実施の形態を図面に基づいて詳細に説明する。 なお この実 施の形態によりこの発明が限定されるものではない。
特に 以下の実施の形態において f 本発明を、インターロイキン— 6等に適用した 例について説明するが、 この場合に限られず、 全てのタンパク質において、 同様に適用
することができ ¾b
[本発明の概要]
以下、 本発明の概要について説明し その後、本発明の構成および処理等にっレ、て詳 細に説明する。 図 1は本発明の基本原理を示す原理構成図である。
本発明 概略的 以下の基本的特徴を有する。 まず、 立体構造を予測する対象の 立体構造予測対象タンパク質 (以下、 「¾^タンパク ¾| という。 ) について、 MSによ る各種の断片化法や酵素消化法などにより断片化し 断片化スぺク トルを測定する。
¾ ^タンパク質の MSによる測定 ¾ エレクトロスプレーイオン化法、 レーザース プレーイオン化 ソニックスプレーイオン化 大気圧化学イオン化法等のスプレ 一方式のイオン化 ¾ MALD I & およびその他これらに相当するイオン化法のうち 少なくともひとつの手法によりイオン化した後、 当該生成したイオンをへキサポール
(h e x a p o l e) C I D法 (ノズルスキマー C I D法、 キヤビラリースキマー C I D法、 マルチポールストァー補助キヤビラリースキマー C I D法と類似の手法であ る) 、 SOR I— C I D法を含む衝突活性化解離 (C I D) 法、 I RMPD法、 イン ソース分解 (I SD) 法、 ボストソース分解 (PSD) 、 表面誘起解離 (S I D) 法、 ECD (電子補足解離) 法、 B I RD (黒体赤外放射解離) 法、 およびその他これら に相当する断片化法のうち少なくとも一つの手法により対象タンパク質について断片化 イオンに断片化し 断片ィヒスぺクトルを測定してもよぐま ペプシンやトリプシンな どを用いた酵素消化法により対象タンパク質について断片化を行い断片化スぺクトル を測定してもよい。
キヤビラリースキマー C I D法 ί イオン化とイオン導入部にあるキヤビラリ一と スキマー間の電圧を利用して断片化を誘起するインソースフラグメンテーション法で ある (S. Ak a s h i , An a l . Ch em. , 71, 4974— 4980 (1 999) 参照)。
ま へキサポール C I D法はさらにへキサポールにイオンを一定時間溜め込むこと により、 キヤビラリ一スキマー C I D法の効率を向上させる方法である (K. A. , S a nn e s— Lowe r y, J . Am. So c. Ma s s Sp e c t r o m. , 11, 1-9 (2000) 参照)。
ま I RMPD法は、イオンに炭酸ガスレーザーを照射することにより、 フラグメ ンテーシヨンを誘起する方法である (C. P. Du f r e s n e, J. Am. S o c. Ma s s Sp e c t r om. , 9, 1222-1225 (1998) 参照)。
そして、 上記手法を用いて得られた断片化スぺクトルにおいて、各フラグメントの帰 属を行う。 すなわ 測定された断片化スぺクトルに基づいて、 ^タンパク質のアミ ノ酸配列に対する断片化イオンの帰属情報を決定する。 ここで; タンパク質のアミ ノ酸配列 PDBに格納されている場合にはその配列を用いてもよぐま MALD I一 TOF— MSや MSZMSなどによるアミノ酸配列同定手法を用いることにより 対象タンパク質のアミノ酸配列を同定してもよい。
そして、決定された断片化イオンの帰属情報により、 対象タンパク質のアミノ酸配列 において断片化イオンに断片化された箇所を特定し 当該箇所に従って対象タンパク質 のァミノ酸配列における切断容易領域情報を決定する。
ここで; 図 6¾ ヒトのインターロイキン一 6 ( I L- 6) について断片化イオンの 帰属情報を求め切断容易領域情報を決定する際の概念図である。 図 6において、 I R MP D法により断片化を行った際の断片化イオンのフラグメントを点線で、 へキサポ ール C I D法により断片化を行った際の断片化イオンのフラグメントを実線で表して いる。 ま これらの断片化イオンの切断部位に基づレ、て求めた切断容易領域情報を斜 線で表している。
そして、 ¾ ^タンパク質について立体構造を予測する。 ここで; 立 造予測^ ホモ ロジーモデリング法、 分子シミュレーション法、 アブイニシォ法、 二次構造予測法、 3 D— 1 スレツディング法などの既存の立体構造予測方法のいずれを用いてもよ レ、。 以下 配列の相同性に基づく立体構造予測手法を一例に説明する。
ここで; 立 冓造予測対象タンパク質のアミノ酸配列 (遺伝子の場合 DNA配列 から得られるアミノ酸配列) と、 類似のアミノ酸配列を有する既知立体構造の検索等 に FASTA (P e a r s o n WR, Me t h o d s En z ymo 1 , 2 66, 227-258, 1996) , PS I -BLAST (S c h a f f e r A A, Wo l f Y I , Pon t i n g CP, Ko o n i n EV, Ar a v i
n d L a n d A 1 t s c h u 1 S F, B i o i n f o rma t i c s, 1 2, 1000— 1 01 1, 1999) , L I BRA (O t a, M. a n d N i s h i k a w a , K. , P r o t e i n En g i n e e r i n g, 10, 339— 3 5 1, 1 99 7)、 RB S— BLAST (S c h a f f e r AA, Wo l f Y I P o n t i n g CP, Ko o n i n E V, Ar a v i n d L a n d A l t s c hu l SF, B i o i n f o rma t i c s, 12, 1000— 1 0 1 1 1 999) 、 IMPALA (A. A. S c h a f f e e t a 1. , B i o i n f o r m a t i c s , 1 5 (1 2) , 1 000— 1 01 1, 1 999) 、 HMMER (R. Du r b i n, S. E d d y, A. Kr o g h, a n d G. M i t c h i s o n, C amb r i d g e Un i v e r s i t y P r e s s, 1 9 98, S . R. E d d y. B i o i n f o rma t i c s, 14, 755— 763, 1 99 8) 、 また i C 1 u s t a 1 W (Th omo p s o n, J . D. , D. G. H i g g i n s, a n d T. J . G i b s o n, Nu c l e i c Ac i d s Re s . 22, 46 73-4680, 1 994) 等などのコンピュータプログラムを用いても よい。
検索対象に ί 予め PDB (P r o t e i n D a t a B a s e) を加工したデー タベースを用いることが好ましレ、。加工データベースは P D Bに登録された全てのタン パク質配列を配列相同性 (ホモロジ一) 95%以上のクラスに分類し各クラスの中 で最も実験精度の高レ、ものを代表配列として抽出する操作によって作成する。 この加工 データベースを用いることで; ホモロジ一検索の効率が増大するとともに 検索件数を 制限した場合でも検索される立体構造の多様性 ·バラエティを確保できる。
検索プログラムによる出力結果から、 立体構造予測対象タンパク質と参照タンパク 質配列とのペアワイズァライメントを検索件数分だけ個々に作成する。 ペアワイズァ ライメントごとに 参照タンパク質の立体構造における 2次構造領域を同定し 参照タ ンパク質配列上に照会する。 なお 立体構造予測対象タンパク質と複数の参照タンパ ク質配列とに基づいて、マルチプルァライメントを行ってもよレ、。
そして、 2次構造情報を表示したァライメント結果に M Sの断片化デ一タにより求 めた切断容易領域情報を照会する。 すなわ MSで得られた断片化イオンの両端は
容易に切断されやすい部位であり、 立体構造上においては運動性の高いループ部分に 相当する可能性が高いと考えられる部位である。一方、 MSで得られた断片化イオンの 両端に挟まれた部分 断片化が起こりにくい咅啦であることから、 αヘリックスや ]3 ストランドなどの 2次構造を有している部位に相当する可能性が高いと考えられる部 位である。
そして、すべての断片化イオンの情報を加味して、ィ 甫タンパク質の評価 (ランク付 け) を行う。
続いて、評価の高い候補タンパク質の立体構造を基盤として、予測対象タンパク質の 立体構造予測をホモロジーモデリング法により行う。 ここで; 立体構造予測プログラム として i¾ 「FAMS」 (Og a t a, K. a n d Ume y a m a , H. , J . Mo 1. G r a p h i c s Mo d. 1 8, 258-272, 2000) 、 Sw i s s -Mo d e l (P e i t s c h MC. , B i o c h em. S o c. T r a n s . 2 4, 274-279, 1 996) 、 CPHmo d e l s (O. L u n d, K. F r i m a n d , J. Go r o d k i n, H. B o h r, J. B o h r, J. H a n s e n , a n d S . B r u n a k. , P r o t e i n En g i n e e r i n g, 1 0, 1 24 1 - 1 248, 1 997) 、 「SAM - T98」 (J. P a r k, K. K a r p 1 u s , C. B a r r e t t, R. Hu g h e y , D. Ha u s s l e r, T. H u b b a r d, a n d C. Ch o t h i a , J MB 284 (4) , 1 20 1— 1 2 1 0, 1 998) 、 「MOD E L L E Rj (A. S a 1 i , L. P o t t e r t o n , F . Yu a n, H. v a n V l i j me n, a n d M. Ka r p l u s ,
P r o t e i n s, 23, 3 1 8— 326, 1 995 ) などを採用してもよい。 ま D a n i e l F i s c h e rら「C AF A S P 2 Th e S e c o n d C r i t i c a l As s e s sme n t o f Fu l l y Au t oma t e d S t r u c t u r e P r e d i c t i o n Me t h o d s, PROTE I NS, 5 ; 1 7 1 — 1 83 ( 200 1)」において開示または参照された各種の立体構造予測プログラ ムを用いてもよレ、。
そして、候補タンパク質について、 予測された立体構造予測データと決定された切断容 易領域情報とを対応させて出力する (例えば グラフィック表 テーブルによる一覧
表示など)。 例え ί 立体構造予測データを針金モデル、 リボンモデル、 パイプモデル、 ボールアンドスティックモデル、 また ¾ 空間充填モデルのうちいずれかのモデルによ りグラフィック表示し切断容易領域情報を対応する立体構造予測データの表示部分 に関連付けて表示 (例えば リンクを設定、 モデル上に表承 モデル上に切断容易領域 情報に対応する網掛けや斜線などの特定のパターン模様を表示など) してもよく、 ま グラフィック表示やテーブル表示を行う際に切断容易領域情報に従って対応する上 記立体構造予測データの表示部分を色分けして表示してもよい。
予測された立体構造予測データと、 決定された切断容易領域情報とを比較して、切断容 易領域情報により特定された切断容易領域に対応する予測構造部分にっレ、て評価を行 レ、予測構造評価情報を決定し 決定された予測構造評価情報を出力する。 すなわ ¾ 得 られた予測構造と M Sの断片化データを照会し 予測構造を評価する。
ま 例えばホモロジ一が高い候補タンパク質について^ 断片化スぺクトルを M S で測定し 立#«造予測対象タンパク質の断片化スぺク トルと比較することにより、 さ らに精度が高い評価を行うことが可能である。
さらに 本発明 立体構造を予測する対象タンパク質または複合体にっレ、て水素一 重水素交換反応を行い、 断片化イオンに断片化し 断片化スぺク トルを測定する。
ここで; 図 1 9 ヒトのインターロイキン一 6 ( I L— 6 ) と、 抗 I L— 6抗体との 複合体 (c o m p l e x ) について、 水素一重水素交換反応を行レ、、 エレク トロスプ レーイオン化法により断片化イオンに断片化し 断片化スぺク トルを測定する際の概 念図である。
そして、 測定された断片化スぺクトルに基づいて、 ^タンパク質のアミノ酸配列に 対する断片化イオンの帰属情報を決定し 測定された断片化スぺク トル、 および、 決定 された断片化イオンの帰属情報に従って、 タンパク質のァミノ酸配列中の各ァミ ノ酸残基における重水素化速度を決定する。
ここで、 図 2 Ο ί 水素一重水素交換反応を行ったヒ トの I L— 6の断片化スぺク ト ルから重水素化速度を求める際の概念図である。 図 2 0に示すように、水素一重水素 交換反応を行ったヒ卜の I L— 6の断片化スぺクトル (上段) と、 水素一重水素交換 反応を行わない場合のヒトの I L _ 6の断片化スぺク トル (下段) の重心値の変化
力 ^重水素化率 (D化率) を決定し 経時的に求めた重水素化率から重水素化速度を 計算する。
そして、 決定されたアミノ酸配列中の各ァミノ酸残基における重水素化速度に従って、 対象タンパク質のァミノ酸配列にぉレ、て溶媒に接触している箇所を特定し 当該箇所に 従って対象タンパク質のアミノ酸配列における溶媒接触残基情報を決定する。 溶媒接 触残基情報 ί 例えば水素—重水素交換していないコントロール実験と比較して重水 素化速度が遅くなってレヽる部位を溶媒接触残基情報として決定してもよい。
ま 複合体の場合に ί 決定されたアミノ酸配列中の各アミノ酸残基における重水 素化速度に従って、 ¾ ^タンパク質のアミノ酸配列における相互作用界面情報を決定 する。 相互作用界面情報 ί 例えば 複合体を形成していない単独時に測定した場合と比 較して、 重水素化速度が遅くなっている部位を相互作用界面情報として決定してもよレ、。 ま 水素—重水素交換していないコントロール実験と比較して重水素化速度が遅くなつ ている部位を相互作用界面情報として決定してもよレ、。
このようにして、決定した溶媒接触残基情報および相互作用界面情報を、 予測データと ともに出力したり、 予測構造評価情報を決定したりする際に利用する。すなわ"^ 予測さ れた立体構造予測データと決定された溶媒接触残基情報や相互作用界面情報とを対応 させて出力し (例え ί グラフィック表 テーブルによる一覧表示など) 、 ま 予測 された立体構造予測データと、 決定された溶媒接触残基情報や相互作用界面情報とを比 較して、溶媒接触残基情報により特定された溶媒接触残基や相互作用界面情報により 特定された相互作用界面に対応する予測構造部分について評価を行い予測構造評価情 報を決定し 決定された予測構造評価情報を出力する。
ここで; 図 1 2 ί ヒ卜のインターロイキン一 6 ( I L - 6 ) について、 立体構造予 測データをリボンモデルによりダラフィック表示レ 切断容易領域情報に従って対応 する上記立体構造予測データの表示部分を色分けして表示する場合の表示画面の一例 を示す図である。 図 1 2において、切断容易領域情報を黒色で、 ま 相互作用界面情 報を灰色で示している。
ま 図 1 7 ί 処 結果についてテーブルによる一覧表示を行う齢の表示画面の 一例を示す図であ この図に示すように処理結果一覧表示画面 例えば、 タンパク
質のアミノ酸残基番号を表示するための表示領域 MA— 1、 本発明により決定された 切断容易領域を表示するための表示領域 MA— 2、 本発明により決定された溶媒接触 残基情報を表示するための表示領域 MA— 3、本発明により決定された相互作用界面 情報を表示するための表示領域 MA— 4、 構造予測手法による立体構造予測データ (例えば 二次構造など) を表示するための表示領域 MA— 5、 本発明により決定され た立体構造予測データに対する予測構造評価情報を表示するための表示領域 M A— 6 などを含んで構成されている。 本図に示すように、 タンパク質のアミノ酸残基毎にこれ らの情報をテーブル形式で一覧表示してもよい。ま 相互作用界面情報を表示する場 合に 1対多数の相互作用を区別して表示することが望ましい (例えば、 A, B , C, , , , , という表示方法を採用してもよい) 。
ま 切断容易領域や、 H/D交換しやすい領域が生じる要因としては、揺らぎの情報 も含んでいると考えられる。 従って、 ま 本発明 揺らぎ情報として基準振動計算を 実行し基準振動計算結果と M Sデータとを比較して、 モデノレの評価等をすることも可 能である。 よって、 本発明 対象タンパク質について各種の既知のコンピュータプロ グラム (例えば 富士通株式会社 (商標) の分子軌道計算プログラム MO P A C (製 品名) 等) などを用いて基準振動計算を行い、 »振動計算結果 (例えば 揺らぎの情 報) を対応する立体構造予測データの表示部分に関連付けて表示する (例え 立体 構造モデル上にべクトル表示を行う) ので、切断容易領域として揺らぎの情報を考慮す ることができるようになる。 すなわ 基準振動計算結果により揺らぎ情報を求め、 M S 実測データと比較することにより予測モデルの評価を行うことができるようになる。
[システム構成]
まず、 本システムの構成について説明する。 図 2 本発明が適用される本システム の構成の一例を示すプロック図であり、 該構成のうち本発明に関係する部分のみを概 念的に示している。 本システム 概略的 タンパク質構造解析装置 1 0 0と、 配列 情報等に関する外部データベースやホモ口ジー検索等の外部プログラム等を提供す る外部システム 2 0 0とを、 ネットワーク 3 0 0を介して通信可能に接続して構成され ている。 ま タンパク質構造解析装置 1 0 0 質量分析装置 4 0 0の断片化スぺク トノレ情報などが入力装置 1 1 2またはネットワーク 3 0 0などを介して取得可能に構
成されている。
図 2においてネットワーク 3 0 0 f タンパク質構造解析装置 1 0 0と外部システ ム 2 0 0とを相互に接続する機能を有し 例えば、 ィンターネット等である。 . 図 2において外部システム 2 0 0 « ネットワーク 3 0 0を介して、 タンパク質構造 解析装置 1 0 0と相互に接続され利用者に対して配列情報等に関する外部データべ一 スゃホモロジ一検索やモチーフ検索等の外部プログラムを実行するウェブサイ トを 提供する機能を有する。
ここで;外部システム 2 0 0 WE Bサーバや A S Pサーバ等として構成してもよく、 そのハードウェア構成 —般に市販されるワークステーション、 パーソナルコンビ ユータ等の情報処理装置およびその付属装置により構成してもよい。ま 外部システ ム 2 0 0の各機能 外部システム 2 0 0のハードウェア構成中の C P U、 ディスク 装置、 メモリ装置、 入力装置、 出力装置、 通信制御装置等およびそれらを制御するプロ グラム等により実現される。
図 2において質量分析装置 4 0 0 へキサポール C I D法、 ノズルスキマー C I D法、 キヤビラリースキマー C I D法、 S O R I— C I D法、 および、 マルチポールス トァー補助キヤビラリースキマー C I D法を含む衝突活性ィヒ解離 (C I D) I R M P D& インソース分解 (I S D) 法、 ポストソース分解 (P S D) ¾ 表面誘起 解離 (S I D) ¾ E C D& また B I R D法などの方法により断片化イオンに断 片化レ 断片化スぺク トルを測定する。
図 2においてタンパク質構造解析装置 1 0 0 概略的に タンパク質構造解析装置 1 0 0の全体を統括的に制御する C P U等の制御部 1 0 2、 通信回線等に接続される ルータ等の通信装置 (図示せず) に接続される通信制御インタ一フェース部 1◦ 4、 入力装置 1 1 2や出力装置 1 1 4に接続される入出力制御インターフェース部 1 0 8、 および、 各種のデータベースやテーブルなどを格納する記憶部 1 0 6を備えて構成さ れており、 これら各部は任意の通信路を介して通信可能に接続されている。 さらに この タンパク質構造解析装置 1 0 0 ノレータ等の通信装置および専用線等の有線または 無線の通信回線を介して、ネットワーク 3 0 0に通信可能に接続されている。
記憶部 1 0 6に格納される各種のデータベースやファイルやテーブル (断片化スぺ
ク トルデータファイル 1 0 6 a〜処理結果データファイル 1 0 6 f ) I 固定ディス ク装置等のストレージ手段であり、 各種処理に用いる各種のプログラムやテーブルや フアイルゃデ一タベースゃゥヱブベージ用フアイル等を格納する。
これら記憶部 1 0 6の各構成要素のう ¾ 断片ィヒスぺクトルデータファイル 1 0 6 a I 質量分析装置 4 0 0から取得した断片化スぺク トルデータを格納する断片化スぺ クトルデータ格納手段である。
ま 切断容易領域情報ファイル 1 0 6 b « 切断容易領域情報等を格納する切断 容易領域情報格納手段である。
ま 溶媒接触残基情報 相互作用界面情報ファイル 1 0 6 c i «接触残基情 報および相互作用界面情報等を格納する相互作用界面情報格納手段である。
ま 立体構造予測データファイル 1 0 6 d i 立体構造予測処理により予測された 立体構造予測データ等を格納する立体構造予測データ格納手段である。
ま 予測構造評価情報ファイル 1 0 6 e 予測構造評価情報等を格納する予測 構造評価情報格納手段である。
ま 処理結果データファイル 1 0 6 Π ^¾結果に関する情報等を格納する処理 結果データ格納手段である。
ま その他の情報として、 タンパク質構造解析装置 1 0 0の記憶部 1 0 6に ¾ タ ンパク質のァミノ酸配列情報や構造情報を格納したタンパク質情報データベース等が 記録されていてもよレ、。 このタンパク質情報データベース i P D B等のインターネッ トを経由してアクセスする外部のデータベースであってもよぐ ま らのデータべ ースをコピーしたり、 オリジナルの配列情報等を格納したり、 さらに独自のクラスタリ ング情報やァノテーション情報等を付加したりして作成したィンハウスデータベース であってもよい。
ま 図 2において、 ill言制御インタ一フェース部 1 0 4 タンパク質構造解析装 置 1 0 0とネットワーク 3 0 0 (またはルータ等の通信装置) との間における通信制 御を行う。すなわ^ 適言制御インターフェース部 1 0 4 他の端末と通信回線を介 してデータを通信する機能を有する。
ま 図 2において、 入出力制御インターフェース部 1 0 8 ¾ 入力装置 1 1 2や出
力装置 1 14の制御を行う。 ここで 出力装置 1 14として モニタ (家庭用テレビを 含む) の慨 スピーカを用いることができる (なお 以下においては出力装置 1 14を モニタとして記載する場合がある)。 ま 入力装置 1 1 2として f キーボード、 マウ ス、 および、 マイク等を用いることができる。 ま モニタも、 マウスと協働してポイン ティングデバイス機能を実現する。
ま 図 2において、 $1脚部 1 02i¾ OS (Op e r a t i n g Sy s t em) 等の制御プログラム、 各種の処理手順等を規定したプログラム、 および所要データを 格納するための内部メモリを有レ これらのプログラム等により、 種々の処理を実行す るための情報処理を行う。制御部 102ί 機能概念的 断片化スぺク トルデータ取 得部 102 a、 帰属情報決定部 102 b、 切断容易領域情報決定部 102 c、 溶媒接 触残基情報決定部 1 02 d、 相互作用界面情報決定部 1 02 e、 立体構造予測処理部 1 02 f、 予測構造評価情報決定部 1 02 g、 処理結果出力部 1 02 h、予測構造評 価情報出力部 1 02 i、重水素化速度決定部 102 j、 および 基準振動計算処理部 102 kを備えて構成されている。
このう 断片化スぺク トルデータ取得部 1 02 a f 立体構造を予測する対象タン ノ ク質について MSや酵素などを用いて断片化しその断片化スぺク トルを測定した質 量分析装置 400から断片化スぺクトルデータを取得する断片化スぺクトルデータ 取得手段である。
ま 帰属情報決定部 1 02 bf 断片化スぺク トルデータ取得手段により取得され た断片化スぺクトルデータに基づいて、 ^タンパク質のアミノ酸配列に对する断片 化イオンの帰属情報を決定する帰属情報決定手段である。
ます 切断容易領域情報決定部 1 02 c ί 帰属情報決定手段により決定された断片 化イオンの帰属情報により、 対象タンパク質のアミノ酸配列にぉレ、て断片化イオンに 断片化された箇所を特定レ 当該箇所に従って対象タンパク質のァミノ酸配列における 切断容易領域情報を決定する切断容易領域情報決定手段である。
ま 溶媒接触残基情報決定部 1 02 d ί 重水素化速度決定手段にて決定されたァ ミノ酸配列中の各アミノ酸残基における重水素化速度に従って、 ¾ ^タンパク質のァ ミノ酸配列にぉレ、て溶媒に接触している箇所を特定し 当該箇所に従って対象タンパク
質のァミノ酸配列における溶媒接触残基情報を決定する溶媒接触残基情報決定手段で あ 00
ま 相互作用界面情報決定部 1 0 2 e ί¾ 重水素化速度決定手段にて決定されたァ ミノ酸配列中の各アミノ酸残基における重水素化速度に従って、 ¾ ^タンパク質のァ ミノ酸配列における相互作用界面情報を決定する相互作用界面情報決定手段である。 ま 立体構造予測処理部 1 0 2 f ホモロジーモデリング法、 分子シミュレーシ ヨン ¾ アブイニシォ法、二次構造予測 3 D— l Dfe スレツディング法などの既 存の立体構造予測方法を用いて、 ¾#タンパク質や候補タンパク質について立体構造 を予測する立体構造予測手段である。
ま 予測構造評価情報決定部 1 0 2 g f 立体構造予測手段により予測された立体 構造予測データと、 切断容易領域情報決定手段により決定された切断容易領域情報と を比較して、 切断容易領域情報により特定された切断容易領域に対応する予測構造部 分にっレ、て評価を行レ、予測構造評価情報を決定する予測構造評価情報決定手段、 立体 構造予測手段により予測された立体構造予測データと、溶媒接触残基情報決定手段に より決定された溶媒接触残基情報とを比較して、 «接触残基情報により特定された溶 媒接触残基に対応する予測構造部分にっレ、て評価を行い予測構造評価情報を決定する 予測構造評価情報決定手段、 立体構造予測手段により予測された立体構造予測データ と、相互作用界面情報決定手段により決定された相互作用界面情報とを比較して、相互 作用界面情報により特定された相互作用界面に対応する予測構造部分にっレ、て評価を 行い予測構造評価情報を決定する予測構造評価情報決定手段である。
ます 処理結果出力部 1 0 2 h i 立体構造予測手段により予測された立体構造予測 データと、切断容易領域情報決定手段により決定された切断容易領域情報とを対応させ て出力する処理結果出力手段、 立体構造予測手段により予測された立体構造予測デー タと、 溶媒接触残基情報決定手段により決定された溶媒接触残基情報とを対応させて出 力する処理結果出力手段、 立体構造予測手段により予測された立体構造予測データと、 相互作用界面情報決定手段により決定された相互作用界面情報とを対応させて出力す る処理結果出力手段である。
ま 予測構造評価情報出力部 1 0 2 i 予測構造評価情報決定手段により決定さ
れた予測構造評価情報を出力する予測構造評価情報出力手段である。
ま 重水素化速度決定部 1 0 2 j ί¾ 断片化スぺク トルデータ取得手段により測 定された断片化スぺクトルデータ、 および、 帰属情報決定手段により決定された断片化 イオンの帰属情報に従って、 ^タンパク質のアミノ酸配列中の各アミノ酸残基にお ける重水素化速度を決定する重水素化速度決定手段である。
ま 基準振動計算処理部 1 0 2 k i 対象タンパク質について基準振動計算を行う 基準振動計算手段である。 なお これら各部によって行なわれる処理の詳細について 後述する。
[システムの処理]
次に このように構成された本実施の形態における本システムの処理の一例について、 以下に図 3などを参照して詳細に説明する。
[メイン処理]
まず、 メイン処理の詳細について図 3を参照して説明する。 図 3 本実施形態にお ける本システムのメイン処理の一例を示すフローチヤ一トである。
まず、 ¾^タンパク質にっレ、て質量分析装置 4 0 0により断片化スぺク トルを測定 する (ステップ S A— 1 )。 すなわ^ 対象タンパク質溶液をシリンジポンプで質量 分析装置 4 0 0に連続注入レ へキサポール C I D法などにより対象タンパク質を断 片化イオンに断片化レ断片化スぺク トルの測定を行う。
ここで、 図 4 ¾ 本実施形態におけるへキサポール C I D法により断片化スぺク トル を測定する場合の一例を示すフローチャートである。
まず、 キヤビラリ一出口の電圧を上げる (ステップ S B— 1 )。
そして、 断片化の効率を向上させるため、 へキサポール内でのイオンのトラップ時間 を長くしてもょレヽ (ステップ S B— 2 )。
そして、 タンパク質が断片化するように MSイオン化と検出のパラメータ (例えば キヤピラリー電 へキサポール内トラップ時間など) を調整する (ステップ S B— 3 )。
そして、 MSによる断片化スぺク トルの取り込みと保存を行う (ステップ S B— 4 )。 ま 図 5 本実施形態における I RM P D法により断片化スぺク トルを測定する
場合の一例を示すフローチヤ一トである。
まず、 MS内に存在する (例え f へキサポール内、 イオントラップ內) イオンに対 して、 IRレーザー (10. 9um) を照射する (ステップ SC— 1)。
そして、 断片化の効率を向上させるため、 へキサポール内でのイオンのトラップ時間 を長くしてもよい (ステップ SC— 2)。
そして、 タンパク質が断片化するように MSイオン化と検出のパラメータ (例えば キヤビラリ一電圧、 へキサポール内トラップ時間、 I Rレーザーのエネルギー、 I R レーザーの照射時間など) を調整する (ステップ SC— 3)。
そして、 MSによる断片化スぺク トルの取り込みと保存を行う (ステップ SC— 4) c その他のノズノレスキマー C I D法、 キヤビラリースキマー C I D¾ マルチポーノレ ストアー補助キヤビラリースキマー C I D法、 ECDfe B I RD法、 また SOR I -C I D法などにより断片化スぺク トルを取得してもよい。
再び 図 3に戻り、 タンパク質構造解析装置 10 Οί 断片化スぺクトルデータ取得 部 102 aの処理により、 質量分析装置 400から入力装置 1 12またはネットヮー ク 300を経由して断片化スぺク トルデータを取得し 断片化スぺク トルデータファ ィル 106 aに格納する (ステップ SA_2)。
ついで、 タンパク質構造解析装置 100は 帰属情報決定部 102 bの処理により、 測定された断片化スぺクトルに基づいて、 タンパク質のアミノ酸配列に对する断 片化イオンの帰属情報を決定レ ま 切断容易領域情報決定部 102 cの処理によ り、 決定された断片化イオンの帰属情報により、対象タンパク質のァミノ酸配列にお レ、て断片化イオンに断片化された箇所を特定し、 当該箇所に従って対象タンパク質のァ ミノ酸配列における切断容易領域情報を決定する (ステップ SA— 3)。
ついで; タンパク質構造解析装置 100は 切断容易領域情報決定部 102 cの処 理により、 切断容易領域情報を切断容易領域情報ファイル 106 bに格納する (ステ ップ S A—4)。
ま ¾ ^タンパク質やその複合体について、水素—重水素交換法による断片化スぺ ク トルの測定を行う (ステップ SA— 5)。
ここで; 図 7 本実施形態における水素一重水素交換法により断片化スぺク トルを
測定する場合の一例を示すフローチヤ一トである。
まず、 対象タンパク質を緩衝液に溶解または重水素置換する (ステップ S D— 1 )。 そして、経時的にサンプリングを行いながら、緩衝液を酸性にして温度を下げ、 Η/Ό 交換反応速度を下げる (ステップ SD— 2)。
そして、 酸性条件下で対象タンパク質をペプシン消化する (ステップ SD— 3)。 そして、 ぺプチド消化物を抽出し (ステップ SD— 4)、 MALD I _TOF— MS、 また ί LC/MS/MSを行う (ステップ SD— 5)。
ま 図 8ί 本実施形態における水素—重水素交換法によりタンパク質をそのまま MSで断片化し断片化スぺクトルを測定する場合の一例を示すフローチヤ一トである。 まず、 ^タンパク質を緩衝液に溶解または重水素置換する (ステップ S E— 1 )。 そして、 ES I—MSで断片化スぺクトルの測定を行う (ステップ SE— 2)。
そして、 経時的にサンプリングを行いながら、断片化スぺク トルを取り込み保存する
(ステップ SE— 3)。
ま 図 9 本実施形態における水素—重水素交換法によりタンパク質の複合体を 断片化し断片化スぺク トルを測定する場合の一例を示すフローチャートである。
まず、 タンパク質の複合体を緩衝液に溶解または重水素置換する (ステップ S F_
1)
そして、 経時的にサンプリングを行いながら、緩衝液を酸性にして温度を下げ、 H/D 交換反応速度を下げる (ステップ S F— 2)。
そして、 酸 14条件下で対象タンパク質をペプシン消化する (ステップ S F— 3)。 そして、 ぺプチド消化物を抽出し (ステップ S F— 4)、 MALD I一 TOF— MS、 また LC/MSZMSを行う (ステップ SF— 5)。
ま 図 10 本実施形態における水素一重水素交換法によりタンパク質 Aと Bの 複合体を断片化し断片化スぺクトルを測定する場合の一例を示すフローチヤ一トであ る。
まず、 タンパク質 Aと Bを別々に緩衝液に溶解または重水素置換レー定時間 (t 1) 放置する (ステップ SG— 1)。
そして、 タンパク質 Aと Bを混合し複合体を形成して一定時間 (t 2) 放置する (ス
テツプ S G _ 2 )。
そして、軽水緩衝液に置換、 または 希釈する (ステップ S G—3 ) 。
そして、 一定時間 (T = t 1 + t 2 ) 放置レ HZDの逆交換反応 (オフチェンジ) を行う (ステップ S G— 4 ) 。
そして、 E S I—M Sで断片化スペク トルの測定を行う (ステップ S G— 5 )。 再び、 図 3に戻り、 タンパク質構造解析装置 1 0 0 f 断片化スぺクトルデータ取得 部 1 0 2 aの処理により、 質量分析装置 4 0 0から入力装置 1 1 2またはネットヮー ク 3 0 0を経由して断片化スぺクトルデータを取得レ 断片化スぺクトルデータファ ィル 1 0 6 aに格納する (ステップ S A— 6 )。
ついで、 タンパク質構造解析装置 1 0 0 帰属情報決定部 1 0 2 bの処理により、 測定された断片化スぺクトルに基づいて、 ¾ ^タンパク質のアミノ酸配列に対する断 片化イオンの帰属情報を決定し ま 重水素化速度決定部 1 0 2 jの処理により、 測 定された断片化スぺク トル、 および 決定された断片化イオンの帰属情報に従って、 対 象タンパク質のアミノ酸配列中の各アミノ酸残基における重水素化速度を決定する。 ここで、 重水素化速度 f 以下により求める。 まず、 帰属情報決定部 1 0 2 bがぺプチ ドの帰属情報を決定すると、 重水素化速度決定部 1 0 2 j ί 各アミノ酸残基につい て、 質量増加分を交換性プロトン数で割ることにより重水素化率を求める。 そして、 重 水素化速度決定部 1 0 2 j f 重水素化率に基づいて、 各ぺプチド配列のアミノ酸残 基の重水化速度を決定する。
そして、溶媒接触残基情報決定部 1 0 2 d ί 決定されたァミノ酸配列中の各ァミノ 酸残基における重水素化速度に従って、 * ^タンパク質のアミノ酸配列にぉレ、て溶媒 に接触している箇所を特定し 当該箇所に従って対象タンパク質のァミノ酸配列におけ る溶媒接触残基情報を決定し (ステップ S Α— 7 ) 、 溶媒接触残基情報 相互作用界 面情報ファイル 1 0 6 cに格納する (ステップ S A—8 )。 溶媒接触残基情報 ί 例 えば 水素—重水素交換していないコントロール実験と比較して重水素化速度が遅くな つている部位を溶媒接触残基情報として決定してもよい。
ま 相互作用界面情報決定部 1 0 2 e 決定されたァミノ酸配列中の各ァミノ酸 残基における重水素化速度に従って、 ¾ ^タンパク質のアミノ酸配列における相互作
用界面情報を決定し (ステップ S A— 7 )、 溶媒接触残基情報/相互作用界面情報フ アイル 1 0 6 cに格納する (ステップ S A— 8 )。 相互作用界面情報 例えば 複 合体を形成してレヽない単独時に測定した場合と比較して、 重水素化速度が遅くなつている 部位を相互作用界面情報として決定してもよレ、。ま 水素一重水素交換していないコン トロール実験と比較して重水素化速度が遅くなつている部位を相互作用界面情報として 決定してもよレ、。
ま タンパク質構造解析装置 1 0 0 立体構造予測処理部 1 0 2 f の処理によ り、 対象タンパク質について立体構造を予測し (ステップ S A—9 ) 、 予測した立体構 造予測データを立体構造予測データフアイノレ 1 0 6 dに格納する (ステップ S A— 1 0 )。
そして、 タンパク質構造解析装置 1 0 0 このようにして決定した切断容易領域情報、 溶媒接触残基情報および相互作用界面情報を、予測データとともに出力したり、 予測構 造評価情報を決定したりする際に利用する。
すなわ 処理結果出力部 1 0 2 h i 予測された立体構造予測データと決定された 切断容易領域情報や溶媒接触残棊情報や相互作用界面情報とを対応させて出力する (ステップ S A— 1 1 )。
ま 予測構造評価情報決定部 1 0 2 g ^ 予測された立体構造予測データと、 決定さ れた切断容易領域情報や溶媒接触残基情報や相互作用界面情報とを比較して (ステッ プ S A— 1 2 ) 、 切断容易領域情報により特定された切断容易領域や溶媒接触残基情 報により特定された溶媒接触残基や相互作用界面情報により特定された相互作用界面 に対応する予測構造部分にっレ、て評価を行レ、予測構造評価情報を決定する (ステップ S A— 1 3 )。
ま 予測構造評価情報出力部 1 0 2 i 決定された予測構造評価情報を出力する (ステップ S A— 1 4 )。 これにて、 メイン処理が終了する。
[実施例 1 ]
次に 本発明の実施例 1の詳細について図 1 3等を参照して説明する。 図 1 3 本 発明における本システムの実施例 1の一例を示すフローチヤ一トである。
まず、 対象タンパク質 (または複合体) について質量分析装置 4 0 0により断片化ス
ぺクトルの測定を行う (ステップ S J— 1 )。 ま ¾ ^タンパク質 (または複合体) について水素—重水素交換反応を行いながら、断片化スぺクトルの測定を行ってもよ レ、。 そして、 タンパク質構造解析装置 1 0 0 断片化スぺクトルデータ取得部 1 0 2 aの処理により、 質量分析装置 4 0 0から入力装置 1 1 2またはネットワーク 3 0 0 を経由して断片化スぺク トルデータを取得レ 断片化スぺク トルデータファイル 1 0 6 aに格納する。
ついで、 タンパク質構造解析装置 1 0 0 ί 帰属情報決定部 1 0 2 bの処理により、 測定された断片化スぺクトルに基づいて、 ¾ "^タンパク質のアミノ酸配列に対する断 片化イオンの帰属情報を決定し (ステップ S J— 2 ) 、 ま タンパク質構造解析装 置 1 0 0 ί 切断容易領域情報決定部 1 0 2 cの処理により、 決定された断片化ィォ ンの帰属情報により、 タンパク質のアミノ酸配列において断片化イオンに断片化 された箇所を特定レ 当該箇所に従って対象タンパク質のアミノ酸配列における切断容 易領域情報を決定する。
ま 水素—重水素交換反応を行っている場合に タンパク質構造解析装置 1 0 0 I 重水素化速度決定部 1 0 2 j の処理により、 測定された断片化スぺク トル、 および、 決定された断片化イオンの帰属情報に従って、対象タンパク質のァミノ酸配列中の各 アミノ酸残基における重水素化速度を決定する。 そして、溶媒接触残基情報決定部 1 0 2 d 決定されたァミノ酸配列中の各ァミノ酸残基における重水素化速度に従って、 对象タンパク質のァミノ酸配列において溶媒に接触している箇所を特定し 当該箇所に 従って対象タンパク質のアミノ酸配列における溶媒接触残基情報を決定レ 溶媒接触 残基情報 Z相互作用界面情報ファイル 1 0 6 cに格納する。 ま 相互作用界面情報 決定部 1 0 2 e f 決定されたァミノ酸配列中の各ァミノ酸残基における重水素化速 度に従って、 タンパク質のアミノ酸配列における相互作用养面情報を決定し 溶媒 接触残基情報/相互作用界面情報ファイル 1 0 6 cに格納する。
ま タンパク質構造解析装置 1 0 0 ί 立術苒造予測処理部 1 0 2 f の処理によ り、 対象タンパク質にっレ、て P D Bなどのタンパク質データベースを用レヽて相同性検 索を行い、 雛型の立体構造となる構造既知のタンパク質を抽出する (ステップ S J - 3 ) 。
そして、 立体構造予測処理部 1 0 2 Π¾ 3 D - 1 D法などの手法により、 対象タン パク質と雛型の構造既知タンパク質とのァライメントを実行し (ステップ S J— 4 ) 、 対象タンパク質の立体構造モデルのデータである立体構造予測データを作成し 立体 構造予測データファイル 1 0 6 dに格納する (ステップ S J— 5 ) 。
そして、 処理結果出力部 1 0 2 h 予測された立体構造予測データと決定された切 断容易領域情報や溶媒接触残基情報や相互作用界面情報とを対応させて出力する (ス テツプ S J— 6 )。
ま 予測構造評価情報決定部 1 0 2 予測された立体構造予測データと、決定さ れた切断容易領域情報や溶媒接触残基情報や相互作用界面情報とを比較して、 切断容 易領域情報により特定された切断容易領域や溶媒接触残基情報により特定された溶媒 接触残基や相互作用界面情報により特定された相互作用界面に対応する予測構造部分 について評価を行い予測構造評価情報を決定する。 ま 予測構造評価情報出力部 1 0 2 H 決定された予測構造評価情報を出力する (ステップ S J _ 7 )。 これにて、 実施例 1の処理が終了する。
[実施例 2 ]
次に 本発明の実施例 2の詳細について図 1 4等を参照して説明する。 図 1 4 本 発明における本システムの実施例 2の一例を示すフローチャートである。
まず、 タンパク質 (または複合体) について質量分析装置 4 0 0により断片化ス ぺクトルの測定を行う (ステップ S K—1 ) 。 ま タンパク質 (または複合体) について水素一重水素交換反応を行いながら、断片化スぺク トルの測定を行ってもよ レ、。 そして、 タンパク質構造解析装置 1 0 0 断片化スぺクトルデータ取得部 1 0 2 aの処理により、 質量分析装置 4 0 0から入力装置 1 1 2またはネットワーク 3 0 0 を経由して断片化スぺクトルデータを取得し 断片化スぺクトルデータファイル 1◦ 6 aに格納する。
っレ、で タンパク質構造解析装置 1 0 0 帰属情報決定部 1 0 2 bの処理により、 測定された断片化スぺクトルに基づいて、 ^タンパク質のアミノ酸配列に対する断 片化イオンの帰属情報を決定し (ステップ S K— 2 ) 、 ま タンパク質構造解析装 置 1 0 0 切断容易領域情報決定部 1 0 2 cの処理により、 決定された断片化ィォ
ンの帰属情報により、 タンパク質のアミノ酸配列において断片化イオンに断片化 された箇所を特定し 当該箇所に従って対象タンパク質のァミノ酸配列における切断容 易領域情報を決定する。
ま 水素—重水素交換反応を行っている場合に ¾ タンパク質構造解析装置 1 0 0 I 重水素化速度決定部 1 0 2 jの処理により、 測定された断片化スぺク トル、 および、 決定された断片化イオンの帰属情報に従って、対象タンパク質のァミノ酸配列中の各 アミノ酸残基における重水素化速度を決定する。 そして、溶媒接触残基情報決定部 1 0 2 d l 決定されたァミノ酸配列中の各ァミノ酸残基における重水素化速度に従って、 対象タンパク質のァミノ酸配列にぉレ、て溶媒に接触している箇所を特定し 当該箇所に 従って対象タンパク質のァミノ酸配列における溶媒接触残基情報を決定し溶媒接触 残基情報ノ相互作用界面情報ファイル 1 0 6 cに格納する。 ま 相互作用界面情報 決定部 1 0 2 e ί 決定されたアミノ酸配列中の各ァミノ酸残基における重水素化速 度に従って、 タンパク質のアミノ酸配列における相互作用界面情報を決定し 溶媒 接触残基情報 Z相互作用界面情報ファイル 1 0 6 cに格納する。
ま タンパク質構造解析装置 1 0 0 ί¾ 立体構造予測処理部 1 0 2 f の処理によ り、 対象タンパク質にっレ、て P D Bなどのタンパク質データベースを用レ、て相同性検 索を行い、 雛型の立体構造となる構造既知のタンパク質を抽出する (ステップ S K— 3 )
ここで; 雛形のタンパク質を抽出できな力つた場合に 立体構造予測処理部 1 0 2 f I 分子シミュレーシヨン法などの手法により、 ^タンパク質の立体構造モデル のデータである立体構造予測データを作成レ立体構造予測データファイル 1 0 6 d に格納する (ステップ S K— 4 )。
そして、 処理結果出力部 1 0 2 h〖 予測された立体構造予測データと決定された切 断容易領域情報や溶媒接触残基情報や相互作用界面情報とを対応させて出力する (ス テツプ S K— 5 )。
ま 予測構造評価情報決定部 1 0 2 g〖 予測された立体構造予測データと、 決定さ れた切断容易領域情報や溶媒接触残基情報や相互作用界面情報とを比較して、 切断容 易領域情報により特定された切断容易領域や溶媒接触残基情報により特定された溶媒
接触残基や相互作用界面情報により特定された相互作用界面に对応する予測構造部分 につレ、て評価を行レ、予測構造評価情報を決定する。 ま 予測構造評価情報出力部 1 0 2 i f 決定された予測構造評価情報を出力する (ステップ S K—6 ) 。 これにて、 実施例 2の処理が終了する。
[実施例 3 ]
次に 本発明の実施例 3の詳細について図 1 5等を参照して説明する。 図 1 5 ί 本 発明における本システムの実施例 3の一例を示すフローチャートである。
まず、 タンパク質 (または複合体) について質量分析装置 4 0 0により断片化ス ぺクトルの測定を行う (ステップ S L— 1 )。 ま ^タンパク質 ほたは複合体) について水素—重水素交換反応を行いながら、断片化スぺク トルの測定を行ってもよ い。 そして、 タンパク質構造解析装置 1 0 0 断片化スぺクトルデータ取得部 1 0 2 aの処理により、 質量分析装置 4 0 0から入力装置 1 1 2またはネットワーク 3 0 0 を経由して断片化スぺクトルデータを取得し 断片化スぺクトルデータファイル 1 0 6 aに格納する。
ついで、 タンパク質構造解析装置 1 0 0 ί¾ 帰属情報決定部 1 0 2 bの処理により、 測定された断片化スぺク トルに基づいて、 タンパク質のアミノ酸配列に対する断 片化イオンの帰属情報を決定し (ステップ S L— 2 ) 、 ま タンパク質構造解析装 置 1 0 0 ¾ 切断容易領域情報決定部 1 0 2 cの処理により、 決定された断片化ィォ ンの帰属情報により、 タンパク質のァミノ酸配列において断片化イオンに断片化 された箇所を特定レ 当該箇所に従って対象タンパク質のァミノ酸配列における切断容 易領域情報を決定する。
ま 水素一重水素交換反応を行っている場合に タンパク質構造解析装置 1 0 0 I 重水素化速度決定部 1 0 2 jの処理により、 測定された断片化スぺク トル、 および、 決定された断片化イオンの帰属情報に従って、対象タンパク質のアミノ酸配列中の各 ァミノ酸残基における重水素化速度を決定する。 そして、溶媒接触残基情報決定部 1 0 2 d i% 決定されたアミノ酸配列中の各アミノ酸残基における重水素化速度に従って、 対象タンパク質のアミノ酸配列において溶媒に接触している箇所を特定し 当該箇所に 従って対象タンパク質のァミノ酸配列における溶媒接触残基情報を決定し溶媒接触
残基情報/相互作用界面情報ファイル 1 0 6 cに格納する。 ま 相互作用界面情報 決定部 1 0 2 e 決定されたアミノ酸配列中の各ァミノ酸残基における重水素化速 度に従って、 タンパク質のアミノ酸配列における相互作用界面情報を決定レ溶媒 接触残基情報 相互作用界面情報ファイル 1 0 6 cに格納する。
ま タンパク質構造解析装置 1 0 0 ί 立術冓造予測処理部 1 0 2 f の処理によ り、 対象タンパク質にっ 、て P D Bなどのタンパク質データベ一スを用 、て相同性検 索を行い、雛型の立体構造となる構造既知のタンパク質の候補タンパク質を抽出する (ステップ S L— 3 ) 。
そして、 立体構造予測処理部 1 0 2 Π 3 D - 1 D法などの手法により、 対象タン パク質と候補タンパク質とのァライメントを実行する (ステップ S L— 4 )。
そして、処理結果出力部 1 0 2 h i 候補タンパク質のアミノ酸配列や構造データと、 決定された切断容易領域情報や溶媒接触残基情報や相互作用界面情報とを対応させて 出力する (ステップ S L— 5 ) 。
ま 予測構造評価情報決定部 1 0 2 g 礙甫タンパク質の構造データと、 決定さ れた切断容易領域情報や溶媒接触残基情報や相互作用界面情報とを比較して、切断容 易領域情報により特定された切断容易領域や溶媒接触残基情報により特定された溶媒 接触残基や相互作用界面情報により特定された相互作用界面に対応する予測構造部分 につレ、て評価を行い予測構造評価情報を決定する。 ま 予測構造評価情報出力部 1 0 2 i 決定された予測構造評価情報を出力する。 これにより、 各候補タンパク質の 構造データと対象タンパク質の実験データとの一致性を順位付けることができ、 さらに 最も評価の高い候補タンパク質を絞り込むことができる (ステップ S L— 6 ) 。
ついで、 立体構造予測処理部 1 0 2 f ί 最も評価の高い候補タンパク質を雛型の タンパク質として対象タンパク質の立体構造モデルのデータである立体構造予測デー タを作成し 立体構造予測データファイル 1 0 6 dに格納する (ステップ S L— 7 ) 。 そして、 実施例 1のステップ S J— 6およびステップ S J _ 7と同様の方法により、 モデル構造の評価などを行う (ステップ S L— 8 )。 これにて、 実施例 3の処理が終了 する。
[実施例 4 ]
次に 本発明の実施例 4の詳細について図 1 6等を参照して説明する。 図 1 6 本 発明における本システムの実施例 4の一例を示すフローチヤ一トである。
まず、 タンパク質構造解析装置 1 0 0 立 ί材冓造予測処理部 1 0 2 f の処理によ り、 対象タンパク質にっレ、て P D Bなどのタンパク質データベースを用レ、て相同性検 索を行い、 雛型の立体構造となる構造既知のタンパク質を抽出する (ステップ S M— ここで;雛形のタンパク質を抽出できな力 た場合には 立体構造予測処理部 1 〇 2 f 分子シミュレーシヨン法などの手法により、 対象タンパク質の立体構造モデル のデータである立体構造予測データを作成し立体構造予測データファイル 1 0 6 d に格納する (ステップ S M— 2〜ステップ S M— 3 )。
そして、 * ^タンパク質 ほたは複合体) および雛型タンパク質につレ、て質量分析装 置 4 0◦により断片化スぺク トルの測定を行う (ステップ S M— 1およびステップ S M— 4 )。 ま タンパク質 (または複合体) および雛型タンパク質につレ、て水素 —重水素交換反応を行いながら、 断片化スぺク トルの測定を行ってもよい。 そして、 タ ンパク質構造解析装置 1 0 0 ί¾ 断片化スぺク トルデータ取得部 1 0 2 aの処理によ り、 質量分析装置 4 0 0から入力装置 1 1 2またはネットワーク 3 0 0を経由して断 片化スぺク トルデータを取得レ 断片化スぺク トルデータファイル 1 0 6 aに格納す る。
ついで タンパク質構造解析装置 1 0 0 f 帰属情報決定部 1 0 2 bの処理により、 測定された断片化スぺクトルに基づいて、 * ^タンパク質および雛型タンパク質のァ ミノ酸配列に対する断片化イオンの帰属情報を決定し (ステップ S M— 2 ) 、 ま タンパク質構造解析装置 1 0 0 f 切断容易領域情報決定部 1 0 2 cの処理により、 決定された断片化イオンの帰属情報により、 ^タンパク質および雛型タンパク質の ァミノ酸配列において断片化イオンに断片化された箇所を特定し 当該箇所に従って対 象タンパク質のァミノ酸配列における切断容易領域情報を決定する。
ま 水素—重水素交換反応を行っている場合に タンパク質構造解析装置 1 0 0 重水素化速度決定部 1 0 2 j の処理により、 測定された断片化スぺク トル、 および、 決定された断片化イオンの帰属情報に従って、対象タンパク質および雛型タンパク質
のアミノ酸配列中の各アミノ酸残基における重水素化速度を決定する。 そして、溶媒接 触残基情報決定部 102 d 決定されたァミノ酸配列中の各ァミノ酸残基における 重水素化速度に従って、対象タンパク質および雛型タンパク質のアミノ酸配列におい て溶媒に接触している箇所を特定し 当該箇所に従って対象タンパク質のァミノ酸配列 における溶媒接触残基情報を決定し 溶媒接触残基情報 相互作用界面情報フアイル 106 cに格納する。 また、 相互作用界面情報決定部 102 e ί 決定されたァミノ酸 配列中の各アミノ酸残基における重水素化速度に従って、 ¾ ^タンパク質および雛型 タンパク質のァミノ酸配列における相互作用界面情報を決定し溶媒接触残基情報 Ζ 相互作用界面情報ファイル 106 cに格納する。
そして、 処理結果出力部 102 h ί ¾ ^タンパク質および雛型タンパク質の予測さ れた立体構造予測データと決定された切断容易領域情報や溶媒接触残基情報や相互作 用界面情報とを対応させて出力する (ステップ SM— 5)。
ま 予測構造評価情報決定部 102 g 予測された立体構造予測データと、 決定さ れた切断容易領域情報や溶媒接触残基情報や相互作用界面情報とを比較して、切断容 易領域情報により特定された切断容易領域や溶媒接触残基情報により特定された溶媒 接触残基や相互作用界面情報により特定された相互作用界面に対応する予測構造部分 について評価を行い予測構造評価情報を決定する。 ま 予測構造評価情報出力部 1
02 H 決定された予測構造評価情報を出力する (ステップ SM— 6)。 これにて、 実施例 4の処理が終了する。
なお 実施例 4においては ステップ SM— 2における相同性検索において雛型タン パク質が抽出できない場合を一例に説明したが、相同性検索にぉレ、て雛型タンパク質が 抽出できた場合に その雛型タンパク質についてステップ SM— 4におレ、て実験値が 収集される。
[実施例 5]
次に本発明の実施例 5の詳細について図 11および図 18等を参照して説明する。 (1) リコンビナント . ヒ トインターロイキン一 6 (I L— 6) の調製
I L— 6は文献の方法によ.り、 大腸菌を用いて発現 精製を行った (D. E j i m a , B i o t e c hn o l . B i o e n g. , 62, 301— 10 (1999) 参
照)。
(2) I L— 6の FT I CR— MS測定
すべての測定 g a s a s s i s t e d d yn am i c t r a p p i n g (GADT) 法で行つ GADT法は イオンを測定セル内に捕捉する際 一時的 にトラップ電圧を高くして力つイオンの運動エネルギーを低下させるためにアルゴン ガスをトラップガスとしてパルスでセル内に導入する方法である。 これにより効率よく イオンをセル内に捕捉することが可能となり、感度が向上する。
測定機器及び分析条件等は下記の通りである。
•質量分析計: 7 T セルフシールド超伝導マグネッ トフーリェ変換型質量分析計 A e x I I (ブルカー 'ダルト二クス社製) ;
流速: 60 μ 1 /h ;
乾燥ガス (Dr i n g g a s) : 20 p s i、 150°C ;
Ne b u l i z i n g g a s : 30 p s i ;
アルゴンガス圧: 7. 8 T o o r ;
'へキサポール内蓄積時間: 1秒;
キヤピラリー出口電圧 : 106. 5 k V (MSスぺク トル) 、 150 k V (I RM PD)、 220 k V (へキサポール C I D) ;及ぴ
•データ取り込みポイント数: 512Ko
(3) I RMPD法及びへキサポール C I D法による I L— 6の断片ィ匕
I RMPD法 イオンサイクロトロンセル内に閉じ込めたイオンに対して、 300 ミリ秒間炭酸ガスレーザーを照射し ま へキサポール C I D法 通常の測定と 同じパルスシークェンスを用いて、 キヤピラリー出口電圧を上げることとへキサポール 内蓄積時間を 1— 3秒にすることで断片化を誘起することができ FT I CR— MS スぺクトルは全て、 装置に付属のソフトウェアである Xm a s sを用いて解析を行つ 断片化イオンの帰属 ί ソフトウェア F r a g— P r o (m s m s s o f t社 製) を用いた。
(4) 3D— ID法及び PS I一 B LASTによるホモロジ一検索
ヒトインターロイキン _6 ( I L 6) のアミノ酸配列 i P IR (タンパク質アミ
ノ酸配列データベース) より取得し プレ配列を含むアミノ酸残基数は 212残基 であつ L I BRAを用いて 3D— 1 D法によるホモロジ一検索を行った結果 上位 30件の PDBファイルリストとして、 1 a 1 u, l l k i, 1 a u 1—A, 1 n f 1― A, 1 q k m― A, 1 j n k , 1 p m e , 1 d g 9― A, 1 b 5 1 , 1 b g c , 1 y r g_A, l e u v_A, 2 t p s一 B, 1 b g 0 , 1 i a 1一 A, 2 c n d , 1 c j s― A, 1 w e r , 7 o d c― A, 1 e q f― A, 1 f 6 f一 A, 1 d x y , 1 e d t , 1 g s e— A, 1 q r 2一 A, 1 1 1 p, 1 q i 7— A, 2 b i d— A, 2 1 j r— A, 1 c 3 j—Aを得
また PS I—B LASTを用いて、 e値が 0· 01以下の条件によるホモロジー検 索を行った結果 PDBファイルリストとして、 1 I L 6, 1 ALU, 1GNC, I B GE— B, 1 BGC, 1 RHG_C, 1 I 1 R— Bを得 この場合、上位 6件は I L 6自身または I L 6と立体構造の類似性が既に指摘されているタンパク質である G C a F (Gr a nu l o c y t e Co l o ny S t i mu l a t i n g r a c t o r) であるため、 レ、ずれの参照タンパク質についても立体構造予測の候補になり 得ることが確認でき
(5) ァライメントに対する 2次構造情報と M Sの断片化データの照会
そこで L I BRAによるホモロジ一検索によって得られた 30種類の各ァライメン トに対して、 参照タンパク質の 2次構造情報と M Sの断片化データを同時に照会する プログラムを作成レ 結果をァライメントごと^ ¾示し 図 18 雄例 5におけ る処理結果の一例を示す図である (本図において Aの後に Bが結合する)。この図に 示すように処理結果の表示画面 ί 例えば ¾ ^タンパク質のアミノ酸配列を表示す るための表示領域 MB— 1、 雛型タンパク質のアミノ酸配列を表示するための表示領 域 MB— 2、 立体構造予測データの一例である二次立体構造予測データを表示するた めの表示領域 MB— 3、および、 実験データの断片化イオンのフラグメントを表示す るための表示領域 MB - 4を含んで構成されている。 図 18において、 MB- 3におけ る 2次構造の表示 f 「1」 は αヘリックス、 「2」は ]3ストランド、 「4」はループ領域 を示している。
(6) 候補タンパク質の評価
2次構造情報と全ての断片化データの情報からァライメントごとに候補タンパク質 の評価 (ランク付け) を行うプログラムを作成レ これを検証した結果、 I L6の立体 構造予測に対して最も有効な候補タンパク質は I L 6自身 (1 a 1 u) であること、 次 いで有効な候補タンパク質 I L 6と立体構造の類似性が既に指摘されているタン パク質である GCSF (1 b g c) であることが確認、でき
ここで; 図 11 本実施例にぉレ、て断片化スぺクトルを解析する場合の一例を示す フローチヤ一トである。
まず、 帰属情報決定部 102 b ί 断片化スぺク トルデータファイル 106 aに格 納された断片化スぺク トルを参照して、 断片化スぺク トルにおける各イオンの mZz や、価数の情報 (分解能が低い場合、価数はわからない場合もある) を取得する (ス テツプ SH— 1)。
そして、 帰属情報決定部 102 b 各断片化イオンのアミノ酸配列への帰属を求め、 各イオンの m/ z (+価数) に基づいて、 候補べプチド断片を検索 ·抽出 ·表示する (ステップ SH— 2)。
そして、切断容易領域情報決定部 102 c ί 切断が容易な部位を抽出して切断容易 領域情報として切断容易領域情報ファイル 106 bに格納する (ステップ SH— 3)。 そして、 処理結果出力部 102hii 上述した図 12に示すように 立体構造表示ソフ トを用いて切断容易領域情報に基づレ、て切断部位の色を変えるように制御して表示す る (ステップ SH— 4)。 これにて、 実施例 5の処理が終了する。
[実施例 6 ]
7火に 本発明の実施例 6の詳細について図 26等を参照して説明する。
(1) ュビキチンの FT I CR—MSによる断片化スぺクトルの測定と帰属
ゥシ由来ュビキチン (シグマ社製コード No. U 6253) を 5 pmo l/ Lに なるように 1 %酢酸一 50 %メタノ一ル水溶液に溶解したサンプルを使用し 全ての 測定 GAD T法で行っ
測定機器及び分析条件等は下記の通りである。
'質量分析計:ナノエレクトロスプレ一^ rオン源を装着した 7 τ セルフシールド超 伝導マグネットフーリェ変換型質量分析計 Ap e x I I (ブノレ力一' ダルトニク
ス社製) ;
•流速: 200 n 1 / m i n ;
•乾燥ガス : 5 p s i、 200 °C;
.へキサポール内蓄積時間: 0. 6秒;
·キヤピラリー電圧: 1 800 V ;
•キヤピラリー出口電圧: 90 V;及び
•データ取り込みポイント数: 5 1 2
本実施例において、 高いキヤピラリー出口電圧によるノイズスキマー C I D法を用い て、 ュビキチンの断片化を誘起することができ FT I CR— MSスぺク トルの解析 と断片化ィオンの帰属 ί 実施例 5と同じ方法で行つ:^ ァミノ酸配列は P I Rより取 得し^
(2) 立体構造と MS断片化データの照会
ュビキチンは既に立体構造が明ら力となっている。 PDB (タンパク質立体構造デー タバンク) より、 ュビキチンの構造ファイル (PDBファイル; 1 UB I . p d b) を取得し 立体構造表示ソフト「V i e w e r L i t e (製品名)」 (A c c e 1 r y s (会社名) 製) を用いて、 図 26に示すようにュビキチンの立体構造をリボンモデ ルで表示し 図 26は、本発明における本システムの実施例 6におけるゥシ由来ュビ キチンの立体構造の一例を示す図である。 図 26において、 αヘリックスを スト ランドを水色で表示し更に MSで得られた断片化部位を黄色で表示し その結果 ctヘリックスの末端や /3ストランドの断片化が生じ易ぐ 2次構造を有する αへリツ クス内部や ]3ストランド内部では生じにくレ 頃向にあることがわ力 これにて、 実施 例 6の説明が終了する。
[実施例 7]
次に本発明の実施例 7の詳細について図 2 7等を参照して説明する。
( 1) アルコール脱水素酵素の FT I CR— MSによる断片化スペク トルの測定と帰 属
酵母由来アルコール脱水素酵素 (シグマ社製コード No. ) を 5 pmo l / Lに なるように 1 %酢酸— 50 %メタノール水溶液に溶解したサンプルを使用し 全ての
測定 ft GAD T法で行つ
測定機器及び分析条件等は下記の通りである。
'質量分析計:ナノエレクトロスプレーイオン源を装着した 7 Τ セルフシールド超 伝導マグネットフーリェ変換型質量分析計 Ap e x I I (ブノレ力一 ·ダルトニク ス社製) ;
流速: 200 η \ / ΧΏ. Ί η ;
乾燥ガス : 5 p s i、 200 °C ;
へキサポール内蓄積時間: 1秒;
キヤビラリ一電圧: 1 7 50 V ;
キヤピラリー出口電圧: 1 70 V;及び
データ取り込みポイント数: 5 1 2Ko
本実施例において、 キヤビラリ一出口の電圧を上げることによるへキサポール C I D 法を用いて、 アルコール脱水素酵素の断片化を誘起することができ^ FT I CR-M Sスぺクトルの解析と断片化イオンの帰属 実施例 5と同じ方法で行っ アミノ酸 配列は P I Rより取得し
(2) アルコール脱水素酵素のモデリングと MS断片化データの照会
全自動タンパク質モデリングソフト F AM Sを用いて、 アルコール脱水素酵素の立 体構造モデルを作成し 立体構造表示ソフト 「V i ewe r L i t e (製品名) J
(A c c e 1 r y s (会社名) 製) を用いて、図 2 7に示すようにアルコール脱水素 酵素の立体構造をリボンモデノレで表示し^ 図 27ί¾ 本発明における本システムの 実施例 7における酵母由来アルコール脱水素酵素の立体構造の一例を示す図である。 図 2 7において、 αヘリックスを歡 βストランドを水色で表示し更に MSで得られ た断片化部位を黄色で表示し その結: ¾ モデル構造上、 αヘリックスや ;8ストラン ドの末端に断片化部位が多ぐ ctヘリックス内部や i3ストランド内部で少なレ、傾向に あることが視覚的に容易にわかり、 モデル構造が実験データとよく一致し これにて、 実施例 7の説明が終了する。
[実施例 8 ;実験結果により興味の対象となったタンパク質の立体構造表示] 次に本発明の実施例 8の詳細について図 21〜図 25等を参照して説明する。
図 21W 本発明における本システムの実施例 8の一例を示すフローチャートであ る。
本実施例 f 図 21に示すよう ( DNAマイクロアレイ等による mRNA発現プロ フアイリング等の発現解析結果や、 プロテオーム解析で得られた M Sによる同定結果 (例え i Ma s c o t, SE QUE ST等) や、比較ゲノム解析の結果や、 タンパク 質相互作用解析 (例えば 酵母 2ハイプリッド (y e a s t two-h y b r i d) 法や TAP法 (Anu j Kume r , , Na t u r e, 415, 123— 12 4 (2002) ) ) の結果や、 例えば KEG G等の代謝パスウェイマップやシグナル 伝達マップ上で興味深い遺伝子のァクセッション番号等の識別番号を指定 (例えば 画面上でクリック等) することにより、 立体構造データベース (例えば PDB等) や モデル構造データベース (例えば FAMS B a s e等) から立体構造データを検 索 '抽出レ 立体構造表示プログラム (例えば Ra sMo 1等) を用いて表示する。 以下【 Ana b a e n a s p. P C C 7120株のゲノムについて、 転写量の増 減と立体構造との相関を表す場合を一例に説明する。 本実施例 i DNAマイクロア レイによる m R Ν Α転写の量転写量をマッピングしたデータと立体構造データベース とをリンクさせることにより、 転写量の増減と立体構造との相関を明確化することを目 的とする表示プログラムである。
図 22{ DN Aマイクロアレイによる発現量の違いを色別に表示した表示画面の 一例を示す図である。 本画面中の小さなマス ί 遺伝子一つ一つを示レ 「赤、 「青、 mは転写量の「増、 搣、 「不変 をそれぞれ表レ 色の「濃、 体構造データ ベース (例えば PDB等) との配列的な相同性の「有、 「無 を表す。
ここで、禾 IJ用者が興味深い遺伝子に対応するマスの一つをクリックすると、 図 23に 示すように SCOP (S t u r u c t u r a l C l a s s i f i c a t i o n o f Pr o t e i n s) の分類番号と、錡型の PDB等の I D (識別番号) が示され さらに ホモロジ一の高い PDBデータ (本図の例では上位五位) を示すクリックボ タン (図 23においてアンダーライン表示された部分) が表示される。
禾 ϋ用者がクリックボタンをクリックすると、 図 24に示すようなァライメントの表示 画面や図 25に示すような R a sMo 1等のグラフィックソフトウエアによる立体構
造の表示画面を表示することができる。
本実施例によると、 DN Aマイクロアレイ等によるトランスクリプトーム解析や、 プ 口テオ一ム解析 (MSによるタンパク同定結果など) や、 ゲノム解析 (バイオインフ ォマテイクス) 等によりディスプレイ上に表示された注目すべき遺伝子 ·蛋白質の識 別番号 (ァクセッション番号等) をクリックすると、 立体構造および構造予測データ ベースから、 その立体構造を引き出して 3D表示をすることができるようになる。 これに て、 実施例 8の処理が終了する。
[他の実施の形態]
さて、 これまで本発明の実施の形態について説明したが、 本発明 ί した実施の形 態以外にも、 上記特許請求の範囲に記載した技術的思想の範囲内にぉレ、て種々の異な る実施の形態にて実施されてよいものである。
例え タンパク質構造解析装置 100がスタンドアローンの形態で処理を行う場 合を一例に説明したが、 タンパク質構造解析装置 1◦ 0とは別筐体で構成されるクラ イアント端末からの要求に応じて処理を行い、その処理結果を当該クライアント端末 に返却するように構成してもよい。
ま 上述した実施例において ¾ 溶媒接触残基や相互作用部位界面情報等を水素— 重水素交換法を用レ、て得る場合を一例に説明したが、 本発明はこのような:^に限定さ れるものではなぐ例え 化学修飾法などを用レ、て得てもよレ、。 例えば、 トランスダル タミナーゼを用いてタンパク質のグルタミン残基に安定同位体 15 Νを選択的に導 入することができる (N. S h i mb a , N. Yama d a, K. Yo k o y am a , E. Su z uk i, An a l . B i o c h e m. , 301, 123— 127 (2002) )。 この方法を上述した実施の形態と組み合わせることにより、 グノレタミ ン残基ごとの溶媒接触度の違レ、をラベル化率から求めることができるので、 溶媒接触残 基や相互作用部位界面情報等を水素一重水素交換法を用いる場合と同様に得ることが できるようになる。
ま 上述した実施例において MSにより断片化を行う場合を一例に説明したが、 本発明はこのような場合に限定されるものではなぐ例えば 酵素消化法などを用いて得 てもよレ、。 すなわ ペプシンやトリプシンなどの消化酵素などを用いた酵素反応によ
りタンパク質を断片化してもよい。
ま 立体構造予測処理部 102 Π タンパク質構造解析装置 100に備える予測 プログラムを用いて予測してもよぐま 外部システム 200に備える予測プロダラ ムを用いて立体構造予測データを作成レ その立体構造予測データをネットワーク 3 00経由で取得してもよい。
ま 実施形態において説明した各処理のうち、 自動的に行なわれるものとして説明し た処理の全部または一部を手動的に行うこともでき、 あるい 手動的に行なわれるも のとして説明した処理の全部または一部を公知の方法で自動的に行うこともできる。 この佌 上記文書中や図面中で示した処理手順、制御手覼 具体的名称、各種の登録デ ータゃ検索条件等のパラメータを含む情報、 ®Β データベース構成について 特記する場合を除レ、て任意に変更することができる。
まナ タンパク質構造解析装置 100に関して、 図示の各構成要素は機能概念的なも のであり、 必ずしも物理的に図示の如く構成されていることを要しない。
例えば タンパク質構造解析装置 100の各部または各装置が備える処理機^ 特に 制御部 102にて行なわれる各処理機能について ί¾ その全部または任意の一部を、 C PU (Ce n t r a l P r o c e s s i n g Un i t) および当該 C PUにて解 釈実行されるプログラムにて実現することができ、 あるい ί¾ ワイヤードロジックによ るハードウェアとして することも可能である。 なお プログラムは後述する記録媒 体に記録されており、 必要に応じてタンパク質構造解析装置 100に機械的に読み取ら れる。
すなわ ROMまたは HDなどの記憶部 106などに OS (O p e r a t i n g Sy s t em) と協働して C P Uに命令を与え、 各種処理を行うためのコンビユー タプログラムが記録されている。 このコンピュータプログラム i RAM等にロードさ れることによって実行され CPUと協働して制御部 102を構成する。ま このコン ピュータプログラム { タンパク質構造解析装置 100に対して任意のネットワーク 300を介して接続されたアプリケーションプログラムサーバに記録されてもよぐ必 要に応じてその全部または一部をダゥンロードすることも可能である。
ま 本発明にかかるプログラムを、 コンピュータ読み取り可能な記録媒体に格納す
ることもできる。 ここで、 この「 媒体」 とは フレキシブルディスク、 駕気ディスク、 ROM, EPRO , EE PROM, CD-ROM, MO、 DVD等の任意の「可搬用 の物理媒体」や、 各種コンピュータシステムに内蔵される ROM、 RAM, HD等の任 意の「固定用の物理媒体」、あるい LAN、 WAN, インターネットに代表されるネ ッ卜ワークを介してプログラムを送信する場合の通信回線や搬送波のよう ( 短期に プログラムを保持する「通信媒体」 を含むものとする。
ま 「プログラム」 と 任意の言語や記述方法にて記述されたデータ処理方法であ り、 ソースコードやバイナリコード等の形式を問わない。 なお 「プログラム」 は必ずし も単一的に構成されるものに限られず、 複数のモジュールやライブラリとして分散構 成されるものや、 OS (Op e r a t i n g Sy s t em) に代表される別個のプ ログラムと協働してその機能を達成するものをも含む。 なお 実施の形態に示した各装 置において記録媒体を読み取るための具体的な構^ 読み取り手睱 あるい 読み取 り後のインストール手順等について ¾ 周知の構成や手順を用いることができる。
記憶部 106に格納される各種のデータベース等 (断片化スぺクトルデータフアイ ノレ 106 a〜処理結果データファイル 106 f ) I RAM, ROM等のメモリ装置、 ハードディスク等の固定ディスク装置、 フレキシブルディスク、 光ディスク等のスト レージ手段であり、 各種処理やウェブサイ ト提供に用いる各種のプログラムやテープ ルゃフアイルゃデ一タベースゃゥヱブベージ用フアイル等を格納する。
ま タンパク質構造解析装置 100 既知のパーソナルコンピュータ、 ワークス テーション等の情報処理端末等の情報処理装置にプリンタゃモニタやイメージスキ ャナ等の周辺装置を接続し 該情報処理装置に本発明の方法を実現させるソフトゥェ ァ (プログラム、 データ等を含む) を実装することにより実現してもよレ、。
さらに タンパク質構造解析装置 100の分散 ·統合の具体的形態は図示のものに 限られず、 その全部または一部を、 各種の負荷等に応じた任意の単位で、機能的または 物理的に分散 ·統合して構成することができる。例えば 各データベースを独立したデ ータベース装置として独立に構成してもよぐまた、処理の一部を CG I (C ommo n Ga t ewa y I n t e r f a c e) を用いて実現してもよレヽ。 ま 例え ί タ ンパク質構造解析装置 100¾ 質量分析装置 400と一体として構成してもよい。
ま ネットワーク 3 0 0 タンパク質構造解析装置 1 0 0と外部システム 2 0 0 とを相互に接続する機能を有レ 例えば インタ一ネットゃ、 イントラネットゃ、 L A N (有線/無線の双方を含む) や、 VANや、パソコン通信網や、 公衆電話網 (アナ ログ デジタルの双方を含む) や、 専用回線網 (アナログ/デジタルの双方を含む) や、 C A T V網や、 I MT 2 0 0 0方 G S M方式または P D CZ P D C— P方式 等の携帯回線交換網 携帯バケツト交換網や、無線呼出網や、 B 1 u e t o o t h等 の局所無線網や、 P H S網や、 C S、 B Sまたは I S D B等の衛星通信網等のうちいず れかを含んでもよレ、。 すなわ ¾ 本システム ί 有線 ·無線を問わず任意のネットヮー クを介して、各種データを送受信することができる。
以上詳細に説明したように本発明によれ ί 立体構造を予測する対象タンパク質に ついてエレクトロスプレーイオン化法などによりイオン化したイオンをへキサポール C I D法などにより断片化イオンに断片化レ断片化スぺク トルを測定レ 測定された 断片化スぺクトルに基づいて、 ¾^タンパク質のアミノ酸配列に対する断片化イオン の帰属情報を決定レ 決定された断片化イオンの帰属情報により、 ^タンパク質の ァミノ酸配列において断片化ィオンに断片化された箇所を特定レ 当該箇所に従って対 象タンパク質のアミノ酸配列における切断容易領域情報を決定レ タンパク質に ついて立体構造を予測し、予測された立体構造予測データと決定された切断容易領域情 報とを対応させて出力する (例えば グラフィック表/ テーブルによる一覧表示な ど) ので、 立体構造未知のタンパク質 (これをコードする遺伝子を含む) の立体構造 予測を行う場合、 実測した立体構造情報を加味することにより、 精度の高い予測を行うこ とができるタンパク質構造解析方法、 タンパク質構造解析装置、 プログラム、 および、 記録媒体を提供することができる。
ま 本発明によれば、立体構造予測データを針金モデル、 リボンモデル、 パイプモ デル、 ボールアンドスティックモデル、 または空間充填モデルのうちレ、ずれかのモデ ルによりダラフィック表示し 切断容易領域情報を対応する立体構造予測データの表 示部分に関連付けて表示する (例えば リンクを設定、 モデル上に表示、モデル上に切 断容易領域情報に対応する網掛けや斜線などの特定のパターン模様を表示など) ので、 これらの情報を視覚的に分かり易く表示することができるようになり、利用者が立体構
造予測データの信頼性を直感的に判断することができるタンパク質構造解析方法、 タ ンパク質構造解析装置、 プロダラム、 および、 言 媒体を提供することができる。
ま 本発明によれば、 グラフィック表示やテーブル表示を行う際に切断容易領域 情報に従って対応する上記立体構造予測データの表示部分を色分けして表示するので、 これらの情報を視覚的に分かり易く表示することができるようになり、利用者が立体構 造予測データの信頼性を直感的に判断することができるタンパク質構造解析方法、 タ ンパク質構造解析装置、 プログラム、 および、 言 媒体を提供することができる。
ま 本発明によれば、予測された立体構造予測データと、決定された切断容易領域情 報とを比較して、切断容易領域情報により特定された切断容易領域に対応する予測構造 部分について評価を行い予測構造評価情報を決定し決定された予測構造評価情報を 出力するので、 計算機により予測された予測構造を生化学実験データに基づいて評価 を行うことができるようになり、 予測精度を著しく向上させることができるタンパク質構造 解析方法、 タンパク質構造解析装置、 プログラム、および、 記録媒体を提供することが できる。
ま これにより、 ゲノム配列解析、 D NAチップを用いた発現プロフアイリング解 析、 プロテオーム解析などで見つ力 た興味深い遺伝子 ' タンパク質の機能解析を行う 場合、 立体構造を基準とした機能予測の精度が格段に向上するようになり、 ま ゲノム 配列解析において 機能未知の遺伝子 ' タンパク質の立体構造を考慮した機能予測 を行うことにより効率的に機能を推定することができるようになる。 さらに、これにより、 阻害剤などのドラッグデザィンゃ蛋白質工学による活性向上や機能改変体のデザィ ンを効率的に行うことができるようになる。
ま 本発明によれば、 タンパク質について基準振動計算を行い、基準振動計算 結果 (例えば 揺らぎの情報など) を対応する立体構造予測データの表示部分に関連 付けて表示する (例えば 立体構造モデル上にべクトル表示を行う) ので、切断容易領 域として揺らぎの情報を考慮することができるようになる。 すなわ 基準振動計算結果 により揺らぎ情報を求め、 MS実測データと比較することにより予測モデルの評価を 行うことができるタンパク質構造解析方& タンパク質構造解析装置、 プログラム、 お よび、 記録媒体を提供することができる。
ま 本発明によれば、 立 f材冓造を予測する対象タンパク質についてへキサポール C I D法、 ノズルスキマー C I D¾ キヤビラリースキマー C I D S O R I—C I D¾ および、 マルチポールストァー補助キヤビラリースキマ一 C I D法を含む衝突 活性化解離 (C I D) 法、 I RM P D インソース分解 ( I S D) 法、 ポストソー ス分解 (P S D) 表面誘起解離 (S I D) ¾ E C D& および、 B I R D法のう ち少なくとも一つの方法により上記対象タンパク質について断片化ィオンに断片化し上 記断片化スぺクトルを測定するので、 ^タンパク質の立体構造を反映した断片化ィ オンを効率的に作成することができるタンパク質構造解析方 & タンパク質構造解析 装置、 プログラム、 および、 記録媒体を提供することができる。
ま 本発明によれば、酵素反応により対象タンパク質について断片化を行い断片化 スぺクトルを測定するので、 ^タンパク質の立体構造を反映した断片化を効率的に 行うことができるタンパク質構造解析方 ¾ タンパク質構造解析装置、 プログラム、 お よび、 記録媒体を提供することができる。
ま 本発明によれば、 立附冓造を予測する対象タンパク質について断片化し 断片 化スぺクトルを測定レ測定された断片化スぺクトルに基づいて、 ^タンパク質のァ ミノ酸配列に対する断片化イオンの帰属情報を決定レ 測定された断片化スぺク トノレ、 および、 決定された断片化イオンの帰属情報に従って、 ¾ ^タンパク質のアミノ酸配列 において溶媒に接触している箇所を特定し 当該箇所に従って対象タンパク質のァミノ 酸配列における溶媒接触残基情報を決定し ^タンパク質にっレ、て立体構造を予測 し予測された立体構造予測データと決定された溶媒接触残基情報とを対応させて出力 する (例え グラフィック表 テーブルによる一覧表示など) ので、立体構造未知 のタンパク質 にれをコードする遺伝子を含む) の立体構造予測を行う 、 実測し た立体構造情報を加味することにより、 精度の高い予測を行うこと力 Sできるタンパク質 構造解析方 タンパク質構造解析装置、 プログラム、 および、 記録媒体を提供するこ とができる。
ま 本発明によれば、予測された立体構造予測データと、 決定された溶媒接触残基情 報とを比較して、 溶媒接触残基情報により特定された溶媒接触残基に対応する予測構造 部分について評価を行い予測構造評価情報を決定レ 決定された予測構造評価情報を
出力するので、 計算機により予測された予測構造を生化学実験データに基づレ、て評価 を行うことができるようになり、 予測精度を著しく向上させることができるタンパク質構造 解析方法、 タンパク質構造解析装置、 プログラム、および、 記録媒体を提供することが できる。
ま 本発明によれば、 ¾" ^タンパク質について水素—重水素交換反応を行った後、 断片化し断片化スぺク トルを測定し 測定された断片化スぺク トル、 および、 決定され た断片化イオンの帰属情報に従って、 ^^タンパク質のアミノ酸配列中の各アミノ酸 残基における重水素化速度を決定レ 当該重水素化速度に従って対象タンパク質のァ ミノ酸配列において溶媒に接触している箇所を特定し 当該箇所に従って対象タンパク 質の上記ァミノ酸配列における溶媒接触残基情報を決定するので、 効率的に溶媒接触 情報を求めることができるタンパク質構造解析方 タンパク質構造解析装置、 プログ ラム、 および、 記録媒体を提供することができる。
ま 本発明によれば、 タンパク質について化学修飾を行った後、断片化し断片化 スぺクトルを測定し 測定された断片化スぺクトル、 および、 決定された断片化イオン の帰属情報に従って、 タンパク質のアミノ酸配列中の各アミノ酸残基における化 学修飾部分を決定レ 当該化学修飾部分に従って対象タンパク質のァミノ酸配列にお レ、て溶媒に接触している箇所を特定レ 当該箇所に従って対象タンパク質のアミノ酸配 列における溶媒接触残基情報を決定するので、効率的に溶媒接触情報を求めることが できるタンパク質構造解析方 ί£ タンパク質構造解析装置、 プログラム、および、 記録 媒体を提供することができ
ま 本発明によれば、 立附冓造を予測する対象タンパク質と化合物 (例えば タン パク質や低分子化合物や核酸など) との複合体について断片化レ 断片ィヒスぺクトル を測定し 測定された断片化スぺクトルに基づいて、 タンパク質およひブまたは化 合物に対する断片化イオンの帰属情報を決定し 測定された断片化スぺク トル、 および、 決定された断片化ィオンの帰属情報に従って、対象タンパク質および/または化合物に 関する相互作用界面情報を決定レ 対象タンパク質および/または化合物について立 体構造を予測レ 予測された立体構造予測データと、決定された相互作用界面情報とを 対応させて出力する (例え ί グラフィック表承 テーブルによる一覧表示など) ので、
立体構造未知のタンパク質 (これをコードする遺伝子を含む) の立体構造予測を行う 場合、 実測した立体構造情報を加味することにより、 精度の高い予測を行うことができる タンパク質構造解析方 タンパク質構造解析装置、 プログラ および、 記録媒体を 提供することができる。
ま 本発明によれば、立 冓造予測データを針金モデル、 リボンモデル、 パイプモ デル、 ボールアンドスティックモデル、 また f 空間充填モデルのうちいずれかのモデ ルにより対象タンパク質および zまたは化合物についてグラフィック表示 (例えば ドッキングシミュレーションなども含む) レ相互作用界面情報を対応する立体構造 予測データの表示部分に関連付けて表示する (例えば リンクを設定、モデノレ上に表 示 \ モデル上に相互作用界面情報に対応する網掛けや斜線などの特定のパターン模様 を表示など) ので、 これらの情報を視覚的に分かり易く表示することができるようになり、 禾 ij用者が立体構造予測データの信頼性を直感的に判断することができるタンパク質構 造解析方法、 タンパク質構造解析装置、 プログラム、 および、 記録媒体を提供すること ができる。
ます 本発明によれば、 グラフィック表示やテーブル表示を行う際に相互作用界面 情報に従って対象タンパク質および/または化合物の対応する上記立体構造予測デー タの表示部分を色分けして表示するので、 これらの情報を視覚的に分かり易く表示する ことができるようになり、利用者が立体構造予測データの信頼性を直感的に判断するこ とができるタンパク質構造解析方 ¾ タンパク質構造解析装置、 プログラム、 および、 記録媒体を提供することができる。
ま 本発明によれば、予測された立体構造予測データと、決定された相互作用界面情 報とを比較して、 相互作用界面情報により特定された相互作用界面に対応する予測構造 部分について評価を行い予測構造評価情報を決定し 決定された予測構造評価情報を 出力するので、 計算機により予測された予測構造を生化学実験データに基づレ、て評価 を行うことができるようになり、 予測精度を著しく向上させることができるタンパク質構造 解析方 ¾ タンパク質構造解析装置、 プログラム、および 記録媒体を提供することが できる。
ま 本発明によれば、纖タンパク質と化合物との複合体にっレ、て水素—重水素交
換反応を行った後、 断片化し上記断片化スぺク トルを測定し 測定された断片化スぺク トル、 および、 決定された断片化イオンの帰属情報に従って、 ¾ ^タンパク質および または化合物における重水素化速度を決定し 当該重水素化速度に従って対象タンパ ク質および/または化合物において相互作用界面を特定し 当該相互作用界面に従って 対象タンパク質および Zまたは化合物における相互作用界面情報を決定するので、 効 率的に相互作用界面情報を求めることができるタンパク質構造解析方法、 タンパク質 構造解析装置、 プログラム、 および、 記録媒体を提供することができる。
ま 本発明によれば、纖タンパク質と化合物との複合体について化学修飾を行つ た後、 断片化し断片化スぺク トルを測定し 測定された断片化スぺク トル、 および、 決定 された断片化イオンの帰属情報に従って、 ¾«タンパク質および Zまたは化合物におけ る化学修飾部分を決定し 当該化学修飾部分に従って対象タンパク質および Zまたは 化合物において相互作用界面を特定し 当該相互作用界面に従って対象タンパク質お よび/または化合物における相互作用界面情報を決定するので、効率的に相互作用界 面情報を求めることができるタンパク質構造解析方 タンパク質構造解析装置、 プロ グラム、 および 記録媒体を提供することができる。
さら ( 本発明によれば、 酵素反応により対象タンパク質と化合物の複合体について 断片化を行い断片化スぺク トルを測定するので、 タンパク質の立体構造を反映し た断片化を効率的に行うことができるタンパク質構造解析方法、 タンパク質構造解析装 置、 プログラム、 および、言 媒体を提供することができる。 産業上の利用可能性
以上のように 本発明にかかるタンパク質構造解析方法、 タンパク質構造解析装置、 プログラム、 および、 «媒体 f 計算手法により求めたタンパク質の立体構造デー タを生化学的な実験手法により求めたデータにより補完することができる。
これにより、 本発明にかかるタンパク質構造解析方法、 タンパク質構造解析装置、 プ ログラム、 および、 記録媒体 タンパク質の質量分析や立体構造などの解析を行うバ ィォインフォマテイクス分野において極めて有用である。
本発明 ί 産業上多くの分野、 特に医薬品、 食品、ィ t£P 医療、 遺伝子発現解析等の
分野で広く実施することができ、極めて有用である。