JP5990862B2

JP5990862B2 - 承認予測装置、承認予測方法、および、プログラム

Info

Publication number: JP5990862B2
Application number: JP2012219730A
Authority: JP
Inventors: シルヴァロペスティアゴジョゼダ; 北野　宏明; 宏明北野; 河岡　義裕; 義裕河岡
Original assignee: Japan Science and Technology Agency
Current assignee: Japan Science and Technology Agency
Priority date: 2012-10-01
Filing date: 2012-10-01
Publication date: 2016-09-14
Anticipated expiration: 2032-10-01
Also published as: WO2014054526A1; EP2905363B1; US20150242752A1; EP2905363A1; JP2014071836A; EP2905363A4; CN104781458B; CN104781458A

Description

本発明は、承認予測装置、承認予測方法、および、プログラムに関する。

従来から、既存の化合物のオフターゲットまたは副作用の予測を行う技術が開示されている。

非特許文献１に記載のタンパク質機能識別においては、リガンドの類似性に基づいてタンパク質のグループ化による薬物のオフターゲットを検出する技術が開示されており、以前に文献で報告されていない受容体と拮抗する点において、メタドン、エメチンおよびロペラミドのような薬剤の間に予期しない関係を発見している。

また、非特許文献２に記載の薬剤標的識別においては、出発点として市販医薬品によって引き起こされる副作用を用いて、オフターゲット効果を検討し、副作用に応じて薬をグループ化することにより適応や構造を持つ薬剤をグループ化し、以前に知られていなかった薬剤の追加標的タンパク質を決定する技術が開示されている。

また、非特許文献３に記載の既知薬剤の新規分子ターゲット予測においては、リガンドの類似性に基づいてタンパク質をグループ化し、オフターゲット効果を調べることで、既知の薬剤のうち、報告されている標的以外の標的を発見する技術が開示されている。

また、非特許文献４に記載の薬剤標的相互作用ネットワーク予測においては、タンパク質配列および薬剤標的に関する情報を結びつけて、薬理学的空間（ｐｈａｒｍａｃｏｌｏｇｉｃａｌｓｐａｃｅ）と呼ぶリソースを新たに作成し、このリソースを使用して、既知の薬物の追加標的を明らかにし、薬剤標的を酵素、イオンチャネル、Ｇタンパク質結合受容体、および、核内受容体の４つのクラスに分類する技術が開示されている。

また、非特許文献５に記載の薬剤活性大規模予測においては、市販薬の副作用の予測および説明に使用される薬剤ターゲット副作用ネットワークを作成し、医薬品と特定のタンパク質との意図しない相互作用の様々な関連性から、以前には説明することができなかった副作用を見いだす技術が開示されている。

また、非特許文献６に記載の薬剤誘導肝臓損傷予測システムは、肝臓の損傷を引き起こす可能性が高い化合物を同定するための予測システムであり、予測対象を肝臓に限定し、ある種の化合物が肝臓への損傷を起こしやすくしているという特性を科学文献の調査に基づいて予測する技術が開示されている。ここで、薬剤誘導肝臓損傷予測システムにおいては、肝臓への有害な影響を引き起こす可能性があるいくつかのタンパク質および経路を予測している。

ＫｅｉｓｅｒＭＪ，ＲｏｔｈＢＬ，ＡｒｍｂｒｕｓｔｅｒＢＮ，ＥｒｎｓｂｅｒｇｅｒＰ，ＩｒｗｉｎＪＪ，ＳｈｏｉｃｈｅｔＢＫ．（２００７）Ｒｅｌａｔｉｎｇｐｒｏｔｅｉｎｐｈａｒｍａｃｏｌｏｇｙｂｙｌｉｇａｎｄｃｈｅｍｉｓｔｒｙ，ＮａｔｕｒｅＢｉｏｔｅｃｈｎｏｌｏｇｙ，２５，１９７−２０６．ＣａｍｐｉｌｌｏｓＭ，ＫｕｈｎＭ，ＧａｖｉｎＡＣ，ＪｅｎｓｅｎＬＪ，ＢｏｒｋＰ．（２００８）ＤｒｕｇＴａｒｇｅｔＩｄｅｎｔｉｆｉｃａｔｉｏｎＵｓｉｎｇＳｉｄｅ−ＥｆｆｅｃｔＳｉｍｉｌａｒｉｔｙ，Ｓｃｉｅｎｃｅ，３２１，２６３−２６６．ＫｅｉｓｅｒＭＪ，ＳｅｔｏｌａＶ，ＩｒｗｉｎＪＪ，ＬａｇｇｎｅｒＣ，ＡｂｂａｓＡＩ，ＨｕｆｅｉｓｅｎＳＪ，ＪｅｎｓｅｎＮＨ，ＫｕｉｊｅｒＭＢ，ＭａｔｏｓＲＣ，ＴｒａｎＴＢ，ＷｈａｌｅｙＲ，ＧｌｅｎｎｏｎＲＡ，ＨｅｒｔＪ，ＴｈｏｍａｓＫＬ，ＥｄｗａｒｄｓＤＤ，ＳｈｏｉｃｈｅｔＢＫ，ＲｏｔｈＢＬ．（２００９）Ｐｒｅｄｉｃｔｉｎｇｎｅｗｍｏｌｅｃｕｌａｒｔａｒｇｅｔｓｆｏｒｋｎｏｗｎｄｒｕｇｓ，Ｎａｔｕｒｅ，４６２，１７５−１８１．ＹａｍａｎｉｓｈｉＹ，ＡｒａｋｉＭ，ＧｕｔｔｅｒｉｄｇｅＡ，ＨｏｎｄａＷ，ＫａｎｅｈｉｓａＭ．（２００８）Ｐｒｅｄｉｃｔｉｏｎｏｆｄｒｕｇ−ｔａｒｇｅｔｉｎｔｅｒａｃｔｉｏｎｎｅｔｗｏｒｋｓｆｒｏｍｔｈｅｉｎｔｅｇｒａｔｉｏｎｏｆｃｈｅｍｉｃａｌａｎｄｇｅｎｏｍｉｃｓｐａｃｅｓ，Ｂｉｏｉｎｆｏｒｍａｔｉｃｓ，２４，ｉ２３２−ｉ２４０．ＬｏｕｎｋｉｎｅＥ，ＫｅｉｓｅｒＭＪ，ＷｈｉｔｅｂｒｅａｄＳ，ＭｉｋｈａｉｌｏｖＤ，ＨａｍｏｎＪ，ＪｅｎｋｉｎｓＪＬ，ＬａｖａｎＰ，ＷｅｂｅｒＥ，ＤｏａｋＡＫ，ＣｏｔｅＳ，ＳｈｏｉｃｈｅｔＢＫ，ＵｒｂａｎＬ．（２０１２）Ｌａｒｇｅ−ｓｃａｌｅｐｒｅｄｉｃｔｉｏｎａｎｄｔｅｓｔｉｎｇｏｆｄｒｕｇａｃｔｉｖｉｔｙｏｎｓｉｄｅ−ｅｆｆｅｃｔｔａｒｇｅｔｓ，Ｎａｔｕｒｅ，４８６，３６１−３６７．ＬｉｕＺ，ＳｈｉＱ，ＤｉｎｇＤ，ＫｅｌｌｙＲ，ＦａｎｇＨ，ｅｔａｌ．（２０１１）ＴｒａｎｓｌａｔｉｎｇＣｌｉｎｉｃａｌＦｉｎｄｉｎｇｓｉｎｔｏＫｎｏｗｌｅｄｇｅｉｎＤｒｕｇＳａｆｅｔｙＥｖａｌｕａｔｉｏｎ − ＤｒｕｇＩｎｄｕｃｅｄＬｉｖｅｒＩｎｊｕｒｙＰｒｅｄｉｃｔｉｏｎＳｙｓｔｅｍ（ＤＩＬＩｐｓ）．ＰＬｏＳＣｏｍｐｕｔＢｉｏｌ７（１２）：ｅ１００２３１０．

しかしながら、非特許文献１乃至６に記載の従来の薬剤標的予測技術においては、標的タンパク質の特性に基づいて医薬品の承認の可能性を定量化することができないという問題点を有していた。

本発明は、上記問題点に鑑みてなされたもので、医薬品の承認または拒否の可能性を定量化することができる承認予測装置、承認予測方法、および、プログラムを提供することを目的とする。

このような目的を達成するため、本発明の承認予測装置は、出力部と記憶部と制御部とを少なくとも備えた承認予測装置であって、上記記憶部は、タンパク質同士の類似性に基づき構成されたタンパク質類似性ネットワークに関する類似性ネットワーク情報を記憶する類似性ネットワーク情報記憶手段と、薬剤の承認、または、非承認に関する承認属性を含む薬剤情報と、当該薬剤の標的となる上記タンパク質に関するタンパク質情報と、を対応付けて記憶する薬剤標的記憶手段と、上記タンパク質間の相互作用に基づき構成されたタンパク質間相互作用ネットワークに関する相互作用ネットワーク情報を記憶する相互作用ネットワーク情報記憶手段と、を備え、上記制御部は、上記類似性ネットワーク情報記憶手段に記憶された上記類似性ネットワーク情報に基づき、上記タンパク質類似性ネットワークを構成する上記タンパク質の次数中心性、媒介値中心性、距離の中心性、および、バートの制約値を含む中心性尺度である類似性中心性尺度を算出する類似性中心性尺度算出手段と、上記相互作用ネットワーク情報記憶手段に記憶された上記相互作用ネットワーク情報に基づき、上記タンパク質間相互作用ネットワークを構成する上記タンパク質の上記次数中心性、上記媒介値中心性、上記距離の中心性、および、上記バートの制約値を含む中心性尺度である相互作用中心性尺度を算出する相互作用中心性尺度算出手段と、上記薬剤標的記憶手段に記憶された上記各薬剤の上記承認属性と、上記類似性中心性尺度算出手段により算出された上記類似性中心性尺度の上記各薬剤の上記標的毎の合計値および平均値と、上記相互作用中心性尺度算出手段により算出された上記相互作用中心性尺度の上記各薬剤の上記標的毎の合計値および平均値と、を訓練データとする分類器を用いて、検証対象の化合物が上記非承認の上記薬剤に分類される確率である拒否スコアを算出する拒否スコア算出手段と、上記拒否スコア算出手段により算出された上記拒否スコアを上記出力部を介して出力させる拒否スコア出力手段と、を備えたことを特徴とする。

また、本発明の承認予測装置は、出力部と記憶部と制御部とを少なくとも備えた承認予測装置であって、上記記憶部は、類似性を有するタンパク質同士で構成されたタンパク質類似性ネットワークに関する類似性ネットワーク情報を記憶する類似性ネットワーク情報記憶手段と、薬剤の承認、または、非承認に関する承認属性を含む薬剤情報と、当該薬剤の標的となる上記タンパク質に関するタンパク質情報と、を対応付けて記憶する薬剤標的記憶手段と、を備え、上記制御部は、上記類似性ネットワーク情報記憶手段に記憶された上記類似性ネットワーク情報に基づき、上記タンパク質類似性ネットワークを構成する上記タンパク質の次数中心性、媒介値中心性、距離の中心性、および、バートの制約値を含む中心性尺度である類似性中心性尺度を算出する類似性中心性尺度算出手段と、上記タンパク質類似性ネットワークを構成する、上記薬剤標的記憶手段に記憶された上記タンパク質情報に基づく上記タンパク質を上記標的とする上記薬剤の上記承認属性に基づき、当該タンパク質類似性ネットワークを構成する検証対象の上記タンパク質が、上記承認された上記薬剤、または、上記非承認の上記薬剤の上記標的の範囲に含まれるか否かの判定結果を、上記類似性中心性尺度算出手段により算出された当該検証対象のタンパク質の上記類似性中心性尺度を用いて取得する承認判定手段と、上記承認判定手段により取得された上記判定結果を上記出力部を介して出力させる判定結果出力手段と、を備えたことを特徴とする。

また、本発明の承認予測装置は、上記記載の承認予測装置において、上記記憶部は、上記タンパク質のアミノ酸配列に関する配列情報を記憶するタンパク質配列情報記憶手段、を更に備え、上記制御部は、上記タンパク質配列情報記憶手段に記憶された上記配列情報に基づき、シグネチャベースアルゴリズムを用いて上記タンパク質同士の上記類似性が相互に検出された場合、当該相互に上記類似性が検出された上記タンパク質同士で構成される上記タンパク質類似性ネットワークを作成し、当該タンパク質類似性ネットワークに関する上記類似性ネットワーク情報を上記類似性ネットワーク情報記憶手段に格納する類似性ネットワーク情報格納手段、を更に備えたことを特徴とする。

また、本発明の承認予測装置は、上記記載の承認予測装置において、上記承認判定手段は、上記タンパク質類似性ネットワークを構成する、上記薬剤標的記憶手段に記憶された上記タンパク質情報に基づく上記タンパク質を上記標的とする上記薬剤の上記承認属性に基づき、上記類似性中心性尺度算出手段により算出された上記検証対象のタンパク質の上記類似性中心性尺度に含まれる上記次数中心性が高く、上記距離の中心性が低く、上記バートの制約値が非常に低い場合、上記検証対象の上記タンパク質が、上記非承認の上記薬剤の上記標的の範囲に含まれるという判定結果を生成することを特徴とする。

また、本発明の承認予測方法は、出力部と記憶部と制御部とを少なくとも備えた承認予測装置において実行される承認予測方法であって、上記記憶部は、タンパク質同士の類似性に基づき構成されたタンパク質類似性ネットワークに関する類似性ネットワーク情報を記憶する類似性ネットワーク情報記憶手段と、薬剤の承認、または、非承認に関する承認属性を含む薬剤情報と、当該薬剤の標的となる上記タンパク質に関するタンパク質情報と、を対応付けて記憶する薬剤標的記憶手段と、上記タンパク質間の相互作用に基づき構成されたタンパク質間相互作用ネットワークに関する相互作用ネットワーク情報を記憶する相互作用ネットワーク情報記憶手段と、を備え、上記制御部において実行される、上記類似性ネットワーク情報記憶手段に記憶された上記類似性ネットワーク情報に基づき、上記タンパク質類似性ネットワークを構成する上記タンパク質の次数中心性、媒介値中心性、距離の中心性、および、バートの制約値を含む中心性尺度である類似性中心性尺度を算出する類似性中心性尺度算出ステップと、上記相互作用ネットワーク情報記憶手段に記憶された上記相互作用ネットワーク情報に基づき、上記タンパク質間相互作用ネットワークを構成する上記タンパク質の上記次数中心性、上記媒介値中心性、上記距離の中心性、および、上記バートの制約値を含む中心性尺度である相互作用中心性尺度を算出する相互作用中心性尺度算出ステップと、上記薬剤標的記憶手段に記憶された上記各薬剤の上記承認属性と、上記類似性中心性尺度算出ステップにて算出された上記類似性中心性尺度の上記各薬剤の上記標的毎の合計値および平均値と、上記相互作用中心性尺度算出ステップにて算出された上記相互作用中心性尺度の上記各薬剤の上記標的毎の合計値および平均値と、を訓練データとする分類器を用いて、検証対象の化合物が上記非承認の上記薬剤に分類される確率である拒否スコアを算出する拒否スコア算出ステップと、上記拒否スコア算出ステップにて算出された上記拒否スコアを上記出力部を介して出力させる拒否スコア出力ステップと、を含むことを特徴とする。

また、本発明の承認予測方法は、出力部と記憶部と制御部とを少なくとも備えた承認予測装置において実行される承認予測方法であって、上記記憶部は、類似性を有するタンパク質同士で構成されたタンパク質類似性ネットワークに関する類似性ネットワーク情報を記憶する類似性ネットワーク情報記憶手段と、薬剤の承認、または、非承認に関する承認属性を含む薬剤情報と、当該薬剤の標的となる上記タンパク質に関するタンパク質情報と、を対応付けて記憶する薬剤標的記憶手段と、を備え、上記制御部において実行される、上記類似性ネットワーク情報記憶手段に記憶された上記類似性ネットワーク情報に基づき、上記タンパク質類似性ネットワークを構成する上記タンパク質の次数中心性、媒介値中心性、距離の中心性、および、バートの制約値を含む中心性尺度である類似性中心性尺度を算出する類似性中心性尺度算出ステップと、上記タンパク質類似性ネットワークを構成する、上記薬剤標的記憶手段に記憶された上記タンパク質情報に基づく上記タンパク質を上記標的とする上記薬剤の上記承認属性に基づき、当該タンパク質類似性ネットワークを構成する検証対象の上記タンパク質が、上記承認された上記薬剤、または、上記非承認の上記薬剤の上記標的の範囲に含まれるか否かの判定結果を、上記類似性中心性尺度算出ステップにて算出された当該検証対象のタンパク質の上記類似性中心性尺度を用いて取得する承認判定ステップと、上記承認判定ステップにて取得された上記判定結果を上記出力部を介して出力させる判定結果出力ステップと、を含むことを特徴とする。

また、本発明のプログラムは、出力部と記憶部と制御部とを少なくとも備えた承認予測装置に実行させるためのプログラムであって、上記記憶部は、タンパク質同士の類似性に基づき構成されたタンパク質類似性ネットワークに関する類似性ネットワーク情報を記憶する類似性ネットワーク情報記憶手段と、薬剤の承認、または、非承認に関する承認属性を含む薬剤情報と、当該薬剤の標的となる上記タンパク質に関するタンパク質情報と、を対応付けて記憶する薬剤標的記憶手段と、上記タンパク質間の相互作用に基づき構成されたタンパク質間相互作用ネットワークに関する相互作用ネットワーク情報を記憶する相互作用ネットワーク情報記憶手段と、を備え、上記制御部において、上記類似性ネットワーク情報記憶手段に記憶された上記類似性ネットワーク情報に基づき、上記タンパク質類似性ネットワークを構成する上記タンパク質の次数中心性、媒介値中心性、距離の中心性、および、バートの制約値を含む中心性尺度である類似性中心性尺度を算出する類似性中心性尺度算出ステップと、上記相互作用ネットワーク情報記憶手段に記憶された上記相互作用ネットワーク情報に基づき、上記タンパク質間相互作用ネットワークを構成する上記タンパク質の上記次数中心性、上記媒介値中心性、上記距離の中心性、および、上記バートの制約値を含む中心性尺度である相互作用中心性尺度を算出する相互作用中心性尺度算出ステップと、上記薬剤標的記憶手段に記憶された上記各薬剤の上記承認属性と、上記類似性中心性尺度算出ステップにて算出された上記類似性中心性尺度の上記各薬剤の上記標的毎の合計値および平均値と、上記相互作用中心性尺度算出ステップにて算出された上記相互作用中心性尺度の上記各薬剤の上記標的毎の合計値および平均値と、を訓練データとする分類器を用いて、検証対象の化合物が上記非承認の上記薬剤に分類される確率である拒否スコアを算出する拒否スコア算出ステップと、上記拒否スコア算出ステップにて算出された上記拒否スコアを上記出力部を介して出力させる拒否スコア出力ステップと、を実行させることを特徴とする。

また、本発明のプログラムは、出力部と記憶部と制御部とを少なくとも備えた承認予測装置に実行させるためのプログラムであって、上記記憶部は、類似性を有するタンパク質同士で構成されたタンパク質類似性ネットワークに関する類似性ネットワーク情報を記憶する類似性ネットワーク情報記憶手段と、薬剤の承認、または、非承認に関する承認属性を含む薬剤情報と、当該薬剤の標的となる上記タンパク質に関するタンパク質情報と、を対応付けて記憶する薬剤標的記憶手段と、を備え、上記制御部において、上記類似性ネットワーク情報記憶手段に記憶された上記類似性ネットワーク情報に基づき、上記タンパク質類似性ネットワークを構成する上記タンパク質の次数中心性、媒介値中心性、距離の中心性、および、バートの制約値を含む中心性尺度である類似性中心性尺度を算出する類似性中心性尺度算出ステップと、上記タンパク質類似性ネットワークを構成する、上記薬剤標的記憶手段に記憶された上記タンパク質情報に基づく上記タンパク質を上記標的とする上記薬剤の上記承認属性に基づき、当該タンパク質類似性ネットワークを構成する検証対象の上記タンパク質が、上記承認された上記薬剤、または、上記非承認の上記薬剤の上記標的の範囲に含まれるか否かの判定結果を、上記類似性中心性尺度算出ステップにて算出された当該検証対象のタンパク質の上記類似性中心性尺度を用いて取得する承認判定ステップと、上記承認判定ステップにて取得された上記判定結果を上記出力部を介して出力させる判定結果出力ステップと、を実行させることを特徴とする。

また、この発明によれば、タンパク質類似性ネットワークを構成するタンパク質の次数中心性、媒介値中心性、距離の中心性、および、バートの制約値を含む中心性尺度である類似性中心性尺度を算出し、タンパク質間相互作用ネットワークを構成するタンパク質の次数中心性、媒介値中心性、距離の中心性、および、バートの制約値を含む中心性尺度である相互作用中心性尺度を算出し、各薬剤の承認属性と、算出された類似性中心性尺度の各薬剤の標的毎の合計値および平均値と、算出された相互作用中心性尺度の各薬剤の標的毎の合計値および平均値と、を訓練データとする分類器を用いて、検証対象の化合物が非承認の薬剤に分類される確率である拒否スコアを算出し、算出された拒否スコアを出力部を介して出力させるので、１つの化合物の標的として全タンパク質の特性を考慮することで、複数標的化合物の承認・非承認の予測に利用することができるという効果を奏する。また、この発明によれば、機械学習の分類を用いた、候補化合物が望ましくない副作用を引き起こす可能性を示すスコアリングを行うことで、医薬品開発の初期段階で使用され、承認される高い可能性を有する化合物の優先順位を決定する手助けになるという効果を奏する。

この発明によれば、タンパク質類似性ネットワークを構成するタンパク質の次数中心性、媒介値中心性、距離の中心性、および、バートの制約値を含む中心性尺度である類似性中心性尺度を算出し、タンパク質類似性ネットワークを構成する、タンパク質を標的とする薬剤の承認属性に基づき、当該タンパク質類似性ネットワークを構成する検証対象のタンパク質が、承認された薬剤、または、非承認の薬剤の標的の範囲に含まれるか否かの判定結果を、算出された当該検証対象のタンパク質の類似性中心性尺度を用いて取得し、取得された判定結果を出力部を介して出力させるので、個々のタンパク質の特性を特定し、有害な影響を与える可能性がないかを判断することができるという効果を奏する。また、この発明によれば、ｓｉＲＮＡ治療、または、シングル標的化合物（ａｋａｍａｇｉｃｂｕｌｌｅｔｓ）等の単独標的の評価、または、単一の特定のタンパク質の活性を調節する技術に利用することができるという効果を奏する。

また、この発明によれば、シグネチャベースアルゴリズムを用いてタンパク質同士の類似性が相互に検出された場合、当該相互に類似性が検出されたタンパク質同士で構成されるタンパク質類似性ネットワークを作成し、当該タンパク質類似性ネットワークに関する類似性ネットワーク情報を格納するので、従来公表されているネットワークデータよりも高い類似性を有するネットワークデータを提供することができるという効果を奏する。

また、この発明によれば、タンパク質類似性ネットワークを構成する、タンパク質を標的とする薬剤の承認属性に基づき、算出された検証対象のタンパク質の類似性中心性尺度に含まれる次数中心性が高く、距離の中心性が低く、バートの制約値が非常に低い場合、検証対象のタンパク質が、非承認の薬剤の標的の範囲に含まれるという判定結果を生成するので、非特異的な結合をしやすく、副作用を起こしやすいタンパク質を的確に特定することができるという効果を奏する。

図１は、本実施の形態の基本原理を示すフローチャートである。図２は、本実施の形態の基本原理を示すフローチャートである。図３は、本実施の形態における承認予測装置の構成の一例を示すブロック図である。図４は、本実施の形態の承認予測装置の処理の一例を示すフローチャートである。図５は、本実施の形態における配列情報の一例を示す図である。図６は、本実施の形態における類似性ネットワーク情報の一例を示す図である。図７は、本実施の形態におけるバートの制約の一例を示す図である。図８は、本実施の形態におけるタンパク質の中心性尺度の一例を示す図である。図９は、本実施の形態における薬剤標的データベースに記憶される情報の一例を示す図である。図１０は、本実施の形態における承認または非承認の薬剤の標的の中心性尺度の一例を示す図である。図１１は、本実施の形態における相互作用ネットワーク情報の一例を示す図である。図１２は、本実施の形態における分類器の性能改善の一例を示す図である。図１３は、本実施の形態における分類器の分類精度の一例を示す図である。図１４は、本実施の形態における分類器の一例を示す図である。図１５は、本実施形態における出力情報の一例を示す図である。

以下に、本発明にかかる承認予測装置、承認予測方法、および、プログラムの実施の形態を図面に基づいて詳細に説明する。なお、この実施の形態によりこの発明が限定されるものではない。

［本発明の実施の形態の概要］
以下、本発明の実施の形態の概要について図１および図２を参照して説明し、その後、本実施の形態の構成および処理等について詳細に説明する。

［概要（その１）］
まず、図１を参照して、本発明の実施の形態の概要の一例について説明する。図１は、本実施の形態の基本原理を示すフローチャートである。本実施の形態は、概略的に、以下の基本的特徴を有する。

すなわち、本実施の形態の承認予測装置の制御部は、図１に示すように、タンパク質類似性ネットワークを構成するタンパク質の次数中心性、媒介値中心性、距離の中心性、および、バートの制約値を含む中心性尺度である類似性中心性尺度を算出する（ステップＳＡ−１）。

そして、承認予測装置の制御部は、タンパク質類似性ネットワークを構成する、タンパク質を標的とする薬剤の承認属性に基づき、当該タンパク質類似性ネットワークを構成する検証対象のタンパク質が、承認された薬剤、または、非承認の薬剤の標的の範囲に含まれるか否かの判定結果を、ステップＳＡ−１にて算出された当該検証対象のタンパク質の類似性中心性尺度を用いて取得する（ステップＳＡ−２）。

そして、承認予測装置の制御部は、ステップＳＡ−２にて取得された判定結果を出力部を介して出力させ（ステップＳＡ−３）、処理を終了する。

以上で、概要（その１）の説明を終える。

［概要（その２）］
また、図２を参照して、本発明の実施の形態の概要の一例について説明する。図２は、本実施の形態の基本原理を示すフローチャートである。

本実施の形態の承認予測装置の制御部は、図２に示すように、タンパク質類似性ネットワークを構成するタンパク質の次数中心性、媒介値中心性、距離の中心性、および、バートの制約値を含む中心性尺度である類似性中心性尺度を算出する（ステップＳＢ−１）。

そして、承認予測装置の制御部は、タンパク質間相互作用ネットワークを構成するタンパク質の次数中心性、媒介値中心性、距離の中心性、および、バートの制約値を含む中心性尺度である相互作用中心性尺度を算出する（ステップＳＢ−２）。

そして、承認予測装置の制御部は、各薬剤の承認属性と、ステップＳＢ−１にて算出された類似性中心性尺度の各薬剤の標的毎の合計値および平均値と、ステップＳＢ−２にて算出された相互作用中心性尺度の各薬剤の標的毎の合計値および平均値と、を訓練データとする分類器を用いて、検証対象の化合物が非承認の薬剤に分類される確率である拒否スコアを算出する（ステップＳＢ−３）。

そして、承認予測装置の制御部は、ステップＳＢ−３にて算出された拒否スコアを出力部を介して出力させ（ステップＳＢ−４）、処理を終了する。

以上で、本実施の形態の概要の説明を終える。

［承認予測装置１００の構成］
次に、本実施の形態における承認予測装置１００の構成の詳細について、図３を参照して以下に説明する。図３は、本実施の形態における承認予測装置１００の構成の一例を示すブロック図であり、該構成のうち本発明に関係する部分のみを概念的に示している。ここで、本実施の形態における承認予測装置１００においては、各構成が一筐体内に全て備えられ、単独で処理を行うもの（スタンドアローン型）を、承認予測装置１００として説明するが、当該実施例に限らず、各構成が分離した筐体内に備えられ、ネットワーク３００等を介して接続されて一つの概念としての装置を構成するもの（例えば、クラウドコンピューティング等）であってもよい。

図３において、外部システム２００は、ネットワーク３００を介して、承認予測装置１００と相互に接続され、タンパク質配列情報、薬剤情報、薬剤標的情報、および／もしくは、タンパク質間相互作用情報等に関する外部データベース、ならびに／または、ユーザインターフェース等を実行するウェブサイトを提供する機能等を有していてもよい。

ここで、外部システム２００は、ＷＥＢサーバやＡＳＰサーバ等として構成していてもよい。また、外部システム２００のハードウェア構成は、一般に市販されるワークステーション、パーソナルコンピュータ等の情報処理装置およびその付属装置により構成していてもよい。また、外部システム２００の各機能は、外部システム２００のハードウェア構成中のＣＰＵ、ディスク装置、メモリ装置、入力装置、出力装置、通信制御装置等およびそれらを制御するプログラム等により実現されてもよい。

また、ネットワーク３００は、承認予測装置１００と外部システム２００とを相互に接続する機能を有し、例えば、インターネット等である。

また、承認予測装置１００は、概略的に、制御部１０２と通信制御インターフェース部１０４と記憶部１０６と入出力制御インターフェース部１０８とを備える。ここで、承認予測装置１００は、更に、表示部１１２を少なくとも含む出力部、および、入力部１１４を備えていてもよい。また、出力部は、更に、音声出力部、および、印刷出力部等を含んでいてもよい。ここで、制御部１０２は、承認予測装置１００の全体を統括的に制御するＣＰＵ等である。また、通信制御インターフェース部１０４は、通信回線等に接続されるルータ等の通信装置（図示せず）に接続されるインターフェースであり、入出力制御インターフェース部１０８は、出力部、および、入力部１１４に接続されるインターフェースである。また、記憶部１０６は、各種のデータベースやテーブルなどを格納する装置である。これら承認予測装置１００の各部は任意の通信路を介して通信可能に接続されている。更に、この承認予測装置１００は、ルータ等の通信装置および専用線等の有線または無線の通信回線を介して、ネットワーク３００に通信可能に接続されている。

記憶部１０６に格納される各種のデータベースやテーブル（タンパク質配列情報データベース１０６ａ、類似性ネットワーク情報データベース１０６ｂ、薬剤標的データベース１０６ｃ、および、相互作用ネットワーク情報データベース１０６ｄ）は、固定ディスク装置等のストレージ手段である。例えば、記憶部１０６は、各種処理に用いる各種のプログラム、テーブル、ファイル、データベース、および、ウェブページ等を格納する。

これら記憶部１０６の各構成要素のうち、タンパク質配列情報データベース１０６ａは、タンパク質のアミノ酸配列に関する配列情報を記憶するタンパク質配列情報記憶手段である。ここで、アミノ酸配列は、ヒトタンパク質のアミノ酸配列であってもよい。また、配列情報は、ＦＡＳＴＡ形式であってもよい。これら配列情報は、タンパク質配列情報データベース１０６ａに予め記憶されており、承認予測装置１００の制御部１０２は、定期的に、および／または、制御部１０２による処理に応じてネットワーク３００を介して最新のデータを外部システム２００（例えば、ＮＣＢＩ、または、ＵＮＩＰＲＯＴ等）からダウンロードしてタンパク質配列情報データベース１０６ａに記憶された配列情報をアップデートしてもよい。

また、類似性ネットワーク情報データベース１０６ｂは、類似性を有するタンパク質同士で構成されたタンパク質類似性ネットワーク（ＰＳＩＮ）に関する類似性ネットワーク情報を記憶する類似性ネットワーク情報記憶手段である。

また、薬剤標的データベース１０６ｃは、薬剤の承認、または、非承認に関する承認属性を含む薬剤情報と、当該薬剤の標的となるタンパク質に関するタンパク質情報と、を対応付けて記憶する薬剤標的記憶手段である。ここで、非承認の薬剤とは、本実施の形態において、薬剤承認において撤回（Ｗｉｔｈｄｒａｗ）、または、却下（Ｉｌｌｉｃｉｔ）された薬剤を、問題がある薬剤として１つのグループと見なした薬剤であってもよい。すなわち、問題がある薬剤とは、有害な影響を与えるため市場から撤廃しなければならない薬剤、または、社会的に許されない違法な薬剤（例えば、覚せい剤または幻覚剤等）であって、承認される薬剤と区別する必要のある薬剤であってもよい。これら薬剤承認に関する薬剤情報およびタンパク質情報は、薬剤標的データベース１０６ｃに予め記憶されており、承認予測装置１００の制御部１０２は、定期的に、および／または、制御部１０２による処理に応じてネットワーク３００を介して最新のデータを外部システム２００（例えば、Ｄｒｕｇｂａｎｋ（ｈｔｔｐ：／／ｗｗｗ．ｄｒｕｇｂａｎｋ．ｃａ／）等）からダウンロードして薬剤標的データベース１０６ｃに記憶された薬剤承認に関する薬剤情報およびタンパク質情報をアップデートしてもよい。

また、相互作用ネットワーク情報データベース１０６ｄは、タンパク質間の相互作用に基づき構成されたタンパク質間相互作用ネットワーク（ＰＰＩ）に関する相互作用ネットワーク情報を記憶する相互作用ネットワーク情報記憶手段である。これら相互作用ネットワーク情報は、相互作用ネットワーク情報データベース１０６ｄに予め記憶されており、承認予測装置１００の制御部１０２は、定期的に、および／または、制御部１０２による処理に応じてネットワーク３００を介して最新のデータを外部システム２００（例えば、ＨＩＰＰＩＥ（ｈｔｔｐ：／／ｃｂｄｍ．ｍｄｃ−ｂｅｒｌｉｎ．ｄｅ／ｔｏｏｌｓ／ｈｉｐｐｉｅ／）等）からダウンロードして相互作用ネットワーク情報データベース１０６ｄに記憶された相互作用ネットワーク情報をアップデートしてもよい。

また、通信制御インターフェース部１０４は、承認予測装置１００とネットワーク３００（またはルータ等の通信装置）との間における通信制御を行う。すなわち、通信制御インターフェース部１０４は、外部システム２００、および、他の端末等と通信回線を介してデータを通信する機能を有する。

また、入出力制御インターフェース部１０８は、出力部（表示部１１２）、および、入力部１１４の制御を行う。

ここで、表示部１１２としては、アプリケーション等の表示画面を表示する表示手段（例えば、液晶または有機ＥＬ等から構成されるディスプレイ、モニタ、または、タッチパネル等）であってもよい。また、入力部１１４は、例えば、キー入力部、タッチパネル、コントロールパッド（例えば、タッチパッド、および、ゲームパッド等）、マウス、キーボード、または、マイク等であってもよい。また、音声出力部としては、例えば、スピーカ等であってもよい。また、印刷出力部としては、例えば、プリンタ等であってもよい。

また、図３において、制御部１０２は、ＯＳ（ＯｐｅｒａｔｉｎｇＳｙｓｔｅｍ）等の制御プログラムや、各種の処理手順等を規定したプログラム、および、所要データを格納するための内部メモリを有する。そして、制御部１０２は、これらのプログラム等により、種々の処理を実行するための情報処理を行う。制御部１０２は、機能概念的に、類似性ネットワーク情報格納部１０２ａ、類似性中心性尺度算出部１０２ｂ、承認判定部１０２ｃ、判定結果出力部１０２ｄ、相互作用中心性尺度算出部１０２ｅ、拒否スコア算出部１０２ｆ、および、拒否スコア出力部１０２ｇを備える。

このうち、類似性ネットワーク情報格納部１０２ａは、タンパク質配列情報データベース１０６ａに記憶された配列情報に基づき、シグネチャベースアルゴリズムを用いてタンパク質同士の類似性が相互に検出された場合、当該相互に類似性が検出されたタンパク質同士で構成されるタンパク質類似性ネットワーク（ＰＳＩＮ）を作成し、当該タンパク質類似性ネットワークに関する類似性ネットワーク情報を類似性ネットワーク情報データベース１０６ｂに格納する類似性ネットワーク情報格納手段である。

また、類似性中心性尺度算出部１０２ｂは、類似性ネットワーク情報データベース１０６ｂに記憶された類似性ネットワーク情報に基づき、タンパク質類似性ネットワークを構成するタンパク質の次数中心性（Ｄｅｇｒｅｅ）、媒介値中心性（Ｂｅｔｗｅｅｎｎｅｓｓ）、距離の中心性（ＣｌｏｓｅｎｅｓｓＣｅｎｔｒａｌｉｔｙ）、および、バートの制約値（Ｂｕｒｔ’ｓｃｏｎｓｔｒａｉｎｔ）を含む中心性尺度である類似性中心性尺度を算出する類似性中心性尺度算出手段である。ここで、次数中心性は、ネットワーク内で他のノードとどの程度（いくつ）直接つながっているのかを示す指標である。また、媒介値中心性は、ネットワーク内の他のノードと接続するために通過しなければならない最短経路の数を数えることによって、タンパク質のネットワークの中心性を測るものである。また、距離の中心性は、ネットワーク内の他の全てのノードに到達するために必要なステップ数を測定したものである。また、バートの制約値は、グループ内の個人の位置関係と利点を勉強する社会学的文脈で提案された指標である。

また、承認判定部１０２ｃは、タンパク質類似性ネットワークを構成する、薬剤標的データベース１０６ｃに記憶されたタンパク質情報に基づくタンパク質を標的とする薬剤の承認属性に基づき、当該タンパク質類似性ネットワークを構成する検証対象のタンパク質が、承認された薬剤、または、非承認の薬剤の標的の範囲に含まれるか否かの判定結果を、類似性中心性尺度算出部１０２ｂにより算出された当該検証対象のタンパク質の類似性中心性尺度を用いて取得する承認判定手段である。ここで、承認判定部１０２ｃは、タンパク質類似性ネットワークを構成する、薬剤標的データベース１０６ｃに記憶されたタンパク質情報に基づくタンパク質を標的とする薬剤の承認属性に基づき、類似性中心性尺度算出部１０２ｂにより算出された検証対象のタンパク質の類似性中心性尺度に含まれる次数中心性が高く、距離の中心性が低く、バートの制約値が非常に低い場合、検証対象のタンパク質が、非承認の薬剤の標的の範囲に含まれるという判定結果を生成してもよい。また、検証対象のタンパク質は、ユーザにより入力部１１４を介して入力されたタンパク質情報に基づくものであってもよい。

また、判定結果出力部１０２ｄは、承認判定部１０２ｃにより取得された判定結果を出力部を介して出力させる判定結果出力手段である。ここで、判定結果出力部１０２ｄは、判定結果を表示部１１２に表示させてもよい。また、判定結果出力部１０２ｄは、判定結果を印刷出力部を介して出力させてもよい。

また、相互作用中心性尺度算出部１０２ｅは、相互作用ネットワーク情報データベース１０６ｄに記憶された相互作用ネットワーク情報に基づき、タンパク質間相互作用ネットワークを構成するタンパク質の次数中心性、媒介値中心性、距離の中心性、および、バートの制約値を含む中心性尺度である相互作用中心性尺度を算出する相互作用中心性尺度算出手段である。

また、拒否スコア算出部１０２ｆは、薬剤標的データベース１０６ｃに記憶された各薬剤の承認属性と、類似性中心性尺度算出部１０２ｂにより算出された類似性中心性尺度の各薬剤の標的毎の合計値および平均値と、相互作用中心性尺度算出部１０２ｅにより算出された相互作用中心性尺度の各薬剤の標的毎の合計値および平均値と、を訓練データとする分類器を用いて、検証対象の化合物が非承認の薬剤に分類される確率である拒否スコアを算出する拒否スコア算出手段である。ここで、検証対象の化合物（薬剤）は、ユーザにより入力部１１４を介して入力された化合物情報に基づくものであってもよい。

また、拒否スコア出力部１０２ｇは、拒否スコア算出部１０２ｆにより算出された拒否スコアを出力部を介して出力させる拒否スコア出力手段である。ここで、拒否スコア出力部１０２ｇは、拒否スコアを表示部１１２に表示させてもよい。また、拒否スコア出力部１０２ｇは、拒否スコアを印刷出力部を介して出力させてもよい。

以上で、本実施の形態における承認予測装置１００の構成の一例の説明を終える。

［承認予測装置１００の処理］
次に、このように構成された本実施の形態における承認予測装置１００の処理の詳細について、以下に図４乃至図１５を参照して詳細に説明する。図４は、本実施の形態における承認予測装置１００の処理の一例を示すフローチャートである。

図４に示すように、類似性ネットワーク情報格納部１０２ａは、ヒトタンパク質データベース（タンパク質配列情報データベース）１０６ａに記憶された配列情報に基づき、タンパク質のホモログ間の類似点を探索するタンパク質シグネチャベースアルゴリズムを用いてタンパク質同士の類似性が相互に検出された場合、当該相互に類似性が検出されたタンパク質同士で構成されるタンパク質類似性ネットワーク（ＰＳＩＮ）を作成し、当該タンパク質類似性ネットワークに関する類似性ネットワーク情報を類似性ネットワーク情報データベース１０６ｂに格納する（ステップＳＣ−１）。ここで、類似したタンパク質を見つけるために、ＮＣＢＩヒトタンパク質データベースから２２０００のヒトタンパク質の各々を照会し、比較するＰＳＩ−ＢＬＡＳＴツール（Ｓｃｈａｆｆｅｒ，ｅｔａｌ．，２００１）を使用した場合、従来の研究（Ａｔｋｉｎｓｏｎ，ｅｔａｌ．，２００９；Ｃａｍｏｇｌｕ，ｅｔａｌ．，２００６；Ｒａｔｔｅｉ，ｅｔａｌ．，２０１０；Ｖａｌａｖａｎｉｓ，ｅｔａｌ．，２０１０；Ｗｅｓｔｏｎ，ｅｔａｌ．，２００４；ＺｈａｎｇａｎｄＧｒｉｇｏｒｏｖ，２００６）とは異なり、相互関連性（すなわち、タンパク質Ａを照会してタンパク質Ｂが類似していることが同定される場合に、その逆のタンパク質Ｂを照会してタンパク質Ａを類似として同定されるということ）を示さないという結果を得た。そこで、この結果を受けて、類似性ネットワーク情報格納部１０２ａは、グラフ理論表現を用いた新しいタンパク質類似性ネットワーク（ＰＳＩＮ）を作成した。ここで、当該タンパク質類似性ネットワーク（ＰＳＩＮ）では、ノードがタンパク質を表しており、タンパク質の配列が高い類似性を有し、且つ、双方向のヒット（すなわち、タンパク質Ａがタンパク質Ｂに類似することが同定される場合、その逆のタンパク質Ｂがタンパク質Ａに類似することが同定されること）が確認されたときにのみ、２つのノードがエッジで接続されている。これにより、類似性ネットワーク情報格納部１０２ａは、１９，７２１ノードおよび７７６，５９８エッジを含むタンパク質類似性ネットワーク（ＰＳＩＮ）を作成した。

ここで、図５を参照して、本実施の形態における配列情報の一例について説明する。図５は、本実施の形態における配列情報の一例を示す図である。

図５に示すように、タンパク質配列情報データベース１０６ａに記憶された配列情報は、Ｐ６３２６１、および、Ｐ４９２８１等のヒトタンパク質のＦＡＳＴＡ形式のタンパク質配列情報であってもよい。

また、図６を参照して、本実施の形態における類似性ネットワーク情報の一例について説明する。図６は、本実施の形態における類似性ネットワーク情報の一例を示す図である。

図６に示すように、本実施の形態における類似性ネットワーク情報には、タンパク質の名称、当該タンパク質と類似するタンパク質（Ｎｅｉｇｈｂｏｕｒｓ）の名称、配列スコア、および、２つのタンパク質が類似する領域の配列情報を含んでいてもよい。図６においては、Ｑ３ＭＩ９４とＱ９Ｙ４７３との類似性に関する類似性ネットワーク情報、および、Ｑ９Ｐ２Ｖ４とＱ８Ｎ０Ｖ４との類似性に関する類似性ネットワーク情報を一例として示している。

図４に戻り、類似性中心性尺度算出部１０２ｂは、類似性ネットワーク情報データベース１０６ｂに記憶された類似性ネットワーク情報に基づき、中心性基準を算出するアルゴリズムを用いて、タンパク質類似性ネットワーク（ＰＳＩＮ）を構成するタンパク質の次数中心性（Ｄｅｇｒｅｅ）、媒介値中心性（Ｂｅｔｗｅｅｎｎｅｓｓ）、距離の中心性（ＣｌｏｓｅｎｅｓｓＣｅｎｔｒａｌｉｔｙ）、および、バートの制約値（Ｂｕｒｔ’ｓｃｏｎｓｔｒａｉｎｔ）を算出する（ステップＳＣ−２）。

ここで、本実施形態におけるＰＳＩＮを構成するタンパク質の中心性尺度について説明する。まず、類似性中心性尺度算出部１０２ｂは、ＰＳＩＮ内のノードとどの程度直接つながっているのかを示す指標である次数中心性として、１（最もつながりの少ないもの）から４４１（最もつながりの多いもの）の範囲で算出している。

また、類似性中心性尺度算出部１０２ｂは、ノードｉとノードｊとの間の最短経路の数であるｓ_ｉｊ、および、ノードｖを通過する最短経路の割合であるｓ_ｉｊ（ｖ）からなる以下の数式（１）を用いて、媒介値中心性Ｂ（ｖ）を算出している。

また、類似性中心性尺度算出部１０２ｂは、ノードｖとノードｉとの間のステップで表す距離であるｄ（ｖ，ｉ）からなる以下の数式（２）を用いて、距離の中心性Ｃ（ｖ）を算出している。

また、類似性中心性尺度算出部１０２ｂは、ノードｊとノードｉとの関係の比例強度、および、ノードｊとノードｑとの関係の比例強度の積であるｐ_ｉｑｐ_ｑｊからなる以下の数式（３）を用いて、バートの制約値Ｃ（ｉ）を算出している。

ここで、図７を参照して、本実施の形態におけるバートの制約値について説明する。図７は、本実施の形態におけるバートの制約の一例を示す図である。

バートの制約値は、グループ内の個人の位置関係と利点とを学習する社会学的文脈で提案された手法であり、図７においてノードが個人であるとすると、図７左図において、すべてのノードには代替接続があるので、他人との交渉および取引をすることができる。一方、図７右図のように、構造的な穴（Ｓｔｒｕｃｔｕｒａｌｈｏｌｅ）が存在する場合、ノード２とノード３との間では互いの存在を認識できないため、ノード１が交渉に有利な位置にあることになる。これを、本実施の形態においては、タンパク質であるノードの類似のコンテキストに適用することで、小さなバートの制約値を持つタンパク質（ノード）は、一般的に異なるタンパク質ファミリーの間に位置する複数のドメインを有するものとなり、大きなバートの制約値を持つタンパク質（ノード）は、わずかな隣接タンパク質と配列類似性と示すものとなる。

また、図８を参照して、本実施の形態におけるタンパク質の中心性尺度の一例を説明する。図８は、本実施の形態におけるタンパク質の中心性尺度の一例を示す図である。

図８に示すように、類似性中心性尺度算出部１０２ｂは、ＰＳＩＮを構成するタンパク質（Ｐ１４７８４、Ｐ１４８５４、Ｐ１４８５９、Ｐ１４８６７、Ｐ１４８６８、Ｐ１４９０２、および、Ｐ１４９２０）の中心性尺度として、次数中心性（Ｄｅｇｒｅｅ）、媒介値中心性（Ｂｅｔｗｅｅｎｎｅｓｓ）、距離の中心性（ＣｌｏｓｅｎｅｓｓＣｅｎｔｒａｌｉｔｙ）、および、バートの制約値（Ｂｕｒｔ’ｓｃｏｎｓｔｒａｉｎｔ）を算出し、当該中心性尺度のリストを出力してもよい。

図４に戻り、承認判定部１０２ｃは、タンパク質類似性ネットワークを構成する、薬剤標的データベース１０６ｃに記憶されたタンパク質情報に基づくタンパク質を標的とする薬剤の承認属性に基づき、当該タンパク質類似性ネットワークを構成する検証対象のタンパク質が、承認された薬剤、または、非承認の薬剤の標的の範囲に含まれるか否かの判定結果（標的タンパク質の安全性）を、ステップＳＣ−２にて類似性中心性尺度算出部１０２ｂにより算出された当該検証対象のタンパク質の次数中心性、媒介値中心性、距離の中心性、および、バートの制約値を用いて取得する（ステップＳＣ−３）。すなわち、承認判定部１０２ｃは、タンパク質類似性ネットワークを構成するタンパク質の中心性尺度、および、薬剤標的データベース１０６ｃに記憶されたリストを必要とし、薬剤標的の承認、または、非承認（撤回（Ｗｉｔｈｄｒａｗ）、および、却下（Ｉｌｌｉｃｉｔ））と仮定できる値の範囲を決定してもよい。ここで、当該ステップにおいては、個々のタンパク質だけを考慮し、化合物の標的可能なタンパク質全セットは考慮しない。また、個々の薬剤ターゲットの特性を先に決定するのは、単一標的の化合物（魔法の弾丸（ｍａｇｉｃｂｕｌｌｅｔ））、または、ｓｉＲＮＡベースの治療法等が単一標的のみを阻害するように設計されているため、標的の治療抑制が安全であるという前提で、標的の選択がなされる必要があるからである。

また、承認判定部１０２ｃは、タンパク質類似性ネットワークを構成する、薬剤標的データベース１０６ｃに記憶されたタンパク質情報に基づくタンパク質を標的とする薬剤の承認属性に基づき、ステップＳＣ−２にて類似性中心性尺度算出部１０２ｂにより算出された検証対象のタンパク質の類似性中心性尺度に含まれる次数中心性が高く、距離の中心性が低く、バートの制約値が非常に低い場合、検証対象のタンパク質が、非承認の薬剤の標的の範囲に含まれるという判定結果を生成してもよい。

ここで、図９を参照して、本実施の形態における薬剤標的データベース１０６ｃに記憶される情報の一例について説明する。図９は、本実施の形態における薬剤標的データベース１０６ｃに記憶される情報の一例を示す図である。

図９に示すように、本実施の形態における薬剤標的データベース１０６ｃに記憶される情報には、薬剤名称（Ｄｒｕｇ）、当該薬剤の標的となるタンパク質の名称（Ｔａｒｇｅｔｓ）、および、（日本の厚生労働省、または、米国のＦＤＡ等による）当該薬剤の承認、または、非承認に関する承認属性（Ｓｔａｔｕｓ）が含まれていてもよい。

ここで、図１０を参照して、本実施の形態における承認または非承認の薬剤の標的の中心性尺度の一例について説明する。図１０は、本実施の形態における承認または非承認の薬剤の標的の中心性尺度の一例を示す図である。

図１０に示すように、非承認（問題のある）薬剤の標的タンパク質は、承認薬剤の標的タンパク質よりも、高い次数中心性（Ｄｅｇｒｅｅ）、非常に低いバートの制約値（Ｂｕｒｔ’ｓｃｏｎｓｔｒａｉｎｔ）、および、負の対数スケールにおいて低い距離の中心性（ＣｌｏｓｅｎｅｓｓＣｅｎｔｒａｌｉｔｙ）を示していてもよい。図１０に示すように、承認薬剤の標的では、他の多くのタンパク質と構造共有度が低いが（ｌｏｗ−ｄｅｇｒｅｅ）、非承認の標的では、複数のタンパク質間での構造共有が高いことから、非承認薬物の標的は、非特異的な結合および副作用を起こしやすいという特徴を持っていることがわかる。

図４に戻り、判定結果出力部１０２ｄは、承認判定部１０２ｃにより取得された標的タンパク質の安全性を表示部１１２に表示させる（ステップＳＣ−４）。ここで、判定結果出力部１０２ｄは、判定結果を印刷出力部を介して出力させてもよい。また、判定結果出力部１０２ｄは、ユーザが興味のあるタンパク質が、安全な薬剤標的の範囲内にあるか危険な薬剤標的の範囲内にあるかどうかを確認のために照会可能なリストを出力してもよい。

一方、相互作用中心性尺度算出部１０２ｅは、相互作用ネットワーク情報データベース１０６ｄに記憶された相互作用ネットワーク情報に基づき、タンパク質間相互作用ネットワーク（ＰＰＩ）を構成するタンパク質の次数中心性、媒介値中心性、距離の中心性、および、バートの制約値を算出する（ステップＳＣ−５）。

ここで、図１１を参照して、本実施の形態における相互作用ネットワーク情報の一例について説明する。図１１は、本実施の形態における相互作用ネットワーク情報の一例を示す図である。

図１１に示すように、本実施の形態における相互作用ネットワーク情報は、物理的に相互作用するタンパク質同士を組としたタンパク質リストを含んでいてもよい。

図４に戻り、拒否スコア算出部１０２ｆは、薬剤標的データベース１０６ｃに記憶された各薬剤の承認属性と、ステップＳＣ−２にて類似性中心性尺度算出部１０２ｂにより算出された次数中心性、媒介値中心性、距離の中心性、および、バートの制約値の各薬剤の標的毎の合計値および平均値と、ステップＳＣ−５にて相互作用中心性尺度算出部１０２ｅにより算出された次数中心性、媒介値中心性、距離の中心性、および、バートの制約値の各薬剤の標的毎の合計値および平均値と、を訓練データとする機械学習の分類器を用いて、検証対象の化合物が非承認の薬剤に分類される確率である拒否スコアを算出する（ステップＳＣ−６）。ここで、薬剤標的データベース１０６ｃでは、ほとんどの既存の薬剤（化合物）は、一度に複数のタンパク質に結合してその活性を阻害する、すなわち、複数の薬剤標的が報告されているため、各化合物について標的となるすべてのタンパク質の中心性尺度を考慮する必要がある。そこで、拒否スコア算出部１０２ｆは、タンパク質類似性ネットワーク（ＰＳＩＮ）、および、タンパク質相互作用ネットワーク（ＰＰＩ）を使用して、各薬剤について標的毎の次数中心性、媒介値中心性、距離の中心性、および、バートの制約値の合計および平均を算出し、ＰＳＩＮから８属性、ＰＰＩから８属性、および、化合物（承認または非承認）のクラスを示す１属性を分類器に入力する最終データセットとして用いている。ここで、機械学習の分類器は、ＷＥＫＡ等の既存のパッケージ（Ｗｉｓｈａｒｔ，２００６）などの機械学習の分類器のセットであってもよい。

なお、本実施の形態においては、トレーニング、および、予測ステップのガイドとして、機械学習の分類と薬剤分類（承認、または、非承認）を用いて、最終データセットを１０倍クロス検証法を使用して処理した。さらに、本実施の形態においては、いくつかの異なる分類アルゴリズムを使用してこの手順を実行し、前処理技術の使用、および、同じデータセットに対しタンパク質類似性ネットワーク（ＰＳＩＮ）からの中心性尺度と、タンパク質相互作用ネットワーク（ＰＰＩ）からの中心性尺度の使用の２つのケースで予測のパフォーマンスが強化されていることを確認した。

ここで、本実施の形態における前処理は、下記の三つのステップで行ってもよい。最初に、合成したデータセットの他のインスタンスの手段およびモードで欠損値を充填し、第二に、より小さいクラスのインスタンスの数を拡大し、最後に、データセットをサンプリングしてもよい。本実施の形態におけるデータセットにおいては、承認された薬剤標的クラスと最大３００例の非承認（問題のある）薬剤標的クラスの複数のインスタンスから構成されているため、より小さいクラスに対する標本からサンプルを多く集める必要がある。そのため、新規化合物の開発コストを鑑みれば、承認された薬剤が問題のある薬剤と誤分類されることで生じる不都合は、問題のある薬剤を承認された薬剤として誤分類することで引き起こされる不都合よりも小さいため、本実施の形態においては、小さなクラスを多く集め、大規模なクラスを少なくサンプリングするためにＳＭＯＴＥアルゴリズムを使用してもよい。このような戦略は、様々なサイズを含むデータセットでの分類器の性能を向上させることになる。また、２番目のステップであるリサンプリングを実行するには、データセットからランダムにインスタンスを選択、すなわち、同じインスタンスが二回選択することができてもよい。更に、新しいデータセットには、オリジナルのデータセットと同じインスタンス数および属性の数があってもよく、５０から６０の一意のインスタンスであってもよい。

ここで、図１２を参照して、本実施の形態における分類器の性能改善の一例について説明する。図１２は、本実施の形態における分類器の性能改善の一例を示す図である。

図１２に示すように、本実施の形態における分類器においては、前処理技術の使用、および、同じデータセットに対しＰＳＩＮからの中心性尺度と、ＰＰＩからの中心性尺度の使用をすることで、問題のある薬剤クラスに対する分類器の感度をかなり向上させることができることを示している。

更に、本実施の形態においては、三つの異なる戦略を使用した１５機械学習の分類器の予測力を比較した。最初の方法では、１０倍交差検証を用いて比較した。また、第二の方法では、元のデータセットを、インスタンスの７０／１００と３５／１００とでそれぞれ設定したトレーニングセットとテストセットとに分割して比較した。本実施の形態においては、元のデータセットから、５００回以上ランダムに薬剤を選択して、偏りがないように調整した。また、トレーニングセットとテストセットとにデータセットを分割する際、トレーニングセットのみを事前処理した。

ここで、図１３を参照して、本実施の形態における分類器の分類精度の一例について説明する。図１３は、本実施の形態における分類器の分類精度の一例を示す図である。

図１３に示すように、本実施の形態における分類器の現実的な精度測定には、薬剤の承認クラス、または、問題のあるクラスに対する、真陽性率の調和平均（ｈａｒｍｏｎｉｃｍｅａｎｏｆｔｈｅｔｒｕｅｐｏｓｉｔｉｖｅｒａｔｅｓ）を用いた。ここで、図１３に示すように、（パラメータの最適化、および、前処理技術の使用により）ほとんどすべての分類子（分類器）が同様の性能を持っていたため、本実施の形態においては、更なる医薬品の安全性予測のために、すべてのアルゴリズムが必然的に持っているバイアスを補正することを目的として、異なる原理を使用して構築された７つの最高の性能を発揮するアルゴリズム（ＫＳＴＡＲ、ＩＢＫ、Ｄｅｃｏｒａｔｅ、ＥＮＤＣｌａｓｓＢａｌａｎｃｅｄＮＤ、ＪＲｉｐ、または、ＲｏｔａｔｉｏｎＦｏｒｅｓｔ等）を使用した。

また、図１４を参照して、本実施の形態における分類器の一例について説明する。図１４は、本実施の形態における分類器の一例を示す図である。

図１４に示すように、元のデータセットの調整の有無にかかわらず、ＫＳｔａｒ、Ｄｅｃｏｒａｔｅ、ＲｏｔａｔｉｏｎＦｏｒｅｓｔ、および、ＲａｎｄｏｍＦｏｒｅｓｔが最高のパフォーマンスを示すことを確認したので、本実施の形態においては、これらベスト４のアルゴリズムを更なる分析に使用した。テストフェーズでは、分類器がこれまで検出されていないインスタンスを分類する際、これらの７つの最適なアルゴリズムは、各薬剤が問題のあるクラスに属する確率を算出し、算出した確率を使用して、拒否スコア（ＲＳ）という名前のインデックスを作成した。ここで、本実施の形態においては、反対調和平均（ｃｏｎｔｒａｈａｒｍｏｎｉｃｍｅａｎ）を用いて、これらの確率を平均した値をＲＳとしてもよい。ＲＳの値は、化合物が安全（ＲＳが０．０に近い）、または、有害（ＲＳが１．０に近い）であるかを予測しているかを示唆していてもよい。

図４に戻り、拒否スコア出力部１０２ｇは、拒否スコア算出部１０２ｆにより算出された化合物の拒否スコアを表示部１１２に表示させ（ステップＳＣ−７）、処理を終了する。ここで、拒否スコア出力部１０２ｇは、化合物の拒否スコアを印刷出力部を介して出力させてもよい。

ここで、図１５を参照して、本実施形態における出力情報の一例について説明する。図１５は、本実施形態における出力情報の一例を示す図である。

図１５に示すように、拒否スコア出力部１０２ｇは、薬剤とそれぞれの拒否スコア（０．００−１．００の間の値）とのリストを出力してもよい。ここで、問題のある薬剤は１．００に近いスコア値を持っているが、承認薬剤は０．００に近いスコアを持っている。また、図１５は、Ｄｒｕｇｂａｎｋデータベースから得られた既存の薬剤を入力して得られた一例を示している。このように、ユーザが興味のある薬剤候補となる化合物を入力することで、標的タンパク質と化合物との拒否スコアを確認することができる。なお、本実施の形態による手法を用いることで、既存の１０００の承認薬と非承認薬との間で正確に区別することに成功し、本手法の有効性を確認した。

以上で、本実施の形態における承認予測装置１００の処理の一例の説明を終える。

［他の実施の形態］
さて、これまで本発明の実施の形態について説明したが、本発明は、上述した実施の形態以外にも、特許請求の範囲に記載した技術的思想の範囲内において種々の異なる実施の形態にて実施されてよいものである。

例えば、承認予測装置１００がスタンドアローンの形態で処理を行う場合を一例に説明したが、承認予測装置１００は、クライアント端末（承認予測装置１００とは別筐体である）からの要求に応じて処理を行い、その処理結果を当該クライアント端末に返却するようにしてもよい。

また、実施の形態において説明した各処理のうち、自動的に行われるものとして説明した処理の全部または一部を手動的に行うこともでき、あるいは、手動的に行われるものとして説明した処理の全部または一部を公知の方法で自動的に行うこともできる。

このほか、上記文献中や図面中で示した処理手順、制御手順、具体的名称、各処理の登録データや検索条件等のパラメータを含む情報、画面例、データベース構成については、特記する場合を除いて任意に変更することができる。

また、承認予測装置１００に関して、図示の各構成要素は機能概念的なものであり、必ずしも物理的に図示の如く構成されていることを要しない。

例えば、承認予測装置１００の各装置が備える処理機能、特に制御部１０２にて行われる各処理機能については、その全部または任意の一部を、ＣＰＵ（ＣｅｎｔｒａｌＰｒｏｃｅｓｓｉｎｇＵｎｉｔ）および当該ＣＰＵにて解釈実行されるプログラムにて実現してもよく、また、ワイヤードロジックによるハードウェアとして実現してもよい。尚、プログラムは、後述する、コンピュータに本発明に係る方法を実行させるためのプログラム化された命令を含む、一時的でないコンピュータ読み取り可能な記録媒体に記録されており、必要に応じて承認予測装置１００に機械的に読み取られる。すなわち、ＲＯＭまたはＨＤＤ（ＨａｒｄＤｉｓｋＤｒｉｖｅ）などの記憶部１０６などには、ＯＳ（ＯｐｅｒａｔｉｎｇＳｙｓｔｅｍ）と協働してＣＰＵに命令を与え、各種処理を行うためのコンピュータプログラムが記録されている。このコンピュータプログラムは、ＲＡＭにロードされることによって実行され、ＣＰＵと協働して制御部を構成する。

また、このコンピュータプログラムは、承認予測装置１００に対して任意のネットワーク３００を介して接続されたアプリケーションプログラムサーバに記憶されていてもよく、必要に応じてその全部または一部をダウンロードすることも可能である。

また、本発明に係るプログラムを、コンピュータ読み取り可能な記録媒体に格納してもよく、また、プログラム製品として構成することもできる。ここで、この「記録媒体」とは、メモリーカード、ＵＳＢメモリ、ＳＤカード、フレキシブルディスク、光磁気ディスク、ＲＯＭ、ＥＰＲＯＭ、ＥＥＰＲＯＭ、ＣＤ−ＲＯＭ、ＭＯ、ＤＶＤ、および、Ｂｌｕ−ｒａｙＤｉｓｃ等の任意の「可搬用の物理媒体」を含むものとする。

また、「プログラム」とは、任意の言語や記述方法にて記述されたデータ処理方法であり、ソースコードやバイナリコード等の形式を問わない。なお、「プログラム」は必ずしも単一的に構成されるものに限られず、複数のモジュールやライブラリとして分散構成されるものや、ＯＳ（ＯｐｅｒａｔｉｎｇＳｙｓｔｅｍ）に代表される別個のプログラムと協働してその機能を達成するものをも含む。なお、実施の形態に示した各装置において記録媒体を読み取るための具体的な構成、読み取り手順、あるいは、読み取り後のインストール手順等については、周知の構成や手順を用いることができる。

記憶部１０６に格納される各種のデータベース等（タンパク質配列情報データベース１０６ａ、類似性ネットワーク情報データベース１０６ｂ、薬剤標的データベース１０６ｃ、および、相互作用ネットワーク情報データベース１０６ｄ）は、ＲＡＭ、ＲＯＭ等のメモリ装置、ハードディスク等の固定ディスク装置、フレキシブルディスク、および、光ディスク等のストレージ手段であり、各種処理やウェブサイト提供に用いる各種のプログラム、テーブル、データベース、および、ウェブページ用ファイル等を格納する。

また、承認予測装置１００は、既知のデスクトップ型またはノート型のパーソナルコンピュータ、携帯電話、スマートフォン、ＰＨＳ、およびＰＤＡ等の携帯端末装置、ならびに、ワークステーション等の情報処理装置として構成してもよく、また、該情報処理装置に任意の周辺装置を接続して構成してもよい。また、承認予測装置１００は、該情報処理装置に本発明の方法を実現させるソフトウェア（プログラム、データ等を含む）を実装することにより実現してもよい。

更に、装置の分散・統合の具体的形態は図示するものに限られず、その全部または一部を、各種の付加等に応じて、または、機能負荷に応じて、任意の単位で機能的または物理的に分散・統合して構成することができる。すなわち、上述した実施の形態を任意に組み合わせて実施してもよく、実施の形態を選択的に実施してもよい。

以上詳述に説明したように、本発明によれば、医薬品の承認または拒否の可能性を定量化することができる承認予測装置、承認予測方法、および、プログラムを提供することができるので、特に医療、製薬、創薬、および、生物学研究などの様々な分野において極めて有用である。

１００承認予測装置
１０２制御部
１０２ａ類似性ネットワーク情報格納部
１０２ｂ類似性中心性尺度算出部
１０２ｃ承認判定部
１０２ｄ判定結果出力部
１０２ｅ相互作用中心性尺度算出部
１０２ｆ拒否スコア算出部
１０２ｇ拒否スコア出力部
１０４通信制御インターフェース部
１０６記憶部
１０６ａタンパク質配列情報データベース
１０６ｂ類似性ネットワーク情報データベース
１０６ｃ薬剤標的データベース
１０６ｄ相互作用ネットワーク情報データベース
１０８入出力制御インターフェース部
１１２表示部
１１４入力部
２００外部システム
３００ネットワーク

Claims

出力部と記憶部と制御部とを少なくとも備えた承認予測装置であって、
上記記憶部は、
タンパク質同士の類似性に基づき構成されたタンパク質類似性ネットワークに関する類似性ネットワーク情報を記憶する類似性ネットワーク情報記憶手段と、
薬剤の承認、または、非承認に関する承認属性を含む薬剤情報と、当該薬剤の標的となる上記タンパク質に関するタンパク質情報と、を対応付けて記憶する薬剤標的記憶手段と、
上記タンパク質間の相互作用に基づき構成されたタンパク質間相互作用ネットワークに関する相互作用ネットワーク情報を記憶する相互作用ネットワーク情報記憶手段と、
を備え、
上記制御部は、
上記類似性ネットワーク情報記憶手段に記憶された上記類似性ネットワーク情報に基づき、上記タンパク質類似性ネットワークを構成する上記タンパク質の次数中心性、媒介値中心性、距離の中心性、および、バートの制約値を含む中心性尺度である類似性中心性尺度を算出する類似性中心性尺度算出手段と、
上記相互作用ネットワーク情報記憶手段に記憶された上記相互作用ネットワーク情報に基づき、上記タンパク質間相互作用ネットワークを構成する上記タンパク質の上記次数中心性、上記媒介値中心性、上記距離の中心性、および、上記バートの制約値を含む中心性尺度である相互作用中心性尺度を算出する相互作用中心性尺度算出手段と、
上記薬剤標的記憶手段に記憶された上記各薬剤の上記承認属性と、上記類似性中心性尺度算出手段により算出された上記類似性中心性尺度の上記各薬剤の上記標的毎の合計値および平均値と、上記相互作用中心性尺度算出手段により算出された上記相互作用中心性尺度の上記各薬剤の上記標的毎の合計値および平均値と、を訓練データとする分類器を用いて、検証対象の化合物が上記非承認の上記薬剤に分類される確率である拒否スコアを算出する拒否スコア算出手段と、
上記拒否スコア算出手段により算出された上記拒否スコアを上記出力部を介して出力させる拒否スコア出力手段と、
を備えたことを特徴とする承認予測装置。
出力部と記憶部と制御部とを少なくとも備えた承認予測装置であって、
上記記憶部は、
類似性を有するタンパク質同士で構成されたタンパク質類似性ネットワークに関する類似性ネットワーク情報を記憶する類似性ネットワーク情報記憶手段と、
薬剤の承認、または、非承認に関する承認属性を含む薬剤情報と、当該薬剤の標的となる上記タンパク質に関するタンパク質情報と、を対応付けて記憶する薬剤標的記憶手段と、
を備え、
上記制御部は、
上記類似性ネットワーク情報記憶手段に記憶された上記類似性ネットワーク情報に基づき、上記タンパク質類似性ネットワークを構成する上記タンパク質の次数中心性、媒介値中心性、距離の中心性、および、バートの制約値を含む中心性尺度である類似性中心性尺度を算出する類似性中心性尺度算出手段と、
上記タンパク質類似性ネットワークを構成する、上記薬剤標的記憶手段に記憶された上記タンパク質情報に基づく上記タンパク質を上記標的とする上記薬剤の上記承認属性に基づき、当該タンパク質類似性ネットワークを構成する検証対象の上記タンパク質が、上記承認された上記薬剤、または、上記非承認の上記薬剤の上記標的の範囲に含まれるか否かの判定結果を、上記類似性中心性尺度算出手段により算出された当該検証対象のタンパク質の上記類似性中心性尺度を用いて取得する承認判定手段と、
上記承認判定手段により取得された上記判定結果を上記出力部を介して出力させる判定結果出力手段と、
を備えたことを特徴とする承認予測装置。
請求項１または２に記載の承認予測装置において、
上記記憶部は、
上記タンパク質のアミノ酸配列に関する配列情報を記憶するタンパク質配列情報記憶手段、
を更に備え、
上記制御部は、
上記タンパク質配列情報記憶手段に記憶された上記配列情報に基づき、シグネチャベースアルゴリズムを用いて上記タンパク質同士の上記類似性が相互に検出された場合、当該相互に上記類似性が検出された上記タンパク質同士で構成される上記タンパク質類似性ネットワークを作成し、当該タンパク質類似性ネットワークに関する上記類似性ネットワーク情報を上記類似性ネットワーク情報記憶手段に格納する類似性ネットワーク情報格納手段、
を更に備えたことを特徴とする承認予測装置。
請求項２に記載の承認予測装置において、
上記承認判定手段は、
上記タンパク質類似性ネットワークを構成する、上記薬剤標的記憶手段に記憶された上記タンパク質情報に基づく上記タンパク質を上記標的とする上記薬剤の上記承認属性に基づき、上記類似性中心性尺度算出手段により算出された上記検証対象のタンパク質の上記類似性中心性尺度に含まれる上記次数中心性が高く、上記距離の中心性が低く、上記バートの制約値が非常に低い場合、上記検証対象の上記タンパク質が、上記非承認の上記薬剤の上記標的の範囲に含まれるという判定結果を生成することを特徴とする承認予測装置。
出力部と記憶部と制御部とを少なくとも備えた承認予測装置において実行される承認予測方法であって、
上記記憶部は、
タンパク質同士の類似性に基づき構成されたタンパク質類似性ネットワークに関する類似性ネットワーク情報を記憶する類似性ネットワーク情報記憶手段と、
薬剤の承認、または、非承認に関する承認属性を含む薬剤情報と、当該薬剤の標的となる上記タンパク質に関するタンパク質情報と、を対応付けて記憶する薬剤標的記憶手段と、
上記タンパク質間の相互作用に基づき構成されたタンパク質間相互作用ネットワークに関する相互作用ネットワーク情報を記憶する相互作用ネットワーク情報記憶手段と、
を備え、
上記制御部において実行される、
上記類似性ネットワーク情報記憶手段に記憶された上記類似性ネットワーク情報に基づき、上記タンパク質類似性ネットワークを構成する上記タンパク質の次数中心性、媒介値中心性、距離の中心性、および、バートの制約値を含む中心性尺度である類似性中心性尺度を算出する類似性中心性尺度算出ステップと、
上記相互作用ネットワーク情報記憶手段に記憶された上記相互作用ネットワーク情報に基づき、上記タンパク質間相互作用ネットワークを構成する上記タンパク質の上記次数中心性、上記媒介値中心性、上記距離の中心性、および、上記バートの制約値を含む中心性尺度である相互作用中心性尺度を算出する相互作用中心性尺度算出ステップと、
上記薬剤標的記憶手段に記憶された上記各薬剤の上記承認属性と、上記類似性中心性尺度算出ステップにて算出された上記類似性中心性尺度の上記各薬剤の上記標的毎の合計値および平均値と、上記相互作用中心性尺度算出ステップにて算出された上記相互作用中心性尺度の上記各薬剤の上記標的毎の合計値および平均値と、を訓練データとする分類器を用いて、検証対象の化合物が上記非承認の上記薬剤に分類される確率である拒否スコアを算出する拒否スコア算出ステップと、
上記拒否スコア算出ステップにて算出された上記拒否スコアを上記出力部を介して出力させる拒否スコア出力ステップと、
を含むことを特徴とする承認予測方法。
出力部と記憶部と制御部とを少なくとも備えた承認予測装置において実行される承認予測方法であって、
上記記憶部は、
類似性を有するタンパク質同士で構成されたタンパク質類似性ネットワークに関する類似性ネットワーク情報を記憶する類似性ネットワーク情報記憶手段と、
薬剤の承認、または、非承認に関する承認属性を含む薬剤情報と、当該薬剤の標的となる上記タンパク質に関するタンパク質情報と、を対応付けて記憶する薬剤標的記憶手段と、
を備え、
上記制御部において実行される、
上記類似性ネットワーク情報記憶手段に記憶された上記類似性ネットワーク情報に基づき、上記タンパク質類似性ネットワークを構成する上記タンパク質の次数中心性、媒介値中心性、距離の中心性、および、バートの制約値を含む中心性尺度である類似性中心性尺度を算出する類似性中心性尺度算出ステップと、
上記タンパク質類似性ネットワークを構成する、上記薬剤標的記憶手段に記憶された上記タンパク質情報に基づく上記タンパク質を上記標的とする上記薬剤の上記承認属性に基づき、当該タンパク質類似性ネットワークを構成する検証対象の上記タンパク質が、上記承認された上記薬剤、または、上記非承認の上記薬剤の上記標的の範囲に含まれるか否かの判定結果を、上記類似性中心性尺度算出ステップにて算出された当該検証対象のタンパク質の上記類似性中心性尺度を用いて取得する承認判定ステップと、
上記承認判定ステップにて取得された上記判定結果を上記出力部を介して出力させる判定結果出力ステップと、
を含むことを特徴とする承認予測方法。
出力部と記憶部と制御部とを少なくとも備えた承認予測装置に実行させるためのプログラムであって、
上記記憶部は、
タンパク質同士の類似性に基づき構成されたタンパク質類似性ネットワークに関する類似性ネットワーク情報を記憶する類似性ネットワーク情報記憶手段と、
薬剤の承認、または、非承認に関する承認属性を含む薬剤情報と、当該薬剤の標的となる上記タンパク質に関するタンパク質情報と、を対応付けて記憶する薬剤標的記憶手段と、
上記タンパク質間の相互作用に基づき構成されたタンパク質間相互作用ネットワークに関する相互作用ネットワーク情報を記憶する相互作用ネットワーク情報記憶手段と、
を備え、
上記制御部において、
上記類似性ネットワーク情報記憶手段に記憶された上記類似性ネットワーク情報に基づき、上記タンパク質類似性ネットワークを構成する上記タンパク質の次数中心性、媒介値中心性、距離の中心性、および、バートの制約値を含む中心性尺度である類似性中心性尺度を算出する類似性中心性尺度算出ステップと、
上記相互作用ネットワーク情報記憶手段に記憶された上記相互作用ネットワーク情報に基づき、上記タンパク質間相互作用ネットワークを構成する上記タンパク質の上記次数中心性、上記媒介値中心性、上記距離の中心性、および、上記バートの制約値を含む中心性尺度である相互作用中心性尺度を算出する相互作用中心性尺度算出ステップと、
上記薬剤標的記憶手段に記憶された上記各薬剤の上記承認属性と、上記類似性中心性尺度算出ステップにて算出された上記類似性中心性尺度の上記各薬剤の上記標的毎の合計値および平均値と、上記相互作用中心性尺度算出ステップにて算出された上記相互作用中心性尺度の上記各薬剤の上記標的毎の合計値および平均値と、を訓練データとする分類器を用いて、検証対象の化合物が上記非承認の上記薬剤に分類される確率である拒否スコアを算出する拒否スコア算出ステップと、
上記拒否スコア算出ステップにて算出された上記拒否スコアを上記出力部を介して出力させる拒否スコア出力ステップと、
を実行させるためのプログラム。
出力部と記憶部と制御部とを少なくとも備えた承認予測装置に実行させるためのプログラムであって、
上記記憶部は、
類似性を有するタンパク質同士で構成されたタンパク質類似性ネットワークに関する類似性ネットワーク情報を記憶する類似性ネットワーク情報記憶手段と、
薬剤の承認、または、非承認に関する承認属性を含む薬剤情報と、当該薬剤の標的となる上記タンパク質に関するタンパク質情報と、を対応付けて記憶する薬剤標的記憶手段と、
を備え、
上記制御部において、
上記類似性ネットワーク情報記憶手段に記憶された上記類似性ネットワーク情報に基づき、上記タンパク質類似性ネットワークを構成する上記タンパク質の次数中心性、媒介値中心性、距離の中心性、および、バートの制約値を含む中心性尺度である類似性中心性尺度を算出する類似性中心性尺度算出ステップと、
上記タンパク質類似性ネットワークを構成する、上記薬剤標的記憶手段に記憶された上記タンパク質情報に基づく上記タンパク質を上記標的とする上記薬剤の上記承認属性に基づき、当該タンパク質類似性ネットワークを構成する検証対象の上記タンパク質が、上記承認された上記薬剤、または、上記非承認の上記薬剤の上記標的の範囲に含まれるか否かの判定結果を、上記類似性中心性尺度算出ステップにて算出された当該検証対象のタンパク質の上記類似性中心性尺度を用いて取得する承認判定ステップと、
上記承認判定ステップにて取得された上記判定結果を上記出力部を介して出力させる判定結果出力ステップと、
を実行させるためのプログラム。