JP2020064626A - 生体エンティティの特性を推測するコンピュータにより実施される方法及び機器 - Google Patents
生体エンティティの特性を推測するコンピュータにより実施される方法及び機器 Download PDFInfo
- Publication number
- JP2020064626A JP2020064626A JP2019186293A JP2019186293A JP2020064626A JP 2020064626 A JP2020064626 A JP 2020064626A JP 2019186293 A JP2019186293 A JP 2019186293A JP 2019186293 A JP2019186293 A JP 2019186293A JP 2020064626 A JP2020064626 A JP 2020064626A
- Authority
- JP
- Japan
- Prior art keywords
- graph
- edge
- vertices
- edges
- representation
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000000034 method Methods 0.000 title claims abstract description 93
- 239000011159 matrix material Substances 0.000 claims abstract description 112
- 238000005070 sampling Methods 0.000 claims abstract description 24
- 108090000623 proteins and genes Proteins 0.000 claims description 55
- 102000004169 proteins and genes Human genes 0.000 claims description 52
- 230000006916 protein interaction Effects 0.000 claims description 15
- 238000004590 computer program Methods 0.000 claims description 14
- 238000013507 mapping Methods 0.000 claims description 14
- 238000006243 chemical reaction Methods 0.000 claims description 8
- 238000002372 labelling Methods 0.000 claims description 4
- 235000018102 proteins Nutrition 0.000 description 47
- 238000012545 processing Methods 0.000 description 22
- 230000007704 transition Effects 0.000 description 22
- 238000005295 random walk Methods 0.000 description 21
- 230000037361 pathway Effects 0.000 description 16
- 239000013598 vector Substances 0.000 description 14
- 230000006870 function Effects 0.000 description 12
- 230000003993 interaction Effects 0.000 description 10
- 230000001419 dependent effect Effects 0.000 description 7
- 230000000694 effects Effects 0.000 description 6
- 230000008569 process Effects 0.000 description 6
- 238000004458 analytical method Methods 0.000 description 4
- 230000006909 anti-apoptosis Effects 0.000 description 4
- 239000002585 base Substances 0.000 description 4
- 238000013500 data storage Methods 0.000 description 4
- 238000010586 diagram Methods 0.000 description 4
- 201000010099 disease Diseases 0.000 description 4
- 208000037265 diseases, disorders, signs and symptoms Diseases 0.000 description 4
- 230000007246 mechanism Effects 0.000 description 4
- 230000009466 transformation Effects 0.000 description 4
- 102100040121 Allograft inflammatory factor 1 Human genes 0.000 description 3
- 101000890626 Homo sapiens Allograft inflammatory factor 1 Proteins 0.000 description 3
- 238000013459 approach Methods 0.000 description 3
- 230000008827 biological function Effects 0.000 description 3
- 238000004422 calculation algorithm Methods 0.000 description 3
- 238000004364 calculation method Methods 0.000 description 3
- 230000014509 gene expression Effects 0.000 description 3
- 239000000126 substance Substances 0.000 description 3
- 230000001131 transforming effect Effects 0.000 description 3
- 125000000174 L-prolyl group Chemical group [H]N1C([H])([H])C([H])([H])C([H])([H])[C@@]1([H])C(*)=O 0.000 description 2
- 206010028980 Neoplasm Diseases 0.000 description 2
- 230000004913 activation Effects 0.000 description 2
- 150000001413 amino acids Chemical class 0.000 description 2
- 230000003042 antagnostic effect Effects 0.000 description 2
- 230000008901 benefit Effects 0.000 description 2
- 201000011510 cancer Diseases 0.000 description 2
- 230000000052 comparative effect Effects 0.000 description 2
- 238000007418 data mining Methods 0.000 description 2
- 239000003814 drug Substances 0.000 description 2
- 230000010365 information processing Effects 0.000 description 2
- 230000005764 inhibitory process Effects 0.000 description 2
- 238000005065 mining Methods 0.000 description 2
- 230000001537 neural effect Effects 0.000 description 2
- 230000003287 optical effect Effects 0.000 description 2
- 229920001184 polypeptide Polymers 0.000 description 2
- 230000000861 pro-apoptotic effect Effects 0.000 description 2
- 108090000765 processed proteins & peptides Proteins 0.000 description 2
- 102000004196 processed proteins & peptides Human genes 0.000 description 2
- 238000011160 research Methods 0.000 description 2
- 230000019491 signal transduction Effects 0.000 description 2
- 239000007787 solid Substances 0.000 description 2
- 101150084750 1 gene Proteins 0.000 description 1
- 241000894006 Bacteria Species 0.000 description 1
- 101001059929 Caenorhabditis elegans Forkhead box protein O Proteins 0.000 description 1
- 230000004655 Hippo pathway Effects 0.000 description 1
- 101001047642 Homo sapiens Serine/threonine-protein kinase LATS1 Proteins 0.000 description 1
- 108090000144 Human Proteins Proteins 0.000 description 1
- 102000003839 Human Proteins Human genes 0.000 description 1
- 241001465754 Metazoa Species 0.000 description 1
- 108091000080 Phosphotransferase Proteins 0.000 description 1
- 102100024031 Serine/threonine-protein kinase LATS1 Human genes 0.000 description 1
- 241000700605 Viruses Species 0.000 description 1
- 208000027418 Wounds and injury Diseases 0.000 description 1
- 102000050257 X-Linked Inhibitor of Apoptosis Human genes 0.000 description 1
- 108700031544 X-Linked Inhibitor of Apoptosis Proteins 0.000 description 1
- 235000021120 animal protein Nutrition 0.000 description 1
- 230000002424 anti-apoptotic effect Effects 0.000 description 1
- 230000006907 apoptotic process Effects 0.000 description 1
- 238000003491 array Methods 0.000 description 1
- 230000008236 biological pathway Effects 0.000 description 1
- 230000031018 biological processes and functions Effects 0.000 description 1
- 230000030833 cell death Effects 0.000 description 1
- 238000010225 co-occurrence analysis Methods 0.000 description 1
- 238000004891 communication Methods 0.000 description 1
- 230000006378 damage Effects 0.000 description 1
- 238000013016 damping Methods 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 229940079593 drug Drugs 0.000 description 1
- 238000002474 experimental method Methods 0.000 description 1
- 230000002349 favourable effect Effects 0.000 description 1
- 239000012458 free base Substances 0.000 description 1
- 230000005021 gait Effects 0.000 description 1
- 230000002068 genetic effect Effects 0.000 description 1
- 239000007943 implant Substances 0.000 description 1
- 230000006872 improvement Effects 0.000 description 1
- 208000014674 injury Diseases 0.000 description 1
- 230000004060 metabolic process Effects 0.000 description 1
- 239000000203 mixture Substances 0.000 description 1
- 239000002547 new drug Substances 0.000 description 1
- 108020004707 nucleic acids Proteins 0.000 description 1
- 102000039446 nucleic acids Human genes 0.000 description 1
- 150000007523 nucleic acids Chemical class 0.000 description 1
- 238000005457 optimization Methods 0.000 description 1
- 230000002093 peripheral effect Effects 0.000 description 1
- 238000006366 phosphorylation reaction Methods 0.000 description 1
- 102000020233 phosphotransferase Human genes 0.000 description 1
- 230000004962 physiological condition Effects 0.000 description 1
- 238000007781 pre-processing Methods 0.000 description 1
- 230000035935 pregnancy Effects 0.000 description 1
- 230000035755 proliferation Effects 0.000 description 1
- 230000000644 propagated effect Effects 0.000 description 1
- 239000000758 substrate Substances 0.000 description 1
- 230000004083 survival effect Effects 0.000 description 1
- 230000004654 survival pathway Effects 0.000 description 1
- 230000002123 temporal effect Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N5/00—Computing arrangements using knowledge-based models
- G06N5/02—Knowledge representation; Symbolic representation
- G06N5/022—Knowledge engineering; Knowledge acquisition
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N5/00—Computing arrangements using knowledge-based models
- G06N5/01—Dynamic search techniques; Heuristics; Dynamic trees; Branch-and-bound
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16B—BIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
- G16B20/00—ICT specially adapted for functional genomics or proteomics, e.g. genotype-phenotype associations
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16B—BIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
- G16B40/00—ICT specially adapted for biostatistics; ICT specially adapted for bioinformatics-related machine learning or data mining, e.g. knowledge discovery or pattern finding
- G16B40/30—Unsupervised data analysis
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16B—BIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
- G16B5/00—ICT specially adapted for modelling or simulations in systems biology, e.g. gene-regulatory networks, protein interaction networks or metabolic networks
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16C—COMPUTATIONAL CHEMISTRY; CHEMOINFORMATICS; COMPUTATIONAL MATERIALS SCIENCE
- G16C20/00—Chemoinformatics, i.e. ICT specially adapted for the handling of physicochemical or structural data of chemical particles, elements, compounds or mixtures
- G16C20/30—Prediction of properties of chemical compounds, compositions or mixtures
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- Health & Medical Sciences (AREA)
- Life Sciences & Earth Sciences (AREA)
- Data Mining & Analysis (AREA)
- Medical Informatics (AREA)
- General Engineering & Computer Science (AREA)
- Software Systems (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Evolutionary Computation (AREA)
- Artificial Intelligence (AREA)
- Spectroscopy & Molecular Physics (AREA)
- Biophysics (AREA)
- General Health & Medical Sciences (AREA)
- Biotechnology (AREA)
- Bioinformatics & Computational Biology (AREA)
- Mathematical Physics (AREA)
- Evolutionary Biology (AREA)
- General Physics & Mathematics (AREA)
- Computing Systems (AREA)
- Computational Linguistics (AREA)
- Molecular Biology (AREA)
- Epidemiology (AREA)
- Databases & Information Systems (AREA)
- Public Health (AREA)
- Analytical Chemistry (AREA)
- Chemical & Material Sciences (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Bioethics (AREA)
- Genetics & Genomics (AREA)
- Proteomics, Peptides & Aminoacids (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
Description
・核酸(DNA,RNAを含む)
・アミノ酸
・ポリペプチド
・タンパク質(アミノ酸の連鎖である1つ以上のポリペプチドからなる)
有機的組織体は以下を含んでよい:
・バクテリア
・植物
・動物
病状は以下を含んでよい:
・病気
・物理的傷
・生理的状態(妊娠、等)
調合薬は、任意の種類の化学薬品又は背得仏学的薬物を含んでよい。
ここで、eはユニークなエッジ識別子であり、S、Tはそれぞれ前記エッジにより有向接続されるソース及びターゲット頂点のセットであり、Uは前記エッジにより無向接続される頂点のセットであり、lはエッジラベルである。
本章は、先ず、拡張可能表現のために使用されるコア構造を紹介し、次に選択されたグラフ構造を普遍表現に変換するためのルールを記載する。最後に、選択されたグラフ構造及びそれらの変換された表現の説明のための例が提供される。
グラフ構造の表現のための基礎(特に、標準グラフ、複数グラフ、及びハイパーグラフ)として、発明者等は以下のように定義される2部グラフを選択した。
(V,E,A)
ここで、V、Eは、それぞれ、2部グラフにより表現されるグラフ構造内の頂点及び(ハイパー)エッジに対応するノード部分である。
ここで、Lv、Leは、それぞれ、頂点及びエッジラベルのセットである。マッピングは、主に、特定頂点及びエッジノードを、汎用の可能なラベル付けされ重み付けされたグラフ構造の適切な表現のために必要な種類及び重みに関連付けることを意味する。特に断りのない場合、ラベルの以下のデフォルト設定が定義される。
ここで、Ov、Oeは、それぞれ、実数集合からの頂点及びエッジノードのデフォルト単一ラベル(1つの値のみ)である。2部表現は、異なる表現及び複雑性レベルの様々なグラフ構造の均一な表現を可能にする。しかしながら、2部表現を介して実行される標準グラフ演算の空間及び時間的複雑性を増大するという点で、これに対する対価がある。この増大は、概して線形であり、したがって、別の複雑性クラスへのシフトを意味しないが、線形因子の増大さえも、大規模データについての多くのアプリケーションでは困難な場合がある。したがって、2部表現の以下の特定の最適化が導入されてよい。
・全てのエンティティ及び関係ラベルの整数符号化。その結果、2部グラフの頂点は、より効率的に格納できる(つまり、可変サイズのストリング型ではなく、固定サイズの整数を用いる)。
・疎ブール(sparse Boolean)行列を用いるA内のエッジの表現。これは、最適化行列演算により、後続、先行、及び隣接ノードの効率的検索を可能にする。
(I)全てのe∈Eについて、d(e)は2である。ここで、d(u)は、2部表現の中のノードuの次数である。表現されているグラフが有向性である場合、全てのe∈Eについてdi(e)=do(e)=1である。ここで、di(e)及びdo(e)は、それぞれ、2部表現の中のノードuの入次数(in-degree)及び出次数(out-degree)である(ハイパーエッジは無い;「入り込む(sink)」又は「湧き出る(spring)」ノードは無い)。
(II)(vi,ea),(vj,ea)∈A且つ(vi,eb),(vj,eb)∈Aの場合、ea=ebである(複数エッジは無い)。
(III)Aは集合である(ループは無い)。
(I)全てのe∈Eについて、d(e)は2である。表現されているグラフが有向である場合、全てのe∈Eについて、di(e)=do(e)=1である(ハイパーエッジは無い;「入り込む(sink)」又は「湧き出る(spring)」エッジは無い)。
(II)Aは複数集合であり得る(ループが可能である)。
(III)(vi,ea),(vj,ea)∈A且つ(vi,eb),(vj,eb)∈Aの場合、λe(ea)≠λe(eb)である(同じラベルを共有する複数エッジは無い)。
(I)全てのe∈Eについて、d(e)>1である。表現されているグラフが有向関係を有する場合、全てのe∈Eについて、di(e)>0,do(e)>0である(「入り込む(sink)」又は「湧き出る(spring)」ハイパーエッジは無い)。
(II)Aは複数集合であり得る(ループが可能である)。
(III)(vi,ea),(vj,ea)∈A且つ(vi,eb),(vj,eb)∈Aの場合、λe(ea)≠λe(eb)である(同じラベルを共有するハイパーエッジは無い)。
変換のための極めて重要な手段は、タプルとして定義される汎用(ハイパー)エッジである。(e,S,T,U)
ここで、eはユニークなエッジ識別子であり、S、Tはそれぞれ、エッジにより有向接続されるソース及びターゲットノードのセットである。Uは、エッジにより無向接続されるノードのセットである。S、T、Uセットは、以下の条件を満たす:
(I)|S∪T∪U|>1(単項又は空配列(nullary)関係は無い)、
(II)
(ユニークな頂点の役割)、
(III)
(ハイパーグラフのみが混合有向性であり得る)。
aからbへと向かう有向エッジは、以下のように表現され得る。
ハイパーエッジは、当然に(_,S,T,U)と表現でき、ここで|S∪T∪U|>2である。重み付けされた型付き(ラベル付けされた)エッジは、対応するマッピングをエッジセット及び/又はユニークなエッジ識別子に導入することにより表現できる。
・VはVバーに等しい。
・全ての(ハイパー)エッジ(e,S,T,U)∈Eバーについて、ノードe∈Eが存在する。
・全ての(ハイパー)エッジ(e,S,T,U)∈Eバーは、A内に以下のエッジに対応する:
・元の表現に関連付けられた任意のマッピング(又はラベル/重み)がある場合、それらは相応してλv、λe、λwマッピングに保存される。
図4は、標準無向グラフ、有向複数グラフ、及び混合重み付けハイパーグラフを符号化するステートメントセット、並びに対応する2部表現の単純な例を示す。参考のため、グラフ及び複数グラフの直接グラフ表現が示される。より高次のアリティ関係の描写が比較的複雑なので、例を簡潔且つ分かり易く保つために、ハイパーグラフの直接グラフ表現はここでは与えられない。
及び
次に、これらの構造のマージ及びその対応するハイパーグラフ表現が、図6のように示される。
本章は、先ず、元のグラフ構造の中のパスと2部表現との間の対応を記載する。これは、次に、構造をサンプリングするために使用され得るトラバースを定義するために使用される。サンプリングの例が次に与えられる。
検討されるグラフ構造のいずれかにおいて(つまり、標準グラフ、複数グラフ、及びハイパーグラフ)、パスは、Adrian Bondy and Uppaluri SR Murty. Graph Theory (Graduate Texts in Mathematics 244) Springer, 2008において紹介された表記を用いて定義されてよい。パスは、2つのノードがシーケンス内で連続する場合にそれらが隣接するように、ノードの線形シーケンスの中で順序付けられてよい単純なグラフ(ループ又は複数エッジを有しない2項グラフ)である。
ここで、vi,ej,i∈{1,...,k},j∈{1,...,k-1}は、対応するグラフ構造の中のノード及び(ハイパー)エッジである。明らかに、エッジezは、vx,vyがそれぞれezエッジのソース及びターゲットノードである場合且つその場合にのみ、ノードvxとvyとの間のパスシーケンスの中に現れてよい。
の2部表現は、以下のシーケンスである:
ここで、x∈{1,...,k},y∈{1,...,k-1},z∈{1,...,2k-1}について、vx∈A,ey∈E,az∈Aである。パスシーケンス内の任意のサブパスvi,aj,ek,al,vmについて、以下が満たされなければならない。
aj=(vi,o1,ek),al=(vm,o2,ek),ここで、o1∈{→,<->}且つo2∈{←,<->}
元の構造の中のパスとそれらの2部表現との間の直接対応により、参照は、特に断りのない限り、V,E要素からのみ構成されるより単純な表記に向かう。しかしながら、ノードの特性の観点から、特に断りのない限り、私達は2部表現を参照する。
1.頂点ノードvxからエッジノードexへの確率p(ex|vx)。
2.エッジノードexから頂点ノードvx+1への確率p(vx+1|ex)。
これら2つのイベントは独立なので、遷移確率はp[(vx,ex,vx+1)]=p(ex|vx)p(vx+1|ex)である。
ここで、
はvxに関する出エッジノードの集合である。p(vx+1|ex)確率は以下の場合ゼロである。
の場合、p(vx+1|ex)確率は以下の通りである。
つまり、遷移の開始ノードを除いて、エッジノードexの出次数に比例する。したがって、同時遷移確率は、次の通りである。
ランダムウォークトラバースにより生成されたシーケンスは、ランダムウォークの隣接サブパスとして直接取得されてよい。
パス及びトラバースの考えを説明するために、図4の例#1及び#3及びランダムウォークによるトラバースを取り上げる(おそらく、前の段落で検討された可能性のうち最も自明でないものである)。例#1は、図7に与えられる直接且つ2部グラフ表現による標準グラフGを表す。
つまり、bで開始した後にランダムにPgを生成する遷移の確率の積である。定義されたエッジ重みがないので、デフォルト重み1が使用され、したがって、遷移確率はパスに沿った(エッジ)ノードの次数に事実上依存することに留意する。
上述の例で生成された全てのランダムウォークは、対応するグラフ構造のサンプルシーケンスとして直接使用されてよい。
本章は、グラフ構造をサンプリングすることにより生成されたシーケンスが、エンティティ及び関係の分布特徴ベクトルを構成するためにどのように使用され得るかを記載する。サンプルの例が次に与えられる。
ノードV及び(ハイパー)エッジEを有するグラフ構造Gに対応する、|E|+|V|の行及び列を有する空の(つまり、ゼロの)特徴行列Fを仮定する。行s∈E∪V及び列s'∈E∪Vに対応する要素を、F(s,s')として示す。
これはグラフ構造G(長さsは2k-1である)からサンプリングされ、次に、以下の通り特徴行列Fを更新するために使用される。
・局所的共起重みマッピング
を初期化して、鍵値全てについてゼロにする。
・サイズcの各コンテキストウインドウについて、以下の開始位置si∈{s1,s2,...,s2k-2}に渡り完全に繰り返す。
-局所的な共起重みが計算される軸(pivot)としてsiを用いる。
-各j∈{i+1,i+2,...,max(c,2k-1)}について、局所的共起を以下のように更新する:
+j-i≦αの場合、wcooc(si,sj)←wcooc(si,sj)+1;
+その他の場合、wcooc(si,sj)←wcooc(si,sj)+(j-i-α+1)-β
各s、s'∈E∪Vついて、特徴行列Fを以下のように更新する:
本処理の結果は、サンプリングされたシーケンス内の他のエンティティ及び関係との共起を反映する重みのベクトルとして、各エンティティ及び関係を符号化する対称正方行列である。共起重みが計算される方法は、3つのパラメータにより影響されてよい。
・c:コンテキストウインドウサイズを定めるパラメータであり、非ゼロ共起重みについて、一度にどれだけ多くの連続要素が考慮されるかを定める。これは、自然言語テキストについての共起計算における自然な文の境界の類似体として理解され得る。
・α:直接の近隣を定めるパラメータである。つまり、要素が非常に密接に関連していると考えられる距離範囲である(可能な最も高い1の局所的共起重みを受信する)。これは、主に、2つのエンティティが関係により直接リンクされる場合、(それらの間のリンク関係により)それらがサンプリングされたシーケンス内で2つの離れた位置にある場合でも、直感的に強力に関連付けられるべきであることを反映するためである。
・β:軸(pivot)からの距離の関数として、局所的共起重みのダンピングを定めるパラメータである。これは、更に離れている要素があまり強力に関連付けられるべきでないことを反映するためである。
前の例からの経路Pg=(b,g,c,f,a,h,d)を、サンプリングされたシーケンスと考える。
(b,g,c,f,a),
(g,c,f,a,h),
(c,f,a,h,d),
(f,a,h,d),
(a,h,d),
(h,d)
シーケンス内の要素間の距離が2以下(αパラメータ)なので、(b,g)、(b,c)のwcooc値は1に等しい。
全てのコンテキストウインドウからのペアは、以下の通りである:
a,b,c,d,e,f,g,h要素に対応する行及び列を仮定すると、結果として生じる共起特徴行列は以下の通りである:
図4中のエンティティ及び関係の特定のインスタンス化、例#3は以下の通りである。
a:AKT
b:FOX01
c:BIM
d:XIAP
関係r:抑制(Inhibition)
関係s:活性化(activation)
コンテキストD1:アポトーシス(aptoptosis)経路の抑制
コンテキストD2:生存経路の活性化
無向関係は:タンパク質相互作用である。
第1作業例は、2段階:図9のS101に示すような2部グラフへの変換、及び図9のステップS102に示すようなグラフサンプリング、のうちの第1部分を考える。
(f01,{u0},{u1},{c0})の第2要素の各メンバについて、該メンバからエッジ「→」が生成され、及び(f01,{u0},{u1},{c0})の第1要素が生成される。第2要素はu0のみであり、第1要素はf01なので、(u0,→,f01)が生成される。
(f01,{u0},{u1},{c0})の第3要素の各メンバについて、該メンバからエッジ「←」が生成され、及び(f01,{u0},{u1},{c0})の第1要素が生成される。第3要素はu1のみであり、第1要素はf01なので、(u0,←,f01)が生成される。
(f01,{u0},{u1},{c0})の第4要素の各メンバについて、該メンバからエッジ「<->」が生成され、及び(f01,{u0},{u1},{c0})の第1要素が生成される。第4要素はc0のみであり、第1要素はf01なので、(u0,<->,f01)が生成される。
u3がu2として選択されるとき、p[(u0,f03,u3)]=p(f03|u0)*p(u3|f03)=(1/4)*(1/2)=1/8。
c0がu2として選択されるとき、p[(u0,f03,c0)]=p(f03|u0)*p(c0|f03)=(1/4)*(1/2)=1/8。
(1)第1遷移は(u0,f03,u3)である。つまりv2=u3である。Eo(u3)は、A内の(u3,→,e)又は(u3,<->,e)を満たすエッジノードのセットである。A内にこのようなeが存在しないので、Eo(u3)は空である。この場合、次候補が見付からないので、ランダムウォークはここで停止する。したがって、経路(u0,f03,u3)が、24*p[(u0,f03,c0)]=24*(1/8)=3回、生成される。
(2)第1遷移は(u0,f03,c0)である。つまりv2=c0である。Eo(c0)は、A内の(u3,→,e)又は(u3,<->,e)を満たすエッジノードのセットである。(c0<->,,f01)、(c0,<->,f02)及び(c0,<->,f03)がA内に存在するので、Eo(c0)={f01,f02,f03}及びp(f01|c0)=p(f02|c0)=p(f03|c0)=1/3である。
f01をEo(c0)からe2として選択する。つまりe2=f01である。
Vo(f01)は、A内の(v,←,f01)又は(v,<->,f01)を満たす頂点ノードのセットである。A内に(u1,←,f01)及び(c0,<->,f01)が存在するので、Vo(f01)={u1,c0}及びVo(f01)\{c0}={u1}である。したがって、p{u1}=1である。u1がv2の候補ではないことに留意する。
u1のみがv3として選択されるとき、p[(c0,f01,u1)]=p(f01|c0)*p(u3|f03)=(1/3)*1=1/3。
したがって、経路(u0,f03,c0,f01,u1)が、24*p[(u0,f03,c0)]*p[(c0,f01,u1)]=24*(1/8)*(1/3)=1回、生成される。
先ず、図17aは、図13におけるように図17bのように表現できる。2部変換器は、図13を図14に変換するのと同様の方法で、図17を図18に変換する。図18により、グラフサンプラは、生成されたシーケンスの数20で、図16に示すシーケンスを生成するのと同様の方法で、図19に示すシーケンスを生成する。
F(si,sj):=F(si,sj)+1及びF(sj,si):=F(sj,si)+1
(1回目の反復)ステップ134で、3つのうちの第1シーケンス(u0,f01,u1,f15,u5)が選択されると想定する。ステップ135で、可能なペアは(u0,f01)、(u0,u1)、(u0,f15)、(u0,u5)、(f01,u1)、(f01,f15)、(f01,u5)、(u1,f15)、(u1,u5)、及び(f15,u5)なので、各ペアに対応するF内のセルは1だけ増大され、Fは図27へと更新される(更新された要素は影付きである)。
正規グラフ表現を有する方法と比較するために、分布解析器は図19に適用される。図16から図30を生成するのと同様の方法で、図31の共起行列が得られる。
u5の埋め込みは、図30のu5行に対応するベクトルである。つまり、
u5=(3,35,0,0,0,0,0,0,0,8,0,11,0,0,0,35,0,0,0)
同様に、
u6=(3,0,35,0,0,0,0,0,0,8,0,0,11,0,0,0,35,0,0)、
u8=(3,0,0,0,51,0,0,0,0,0,24,0,0,0,27,0,0,0,51)
u5及びu6の、並びにu5及びu8の、コサイン類似性を計算する。
正規グラフ表現を有する方法(図31):
同様に、
u5=(1,5,0,0,0,0,0,0,0,1,0,0,0,5,0,0,0)、
u6=(1,0,5,0,0,0,0,0,0,0,1,0,0,0,5,0,0)、
u8=(1,0,0,0,5,0,0,0,0,0,0,0,1,0,0,0,5)
及び
本発明の実施形態では、u5はu8よりもu6に類似し、他の方法では、u5はu6及びu8に同等に類似する。図13で、u5、u6及びu8は、同様の構造「u0→(別のノード)→(接続されたノード)」を有する。したがって、u5がu8よりu6に類似すると考えることは自然である。これは、本発明の実施形態は示すが、他の方法は示さない。
u5の埋め込みは、図30のu5行に対応するベクトルである。つまり、
u5=(3,35,0,0,0,0,0,0,0,8,0,11,0,0,0,35,0,0,0)
同様に、
u6=(3,0,35,0,0,0,0,0,0,8,0,0,11,0,0,0,35,0,0)、
u7=(0,0,0,24,0,0,0,0,0,0,0,0,0,0,0,0,0,24,0)
u5及びu6の、並びにu5及びu8の、コサイン類似性を計算する。
正規グラフ表現を有する方法(図F1):
同様に、
u5=(30,254,0,0,0,0,0,0,0,32,0,62,0,0,0,350,0,0,0)、
u6=(30,0,254,0,0,0,0,0,0,32,0,0,62,0,0,0,350,0,0)、
u7=(30,0,0,254,0,0,0,0,0,32,0,0,0,62,0,0,0,350,0)
及び
本発明の実施形態では、u5はu7よりもu6に類似し、他の方法では、u5はu6及びu7に同等に類似する。図13で、u5、u6及びu7は、同様の構造「u0→(別のノード)-?-(接続されたノード)」を有するが、第2エッジはu5及びu6への順方向エッジであり、u7については逆方向エッジである。したがって、u5がu7よりu6に類似すると考えることは自然である。これは、本発明が達成するが、他の方法は達成しない。
C1:抗アポトーシス(Anti-apoptotic)
U0:LATS1/2
U1:TAZ
U2:FOXO
U3:BAX
U4:YAP
U5:P73
U6:AIF1
U7:PUMA
U8:TEAD
全ての関係(fxx)は、リン酸化反応であり、キナーゼから基質を指す。
システムの主な範囲は、生体情報コンテキストに依存する経路ネットワーク又は刊行物から抽出された2項ステートメント、及び生体情報コンテキストに依存する経路ネットワーク又は刊行物及びそれらの出所から抽出された2項ステートメントのようなそれらの出所、の異なるアリティ及び方向の関係を符号化する知識グラフに特に焦点を当てた、グラフ構造の直ぐに使用可能な且つ効率的な表現の生成である。
本発明の実施形態は、同型ではない知識グラフが一緒に処理されなけれなならない使用例において(例えば、経路データベースの中のコンテキストに依存するn-ary関係と一緒にタンパク質相互作用ネットワークの中の2項関係を分析する)、特に有利である。多様なデータセットを一緒に処理する今までに例のない能力は、基本的に不可能であった自動発見をもたらし得る。
Arity、アリティ:エッジにより接続されたノードの最大数を示す、グラフの特性。
Knowledge Graph、知識グラフ:(ノード/頂点により表される)アイテムの集合。アイテムのうちの任意のものは、それらの間の(型付き2項関係のような)リンクにより接続され得る。それらは、グラフ構造知識ベースとして理解できる。2つより多くのノードを接続する構造への一般化が可能であり、幾つかの用途で要求される。
Embedding、埋め込み:1つの構造の要素(例えば、グラフ内のノード又は関係、又は自然言語文のセットの中のフレーズ)の、(標準的に低次数の)連続ベクトル空間内のベクトルへのマッピング。主に構造化情報の使い勝手の良い(線形)表現のために使用される。その結果、幾つかの関心パターンがその中で発見できる。
Graph、グラフ:エンティティ(ノード又は頂点)のペアの間の関係(エッジ)を表す数学的構造。有向又は無向グラフは、標準的に区別される(有向グラフでは、ノードAからノードBへのエッジは、ノードBからノードAへのエッジと何かが異なることを意味し、一方で、無向グラフではこれは同じことを意味する)。標準的に、エッジ又はノードラベルは考慮されない。また、同じ2つのノード(複数エッジ)の間の複数の接続、及びループ(ノードをそれ自体に「接続する」エッジ)は、標準グラフでは禁止される。
Labelled Graph、ラベル付きグラフ:ラベルをノード及び/又はエッジに関連付けることのできる、グラフの一般化。
Weighted Graph、重み付きグラフ:重みの相対的重要度を反映するために、重みをそのエッジに関連付けることのできる、グラフの一般化。
Multigraph、複数グラフ:ループ及び複数エッジ(例えば、同じ2個の頂点/ノードの間にある2個のエッジ)を含むことのできる、グラフの一般化。
Hypergraph、ハイパーグラフ:2つより多くのノードをリンクするハイパーエッジを含むことのできる、グラフの一般化。
Bipartite Graph、2部グラフ:ノードのセットU、V内のノードを接続するエッジが存在しないように、U、Vを区別しなければならないグラフ。言い換えると、UからのノードをVからのノードに接続するエッジのみが許可される。
Graph Structure、グラフ構造:グラフ又はその一般化の任意の種類(例えば、複数グラフ又はハイパーグラフ)。
Graph Path、グラフパス:グラフ構造G内の長さ2k-1の、ノードux及びエッジeyのシーケンス(u1,e1,u2,e2,..,ek-1,uk)。ここで、kはパス内のノードの数であり、パス内の任意のui,ei,ui+1について、eiはuiとui+1との間のエッジを符号化する。パス内で生じるノードの数は、無限である可能性がある。
Graph Traversal、グラフトラバース:ノード間の各遷移が特定の原理を用いて選択される、グラフパス。
Depth-First Search、縦型検索:グラフトラバースの種類。グラフの包括的検索を試みるグラフパス(つまり、全てのノードを訪問する)。ノード間の各遷移は、グラフの中へより深く行こうと試みる。訪問できる新しいノードが無い場合、トラバースは最後の訪問されていないノードへ後戻りする。
Breadth-First Search、横型検索:グラフトラバースの種類。グラフの包括的検索を試みるグラフパス(つまり、全てのノードを訪問する)。ノード間の各遷移は、より深く行く前に、前のノードの全ての近隣を包括的に訪問しようと試みる。訪問できる新しいノードが無い場合、トラバースは最後の訪問されていないノードへ後戻りする。
Best-First Search、最良優先探索:グラフトラバースの種類。ノード間の各遷移が、最も効率的な検索のための次ノード候補の「見込み(promise)」を決定する、アプリケーションに依存する経験則(heuristics)に基づき選択される、グラフパス。
Random Walk、ランダムウォーク:グラフトラバースの種類。ノード間の各遷移がランダムに選択される、グラフパス。選択は、利用可能エッジの間で同様である、又は重み付きグラフ構造の中のエッジ重みに基づいてよい。
Distributional Representation、分布表現:頻繁に共起する他の要素に基づく要素の、構造の中の該要素の表現(例えば、グラフ内のノード又は関係、又はテキストコーパスの中のフレーズ)。標準的に、データ内の他の要素に関する特定の共起スコアを反映する連続ベクトルを用いて、符号化される。
(付記1)
生体エンティティの特性を推測する、コンピュータにより実施される方法であって、
頂点及びエッジの形式の、異なるアリティを有する、生体エンティティに関連する2以上の知識グラフを入力するステップであって、前記知識グラフのうちの少なくとも1つは有向であり、前記知識グラフのうちの少なくとも1つはラベル付きである、ステップと、
前記知識グラフの各々を、ユニークなエッジ識別子のリストとして、ハイパーエッジ表現に変換するステップであって、前記ユニークなエッジ識別子の各々はソース及びターゲット頂点を有し、頂点は前記エッジにより無方向接続され、ラベルは前記エッジに関連付けられる、ステップと、
前記ハイパーエッジ表現を、2部グラフに変換するステップであって、前記2部グラフは一方のセットの中に前記頂点及びラベルを有し、他方のセットの中に前記エッジを有し、前記頂点及びラベルは前記ハイパーエッジ表現のとおりに補助エッジAにより前記エッジにリンクされる、ステップと、
前記2部グラフをサンプリングするステップであって、前記2部グラフを、前記頂点、ラベル、及びエッジの特徴行列の中の行列エントリとして埋め込む、ステップと、
前記特徴行列を用いて、前記行列エントリに基づき結合知識グラフの中の生体エンティティの特性を推測するステップと、
を含む方法。
(付記2) 前記生体エンティティはタンパク質であり、前記知識グラフはタンパク質に関連する、付記1に記載の方法。
(付記3) 一方の知識グラフ入力は、タンパク質相互作用データのような2項のみの関係を有する有向ラベルグラフであり、他方の知識グラフ入力は、経路データベースのような3項関係を有する混合有向/一方向ラベルグラフである、付記1又は2に記載の方法。
(付記4) 前記2部グラフをサンプリングするステップは、
前記2部グラフをトラバースするステップであって、前記セットの間の前記リンクに沿って可能なシーケンスを提供する、ステップを含み、
前記2部グラフを埋め込むステップは、
前記シーケンスから、前記頂点、ラベル、及びエッジの特徴行列を生成するステップであって、共起スコアが前記特徴行列の各セルの中の行列エントリを形成する、ステップを含み、
前記特徴行列は、前記共起スコアに基づき前記知識グラフの中の生体エンティティの特性を推測するために使用される、付記1乃至3のいずれか一項に記載の方法。
(付記5) 前記ハイパーエッジ表現は、2部グラフへの変換の前に、同じ頂点と同じ名称を有する頂点を考慮することにより結合される、付記1乃至4のいずれか一項に記載の方法。
(付記6) 同じ頂点の選択的名称を一緒にグループ化するために、マッピングツールが使用される、付記5に記載の方法。
(付記7) 各エッジ識別子は、(e,S,T,U)lの形式を有し、
eはユニークなエッジ識別子であり、S、Tはそれぞれ前記エッジにより有向接続されるソース及びターゲット頂点のセットであり、Uは前記エッジにより無方向接続される頂点のセットであり、lはエッジラベルである、付記1乃至6のいずれか一項に記載の方法。
(付記8) 補助エッジAは、各頂点と該頂点の結合されるエッジとの間に形成され、2つの頂点の間の関係は、2つの補助エッジ及び前記エッジを含む、付記1乃至7のいずれか一項に記載の方法。
(付記9) 補助エッジが有向エッジと頂点との間にあるとき、前記補助エッジは、前記有向エッジと同じ方向を向いている、付記8に記載の方法。
(付記10) 補助エッジは、エッジをラベル付けするラベルと前記エッジとの間に形成される、付記1乃至9のいずれか一項に記載の方法。
(付記11) 前記2部グラフのトラバースは、頂点又はエッジラベルと前記ハイパーエッジ表現のエッジとの間で交互に現れるシーケンスを生成する、付記1乃至10のいずれか一項に記載の方法。
(付記12) 前記特徴行列は、シーケンスの中の2つのエンティティの間の前記シーケンス内の距離を考慮して共起スコアを生成し、共起スコアを各シーケンスの前記特徴行列に加算することにより入力される、付記1乃至11のいずれか一項に記載の方法。
(付記13) シーケンス内の最後ではない各点で開始するコンテキストウインドウを用いて、コンテキストシーケンスを与えるステップ、を更に含み、
各開始点と前記コンテキストシーケンス内の後のエンティティとの間の前記共起スコアは、前記コンテキストシーケンス内の前記エンティティ間の距離を考慮して計算され、前記特徴行列に追加される、付記12に記載の方法。
(付記14) 前記生体エンティティの前記特性は、例えばコサイン類似性を用いて、2以上の生体エンティティの類似性を計算することにより推測される、付記1乃至13のいずれか一項に記載の方法。
(付記15) コンピュータ機器上で実行すると、該コンピュータ機器に付記1乃至14のいずれか一項に記載の方法を実行させるコンピュータプログラム。
(付記16) タンパク質の特性を推測する機器であって、メモリとプロセッサとを含み、
前記プロセッサは、2部変換器と、グラフサンプラと、分布解析器と、を提供し、
前記2部変換器は、頂点及びエッジの形式の、異なるアリティを有する、タンパク質に関連する2以上の知識グラフを受信し、前記知識グラフのうちの少なくとも1つは有向であり、前記知識グラフのうちの少なくとも1つはラベル付きであり、
前記知識グラフの各々を、ユニークなエッジ識別子のリストとして、ハイパーエッジ表現に変換し、前記ユニークなエッジ識別子の各々はソース及びターゲット頂点を有し、頂点は前記エッジにより無方向接続され、ラベルは前記エッジに関連付けられ、
前記ハイパーエッジ表現を、2部グラフに変換するステップであって、前記2部グラフは一方のセットの中に前記頂点及びラベルを有し、他方のセットの中に前記エッジを有し、前記頂点及びラベルは前記ハイパーエッジ表現のとおりに補助エッジAにより前記エッジにリンクされ、
前記グラフサンプラは、前記2部グラフをサンプリングし、
前記分布解析器は、
前記2部グラフを、前記頂点、ラベル、及びエッジの特徴行列の中の行列エントリとして埋め込み、
前記特徴行列をメモリに格納し、
前記特徴行列を用いて、前記行列エントリに基づき結合知識グラフの中のタンパク質の特性を推測する、機器。
20 グラフサンプラ
30 分布解析器
40 知識グラフDB
50 2部グラフDB
60 シーケンスDB
70 共起行列DB
Claims (16)
- 生体エンティティの特性を推測する、コンピュータにより実施される方法であって、
頂点及びエッジの形式の、異なるアリティを有する、生体エンティティに関連する2以上の知識グラフを入力するステップであって、前記知識グラフのうちの少なくとも1つは有向であり、前記知識グラフのうちの少なくとも1つはラベル付きである、ステップと、
前記知識グラフの各々を、ユニークなエッジ識別子のリストとして、ハイパーエッジ表現に変換するステップであって、前記ユニークなエッジ識別子の各々はソース及びターゲット頂点を有し、頂点は前記エッジにより無方向接続され、ラベルは前記エッジに関連付けられる、ステップと、
前記ハイパーエッジ表現を、2部グラフに変換するステップであって、前記2部グラフは一方のセットの中に前記頂点及びラベルを有し、他方のセットの中に前記エッジを有し、前記頂点及びラベルは前記ハイパーエッジ表現のとおりに補助エッジAにより前記エッジにリンクされる、ステップと、
前記2部グラフをサンプリングするステップであって、前記2部グラフを、前記頂点、ラベル、及びエッジの特徴行列の中の行列エントリとして埋め込む、ステップと、
前記特徴行列を用いて、前記行列エントリに基づき結合知識グラフの中の生体エンティティの特性を推測するステップと、
を含む方法。 - 前記生体エンティティはタンパク質であり、前記知識グラフはタンパク質に関連する、請求項1に記載の方法。
- 一方の知識グラフ入力は、タンパク質相互作用データのような2項のみの関係を有する有向ラベルグラフであり、他方の知識グラフ入力は、経路データベースのような3項関係を有する混合有向/一方向ラベルグラフである、請求項1又は2に記載の方法。
- 前記2部グラフをサンプリングするステップは、
前記2部グラフをトラバースするステップであって、前記セットの間の前記リンクに沿って可能なシーケンスを提供する、ステップを含み、
前記2部グラフを埋め込むステップは、
前記シーケンスから、前記頂点、ラベル、及びエッジの特徴行列を生成するステップであって、共起スコアが前記特徴行列の各セルの中の行列エントリを形成する、ステップを含み、
前記特徴行列は、前記共起スコアに基づき前記知識グラフの中の生体エンティティの特性を推測するために使用される、請求項1乃至3のいずれか一項に記載の方法。 - 前記ハイパーエッジ表現は、2部グラフへの変換の前に、同じ頂点と同じ名称を有する頂点を考慮することにより結合される、請求項1乃至4のいずれか一項に記載の方法。
- 同じ頂点の選択的名称を一緒にグループ化するために、マッピングツールが使用される、請求項5に記載の方法。
- 各エッジ識別子は、(e,S,T,U)lの形式を有し、
eはユニークなエッジ識別子であり、S、Tはそれぞれ前記エッジにより有向接続されるソース及びターゲット頂点のセットであり、Uは前記エッジにより無方向接続される頂点のセットであり、lはエッジラベルである、請求項1乃至6のいずれか一項に記載の方法。 - 補助エッジAは、各頂点と該頂点の結合されるエッジとの間に形成され、2つの頂点の間の関係は、2つの補助エッジ及び前記エッジを含む、請求項1乃至7のいずれか一項に記載の方法。
- 補助エッジが有向エッジと頂点との間にあるとき、前記補助エッジは、前記有向エッジと同じ方向を向いている、請求項8に記載の方法。
- 補助エッジは、エッジをラベル付けするラベルと前記エッジとの間に形成される、請求項1乃至9のいずれか一項に記載の方法。
- 前記2部グラフのトラバースは、頂点又はエッジラベルと前記ハイパーエッジ表現のエッジとの間で交互に現れるシーケンスを生成する、請求項1乃至10のいずれか一項に記載の方法。
- 前記特徴行列は、シーケンスの中の2つのエンティティの間の前記シーケンス内の距離を考慮して共起スコアを生成し、共起スコアを各シーケンスの前記特徴行列に加算することにより入力される、請求項1乃至11のいずれか一項に記載の方法。
- シーケンス内の最後ではない各点で開始するコンテキストウインドウを用いて、コンテキストシーケンスを与えるステップ、を更に含み、
各開始点と前記コンテキストシーケンス内の後のエンティティとの間の前記共起スコアは、前記コンテキストシーケンス内の前記エンティティ間の距離を考慮して計算され、前記特徴行列に追加される、請求項12に記載の方法。 - 前記生体エンティティの前記特性は、例えばコサイン類似性を用いて、2以上の生体エンティティの類似性を計算することにより推測される、請求項1乃至13のいずれか一項に記載の方法。
- コンピュータ機器上で実行すると、該コンピュータ機器に請求項1乃至14のいずれか一項に記載の方法を実行させるコンピュータプログラム。
- タンパク質の特性を推測する機器であって、メモリとプロセッサとを含み、
前記プロセッサは、2部変換器と、グラフサンプラと、分布解析器と、を提供し、
前記2部変換器は、頂点及びエッジの形式の、異なるアリティを有する、タンパク質に関連する2以上の知識グラフを受信し、前記知識グラフのうちの少なくとも1つは有向であり、前記知識グラフのうちの少なくとも1つはラベル付きであり、
前記知識グラフの各々を、ユニークなエッジ識別子のリストとして、ハイパーエッジ表現に変換し、前記ユニークなエッジ識別子の各々はソース及びターゲット頂点を有し、頂点は前記エッジにより無方向接続され、ラベルは前記エッジに関連付けられ、
前記ハイパーエッジ表現を、2部グラフに変換するステップであって、前記2部グラフは一方のセットの中に前記頂点及びラベルを有し、他方のセットの中に前記エッジを有し、前記頂点及びラベルは前記ハイパーエッジ表現のとおりに補助エッジAにより前記エッジにリンクされ、
前記グラフサンプラは、前記2部グラフをサンプリングし、
前記分布解析器は、
前記2部グラフを、前記頂点、ラベル、及びエッジの特徴行列の中の行列エントリとして埋め込み、
前記特徴行列をメモリに格納し、
前記特徴行列を用いて、前記行列エントリに基づき結合知識グラフの中のタンパク質の特性を推測する、機器。
Applications Claiming Priority (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
EP18201367.2 | 2018-10-18 | ||
EP18201367.2A EP3640864A1 (en) | 2018-10-18 | 2018-10-18 | A computer-implemented method and apparatus for inferring a property of a biomedical entity |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2020064626A true JP2020064626A (ja) | 2020-04-23 |
JP7400319B2 JP7400319B2 (ja) | 2023-12-19 |
Family
ID=63914945
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2019186293A Active JP7400319B2 (ja) | 2018-10-18 | 2019-10-09 | 生体エンティティの特性を推測するコンピュータにより実施される方法及び機器 |
Country Status (2)
Country | Link |
---|---|
EP (1) | EP3640864A1 (ja) |
JP (1) | JP7400319B2 (ja) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2021201177A1 (ja) | 2020-03-31 | 2021-10-07 | 株式会社日本触媒 | 粒子状吸水剤 |
Families Citing this family (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN112002378B (zh) * | 2020-10-29 | 2021-02-23 | 武汉金开瑞生物工程有限公司 | 基于几何图神经网络的蛋白质信号肽的预测方法及装置 |
CN113220895B (zh) * | 2021-04-23 | 2024-02-02 | 北京大数医达科技有限公司 | 基于强化学习的信息处理方法、装置、终端设备 |
CN113987105B (zh) * | 2021-10-28 | 2024-06-14 | 南开大学 | 基于滑动窗口的标签感知图形流草图构建方法及应用 |
CN114091614A (zh) * | 2021-11-26 | 2022-02-25 | ***股份有限公司 | 一种实体标签关联预测方法、装置及计算机可读存储介质 |
CN117314266B (zh) * | 2023-11-30 | 2024-02-06 | 贵州大学 | 一种基于超图注意力机制的新型科技人才智能评价方法 |
Family Cites Families (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US7460960B2 (en) | 2002-05-10 | 2008-12-02 | Epitome Biosystems, Inc. | Proteome epitope tags and methods of use thereof in protein modification analysis |
JP2009168695A (ja) | 2008-01-18 | 2009-07-30 | Hitachi High-Technologies Corp | 立体構造予測方法,立体構造予測プログラム及び質量分析装置 |
US20140207385A1 (en) | 2011-08-26 | 2014-07-24 | Philip Morris Products Sa | Systems and methods for characterizing topological network perturbations |
WO2015048572A1 (en) | 2013-09-27 | 2015-04-02 | Codexis, Inc. | Automated screening of enzyme variants |
GB2537925A (en) * | 2015-04-30 | 2016-11-02 | Fujitsu Ltd | A similarity-computation apparatus, a side effect determining apparatus and a system for calculating similarities between drugs and using the similarities |
US9436760B1 (en) * | 2016-02-05 | 2016-09-06 | Quid, Inc. | Measuring accuracy of semantic graphs with exogenous datasets |
EP3404567A1 (en) | 2017-05-19 | 2018-11-21 | Fujitsu Limited | A system and a method for discovery of predicted site-specific protein phosphorylation candidates |
-
2018
- 2018-10-18 EP EP18201367.2A patent/EP3640864A1/en not_active Ceased
-
2019
- 2019-10-09 JP JP2019186293A patent/JP7400319B2/ja active Active
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2021201177A1 (ja) | 2020-03-31 | 2021-10-07 | 株式会社日本触媒 | 粒子状吸水剤 |
Also Published As
Publication number | Publication date |
---|---|
EP3640864A1 (en) | 2020-04-22 |
JP7400319B2 (ja) | 2023-12-19 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP7400319B2 (ja) | 生体エンティティの特性を推測するコンピュータにより実施される方法及び機器 | |
Castelli et al. | A C++ framework for geometric semantic genetic programming | |
Matsen et al. | A format for phylogenetic placements | |
US8775358B2 (en) | Method and apparatus for performing probabilistic inference and providing related solution methods | |
Abseher et al. | htd–a free, open-source framework for (customized) tree decompositions and beyond | |
Stålring et al. | AZOrange-High performance open source machine learning for QSAR modeling in a graphical programming environment | |
JP2019028879A (ja) | 結合性予測方法、装置、プログラム、記録媒体、および機械学習アルゴリズムの製造方法 | |
Erdem et al. | Generating explanations for biomedical queries | |
Basu et al. | Towards making autotuning mainstream | |
Gancheva | SOA based multi-agent approach for biological data searching and integration | |
Trinh et al. | Minimal trap spaces of logical models are maximal siphons of their petri net encoding | |
Khalilian et al. | CGenProg: Adaptation of cartesian genetic programming with migration and opposite guesses for automatic repair of software regression faults | |
Sarkar et al. | QiBAM: approximate sub-string index search on quantum accelerators applied to DNA read alignment | |
Acer et al. | EXAGRAPH: Graph and combinatorial methods for enabling exascale applications | |
Gil et al. | Expressive reusable workflow templates | |
Abeysinghe et al. | Rhyme: a data-centric expressive query language for nested data structures | |
Dal Palù et al. | Prolog meets biology | |
Hidders et al. | Petri net+ nested relational calculus= dataflow | |
Gevezes et al. | The shortest superstring problem | |
Losko et al. | Semantic data integration and knowledge management to represent biological network associations | |
Losko et al. | Semantic data integration and knowledge management to represent biological network associations | |
Zaharias et al. | The maximum weight trace alignment merging problem | |
Binatlı et al. | MOKPE: drug–target interaction prediction via manifold optimization based kernel preserving embedding | |
Prasanna et al. | Scalable Knowledge Graph Construction and Inference on Human Genome Variants | |
Holbrook et al. | Computational Statistics and Data Science in the Twenty-first Century |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20220609 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20230905 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20231025 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20231107 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20231120 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 7400319 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |