JP6908111B2 - 予測装置、予測方法、予測プログラム、及び、遺伝子推定装置 - Google Patents

予測装置、予測方法、予測プログラム、及び、遺伝子推定装置 Download PDF

Info

Publication number
JP6908111B2
JP6908111B2 JP2019526116A JP2019526116A JP6908111B2 JP 6908111 B2 JP6908111 B2 JP 6908111B2 JP 2019526116 A JP2019526116 A JP 2019526116A JP 2019526116 A JP2019526116 A JP 2019526116A JP 6908111 B2 JP6908111 B2 JP 6908111B2
Authority
JP
Japan
Prior art keywords
information
model
sequence
observation
gene
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2019526116A
Other languages
English (en)
Other versions
JPWO2019003441A1 (ja
Inventor
峰斗 佐藤
峰斗 佐藤
壮一郎 荒木
壮一郎 荒木
藤山 健一郎
健一郎 藤山
哲理 有山
哲理 有山
たん 東
たん 東
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
NEC Corp
Original Assignee
NEC Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by NEC Corp filed Critical NEC Corp
Publication of JPWO2019003441A1 publication Critical patent/JPWO2019003441A1/ja
Application granted granted Critical
Publication of JP6908111B2 publication Critical patent/JP6908111B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B20/00ICT specially adapted for functional genomics or proteomics, e.g. genotype-phenotype associations
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B30/00ICT specially adapted for sequence analysis involving nucleotides or amino acids

Landscapes

  • Life Sciences & Earth Sciences (AREA)
  • Physics & Mathematics (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Health & Medical Sciences (AREA)
  • Engineering & Computer Science (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • Medical Informatics (AREA)
  • Biophysics (AREA)
  • Theoretical Computer Science (AREA)
  • Spectroscopy & Molecular Physics (AREA)
  • Chemical & Material Sciences (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Biotechnology (AREA)
  • Evolutionary Biology (AREA)
  • General Health & Medical Sciences (AREA)
  • Analytical Chemistry (AREA)
  • Molecular Biology (AREA)
  • Genetics & Genomics (AREA)
  • Apparatus Associated With Microorganisms And Enzymes (AREA)
  • Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Description

本発明は、解析対象に生じる事象に関して予測する予測装置等に関する。
特許文献1には、実世界で起きている現象を、コンピュータを用いて数値的にシミュレーションするシミュレーション装置が開示されている。該シミュレーション装置は、解析対象に関する状態を表すモデル情報に基づき該解析対象に関する状態を予測し、予測した状態と、該解析対象に関して観測された観測情報とに基づき該モデルを更新する。
特許文献2には、農作物に関する変数の値等を予測する方法が開示されている。
国際公開第2016/194379号 国際公開第2001/18177号
しかし、特許文献1乃至特許文献2に開示されたいずれの装置を用いたとしても、必ずしも、予測結果が正しいとは限らない。この理由は、解析対象の状態等をシミュレーションする基であるモデル情報が必ずしも正確であるとは限らないからである。すなわち、該モデル情報が誤差を含んでいることが多いので、必ずしも、該モデル情報に基づくシミュレーションの結果は、正確であるとは限らない。
そこで、本発明の目的の1つは、解析対象をより正確にシミュレーションすることが可能な予測装置等を提供することである。
本発明の1つの態様として、予測装置は、
解析対象となりうる生体が有する遺伝子配列を表す配列情報と、該遺伝子配列によって発現しうる機能を表す機能情報との関連性を表す第1モデル情報に基づき、解析対象が有する遺伝子配列についての前記機能情報を作成する第1モデル処理手段と、
前記生体に関する前記機能情報、前記生体の周囲の環境を表す環境情報、及び、前記生体に関して観測される観測情報の間における関連性を表す第2モデル情報と、前記第1モデル処理手段によって前記解析対象に関する前記遺伝子配列について作成された前記機能情報とに基づき、前記解析対象について予測された前記観測情報を表す予測情報を作成する第2モデル処理手段と
を備える。
また、本発明の他の態様として、予測方法は、
情報処理装置によって、解析対象となりうる生体が有する遺伝子配列を表す配列情報と、該遺伝子配列によって発現しうる機能を表す機能情報との関連性を表す第1モデル情報に基づき、解析対象が有する遺伝子配列についての前記機能情報を作成し、前記生体に関する前記機能情報、前記生体の周囲の環境を表す環境情報、及び、前記生体に関して観測される観測情報の間における関連性を表す第2モデル情報と、前記解析対象に関する前記遺伝子配列について作成された前記機能情報とに基づき、前記解析対象について予測された前記観測情報を表す予測情報を作成する。
また、本発明の他の態様として、予測プログラムは、
解析対象となりうる生体が有する遺伝子配列を表す配列情報と、該遺伝子配列によって発現しうる機能を表す機能情報との関連性を表す第1モデル情報に基づき、解析対象が有する遺伝子配列についての前記機能情報を作成する第1モデル処理機能と、
前記生体に関する前記機能情報、前記生体の周囲の環境を表す環境情報、及び、前記生体に関して観測される観測情報の間における関連性を表す第2モデル情報と、前記第1モデル処理機能によって前記解析対象に関する前記遺伝子配列について作成された前記機能情報とに基づき、前記解析対象について予測された前記観測情報を表す予測情報を作成する第2モデル処理機能と
をコンピュータに実現させる。
さらに、同目的は、係るプログラムを記録するコンピュータが読み取り可能な記録媒体によっても実現される。
本発明に係る予測装置等によれば、解析対象をより正確にシミュレーションすることができる。
本発明の第1の実施形態に係る予測装置が有する構成を示すブロック図である。 第1の実施形態に係る予測装置における処理の流れを示すフローチャートである。 本発明の第1の実施形態に係る遺伝子推定装置が有する構成を示すブロック図である。 本発明の第2の実施形態に係る予測装置が有する構成を示すブロック図である。 第2の実施形態に係る予測装置における処理の流れを示すフローチャートである。 本発明の各実施形態に係る予測装置、または、係る遺伝子推定装置を実現可能な計算処理装置のハードウェア構成例を概略的に示すブロック図である。
まず、本発明の理解を容易にするため、本発明が解決しようとする課題を詳細に説明する。
解析対象に対する入力である入力情報と、該解析対象が出力する出力情報との間の関連性を表すモデル情報に基づき、該解析対象に関する数値シミュレーションが実行される。該モデル情報は、たとえば、該入力情報と、該出力情報との間に物理的に成り立つ関連性が、偏微分方程式を用いて表された情報である。情報処理装置を用いてシミュレーションする場合には、当該偏微分方程式が離散化されることによって連立一次方程式が作成され、該連立一次方程式の解を算出することによって、該解析対象の状態が算出される。
しかし、一般に、解析対象に生じる事象(たとえば、動き、状態の変化)を、モデル情報を用いて表す場合に誤差が生じ、生じた誤差によってシミュレーションした結果が実際に観測される観測情報から乖離してしまうことがある。たとえば、解析対象が植物等の生体である場合に、解析対象に関して実際に観測される観測情報と、該観測情報に関する予測結果を表す予測情報(すなわち、観測情報について予測された結果を表す情報)との間に乖離が生じてしまう。
本願発明者は、解析対象が植物等の生体である場合に、該解析対象に関して観測された観測情報(事象)と、シミュレーションによって予測された事象との間に乖離が生じやすいことを見出した。さらに、本願発明者は、このような乖離が生じる要因の1つが同種の生体が解析対象であったとしても、個々の解析対象が有している遺伝子配列が異なっているにも関わらず、シミュレーションにおいては、そのような遺伝子配列の違いがモデル情報において表現されていないことであることを見出した。また、本願発明者は、異なる生体が同じ遺伝子配列を有している場合であっても該生体が生育される環境に応じて生育状態が異なる状況が生じているものの、モデル情報においては当該状況が表現されていないという課題を見出した。本願発明者は、このような状況に課題を見出すとともに、係る課題を解決する手段を導出するに至った。
次に、本発明の各実施形態にて用いる用語について説明する。
パラメタは、記憶装置(記憶部)における、ある記憶領域を表すとする。パラメタに値を設定する処理は、該パラメタが表す記憶領域にデータを格納する処理を表す。また、変数(パラメタ)に関する値を、「変数(パラメタ)の値」、または、「変数(パラメタ)値」とも表す。パラメタの値は、該パラメタが表す記憶領域に格納されている値を表す。説明の便宜上、パラメタの値Aを、単に、「パラメタA」と表すこともある。
また、確率変数(random variables)Sの値(value)がCである場合に、確率変数TがDである条件付き確率(conditional probability)Pを式Aに示すように表す、
P(T=D|S=C)・・・(式A)。
また、誤解を生じない限り、確率変数の値を、該確率変数の添え字を用いて表すこととする。この場合には、式Aを、式Bに示すように表すことができる、
P(T=TD|S=SC)・・・(式B)。
さらに、説明の便宜上、誤解を生じない限り、確率変数S、及び、確率変数Tを省略して表すこととする。この場合には、式Bを、式Cに示すように表すことができる、
P(TD|SC)・・・(式C)。
以降においては、シミュレーション対象を「解析対象」と表す。センサ等を用いて、解析対象に関して観測される情報を「観測情報」と表す。解析対象をシミュレーションすることによって予測された情報を「予測情報」と表す。また、植物等の解析対象を遺伝子配列に基づき識別する場合には、各解析対象を「個体」と表す。
以降、上述したような課題を解決可能な、本発明を実施する実施形態について、図面を参照しながら詳細に説明する。
<第1の実施形態>
図1を参照しながら、本発明の第1の実施形態に係る予測装置101が有する構成について詳細に説明する。図1は、本発明の第1の実施形態に係る予測装置101が有する構成を示すブロック図である。
第1の実施形態に係る予測装置101は、遺伝子モデル処理部102と、作物モデル処理部103と、更新部104とを有する。予測装置101は、さらに、遺伝子モデル情報記憶部105と、作物モデル情報記憶部106と、機能情報記憶部107と、観測情報記憶部108と、環境情報記憶部109と、基準情報記憶部110と、関連性情報記憶部111とを有していてもよい。
以降の説明においては、説明の便宜上、解析対象は、圃場にて生育されている植物(作物)であるとする。しかし、解析対象は、植物に限定されず、生体であればよい。同様に、説明の便宜上、作物モデル情報、作物モデル処理部103、及び、作物モデル情報記憶部106を用いて説明するが、予測装置101の処理対象は、作物モデル情報に限定されない。以降の説明においては、より一般化された作物モデル情報を、「第2モデル情報」と表すこともある。同様に、作物モデル処理部を、「第2モデル処理部」と表すこともある。作物モデル情報記憶部を、「第2モデル情報記憶部」と表すこともある。
環境情報記憶部109には、植物周囲の環境に関する環境情報が格納されている。該環境情報は、たとえば、圃場における降水量、該圃場における土壌に含まれている水分量、土壌に含まれている窒素量、圃場における気温、圃場における日照時間を表す情報である。環境情報は、たとえば、圃場にて実施された灌漑量を表す情報であってもよい。環境情報は、上述した例と異なる情報が含まれていてもよい。環境情報は、個体周囲の環境に関する環境情報であってもよい。
観測情報記憶部108には、植物に関して観測された観測情報Yが格納されている。観測情報は、たとえば、植物に関する葉面積指標、該植物の大きさ、葉の枚数、葉の大きさ、作物の大きさである。観測情報は、個体に関して観測された観測情報であってもよい。観測情報は、センサ等を用いて取得された情報であってもよいし、観測された情報に基づき算出された情報であってもよい。観測情報は、上述した例に限定されない。
機能情報記憶部107には、植物(または、個体)が有している遺伝子配列によって発現しうる機能、または、該機能が発現することによって生じる事象を表す機能情報Ccropが格納されている。すなわち、機能情報Ccropは、遺伝子配列によって発現しうる機能に関する情報である。機能情報Ccropは、当該遺伝子配列を表す配列情報と、該機能(または、該事象)を表す情報とが関連付けされた情報であってもよい。機能情報Ccropは、当該配列情報と、該機能(または、該事象)を表す情報と、該機能(または、該事象)が生じた場合における該植物(または、個体)に関する環境情報とが関連付けされた情報であってもよい。
機能情報Ccropは、該機能自体を表す情報であってもよいし、該機能によって生じる事象を表す情報であってもよい。機能情報Ccropは、たとえば、個体がある遺伝子配列を有している場合に、土壌に根を広く張る状態(たとえば、根が広がっている範囲の体積)を表す情報であってもよいし、根を張ることに起因して生じる事象(たとえば、水の吸収速度)を表す情報であってもよい。機能情報Ccropは、植物の大きさ、作物ができるまでの期間、作物の色、作物の大きさ等を表す情報であってもよい。機能情報Ccropは、該機能を発現した植物が、植物周囲の環境に応じて実現する状態を表す情報であってもよい。たとえば、根が広く張っている植物が生育されている土壌に、ある降水量の雨が降った場合に、機能情報Ccropは、該植物が根から吸収する水分量を表す情報であってもよい。この場合に、遺伝子モデル情報は、植物に関する配列情報xgene、及び、該植物周囲の環境に関する環境情報と、該機能情報Ccropとの関連性を表す情報である。機能情報Ccropは、一般的な核酸配列データベースに登録されている情報であってもよいし、遺伝子配列を有している個体を観測することによって得られた情報であってもよい。機能情報Ccropは、必ずしも、1つの情報だけでなく、複数の情報を含んでいてもよい。遺伝子モデル情報、及び、機能情報Ccropは、上述した例に限定されない。
遺伝子モデル情報記憶部105には、植物が有している遺伝子配列を表す配列情報xgeneと、該機能情報Ccropとの関連性を表す遺伝子モデル情報(以降、「第1モデル情報」とも表す)が格納されている。遺伝子モデル情報は、植物に関する配列情報xgeneと、該植物周囲の環境を表す環境情報と、該植物に関する機能情報Ccropとの関連性を表す情報であってもよい。遺伝子モデル情報は、さらに、該植物を表す植物識別子(以降、識別子を「ID」と表す)が関連付けされている情報であってもよい。たとえば、ある個体が有している遺伝子配列と、該個体周囲の環境を表す環境情報とに、当該遺伝子モデル情報を適用することによって、該ある植物に関する機能情報を求めることができる。
以降の説明においては、説明の便宜上、遺伝子モデル情報に入力される環境情報を、「第1環境情報θenv」と表す。
具体例を参照しながら、遺伝子モデル情報について説明する。
説明の便宜上、配列情報xgeneが根の張り具合に影響を与える遺伝子配列を表すとする。圃場にて生育されている個体が根を多く張る遺伝子配列を有している場合に、該個体は、成長するにつれて、該遺伝子配列を有していない個体よりも多くの根を土壌に張る。ここで、圃場にて少雨な状況が生じているとする。根を多く張る遺伝子配列を有している個体は、少雨であっても、十分な水分を吸収することができるので大きく成長する。これに対して、根を多く張る遺伝子配列を有していない個体は、少雨の場合に、十分な水分を吸収することができないので、大きく成長することができない。この場合に、機能情報Ccropは、たとえば、該個体の吸水能力を表す情報である。機能情報Ccropは、該個体の耐ストレス性等を表す情報であってもよい。第1環境情報θenvは、圃場における降水量である。個体の大きさ(機能情報Ccropの一例)は、該個体が有している配列情報xgeneによって発現する機能、及び、該個体周囲の環境に関する第1環境情報θenv等に応じて決定される。
作物モデル情報記憶部106には、植物に関する機能情報Ccrop、及び、該植物周囲の環境に関する環境情報と、該植物(または、個体)に関して実際に観測される観測情報Y(または、該観測情報に関する予測情報)との関連性を表す作物モデル情報(「第2モデル情報」の一例)が格納されている。以降、説明の便宜上、作物モデル情報を説明する場合に、観測情報、及び、予測情報を総称して観測情報と表す。
以降の説明においては、説明の便宜上、作物モデル情報に入力される環境情報を、「第2環境情報θ2env」と表す。また、第2環境情報θ2env、及び、第1環境情報θenvを総称して「環境情報」と表す。
第2環境情報θ2envは、第1環境情報θenvと同種の情報であってもよいし、異なる種類の情報であってもよい。具体例を参照しながら、作物モデル情報について説明する。
説明の便宜上、植物に関する機能情報Ccropは、該植物の吸水能力を表す情報であるとする。また、観測情報Yは、当該植物に関する正規化差植生指数(NDVI:Normalized Difference Vegetation Index)であるとする。
植生指数は、たとえば、人工衛星、ドローン等の飛行体から、圃場を見込む画角にて撮像された画像に基づき算出することができる。たとえば、係る飛行体が有するカメラは、該飛行体が圃場の上空を飛行中に、このような画像を撮影する。たとえば、該植生指数は、圃場付近について観測された可視域赤の反射率Rと、近赤外域の反射率IRとに基づき、式1に示す処理に従い算出される。
NDVI=(IR−R)÷(IR+R)・・・(式1)、
ただし、NDVIは、正の大きな値であるほど植生が濃いことを表す。
植物は、たとえば、春に発芽してから成長するとともに、より多くの葉を茂らせる。夏になると植物の成長が止まり、花が咲く結果、植生指数(式1に例示)は、低下していく。やがて、果実(すなわち、作物)が実り始め、秋になると葉の色が変わる(または、落葉し始める)。すると、植生指数(式1に例示)が低下する程度は急になる。この例において、第2環境情報θ2envは、圃場における日照時間、該圃場周囲の気温等の情報である。したがって、この例において、作物モデル情報は、日照時間、圃場周囲の気温、及び、植物の吸水能力(機能情報Ccropの一例)と、該植物に関する植生指数(観測情報Yの一例)との関連性を表すモデルである。
関連性情報記憶部111には、配列情報xgeneと、該配列情報xgeneが表す遺伝子配列を有している個体に関して観測された観測情報Yとが関連付けされた関連性情報が格納されている。関連性情報は、配列情報xgeneと、該配列情報xgeneが表す遺伝子配列を有している個体に関する観測情報Yが予測された予測情報とが関連付けされた情報であってもよい。または、関連性情報は、個体に関して観測された観測情報Yと、該個体について推定された遺伝子配列を表す配列情報xgeneとが関連付けされた情報であってもよい。以降の説明において関連性情報を説明する場合に、観測情報、及び、予測情報を総称して観測情報と表す。関連性情報は、上述した例に限定されない。
基準情報記憶部110には、関連性情報記憶部111に格納されている関連性情報のうち、特定の関連性情報を選択する場合の基である選択基準を表す基準情報が格納されている。該基準情報は、たとえば、観測情報Yからのずれの範囲が狭い等の安定性に関する基準、観測情報Yと、予測情報との乖離が小さい等の耐性(トレランス)に関する基準、あるいは、観測情報Yの範囲が基準の範囲内であるという基準等である。基準情報は、たとえば、観測された観測情報Yとの類似度が所定の条件を満たしているという基準である。この場合に、該基準情報は、観測された観測情報Yに類似している観測情報を選択する基準である。
次に、図2を参照しながら、本発明の第1の実施形態に係る予測装置101における処理について詳細に説明する。図2は、第1の実施形態に係る予測装置101における処理の流れを示すフローチャートである。
遺伝子モデル処理部102は、解析対象である植物を表す植物IDを受け取る。
次に、遺伝子モデル処理部102は、遺伝子モデル情報記憶部105に、植物IDが表す植物に関する遺伝子モデル情報が格納されているか否かを判定する(ステップS101)。遺伝子モデル情報は、植物の個体が有している遺伝子配列を表す配列情報xgeneと、該個体周囲の環境を表す第1環境情報θenvと、該個体に関する機能情報Ccropとの間の関連性を表す情報である。
該植物IDが表す植物に関する遺伝子モデル情報が遺伝子モデル情報記憶部105に格納されていない場合に(ステップS101にてNO)、遺伝子モデル処理部102は、配列情報、環境情報、及び、機能(または、該事象)に関する情報が関連付けされた機能情報Ccropを機能情報記憶部107から読み取る(ステップS102)。遺伝子モデル処理部102は、読み取った機能情報Ccropに基づき、遺伝子モデル情報を作成する(ステップS103)。遺伝子モデル処理部102が遺伝子モデル情報を作成する処理は、たとえば、既知の配列情報xgeneと、既知の機能情報Ccropと間に成り立つ関連性を統計的に求める処理、または、後述する式2(または、式3)に含まれているパラメタの値を、既知の配列情報xgeneと、既知の機能情報Ccropとに基づき決定する処理である。遺伝子モデル情報を作成する処理は、上述した例に限定されない。
該植物IDが表す植物に関する遺伝子モデル情報が遺伝子モデル情報記憶部105に格納されている場合に(ステップS101にてYES)、遺伝子モデル処理部102は、該遺伝子モデル情報を、遺伝子モデル情報記憶部105から読み取る。
遺伝子モデル処理部102は、植物が有している遺伝子配列を表す配列情報xgeneと、該植物の周囲の環境に関する第1環境情報θenvとを外部から受け取る。遺伝子モデル処理部102は、該配列情報xgeneと、該周囲の環境に関する第1環境情報θenvとに対して、該遺伝子モデル情報fgp(式2)に例示される所定の処理を適用することによって、該植物に関する機能情報Ccropを作成する(ステップS104)。
crop=fgp(xgene,θenv)・・・(式2)。
所定の処理は、たとえば、教師付き学習法に従い作成されたモデル情報を用いて、ある説明変数に対する目的変数を予測する処理である。この場合に、説明変数は、植物に関する配列情報xgeneと、該植物の周囲の環境に関する第1環境情報θenvとである。目的変数は、該植物に関する機能情報Ccropである。遺伝子モデル処理部102は、該植物に関する配列情報と、環境情報と、機能情報とを、訓練データとして作成された遺伝子モデル情報を用いて、受け取った第1環境情報θenvと、該配列情報xgeneとに対する機能情報Ccropを作成する。
所定の処理は、教師付き学習法に限定されず、半教師付き学習法、ベイズ推定等の統計的な手法、または、式4乃至式7を参照しながら後述するようなモデル情報に基づくシミュレーション手法であってもよい。また、遺伝子モデル情報は、上述した関連性がモデル情報を用いて表現された場合に生じる誤差を表す情報(式3におけるパラメタη)を含んでいてもよい。また、遺伝子モデル情報は、上述したパラメタ(配列情報xgene等)と異なるパラメタを含んでいてもよい。所定の処理は、上述した例に限定されない。
また、遺伝子モデル情報fgpは、式3に例示されるように、パラメタηを含むモデル情報であってもよい。
crop=fgp(xgene,θenv,η)・・・(式3)。
ただし、パラメタηは、植物等の解析対象に生じる事象に対する影響を表す情報である。言い換えると、パラメタηは、遺伝子モデル情報(式2に例示)を表現した場合における補正量を表すパラメタである。配列情報xgeneは、必ずしも、植物が有している遺伝子配列を表していなくともよく、遺伝子配列に関する推定情報であってもよい。該推定情報は、遺伝子配列に関する推定情報である。また、第1環境情報θenvは、環境情報を表す。パラメタηは、たとえば、観測情報Yに基づき、作物モデル情報(式4、または、式6を参照しながら後述する)に従い算出される機能情報と、遺伝子モデル情報(式2または式3に例示)に従い算出される機能情報との差異を表す。配列情報xgene、及び、第1環境情報θenvは、ある確率分布に従い当該情報が決定されるとも考えることができる。したがって、パラメタη(すなわち、補正を表すパラメタ)は、確率的にその情報が決定され、当該情報を、確率を用いて表すこともできる。
遺伝子モデル処理部102は、ステップS104にて作成した機能情報Ccropを、機能情報記憶部107に格納してもよい。遺伝子モデル処理部102は、作成した機能情報Ccropを作物モデル処理部103に入力する。
作物モデル処理部103は、遺伝子モデル処理部102から該機能情報Ccropを受け取る。作物モデル処理部103は、植物IDを外部装置、または、遺伝子モデル処理部102から受け取る。作物モデル処理部103は、該植物IDが表す植物の周囲の環境に関する第2環境情報θ2envを、土壌センサ、水分センサ等の外部装置から受け取る。作物モデル処理部103は、該植物IDが表す植物に関する作物モデル情報を作物モデル情報記憶部106から読み取る。作物モデル処理部103は、受け取った該機能情報Ccrop、及び、第2環境情報θ2envに対して、作物モデル情報ggrowthが表す処理(式4に例示)を適用する。この処理によって、作物モデル処理部103は、あるタイミングtにおける作物の状態を表す状態情報xphenoを算出し、算出した状態情報xphenoに基づき、該あるタイミングtにおける観測情報Yを予測する(すなわち、予測情報を作成する)(ステップS105)。
pheno =ggrowth(xpheno t−1,Ccrop,θ2env)・・・(式4)。
=h(xpheno )・・・(式5)。
式4に例示されているように、作物モデル情報ggrowthは、複数のタイミングにおける状態情報xphenoが、機能情報Ccrop、及び、第2環境情報θ2envを用いて関連付けされた情報である。式4に例示された例においては、タイミングtにおける状態情報xpheno と、タイミング(t−1)における状態情報xpheno t−1とが関連付けされている。たとえば、式4に示された処理に従えば、タイミング(t−1)における状態情報xpheno t−1と、第2環境情報θ2envと、機能情報Ccropとに基づき、タイミングtにおける状態情報xpheno を予測することができる。
式5に示されているように、観測モデル情報hは、あるタイミングtにおける状態情報xpheno と、該あるタイミングにおける観測情報Yとの間の関連性を表す情報である。たとえば、式5に例示された観測モデル情報hは、タイミングtにおける状態情報xpheno と、タイミングtにおける観測情報Yとの間の関連性を表す情報である。たとえば、観測モデル情報hは、恒等関数(すなわち、観測情報Yとして状態情報xpheno を算出する関数)を用いて表されるモデル情報であってもよい。この場合に、観測モデル情報hは、「Y=xpheno 」なる関連性を表す情報である。
以降、観測モデル情報hを、「第3モデル情報」とも表す。
状態情報xphenoとして、個体の植生、該個体の重さ、該個体の個数、及び、該個体の成熟度を取得することができる状況であっても、式5に例示される観測モデル情報hは、タイミングtにて観測された観測情報のみが関連付けされた情報であってもよい。たとえば、タイミングtにて個体の植生、及び、個体の個数のみが観測される場合に、式5に例示される観測モデル情報hは、該個体の植生、及び、該個体の個数のみが関連付けされた情報であってもよい。
また、ある生体に関する作物モデル情報が複数の地域(または、地点)に関して異なっている場合に、各作物モデル情報に従い算出される観測情報の平均値(または、重み付け平均値)を算出することによって、観測情報Yが求められてもよい。
式6に示されているように、作物モデル情報ggrowthは、たとえば、状態情報xphenoに関する時間変化(時間発展)における不確実性を表すシステムノイズvを含んでいてもよい。システムノイズvは、タイミングtにおけるシステムノイズを表す。同様に、観測モデル情報hは、式7に示されているように、たとえば、作物モデル情報に関する不確実性を表す観測ノイズwを含んでいてもよい。該不確実性を表す観測ノイズwは、たとえば、土壌センサ、水分センサ等の観測装置によって観測された情報に含まれている差異(または、誤差、ノイズ)、または、該観測モデル情報h自体に含まれている差異(または、誤差、ノイズ)を表す情報である。観測ノイズwは、タイミングtにおける観測ノイズを表す。
pheno =ggrowth(xpheno t−1,Ccrop ,θ2env ,v)・・・(式6)、
=h(xpheno ,w)・・・(式7)。
ただし、システムノイズv、及び、観測ノイズwは、たとえば、平均が0であり、所定の分散を有するガウス分布に従い生じた値であるとする。
以降の説明においては、式6に例示された作物モデル情報ggrowth、及び、式7に例示された観測モデル情報hを総称して、「状態空間モデル」と呼ぶこともある。後述するように、式6、及び、式7に例示された状態空間モデルは、たとえば、タイミングtにおける状態情報xpheno と、観測情報Yとに基づき更新される。
また、式6、及び、式7に例示されているように、各モデル情報における情報、及び、ノイズは、時間に応じて変化する情報であってもよい。具体的には、Ccrop は、タイミングtにおける機能情報Ccropである。θ2env は、タイミングtにおける第2環境情報θ2envである。
式6及び式7に例示されている状態空間モデルを更新する処理手法として、たとえば、データ同化処理に従った処理手法がある。データ同化処理においては、タイミングtに関して、相互に異なる複数のセットに基づき算出される観測情報(すなわち、予測情報)と、実際に観測される観測情報との間の差異が算出される。該セットは、機能情報Ccrop 、及び、第2環境情報θ2env 等の情報を含んでいる。複数のセットが、ある乱数を用いて作成される情報を含んでいる場合には、該差異(すなわち、システムノイズ、及び、観測ノイズ)は、ある確率分布に従い生じているとも考えることができる。以降、1つのセットを「アンサンブル」と表し、相互に異なる複数のセットを「アンサンブル集合」と表すこともある。また、作物モデル情報は、上述したパラメタ(機能情報Ccrop等)と異なるパラメタを含んでいてもよい。
遺伝子モデル情報fgp(式2または式3に例示)、及び、作物モデル情報ggrowth(式4に例示)は、たとえば、解析対象に関する状態と、該解析対象に関して観測された観測情報との関連性を表す偏微分方程式等の情報に基づき作成されてもよい。偏微分方程式は、必ずしも、1つの式でなく、複数の式であってもよい。該偏微分方程式が、たとえば、有限要素法等の離散化手法に従い離散化される。この結果、連立一次方程式が作成される。遺伝子モデル情報fgp(式2または式3に例示)、及び、作物モデル情報ggrowth(式4に例示)は、たとえば、反復法等の求解手順に従い、該連立一次方程式の解を算出する処理手順を概念的に表す。
タイミングtにおける機能情報Ccrop が生じる場合に状態情報xpheno が生じる確率は、式8に示されるように、機能情報Ccrop と第2環境情報θ2env とが生じた場合における予測確率として表すことができる。
p(xpheno |xpheno t−1,Ccrop ,θ2env )・・・(式8)。
式8に示す予測確率の値は、たとえば、機能情報Ccropを式3(または、式2)に示された処理に従い算出し、さらに、算出した機能情報Ccropに対する状態情報xpheno を式6(または、式4)に従い算出する処理を、複数のセットに関して繰り返し実行するアンサンブルシミュレーションに従い求めることができる。
アンサンブルシミュレーションには、たとえば、機能情報Ccropを、正規(ガウス)分布に従って選択し、選択した機能情報Ccropの値に関して、式6(または、式4)に従い状態情報xpheno を予測する(すなわち、該観測情報に関する予測情報を作成する)解析的な手法がある。あるいは、アンサンブルシミュレーションにおいては、式3(または、式2)に例示された処理に従い算出されたCcropを平均として算出し、算出した値に対して式6(または、式4)に従い所定の分散を有する乱数をノイズとして加えることによってアンサンブル(アンサンブルメンバ)が作成される。当該所定の分散を有する複数の乱数に対して、それぞれ、アンサンブル(アンサンブルメンバ)を作成することによって、アンサンブル集合(式9に例示)が作成される。該アンサンブルシミュレーションには、作成されたアンサンブル集合に含まれているアンサンブルメンバに対して、それぞれ、式4(または、式6)に示された処理に従い状態情報xpheno 、及び、該状態情報xpheno に関する観測情報Yに関する予測情報が作成する手法もある。
{xpheno,k t−1、Ccrop,k 、θ2env,k }・・・(式9)、
ただし、k(kは、1≦k≦Nなる自然数を表す)は、1つのアンサンブルメンバを指し示す。Nは、アンサンブル集合に含まれているアンサンブルメンバの個数を表す。たとえば、Ccrop,k は、Ccrop に基づき算出されたアンサンブルに含まれている機能情報を表す。
アンサンブルシミュレーションにおいて、作物モデル処理部103は、状態情報xpheno,k t−1、及び機能情報Ccrop,k 、第2環境情報θ2env,k について、独立(または、並列)に予測情報である作物の状態量xpheno を算出する(したがって、該観測情報Yに関する予測情報を作成する)ことができる。作物モデル処理部103は、たとえば、機能情報Ccrop や、第2環境情報θ2env に関するN個のアンサンブル集合(式9に例示)に含まれている各アンサンブルメンバについて、式7(または、式5)に従い観測情報Yを予測する手法がある。作物モデル処理部103は、異なる第2環境情報θ2env を、たとえば、所定の分散を有するシステムノイズを加える等の処理によって作成することができる。
更新部104は、新たに観測された観測情報があるか否かを判定する(ステップS106)。新たに観測された観測情報がある場合に(ステップS106にてYES)、更新部104は、所定の更新処理(後述する)に従い、該観測情報に基づき、遺伝子モデル情報、及び、作物モデル情報を更新する(ステップS107)。更新部104は、所定の要因推定処理(後述する)に従い、更新した遺伝子モデル情報、及び、作物モデル情報に基づき、該観測情報に適合している配列情報、または、該観測情報に適合している機能情報を推定してもよい。
所定の要因推定処理について詳細に説明する。
式3に示された遺伝子モデル情報が不確実性を含むモデル情報であるので、タイミングtにおける観測情報Yを与えた場合に、機能情報Ccrop である確率は、式10に示されるように、観測情報Yの事後確率として表すことができる。
p(Ccrop |Y)・・・(式10)。
式10に従う処理手順は、式4乃至式7に示されたモデル情報に関する処理において、観測情報Yに基づき、機能情報Ccrop を求める処理手順によって実現することができる。また、更新部104は、異なる第2環境情報θ2env に関しても、たとえば、実際に観測された観測情報Yによって更新する(すなわち、事後分布p(θ2env |Y)を求める)機能を有していてもよい。
配列情報xgeneを推定する所定の要因推定処理には、大別して、順問題的アプローチと、逆問題的アプローチとがある。該順問題的アプローチは、与えられた観測情報Yに近くなる配列情報xgeneを探索する手順であり、たとえば、遺伝的アルゴリズム等の処理手順がある。逆問題的アプローチは、たとえば、配列情報xgeneが出現するパターンを、複数個、予め入力しておき、該パターンのうち、観測情報Y(または、観測情報Yに類似している情報)を与える配列情報xgeneをフィルタリングする手順である。逆問題的アプローチは、たとえば、逐次ベイズフィルタリング、データ同化処理、マルコフ連鎖モンテカルロ法等の所定の処理手順に従い実現することができる。該所定の要因推定処理は、上述した処理手順に限定されない。
次に、所定の更新処理について詳細に説明する。
更新部104は、観測情報Yに基づき求められた各機能情報Ccrop (すなわち、式10に示された事後確率)と、遺伝子モデル情報(式2または式3に例示)に従い算出された機能情報Ccrop との差異を算出する。更新部104は、該差異を用いて、式3に例示された遺伝子モデル情報を更新する。更新部104は、更新後の遺伝子モデル情報(すなわち、植物IDが表す植物に関する情報)と、当該植物IDとが関連付けされた情報を作成し、作成した情報を遺伝子モデル情報記憶部105に格納する。尚、観測情報Yに基づき求められた各機能情報Ccrop に関する事後分布をより確度の高い値とし、遺伝子モデル情報に従い算出された機能情報Ccrop の確からしさを表す尤度を算出して更新に用いてもよい。
更新部104は、作物モデル処理部103によって観測情報Yに関して予測された予測情報に関する状態情報xpheno を受け取る。更新部104は、さらに、植物に関して実際に観測された観測情報Yを受け取る。更新部104は、観測情報Yと観測ノイズwとに基づき、予測情報である作物の状態量xpheno の確からしさを表す尤度を算出し、算出した尤度に基づき、式4(または、式6)に例示されている作物モデル情報ggrowthを更新する。更新部104は、データ同化処理に従い処理を実行する場合に、アンサンブル集合に含まれている各アンサンブルメンバについて誤差を算出し、システムノイズvの下での予測情報である作物の状態量xpheno の確率分布を算出する。更新部104は、観測情報Yに基づき求められた各機能情報Ccropや第2環境情報θ2envの事後分布を含む作物モデル情報を作成することによって、作物モデル情報ggrowthを更新する。もしくは、システムノイズを、たとえば、パラメタρ(ハイパーパラメタ)を用いてv(ρ)と定義し、同様に、観測情報Yに基づき事後分布を求めることができる。これにより、同様に観測情報Yに従うシステムノイズを含む作物モデル情報を作成し、作物モデル情報ggrowthを更新することができる。更新部104は、更新後の作物モデル情報(すなわち、植物IDが表す植物に関する情報)と、当該植物IDとが関連付けされた情報を作成し、作成した情報を作物モデル情報記憶部106に格納する。
更新部104は、上述したような所定の更新処理に従い処理を実行した後に、観測情報Yと一致している(または、類似している)情報を含んでいる関連性情報を特定し、特定した該関連性情報に含まれている配列情報xgeneを提示してもよい。この場合に、更新部104は、個体(または、植物)に関して観測された観測情報Yに基づき、上述したような順問題的アプローチ、または、逆問題的アプローチに従い、該個体が有している遺伝子配列を推定する。更新部104は、推定した該遺伝子配列を表す配列情報xgeneと、該観測情報Yとが関連付けされた関連性情報を作成し、関連性情報記憶部111に格納してもよい。
配列情報xgeneを推定する処理について、後述する式11、及び、式12を参照しながら詳細に説明する。
説明の便宜上、更新部104が算出した配列情報xgene(または、観測情報Y)のタイミングを「t」(tは、自然数)と表す。また、観測情報記憶部108には、該タイミングtより後に観測された観測情報Yt+s(sは、自然数)が、たとえば、リアルタイムに格納されるとする。しかし、必ずしも、観測情報が格納されるタイミングは、リアルタイムでなくともよい。
更新部104は、タイミングtよりも後のタイミング「t+s」(sは、自然数)における観測情報Yt+sと、遺伝子モデル情報(式2または式3に例示)と、作物モデル情報(式4に例示)とに基づき、タイミング「t+s+1」(sは、自然数)における遺伝子配列「xgene t+s+1」の推定値を算出する。この処理について、詳細に説明する。
更新部104は、上述したような順問題的アプローチ、または、逆問題的アプローチと同様な処理を実行することによって、観測情報Yt+sである場合の配列情報xgene(要因情報)を特定する。すなわち、更新部104は、観測情報Yt+sである場合に、配列情報が配列情報xgene t+s+1である確率(式11)を、作物モデル情報と、遺伝子モデル情報とに従い算出する。
p(xgene t+s+1|Yt+s)・・・(式11)。
次に、更新部104は、関連性情報記憶部111から関連性情報を読み取り、基準情報記憶部110から基準情報を読み取る。更新部104は、観測情報Yt+sと、算出した配列情報xgene t+s+1とについて、読み取った該関連性情報のうち、読み取った基準情報が表す選択基準を満たしている関連性情報(または、値)を特定する。説明の便宜上、この処理を「特定処理」と表す。選択基準が、上述したような安定性に関する基準である場合に、更新部104は、たとえば、関連性情報記憶部111に格納されている関連性情報のうち、観測情報Yt+sの範囲が基準の範囲内であるという選択基準を満たしている関連性情報を特定する。
更新部104は、特定した関連性情報に含まれている観測情報(説明の便宜上、該観測情報の集合を「集合Rc」と表す)と、観測情報Yt+sとについて、該特定処理と同様な処理を実行することによって、該関連性情報記憶部111に関する配列情報xgene t+s+1を算出する。この場合に、更新部104は、観測情報Yt+sと、集合Rcが与えられた場合の、配列情報xgene t+s+1の条件付き確率(式12)を算出する。
p(xgene t+s+1|Yt+s、Rc)・・・(式12)。
したがって、更新部104は、上述した特定処理に従い、該基準情報と、該関連性情報とに基づき、配列情報xgene t+s+1として推定される集合Rcを設定する。更新部104は、設定した集合Rcと、モデル情報を用いて算出された推定値とに基づき、観測情報Yt+sに関する配列情報xgene t+s+1を算出する。
式12に示された確率は、たとえば、特定した該関連性情報に含まれている配列情報の出現頻度を解析することによって、算出することができる。あるいは、配列情報と、該配列情報に基づき推定された観測情報とが関連付けされた情報であってもよい。
更新部104は、式12に従い算出した確率のうち、最も大きな値である配列情報を、配列情報xgene t+s+1として推定してもよい。
更新部104は、タイミングtに関する処理にて、観測情報Yに基づき配列情報xgene t+1を推定する。予測装置101は、推定した配列情報xgene t+1に基づき観測情報Yを予測する(すなわち、該観測情報に関する予測情報を作成する)。次に、更新部104は、作成した観測情報Yt+1に基づき、配列情報xgene t+2を推定する。したがって、更新部104は、各タイミングにて受け取った観測情報に基づき、配列情報を推定する。すなわち、更新部104は、解析対象に関する観測情報の履歴に基づき、該解析対象が有している遺伝子配列を推定する。
尚、本発明の各実施形態に示す予測装置は、図3に例示されているように、遺伝子推定装置151に含まれていてもよい。図3は、本発明の第1の実施形態に係る遺伝子推定装置151が有する構成を示すブロック図である。
第1の実施形態に係る遺伝子推定装置151は、予測装置152と、出力部153とを有する。予測装置152は、たとえば、予測装置101(または、図4を参照しながら後述する予測装置201)が有している機能と同様な機能を用いて実現することができる。遺伝子推定装置151は、ドローン154、または、人工衛星155等の飛行体と通信接続されている。図2を参照しながら上述したように、ドローン154、または、人工衛星155等の飛行体は、植物(または、個体)が生育されている圃場を観測しているセンサを有する。ドローン154、または、人工衛星155等の飛行体は、センサ等によって観測された観測情報(または、環境情報)を、通信ネットワークを介して遺伝子推定装置151に送信する。遺伝子推定装置151は、該観測情報(または、該環境情報)を受信し、これらの情報を予測装置152に入力する。予測装置152は、本発明の各実施形態に示す処理を実行することによって、たとえば、植物(または、個体)の遺伝子配列を表す配列情報156を作成する。予測装置152は、作成した配列情報156を、出力部153に入力する。出力部153は、配列情報156(たとえば、式11に例示された確率)を受け取り、該配列情報156のうち、最も確率が大きな配列情報156を出力する。すなわち、出力部153は、配列情報156(たとえば、式11に例示された確率)を受け取り、該配列情報156のうち、少なくとも一部の配列情報156を出力する。したがって、遺伝子推定装置151は、ドローン154、または、人工衛星155等の飛行体が送信した観測情報に基づき、遺伝子配列を推定することができる。
次に、本発明の第1の実施形態に係る予測装置101に関する効果について説明する。
第1の実施形態に係る予測装置101によれば、解析対象をより正確にシミュレーションすることができる。この理由は、植物等の解析対象が有している遺伝子配列について発現する可能性がある事象を表すモデルのパラメタを予測し、予測したパラメタに基づき、該植物に関して生じる事象をシミュレーションするからである。この理由について詳細に説明する。
本実施形態にて課題に関して上述したように、シミュレーションによって予測された事象と、センサ等によって取得された事象との間には誤差が生じる。個体が有している遺伝子配列が当該シミュレーションの基であるモデル情報には表現されていないことが、該誤差の要因の1つであることを、本願発明者は見出した。そこで、本願発明者は、遺伝子配列を表す配列情報xgeneに関係して生じる事象を表す機能情報Ccropをモデル情報に導入し、該機能情報Ccropを介して、配列情報xgeneと観測情報Yとの関連性を表現した。つまり、第1の実施形態に係る予測装置101は、機能情報Ccropを介して、配列情報xgeneと観測情報Yとの関連性を表すモデル情報(式2乃至式7に例示)に従い、観測情報を予測する(すなわち、該観測情報に関する予測情報を作成する)。したがって、予測装置101によって予測情報には、配列情報xgeneが1つの要因として反映されているので、予測装置101によれば、解析対象をより正確にシミュレーションすることができる。
さらに、第1の実施形態に係る予測装置101によれば、生体が有している遺伝子配列によって当該生体に関して観測される観測情報を、短期間に取得することができる。この理由は、解析対象が有している遺伝子配列に基づくシミュレーションを、予測装置101が実行するからである。一般に、解析対象を実際に生育している期間に比べ、当該解析対象に生じる事象に関するシミュレーションに要する期間が短いので、予測装置101によれば、生体が有している遺伝子配列によって当該生体に関して観測される観測情報を、短期間に取得することができる。
さらに、第1の実施形態に係る予測装置101によれば、解析対象に関して実際に観測された事象を表す観測情報Yに基づき、該解析対象が有している遺伝子配列を推定することができる。この理由は、予測装置101が、順問題的アプローチ、または、逆問題的アプローチに従った処理を実行することによって、観測情報Yを生じる要因である遺伝子配列を表す配列情報を特定するからである。
また、環境情報(第1環境情報、または、第2環境情報)があらかじめ得られている場合には、第1の実施形態に係る予測装置101によれば、該環境情報が表す環境における収穫効率を向上することができる。この理由は、予測装置101が植物(または、個体)に関して予測した観測情報(すなわち、予測情報)に基づき、該植物の生育に関する情報を取得することができるからである。すなわち、予測装置101が、植物(または、個体)配列情報と、環境情報とに基づき、該植物(または、該個体)が成長した場合における観測情報を予測するので(すなわち、予測情報を作成する)、利用者は、該予測情報に基づき、該環境情報に適した植物(または、個体)を、該植物を生育する以前に特定することができる。
また、植物(または、個体)に関する配列情報があらかじめ得られていない場合であっても、第1の実施形態に係る予測装置101によれば、環境情報が表す環境にて収穫効率を向上することができる。この理由は、予測装置101が植物(または、個体)に関する予測情報、及び、配列情報に基づき、利用者は、該環境情報が表す環境に適した植物(または、個体)を特定することができる。
<第2の実施形態>
次に、本発明の第2の実施形態について説明する。
図4を参照しながら、本発明の第2の実施形態に係る予測装置201が有する構成について詳細に説明する。図4は、本発明の第2の実施形態に係る予測装置201が有する構成を示すブロック図である。
第2の実施形態に係る予測装置201は、第1モデル処理部202と、第2モデル処理部203とを有する。予測装置201は、さらに、第1モデル情報記憶部204と、第2モデル情報記憶部205とを有していてもよい。
以降の説明においては、説明の便宜上、解析対象は、圃場にて生育されている植物(作物)であるとする。しかし、解析対象は、植物に限定されず、生体であればよい。
第1モデル情報記憶部204には、図1を参照しながら説明したような、遺伝子配列を表す配列情報と、該遺伝子配列によって発現しうる機能に関する機能情報との関連性を表す第1モデル情報(たとえば、「遺伝子モデル情報」)が格納されている。第1モデル情報は、当該遺伝子配列を有している生体の周囲の環境を表す環境情報と、該配列情報と、該機能情報との関連性を表す情報であってもよい。第2モデル情報記憶部205は、図1を参照しながら説明したような、複数のタイミングにおける該生体の状態における関連性が、該機能情報を介して表された第2モデル情報(たとえば、作物モデル情報)が格納されている。
次に、図5を参照しながら、本発明の第2の実施形態に係る予測装置201における処理について詳細に説明する。図5は、第2の実施形態に係る予測装置201における処理の流れを示すフローチャートである。
第1モデル処理部202は、植物(または、個体)等の解析対象が有する遺伝子配列を表す配列情報を受け取る。第1モデル処理部202は、第1モデル情報記憶部204に格納されている第1モデル情報(式2、または、式3に例示)を読み取る。第1モデル処理部202は、受け取った該配列情報に、該第1モデル情報が示す処理を適用することによって、解析対象に関する機能情報を作成する(ステップS201)。第1モデル処理部202は、作成した機能情報を第2モデル処理部203に入力する。ステップS201における処理は、たとえば、図2におけるステップS104を参照しながら説明したような処理と同様な処理である。
次に、第2モデル処理部203は、該機能情報、及び、第1タイミングにおける該解析対象の状態(以降、「第1状態」と表す)を表す情報を受け取る。第2モデル処理部203は、解析対象の周囲の環境に関する環境情報を外部装置から受け取る。第2モデル処理部203は、第2モデル情報記憶部205に格納されている第2モデル情報(たとえば、式4、または、式6に例示された作物モデル情報)を読み取る。第2モデル処理部203は、該機能情報と、該第1情報とに、該第2モデル情報が示す処理を適用することによって、第2タイミングにおける解析対象の状態(以降、「第2状態」と表す)を表す情報を算出する(ステップS202)。ステップS201における処理は、たとえば、図2におけるステップS105を参照しながら説明したような処理と同様な処理である。
第1モデル情報記憶部204は、第1の実施形態に係る遺伝子モデル情報記憶部105(図1)が有している機能と同様な機能を用いて実現することができる。第2モデル情報記憶部205は、第1の実施形態に係る作物モデル情報記憶部106(図1)が有している機能と同様な機能を用いて実現することができる。第1モデル処理部202は、第1の実施形態に係る遺伝子モデル処理部102(図1)が有している機能と同様な機能を用いて実現することができる。第2モデル処理部203は、第1の実施形態に係る作物モデル処理部103(図1)が有している機能と同様な機能を用いて実現することができる。したがって、予測装置201は、第1の実施形態に係る予測装置101(図1)が有している機能と同様な機能を用いて実現することができる。
次に、本発明の第2の実施形態に係る予測装置201に関する効果について説明する。
本実施形態に係る予測装置201によれば、解析対象をより正確にシミュレーションすることができる。この理由は、植物等の解析対象が有している遺伝子配列について発現する可能性がある事象を表すモデル情報に含まれているパラメタを予測し、予測したパラメタに基づき、該植物に関して生じる事象をシミュレーションするからである。この理由について詳細に説明する。
本実施形態にて課題に関して上述したように、本願発明者は、シミュレーションにて生じる誤差の要因の1つが、植物(または、個体)が有している遺伝子配列が当該シミュレーションの基であるモデル情報には表現されていないことを見出した。そこで、本願発明者は、遺伝子配列を表す配列情報xgeneに関係して生じる事象を表す機能情報Ccropをモデル情報に導入し、該機能情報Ccropを介して、配列情報xgeneと状態情報xphenoとの関連性を表現した。つまり、第2の実施形態に係る予測装置201は、機能情報Ccropを介して、配列情報xgeneと状態情報xphenoとの関連性を表すモデル情報等(式2乃至式7に例示)に従い、解析対象に関する第2状態を算出する。したがって、予測装置201によって第2状態には、配列情報xgeneが1つの要因として反映されているので、予測装置201によれば、解析対象をより正確にシミュレーションすることができる。
(ハードウェア構成例)
上述した本発明の各実施形態に係る予測装置、または、遺伝子推定装置を、1つの計算処理装置(情報処理装置、コンピュータ)を用いて実現するハードウェア資源の構成例について説明する。但し、係る予測装置、または、係る遺伝子推定装置は、物理的または機能的に少なくとも2つの計算処理装置を用いて実現されてもよい。また、係る予測装置、または、係る遺伝子推定装置は、専用の装置として実現されてもよい。
図6は、本発明の各実施形態に係る予測装置、または、係る遺伝子推定装置を実現可能な計算処理装置のハードウェア構成例を概略的に示すブロック図である。計算処理装置20は、中央処理演算装置(Central_Processing_Unit、以降「CPU」と表す)21、メモリ22、ディスク23、不揮発性記録媒体24、及び、通信インターフェース(以降、「通信IF」と表す)27を有する。計算処理装置20は、入力装置25、出力装置26に接続可能であってもよい。計算処理装置20は、通信IF27を介して、他の計算処理装置、及び、通信装置と情報を送受信することができる。
不揮発性記録媒体24は、コンピュータが読み取り可能な、たとえば、コンパクトディスク(Compact_Disc)、デジタルバーサタイルディスク(Digital_Versatile_Disc)である。また、不揮発性記録媒体24は、ユニバーサルシリアルバスメモリ(USBメモリ)、ソリッドステートドライブ(Solid_State_Drive)等であってもよい。不揮発性記録媒体24は、電源を供給しなくても係るプログラムを保持し、持ち運びを可能にする。不揮発性記録媒体24は、上述した媒体に限定されない。また、不揮発性記録媒体24の代わりに、通信IF27、及び、通信ネットワークを介して係るプログラムを持ち運びしてもよい。
すなわち、CPU21は、ディスク23に格納されているソフトウェア・プログラム(コンピュータ・プログラム:以下、単に「プログラム」と称する)を、実行する際にメモリ22にコピーし、演算処理を実行する。CPU21は、プログラム実行に必要なデータをメモリ22から読み取る。表示が必要な場合に、CPU21は、出力装置26に出力結果を表示する。外部からプログラムを入力する場合に、CPU21は、入力装置25からプログラムを読み取る。CPU21は、上述した図1、図3、または、図4に示す各部が表す機能(処理)に対応するところのメモリ22にある予測プログラム(図2、または、図5)を解釈し実行する。CPU21は、上述した本発明の各実施形態において説明した処理を順次実行する。
すなわち、このような場合に、本発明の各実施形態は、係る予測プログラムによっても成し得ると捉えることができる。さらに、係る予測プログラムが記録されたコンピュータが読み取り可能な不揮発性の記録媒体によっても、本発明の各実施形態は成し得ると捉えることができる。
以上、上述した実施形態を模範的な例として本発明を説明した。しかし、本発明は、上述した実施形態には限定されない。すなわち、本発明は、本発明のスコープ内において、当業者が理解し得る様々な態様を適用することができる。
101 予測装置
102 遺伝子モデル処理部
103 作物モデル処理部
104 更新部
105 遺伝子モデル情報記憶部
106 作物モデル情報記憶部
107 機能情報記憶部
108 観測情報記憶部
109 環境情報記憶部
110 基準情報記憶部
111 関連性情報記憶部
151 遺伝子推定装置
152 予測装置
153 出力部
154 ドローン
155 人工衛星
156 配列情報
201 予測装置
202 第1モデル処理部
203 第2モデル処理部
204 第1モデル情報記憶部
205 第2モデル情報記憶部
20 計算処理装置
21 CPU
22 メモリ
23 ディスク
24 不揮発性記録媒体
25 入力装置
26 出力装置
27 通信IF

Claims (10)

  1. 解析対象となりうる生体が有する遺伝子配列を表す配列情報と、前記遺伝子配列によって発現しうる機能を表す機能情報との関連性を表す統計的モデルまたは機械学習モデルである第1モデル情報を前記解析対象についての前記配列情報に適用することによって前記解析対象が有する遺伝子配列についての前記機能情報を作成する第1モデル処理手段と、
    前記生体に関する前記機能情報、前記生体の周囲の環境を表す環境情報、及び、前記生体に関して観測される観測情報の間における関連性を表すモデルである第2モデル情報、前記第1モデル処理手段によって前記解析対象に関する前記配列情報について作成された前記機能情報と、前記解析対象についての環境情報とに適用することによって、前記解析対象について予測された前記観測情報を表す予測情報を作成する第2モデル処理手段と
    を備える予測装置。
  2. 更新手段
    をさらに備え、
    前記第2モデル処理手段は、前記生体の状態と、前記生体に関して観測される観測情報との間における関連性を表す第3モデル情報に従い、前記解析対象についての前記観測情報が予測された情報を表す予測情報を作成し、
    前記更新手段は、前記解析対象について観測された観測情報と、前記予測情報との差異に基づき、前記第2モデル情報を更新する
    請求項1に記載の予測装置。
  3. 前記更新手段は、更新した後の前記第2モデル情報を用いて、前記予測情報を作成する場合における前記機能情報を推定し、推定された前記機能情報と、前記第1モデル情報に基づき前記第1モデル処理手段が作成した前記機能情報との差異に基づき、前記第1モデル情報を更新する
    請求項2に記載の予測装置。
  4. 前記更新手段は、前記生体についての前記配列情報と、前記生体に関して観測された観測情報とが関連付けされた関連性情報に基づき、前記解析対象についての前記観測情報に関連付けされた前記配列情報を特定する
    請求項2または請求項3に記載の予測装置。
  5. 前記更新手段は、前記関連性情報のうち、前記解析対象についての前記観測情報との類似度が所定の条件を満たしている関連性情報を特定し、特定した前記関連性情報に含まれている前記配列情報を特定する
    請求項4に記載の予測装置。
  6. 前記更新手段は、前記解析対象について特定した前記配列情報と、前記解析対象についての当該観測情報とが関連付けされた前記関連性情報を作成する
    請求項4または請求項5に記載の予測装置。
  7. 請求項4乃至請求項6のいずれかに記載の予測装置と、
    前記更新手段によって特定された前記配列情報のうち、少なくとも一部の配列情報を出力する出力手段と
    を備える遺伝子推定装置。
  8. 情報処理装置によって、解析対象となりうる生体が有する遺伝子配列を表す配列情報と、前記遺伝子配列によって発現しうる機能を表す機能情報との関連性を表す統計的モデルまたは機械学習モデルである第1モデル情報を前記解析対象についての配列情報に適用することによって前記解析対象が有する遺伝子配列についての前記機能情報を作成し、前記生体に関する前記機能情報、前記生体の周囲の環境を表す環境情報、及び、前記生体に関して観測される観測情報の間における関連性を表すモデルである第2モデル情報、前記解析対象に関する前記配列情報について作成された前記機能情報と、前記解析対象についての環境情報とに適用することによって、前記解析対象について予測された前記観測情報を表す予測情報を作成する予測方法。
  9. 解析対象となりうる生体が有する遺伝子配列を表す配列情報と、前記遺伝子配列によって発現しうる機能を表す機能情報との関連性を表す統計的モデルまたは機械学習モデルである第1モデル情報を前記解析対象についての配列情報に適用することによって前記解析対象が有する遺伝子配列についての前記機能情報を作成する第1モデル処理機能と、
    前記生体に関する前記機能情報、前記生体の周囲の環境を表す環境情報、及び、前記生体に関して観測される観測情報の間における関連性を表すモデルである第2モデル情報、前記第1モデル処理機能によって前記解析対象に関する前記配列情報について作成された前記機能情報と、前記解析対象についての環境情報とに適用することによって、前記解析対象について予測された前記観測情報を表す予測情報を作成する第2モデル処理機能と
    をコンピュータに実現させる予測プログラム。
  10. 更新機能
    をさらにコンピュータに実現させ、
    前記第2モデル処理機能において、前記生体の状態と、前記生体に関して観測される観測情報との間における関連性を表す第3モデル情報に従い、前記解析対象についての前記観測情報が予測された情報を表す予測情報を作成し、
    前記更新機能において、前記解析対象について観測された観測情報と、前記予測情報との差異に基づき、前記第2モデル情報を更新する
    請求項9に記載の予測プログラム
JP2019526116A 2017-06-30 2017-06-30 予測装置、予測方法、予測プログラム、及び、遺伝子推定装置 Active JP6908111B2 (ja)

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
PCT/JP2017/024229 WO2019003441A1 (ja) 2017-06-30 2017-06-30 予測装置、予測方法、予測プログラムが記録された記録媒体、及び、遺伝子推定装置

Publications (2)

Publication Number Publication Date
JPWO2019003441A1 JPWO2019003441A1 (ja) 2020-03-26
JP6908111B2 true JP6908111B2 (ja) 2021-07-21

Family

ID=64741259

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2019526116A Active JP6908111B2 (ja) 2017-06-30 2017-06-30 予測装置、予測方法、予測プログラム、及び、遺伝子推定装置

Country Status (4)

Country Link
US (1) US11557372B2 (ja)
EP (1) EP3648109A4 (ja)
JP (1) JP6908111B2 (ja)
WO (1) WO2019003441A1 (ja)

Families Citing this family (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP6908111B2 (ja) * 2017-06-30 2021-07-21 日本電気株式会社 予測装置、予測方法、予測プログラム、及び、遺伝子推定装置
FR3122044B1 (fr) 2021-04-15 2024-04-12 Schneider Electric Ind Sas Coffret électrique et méthode de fabrication d’un tel coffret électrique
CN116598005B (zh) * 2023-07-17 2023-10-03 中日友好医院(中日友好临床医学研究所) 基于宿主序列信息的下呼吸道感染概率预测***及装置

Family Cites Families (18)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
DE19909146A1 (de) 1999-03-03 2000-09-28 Mohamed A Marahiel Verfahren zur gezielten biologischen Synthese von Peptiden
US7142988B1 (en) 1999-09-07 2006-11-28 Monsanto Company Method and information system for non-random selection of uniform structural and functional features for tissue and plant product processing
ES2331228T3 (es) 2000-02-09 2009-12-28 Basf Se Nuevo gen de elongasa y proceso para la preparacion de acidos grasos poliinsaturados.
WO2004086949A2 (en) * 2003-03-25 2004-10-14 John Wayne Cancer Institute Dna markers for management of cancer
JP2005309877A (ja) 2004-04-22 2005-11-04 National Institute Of Advanced Industrial & Technology 機能性生体分子の配列解析方法
JP4791737B2 (ja) 2005-02-25 2011-10-12 大日本住友製薬株式会社 機能性核酸配列解析方法
JP2011518174A (ja) * 2008-04-18 2011-06-23 シェノゲン ファーマ グループ リミテッド エストロゲン受容体に関連する疾患を処置するための化合物及び方法
JP5582433B2 (ja) * 2009-03-24 2014-09-03 国立大学法人名古屋大学 機能性ペプチドを表すルールの抽出法、機能性ペプチドの設計法及び調製法、ポリペプチド又はポリペプチド含有組成物の評価法、並びに機能性ペプチド
KR101325736B1 (ko) * 2010-10-27 2013-11-08 삼성에스디에스 주식회사 바이오 마커 추출 장치 및 방법
US20150184247A1 (en) * 2012-04-20 2015-07-02 Memorial Sloan-Kettering Cancer Center Gene expression profiles associated with metastatic breast cancer
JP6251730B2 (ja) * 2012-04-26 2017-12-20 ザ・ユニバーシティ・オブ・シカゴThe University Of Chicago 黄色ブドウ球菌(staphylococcusaureus)疾患の間にコアグラーゼ活性を中和する抗体に関連した組成物および方法
EP3188060B1 (en) 2014-08-27 2023-04-26 Nec Corporation Simulation device, simulation method, and memory medium
JP6798487B2 (ja) 2015-06-02 2020-12-09 日本電気株式会社 シミュレーション装置、シミュレーション方法及びプログラムを記憶する記録媒体
US20180060482A1 (en) * 2016-08-31 2018-03-01 Intermountain Invention Management, Llc Interpreting genomic results and providing targeted treatment options in cancer patients
US10440911B2 (en) * 2016-09-16 2019-10-15 Wisconsin Alumni Research Foundation Targeted modification of maize roots to enhance abiotic stress tolerance
JP6908111B2 (ja) * 2017-06-30 2021-07-21 日本電気株式会社 予測装置、予測方法、予測プログラム、及び、遺伝子推定装置
US11712026B2 (en) * 2017-10-18 2023-08-01 The Jackson Laboratory Murine-MHC-deficient HLA-transgenic nod-mouse models for T1D therapy development
WO2019191123A1 (en) * 2018-03-26 2019-10-03 The Trustees Of Princeton University Methods for predicting genomic variation effects on gene transcription

Also Published As

Publication number Publication date
JPWO2019003441A1 (ja) 2020-03-26
WO2019003441A1 (ja) 2019-01-03
US20210142865A1 (en) 2021-05-13
EP3648109A1 (en) 2020-05-06
EP3648109A4 (en) 2020-06-24
US11557372B2 (en) 2023-01-17

Similar Documents

Publication Publication Date Title
EP3315014B1 (en) A system for forecasting the drying of an agricultural crop
Dumont et al. Parameter identification of the STICS crop model, using an accelerated formal MCMC approach
JP6908111B2 (ja) 予測装置、予測方法、予測プログラム、及び、遺伝子推定装置
WO2017170086A1 (ja) 情報処理システム、情報処理装置、シミュレーション方法およびシミュレーションプログラムが記録された記録媒体
Medina-Ruíz et al. Mathematical modeling on tomato plants: A review
Yang et al. Deep reinforcement learning-based irrigation scheduling
CN114662742A (zh) 大田灌溉施肥制度动态决策方法及装置
JP5671877B2 (ja) 農作業支援装置、農作業支援方法、及び農作業支援プログラム
CN115600771A (zh) 作物产量估测方法、装置、设备及存储介质
CN111095314A (zh) 作物植物种植的产量估计
JP7140086B2 (ja) 果菜類植物及び果樹栽培管理装置、学習装置、果菜類植物及び果樹栽培管理方法、学習モデル生成方法、果菜類植物及び果樹栽培管理プログラム及び学習モデル生成プログラム
Khan et al. An ecophysiological model analysis of yield differences within a set of contrasting cultivars and an F1 segregating population of potato (Solanum tuberosum L.) grown under diverse environments
Confalonieri CoSMo: A simple approach for reproducing plant community dynamics using a single instance of generic crop simulators
CN112308284A (zh) 作物特性预测***及方法、计算机可读取的存储介质
JP2002136223A (ja) 農作物収穫量予測方法、農作物収穫量予測装置及び記録媒体
JP7208503B2 (ja) 機械学習プログラム、機械学習方法および機械学習装置
CN113010529A (zh) 基于知识图谱的作物管理方法和装置
JP7024733B2 (ja) 情報処理装置、情報処理方法、及び、情報処理プログラム
JP7416394B2 (ja) 作付スケジュール算出装置、作付スケジュール算出プログラム、及び、作付スケジュール算出方法
JP6874776B2 (ja) 情報処理装置、情報処理方法、及び、情報処理プログラム
JP7405177B2 (ja) 情報処理装置、推論装置、機械学習装置、情報処理方法、推論方法、及び、機械学習方法
JP6763444B2 (ja) 情報処理装置、情報処理方法、及び、情報処理プログラム
WO2023119529A1 (ja) 生育予測装置、生育予測方法、及び生育予測プログラム
Ahmad et al. Understanding the Agricultural Systems Modeling: A Review
US20230385654A1 (en) Model-predictive control of pest presence in host environments

Legal Events

Date Code Title Description
A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20191121

A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20191121

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20210112

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20210301

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20210601

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20210614

R150 Certificate of patent or registration of utility model

Ref document number: 6908111

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150