JP6908111B2

JP6908111B2 - 予測装置、予測方法、予測プログラム、及び、遺伝子推定装置

Info

Publication number: JP6908111B2
Application number: JP2019526116A
Authority: JP
Inventors: 峰斗佐藤; 壮一郎荒木; 藤山　健一郎; 健一郎藤山; 哲理有山; たん東
Original assignee: NEC Corp
Current assignee: NEC Corp
Priority date: 2017-06-30
Filing date: 2017-06-30
Publication date: 2021-07-21
Anticipated expiration: 2037-06-30
Also published as: JPWO2019003441A1; WO2019003441A1; US20210142865A1; EP3648109A1; EP3648109A4; US11557372B2

Description

本発明は、解析対象に生じる事象に関して予測する予測装置等に関する。

特許文献１には、実世界で起きている現象を、コンピュータを用いて数値的にシミュレーションするシミュレーション装置が開示されている。該シミュレーション装置は、解析対象に関する状態を表すモデル情報に基づき該解析対象に関する状態を予測し、予測した状態と、該解析対象に関して観測された観測情報とに基づき該モデルを更新する。

特許文献２には、農作物に関する変数の値等を予測する方法が開示されている。

国際公開第２０１６／１９４３７９号国際公開第２００１／１８１７７号

しかし、特許文献１乃至特許文献２に開示されたいずれの装置を用いたとしても、必ずしも、予測結果が正しいとは限らない。この理由は、解析対象の状態等をシミュレーションする基であるモデル情報が必ずしも正確であるとは限らないからである。すなわち、該モデル情報が誤差を含んでいることが多いので、必ずしも、該モデル情報に基づくシミュレーションの結果は、正確であるとは限らない。

そこで、本発明の目的の１つは、解析対象をより正確にシミュレーションすることが可能な予測装置等を提供することである。

本発明の１つの態様として、予測装置は、
解析対象となりうる生体が有する遺伝子配列を表す配列情報と、該遺伝子配列によって発現しうる機能を表す機能情報との関連性を表す第１モデル情報に基づき、解析対象が有する遺伝子配列についての前記機能情報を作成する第１モデル処理手段と、
前記生体に関する前記機能情報、前記生体の周囲の環境を表す環境情報、及び、前記生体に関して観測される観測情報の間における関連性を表す第２モデル情報と、前記第１モデル処理手段によって前記解析対象に関する前記遺伝子配列について作成された前記機能情報とに基づき、前記解析対象について予測された前記観測情報を表す予測情報を作成する第２モデル処理手段と
を備える。

また、本発明の他の態様として、予測方法は、
情報処理装置によって、解析対象となりうる生体が有する遺伝子配列を表す配列情報と、該遺伝子配列によって発現しうる機能を表す機能情報との関連性を表す第１モデル情報に基づき、解析対象が有する遺伝子配列についての前記機能情報を作成し、前記生体に関する前記機能情報、前記生体の周囲の環境を表す環境情報、及び、前記生体に関して観測される観測情報の間における関連性を表す第２モデル情報と、前記解析対象に関する前記遺伝子配列について作成された前記機能情報とに基づき、前記解析対象について予測された前記観測情報を表す予測情報を作成する。

また、本発明の他の態様として、予測プログラムは、
解析対象となりうる生体が有する遺伝子配列を表す配列情報と、該遺伝子配列によって発現しうる機能を表す機能情報との関連性を表す第１モデル情報に基づき、解析対象が有する遺伝子配列についての前記機能情報を作成する第１モデル処理機能と、
前記生体に関する前記機能情報、前記生体の周囲の環境を表す環境情報、及び、前記生体に関して観測される観測情報の間における関連性を表す第２モデル情報と、前記第１モデル処理機能によって前記解析対象に関する前記遺伝子配列について作成された前記機能情報とに基づき、前記解析対象について予測された前記観測情報を表す予測情報を作成する第２モデル処理機能と
をコンピュータに実現させる。

さらに、同目的は、係るプログラムを記録するコンピュータが読み取り可能な記録媒体によっても実現される。

本発明に係る予測装置等によれば、解析対象をより正確にシミュレーションすることができる。

本発明の第１の実施形態に係る予測装置が有する構成を示すブロック図である。第１の実施形態に係る予測装置における処理の流れを示すフローチャートである。本発明の第１の実施形態に係る遺伝子推定装置が有する構成を示すブロック図である。本発明の第２の実施形態に係る予測装置が有する構成を示すブロック図である。第２の実施形態に係る予測装置における処理の流れを示すフローチャートである。本発明の各実施形態に係る予測装置、または、係る遺伝子推定装置を実現可能な計算処理装置のハードウェア構成例を概略的に示すブロック図である。

まず、本発明の理解を容易にするため、本発明が解決しようとする課題を詳細に説明する。

解析対象に対する入力である入力情報と、該解析対象が出力する出力情報との間の関連性を表すモデル情報に基づき、該解析対象に関する数値シミュレーションが実行される。該モデル情報は、たとえば、該入力情報と、該出力情報との間に物理的に成り立つ関連性が、偏微分方程式を用いて表された情報である。情報処理装置を用いてシミュレーションする場合には、当該偏微分方程式が離散化されることによって連立一次方程式が作成され、該連立一次方程式の解を算出することによって、該解析対象の状態が算出される。

しかし、一般に、解析対象に生じる事象（たとえば、動き、状態の変化）を、モデル情報を用いて表す場合に誤差が生じ、生じた誤差によってシミュレーションした結果が実際に観測される観測情報から乖離してしまうことがある。たとえば、解析対象が植物等の生体である場合に、解析対象に関して実際に観測される観測情報と、該観測情報に関する予測結果を表す予測情報（すなわち、観測情報について予測された結果を表す情報）との間に乖離が生じてしまう。

本願発明者は、解析対象が植物等の生体である場合に、該解析対象に関して観測された観測情報（事象）と、シミュレーションによって予測された事象との間に乖離が生じやすいことを見出した。さらに、本願発明者は、このような乖離が生じる要因の１つが同種の生体が解析対象であったとしても、個々の解析対象が有している遺伝子配列が異なっているにも関わらず、シミュレーションにおいては、そのような遺伝子配列の違いがモデル情報において表現されていないことであることを見出した。また、本願発明者は、異なる生体が同じ遺伝子配列を有している場合であっても該生体が生育される環境に応じて生育状態が異なる状況が生じているものの、モデル情報においては当該状況が表現されていないという課題を見出した。本願発明者は、このような状況に課題を見出すとともに、係る課題を解決する手段を導出するに至った。

次に、本発明の各実施形態にて用いる用語について説明する。

パラメタは、記憶装置（記憶部）における、ある記憶領域を表すとする。パラメタに値を設定する処理は、該パラメタが表す記憶領域にデータを格納する処理を表す。また、変数（パラメタ）に関する値を、「変数（パラメタ）の値」、または、「変数（パラメタ）値」とも表す。パラメタの値は、該パラメタが表す記憶領域に格納されている値を表す。説明の便宜上、パラメタの値Ａを、単に、「パラメタＡ」と表すこともある。

また、確率変数（ｒａｎｄｏｍｖａｒｉａｂｌｅｓ）Ｓの値（ｖａｌｕｅ）がＣである場合に、確率変数ＴがＤである条件付き確率（ｃｏｎｄｉｔｉｏｎａｌｐｒｏｂａｂｉｌｉｔｙ）Ｐを式Ａに示すように表す、
Ｐ（Ｔ＝Ｄ｜Ｓ＝Ｃ）・・・（式Ａ）。

また、誤解を生じない限り、確率変数の値を、該確率変数の添え字を用いて表すこととする。この場合には、式Ａを、式Ｂに示すように表すことができる、
Ｐ（Ｔ＝ＴＤ｜Ｓ＝ＳＣ）・・・（式Ｂ）。

さらに、説明の便宜上、誤解を生じない限り、確率変数Ｓ、及び、確率変数Ｔを省略して表すこととする。この場合には、式Ｂを、式Ｃに示すように表すことができる、
Ｐ（ＴＤ｜ＳＣ）・・・（式Ｃ）。

以降においては、シミュレーション対象を「解析対象」と表す。センサ等を用いて、解析対象に関して観測される情報を「観測情報」と表す。解析対象をシミュレーションすることによって予測された情報を「予測情報」と表す。また、植物等の解析対象を遺伝子配列に基づき識別する場合には、各解析対象を「個体」と表す。

以降、上述したような課題を解決可能な、本発明を実施する実施形態について、図面を参照しながら詳細に説明する。

＜第１の実施形態＞
図１を参照しながら、本発明の第１の実施形態に係る予測装置１０１が有する構成について詳細に説明する。図１は、本発明の第１の実施形態に係る予測装置１０１が有する構成を示すブロック図である。

第１の実施形態に係る予測装置１０１は、遺伝子モデル処理部１０２と、作物モデル処理部１０３と、更新部１０４とを有する。予測装置１０１は、さらに、遺伝子モデル情報記憶部１０５と、作物モデル情報記憶部１０６と、機能情報記憶部１０７と、観測情報記憶部１０８と、環境情報記憶部１０９と、基準情報記憶部１１０と、関連性情報記憶部１１１とを有していてもよい。

以降の説明においては、説明の便宜上、解析対象は、圃場にて生育されている植物（作物）であるとする。しかし、解析対象は、植物に限定されず、生体であればよい。同様に、説明の便宜上、作物モデル情報、作物モデル処理部１０３、及び、作物モデル情報記憶部１０６を用いて説明するが、予測装置１０１の処理対象は、作物モデル情報に限定されない。以降の説明においては、より一般化された作物モデル情報を、「第２モデル情報」と表すこともある。同様に、作物モデル処理部を、「第２モデル処理部」と表すこともある。作物モデル情報記憶部を、「第２モデル情報記憶部」と表すこともある。

環境情報記憶部１０９には、植物周囲の環境に関する環境情報が格納されている。該環境情報は、たとえば、圃場における降水量、該圃場における土壌に含まれている水分量、土壌に含まれている窒素量、圃場における気温、圃場における日照時間を表す情報である。環境情報は、たとえば、圃場にて実施された灌漑量を表す情報であってもよい。環境情報は、上述した例と異なる情報が含まれていてもよい。環境情報は、個体周囲の環境に関する環境情報であってもよい。

観測情報記憶部１０８には、植物に関して観測された観測情報Ｙが格納されている。観測情報は、たとえば、植物に関する葉面積指標、該植物の大きさ、葉の枚数、葉の大きさ、作物の大きさである。観測情報は、個体に関して観測された観測情報であってもよい。観測情報は、センサ等を用いて取得された情報であってもよいし、観測された情報に基づき算出された情報であってもよい。観測情報は、上述した例に限定されない。

機能情報記憶部１０７には、植物（または、個体）が有している遺伝子配列によって発現しうる機能、または、該機能が発現することによって生じる事象を表す機能情報Ｃ_ｃｒｏｐが格納されている。すなわち、機能情報Ｃ_ｃｒｏｐは、遺伝子配列によって発現しうる機能に関する情報である。機能情報Ｃ_ｃｒｏｐは、当該遺伝子配列を表す配列情報と、該機能（または、該事象）を表す情報とが関連付けされた情報であってもよい。機能情報Ｃ_ｃｒｏｐは、当該配列情報と、該機能（または、該事象）を表す情報と、該機能（または、該事象）が生じた場合における該植物（または、個体）に関する環境情報とが関連付けされた情報であってもよい。

機能情報Ｃ_ｃｒｏｐは、該機能自体を表す情報であってもよいし、該機能によって生じる事象を表す情報であってもよい。機能情報Ｃ_ｃｒｏｐは、たとえば、個体がある遺伝子配列を有している場合に、土壌に根を広く張る状態（たとえば、根が広がっている範囲の体積）を表す情報であってもよいし、根を張ることに起因して生じる事象（たとえば、水の吸収速度）を表す情報であってもよい。機能情報Ｃ_ｃｒｏｐは、植物の大きさ、作物ができるまでの期間、作物の色、作物の大きさ等を表す情報であってもよい。機能情報Ｃ_ｃｒｏｐは、該機能を発現した植物が、植物周囲の環境に応じて実現する状態を表す情報であってもよい。たとえば、根が広く張っている植物が生育されている土壌に、ある降水量の雨が降った場合に、機能情報Ｃ_ｃｒｏｐは、該植物が根から吸収する水分量を表す情報であってもよい。この場合に、遺伝子モデル情報は、植物に関する配列情報ｘ_ｇｅｎｅ、及び、該植物周囲の環境に関する環境情報と、該機能情報Ｃ_ｃｒｏｐとの関連性を表す情報である。機能情報Ｃ_ｃｒｏｐは、一般的な核酸配列データベースに登録されている情報であってもよいし、遺伝子配列を有している個体を観測することによって得られた情報であってもよい。機能情報Ｃ_ｃｒｏｐは、必ずしも、１つの情報だけでなく、複数の情報を含んでいてもよい。遺伝子モデル情報、及び、機能情報Ｃ_ｃｒｏｐは、上述した例に限定されない。

遺伝子モデル情報記憶部１０５には、植物が有している遺伝子配列を表す配列情報ｘ_ｇｅｎｅと、該機能情報Ｃ_ｃｒｏｐとの関連性を表す遺伝子モデル情報（以降、「第１モデル情報」とも表す）が格納されている。遺伝子モデル情報は、植物に関する配列情報ｘ_ｇｅｎｅと、該植物周囲の環境を表す環境情報と、該植物に関する機能情報Ｃ_ｃｒｏｐとの関連性を表す情報であってもよい。遺伝子モデル情報は、さらに、該植物を表す植物識別子（以降、識別子を「ＩＤ」と表す）が関連付けされている情報であってもよい。たとえば、ある個体が有している遺伝子配列と、該個体周囲の環境を表す環境情報とに、当該遺伝子モデル情報を適用することによって、該ある植物に関する機能情報を求めることができる。

以降の説明においては、説明の便宜上、遺伝子モデル情報に入力される環境情報を、「第１環境情報θ_ｅｎｖ」と表す。

具体例を参照しながら、遺伝子モデル情報について説明する。

説明の便宜上、配列情報ｘ_ｇｅｎｅが根の張り具合に影響を与える遺伝子配列を表すとする。圃場にて生育されている個体が根を多く張る遺伝子配列を有している場合に、該個体は、成長するにつれて、該遺伝子配列を有していない個体よりも多くの根を土壌に張る。ここで、圃場にて少雨な状況が生じているとする。根を多く張る遺伝子配列を有している個体は、少雨であっても、十分な水分を吸収することができるので大きく成長する。これに対して、根を多く張る遺伝子配列を有していない個体は、少雨の場合に、十分な水分を吸収することができないので、大きく成長することができない。この場合に、機能情報Ｃ_ｃｒｏｐは、たとえば、該個体の吸水能力を表す情報である。機能情報Ｃ_ｃｒｏｐは、該個体の耐ストレス性等を表す情報であってもよい。第１環境情報θ_ｅｎｖは、圃場における降水量である。個体の大きさ（機能情報Ｃ_ｃｒｏｐの一例）は、該個体が有している配列情報ｘ_ｇｅｎｅによって発現する機能、及び、該個体周囲の環境に関する第１環境情報θ_ｅｎｖ等に応じて決定される。

作物モデル情報記憶部１０６には、植物に関する機能情報Ｃ_ｃｒｏｐ、及び、該植物周囲の環境に関する環境情報と、該植物（または、個体）に関して実際に観測される観測情報Ｙ（または、該観測情報に関する予測情報）との関連性を表す作物モデル情報（「第２モデル情報」の一例）が格納されている。以降、説明の便宜上、作物モデル情報を説明する場合に、観測情報、及び、予測情報を総称して観測情報と表す。

以降の説明においては、説明の便宜上、作物モデル情報に入力される環境情報を、「第２環境情報θ２_ｅｎｖ」と表す。また、第２環境情報θ２_ｅｎｖ、及び、第１環境情報θ_ｅｎｖを総称して「環境情報」と表す。

第２環境情報θ２_ｅｎｖは、第１環境情報θ_ｅｎｖと同種の情報であってもよいし、異なる種類の情報であってもよい。具体例を参照しながら、作物モデル情報について説明する。

説明の便宜上、植物に関する機能情報Ｃ_ｃｒｏｐは、該植物の吸水能力を表す情報であるとする。また、観測情報Ｙは、当該植物に関する正規化差植生指数（ＮＤＶＩ：ＮｏｒｍａｌｉｚｅｄＤｉｆｆｅｒｅｎｃｅＶｅｇｅｔａｔｉｏｎＩｎｄｅｘ）であるとする。

植生指数は、たとえば、人工衛星、ドローン等の飛行体から、圃場を見込む画角にて撮像された画像に基づき算出することができる。たとえば、係る飛行体が有するカメラは、該飛行体が圃場の上空を飛行中に、このような画像を撮影する。たとえば、該植生指数は、圃場付近について観測された可視域赤の反射率Ｒと、近赤外域の反射率ＩＲとに基づき、式１に示す処理に従い算出される。

ＮＤＶＩ＝（ＩＲ−Ｒ）÷（ＩＲ＋Ｒ）・・・（式１）、
ただし、ＮＤＶＩは、正の大きな値であるほど植生が濃いことを表す。

植物は、たとえば、春に発芽してから成長するとともに、より多くの葉を茂らせる。夏になると植物の成長が止まり、花が咲く結果、植生指数（式１に例示）は、低下していく。やがて、果実（すなわち、作物）が実り始め、秋になると葉の色が変わる（または、落葉し始める）。すると、植生指数（式１に例示）が低下する程度は急になる。この例において、第２環境情報θ２_ｅｎｖは、圃場における日照時間、該圃場周囲の気温等の情報である。したがって、この例において、作物モデル情報は、日照時間、圃場周囲の気温、及び、植物の吸水能力（機能情報Ｃ_ｃｒｏｐの一例）と、該植物に関する植生指数（観測情報Ｙの一例）との関連性を表すモデルである。

関連性情報記憶部１１１には、配列情報ｘ_ｇｅｎｅと、該配列情報ｘ_ｇｅｎｅが表す遺伝子配列を有している個体に関して観測された観測情報Ｙとが関連付けされた関連性情報が格納されている。関連性情報は、配列情報ｘ_ｇｅｎｅと、該配列情報ｘ_ｇｅｎｅが表す遺伝子配列を有している個体に関する観測情報Ｙが予測された予測情報とが関連付けされた情報であってもよい。または、関連性情報は、個体に関して観測された観測情報Ｙと、該個体について推定された遺伝子配列を表す配列情報ｘ_ｇｅｎｅとが関連付けされた情報であってもよい。以降の説明において関連性情報を説明する場合に、観測情報、及び、予測情報を総称して観測情報と表す。関連性情報は、上述した例に限定されない。

基準情報記憶部１１０には、関連性情報記憶部１１１に格納されている関連性情報のうち、特定の関連性情報を選択する場合の基である選択基準を表す基準情報が格納されている。該基準情報は、たとえば、観測情報Ｙからのずれの範囲が狭い等の安定性に関する基準、観測情報Ｙと、予測情報との乖離が小さい等の耐性（トレランス）に関する基準、あるいは、観測情報Ｙの範囲が基準の範囲内であるという基準等である。基準情報は、たとえば、観測された観測情報Ｙとの類似度が所定の条件を満たしているという基準である。この場合に、該基準情報は、観測された観測情報Ｙに類似している観測情報を選択する基準である。

次に、図２を参照しながら、本発明の第１の実施形態に係る予測装置１０１における処理について詳細に説明する。図２は、第１の実施形態に係る予測装置１０１における処理の流れを示すフローチャートである。

遺伝子モデル処理部１０２は、解析対象である植物を表す植物ＩＤを受け取る。

次に、遺伝子モデル処理部１０２は、遺伝子モデル情報記憶部１０５に、植物ＩＤが表す植物に関する遺伝子モデル情報が格納されているか否かを判定する（ステップＳ１０１）。遺伝子モデル情報は、植物の個体が有している遺伝子配列を表す配列情報ｘ_ｇｅｎｅと、該個体周囲の環境を表す第１環境情報θ_ｅｎｖと、該個体に関する機能情報Ｃ_ｃｒｏｐとの間の関連性を表す情報である。

該植物ＩＤが表す植物に関する遺伝子モデル情報が遺伝子モデル情報記憶部１０５に格納されていない場合に（ステップＳ１０１にてＮＯ）、遺伝子モデル処理部１０２は、配列情報、環境情報、及び、機能（または、該事象）に関する情報が関連付けされた機能情報Ｃ_ｃｒｏｐを機能情報記憶部１０７から読み取る（ステップＳ１０２）。遺伝子モデル処理部１０２は、読み取った機能情報Ｃ_ｃｒｏｐに基づき、遺伝子モデル情報を作成する（ステップＳ１０３）。遺伝子モデル処理部１０２が遺伝子モデル情報を作成する処理は、たとえば、既知の配列情報ｘ_ｇｅｎｅと、既知の機能情報Ｃ_ｃｒｏｐと間に成り立つ関連性を統計的に求める処理、または、後述する式２（または、式３）に含まれているパラメタの値を、既知の配列情報ｘ_ｇｅｎｅと、既知の機能情報Ｃ_ｃｒｏｐとに基づき決定する処理である。遺伝子モデル情報を作成する処理は、上述した例に限定されない。

該植物ＩＤが表す植物に関する遺伝子モデル情報が遺伝子モデル情報記憶部１０５に格納されている場合に（ステップＳ１０１にてＹＥＳ）、遺伝子モデル処理部１０２は、該遺伝子モデル情報を、遺伝子モデル情報記憶部１０５から読み取る。

遺伝子モデル処理部１０２は、植物が有している遺伝子配列を表す配列情報ｘ_ｇｅｎｅと、該植物の周囲の環境に関する第１環境情報θ_ｅｎｖとを外部から受け取る。遺伝子モデル処理部１０２は、該配列情報ｘ_ｇｅｎｅと、該周囲の環境に関する第１環境情報θ_ｅｎｖとに対して、該遺伝子モデル情報ｆ_ｇｐ（式２）に例示される所定の処理を適用することによって、該植物に関する機能情報Ｃ_ｃｒｏｐを作成する（ステップＳ１０４）。

Ｃ_ｃｒｏｐ＝ｆ_ｇｐ（ｘ_ｇｅｎｅ，θ_ｅｎｖ）・・・（式２）。

所定の処理は、たとえば、教師付き学習法に従い作成されたモデル情報を用いて、ある説明変数に対する目的変数を予測する処理である。この場合に、説明変数は、植物に関する配列情報ｘ_ｇｅｎｅと、該植物の周囲の環境に関する第１環境情報θ_ｅｎｖとである。目的変数は、該植物に関する機能情報Ｃ_ｃｒｏｐである。遺伝子モデル処理部１０２は、該植物に関する配列情報と、環境情報と、機能情報とを、訓練データとして作成された遺伝子モデル情報を用いて、受け取った第１環境情報θ_ｅｎｖと、該配列情報ｘ_ｇｅｎｅとに対する機能情報Ｃ_ｃｒｏｐを作成する。

所定の処理は、教師付き学習法に限定されず、半教師付き学習法、ベイズ推定等の統計的な手法、または、式４乃至式７を参照しながら後述するようなモデル情報に基づくシミュレーション手法であってもよい。また、遺伝子モデル情報は、上述した関連性がモデル情報を用いて表現された場合に生じる誤差を表す情報（式３におけるパラメタη）を含んでいてもよい。また、遺伝子モデル情報は、上述したパラメタ（配列情報ｘ_ｇｅｎｅ等）と異なるパラメタを含んでいてもよい。所定の処理は、上述した例に限定されない。

また、遺伝子モデル情報ｆ_ｇｐは、式３に例示されるように、パラメタηを含むモデル情報であってもよい。

Ｃ_ｃｒｏｐ＝ｆ_ｇｐ（ｘ_ｇｅｎｅ，θ_ｅｎｖ，η）・・・（式３）。

ただし、パラメタηは、植物等の解析対象に生じる事象に対する影響を表す情報である。言い換えると、パラメタηは、遺伝子モデル情報（式２に例示）を表現した場合における補正量を表すパラメタである。配列情報ｘ_ｇｅｎｅは、必ずしも、植物が有している遺伝子配列を表していなくともよく、遺伝子配列に関する推定情報であってもよい。該推定情報は、遺伝子配列に関する推定情報である。また、第１環境情報θ_ｅｎｖは、環境情報を表す。パラメタηは、たとえば、観測情報Ｙに基づき、作物モデル情報（式４、または、式６を参照しながら後述する）に従い算出される機能情報と、遺伝子モデル情報（式２または式３に例示）に従い算出される機能情報との差異を表す。配列情報ｘ_ｇｅｎｅ、及び、第１環境情報θ_ｅｎｖは、ある確率分布に従い当該情報が決定されるとも考えることができる。したがって、パラメタη（すなわち、補正を表すパラメタ）は、確率的にその情報が決定され、当該情報を、確率を用いて表すこともできる。

遺伝子モデル処理部１０２は、ステップＳ１０４にて作成した機能情報Ｃ_ｃｒｏｐを、機能情報記憶部１０７に格納してもよい。遺伝子モデル処理部１０２は、作成した機能情報Ｃ_ｃｒｏｐを作物モデル処理部１０３に入力する。

作物モデル処理部１０３は、遺伝子モデル処理部１０２から該機能情報Ｃ_ｃｒｏｐを受け取る。作物モデル処理部１０３は、植物ＩＤを外部装置、または、遺伝子モデル処理部１０２から受け取る。作物モデル処理部１０３は、該植物ＩＤが表す植物の周囲の環境に関する第２環境情報θ２_ｅｎｖを、土壌センサ、水分センサ等の外部装置から受け取る。作物モデル処理部１０３は、該植物ＩＤが表す植物に関する作物モデル情報を作物モデル情報記憶部１０６から読み取る。作物モデル処理部１０３は、受け取った該機能情報Ｃ_ｃｒｏｐ、及び、第２環境情報θ２_ｅｎｖに対して、作物モデル情報ｇ_{ｇｒｏｗｔｈ}が表す処理（式４に例示）を適用する。この処理によって、作物モデル処理部１０３は、あるタイミングｔにおける作物の状態を表す状態情報ｘ_{ｐｈｅｎｏ}を算出し、算出した状態情報ｘ_{ｐｈｅｎｏ}に基づき、該あるタイミングｔにおける観測情報Ｙを予測する（すなわち、予測情報を作成する）（ステップＳ１０５）。

ｘ_{ｐｈｅｎｏ} ^ｔ＝ｇ_{ｇｒｏｗｔｈ}（ｘ_{ｐｈｅｎｏ} ^ｔ−１，Ｃ_ｃｒｏｐ，θ２_ｅｎｖ）・・・（式４）。

Ｙ^ｔ＝ｈ（ｘ_{ｐｈｅｎｏ} ^ｔ）・・・（式５）。

式４に例示されているように、作物モデル情報ｇ_{ｇｒｏｗｔｈ}は、複数のタイミングにおける状態情報ｘ_{ｐｈｅｎｏ}が、機能情報Ｃ_ｃｒｏｐ、及び、第２環境情報θ２_ｅｎｖを用いて関連付けされた情報である。式４に例示された例においては、タイミングｔにおける状態情報ｘ_{ｐｈｅｎｏ} ^ｔと、タイミング（ｔ−１）における状態情報ｘ_{ｐｈｅｎｏ} ^ｔ−１とが関連付けされている。たとえば、式４に示された処理に従えば、タイミング（ｔ−１）における状態情報ｘ_{ｐｈｅｎｏ} ^ｔ−１と、第２環境情報θ２_ｅｎｖと、機能情報Ｃ_ｃｒｏｐとに基づき、タイミングｔにおける状態情報ｘ_{ｐｈｅｎｏ} ^ｔを予測することができる。

式５に示されているように、観測モデル情報ｈは、あるタイミングｔにおける状態情報_{ｘｐｈｅｎｏ} ^ｔと、該あるタイミングにおける観測情報Ｙ^ｔとの間の関連性を表す情報である。たとえば、式５に例示された観測モデル情報ｈは、タイミングｔにおける状態情報ｘ_{ｐｈｅｎｏ} ^ｔと、タイミングｔにおける観測情報Ｙ^ｔとの間の関連性を表す情報である。たとえば、観測モデル情報ｈは、恒等関数（すなわち、観測情報Ｙ^ｔとして状態情報ｘ_{ｐｈｅｎｏ} ^ｔを算出する関数）を用いて表されるモデル情報であってもよい。この場合に、観測モデル情報ｈは、「Ｙ^ｔ＝ｘ_{ｐｈｅｎｏ} ^ｔ」なる関連性を表す情報である。

以降、観測モデル情報ｈを、「第３モデル情報」とも表す。

状態情報ｘ_{ｐｈｅｎｏ}として、個体の植生、該個体の重さ、該個体の個数、及び、該個体の成熟度を取得することができる状況であっても、式５に例示される観測モデル情報ｈは、タイミングｔにて観測された観測情報のみが関連付けされた情報であってもよい。たとえば、タイミングｔにて個体の植生、及び、個体の個数のみが観測される場合に、式５に例示される観測モデル情報ｈは、該個体の植生、及び、該個体の個数のみが関連付けされた情報であってもよい。

また、ある生体に関する作物モデル情報が複数の地域（または、地点）に関して異なっている場合に、各作物モデル情報に従い算出される観測情報の平均値（または、重み付け平均値）を算出することによって、観測情報Ｙが求められてもよい。

式６に示されているように、作物モデル情報ｇ_{ｇｒｏｗｔｈ}は、たとえば、状態情報ｘ_{ｐｈｅｎｏ}に関する時間変化（時間発展）における不確実性を表すシステムノイズｖ^ｔを含んでいてもよい。システムノイズｖ^ｔは、タイミングｔにおけるシステムノイズを表す。同様に、観測モデル情報ｈは、式７に示されているように、たとえば、作物モデル情報に関する不確実性を表す観測ノイズｗ^ｔを含んでいてもよい。該不確実性を表す観測ノイズｗ^ｔは、たとえば、土壌センサ、水分センサ等の観測装置によって観測された情報に含まれている差異（または、誤差、ノイズ）、または、該観測モデル情報ｈ自体に含まれている差異（または、誤差、ノイズ）を表す情報である。観測ノイズｗ^ｔは、タイミングｔにおける観測ノイズを表す。

ｘ_{ｐｈｅｎｏ} ^ｔ＝ｇ_{ｇｒｏｗｔｈ}（ｘ_{ｐｈｅｎｏ} ^ｔ−１，Ｃ_ｃｒｏｐ ^ｔ，θ２_ｅｎｖ ^ｔ，ｖ^ｔ）・・・（式６）、
Ｙ^ｔ＝ｈ（ｘ_{ｐｈｅｎｏ} ^ｔ，ｗ^ｔ）・・・（式７）。

ただし、システムノイズｖ^ｔ、及び、観測ノイズｗ^ｔは、たとえば、平均が０であり、所定の分散を有するガウス分布に従い生じた値であるとする。

以降の説明においては、式６に例示された作物モデル情報ｇ_{ｇｒｏｗｔｈ}、及び、式７に例示された観測モデル情報ｈを総称して、「状態空間モデル」と呼ぶこともある。後述するように、式６、及び、式７に例示された状態空間モデルは、たとえば、タイミングｔにおける状態情報ｘ_{ｐｈｅｎｏ} ^ｔと、観測情報Ｙ^ｔとに基づき更新される。

また、式６、及び、式７に例示されているように、各モデル情報における情報、及び、ノイズは、時間に応じて変化する情報であってもよい。具体的には、Ｃ_ｃｒｏｐ ^ｔは、タイミングｔにおける機能情報Ｃ_ｃｒｏｐである。θ２_ｅｎｖ ^ｔは、タイミングｔにおける第２環境情報θ２_ｅｎｖである。

式６及び式７に例示されている状態空間モデルを更新する処理手法として、たとえば、データ同化処理に従った処理手法がある。データ同化処理においては、タイミングｔに関して、相互に異なる複数のセットに基づき算出される観測情報（すなわち、予測情報）と、実際に観測される観測情報との間の差異が算出される。該セットは、機能情報Ｃ_ｃｒｏｐ ^ｔ、及び、第２環境情報θ２_ｅｎｖ ^ｔ等の情報を含んでいる。複数のセットが、ある乱数を用いて作成される情報を含んでいる場合には、該差異（すなわち、システムノイズ、及び、観測ノイズ）は、ある確率分布に従い生じているとも考えることができる。以降、１つのセットを「アンサンブル」と表し、相互に異なる複数のセットを「アンサンブル集合」と表すこともある。また、作物モデル情報は、上述したパラメタ（機能情報Ｃ_ｃｒｏｐ等）と異なるパラメタを含んでいてもよい。

遺伝子モデル情報ｆ_ｇｐ（式２または式３に例示）、及び、作物モデル情報ｇ_{ｇｒｏｗｔｈ}（式４に例示）は、たとえば、解析対象に関する状態と、該解析対象に関して観測された観測情報との関連性を表す偏微分方程式等の情報に基づき作成されてもよい。偏微分方程式は、必ずしも、１つの式でなく、複数の式であってもよい。該偏微分方程式が、たとえば、有限要素法等の離散化手法に従い離散化される。この結果、連立一次方程式が作成される。遺伝子モデル情報ｆ_ｇｐ（式２または式３に例示）、及び、作物モデル情報ｇ_{ｇｒｏｗｔｈ}（式４に例示）は、たとえば、反復法等の求解手順に従い、該連立一次方程式の解を算出する処理手順を概念的に表す。

タイミングｔにおける機能情報Ｃ_ｃｒｏｐ ^ｔが生じる場合に状態情報ｘ_{ｐｈｅｎｏ} ^ｔが生じる確率は、式８に示されるように、機能情報Ｃ_ｃｒｏｐ ^ｔと第２環境情報θ２_ｅｎｖ ^ｔとが生じた場合における予測確率として表すことができる。

ｐ（ｘ_{ｐｈｅｎｏ} ^ｔ｜ｘ_{ｐｈｅｎｏ} ^ｔ−１，Ｃ_ｃｒｏｐ ^ｔ，θ２_ｅｎｖ ^ｔ）・・・（式８）。

式８に示す予測確率の値は、たとえば、機能情報Ｃ_ｃｒｏｐを式３（または、式２）に示された処理に従い算出し、さらに、算出した機能情報Ｃ_ｃｒｏｐに対する状態情報ｘ_{ｐｈｅｎｏ} ^ｔを式６（または、式４）に従い算出する処理を、複数のセットに関して繰り返し実行するアンサンブルシミュレーションに従い求めることができる。

アンサンブルシミュレーションには、たとえば、機能情報Ｃ_ｃｒｏｐを、正規（ガウス）分布に従って選択し、選択した機能情報Ｃ_ｃｒｏｐの値に関して、式６（または、式４）に従い状態情報ｘ_{ｐｈｅｎｏ} ^ｔを予測する（すなわち、該観測情報に関する予測情報を作成する）解析的な手法がある。あるいは、アンサンブルシミュレーションにおいては、式３（または、式２）に例示された処理に従い算出されたＣ_ｃｒｏｐを平均として算出し、算出した値に対して式６（または、式４）に従い所定の分散を有する乱数をノイズとして加えることによってアンサンブル（アンサンブルメンバ）が作成される。当該所定の分散を有する複数の乱数に対して、それぞれ、アンサンブル（アンサンブルメンバ）を作成することによって、アンサンブル集合（式９に例示）が作成される。該アンサンブルシミュレーションには、作成されたアンサンブル集合に含まれているアンサンブルメンバに対して、それぞれ、式４（または、式６）に示された処理に従い状態情報ｘ_{ｐｈｅｎｏ} ^ｔ、及び、該状態情報ｘ_{ｐｈｅｎｏ} ^ｔに関する観測情報Ｙに関する予測情報が作成する手法もある。

｛ｘ_{ｐｈｅｎｏ，ｋ} ^ｔ−１、Ｃ_{ｃｒｏｐ，ｋ} ^ｔ、θ２_{ｅｎｖ，ｋ} ^ｔ｝・・・（式９）、
ただし、ｋ（ｋは、１≦ｋ≦Ｎなる自然数を表す）は、１つのアンサンブルメンバを指し示す。Ｎは、アンサンブル集合に含まれているアンサンブルメンバの個数を表す。たとえば、Ｃ_{ｃｒｏｐ，ｋ} ^ｔは、Ｃ_ｃｒｏｐ ^ｔに基づき算出されたアンサンブルに含まれている機能情報を表す。

アンサンブルシミュレーションにおいて、作物モデル処理部１０３は、状態情報ｘ_{ｐｈｅｎｏ，ｋ} ^ｔ−１、及び機能情報Ｃ_{ｃｒｏｐ，ｋ} ^ｔ、第２環境情報θ２_{ｅｎｖ，ｋ} ^ｔについて、独立（または、並列）に予測情報である作物の状態量ｘ_{ｐｈｅｎｏ} ^ｔを算出する（したがって、該観測情報Ｙに関する予測情報を作成する）ことができる。作物モデル処理部１０３は、たとえば、機能情報Ｃ_ｃｒｏｐ ^ｔや、第２環境情報θ２_ｅｎｖ ^ｔに関するＮ個のアンサンブル集合（式９に例示）に含まれている各アンサンブルメンバについて、式７（または、式５）に従い観測情報Ｙを予測する手法がある。作物モデル処理部１０３は、異なる第２環境情報θ２_ｅｎｖ ^ｔを、たとえば、所定の分散を有するシステムノイズを加える等の処理によって作成することができる。

更新部１０４は、新たに観測された観測情報があるか否かを判定する（ステップＳ１０６）。新たに観測された観測情報がある場合に（ステップＳ１０６にてＹＥＳ）、更新部１０４は、所定の更新処理（後述する）に従い、該観測情報に基づき、遺伝子モデル情報、及び、作物モデル情報を更新する（ステップＳ１０７）。更新部１０４は、所定の要因推定処理（後述する）に従い、更新した遺伝子モデル情報、及び、作物モデル情報に基づき、該観測情報に適合している配列情報、または、該観測情報に適合している機能情報を推定してもよい。

所定の要因推定処理について詳細に説明する。

式３に示された遺伝子モデル情報が不確実性を含むモデル情報であるので、タイミングｔにおける観測情報Ｙ^ｔを与えた場合に、機能情報Ｃ_ｃｒｏｐ ^ｔである確率は、式１０に示されるように、観測情報Ｙ^ｔの事後確率として表すことができる。

ｐ（Ｃ_ｃｒｏｐ ^ｔ｜Ｙ^ｔ）・・・（式１０）。

式１０に従う処理手順は、式４乃至式７に示されたモデル情報に関する処理において、観測情報Ｙ^ｔに基づき、機能情報Ｃ_ｃｒｏｐ ^ｔを求める処理手順によって実現することができる。また、更新部１０４は、異なる第２環境情報θ２_ｅｎｖ ^ｔに関しても、たとえば、実際に観測された観測情報Ｙによって更新する（すなわち、事後分布ｐ（θ２_ｅｎｖ ^ｔ｜Ｙ^ｔ）を求める）機能を有していてもよい。

配列情報ｘ_ｇｅｎｅを推定する所定の要因推定処理には、大別して、順問題的アプローチと、逆問題的アプローチとがある。該順問題的アプローチは、与えられた観測情報Ｙ^ｔに近くなる配列情報ｘ_ｇｅｎｅを探索する手順であり、たとえば、遺伝的アルゴリズム等の処理手順がある。逆問題的アプローチは、たとえば、配列情報ｘ_ｇｅｎｅが出現するパターンを、複数個、予め入力しておき、該パターンのうち、観測情報Ｙ^ｔ（または、観測情報Ｙ^ｔに類似している情報）を与える配列情報ｘ_ｇｅｎｅをフィルタリングする手順である。逆問題的アプローチは、たとえば、逐次ベイズフィルタリング、データ同化処理、マルコフ連鎖モンテカルロ法等の所定の処理手順に従い実現することができる。該所定の要因推定処理は、上述した処理手順に限定されない。

次に、所定の更新処理について詳細に説明する。

更新部１０４は、観測情報Ｙ^ｔに基づき求められた各機能情報Ｃ_ｃｒｏｐ ^ｔ（すなわち、式１０に示された事後確率）と、遺伝子モデル情報（式２または式３に例示）に従い算出された機能情報Ｃ_ｃｒｏｐ ^ｔとの差異を算出する。更新部１０４は、該差異を用いて、式３に例示された遺伝子モデル情報を更新する。更新部１０４は、更新後の遺伝子モデル情報（すなわち、植物ＩＤが表す植物に関する情報）と、当該植物ＩＤとが関連付けされた情報を作成し、作成した情報を遺伝子モデル情報記憶部１０５に格納する。尚、観測情報Ｙ^ｔに基づき求められた各機能情報Ｃ_ｃｒｏｐ ^ｔに関する事後分布をより確度の高い値とし、遺伝子モデル情報に従い算出された機能情報Ｃ_ｃｒｏｐ ^ｔの確からしさを表す尤度を算出して更新に用いてもよい。

更新部１０４は、作物モデル処理部１０３によって観測情報Ｙ^ｔに関して予測された予測情報に関する状態情報ｘ_{ｐｈｅｎｏ} ^ｔを受け取る。更新部１０４は、さらに、植物に関して実際に観測された観測情報Ｙ^ｔを受け取る。更新部１０４は、観測情報Ｙと観測ノイズｗとに基づき、予測情報である作物の状態量ｘ_{ｐｈｅｎｏ} ^ｔの確からしさを表す尤度を算出し、算出した尤度に基づき、式４（または、式６）に例示されている作物モデル情報ｇ_{ｇｒｏｗｔｈ}を更新する。更新部１０４は、データ同化処理に従い処理を実行する場合に、アンサンブル集合に含まれている各アンサンブルメンバについて誤差を算出し、システムノイズｖの下での予測情報である作物の状態量ｘ_{ｐｈｅｎｏ} ^ｔの確率分布を算出する。更新部１０４は、観測情報Ｙに基づき求められた各機能情報Ｃ_ｃｒｏｐや第２環境情報θ２_ｅｎｖの事後分布を含む作物モデル情報を作成することによって、作物モデル情報ｇ_{ｇｒｏｗｔｈ}を更新する。もしくは、システムノイズを、たとえば、パラメタρ（ハイパーパラメタ）を用いてｖ（ρ）と定義し、同様に、観測情報Ｙに基づき事後分布を求めることができる。これにより、同様に観測情報Ｙに従うシステムノイズを含む作物モデル情報を作成し、作物モデル情報ｇ_{ｇｒｏｗｔｈ}を更新することができる。更新部１０４は、更新後の作物モデル情報（すなわち、植物ＩＤが表す植物に関する情報）と、当該植物ＩＤとが関連付けされた情報を作成し、作成した情報を作物モデル情報記憶部１０６に格納する。

更新部１０４は、上述したような所定の更新処理に従い処理を実行した後に、観測情報Ｙ^ｔと一致している（または、類似している）情報を含んでいる関連性情報を特定し、特定した該関連性情報に含まれている配列情報ｘ_ｇｅｎｅを提示してもよい。この場合に、更新部１０４は、個体（または、植物）に関して観測された観測情報Ｙに基づき、上述したような順問題的アプローチ、または、逆問題的アプローチに従い、該個体が有している遺伝子配列を推定する。更新部１０４は、推定した該遺伝子配列を表す配列情報ｘ_ｇｅｎｅと、該観測情報Ｙ^ｔとが関連付けされた関連性情報を作成し、関連性情報記憶部１１１に格納してもよい。

配列情報ｘ_ｇｅｎｅを推定する処理について、後述する式１１、及び、式１２を参照しながら詳細に説明する。

説明の便宜上、更新部１０４が算出した配列情報ｘ_ｇｅｎｅ（または、観測情報Ｙ^ｔ）のタイミングを「ｔ」（ｔは、自然数）と表す。また、観測情報記憶部１０８には、該タイミングｔより後に観測された観測情報Ｙ^ｔ＋ｓ（ｓは、自然数）が、たとえば、リアルタイムに格納されるとする。しかし、必ずしも、観測情報が格納されるタイミングは、リアルタイムでなくともよい。

更新部１０４は、タイミングｔよりも後のタイミング「ｔ＋ｓ」（ｓは、自然数）における観測情報Ｙ^ｔ＋ｓと、遺伝子モデル情報（式２または式３に例示）と、作物モデル情報（式４に例示）とに基づき、タイミング「ｔ＋ｓ＋１」（ｓは、自然数）における遺伝子配列「ｘ_ｇｅｎｅ ^{ｔ＋ｓ＋１}」の推定値を算出する。この処理について、詳細に説明する。

更新部１０４は、上述したような順問題的アプローチ、または、逆問題的アプローチと同様な処理を実行することによって、観測情報Ｙ^ｔ＋ｓである場合の配列情報ｘ_ｇｅｎｅ（要因情報）を特定する。すなわち、更新部１０４は、観測情報Ｙ^ｔ＋ｓである場合に、配列情報が配列情報ｘ_ｇｅｎｅ ^{ｔ＋ｓ＋１}である確率（式１１）を、作物モデル情報と、遺伝子モデル情報とに従い算出する。

ｐ（ｘ_ｇｅｎｅ ^{ｔ＋ｓ＋１}｜Ｙ^ｔ＋ｓ）・・・（式１１）。

次に、更新部１０４は、関連性情報記憶部１１１から関連性情報を読み取り、基準情報記憶部１１０から基準情報を読み取る。更新部１０４は、観測情報Ｙ^ｔ＋ｓと、算出した配列情報ｘ_ｇｅｎｅ ^{ｔ＋ｓ＋１}とについて、読み取った該関連性情報のうち、読み取った基準情報が表す選択基準を満たしている関連性情報（または、値）を特定する。説明の便宜上、この処理を「特定処理」と表す。選択基準が、上述したような安定性に関する基準である場合に、更新部１０４は、たとえば、関連性情報記憶部１１１に格納されている関連性情報のうち、観測情報Ｙ^ｔ＋ｓの範囲が基準の範囲内であるという選択基準を満たしている関連性情報を特定する。

更新部１０４は、特定した関連性情報に含まれている観測情報（説明の便宜上、該観測情報の集合を「集合Ｒｃ」と表す）と、観測情報Ｙ^ｔ＋ｓとについて、該特定処理と同様な処理を実行することによって、該関連性情報記憶部１１１に関する配列情報ｘ_ｇｅｎｅ ^{ｔ＋ｓ＋１}を算出する。この場合に、更新部１０４は、観測情報Ｙ^ｔ＋ｓと、集合Ｒｃが与えられた場合の、配列情報ｘ_ｇｅｎｅ ^{ｔ＋ｓ＋１}の条件付き確率（式１２）を算出する。

ｐ（ｘ_ｇｅｎｅ ^{ｔ＋ｓ＋１}｜Ｙ^ｔ＋ｓ、Ｒｃ）・・・（式１２）。

したがって、更新部１０４は、上述した特定処理に従い、該基準情報と、該関連性情報とに基づき、配列情報ｘ_ｇｅｎｅ ^{ｔ＋ｓ＋１}として推定される集合Ｒｃを設定する。更新部１０４は、設定した集合Ｒｃと、モデル情報を用いて算出された推定値とに基づき、観測情報Ｙ^ｔ＋ｓに関する配列情報ｘ_ｇｅｎｅ ^{ｔ＋ｓ＋１}を算出する。

式１２に示された確率は、たとえば、特定した該関連性情報に含まれている配列情報の出現頻度を解析することによって、算出することができる。あるいは、配列情報と、該配列情報に基づき推定された観測情報とが関連付けされた情報であってもよい。

更新部１０４は、式１２に従い算出した確率のうち、最も大きな値である配列情報を、配列情報ｘ_ｇｅｎｅ ^{ｔ＋ｓ＋１}として推定してもよい。

更新部１０４は、タイミングｔに関する処理にて、観測情報Ｙ^ｔに基づき配列情報ｘ_ｇｅｎｅ ^ｔ＋１を推定する。予測装置１０１は、推定した配列情報ｘ_ｇｅｎｅ ^ｔ＋１に基づき観測情報Ｙ^ｔを予測する（すなわち、該観測情報に関する予測情報を作成する）。次に、更新部１０４は、作成した観測情報Ｙ^ｔ＋１に基づき、配列情報ｘ_ｇｅｎｅ ^ｔ＋２を推定する。したがって、更新部１０４は、各タイミングにて受け取った観測情報に基づき、配列情報を推定する。すなわち、更新部１０４は、解析対象に関する観測情報の履歴に基づき、該解析対象が有している遺伝子配列を推定する。

尚、本発明の各実施形態に示す予測装置は、図３に例示されているように、遺伝子推定装置１５１に含まれていてもよい。図３は、本発明の第１の実施形態に係る遺伝子推定装置１５１が有する構成を示すブロック図である。

第１の実施形態に係る遺伝子推定装置１５１は、予測装置１５２と、出力部１５３とを有する。予測装置１５２は、たとえば、予測装置１０１（または、図４を参照しながら後述する予測装置２０１）が有している機能と同様な機能を用いて実現することができる。遺伝子推定装置１５１は、ドローン１５４、または、人工衛星１５５等の飛行体と通信接続されている。図２を参照しながら上述したように、ドローン１５４、または、人工衛星１５５等の飛行体は、植物（または、個体）が生育されている圃場を観測しているセンサを有する。ドローン１５４、または、人工衛星１５５等の飛行体は、センサ等によって観測された観測情報（または、環境情報）を、通信ネットワークを介して遺伝子推定装置１５１に送信する。遺伝子推定装置１５１は、該観測情報（または、該環境情報）を受信し、これらの情報を予測装置１５２に入力する。予測装置１５２は、本発明の各実施形態に示す処理を実行することによって、たとえば、植物（または、個体）の遺伝子配列を表す配列情報１５６を作成する。予測装置１５２は、作成した配列情報１５６を、出力部１５３に入力する。出力部１５３は、配列情報１５６（たとえば、式１１に例示された確率）を受け取り、該配列情報１５６のうち、最も確率が大きな配列情報１５６を出力する。すなわち、出力部１５３は、配列情報１５６（たとえば、式１１に例示された確率）を受け取り、該配列情報１５６のうち、少なくとも一部の配列情報１５６を出力する。したがって、遺伝子推定装置１５１は、ドローン１５４、または、人工衛星１５５等の飛行体が送信した観測情報に基づき、遺伝子配列を推定することができる。

次に、本発明の第１の実施形態に係る予測装置１０１に関する効果について説明する。

第１の実施形態に係る予測装置１０１によれば、解析対象をより正確にシミュレーションすることができる。この理由は、植物等の解析対象が有している遺伝子配列について発現する可能性がある事象を表すモデルのパラメタを予測し、予測したパラメタに基づき、該植物に関して生じる事象をシミュレーションするからである。この理由について詳細に説明する。

本実施形態にて課題に関して上述したように、シミュレーションによって予測された事象と、センサ等によって取得された事象との間には誤差が生じる。個体が有している遺伝子配列が当該シミュレーションの基であるモデル情報には表現されていないことが、該誤差の要因の１つであることを、本願発明者は見出した。そこで、本願発明者は、遺伝子配列を表す配列情報ｘ_ｇｅｎｅに関係して生じる事象を表す機能情報Ｃ_ｃｒｏｐをモデル情報に導入し、該機能情報Ｃ_ｃｒｏｐを介して、配列情報ｘ_ｇｅｎｅと観測情報Ｙとの関連性を表現した。つまり、第１の実施形態に係る予測装置１０１は、機能情報Ｃ_ｃｒｏｐを介して、配列情報ｘ_ｇｅｎｅと観測情報Ｙとの関連性を表すモデル情報（式２乃至式７に例示）に従い、観測情報を予測する（すなわち、該観測情報に関する予測情報を作成する）。したがって、予測装置１０１によって予測情報には、配列情報ｘ_ｇｅｎｅが１つの要因として反映されているので、予測装置１０１によれば、解析対象をより正確にシミュレーションすることができる。

さらに、第１の実施形態に係る予測装置１０１によれば、生体が有している遺伝子配列によって当該生体に関して観測される観測情報を、短期間に取得することができる。この理由は、解析対象が有している遺伝子配列に基づくシミュレーションを、予測装置１０１が実行するからである。一般に、解析対象を実際に生育している期間に比べ、当該解析対象に生じる事象に関するシミュレーションに要する期間が短いので、予測装置１０１によれば、生体が有している遺伝子配列によって当該生体に関して観測される観測情報を、短期間に取得することができる。

さらに、第１の実施形態に係る予測装置１０１によれば、解析対象に関して実際に観測された事象を表す観測情報Ｙに基づき、該解析対象が有している遺伝子配列を推定することができる。この理由は、予測装置１０１が、順問題的アプローチ、または、逆問題的アプローチに従った処理を実行することによって、観測情報Ｙを生じる要因である遺伝子配列を表す配列情報を特定するからである。

また、環境情報（第１環境情報、または、第２環境情報）があらかじめ得られている場合には、第１の実施形態に係る予測装置１０１によれば、該環境情報が表す環境における収穫効率を向上することができる。この理由は、予測装置１０１が植物（または、個体）に関して予測した観測情報（すなわち、予測情報）に基づき、該植物の生育に関する情報を取得することができるからである。すなわち、予測装置１０１が、植物（または、個体）配列情報と、環境情報とに基づき、該植物（または、該個体）が成長した場合における観測情報を予測するので（すなわち、予測情報を作成する）、利用者は、該予測情報に基づき、該環境情報に適した植物（または、個体）を、該植物を生育する以前に特定することができる。

また、植物（または、個体）に関する配列情報があらかじめ得られていない場合であっても、第１の実施形態に係る予測装置１０１によれば、環境情報が表す環境にて収穫効率を向上することができる。この理由は、予測装置１０１が植物（または、個体）に関する予測情報、及び、配列情報に基づき、利用者は、該環境情報が表す環境に適した植物（または、個体）を特定することができる。

＜第２の実施形態＞
次に、本発明の第２の実施形態について説明する。

図４を参照しながら、本発明の第２の実施形態に係る予測装置２０１が有する構成について詳細に説明する。図４は、本発明の第２の実施形態に係る予測装置２０１が有する構成を示すブロック図である。

第２の実施形態に係る予測装置２０１は、第１モデル処理部２０２と、第２モデル処理部２０３とを有する。予測装置２０１は、さらに、第１モデル情報記憶部２０４と、第２モデル情報記憶部２０５とを有していてもよい。

以降の説明においては、説明の便宜上、解析対象は、圃場にて生育されている植物（作物）であるとする。しかし、解析対象は、植物に限定されず、生体であればよい。

第１モデル情報記憶部２０４には、図１を参照しながら説明したような、遺伝子配列を表す配列情報と、該遺伝子配列によって発現しうる機能に関する機能情報との関連性を表す第１モデル情報（たとえば、「遺伝子モデル情報」）が格納されている。第１モデル情報は、当該遺伝子配列を有している生体の周囲の環境を表す環境情報と、該配列情報と、該機能情報との関連性を表す情報であってもよい。第２モデル情報記憶部２０５は、図１を参照しながら説明したような、複数のタイミングにおける該生体の状態における関連性が、該機能情報を介して表された第２モデル情報（たとえば、作物モデル情報）が格納されている。

次に、図５を参照しながら、本発明の第２の実施形態に係る予測装置２０１における処理について詳細に説明する。図５は、第２の実施形態に係る予測装置２０１における処理の流れを示すフローチャートである。

第１モデル処理部２０２は、植物（または、個体）等の解析対象が有する遺伝子配列を表す配列情報を受け取る。第１モデル処理部２０２は、第１モデル情報記憶部２０４に格納されている第１モデル情報（式２、または、式３に例示）を読み取る。第１モデル処理部２０２は、受け取った該配列情報に、該第１モデル情報が示す処理を適用することによって、解析対象に関する機能情報を作成する（ステップＳ２０１）。第１モデル処理部２０２は、作成した機能情報を第２モデル処理部２０３に入力する。ステップＳ２０１における処理は、たとえば、図２におけるステップＳ１０４を参照しながら説明したような処理と同様な処理である。

次に、第２モデル処理部２０３は、該機能情報、及び、第１タイミングにおける該解析対象の状態（以降、「第１状態」と表す）を表す情報を受け取る。第２モデル処理部２０３は、解析対象の周囲の環境に関する環境情報を外部装置から受け取る。第２モデル処理部２０３は、第２モデル情報記憶部２０５に格納されている第２モデル情報（たとえば、式４、または、式６に例示された作物モデル情報）を読み取る。第２モデル処理部２０３は、該機能情報と、該第１情報とに、該第２モデル情報が示す処理を適用することによって、第２タイミングにおける解析対象の状態（以降、「第２状態」と表す）を表す情報を算出する（ステップＳ２０２）。ステップＳ２０１における処理は、たとえば、図２におけるステップＳ１０５を参照しながら説明したような処理と同様な処理である。

第１モデル情報記憶部２０４は、第１の実施形態に係る遺伝子モデル情報記憶部１０５（図１）が有している機能と同様な機能を用いて実現することができる。第２モデル情報記憶部２０５は、第１の実施形態に係る作物モデル情報記憶部１０６（図１）が有している機能と同様な機能を用いて実現することができる。第１モデル処理部２０２は、第１の実施形態に係る遺伝子モデル処理部１０２（図１）が有している機能と同様な機能を用いて実現することができる。第２モデル処理部２０３は、第１の実施形態に係る作物モデル処理部１０３（図１）が有している機能と同様な機能を用いて実現することができる。したがって、予測装置２０１は、第１の実施形態に係る予測装置１０１（図１）が有している機能と同様な機能を用いて実現することができる。

次に、本発明の第２の実施形態に係る予測装置２０１に関する効果について説明する。

本実施形態に係る予測装置２０１によれば、解析対象をより正確にシミュレーションすることができる。この理由は、植物等の解析対象が有している遺伝子配列について発現する可能性がある事象を表すモデル情報に含まれているパラメタを予測し、予測したパラメタに基づき、該植物に関して生じる事象をシミュレーションするからである。この理由について詳細に説明する。

本実施形態にて課題に関して上述したように、本願発明者は、シミュレーションにて生じる誤差の要因の１つが、植物（または、個体）が有している遺伝子配列が当該シミュレーションの基であるモデル情報には表現されていないことを見出した。そこで、本願発明者は、遺伝子配列を表す配列情報ｘ_ｇｅｎｅに関係して生じる事象を表す機能情報Ｃ_ｃｒｏｐをモデル情報に導入し、該機能情報Ｃ_ｃｒｏｐを介して、配列情報ｘ_ｇｅｎｅと状態情報ｘ_{ｐｈｅｎｏ}との関連性を表現した。つまり、第２の実施形態に係る予測装置２０１は、機能情報Ｃ_ｃｒｏｐを介して、配列情報ｘ_ｇｅｎｅと状態情報ｘ_{ｐｈｅｎｏ}との関連性を表すモデル情報等（式２乃至式７に例示）に従い、解析対象に関する第２状態を算出する。したがって、予測装置２０１によって第２状態には、配列情報ｘ_ｇｅｎｅが１つの要因として反映されているので、予測装置２０１によれば、解析対象をより正確にシミュレーションすることができる。

（ハードウェア構成例）
上述した本発明の各実施形態に係る予測装置、または、遺伝子推定装置を、１つの計算処理装置（情報処理装置、コンピュータ）を用いて実現するハードウェア資源の構成例について説明する。但し、係る予測装置、または、係る遺伝子推定装置は、物理的または機能的に少なくとも２つの計算処理装置を用いて実現されてもよい。また、係る予測装置、または、係る遺伝子推定装置は、専用の装置として実現されてもよい。

図６は、本発明の各実施形態に係る予測装置、または、係る遺伝子推定装置を実現可能な計算処理装置のハードウェア構成例を概略的に示すブロック図である。計算処理装置２０は、中央処理演算装置（Ｃｅｎｔｒａｌ＿Ｐｒｏｃｅｓｓｉｎｇ＿Ｕｎｉｔ、以降「ＣＰＵ」と表す）２１、メモリ２２、ディスク２３、不揮発性記録媒体２４、及び、通信インターフェース（以降、「通信ＩＦ」と表す）２７を有する。計算処理装置２０は、入力装置２５、出力装置２６に接続可能であってもよい。計算処理装置２０は、通信ＩＦ２７を介して、他の計算処理装置、及び、通信装置と情報を送受信することができる。

不揮発性記録媒体２４は、コンピュータが読み取り可能な、たとえば、コンパクトディスク（Ｃｏｍｐａｃｔ＿Ｄｉｓｃ）、デジタルバーサタイルディスク（Ｄｉｇｉｔａｌ＿Ｖｅｒｓａｔｉｌｅ＿Ｄｉｓｃ）である。また、不揮発性記録媒体２４は、ユニバーサルシリアルバスメモリ（ＵＳＢメモリ）、ソリッドステートドライブ（Ｓｏｌｉｄ＿Ｓｔａｔｅ＿Ｄｒｉｖｅ）等であってもよい。不揮発性記録媒体２４は、電源を供給しなくても係るプログラムを保持し、持ち運びを可能にする。不揮発性記録媒体２４は、上述した媒体に限定されない。また、不揮発性記録媒体２４の代わりに、通信ＩＦ２７、及び、通信ネットワークを介して係るプログラムを持ち運びしてもよい。

すなわち、ＣＰＵ２１は、ディスク２３に格納されているソフトウェア・プログラム（コンピュータ・プログラム：以下、単に「プログラム」と称する）を、実行する際にメモリ２２にコピーし、演算処理を実行する。ＣＰＵ２１は、プログラム実行に必要なデータをメモリ２２から読み取る。表示が必要な場合に、ＣＰＵ２１は、出力装置２６に出力結果を表示する。外部からプログラムを入力する場合に、ＣＰＵ２１は、入力装置２５からプログラムを読み取る。ＣＰＵ２１は、上述した図１、図３、または、図４に示す各部が表す機能（処理）に対応するところのメモリ２２にある予測プログラム（図２、または、図５）を解釈し実行する。ＣＰＵ２１は、上述した本発明の各実施形態において説明した処理を順次実行する。

すなわち、このような場合に、本発明の各実施形態は、係る予測プログラムによっても成し得ると捉えることができる。さらに、係る予測プログラムが記録されたコンピュータが読み取り可能な不揮発性の記録媒体によっても、本発明の各実施形態は成し得ると捉えることができる。

以上、上述した実施形態を模範的な例として本発明を説明した。しかし、本発明は、上述した実施形態には限定されない。すなわち、本発明は、本発明のスコープ内において、当業者が理解し得る様々な態様を適用することができる。

１０１予測装置
１０２遺伝子モデル処理部
１０３作物モデル処理部
１０４更新部
１０５遺伝子モデル情報記憶部
１０６作物モデル情報記憶部
１０７機能情報記憶部
１０８観測情報記憶部
１０９環境情報記憶部
１１０基準情報記憶部
１１１関連性情報記憶部
１５１遺伝子推定装置
１５２予測装置
１５３出力部
１５４ドローン
１５５人工衛星
１５６配列情報
２０１予測装置
２０２第１モデル処理部
２０３第２モデル処理部
２０４第１モデル情報記憶部
２０５第２モデル情報記憶部
２０計算処理装置
２１ＣＰＵ
２２メモリ
２３ディスク
２４不揮発性記録媒体
２５入力装置
２６出力装置
２７通信ＩＦ

Claims

解析対象となりうる生体が有する遺伝子配列を表す配列情報と、前記遺伝子配列によって発現しうる機能を表す機能情報との関連性を表す統計的モデルまたは機械学習モデルである第１モデル情報を前記解析対象についての前記配列情報に適用することによって、前記解析対象が有する遺伝子配列についての前記機能情報を作成する第１モデル処理手段と、
前記生体に関する前記機能情報、前記生体の周囲の環境を表す環境情報、及び、前記生体に関して観測される観測情報の間における関連性を表すモデルである第２モデル情報を、前記第１モデル処理手段によって前記解析対象に関する前記配列情報について作成された前記機能情報と、前記解析対象についての環境情報とに適用することによって、前記解析対象について予測された前記観測情報を表す予測情報を作成する第２モデル処理手段と
を備える予測装置。
更新手段
をさらに備え、
前記第２モデル処理手段は、前記生体の状態と、前記生体に関して観測される観測情報との間における関連性を表す第３モデル情報に従い、前記解析対象についての前記観測情報が予測された情報を表す予測情報を作成し、
前記更新手段は、前記解析対象について観測された観測情報と、前記予測情報との差異に基づき、前記第２モデル情報を更新する
請求項１に記載の予測装置。
前記更新手段は、更新した後の前記第２モデル情報を用いて、前記予測情報を作成する場合における前記機能情報を推定し、推定された前記機能情報と、前記第１モデル情報に基づき前記第１モデル処理手段が作成した前記機能情報との差異に基づき、前記第１モデル情報を更新する
請求項２に記載の予測装置。
前記更新手段は、前記生体についての前記配列情報と、前記生体に関して観測された観測情報とが関連付けされた関連性情報に基づき、前記解析対象についての前記観測情報に関連付けされた前記配列情報を特定する
請求項２または請求項３に記載の予測装置。
前記更新手段は、前記関連性情報のうち、前記解析対象についての前記観測情報との類似度が所定の条件を満たしている関連性情報を特定し、特定した前記関連性情報に含まれている前記配列情報を特定する
請求項４に記載の予測装置。
前記更新手段は、前記解析対象について特定した前記配列情報と、前記解析対象についての当該観測情報とが関連付けされた前記関連性情報を作成する
請求項４または請求項５に記載の予測装置。
請求項４乃至請求項６のいずれかに記載の予測装置と、
前記更新手段によって特定された前記配列情報のうち、少なくとも一部の配列情報を出力する出力手段と
を備える遺伝子推定装置。
情報処理装置によって、解析対象となりうる生体が有する遺伝子配列を表す配列情報と、前記遺伝子配列によって発現しうる機能を表す機能情報との関連性を表す統計的モデルまたは機械学習モデルである第１モデル情報を前記解析対象についての配列情報に適用することによって、前記解析対象が有する遺伝子配列についての前記機能情報を作成し、前記生体に関する前記機能情報、前記生体の周囲の環境を表す環境情報、及び、前記生体に関して観測される観測情報の間における関連性を表すモデルである第２モデル情報を、前記解析対象に関する前記配列情報について作成された前記機能情報と、前記解析対象についての環境情報とに適用することによって、前記解析対象について予測された前記観測情報を表す予測情報を作成する予測方法。
解析対象となりうる生体が有する遺伝子配列を表す配列情報と、前記遺伝子配列によって発現しうる機能を表す機能情報との関連性を表す統計的モデルまたは機械学習モデルである第１モデル情報を前記解析対象についての配列情報に適用することによって、前記解析対象が有する遺伝子配列についての前記機能情報を作成する第１モデル処理機能と、
前記生体に関する前記機能情報、前記生体の周囲の環境を表す環境情報、及び、前記生体に関して観測される観測情報の間における関連性を表すモデルである第２モデル情報を、前記第１モデル処理機能によって前記解析対象に関する前記配列情報について作成された前記機能情報と、前記解析対象についての環境情報とに適用することによって、前記解析対象について予測された前記観測情報を表す予測情報を作成する第２モデル処理機能と
をコンピュータに実現させる予測プログラム。
更新機能
をさらにコンピュータに実現させ、
前記第２モデル処理機能において、前記生体の状態と、前記生体に関して観測される観測情報との間における関連性を表す第３モデル情報に従い、前記解析対象についての前記観測情報が予測された情報を表す予測情報を作成し、
前記更新機能において、前記解析対象について観測された観測情報と、前記予測情報との差異に基づき、前記第２モデル情報を更新する
請求項９に記載の予測プログラム。