JP7035302B2

JP7035302B2 - 情報処理システム、自動運用装置、運用端末、方法およびプログラム

Info

Publication number: JP7035302B2
Application number: JP2016139334A
Authority: JP
Inventors: 幹人荻野; 順一郎石井; 正典杉浦; 博岡本
Original assignee: NEC Corp
Current assignee: NEC Corp
Priority date: 2016-07-14
Filing date: 2016-07-14
Publication date: 2022-03-15
Anticipated expiration: 2036-07-14
Also published as: JP2018010513A

Description

本発明は、管制対象物との通信を行う地上局を制御する技術に関する。

地上局は、管制対象物との通信を行うために地上に設けられる設備からなる。管制対象物としては、例えば人工衛星がある。一般的には、運用者が、地上局を制御する運用を行う。例えば、運用者は、各種の判断情報に基づいて地上局の制御内容を判断し、決定した制御内容を表す制御情報を、地上局制御装置を介して地上局に送信する。判断情報としては、地上局の各設備の状態を表す情報や地上局周辺の環境情報等がある。また、地上局の各設備としては、例えば、送受信設備や変復調設備等がある。また、各設備の状態を表す情報としては、例えば、送受信設備から得られるＡＧＣ（Automatic Gain Control）ゲイン値がある。また、地上局周辺の環境情報としては、例えば、気象情報がある。このような判断情報に基づく制御内容の運用者による判断は、一定の基準によりなされる場合もあるものの、運用者の経験と勘によるところが多い。また、このような判断には、ヒューマンエラーの可能性がある上に、判断にかかる時間が長いという問題がある。また、制御内容が適切でなかった場合、再度制御を行うという手間が生じる。

そこで、運用者による制御内容の判断を、計算機に代わりに行わせて自動化する技術が知られている。例えば、特許文献１に記載された関連技術は、人工衛星からの受信信号のキャリアレベルとノイズレベルとの比をモニタし、モニタした値に基づいて、地上局の送信電力を制御する。

また、例えば、特許文献２に記載された関連技術は、知識ベース部と、データベース部とを用いて、推論機構部が、地上局の各設備からのデータを解析し、各設備を制御する。知識ベース部は、人工衛星を管制するノウハウが体系的に整理された情報を格納する。データベース部は、人工衛星を管制するのに必要な各種値が体系的に整理された情報を格納する。

また、例えば、特許文献３に記載された関連技術は、複数の人工衛星の現在の状態に応じて、各人工衛星の軌道や姿勢を制御する。このとき、この関連技術は、知識ベース部と、推論部とを用いて、人工衛星の管制に関する新たな知識を学習しながら、複数の人工衛星に対する各種制御の順番を知識に基づき最適化する。知識ベース部は、過去に打ち上げられた人工衛星の設計データや試験データ、人工衛星に対する過去の管制に関する情報等を蓄積していくよう構成されている。

特開２００７－２１５１１３号公報特開平５－１８１５０８号公報特許第３２０６９０７号公報

しかしながら、上述した一般的な技術および関連技術には以下の課題がある。

まず、運用者が地上局の制御内容を判断する一般的な技術では、次の問題がある。運用者による判断には時間がかかる。また、誤った制御をした場合、修正するのにも時間がかかる。また、人間による判断では時間がかかり過ぎて難しい運用が存在する。例えば、気象の変化が激しく、人工衛星との通信品質の状態が、短時間に変化する場合、運用者による判断では間に合わない。また、運用者は人間のため、ヒューマンエラーの懸念がある。

また、特許文献１～２に記載された関連技術は、計算機が運用者に代わって制御内容を判断するために、判断情報に対してどのような制御内容を選択するかという制御ルールをあらかじめ作成しておく必要がある。制御ルールをあらかじめ作成しておくことは、運用者にとって難しい場合がある。

例えば、特許文献１に記載された関連技術は、受信信号のキャリアレベルとノイズレベルとの比が晴天時の値より劣化したか否かや、ノイズレベルが初期値より上がっているか否か等に基づいて、どのように送信電力を制御するかというルールを事前に定めている。この関連技術では、受信信号のキャリアレベルとノイズレベルとが、判断情報であるといえる。このように、判断情報が少なければ、制御ルールをあらかじめ定めておくことは比較的容易である。しかしながら、判断情報が増えると、制御ルールの作成は複雑となる。そのため、この関連技術は、判断情報が多いケースに適用することは難しい。

また、特許文献２に記載された関連技術は、人工衛星を管制するノウハウをあらかじめ整理して知識ベース部を構築しておく必要がある。そのようなノウハウは膨大な量であると考えられるため、これらをあらかじめ整理しておくことは容易ではない。

このように、地上局の運用を自動化するために事前に定めた制御ルールを用いる関連技術では、制御ルールの作成作業が、運用者にとって難しい場合がある。また、制御ルールの作成には、意味付けが必要である上、意味付けの理由が「過去の運用による経験」など曖昧となる事が多い。このため、制御ルールの最適化が困難である。

例えば、降雨量が０～１００で判断情報として運用者に提示される時、８０以上で運用終了制御を送信する制御ルールをあらかじめ作成しておくとする。この時、なぜ８０以上に設定したのか、という「８０」という数字に対する意味付けが必要となる。理由が明確な場合もあるが、「過去の運用による経験」など、曖昧な理由となる事も多い。このような曖昧な理由に基づき制御ルールを作成するのは困難である。

また、特許文献３に記載された関連技術は、過去に打ち上げられた人工衛星の設計データや試験データ、過去の管制に関する情報等に基づいて、新たな知識を獲得することにより、複数の人工衛星の管制を行う。ここで、人工衛星に対する管制を適切に行うためには、地上局と人工衛星との間の通信状態を最適化するよう地上局を制御する必要がある。そのためには、人工衛星に関する過去のデータや現在の人工衛星の状態だけでなく、地上局の状態や地上局周辺の環境も考慮する必要がある。しかしながら、この関連技術は、人工衛星に関する過去のデータに基づき獲得した知識に基づくだけでは、地上局を精度よく制御することは難しい。

本発明は、上述の課題を解決するためになされたものである。すなわち、本発明は、事前に制御ルールを定める必要なく、対象物を管制する装置の制御をより高精度に自動化する技術を提供することを目的とする。

本発明の情報処理システムは、管制対象物との通信を行う地上局の状態を表す情報と前記地上局周辺の環境を表す情報とを含む判断情報を取得する判断情報取得部と、前記判断情報を記憶する判断情報記憶部と、前記判断情報に基づいて決定された前記地上局に対する制御内容を表す制御情報を取得する制御情報取得部と、前記制御情報を記憶する制御情報記憶部と、前記制御情報を前記地上局に送信して前記地上局を制御する地上局制御部と、前記判断情報記憶部に記憶された前記判断情報および前記制御情報記憶部に記憶された前記制御情報を学習データとして機械学習を行う学習部と、前記機械学習の学習結果を記憶する学習結果記憶部と、前記判断情報に対して、前記学習結果記憶部に記憶された前記学習結果を適用することにより、前記制御情報を算出する制御情報算出部と、を備える。

また、本発明の自動運用装置は、上述の情報処理システムにおいて、前記判断情報記憶部と、前記制御情報記憶部と、前記学習部と、前記学習結果記憶部と、前記制御情報算出部とを有する。

また、本発明の運用端末は、上述の情報処理システムにおいて、前記制御情報取得部を有する。

また、本発明の方法は、管制対象物との通信を行う地上局の状態を表す情報と前記地上局周辺の環境を表す情報とを含む判断情報、および、前記判断情報に基づいて決定された前記地上局に対する制御内容を表す制御情報を学習データとして機械学習を行い、前記判断情報に対して前記学習結果を適用することにより、前記制御情報を算出する。

また、本発明のプログラムは、管制対象物との通信を行う地上局の状態を表す情報と前記地上局周辺の環境を表す情報とを含む判断情報、および、前記判断情報に基づいて決定された前記地上局に対する制御内容を表す制御情報を学習データとして機械学習を行う機械学習ステップと、前記判断情報に対して前記学習結果を適用することにより、前記制御情報を算出する制御情報算出ステップと、をコンピュータ装置に実行させる。

本発明は、事前に制御ルールを定める必要なく、対象物を管制する装置の制御をより高精度に自動化する技術を提供することができる。

本発明の第１の実施の形態としての情報処理システムの構成を示すブロック図である。本発明の第１の実施の形態としての情報処理システムを構成する装置の一例を示すブロック図である。本発明の第１の実施の形態としての情報処理システムを構成する各装置のハードウェア構成の一例を示す図である。本発明の第１の実施の形態としての情報処理システムが判断情報を取得する動作を説明するフローチャートである。本発明の第１の実施の形態としての情報処理システムが制御情報を取得して地上局に送信する動作を説明するフローチャートである。本発明の第１の実施の形態としての情報処理システムが機械学習を行う動作を説明するフローチャートである。本発明の第１の実施の形態としての情報処理システムが制御情報を算出する動作を説明するフローチャートである。本発明の第２の実施の形態としての情報処理システムの構成を示すブロック図である。本発明の第２の実施の形態としての情報処理システムを構成する装置の一例を示すブロック図である。本発明の第２の実施の形態の第１の運用モードにおいて情報処理システムが評価値を取得する動作を説明するフローチャートである。本発明の第２の実施の形態の第１の運用モードにおいて情報処理システムが機械学習を行う動作を説明するフローチャートである。本発明の第２の実施の形態の第２の運用モードにおいて情報処理システムが制御情報を取得して送信する動作を説明するフローチャートである。本発明の第２の実施の形態の第２の運用モードにおいて情報処理システムが評価値を取得する動作を説明するフローチャートである。本発明の第２の実施の形態の第２の運用モードにおいて情報処理システムが制御情報を算出する動作を説明するフローチャートである。本発明の第２の実施の形態の第３の運用モードにおいて情報処理システムが制御情報を算出して地上局に送信する動作を説明するフローチャートである。本発明の第２の実施の形態において情報処理システムが運用モードを切り替える動作を説明するフローチャートである。本発明の第２の実施の形態の具体例を説明するブロック図である。本発明の第２の実施の形態の具体例において判断情報記憶部に記憶される判断情報の一例を説明する図である。本発明の第２の実施の形態の具体例において用いられる気象情報の一例を説明する図である。本発明の第２の実施の形態の具体例において制御情報記憶部に記憶される制御情報の一例を説明する図である。本発明の第２の実施の形態の具体例において評価値記憶部に記憶される評価値の一例を説明する図である。本発明の第２の実施の形態の具体例において構築される学習結果の出力層の構成の一例を説明する図である。本発明の第２の実施の形態の具体例において構築される学習結果の出力層と比較するための他の出力層の構成の一例を説明する図である。本発明の第２の実施の形態の具体例において構築される学習結果の出力層と比較するためのさらに他の出力層の構成の一例を説明する図である。

以下、本発明の実施の形態について、図面を参照して詳細に説明する。

（第１の実施の形態）
本発明の第１の実施の形態としての情報処理システム１の機能ブロック構成を図１に示す。図１において、情報処理システム１は、判断情報取得部１０１と、判断情報記憶部１０２と、制御情報取得部１０３と、制御情報記憶部１０４と、地上局制御部１０５と、学習部１０６と、学習結果記憶部１０７と、制御情報算出部１０８とを含む。情報処理システム１は、管制対象物との通信を行う地上局を制御するシステムである。地上局は、各種の設備によって構成される。

ここで、情報処理システム１のハードウェア構成の一例を、図２および図３を参照して説明する。図２に示すように、情報処理システム１の各機能ブロックは、地上局制御装置３００と、自動運用装置４００と、運用端末５００とに分散して構成可能である。これらの各装置は、ネットワークを介して互いに通信可能に接続される。例えば、地上局制御装置３００は、判断情報取得部１０１と、地上局制御部１０５とを含む。また、自動運用装置４００は、判断情報記憶部１０２と、制御情報記憶部１０４と、学習結果記憶部１０７と、学習部１０６と、制御情報算出部１０８とを含む。また、運用端末５００は、制御情報取得部１０３を含む。

この場合、例えば、図３に示すように、地上局制御装置３００は、ＣＰＵ（Central Processing Unit）３００１と、メモリ３００２と、ネットワークインタフェース３００５とを含むコンピュータ装置によって構成される。メモリ３００２は、ＲＡＭ（Random Access Memory）、ＲＯＭ（Read Only Memory）、補助記憶装置（ハードディスク等）等によって構成される。ネットワークインタフェース３００５は、ネットワークに接続するインタフェースである。また、自動運用装置４００は、ＣＰＵ４００１と、メモリ４００２と、ネットワークインタフェース４００５とを含むコンピュータ装置によって構成される。メモリ４００２は、ＲＡＭ、ＲＯＭ、補助記憶装置等によって構成される。ネットワークインタフェース４００５は、ネットワークに接続するインタフェースである。また、運用端末５００は、ＣＰＵ５００１と、メモリ５００２と、出力装置５００３と、入力装置５００４と、ネットワークインタフェース５００５とを含むコンピュータ装置によって構成される。メモリ５００２は、ＲＡＭ、ＲＯＭ、補助記憶装置等によって構成される。出力装置５００３は、ディスプレイ装置やプリンタ等のように、情報を出力する装置によって構成される。入力装置５００４は、キーボードやマウス等のように、ユーザ操作の入力を受け付ける装置によって構成される。ネットワークインタフェース５００５は、ネットワークに接続するインタフェースである。

この場合、判断情報取得部１０１および地上局制御部１０５は、地上局制御装置３００のネットワークインタフェース３００５と、メモリ３００２に記憶されたプログラムおよび各種データを読み込んで実行するＣＰＵ３００１とによって構成される。また、判断情報記憶部１０２と、制御情報記憶部１０４と、学習結果記憶部１０７とは、自動運用装置４００のメモリ４００２によって構成される。また、学習部１０６は、自動運用装置４００のメモリ４００２に記憶されたプログラムおよび各種データを読み込んで実行するＣＰＵ４００１によって構成される。また、制御情報算出部１０８は、自動運用装置４００のネットワークインタフェース４００５と、メモリ４００２に記憶されたプログラムおよび各種データを読み込んで実行するＣＰＵ４００１とによって構成される。また、制御情報取得部１０３は、運用端末５００のネットワークインタフェース５００５と、出力装置５００３と、入力装置５００４と、メモリ５００２に記憶されたプログラムおよび各種データを読み込んで実行するＣＰＵ５００１とによって構成される。ただし、情報処理システム１およびその各機能ブロックのハードウェア構成は、上述の構成に限定されない。

次に、各機能ブロックの詳細について説明する。

判断情報取得部１０１は、判断情報を取得する。判断情報は、地上局の状態を表す情報および地上局周辺の環境を表す情報を含む。例えば、判断情報取得部１０１は、地上局を構成する各設備から、その状態を表す情報を取得する。また、例えば、判断情報取得部１０１は、地上局周辺の環境を検出する付帯設備から、環境を表す情報を取得する。

判断情報記憶部１０２は、判断情報取得部１０１によって取得された判断情報を記憶する。

制御情報取得部１０３は、判断情報に基づき決定された制御情報を取得する。制御情報は、地上局に対する制御内容を表す。例えば、制御情報取得部１０３は、判断情報を出力装置５００３に出力し、出力に応じて入力装置５００４から入力される情報を、制御情報として取得してもよい。そのような制御情報は、典型的には、提示された判断情報に基づく運用者の判断により決定された制御内容を表している。

制御情報記憶部１０４は、制御情報取得部１０３によって取得された制御情報を記憶する。

なお、制御情報記憶部１０４の制御情報および判断情報記憶部１０２の判断情報は、どの制御情報がどの判断情報に基づいて決定されたかが照合可能に関連付けられる。例えば、制御情報記憶部１０４では、制御情報に識別情報が付与されて記憶されるとする。この場合、判断情報記憶部１０２では、判断情報が、その判断情報を用いて決定された制御情報の識別情報に関連付けられて記憶される。

あるいは、判断情報記憶部１０２において、判断情報に識別情報が付与されて記憶されてもよい。この場合、制御情報記憶部１０４では、制御情報が、その決定に用いた判断情報の識別情報に関連付けられて記憶される。

なお、判断情報および制御情報は、これらに限らず、どの制御情報がどの判断情報に基づいて決定されたかを照合可能であれば、どのような形式でどのような情報と共に記憶されても構わない。

地上局制御部１０５は、制御情報取得部１０３によって取得された制御情報を地上局に送信することにより、地上局を制御する。

学習部１０６は、判断情報記憶部１０２に記憶された判断情報および制御情報記憶部１０４に記憶された制御情報を学習データとして機械学習を行う。具体的には、学習部１０６は、記憶された各判断情報を入力としてその判断情報に基づいて決定された制御情報が出力されるような演算を、学習結果として生成すればよい。そして、学習部１０６は、機械学習の学習結果を、学習結果記憶部１０７に記憶する。

制御情報算出部１０８は、判断情報に対して、学習結果記憶部１０７に記憶された学習結果を適用することにより、制御情報を算出する。ここで、制御情報算出部１０８は、学習結果を適用する判断情報として、判断情報記憶部１０２から、直近に記憶された１つまたは複数の判断情報を読み込む。そのような１つまたは複数の判断情報は、例えば、算出を行う時点までの所定期間内に取得されたものであってもよい。

また、制御情報算出部１０８は、算出した制御情報を出力する。出力先は、地上局制御部１０５であってもよい。この場合、地上局制御部１０５は、制御情報算出部１０８によって算出された制御情報を、地上局に送信することになる。

以上のように構成された情報処理システム１の動作を、図面を参照して説明する。

まず、情報処理システム１が、判断情報を取得する動作を図４に示す。

図４では、まず、判断情報取得部１０１は、判断情報を取得する（ステップＡ１１）。例えば、判断情報は、地上局を構成する各設備から送信される。また、判断情報は、地上局周辺の環境を検出する付帯設備から送信される。

次に、判断情報取得部１０１は、取得した判断情報を、判断情報記憶部１０２に記憶する（ステップＡ１２）。なお、このステップで記憶された判断情報は、この時点では、制御情報に関連付けられていない。

以上の動作を、情報処理システム１は繰り返す。

次に、情報処理システム１が、制御情報を取得して地上局に送信する動作を図５に示す。

図５では、まず、制御情報取得部１０３は、判断情報記憶部１０２から、制御情報を決定するために用いる判断情報を読み込む（ステップＢ１１）。

例えば、直近Ｎ秒間に受信された１つ以上の判断情報に基づき制御内容が決定されるよう定められているとする。Ｎは正数である。この場合、制御情報取得部１０３は、判断情報記憶部１０２において、直近Ｎ秒間に追加された判断情報を読み込めばよい。

次に、制御情報取得部１０３は、ステップＢ１１で取得された判断情報に基づき決定された制御情報を取得する（ステップＢ１２）。

前述のように、制御情報取得部１０３は、出力装置５００３に該当する判断情報を出力し、出力に応じて入力装置５００４を介して入力される制御情報を取得してもよい。

次に、制御情報取得部１０３は、取得した制御情報を地上局制御部１０５に出力する。そして、地上局制御部１０５は、制御情報を地上局に送信することにより、地上局を制御する（ステップＢ１３）。

次に、制御情報取得部１０３は、取得した制御情報を、制御情報記憶部１０４に記憶する（ステップＢ１４）。

次に、制御情報取得部１０３は、ステップＢ１１で読み込まれた判断情報と、ステップＢ１２で取得された制御情報とを関連付ける（ステップＢ１５）。前述のように、例えば、制御情報に識別情報を付与している場合、ステップＢ１１で取得された判断情報に、ステップＢ１２で取得された制御情報の識別情報を追加して関連付ければよい。

以上の動作を、情報処理システム１は繰り返す。

次に、情報処理システム１が、学習を行う動作を図６に示す。

図６では、まず、学習部１０６は、判断情報記憶部１０２および制御情報記憶部１０４にそれぞれ記憶された情報を照合して学習データを生成する（ステップＣ１１）。

ここで、学習データは、判断情報と、その判断情報に基づいて決定された制御情報との組である。なお、学習データは、必ずしも１つずつの判断情報および制御情報からなる組でなくてもよい。例えば、直近Ｎ秒間に受信された１つ以上の判断情報に基づき制御内容が決定されるよう定められているとする。また、一度に複数種類の制御内容が決定されるよう定められているとする。この場合、学習データは、１つまたは複数の判断情報および１つまたは複数の制御情報からなる組であってもよい。

次に、学習部１０６は、学習データに基づき機械学習を行う（ステップＣ１２）。

具体的には、学習部１０６は、学習データの判断情報を入力信号として、その判断情報の組となる制御情報を教師信号として、入力信号に基づき教師信号が出力されるような演算を導出すればよい。

次に、学習部１０６は、機械学習の学習結果を、学習結果記憶部１０７に記憶する（ステップＣ１３）。

以上で、情報処理システム１は、学習を行う動作を終了する。

次に、情報処理システム１が、制御情報を算出する動作を図７に示す。

図７では、まず、制御情報算出部１０８は、判断情報記憶部１０２から、制御情報を決定するために用いる判断情報を読み込む（ステップＤ１１）。

例えば、直近Ｎ秒間に受信された１つ以上の判断情報に基づき制御内容が決定されるよう定められている場合、制御情報算出部１０８は、判断情報記憶部１０２において、直近Ｎ秒間に追加された判断情報を読み込めばよい。

次に、制御情報算出部１０８は、読み込んだ判断情報に対して、学習結果記憶部１０７に記憶された学習結果を適用することにより、制御情報を算出し出力する（ステップＤ１２）。

前述のように、出力先が地上局制御部１０５である場合、地上局制御部１０５は、制御情報算出部１０８によって算出された制御情報を、地上局に対して送信することになる。

以上で、情報処理システム１は、制御制御情報を算出する動作を終了する。

次に、本発明の第１の実施の形態の効果について述べる。

本発明の第１の実施の形態としての情報処理システムは、事前に制御ルールを定める必要なく、対象物を管制する装置の制御をより高精度に自動化することができる。

その理由について説明する。本実施の形態では、判断情報取得部が、管制対象物との通信を行う地上局の状態を表す情報および前記地上局周辺の環境を表す情報を含む判断情報を取得する。判断情報記憶部には、取得された判断情報が記憶される。また、制御情報取得部が、判断情報に基づいて決定された地上局に対する制御内容を表す制御情報を取得する。制御情報記憶部には、取得された制御情報が記憶される。そして、地上局制御部が、取得された制御情報を地上局に送信して地上局を制御する。そして、学習部が、判断情報記憶部に記憶された判断情報および制御情報記憶部に記憶された制御情報を学習データとして機械学習を行う。学習結果記憶部には、機械学習の学習結果が記憶される。そして、制御情報算出部が、判断情報に対して、学習結果記憶部に記憶された学習結果を適用することにより、制御情報を算出するからである。

このように、本実施の形態は、地上局の状態および地上局周辺の環境を表す判断情報と、判断情報に基づき運用者によって決定された制御情報との組を学習データとして機械学習を行うので、制御ルールをあらかじめ作成する必要がない。そして、本実施の形態は、そのような機械学習の学習結果を用いて、判断情報に基づき制御情報を算出するので、ベテランの運用者と同様な地上局の制御を、ベテランの運用者以上に短時間で判断して実行することができる。さらに、本実施の形態は、そのような機械学習の学習結果を用いて、判断情報に基づき制御情報を算出するので、運用者の判断に基づく制御で起こり得るヒューマンエラーを生じさせない。

つまり、本実施の形態は、学習部による機械学習によって、意味づけ等を必要とせずに、人手では作成が難しいような制御ルールである学習結果を自動的に作成可能としている。また、本実施の形態は、そのような制御ルールである機械学習の学習結果を生成するために充分な量の学習データを、判断情報取得部および制御情報取得部が取得して記憶する。このように、本実施の形態は、制御ルールの作成や学習データの収集にかかる人的コストを必要としない。

また、本実施の形態は、管制対象物に関する過去のデータや過去の制御情報だけでなく、地上局の状態や地上局周辺の環境を表す各種の判断情報に基づいて機械学習を行う。このため、地上局をとりまく状況の変化に応じて高精度に制御情報を算出するための制御ルールが自動的に作成される。したがって、本実施の形態は、このように生成された制御ルールを用いて制御情報算出部が制御情報を算出することにより、運用者では難しい早急な制御内容の判断を可能とする。例えば、地上局の状態や地上局周辺の環境が急激に変化する場合でも、本実施の形態は、急激な変化に応じて早急に制御内容を判断し制御情報を地上局に送信することができる。その結果、本実施の形態は、地上局の状態を最適化して管制対象物との間の通信品質をより高精度に向上させる。

なお、図７のステップＤ１２において、制御情報算出部による制御情報の出力先が、地上局制御部である例について説明したが、出力先は、制御情報取得部であってもよい。出力先が制御情報取得部である場合、制御情報取得部は、図５のステップＢ１２において、制御情報の決定に用いる判断情報と共に、算出された制御情報を参考情報として、出力装置に出力する。そして、制御情報取得部は、これらの情報の出力に応じて入力装置から入力される情報を、制御情報として取得すればよい。この場合、そのような制御情報は、判断情報と、参考情報として提示された制御情報とに基づいて、運用者により決定された制御内容を表している。このように、本実施の形態は、制御情報算出部により運用を自動化する用途の他に、制御情報算出部による算出結果を運用者に提示して運用者の判断を支援する用途としても好適である。

（第２の実施の形態）
次に、本発明の第２の実施の形態について図面を参照して詳細に説明する。なお、本実施の形態の説明において参照する各図面において、本発明の第１の実施の形態と同一の構成および同様に動作するステップには同一の符号を付して本実施の形態における詳細な説明を省略する。

まず、本発明の第２の実施の形態としての情報処理システム２の構成を図８に示す。情報処理システム２は、本発明の第１の実施の形態としての情報処理システム１に対して、制御情報取得部１０３に替えて制御情報取得部２０３と、学習部１０６に替えて学習部２０６と、制御情報算出部１０８に替えて制御情報算出部２０８とを備える点が異なる。また、評価値取得部２０９と、評価値記憶部２１０と、運用モード切替部２１１とをさらに備える点が異なる。

ここで、情報処理システム２のハードウェア構成の一例について説明する。図９に示すように、情報処理システム２の各機能ブロックは、地上局制御装置３００と、自動運用装置４１０と、運用端末５１０とに分散して構成可能である。これらの各装置は、ネットワークを介して互いに通信可能に接続される。地上局制御装置３００の構成は、図２を参照して説明した本発明の第１の実施の形態と同様である。また、自動運用装置４１０は、判断情報記憶部１０２と、制御情報記憶部１０４と、学習結果記憶部１０７と、評価値記憶部２１０と、学習部２０６と、制御情報算出部２０８とを含む。また、運用端末５１０は、制御情報取得部２０３と、評価値取得部２０９と、運用モード切替部２１１とを含む。

この場合、地上局制御装置３００と、自動運用装置４１０と、運用端末５１０と、各装置に配置された各機能ブロックは、図３を参照して説明した本発明の第１の実施の形態と同様のハードウェア要素によって構成される。また、評価値記憶部２１０は、自動運用装置４１０のメモリ４００２によって構成される。また、評価値取得部２０９および運用モード切替部２１１は、次のように構成される。すなわち、これらの各機能ブロックは、運用端末５１０のネットワークインタフェース５００５と、出力装置５００３と、入力装置５００４と、メモリ５００２に記憶されたプログラムおよび各種データを読み込んで実行するＣＰＵ５００１とによって構成される。ただし、情報処理システム２およびその各機能ブロックのハードウェア構成は、上述の構成に限定されない。

次に、各機能ブロックの詳細について説明する。

制御情報取得部２０３は、後述する第１の運用モードでは、本発明の第１の実施の形態における制御情報取得部１０３と同様に構成される。

また、制御情報取得部２０３は、後述する第２の運用モードでは、本発明の第１の実施の形態における制御情報取得部１０３と略同様に構成されるが、次の点が異なる。すなわち、第２の運用モードでは、制御情報取得部２０３は、判断情報記憶部１０２から読み込んだ判断情報と、読み込んだ判断情報に基づいて制御情報算出部２０８により算出された制御情報とに基づいて決定された制御情報を取得する。例えば、制御情報取得部２０３は、判断情報記憶部１０２から読み込んだ判断情報と、読み込んだ判断情報に基づいて制御情報算出部２０８により算出された制御情報とを出力装置５００３に出力してもよい。そして、制御情報取得部２０３は、出力に応じて入力装置５００４から入力される情報を、制御情報として取得すればよい。

また、制御情報取得部２０３は、第２の運用モードでは、入力により取得した制御情報を制御情報記憶部１０４に記憶することに加えて、制御情報算出部２０８により算出された制御情報を制御情報記憶部１０４に記憶する。そして制御情報取得部２０３は、判断情報記憶部１０２から読み込んだ判断情報と、入力により取得した制御情報とを関連付けることに加えて、判断情報記憶部１０２から読み込んだ判断情報と、制御情報算出部２０８により算出された制御情報とを関連付ける。

また、制御情報取得部２０３は、後述する第３の運用モードでは、機能しないよう構成される。

評価値取得部２０９は、制御情報に対する評価値を取得して、評価値記憶部２１０に記憶する。例えば、評価値取得部２０９は、そのような評価値を、運用端末５１０の入力装置５００４から取得してもよい。また、評価値取得部２０９は、評価の対象となった制御情報の識別情報に関連付けて、該当する評価値を評価値記憶部２１０に記憶する。

評価対象となる制御情報は、第１の運用モードおよび第２の運用モードで若干異なる。第１の運用モードでは、評価対象となる制御情報は、制御情報取得部２０３によって取得され地上局に送信された制御情報である。このような制御情報に対する評価値は、運用者による判断に基づく制御結果に対する評価を表していると言える。第２の運用モードでは、制御情報取得部２０３によって取得され地上局に送信された制御情報に加えて、制御情報算出部２０８によって算出された制御情報が評価対象となる。このような制御情報に対する評価値は、学習結果の精度に関する評価を表していると言える。

また、評価値取得部２０９は、第３の運用モードでは、機能しないよう構成される。

学習部２０６は、本発明の第１の実施の形態における学習部１０６と略同様に構成されるが、制御の種類ごとに機械学習を行う点と、学習データとして採用する情報を絞り込む点とが異なる。

具体的には、学習部２０６は、制御情報が表す制御の種類ごとに、その種類の制御情報と、その制御情報を決定する際に用いられた１つ以上の判断情報との組を学習データとして生成する。そして、学習部２０６は、そのような学習データのうち、所定条件を満たす評価値の評価対象となった制御情報を含む学習データを用いて、機械学習を行う。例えば、評価値が、値が大きいほど評価が高いことを表す数値として定義されているとする。この場合、所定条件とは、評価値が閾値以上であることであってもよい。そして、学習部２０６は、学習結果記憶部１０７に、制御の種類ごとの学習結果を記憶する。

また、学習部２０６は、第１の運用モードおよび第２の運用モードで機能し、第３の運用モードで機能しないよう構成される。

制御情報算出部２０８は、判断情報に対して、制御の種類ごとの学習結果を適用することにより、制御情報を算出して出力する。出力先は、第２の運用モードおよび第３の運用モードで異なる。

第２の運用モードでは、制御情報算出部２０８は、制御情報の算出結果を制御情報取得部２０３に出力する。また、第３の運用モードでは、制御情報算出部２０８は、制御情報の算出結果を地上局制御部１０５に出力する。

また、制御情報算出部２０８は、第２の運用モードおよび第３の運用モードで機能し、第１の運用モードで機能しないよう構成される。

運用モード切替部２１１は、第１の運用モード、第２の運用モード、および、第３の運用モードのいずれかへの切り替えを実行する。

第１の運用モードは、制御情報取得部２０３および学習部２０６が機能して制御情報算出部２０８が機能しない運用モードである。第１の運用モードでは、制御情報取得部２０３は、運用者等の入力による制御情報を取得する。例えば、第１の運用モードでは、制御情報取得部２０３は、読み込んだ判断情報を出力装置５００３に出力し、出力に応じて入力装置５００４から入力される制御情報を取得して、地上局制御部１０５に送信すればよい。また、第１の運用モードでは、評価値取得部２０９は、運用者の入力による制御情報に対する評価値を取得する。そして、学習部２０６は、判断情報と、運用者の入力による制御情報との組み合わせのうち、評価値が所定条件を満たす組合せを学習データとして、機械学習を行うことになる。つまり、第１の運用モードは、自動運用装置４１０を導入する初期の段階で、運用者による運用を行いながら自動化のための機械学習を行うモードとして適している。

また、第２の運用モードは、制御情報取得部２０３、学習部２０６および制御情報算出部２０８が共に機能する運用モードである。第２の運用モードでは、制御情報取得部２０３は、運用者等の入力による制御情報と、制御情報算出部２０８からの制御情報を共に取得する。例えば、制御情報取得部２０３は、読み込んだ判断情報と、その判断情報に基づき制御情報算出部２０８によって算出された制御情報とを、出力装置５００３に出力する。そして、制御情報取得部２０３は、これらの情報の出力に応じて入力装置５００４から入力される制御情報を取得して、地上局制御部１０５に送信すればよい。また、制御情報算出部２０８は、制御情報取得部２０３の要求に応じて制御情報を算出し、算出結果を制御情報取得部２０３に出力する。また、評価値取得部２０９は、運用者の入力による制御情報に対する評価値と、制御情報算出部２０８によって算出された制御情報に対する評価値とを取得して記憶する。そして、学習部２０６は、判断情報と、運用者により入力された制御情報または算出された制御情報との組み合わせのうち、評価値が所定条件を満たす組合せを学習データとして機械学習を行うことになる。つまり、第２の運用モードは、第１の運用モードでの機械学習の結果を正式な運用に適用する前に、機械学習の結果の精度を確認しさらに精度を高めるモードとして適している。

また、第３の運用モードは、制御情報取得部２０３および学習部２０６が機能せずに、制御情報算出部２０８が機能する運用モードである。第３の運用モードでは、制御情報算出部２０８は、読み込んだ判断情報に基づいて算出した制御情報を地上局制御部１０５に送信する。送信された制御情報は、地上局制御部１０５により地上局に対して送信される。つまり、第３の運用モードは、第１および第２の運用モードでの機械学習の学習結果を用いて、地上局の制御を自動化したモードとして適している。

例えば、運用モード切替部２１１は、運用端末５１０の入力装置５００４を介して入力される情報に基づいて、運用モードを切り替えてもよい。あるいは、運用モード切替部２１１は、事前に定められたスケジュールにしたがって、運用モードを切り替えてもよい。

以上のように構成された情報処理システム２の動作について、図面を参照して説明する。なお、以下の動作の説明において、異なる装置に配置された機能ブロック間で情報をやり取りする場合には、装置間で通信が行われているものとして、明示的な説明を省略する。

まず、第１の運用モードでの情報処理システム２の動作について説明する。

第１の運用モードにおいて、情報処理システム２が判断情報を取得する動作は、図４を参照して説明した本発明の第１の実施の形態と同様である。

また、第１の運用モードにおいて、情報処理システム２が制御情報を取得して地上局に送信する動作は、図５を参照して説明した本発明の第１の実施の形態と同様である。

次に、第１の運用モードにおいて、情報処理システム２が評価値を取得する動作を図１０に示す。

図１０では、まず、評価値取得部２０９は、図５のステップＢ１２で取得された制御情報を出力する（ステップＥ２１）。このとき、評価値取得部２０９は、制御情報と共に、その制御情報による地上局の制御の結果を表す情報を併せて出力してもよい。出力先は、例えば、出力装置５００３であってもよい。

次に、評価値取得部２０９は、制御情報に対する評価値を取得する（ステップＥ２２）。例えば、評価値取得部２０９は、入力装置５００４を介して評価値を取得してもよい。

次に、評価値取得部２０９は、取得した評価値を、評価対象の制御情報の識別情報と関連付けて、評価値記憶部２１０に記憶する（ステップＥ２３）。

以上で、情報処理システム２は、評価値を取得する動作を終了する。

なお、図１０に示した評価値の取得動作は、図５に示した制御情報の取得動作に続いて実行されるようにしてもよい。これにより、運用者は、制御情報の入力と、評価値の入力とを続いて行うことができ、運用者の負担が軽減される。

次に、第１の運用モードにおいて、情報処理システム２が学習を行う動作を図１１に示す。

図１１では、まず、学習部２０６は、判断情報記憶部１０２および制御情報記憶部１０４にそれぞれ記憶された情報を照合し、制御情報と、その制御情報の決定に用いられた１つ以上の判断情報との組を、学習データとして生成する（ステップＣ２１）。

次に、学習部２０６は、評価値記憶部２１０を参照することにより、所定条件を満たす評価値に関連付けられた評価情報を含む学習データを、ステップＣ２１で生成した学習データから抽出する（ステップＣ２２）。

次に、学習部２０６は、制御の種類毎にステップＣ２３～Ｃ２４の動作を実行する。

ここでは、まず、学習部２０６は、抽出した学習データを用いて、判断情報を入力とし、該当する種類の制御情報を教師信号とする機械学習を行う（ステップＣ２３）。

次に、学習部２０６は、機械学習の学習結果を、学習結果記憶部１０７に記憶する（ステップＣ２４）。

以上の動作を、全ての種類の制御情報について終了すると、情報処理システム２は、学習を行う動作を終了する。

以上で、第１の運用モードにおける情報処理システム２の動作の説明を終了する。

次に、第２の運用モードでの情報処理システム２の動作について説明する。

第２の運用モードにおいて、情報処理システム２が判断情報を取得する動作は、図４を参照して説明した本発明の第１の実施の形態と同様である。

次に、第２の運用モードにおいて、情報処理システム２が制御情報を取得して地上局に送信する動作を、図１２に示す。

図１２において、制御情報取得部２０３は、本発明の第１の実施の形態と同様にステップＢ１１を実行し、判断情報記憶部１０２から、制御情報の決定に用いる判断情報を取得する。

次に、制御情報取得部２０３は、ステップＢ１１で取得した判断情報を制御情報算出部２０８に出力し、その結果、制御情報算出部２０８によって算出される制御情報を取得する（ステップＢ２１）。

次に、制御情報取得部２０３は、読み込んだ判断情報と、制御情報算出部２０８によって算出された制御情報とに基づいて決定された制御情報を取得する（ステップＢ２２）。例えば、制御情報取得部２０３は、読み込んだ判断情報と算出された制御情報とを出力装置５００３に出力し、出力に応じて入力装置５００４から入力される情報を、制御情報として取得してもよい。

次に、制御情報取得部２０３は、本発明の第１の実施の形態と同様にステップＢ１３を実行する。これにより、取得された制御情報が地上局に送信される。

次に、制御情報取得部２０３は、ステップＢ２１で制御情報算出部２０８によって算出された制御情報と、ステップＢ２２で取得された制御情報とを、制御情報記憶部１０４に記憶する（ステップＢ２４）。

次に、制御情報取得部２０３は、本発明の第１の実施の形態と同様にステップＢ１５を実行する。これにより、制御情報と、その決定または算出に用いられた判断情報とが関連づけられる。

以上で、情報処理システム２は、制御情報を取得して地上局に送信する動作を終了する。

次に、第２の運用モードにおいて、情報処理システム２が評価値を取得する動作を図１３に示す。

図１３では、まず、評価値取得部２０９は、図１０に示したステップＥ２１～Ｅ２３を実行する。これにより、評価値取得部２０９は、図１２のステップＢ２２で入力により取得された制御情報に対する評価値を取得し記憶する。

次に、評価値取得部２０９は、図１２に示したステップＢ２１において算出された制御情報を出力する（ステップＥ２４）。

次に、評価値取得部２０９は、算出された制御情報に対する評価値を取得する（ステップＥ２５）。例えば、評価値取得部２０９は、入力装置５００４を介して評価値を取得してもよい。

次に、評価値取得部２０９は、取得した評価値を、算出された制御情報の識別情報と関連付けて、評価値記憶部２１０に記憶する（ステップＥ２６）。

このようにして記憶された判断情報、制御情報および評価値を用いて、第２の運用モードにおいて情報処理システム２が学習を行う動作については、図１１を用いて説明した第１の運用モードの学習動作と同様である。

次に、第２の運用モードにおいて、情報処理システム２が、制御情報を算出する動作を図１４に示す。この動作は、図１２に示したステップＢ２１において制御情報取得部２０３から要求されることにより開始される。

図１４では、まず、制御情報算出部２０８は、制御情報取得部２０３から、制御情報の算出に用いる判断情報を取得する（ステップＤ２１）。

次に、制御情報算出部２０８は、取得した判断情報に対して、制御の種類毎に学習結果を適用し、制御情報を算出する（ステップＤ２２）。そして、制御情報算出部２０８は、算出した制御情報を、制御情報取得部２０３に出力する。

以上で、情報処理システム２が制御情報を算出する動作の説明を終了する。

次に、第３の運用モードでの情報処理システム２の動作について説明する。

第３の運用モードにおいて、情報処理システム２が判断情報を取得する動作は、図４を参照して説明した本発明の第１の実施の形態と同様である。

また、第３の運用モードでは、制御情報取得部２０３および学習部２０６は動作しない。

ここでは、第３の運用モードにおいて、情報処理システム２が制御情報を算出して地上局に送信する動作を、図１５を用いて説明する。

ここでは、まず、制御情報算出部２０８は、判断情報記憶部１０２から、制御情報の算出に用いる判断情報を読み込む（ステップＤ３１）。

次に、制御情報算出部２０８は、読み込んだ判断情報に対して、制御の種類毎に学習結果を適用し、制御情報を算出する。そして、制御情報算出部２０８は、算出した制御情報を、地上局制御部１０５に送信する（ステップＤ３２）。

ここで、制御情報の内容が地上局の現在の状況を変更する内容でない場合（ステップＤ３３でＮｏ）、情報処理システム２は、この種類の制御情報に関する処理を終了する。

一方、制御情報の内容が地上局の現在の状況を変更する内容である場合（ステップＤ３３でＮｏ）、地上局制御部１０５は、制御情報を、地上局に対して送信する（ステップＤ３４）。

全種類の制御情報についてステップＤ３２～Ｄ３４の処理を終了すると、情報処理システム２は、運用を終了するか否かを判断する（ステップＤ３５）。

運用を終了しない場合、情報処理システム２は、ステップＤ３１からの処理を繰り返す。運用を終了する場合、情報処理システム２は、動作を終了する。

以上で、情報処理システム２が制御情報を算出して地上局に送信する動作の説明を終了する。

以上で、第１～第３の運用モードにおける情報処理システム２の動作の説明を終了する。

次に、情報処理システム２が、運用モードを切り替える動作を図１６に示す。

図１６では、まず、運用端末４１０の運用モード切替部２１１は、運用モードを指定する情報を取得する（ステップＦ２１）。運用モードを指定する情報は、第１、第２、および第３の運用モードのいずれかを表す情報である。運用モードを指定する情報は、入力装置５００４を介して取得されてもよい。

ここで、第１の運用モードを指定する情報が取得された場合（ステップＦ２２で第１の運用モード）について説明する。この場合、運用モード切替部２１１は、制御情報算出部２０８、学習部２０６、判断情報取得部１０１および評価値取得部２０９を、次のように制御する（ステップＦ２３）。

すなわち、この場合、運用モード切替部２１１は、制御情報取得部２０３に、図５に示した制御情報の取得動作を実行させるよう制御する。また、運用モード切替部２１１は、評価値取得部２０９に、図１０に示した評価値の取得動作を実行させるよう制御する。また、運用モード切替部２１１は、学習部２０６に、図１１に示した学習動作を実行させるよう制御する。また、運用モード切替部２１１は、制御情報算出部２０８を機能させないよう制御する。

これにより、情報処理システム２は、判断情報に基づく運用者の判断により決定された制御情報を用いた運用を行いながら、そのような運用者の判断を学習部２０６により学習するモードとなる。

また、第２の運用モードを指定する情報が取得された場合（ステップＦ２２で第２の運用モード）について説明する。この場合、運用モード切替部２１１は、制御情報算出部２０８、学習部２０６、判断情報取得部１０１および評価値取得部２０９を、次のように制御する（ステップＦ２４）。

すなわち、この場合、運用モード切替部２１１は、制御情報取得部２０３に、図１２に示した制御情報の取得動作を実行させるよう制御する。また、運用モード切替部２１１は、評価値取得部２０９に、図１３に示した評価値の取得動作を実行させるよう制御する。また、運用モード切替部２１１は、学習部２０６に、図１１に示した学習動作を実行させるよう制御する。また、運用モード切替部２１１は、制御情報算出部２０８に、図１４に示した制御情報の算出動作を実行させるよう制御する。

これにより、情報処理システム２は、学習結果に基づき算出した制御情報を運用者に対して提案として提示し、最終的に運用者によって判断された制御情報を用いて運用を行いながら、学習部２０６による学習を継続するモードとなる。

また、第３の運用モードを指定する情報が取得された場合（ステップＦ２２で第３の運用モード）について説明する。この場合、運用モード切替部２１１は、制御情報算出部２０８、学習部２０６、判断情報取得部１０１および評価値取得部２０９を、次のように制御する（ステップＦ２５）。

すなわち、この場合、運用モード切替部２１１は、制御情報取得部２０３および学習部２０６を機能させないよう制御する。また、運用モード切替部２１１は、評価値取得部２０９を機能させないよう制御する。また、運用モード切替部２１１は、制御情報算出部２０８に、図１５に示した制御情報の算出動作を実行させるよう制御する。

これにより、情報処理システム２は、第１および第２の運用モードによって調整された学習結果を用いて算出される制御情報を用いて、運用を自動化したモードとなる。

次に、情報処理システム２の動作を具体例で示す。

この具体例では、管制対象物は、人工衛星であるものとする。また、図１７に示すように、情報処理システム２は、人工衛星に対応して地上に設けられた地上局の送受信設備および変復調設備に接続される。また、情報処理システム２は、地上局周辺の天候を検出する付帯設備に接続される。

ここでは、判断情報としては、送受信設備から送信されるＡＧＣ（Automatic Gain Control）受信レベルおよび現ループバンド、変復調設備から送信される現ビットレート、および、付帯設備から送信される現在の気象情報および気象予報情報があるとものする。これらの判断情報は、地上局制御装置３００に対して送信される。

また、制御情報としては、送受信設備に対するループバンド設定制御、変復調設備に対するビットレート設定制御、および、運用を終了する制御の３種類があるものとする。

まず、図４に示した動作により、判断情報記憶部１０２に記憶される判断情報の一例を、図１８に示す。図１８において、各行は、同時に取得された判断情報のエントリを表す。各エントリは、タグ、取得日時、および、上述した各種の判断情報から構成される。

各エントリにおいて、取得日時は、そのエントリの判断情報が取得された日時を表す。また、ＡＧＣ受信レベル、現ループバンド、および現ビットレートについては、取得された値がそのまま格納される。また、現在の気象情報および気象予報情報は、図１９に示す対応表に基づく値が格納される。現在の気象情報は、その情報が取得された時点での気象を表す。また、気象予報情報は、その情報が取得された時点以降、所定期間までの所定間隔毎の気象の予報を表す。図１９の例では、各エントリにおいて、気象予報情報は、その情報が取得された時点から２時間後までの３０分毎の気象の予報を表す計４個の数値からなる。

また、各エントリにおいて、タグは、そのエントリの判断情報を用いて決定された制御情報の識別情報を表す。ここでは、制御情報の識別情報は、制御日時である。つまり、タグには、後述する制御情報記憶部１０４における該当するエントリの制御日時が格納される。なお、タグは、判断情報のエントリが作成された時点では、まだ格納されていなくてもよい。タグは、例えば、図５または図１２に示したステップＢ１５において格納される。

この例では、制御情報を決定する処理を実行する時点の直近Ｎ秒間において取得された判断情報が、制御情報の決定に用いられるものとする。例えば、図１８では、１～５行目までの各エントリに、同一の制御情報の識別情報である制御日時「xxx-xx xx:xx」がタグとして格納されている。つまり、１～５行目までの判断情報は、制御日時「xxx-xx xx:xx」を識別情報とする制御情報が決定される際に用いられた判断情報である。

次に、図５または図１２に示した動作により、制御情報記憶部１０４に記憶される制御情報の一例を、図２０に示す。図２０において、各行は、制御情報取得部２０３によって地上局制御装置３００を介して地上局に送信された制御情報のエントリを表す。各エントリは、制御日時、ビットレート設定値、ループバンド設定値および運用終了制御値からなる。制御日時は、この制御情報が取得または算出された日時を表す。また、ビットレート設定値は、変復調設備のビットレートを当該値に設定する制御を表す。また、ループバンド設定値は、送受信設備のループバンドを当該値に設定する制御を表す。また、運用終了制御値は、１がオフ（運用終了）を表し、０がオン（運用継続）を表す。

次に、図１０または図１３に示した動作により、評価値記憶部２１０に記憶される評価値の一例を、図２１に示す。図２１において、各行は、評価値のエントリを表す。各エントリは、タグと、評価値とからなる。タグは、評価対象である制御情報の識別情報（ここでは制御日時）を表す。評価値は、ここでは、０から１００までの任意の整数をとるよう定義されている。１００は、最も良い評価を表し、０は、最も悪い評価を表す。評価値には、ステップＥ２２またはＥ２５において運用者等によって入力された値が格納される。

次に、このような具体例において、情報処理システム２が学習を行う動作について説明する。なお、この動作は、第１および第２の運用モードにおいて実行される。

まず、学習部２０６は、図１８の判断情報記憶部１０２と、図２０の制御情報記憶部１０４とを照合し、制御情報と、その制御日時がタグとして格納された１つ以上の判断情報との組を、学習データとして生成する（ステップＣ２１）。

次に、学習部２０６は、図２１の制御情報記憶部１０４を参照することにより、評価値が閾値（例えば５０）より低いエントリを抽出し、そのタグが示す制御情報を含む学習データを、ステップＣ２１で生成した学習データから削除する（ステップＣ２２）。
これにより、質の悪い学習データが取り除かれ、質の良い学習データが抽出される。

次に、学習部２０６は、ステップＣ２２で残った学習データを用いて、制御の種類毎に、機械学習を行う。ここでは、機械学習のアルゴリズムとして、Ｍ（Ｍは正の整数）個の層を持つ階層型ニューラルネットワークを用いるとする（ステップＣ２３）。

まず、ニューラルネットワークの入力信号は、次式１で表される。

ここで、Ｎは、制御情報の決定に用いられる判断情報の数を表している。ここでは、制御情報の決定には、制御日時の直近Ｎ秒間に取得された判断情報が用いられ、判断情報が１秒毎に取得されるとする。したがって、学習データは、Ｎ個の判断情報と、１つの制御情報とからなる。式１では、Ｎ秒間に取得されたＮ個の現ビットレートを代表する値をＢＲと表し、Ｎ個の現ループバンドを代表する値をＬＢと表している。代表する値は、Ｎ個のうちの最新の値、平均値、最大値、最小値等であってもよいが、その他の統計値であってもよい。また、Ｎ秒間に取得されたＮ個のＡＧＣ受信レベルをＬＶ＝｛ＬＶ（１），・・・，ＬＶ（Ｎ）｝と表している。また、Ｎ秒間に取得されたＮ個の気象情報をＷＩ＝｛ＷＩ（１），・・・，ＷＩ（Ｎ）｝と表している。また、Ｎ秒間に取得されたＮ個の気象予報情報を代表する情報をＦＣ＝｛ＦＣ（１），・・・，ＦＣ（４）｝と表している。１つの気象予報情報が４つの数値からなるため、ここでは、Ｎ個の気象予報情報を代表する情報として、例えば、最新の気象予報情報の４つの値ＦＣ（１）～ＦＣ（４）が採用されている。ただし、Ｎ個の気象予報応報を代表する情報は、その他の統計情報であってもよい。

また、ニューラルネットワークの第ｍ層における第ｊ番目のニューロンの出力をｏ（ｍ，ｊ）と表すと、第一層の出力は、入力信号を用いて、次式２で表される。

また、他の層の出力は、次式３で表される。

ここで、ｗ（ｊ，ｉ，ｍ－１）は、第ｍ－１層の第ｉ番目のニューロンから出力され第ｍ層の第ｊ番目のニューロンに入力される値に対して乗算される重みを表す。また、Ｌ_ｍ－１は、第ｍ－１層のニューロンの数を表す。また、ｆ（ｘ）は活性化関数を表し、例えば、次式４を用いるとする。

また、ニューラルネットワークの学習手法として、例えば、誤差逆伝搬法を用いるとする。誤差逆伝搬法では、次式５に示すように、出力層の出力と教師信号との二乗誤差を最小にするように、重みｗの計算が行われる。

ここで、ｙ（ｉ）は、教師信号を表す。例えば、ビットレート設定値に関する制御情報を教師信号とする機械学習について考える。また、例えば、ビットレートとして設定可能な値が、５０、１００、１５０の３つであることを想定する。この場合、ｙ（１）に設定値５０を割り当て、ｙ（２）に設定値１００を割り当て、ｙ（３）に設定値１５０を割り当てる。ここで、学習データの制御情報のビットレート設定値が５０である場合、教師信号としては、ｙ（１）＝１，ｙ（２）＝０，ｙ（３）＝０が適用される。つまり、ｙ（ｉ）は、割り当てられた設定値が教師信号の設定値であるか否かを１または０で表している。

このようにして、学習部２０６は、ビットレート設定制御、ループバンド設定制御、運用終了制御に対するニューラルネットワークを個別に構築し、逆誤差伝搬法によって重みを計算する。そして、学習部２０６は、ビットレート設定制御に対する重み、ループバンド設定制御に対する重み、運用終了制御に対する重みをそれぞれ算出する。

つまり、学習部２０６は、学習データの判断情報を入力信号とし、学習データの制御情報に含まれるビットレート設定値を教師信号として、１つ目のニューラルネットワークの重み学習を行う。また、学習部２０６は、学習データの判断情報を入力信号とし、学習データの制御情報に含まれるループバンド設定値を教師信号として、２つ目のニューラルネットワークの重み学習を行う。また、学習部２０６は、学習データの判断情報を入力信号とし、学習データの制御情報に含まれる運用終了制御値を教師信号として、３つ目のニューラルネットワークの重み学習を行う。

次に、学習部２０６は、制御情報の種類毎に求めた重みを学習結果として、学習結果記憶部１０７に記憶する（ステップＣ２４）。

以上で、この具体例において、情報処理システム２が学習を行う動作の説明を終了する。

次に、このように構築された制御の種類ごとのニューラルネットワークを用いて、情報処理システム２が制御情報を算出する動作について説明する。なお、ここでは、第３の運用モードにおける制御情報の算出を例として説明する。

ここでは、まず、制御情報算出部２０８は、図１８に示した判断情報記憶部１０２から、現在時刻までの直近Ｎ秒間に追加された判断情報を読み込む（ステップＤ３１）。

次に、制御情報算出部２０８は、読み込んだ判断情報を式１に示した入力信号とする。そして、制御情報算出部２０８は、学習結果記憶部１０７から、ビットレート設定制御について構築したニューラルネットワークの重みを読み込み、それぞれ、式２および式３を繰り返し適用することによって、出力層の出力を算出する。

そして、制御情報算出部２０８は、出力層のニューロンの中で、最も１に近い値を出力したニューロンに割り当てられた制御を選択する。例えば、図２２に示すように、ビットレート設定制御のニューラルネットワーク出力層（第Ｍ層）がｏ（Ｍ，１），ｏ（Ｍ，２），ｏ（Ｍ，３）の３個のニューロンで構成されているとする。また、ビットレートとして設定可能な値が５０、１００、１５０の３つで、ｏ（Ｍ，１）に５０、ｏ（Ｍ，２）に１００、ｏ（Ｍ，３）に１５０が割り当てられているとする。この時、制御情報算出部２０８が、ｏ（Ｍ，１）＝０．２４、ｏ（Ｍ，２）＝０．８９、ｏ（Ｍ，３）＝０．１０を算出したものとする。この場合、制御情報算出部２０８は、ビットレートを設定する制御情報として、最も１に近いｏ（Ｍ，２）＝０．８９に割り当てられたビットレート設定値１００を選択する（テップＤ３２）。

そして、制御情報算出部２０８は、ビットレート設定値１００を、地上局制御部１０５に送信する。

そして、地上局制御部１０５は、受信したビットレート設定値１００が、現在の送受信設備の設定を変更する内容であるか否かを判断する。変更する内容である場合に（ステップＤ３３でＹｅｓ）、地上局制御部１０５は、ビットレート設定値１００を、地上局に送信する（ステップＤ３４）。

同様に、情報処理システム２は、ループバンド設定制御および運用終了制御についても、同様にステップＤ３２～Ｄ３４を実行する。

そして、情報処理システム２は、運用終了制御について算出された制御情報が運用終了でなかった場合（ステップＤ３５でＮｏ）、ステップＤ３１からの動作を繰り返す。

一方、情報処理システム２は、運用終了制御について算出された制御情報が運用終了であった場合（ステップＤ３５でＹｅｓ）、動作を終了する。

このように、この具体例では、機械学習として適用したニューラルネットワークを、制御の種類毎に個別に構築する。また、ニューラルネットワークの出力層のニューロン数を、その種類の制御において指定し得る制御値の個数と同数にする。これにより、本実施の形態の具体例は、制御情報の演算精度を高めている。

なお、本実施の形態の具体例と比較するため、機械学習としてニューラルネットワークを制御の種類毎に構築しないケースについて説明する。この場合、例えば、図２３に示すように、出力層のｏ（Ｍ，１）にビットレート設定値を割り当て、ｏ（Ｍ，２）にループバンド設定値を割り当て、Ｏ（Ｍ，３）に運用終了制御値（運用終了の必要性を表す０～１までの任意の実数値）を割り当てたとする。運用終了制御値は、閾値（例えば０．５）以上が算出された場合に、制御情報として運用終了を表す１が採用されるとする。この時、ｏ（Ｍ，１）＝２５６、ｏ（Ｍ，２）＝１００、Ｏ（Ｍ，３）＝０．８が出力されたとする。この場合、ビットレート設定値が２５６であり、ループバンド設定値が１００であり、運用終了制御値が１である制御情報が算出されることになる。このような機械学習は、１つのニューラルネットワークを用いて異なる種類の制御に関する重みの学習を行わなければならない。したがって、本実施の形態の具体例のように制御の種類毎にニューラルネットワークを個別に構築する場合に比べて、演算精度が低下することになる。

また、本実施の形態の具体例と比較するため、機械学習として制御の種類毎にニューラルネットワークを構築する場合であっても、図２４に示すように、出力層のニューロンを１つにしてその出力値を設定値として適用するケースについて説明する。しかしながら、出力層の１つのニューロンから出力される値を設定値として採用する場合、設定値として算出され得る値が多岐に渡ることになり、その分、制御情報の演算精度が低下する。これに対し、本実施の形態の具体例では、出力層のニューロンの数を、指定し得る設定値の個数と同数にしている。これにより、本実施の形態は、各ニューロンの出力値を比較することができ、各ニューロンの出力値に多少の誤差が生じていても、誤差を吸収してより適切な設定値を選択できる可能性を高くしている。

以上で、具体例の説明を終了する。

次に、本発明の第２の実施の形態の効果について述べる。

本実施の形態としての情報処理システムは、事前に制御ルールを定める必要なく、対象物を管制する装置の制御をさらに高精度に自動化することができる。

その理由について説明する。本実施の形態は、本発明の第１の実施の形態と同様の構成に加えて、評価値取得部が、制御情報に対する評価値を取得して、評価値記憶部に記憶する。そして、学習部が、所定条件を満たす評価値の評価対象となった制御情報を含む学習データを用いて、機械学習を行うからである。

これにより、本実施の形態は、運用者による判断に基づく制御情報や、制御情報算出部によって算出された制御情報のうち、評価の低い制御情報を学習の対象から除外して、機械学習を行うことができる。その結果、本実施の形態は、制御情報の演算精度をさらに高めることができる。また、本実施の形態は、評価値を用いることにより、制御情報の算出を自動化する性能の評価を、運用を行いながら実施することができ、その結果、評価にかかる技術者等の人的コストを大幅に削減する。

さらに、本実施の形態では、学習部が、制御情報が表す制御の種類ごとに機械学習を行い、制御情報算出部が、判断情報に対して、制御の種類ごとの学習結果を適用することにより、制御情報を算出して出力するからである。

これにより、本実施の形態は、異なる種類の制御情報を１つの機械学習で導出させるよう学習する場合と比較して、学習の精度を高め、その結果、制御情報の演算精度を高めることができる。

さらに、本実施の形態では、運用モード切替部が、第１、第２および第３の運用モードのいずれかに切り替えて運用を行うからである。第１の運用モードは、制御情報取得部および学習部を機能させて制御情報算出部を機能させない運用モードである。第２の運用モードは、制御情報取得部、学習部および制御情報算出部を共に機能させる運用モードである。また、第３の運用モードは、制御情報取得部および学習部を機能させずに制御情報算出部を機能させる運用モードである。

このように、本実施の形態は、第１～第３の運用モードを切り替え可能に提供することで、運用者による運用から、自動化による運用まで、短期間で段階的に移行することを可能とする。

なお、本実施の形態の具体例において、管制対象物が人工衛星である例について説明したが、管制対象物は、人工衛星に限定されない。例えば、管制対象物は、航空レーダを用いて管制を行う航空機であってもよい。

また、本実施の形態の具体例において、判断情報として、現ビットレート、現ループバンド、気象情報、気象予報情報を採用する例について説明した。これに限らず、判断情報としては、地上局の状態や地上局周辺の環境を表すその他の各種の情報を適用可能である。

例えば、本実施の形態の具体例において、判断情報の１つは、管制対象物との通信を行うアンテナ周辺の環境を表す情報であってもよい。また、アンテナ周辺の環境を検出する付帯設備として、アンテナ周辺を監視するカメラが適用されてもよい。この場合、本実施の形態は、環境情報として、気象情報だけでなく、アンテナ周辺に鳥が飛んでいる等の環境を基に、電波の質が悪いため運用を終了させる、等の運用者による制御を学習して自動化に用いることが可能である。

また、例えば、本実施の形態の具体例において、判断情報の１つは、アンテナの方位角および仰角を表す情報であってもよい。この場合、本実施の形態は、地上局の状態として、アンテナが向いている方向も考慮した運用者による制御を学習して自動化に用いることが可能である。

また、本実施の形態の具体例において、図１９に示した気象情報の種類は、これらに限らない。また、これらの情報は、必ずしも数値で表される必要はない。

また、本実施の形態の具体例において、図２０に示したように、制御の種類として、ループバンド設定制御、ビットレート設定制御、運用終了制御の３種類を適用した例について説明したが、制御の種類は、これらに限定されない。

また、本実施の形態の具体例において、学習データとして採用するための評価値の所定条件として、閾値以上であることを例示した。これに限らず、評価値の所定条件は、他の条件や、複数の条件の組み合わせであってもよい。

また、上述した本発明の各実施の形態において、情報処理システムの各機能ブロックが、地上局制御装置、自動運用装置、および、運用端末の各装置に分散されて実現される例について説明した。これに限らず、情報処理システムの各機能ブロックは、その他の任意の構成の複数の装置上に分散して実現されてもよい。また、情報処理システムの各機能ブロックは、１つのコンピュータ装置上に実現されてもよい。

また、上述した本発明の各実施の形態において、情報処理システムの各機能ブロックが、メモリに記憶されたコンピュータ・プログラムを実行するＣＰＵによって実現される例を中心に説明した。これに限らず、各機能ブロックの一部、全部、または、それらの組み合わせは、専用のハードウェアにより実現されていてもよい。

また、上述した本発明の各実施の形態において、各フローチャートを参照して説明した情報処理システムの動作を、本発明のコンピュータ・プログラムとしてコンピュータ装置の記憶装置（記憶媒体）に格納しておく。そして、係るコンピュータ・プログラムを当該ＣＰＵが読み出して実行するようにしてもよい。そして、このような場合において、本発明は、係るコンピュータ・プログラムのコードあるいは記憶媒体によって構成される。

また、上述した各実施の形態は、適宜組み合わせて実施されることが可能である。

また、本発明は、上述した各実施の形態に限定されず、様々な態様で実施されることが可能である。

１、２情報処理システム
１０１判断情報取得部
１０２判断情報記憶部
１０３、２０３制御情報取得部
１０４制御情報記憶部
１０５地上局制御部
１０６、２０６学習部
１０７学習結果記憶部
１０８、２０８制御情報算出部
２０９評価値取得部
２１０評価値記憶部
２１１運用モード切替部
３００地上局制御装置
４００、４１０自動運用装置
５００、５１０運用端末
３００１、４００１、５００１ＣＰＵ
３００２、４００２、５００２メモリ
５００３出力装置
５００４入力装置
３００５、４００５、５００５ネットワークインタフェース

Claims

管制対象物との通信を行う地上局の状態を表す情報と前記地上局周辺の環境を表す情報とを含む判断情報を取得する判断情報取得部と、
前記判断情報を記憶する判断情報記憶部と、
前記判断情報に基づいて決定された前記地上局に対する制御内容を表す制御情報を取得する制御情報取得部と、
前記制御情報を記憶する制御情報記憶部と、
前記制御情報を前記地上局に送信して前記地上局を制御する地上局制御部と、
前記判断情報記憶部に記憶された前記判断情報および前記制御情報記憶部に記憶された前記制御情報を学習データとして機械学習を行う学習部と、
前記機械学習の学習結果を記憶する学習結果記憶部と、
前記判断情報に対して、前記学習結果記憶部に記憶された前記学習結果を適用することにより、前記制御情報を算出する制御情報算出部と、
を備え、
前記学習部は、前記制御情報が表す制御の種類ごとに前記機械学習を行い、
前記制御情報算出部は、前記判断情報に対して、前記制御の種類ごとの前記学習結果を適用することにより、前記制御情報を算出し、
前記制御情報取得部は、前記判断情報と、前記制御情報算出部によって算出された前記制御情報とを運用者に提示し、前記運用者によって入力された制御情報を取得し、
前記地上局制御部は、前記運用者によって入力された前記制御情報を前記地上局に送信して前記地上局を制御する
情報処理システム。
前記制御情報算出部は、算出した前記制御情報を前記地上局制御部に送信し、
前記地上局制御部は、前記制御情報算出部から受信した前記制御情報を前記地上局に送信することを特徴とする請求項１に記載の情報処理システム。
前記制御情報算出部は、算出した前記制御情報を前記制御情報取得部に送信し、
前記制御情報取得部は、前記制御情報算出部から受信した前記制御情報と前記判断情報とに基づいて決定された前記制御情報を取得することを特徴とする請求項１または請求項２に記載の情報処理システム。
前記制御情報に対する評価を表す評価値を取得する評価値取得部と、
前記評価値を記憶する評価値記憶部と、
をさらに備え、
前記学習部は、前記学習データのうち、所定条件を満たす前記評価値の評価対象となった前記制御情報を含む学習データを用いて、前記機械学習を行うことを特徴とする請求項１から請求項３のいずれか１項に記載の情報処理システム。
前記制御情報取得部および前記学習部を機能させて前記制御情報算出部を機能させない第１の運用モード、前記制御情報取得部、前記学習部および前記制御情報算出部を共に機能させる第２の運用モード、並びに、前記制御情報取得部および前記学習部を機能させずに前記制御情報算出部を機能させる第３の運用モードのいずれかに切り替える運用モード切替部をさらに備え、
前記制御情報取得部は、前記第２の運用モードにおいて、前記判断情報と、前記制御情報算出部によって算出された前記制御情報とに基づき前記運用者によって入力された制御情報を取得し、
前記学習部は、前記第２の運用モードにおいて、さらに、前記判断情報と、前記運用者によって入力された前記制御情報または前記制御情報算出部によって算出された前記制御情報との組み合わせのうち、所定条件を満たす組み合せを学習データとして前記機械学習を行う、
ことを特徴とする請求項１から請求項４のいずれか１項に記載の情報処理システム。
請求項１から請求項５のいずれか１項に記載の情報処理システムにおいて、
前記判断情報記憶部と、前記制御情報記憶部と、前記学習部と、前記学習結果記憶部と、前記制御情報算出部とを有する自動運用装置。
請求項１から請求項５のいずれか１項に記載の情報処理システムにおいて、
前記制御情報取得部を有する運用端末。
管制対象物との通信を行う地上局の状態を表す情報と前記地上局周辺の環境を表す情報とを含む判断情報、および、前記判断情報に基づいて決定された前記地上局に対する制御内容を表す制御情報を学習データとして機械学習を行う際に、前記制御情報が表す制御の種類ごとに前記機械学習を行い、
前記判断情報に対して、前記制御の種類ごとの前記機械学習の学習結果を適用することにより、前記制御情報を算出し、
前記判断情報と算出した前記制御情報とを運用者に提示し、前記運用者によって入力された制御情報を前記地上局に送信して前記地上局を制御する方法。
管制対象物との通信を行う地上局の状態を表す情報と前記地上局周辺の環境を表す情報とを含む判断情報、および、前記判断情報に基づいて決定された前記地上局に対する制御内容を表す制御情報を学習データとして機械学習を行う際に、前記制御情報が表す制御の種類ごとに前記機械学習を行う機械学習ステップと、
前記判断情報に対して、前記制御の種類ごとの前記機械学習の学習結果を適用することにより、前記制御情報を算出する制御情報算出ステップと、
前記判断情報と算出した前記制御情報とを運用者に提示し、前記運用者によって入力された制御情報を前記地上局に送信して前記地上局を制御する制御ステップと、
をコンピュータ装置に実行させるプログラム。