JP2018194932A - 制御装置、制御プログラム、学習データ作成方法、及び学習方法 - Google Patents

制御装置、制御プログラム、学習データ作成方法、及び学習方法 Download PDF

Info

Publication number
JP2018194932A
JP2018194932A JP2017096165A JP2017096165A JP2018194932A JP 2018194932 A JP2018194932 A JP 2018194932A JP 2017096165 A JP2017096165 A JP 2017096165A JP 2017096165 A JP2017096165 A JP 2017096165A JP 2018194932 A JP2018194932 A JP 2018194932A
Authority
JP
Japan
Prior art keywords
control
learning
target device
output
value
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2017096165A
Other languages
English (en)
Other versions
JP6915371B2 (ja
Inventor
安藤 丹一
Tanichi Ando
丹一 安藤
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Omron Corp
Original Assignee
Omron Corp
Omron Tateisi Electronics Co
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Omron Corp, Omron Tateisi Electronics Co filed Critical Omron Corp
Priority to JP2017096165A priority Critical patent/JP6915371B2/ja
Priority to PCT/JP2018/016703 priority patent/WO2018211927A1/en
Publication of JP2018194932A publication Critical patent/JP2018194932A/ja
Application granted granted Critical
Publication of JP6915371B2 publication Critical patent/JP6915371B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/045Combinations of networks

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Health & Medical Sciences (AREA)
  • Computing Systems (AREA)
  • Biomedical Technology (AREA)
  • Biophysics (AREA)
  • Computational Linguistics (AREA)
  • Data Mining & Analysis (AREA)
  • Evolutionary Computation (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Molecular Biology (AREA)
  • Artificial Intelligence (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Mathematical Physics (AREA)
  • Software Systems (AREA)
  • Health & Medical Sciences (AREA)
  • Feedback Control In General (AREA)
  • Air Conditioning Control Device (AREA)

Abstract

【課題】複数の制御の間で競合が発生しても、制御対象装置が動作不能に陥らないようにする技術を提供する。【解決手段】本発明の一側面に係る制御装置は、第1の制御対象装置の動作を制御するための学習を行った学習済みの第1の学習器から出力される制御値に基づいて、当該第1の制御対象装置の動作を制御する第1の制御処理部と、第2の制御対象装置の動作を制御するための学習を行った学習済みの第2の学習器から出力される制御値に基づいて、当該第2の制御対象装置の動作を制御する第2の制御処理部と、前記第1の学習器から出力される制御値に基づく前記第1の制御対象装置の制御と前記第2の学習器から出力される制御値に基づく前記第2の制御対象装置の制御とが競合する場合に、前記第1の制御対象装置及び前記第2の制御対象装置の制御を修正することで、当該競合を解消する競合解消部と、を備える。【選択図】図5

Description

本発明は、制御装置、制御プログラム、学習データ作成方法、及び学習方法に関する。
近年、所望の装置の動作を制御する機能の習得に、ディープラーニング等の機械学習が用いられることがある。例えば、特許文献1では、ニューラル装置を利用したインテリジェント住宅システムが提案されている。具体的には、特許文献1では、アイデンティティ情報、座標情報、及び使用者が過去に電子装置を調節した制御情報を用いて、使用者の慣用の操作状態に当該電子装置を調節制御する機能を習得する機械学習を行うシステムが提案されている。
特表2016−532355号公報
上記のとおり、機械学習を利用すれば、所望の装置の動作を制御する機能を習得したシステムを容易に構築することができる。しかしながら、本件発明者は、制御対象装置の動作を制御する機能を機械学習により習得したシステムでは、次のような問題点が発生し得ることを見出した。
すなわち、制御対象装置の動作を制御する機能を機械学習により習得した複数の異なる学習器を利用する場合に、1又は複数の制御対象装置に対する複数の制御の間で競合が発生する可能性がある。例えば、各使用者に応じて構築した学習器を利用して同一の制御対象装置を制御する場合に、異なる使用者の学習器から異なる動作を実行させる制御指令が発行されると、当該制御対象装置の制御に競合が発生してしまう。また、例えば、各制御対象装置に応じて構築した学習器を利用して複数の制御対象装置を同時に制御する場合に、同一の場所に移動させる等の同時に実現できない動作を実行させる制御指令が発行されると、当該複数の制御対象装置の制御に競合が発生してしまう。このような制御の競合が発生した場合に、従来のシステムでは、制御対象装置が動作不能に陥ってしまう可能性があるという問題点を本件発明者は見出した。
本発明は、一側面では、このような実情を鑑みてなされたものであり、その目的は、複数の制御の間で競合が発生しても、制御対象装置が動作不能に陥らないようにする技術を提供することである。
本発明は、上述した課題を解決するために、以下の構成を採用する。
すなわち、本発明の一側面に係る制御装置は、第1の制御対象装置の動作を制御するための学習を行った学習済みの第1の学習器から出力される制御値に基づいて、当該第1の制御対象装置の動作を制御する第1の制御処理部と、第2の制御対象装置の動作を制御するための学習を行った学習済みの第2の学習器から出力される制御値に基づいて、当該第2の制御対象装置の動作を制御する第2の制御処理部と、前記第1の学習器から出力される制御値に基づく前記第1の制御対象装置の制御と前記第2の学習器から出力される制御値に基づく前記第2の制御対象装置の制御とが競合する場合に、前記第1の制御対象装置及び前記第2の制御対象装置の制御を修正することで、当該競合を解消する競合解消部と、を備える。
当該構成では、第1の制御処理部が、第1の学習器を利用して、第1の制御対象装置の動作を制御する。また、第2の制御処理部が、第2の学習器を利用して、第2の制御対象装置の動作を制御する。そして、第1の制御対象装置の制御と第2の制御対象装置の制御との間に競合が発生する場合には、競合解消部が、第1の制御対象装置及び第2の制御対象装置の制御を修正することで、当該競合を解消する。したがって、当該構成によれば、複数の制御の間で競合が発生しても、制御対象装置が動作不能に陥らないようにすることができる。なお、第1の制御対象装置及び第2の制御対象装置は、同一の制御対象装置であってもよいし、互いに異なる制御対象装置であってもよい。また、制御対象装置は、制御対象となり得るあらゆる種類の装置を含んでよく、例えば、空調装置、ロボット装置等であってよい。
上記一側面に係る制御装置において、前記競合解消部は、前記第1の学習器から出力される前記第1の制御対象装置の制御値及び前記第2の学習器から出力される前記第2の制御対象装置の制御値を入力すると、前記競合を解消するように修正された前記第1の制御対象装置の制御値及び前記第2の制御対象装置の制御値を出力するように学習を行った学習済みの第3の学習器を利用して、前記競合を解消してもよい。当該構成によれば、制御対象装置の制御が複雑に競合し得る場合であっても、当該制御対象装置に生じ得る競合を容易に解消することができる。
上記一側面に係る制御装置は、前記第1の学習器から出力される前記第1の制御対象装置の制御値及び前記第2の学習器から出力される前記第2の制御対象装置の制御値に基づいて、前記第1の制御対象装置及び前記第2の制御対象装置の制御がどのように競合するかを示す競合種別情報を特定する競合種別特定部を更に備えてよく、前記競合解消部は、特定された前記競合種別情報を前記第3の学習器に更に入力してもよい。当該構成によれば、競合の仕方(種別)に応じて、適した競合の解消方法を採用するようにすることができる。
上記一側面に係る制御装置において、前記競合種別特定部は、前記第1の学習器から出力される前記第1の制御対象装置の制御値及び前記第2の学習器から出力される前記第2の制御対象装置の制御値を入力すると、前記競合種別情報に対応する出力値を出力するように学習を行った学習済みの第4の学習器を利用して、前記競合種別情報を特定してもよい。当該構成によれば、制御対象装置の制御が複雑に競合し得る場合であっても、当該制御対象装置に生じ得る競合の種別を容易に特定することができる。
上記一側面に係る制御装置において、前記第1、第2、第3及び第4の学習器はそれぞれニューラルネットワークにより構成されてよい。当該構成によれば、制御対象装置の制御に生じ得る競合を解消可能な制御装置を簡易に実現することができる。
上記一側面に係る制御装置において、前記競合解消部は、前記第1の学習器から出力される制御値に基づく前記第1の制御対象装置の制御、及び前記第2の学習器から出力される制御値に基づく前記第2の制御対象装置の制御のいずれか一方を優先することで、前記競合を解消してもよい。当該構成によれば、第1の学習器から出力される制御値及び第2の学習器から出力される制御値のいずれか一方を優先し、他方を無視することで、制御対象装置の制御に生じる競合を確実に解消することができる。
上記一側面に係る制御装置において、前記第1の制御対象装置と前記第2の制御対象装置とは同一の制御対象装置であってよく、前記競合解消部は、前記第1の学習器から出力される制御値と前記第2の学習器から出力される制御値とを平均化することで、前記競合を解消してもよい。当該構成によれば、第1の学習器から出力される制御値及び第2の学習器から出力される制御値の平均値を採用することで、制御対象装置の制御に生じる競合を解消することができる。
なお、上記各形態に係る制御装置の別の形態として、以上の各構成を実現する情報処理方法であってもよいし、プログラムであってもよいし、このようなプログラムを記録したコンピュータその他装置、機械等が読み取り可能な記憶媒体であってもよい。ここで、コンピュータ等が読み取り可能な記録媒体とは、プログラム等の情報を、電気的、磁気的、光学的、機械的、又は、化学的作用によって蓄積する媒体である。
例えば、本発明の一側面に係る制御プログラムは、第1の制御対象装置及び第2の制御対象装置の動作を制御するコンピュータに、前記第1の制御対象装置の動作を制御するための学習を行った学習済みの第1の学習器から出力される前記第1の制御対象装置を制御するための制御値を取得するステップと、前記第2の制御対象装置の動作を制御するための学習を行った学習済みの第2の学習器から出力される前記第2の制御対象装置を制御するための制御値を取得するステップと、前記第1の学習器から出力される制御値に基づく前記第1の制御対象装置の制御と前記第2の学習器から出力される制御値に基づく前記第2の制御対象装置の制御とが競合する場合に、当該競合を解消するように修正された前記第1の制御対象装置の制御値及び前記第2の制御対象装置の制御値を取得するステップと、取得された前記制御値に基づいて前記第1の制御対象装置及び前記第2の制御対象装置を制御するステップと、を実行させるためのプログラムである。
また、本発明の一側面に係る学習データ作成方法は、第1の制御対象装置の動作を制御するための学習を行った学習済みの第1の学習器から出力される当該第1の制御対象装置を制御するための制御値を取得するステップと、第2の制御対象装置の動作を制御するための学習を行った学習済みの第2の学習器から出力される当該第2の制御対象装置を制御するための制御値を取得するステップと、前記第1の学習器から出力される制御値に基づく前記第1の制御対象装置の制御と前記第2の学習器から出力される制御値に基づく前記第2の制御対象装置の制御とが競合するか否かを判定するステップと、前記第1の学習器から出力される制御値に基づく前記第1の制御対象装置の制御と前記第2の学習器から出力される制御値に基づく前記第2の制御対象装置の制御とが競合する場合に、当該競合を解消するように前記第1の制御対象装置及び前記第2の制御対象装置の制御値の修正値を決定するステップと、前記第1の学習器から得られた制御値及び前記第2の学習器から得られた制御値を入力データとし、決定された前記修正値を教師データとして、学習器の学習を行うための学習データを作成するステップと、を備える。当該構成によれば、制御対象装置の制御に生じ得る競合の解消に利用する上記第3の学習器を構築するための学習データを収集することができる。
上記一側面に係る学習データ作成方法において、前記修正値は、オペレータの入力により決定されてよい。制御対象装置が人の利用する装置である場合に、制御対象装置の制御に生じ得る競合の解消に利用する第3の学習器の構築に最適な学習データを作成することができる。
上記一側面に係る学習データ作成方法において、前記修正値は、所定の規則に従って決定されてよい。当該構成によれば、第3の学習器の構築に利用する学習データを簡易に作成することができる。
また、本発明の一側面に係る学習方法は、上記いずれかの形態に係る学習データ作成方法により作成した前記学習データを取得するステップと、取得した前記学習データにより学習器の学習を行うステップと、を備える。当該構成によれば、制御対象装置の制御に生じ得る競合の解消に利用する上記第3の学習器を構築することができる。
本発明によれば、複数の制御の間で競合が発生しても、制御対象装置が動作不能に陥らないようにする技術を提供することができる。
図1は、実施の形態に係る制御装置及び学習装置の適用場面の一例を模式的に例示する。 図2は、実施の形態に係る制御装置のハードウェア構成の一例を模式的に例示する。 図3は、実施の形態に係るデータ収集用制御装置のハードウェア構成の一例を模式的に例示する。 図4は、実施の形態に係る学習装置のハードウェア構成の一例を模式的に例示する。 図5は、実施の形態に係る制御装置の機能構成の一例を模式的に例示する。 図6は、実施の形態に係るデータ収集用制御装置の機能構成の一例を模式的に例示する。 図7は、実施の形態に係る学習装置の機能構成の一例を模式的に例示する。 図8は、実施の形態に係る制御装置の処理手順の一例を例示する。 図9は、実施の形態に係るデータ収集用制御装置の処理手順の一例を例示する。 図10は、実施の形態に係る学習装置の処理手順の一例を例示する。 図11は、変形例に係る制御装置の構成の一例を模式的に例示する。 図12は、変形例に係る制御装置の構成の一例を模式的に例示する。 図13は、変形例に係る制御装置の構成の一例を模式的に例示する。
以下、本発明の一側面に係る実施の形態(以下、「本実施形態」とも表記する)を、図面に基づいて説明する。ただし、以下で説明する本実施形態は、あらゆる点において本発明の例示に過ぎない。本発明の範囲を逸脱することなく種々の改良や変形を行うことができることは言うまでもない。つまり、本発明の実施にあたって、実施形態に応じた具体的構成が適宜採用されてもよい。なお、本実施形態において登場するデータを自然言語により説明しているが、より具体的には、コンピュータが認識可能な疑似言語、コマンド、パラメータ、マシン語等で指定される。
§1 適用例
まず、図1を用いて、本発明が適用される場面の一例について説明する。図1は、本実施形態に係る制御装置1及び学習装置3の適用場面の一例を模式的に例示する。
図1に示されるとおり、本実施形態に係る制御装置1は、複数の利用者(図1では、利用者A及びB)からの指示に従って、制御対象装置である空調装置4の動作を制御する情報処理装置である。空調装置4は、例えば、室内の温度を調節する公知のエア・コンディショナであり、本発明の「第1の制御対象装置」及び「第2の制御対象装置」に相当する。すなわち、本実施形態では、第1の制御対象装置及び第2の制御対象装置は同一である。ただし、第1の制御対象装置及び第2の制御対象装置は、このような例に限定されなくてもよく、異なる装置であってもよい。
本実施形態に係る制御装置1は、空調装置4の動作を制御するための2つの学習器を備えている。第1の学習器(後述する第1のニューラルネットワーク5)は、利用者Aの好みに応じた空調装置4の動作の制御を予め学習済みである。一方、第2の学習器(後述する第2のニューラルネットワーク6)は、利用者Bの好みに応じた空調装置4の動作の制御を予め学習済みである。制御装置1は、第1の学習器及び第2の学習器それぞれから出力される制御値に基づいて、空調装置4の動作を制御する。
このとき、第1の学習器から出力される制御値と第2の学習器から出力される制御値とが相違する場合、空調装置4の動作の制御に競合が生じる可能性がある。例えば、室温が24度である状況で、第1の学習器から出力される制御値が室温を26度にする指令を構成しており、第2の学習器から出力される制御値が室温を22度にする指令を構成している場合、空調装置4の動作の制御に競合が生じる。
そこで、本実施形態に係る制御装置1は、第1の学習器から出力される制御値に基づく空調装置4の制御と第2の学習器から出力される制御値に基づく空調装置4の制御とが競合する場合に、空調装置4の制御を修正することで当該競合を解消する。具体的には、本実施形態に係る制御装置1は、第3の学習器(後述する第3のニューラルネットワーク7)を利用して、空調装置4の制御の競合を解消する。
第3の学習器は、第1の学習器及び第2の学習器それぞれから出力される制御値を入力すると、競合を解消するように修正された制御値(以下、「修正済み制御値」とも記載する)を出力するように予め学習済みである。そのため、制御装置1は、第1の学習器及び第2の学習器それぞれから得られる制御値を第3の学習器に入力することで、競合が生じないように修正された制御値を得ることができる。制御装置1は、このようにして得られる修正済み制御値に基づいて、空調装置4の動作を制御する。
一方、本実施形態に係る学習装置3は、第3の学習器の機械学習を行う情報処理装置である。本実施形態に係る学習装置3は、データ収集用制御装置2を用いて、第3の学習器の機械学習に利用する学習データを収集する。データ収集用制御装置2は、制御装置1と同様に、第1の学習器及び第2の学習器を利用して、各利用者(A、B)の好みに適するように空調装置4の動作を制御する。ただし、データ収集用制御装置2は、空調装置4の制御の競合を解消しない(第3の学習器を利用しない)点で、制御装置1と相違する。
すなわち、データ収集用制御装置2による空調装置4の制御では、上記のような競合が生じ得る。そこで、データ収集用制御装置2は、第1の学習器から得られる制御値に基づく空調装置4の制御と第2の学習器から得られる制御値に基づく空調装置4の制御とが競合するか否かを判定する。第1の学習器から得られる制御値に基づく空調装置4の制御と第2の学習器から得られる制御値に基づく空調装置4の制御とが競合すると判定した場合、データ収集用制御装置2は、当該競合を解消するように制御値の修正値を決定する。
例えば、データ収集用制御装置2は、第1の学習器及び第2の学習器それぞれから得られる制御値のうちのいずれか一方を優先する。すなわち、データ収集用制御装置2は、優先する方の制御値を修正済み制御値として取り扱う。また、例えば、データ収集用制御装置2は、第1の学習器及び第2の学習器それぞれから得られる制御値の平均値を修正済み制御値として算出する。これにより、データ収集用制御装置2は、上記競合を解消するように決定した修正済み制御値を取得することができる。
そして、データ収集用制御装置2は、第1の学習器及び第2の学習器それぞれから得た制御値を入力データとし、上記により得られる修正済み制御値を教師データとして、第3の学習器の機械学習に利用する学習データを作成する。つまり、データ収集用制御装置2は、修正前の各制御値と修正済みの制御値とを組にすることで、学習データを作成する。
学習装置3は、このようにして作成された学習データを取得し、取得した学習データを用いて第3の学習器の機械学習を行うことで、上記制御装置1で利用可能な学習済みの第3の学習器を構築する。なお、制御装置1は、例えば、ネットワークを介して、学習装置3から学習済みの第3の学習器を取得してもよい。また、制御装置1を製造する際に、組み込みデータとして、学習済みの第3の学習器は、制御装置1に組み込まれてもよい。
以上のとおり、本実施形態に係る制御装置1は、学習済みの第1の学習器及び第2の学習器を用いることで、各利用者(A、B)の好みに適するように空調装置4の動作を制御することができる。加えて、第1の学習器及び第2の学習器それぞれから得られる制御値に基づく空調装置4の制御に競合が生じる場合に、第3の学習器を利用して、当該競合を解消することができる。したがって、本実施形態によれば、各利用者(A、B)による制御の間で競合が発生しても、空調装置4が動作不能に陥らないようにすることができる。
§2 構成例
[ハードウェア構成]
<制御装置>
次に、図2を用いて、本実施形態に係る制御装置1のハードウェア構成の一例について説明する。図2は、本実施形態に係る制御装置1のハードウェア構成の一例を模式的に例示する。
図2に示されるとおり、本実施形態に係る制御装置1は、制御部11、記憶部12、及び外部インタフェース13が電気的に接続されたコンピュータである。なお、図2では、外部インタフェースを「外部I/F」と記載している。
制御部11は、CPU(Central Processing Unit)、RAM(Random Access Memory)、ROM(Read Only Memory)等を含み、プログラム及びデータに基づいて各種情報処理を実行するように構成される。記憶部12は、制御部11で実行される制御プログラム121、学習済みの第1の学習器に関する情報を示す第1動作制御学習結果データ122、学習済みの第2の学習器に関する情報を示す第2動作制御学習結果データ123、学習済みの第3の学習器に関する情報を示す競合解消学習結果データ124等を記憶する。
制御プログラム121は、後述する空調装置4の動作を制御する処理(図8)を制御部11に実行させるためのプログラムである。第1動作制御学習結果データ122は、学習済みの第1の学習器の設定に利用するデータである。第2動作制御学習結果データ123は、学習済みの第2の学習器の設定に利用するデータである。競合解消学習結果データ124は、学習済みの第3の学習器の設定に利用するデータである。詳細は後述する。
外部インタフェース13は、外部装置と接続するためのインタフェースであり、接続する外部装置に応じて適宜構成される。本実施形態では、制御装置1は、外部インタフェース13を介して、空調装置4に接続する。なお、制御装置1は、外部インタフェース13を介して、記憶媒体に記憶されたデータを読み込むためのドライブ装置等に接続されてもよい。この場合、制御装置1は、ドライブ装置を介して、上記制御プログラム121、第1動作制御学習結果データ122、第2動作制御学習結果データ123、及び競合解消学習結果データ124を取得してもよい。また、ドライブ装置を利用する場合、上記制御プログラム121、第1動作制御学習結果データ122、第2動作制御学習結果データ123、及び競合解消学習結果データ124は、記憶媒体に記憶されていてもよい。記憶媒体は、コンピュータその他装置、機械等が記録されたプログラム等の情報を読み取り可能なように、当該プログラム等の情報を、電気的、磁気的、光学的、機械的又は化学的作用によって蓄積する媒体である。記憶媒体は、例えば、CD(Compact Disk)、DVD(Digital Versatile Disk)、フラッシュメモリ等である。
<データ収集用制御装置>
次に、図3を用いて、本実施形態に係るデータ収集用制御装置2のハードウェア構成の一例について説明する。図3は、本実施形態に係るデータ収集用制御装置2のハードウェア構成の一例を模式的に例示する。
図3に示されるとおり、本実施形態に係るデータ収集用制御装置2は、学習データの収集の場面で利用される制御装置であり、上記制御装置1とほぼ同様に構成される。すなわち、データ収集用制御装置2は、制御部21、記憶部22、及び外部インタフェース23が電気的に接続されたコンピュータである。なお、図3では、上記図2と同様に、外部インタフェースを「外部I/F」と記載している。
制御部21、記憶部22及び外部インタフェース23は、上記制御装置1の制御部11、記憶部12及び外部インタフェース13と同様に構成される。ただし、記憶部22は、データ収集用制御プログラム221、第1動作制御学習結果データ122、第2動作制御学習結果データ123、データ収集用制御プログラム221を実行することで作成される学習データ223等を記憶する。
データ収集用制御プログラム221は、データ収集用制御装置2に後述する学習データの収集処理(図9)を実行させるためのプログラムである。学習データ223は、第1の学習器及び第2の学習器それぞれから出力される制御値を入力すると、競合を解消するように修正済みの制御値を出力するように第3の学習器の学習を行うためのデータである。詳細は後述する。
<学習装置>
次に、図4を用いて、本実施形態に係る学習装置3のハードウェア構成の一例を説明する。図4は、本実施形態に係る学習装置3のハードウェア構成の一例を模式的に例示する。
図4に示されるとおり、本実施形態に係る学習装置3は、制御部31、記憶部32、通信インタフェース33、入力装置34、出力装置35、及びドライブ36が電気的に接続されたコンピュータである。なお、図4では、通信インタフェースを「通信I/F」と記載している。
制御部31は、CPU、RAM、ROM等を含み、プログラム及びデータに基づいて各種情報処理を実行するように構成される。記憶部32は、制御部31で実行される学習プログラム321、第3の学習器の学習に利用する学習データ223、学習プログラム321を実行することで作成した競合解消学習結果データ124等を記憶する。学習プログラム321は、学習装置3に後述する学習処理(図10)を実行させるためのプログラムである。
通信インタフェース33は、例えば、有線LAN(Local Area Network)モジュール、無線LANモジュール等であり、ネットワークを介した有線又は無線通信を行うためのインタフェースである。入力装置34は、例えば、マウス、キーボード等の入力を行うための装置である。出力装置35は、例えば、ディスプレイ、スピーカ等の出力を行うための装置である。
ドライブ36は、例えば、CDドライブ、DVDドライブ等であり、記憶媒体91に記憶されたプログラムを読み込むためのドライブ装置である。ドライブ36の種類は、記憶媒体91の種類に応じて適宜選択されてよい。上記学習プログラム321及び/又は学習データ223は、この記憶媒体91に記憶されていてもよい。
記憶媒体91は、コンピュータその他装置、機械等が記録されたプログラム等の情報を読み取り可能なように、当該プログラム等の情報を、電気的、磁気的、光学的、機械的又は化学的作用によって蓄積する媒体である。学習装置3は、この記憶媒体91から、上記学習プログラム321及び/又は学習データ223を取得してもよい。
なお、図4では、記憶媒体91の一例として、CD、DVD等のディスク型の記憶媒体を例示している。しかしながら、記憶媒体91の種類は、ディスク型に限定される訳ではなく、ディスク型以外であってもよい。ディスク型以外の記憶媒体として、例えば、フラッシュメモリ等の半導体メモリを挙げることができる。
[機能構成]
<制御装置>
次に、図5を用いて、本実施形態に係る制御装置1の機能構成の一例を説明する。図5は、本実施形態に係る制御装置1の機能構成の一例を模式的に例示する。
制御装置1の制御部11は、記憶部12に記憶された制御プログラム121をRAMに展開する。そして、制御部11は、RAMに展開された制御プログラム121をCPUにより解釈及び実行して、各構成要素を制御する。これによって、図5に示されるとおり、本実施形態に係る制御装置1は、第1の制御処理部111、第2の制御処理部112、及び競合解消部113を備えるコンピュータとして機能する。
第1の制御処理部111は、第1の学習器である第1のニューラルネットワーク5を利用して、空調装置4の動作を制御する。第1のニューラルネットワーク5は、利用者Aの好みに適した空調装置4の動作の制御を予め学習済みである。第1の制御処理部111は、利用者Aからの指示データ、位置情報等を第1のニューラルネットワーク5に入力することで、当該第1のニューラルネットワーク5から空調装置4に対する制御値を取得する。
一方、第2の制御処理部112は、第2の学習器である第2のニューラルネットワーク6を利用して、空調装置4の動作を制御する。第2のニューラルネットワーク6は、利用者Bの好みに適した空調装置4の動作の制御を予め学習済みである。第2の制御処理部112は、利用者Bからの指示データ、位置情報等を第2のニューラルネットワーク6に入力することで、当該第2のニューラルネットワーク6から空調装置4に対する制御値を取得する。
なお、第1のニューラルネットワーク5及び第2のニューラルネットワーク6に入力する情報(データ)の種類は、実施の形態に応じて適宜決定されてよい。利用者A及びBは、例えば、PC(Personal Computer)、携帯電話、リモートコントローラ等のユーザ端末を用いて、空調装置4に対して室温調整の要求を行ってもよい。これに応じて、制御装置1は、公知の無線又は有線のデータ通信により、各利用者(A、B)のユーザ端末から指示データを受信してもよい。
このとき、制御装置1は、ユーザ端末からの指示データに付随して、各ニューラルネットワーク(5、6)に入力する各種情報を取得してもよい。例えば、ユーザ端末が、GPS(Global Positioning System)信号の受信機を備える場合には、制御装置1は、各ニューラルネットワーク(5、6)に入力する情報として、各ユーザ端末から各利用者(A、B)の位置情報を取得してもよい。
また、制御装置1は、各利用者(A、B)の個人情報を記憶部12に予め保持していてもよい。この場合、制御部11は、各ユーザ端末から指示データを受信した際に、各ニューラルネットワーク(5、6)に入力する情報として、記憶部12から各利用者(A、B)の個人情報を取得してもよい。
競合解消部113は、第1のニューラルネットワーク5から出力される制御値に基づく空調装置4の制御と第2のニューラルネットワーク6から出力される制御値に基づく空調装置4の制御とが競合する場合に、空調装置4の制御を修正することで、当該競合を解消する。本実施形態では、第3の学習器である第3のニューラルネットワーク7を利用して、当該競合の解消を行う。
第3のニューラルネットワーク7は、第1のニューラルネットワーク5及び第2のニューラルネットワーク6それぞれから出力される制御値を入力すると、競合を解消するように修正済みの制御値を出力するように予め学習済みである。そのため、競合解消部113は、第1のニューラルネットワーク5及び第2のニューラルネットワーク6それぞれから出力される制御値を第3のニューラルネットワーク7に入力することで、競合を解消するように修正済みの制御値を第3のニューラルネットワーク7から取得することができる。
次に、各ニューラルネットワーク5〜7について説明する。図5に示されるとおり、第1のニューラルネットワーク5は、いわゆる深層学習に用いられる多層構造のニューラルネットワークであり、入力から順に、入力層51、中間層(隠れ層)52、及び出力層53を備えている。
なお、図5の例では、第1のニューラルネットワーク5は、1層の中間層52を備えており、入力層51の出力が中間層52の入力となり、中間層52の出力が出力層53の入力となっている。ただし、中間層52の数は1層に限られなくてもよく、第1のニューラルネットワーク5は、2層以上の中間層52を備えてもよい。
各層51〜53は、1又は複数のニューロンを備えている。例えば、入力層51のニューロンの数は、入力に利用する情報の件数に応じて設定することができる。中間層52のニューロンの数は、実施の形態に応じて適宜設定することができる。また、出力層53のニューロンの数は、出力する制御値の種類数に応じて設定することができる。
隣接する層のニューロン同士は適宜結合され、各結合には重み(結合荷重)が設定されている。図5の例では、各ニューロンは、隣接する層の全てのニューロンと結合されているが、ニューロンの結合は、このような例に限定されなくてもよく、実施の形態に応じて適宜設定されてよい。
各ニューロンには閾値が設定されており、基本的には、各入力と各重みとの積の和が閾値を超えているか否かによって各ニューロンの出力が決定される。第1の制御処理部111は、このような第1のニューラルネットワーク5の入力層51に利用者Aからの指示データ、位置情報等の各種情報を入力し、順伝搬の方向に各層51〜53に含まれる各ニューロンの発火判定を行うことで、出力層53から制御値(出力値)を得ることができる。
なお、以上のような第1のニューラルネットワーク5の構成(例えば、ニューラルネットワークの層数、各層におけるニューロンの個数、ニューロン同士の結合関係、各ニューロンの伝達関数)、各ニューロン間の結合の重み、及び各ニューロンの閾値を示す情報は、第1動作制御学習結果データ122に含まれている。第1の制御処理部111は、第1動作制御学習結果データ122を参照して、利用者Aの好みに適した空調装置4の動作の制御を学習済みの第1のニューラルネットワーク5の設定を行う。
第2のニューラルネットワーク6及び第3のニューラルネットワーク7も、第1のニューラルネットワーク5と同様に構成される。すなわち、第2のニューラルネットワーク6は、入力から順に、入力層61、中間層(隠れ層)62、及び出力層63を備えている。第3のニューラルネットワーク7は、入力から順に、入力層71、中間層(隠れ層)72、及び出力層73を備えている。各中間層(62、72)の数、各層(61〜63、71〜73)のニューロンの数、及び隣接する層のニューロンの結合は、実施の形態に応じて適宜設定されてよい。
第2の制御処理部112は、第2のニューラルネットワーク6の入力層61に利用者Bからの指示データ、位置情報等の各種情報を入力し、順伝搬の方向に各層61〜63に含まれる各ニューロンの発火判定を行うことで、出力層63から制御値(出力値)を得ることができる。また、競合解消部113は、第1のニューラルネットワーク5及び第2のニューラルネットワーク6の各出力層(53、63)から出力される制御値を入力層71に入力し、順伝搬の方向に各層71〜73に含まれる各ニューロンの発火判定を行うことで、出力層73から修正済みの制御値(出力値)を得ることができる。
なお、以上のような第2のニューラルネットワーク6の構成、各ニューロン間の結合の重み、及び各ニューロンの閾値を示す情報は、第2動作制御学習結果データ123に含まれている。第2の制御処理部112は、第2動作制御学習結果データ123を参照して、利用者Bの好みに適した空調装置4の動作の制御を学習済みの第2のニューラルネットワーク6の設定を行う。
同様に、以上のような第3のニューラルネットワーク7の構成、各ニューロン間の結合の重み、及び各ニューロンの閾値を示す情報は、競合解消学習結果データ124に含まれている。競合解消部113は、競合解消学習結果データ124を参照して、第1のニューラルネットワーク5及び第2のニューラルネットワーク6それぞれから出力される制御値を入力すると、競合を解消するように修正済みの制御値を出力するように学習済みである第3のニューラルネットワーク7の設定を行う。
<データ収集用制御装置>
次に、図6を用いて、本実施形態に係るデータ収集用制御装置2の機能構成の一例を説明する。図6は、本実施形態に係るデータ収集用制御装置2の機能構成の一例を模式的に例示する。
データ収集用制御装置2の制御部21は、記憶部22に記憶されたデータ収集用制御プログラム221をRAMに展開する。そして、制御部21は、RAMに展開されたデータ収集用制御プログラム221をCPUにより解釈及び実行して、各構成要素を制御する。これにより、図6に示されるとおり、本実施形態に係るデータ収集用制御装置2は、第1の制御処理部211、第2の制御処理部212、修正値決定部213、及び学習データ作成部214を備えるコンピュータとして機能する。
第1の制御処理部211は、上記制御装置1の第1の制御処理部111と同様である。すなわち、第1の制御処理部211は、第1動作制御学習結果データ122を参照して、第1のニューラルネットワーク5の設定を行う。そして、第1の制御処理部211は、設定した第1のニューラルネットワーク5の入力層51に利用者Aからの指示データ、位置情報等の各種情報を入力し、順伝搬の方向に各層51〜53に含まれる各ニューロンの発火判定を行うことで、利用者Aの好みに応じた空調装置4に対する制御値(出力値)を出力層53から取得する。
第2の制御処理部212は、上記制御装置1の第2の制御処理部112と同様である。すなわち、第2の制御処理部212は、第2動作制御学習結果データ123を参照して、第2のニューラルネットワーク6の設定を行う。そして、第2の制御処理部212は、設定した第2のニューラルネットワーク6の入力層61に利用者Bからの指示データ、位置情報等の各種情報を入力し、順伝搬の方向に各層61〜63に含まれる各ニューロンの発火判定を行うことで、利用者Bの好みに応じた空調装置4に対する制御値(出力値)を出力層63から取得する。
データ収集用制御装置2は、第1のニューラルネットワーク5及び第2のニューラルネットワーク6それぞれから得られる制御値に基づいて、空調装置4の動作を制御する。ただし、空調装置4の動作を制御しようとした結果、空調装置4の制御に競合が生じる場合には、空調装置4は動作不能に陥る可能性がある。
例えば、上記のとおり、室温が24度である状況で、第1のニューラルネットワーク5から出力される制御値が室温を26度に上げる指令を構成しており、第2のニューラルネットワーク6から出力される制御値が室温を22度に下げる指令を構成しているとする。このような場合、空調装置4の制御に競合が生じてしまい、データ収集用制御装置2は、室温を上げるように空調装置4の動作を制御すればよいのか、室温を下げるように空調装置4の動作を制御すればよいのか判断できなくなってしまう。
そこで、空調装置4の動作を制御しようとした結果、空調装置4の制御に競合が生じる場合には、修正値決定部213が、当該競合を解消するように制御値の修正値を決定する。そして、学習データ作成部214は、各ニューラルネットワーク(5、6)から得られる制御値を入力データとし、修正値決定部213により決定された修正済みの制御値を教師データとして、第3のニューラルネットワーク7を構築するための学習データ223を作成する。
<学習装置>
次に、図7を用いて、本実施形態に係る学習装置3の機能構成の一例を説明する。図7は、本実施形態に係る学習装置3の機能構成の一例を模式的に例示する。
学習装置3の制御部31は、記憶部32に記憶された学習プログラム321をRAMに展開する。そして、制御部31は、RAMに展開された学習プログラム321をCPUにより解釈及び実行して、各構成要素を制御する。これによって、図7に示されるとおり、本実施形態に係る学習装置3は、学習データ取得部311及び学習処理部312を備えるコンピュータとして機能する。
学習データ取得部311は、上記により作成された学習データ223を取得する。学習処理部312は、取得した学習データ223及び学習用のニューラルネットワーク8を利用して、上記制御装置1で利用する第3のニューラルネットワークの構築を行う。すなわち、学習処理部312は、各ニューラルネットワーク(5、6)から得られる制御値を入力すると、競合を解消するように修正済みの制御値を出力するようにニューラルネットワーク8を学習させる。
学習対象となるニューラルネットワーク8は、第3のニューラルネットワーク7と同様に構成される。すなわち、学習用のニューラルネットワーク8は、入力層81、中間層(隠れ層)82、及び出力層83を備え、各層81〜83は、上記第3のニューラルネットワーク7の各層71〜73と同様に構成される。
学習処理部312は、ニューラルネットワークの学習処理により、各ニューラルネットワーク(5、6)から得られる制御値を入力層81に入力すると、競合を解消するように修正済みの制御値を出力層83から出力するニューラルネットワーク8を構築する。これにより構築されたニューラルネットワーク8は、学習済みの第3のニューラルネットワーク7として利用可能である。学習処理部312は、構築したニューラルネットワーク8の構成、各ニューロン間の結合の重み、及び各ニューロンの閾値を示す情報を競合解消学習結果データ124として記憶部32に格納する。
<その他>
制御装置1、データ収集用制御装置2、及び学習装置3の各機能に関しては後述する動作例で詳細に説明する。なお、本実施形態では、制御装置1、データ収集用制御装置2、及び学習装置3の各機能がいずれも汎用のCPUにより実現される例について説明した。しかしながら、以上の機能の一部又は全部が、1又は複数の専用のハードウェアプロセッサにより実現されてもよい。また、制御装置1、データ収集用制御装置2、及び学習装置3それぞれの機能構成に関して、実施形態に応じて、適宜、機能の省略、置換及び追加が行われてもよい。
§3 動作例
[制御装置]
次に、図8を用いて、制御装置1の動作例を説明する。図8は、制御装置1の処理手順の一例を例示するフローチャートである。なお、以下で説明する処理手順は一例に過ぎず、各処理は可能な限り変更されてよい。また、以下で説明する処理手順について、実施の形態に応じて、適宜、ステップの省略、置換、及び追加が可能である。
(起動)
まず、制御装置1及び空調装置4を含むシステムを適宜起動する。システムを起動すると、制御装置1は、制御プログラム121を読み込んで、初期設定の処理を実行する。具体的には、制御部11は、各学習結果データ122〜124を参照して、各ニューラルネットワーク5〜7の構造、各ニューロン間の結合の重み及び各ニューロンの閾値の設定を行う。そして、制御部11は、以下の処理手順に従って、空調装置4の動作を制御する。
(ステップS101)
ステップS101では、制御部11は、空調装置4の動作の制御に利用する各種情報、換言すると、空調装置4の動作を決定する要因となる情報を各利用者(A、B)から取得する。上記のとおり、空調装置4の動作の制御に利用する情報の種類は、実施の形態に応じて適宜決定されてよい。各利用者(A、B)は、例えば、PC(Personal Computer)、携帯電話、リモートコントローラ等のユーザ端末を用いて、空調装置4に対して室温調整の要求を行ってもよい。これに応じて、制御部11は、公知の無線又は有線のデータ通信により、空調装置4の動作の制御に利用する指示データ、位置情報等の各種情報をユーザ端末から取得してもよい。また、制御部11は、空調装置4の動作の制御に利用する情報として、各利用者(A、B)の個人情報を記憶部12から取得してもよい。
(ステップS102)
次のステップS102では、制御部11は、第1の制御処理部111として機能し、利用者Aから取得した指示データ、位置情報等の各種情報を第1のニューラルネットワーク5に入力する。第1のニューラルネットワーク5は、利用者Aから取得した各種情報を入力すると、利用者Aの好みに応じた空調装置4に対する制御値を出力するように予め学習済みである。そのため、制御部11は、利用者Aから取得した各種情報を入力層51の各ニューロンに入力し、順伝搬の方向に各層51〜53に含まれる各ニューロンの発火判定を行うことで、利用者Aの好みに応じた空調装置4に対する制御値を出力層53の各ニューロンから取得することができる。
また、制御部11は、第2の制御処理部112として機能し、利用者Bから取得した指示データ、位置情報等の各種情報を第2のニューラルネットワーク6に入力する。第2のニューラルネットワーク6は、利用者Bから取得した各種情報を入力すると、利用者Bの好みに応じた空調装置4に対する制御値を出力するように予め学習済みである。そのため、制御部11は、利用者Bから取得した各種情報を入力層61の各ニューロンに入力し、順伝搬の方向に各層61〜63に含まれる各ニューロンの発火判定を行うことで、利用者Bの好みに応じた空調装置4に対する制御値を出力層63の各ニューロンから取得することができる。
(ステップS103)
次のステップS103では、制御部11は、競合解消部113として機能し、各ニューラルネットワーク(5、6)から得られた制御値を第3のニューラルネットワーク7の入力層71に入力する。そして、制御部11は、順伝搬の方向に各層71〜73に含まれる各ニューロンの発火判定を行うことで、第3のニューラルネットワーク7の出力層73から競合を解消するように修正済みの制御値を取得する。これにより、本実施形態では、各ニューラルネットワーク(5、6)を利用した空調装置4の制御に競合が発生する場合に、当該競合を解消するように空調装置4の制御を修正することができる。
ここで、本ステップS103では、ステップS102で取得した各制御値により空調装置4の制御に競合が発生するか否かを区別せずに、第3のニューラルネットワーク7に当該各制御値を入力している。つまり、ステップS102で取得した各制御値により空調装置4の制御に競合が発生しない場合にも、当該ステップS102で取得した各制御値を第3のニューラルネットワーク7に入力している。
このとき、第3のニューラルネットワーク7は、ステップS102で取得した各制御値により空調装置4の制御に競合が発生しない場合、各制御値をそのまま出力するように学習されていてもよいし、競合が発生する場合と同様に修正済みの制御値を出力するように学習されていてもよい。なお、以下では、入力された制御値を修正せずに第3のニューラルネットワーク7からそのまま出力される制御値も「修正済みの制御値(修正済み制御値)」と称する。
(ステップS104)
次のステップS104では、制御部11は、上記ステップS103において第3のニューラルネットワーク7から取得した修正済み制御値に基づいて、空調装置4の動作を制御する。制御値は、例えば、空調装置4を動作させることで達成すべき所望の室温を示す。制御部11は、制御値に示される所望の室温と現状の室温とを比較し、所望の室温になるように空調装置4の冷暖房の動作を制御する。
以上により、制御部11は、本動作例に係る処理を終了する。制御部11は、以上のステップS101〜S104の処理を定期的又は不定期的に繰り返し実行してもよい。これにより、制御装置1は、各利用者(A、B)の好みに応じた空調装置4の動作の制御を継続的に実施することができる。
[データ収集用制御装置]
次に、図9を用いて、データ収集用制御装置2の動作例を説明する。図9は、データ収集用制御装置2の処理手順の一例を例示するフローチャートである。なお、以下で説明する処理手順は、本発明の「学習データ作成方法」に相当する。ただし、以下で説明する処理手順は一例に過ぎず、各処理は可能な限り変更されてよい。また、以下で説明する処理手順について、実施の形態に応じて、適宜、ステップの省略、置換、及び追加が可能である。
(起動)
上記と同様に、データ収集用制御装置2及び空調装置4を含むシステムを適宜起動する。システムを起動すると、データ収集用制御装置2は、データ収集用制御プログラム221を読み込んで、初期設定の処理を実行する。すなわち、制御部21は、各学習結果データ(122、123)を参照して、各ニューラルネットワーク(5、6)の構造、各ニューロン間の結合の重み及び各ニューロンの閾値の設定を行う。そして、制御部21は、以下の処理手順に従って、第3のニューラルネットワーク7を構築するための学習データ223を作成する。
(ステップS201及びS202)
ステップS201では、制御部21は、上記ステップS101と同様に、各ニューラルネットワーク(5、6)に入力する各種情報を各利用者(A、B)から取得する。
次のステップS202では、制御部21は、上記ステップS102と同様に、第1の制御処理部211として機能し、利用者Aから取得した各種情報を第1のニューラルネットワーク5の入力層51に入力する。そして、制御部21は、順伝搬の方向に各層51〜53に含まれる各ニューロンの発火判定を行うことで、第1のニューラルネットワーク5の出力層53から出力される利用者Aの好みに応じた空調装置4に対する制御値を取得する。
また、制御部21は、第2の制御処理部212として機能し、利用者Bから取得した各種情報を第2のニューラルネットワーク6の入力層61に入力する。そして、制御部21は、順伝搬の方向に各層61〜63に含まれる各ニューロンの発火判定を行うことで、第2のニューラルネットワーク6の出力層63から出力される利用者Bの好みに応じた空調装置4に対する制御値を取得する。
(ステップS203及びS204)
次のステップS203では、制御部21は、上記ステップS202で各ニューラルネットワーク(5、6)から取得した各制御値に基づいて、制御対象装置である空調装置4の動作を制御する。そして、ステップS204では、制御部21は、空調装置4の制御に競合が発生するか否かを判定する。
このとき、制御部21は、ステップS203において空調装置4を実際に動作させて、各ニューラルネットワーク(5、6)から取得した各制御値が競合を発生させるか否かを判定してもよい。また、制御部21は、ステップS203において空調装置4を実際には動作させず、各ニューラルネットワーク(5、6)から取得した各制御値に基づいて、空調装置4の動作をシミュレートすることで、競合が発生するか否かを判定してもよい。
競合が発生するか否かを判定する方法は、実施の形態に応じて適宜設定されてよい。例えば、各ニューラルネットワーク(5、6)から取得した各制御値に基づいた空調装置4の制御を同時に実行できない場合に、制御部21は、空調装置4の制御に競合が発生すると判定してもよい。空調装置4の制御に競合が発生すると判定した場合には、制御部21は、次のステップS205に処理を進める。一方、空調装置4の制御に競合が発生しないと判定した場合には、制御部21は、本動作例に係る処理を終了する。
(ステップS205)
次のステップS205では、制御部21は、修正値決定部213として機能し、空調装置4の制御に生じた競合を解消するように、各ニューラルネットワーク(5、6)から取得した各制御値の修正値を決定する。これにより、制御部21は、競合を解消するように修正済みの制御値を取得する。
制御値の修正方法は、実施の形態に応じて適宜選択されてよい。例えば、制御部21は、所定の規則に従って修正値を決定してもよい。この場合、利用者A及びBのいずれか一方を優先することが所定の規則として定められているときには、制御部21は、各ニューラルネットワーク(5、6)から取得した制御値のうちいずれか一方を優先する。すなわち、制御部21は、優先する方の制御値を修正済み制御値として取り扱う。また、利用者A及びBを共に平等に扱うことが所定の規則として定められているときには、制御部21は、各ニューラルネットワーク(5、6)から取得した制御値を平均化することで、修正済みの制御値を取得する。
なお、所定の規則は、このような例に限定されなくてもよい。例えば、所定の規則として、利用者A及びBそれぞれに優先度が設定されている場合には、制御部21は、各ニューラルネットワーク(5、6)から取得した制御値の加重平均を修正済みの制御値として取得してもよい。
また、例えば、制御部21は、修正値の入力をオペレータから受け付けてもよい。すなわち、制御部21は、オペレータからの入力に基づいて修正済みの制御値を決定してもよい。この場合、データ収集用制御装置2は、外部インタフェース23を介して、キーボード、マイクロフォン等の入力装置に接続していてもよい。これにより、オペレータは、キーボード入力、音声入力等により、修正済みの制御値を入力することができる。
(ステップS206)
次のステップS206では、制御部21は、学習データ作成部214として機能し、ステップS202で各ニューラルネットワーク(5、6)から取得した制御値と、ステップS205で決定した修正済みの制御値とを組にする。これにより、制御部21は、修正前の各制御値を入力データとし、修正済みの制御値を教師データとする学習データ223を作成する。そして、制御部21は、作成した学習データ223を記憶部22に保存する。
以上により、制御部21は、本動作例に係る処理を終了する。制御部21は、上記ステップS201〜S206の一連の処理を繰り返し実行することで、複数件の学習データ223を収集することができる。
なお、空調装置4の制御に競合が発生しない場合に、各制御値をそのまま出力する第3のニューラルネットワーク7を構築するときには、制御部21は、ステップS204で競合が発生しないと判定した際の各制御値を入力データ及び教師データとして学習データ223を作成してもよい。
また、空調装置4の制御に競合が発生しない場合でも、各ニューラルネットワーク(5、6)から得られる制御値を修正する第3のニューラルネットワーク7を構築するときには、制御部21は、ステップS204で競合が発生しないと判定した際にも、上記ステップS205及びS206の処理を実行してもよい。
この場合、制御部21は、オペレータからの入力を受け付けて、利用者A及びBの両方の好みに適した修正済みの制御値が得られるように修正値を決定してもよい。これにより、各ニューラルネットワーク(5、6)から得られる制御値を入力すると、利用者A及びBの両方の好みに適した修正済みの制御値を出力する第3のニューラルネットワーク7の構築に利用可能な学習データ223を作成することができる。
[学習装置]
次に、図10を用いて、学習装置3の動作例を説明する。図10は、学習装置3の処理手順の一例を例示するフローチャートである。なお、以下で説明する処理手順は一例に過ぎず、各処理は可能な限り変更されてよい。また、以下で説明する処理手順について、実施の形態に応じて、適宜、ステップの省略、置換、及び追加が可能である。
(ステップS301)
ステップS301では、制御部31は、学習データ取得部311として機能し、上記データ収集用制御装置2により作成された学習データ223を取得する。
データ収集用制御装置2により作成した学習データ223を学習装置3に転送する方法は、実施の形態に応じて適宜選択されてよい。例えば、学習装置3とデータ収集用制御装置2とがネットワークを介して接続している場合には、制御部31は、ネットワークを介してデータ収集用制御装置2にアクセスすることで、学習データ223を取得することができる。また、例えば、データ収集用制御装置2で作成された学習データ223は、NAS(Network Attached Storage)等のその他の情報処理装置(記憶装置)に格納されていてもよい。この場合、制御部31は、当該その他の情報処理装置にアクセスすることで、学習データ223を取得することができる。また、例えば、データ収集用制御装置2で作成された学習データ223は、記憶媒体91に格納されていてもよい。この場合、制御部31は、ドライブ36を介して記憶媒体91から学習データ223を取得することができる。なお、本ステップS301で取得する学習データ223の件数は、学習用のニューラルネットワーク8の学習を行うことができるように、実施の形態に応じて適宜決定されてよい。
(ステップS302)
次のステップS302では、制御部31は、学習処理部312として機能し、ステップS301で取得した学習データ223を用いて、各ニューラルネットワーク(5、6)から得られる制御値を入力すると、競合を解消するように修正済みの制御値を出力するように学習用のニューラルネットワーク8の学習を行う。
具体的には、まず、制御部31は、学習処理を行う対象となる学習用のニューラルネットワーク8を用意する。用意するニューラルネットワーク8の構成、各ニューロン間の結合の重みの初期値、及び各ニューロンの閾値の初期値は、テンプレートにより与えられてもよいし、オペレータの入力により与えられてもよい。また、再学習を行う場合には、制御部31は、再学習を行う対象となる競合解消学習結果データ124に基づいて、学習用のニューラルネットワーク8を用意してもよい。
次に、制御部31は、ステップS301で取得した学習データ223に含まれる各ニューラルネットワーク(5、6)から得られた制御値を入力データとし、修正済みの制御値を教師データとして、ニューラルネットワーク8の学習を行う。このニューラルネットワーク8の学習には、勾配降下法、確率的勾配降下法等が用いられてよい。
例えば、制御部31は、学習データ223に含まれる各ニューラルネットワーク(5、6)から得られた制御値を入力層81に入力して、学習用のニューラルネットワーク8の順伝播方向の演算処理を行う。これにより、制御部31は、学習用のニューラルネットワーク8の出力層83から出力値を得る。次に、制御部31は、出力層83から出力された出力値を学習データ223に含まれる修正済みの制御値との誤差を算出する。続いて、制御部31は、誤差逆伝搬法により、算出した出力値の誤差を用いて、各ニューロン間の結合の重み及び各ニューロンの閾値それぞれの誤差を算出する。そして、制御部31は、算出した各誤差に基づいて、各ニューロン間の結合の重み及び各ニューロンの閾値それぞれの値の更新を行う。
制御部31は、各件の学習データ223について、出力層83から出力される出力値が対応する修正済みの制御値と一致するまでこの一連の処理を繰り返すことにより、ニューラルネットワーク8の学習を行う。これにより、各ニューラルネットワーク(5、6)から得られる制御値を入力すると、競合を解消するように修正済みの制御値を出力するニューラルネットワーク8を構築することができる。
(ステップS303)
次のステップS303では、制御部31は、学習処理部312として機能して、構築したニューラルネットワーク8の構成、各ニューロン間の結合の重み、及び各ニューロンの閾値を示す情報を競合解消学習結果データ124として記憶部32に格納する。これにより、制御部31は、本動作例に係る学習処理を終了する。
なお、学習装置3と制御装置1とがネットワークを介して接続可能な場合、制御部31は、上記ステップS303の処理が完了した後に、作成した競合解消学習結果データ124を制御装置1に適宜転送してもよい。また、制御部31は、上記ステップS301〜S303の学習処理を定期的又は不定期的に実行することで、競合解消学習結果データ124を定期的に又は不定期的に更新してもよい。そして、制御部31は、作成した競合解消学習結果データ124を当該学習処理の実行毎に制御装置1に転送することで、制御装置1の保持する競合解消学習結果データ124を定期的に又は不定期的に更新してもよい。
[作用・効果]
以上のように、本実施形態では、各ニューラルネットワーク(5、6)によって、各利用者(A、B)の好みに適するように空調装置4の動作を制御することができる。ただし、両者から相反する指示がなされた場合等には、空調装置4の制御に競合が発生し得る。これに対して、本実施形態では、各ニューラルネットワーク(5、6)から得られた制御値を、上記ステップS103の処理で利用する第3のニューラルネットワーク7によって、当該競合を解消するように修正することができる。したがって、本実施形態によれば、各利用者(A、B)による制御の間で競合が発生しても、空調装置4が動作不能に陥らないようにすることができる。
§4 変形例
以上、本発明の実施の形態を詳細に説明してきたが、前述までの説明はあらゆる点において本発明の例示に過ぎない。本発明の範囲を逸脱することなく種々の改良や変形を行うことができることは言うまでもない。例えば、以下のような変更が可能である。なお、以下では、上記実施形態と同様の構成要素に関しては同様の符号を用い、上記実施形態と同様の点については、適宜説明を省略した。以下の変形例は適宜組み合わせ可能である。
<4.1>
上記実施形態では、制御装置1により制御される制御対象装置として空調装置を例示している。しかしながら、制御対象装置の種類は、空調装置に限られなくてもよく、実施の形態に応じて適宜選択されてよい。制御対象装置は、例えば、ロボット装置等であってもよい。
また、上記実施形態では、第1のニューラルネットワーク5及び第2のニューラルネットワーク6は、同一の制御対象装置(空調装置4)を制御対象としている。しかしながら、第1のニューラルネットワーク5が制御対象とする制御対象装置と第2のニューラルネットワーク6が制御対象とする制御対象装置とは異なっていてもよい。
例えば、第1のニューラルネットワーク5は、第1の制御対象装置として、第1のロボット装置を制御対象としてもよい。そして、第2のニューラルネットワーク6は、第2の制御対象装置として、第1のロボット装置とは異なる第2のロボット装置を制御対象としてもよい。この場合、例えば、第1のロボット装置及び第2のロボット装置に同じタイミングで同じ位置に移動する制御指令が発行されたときに、両ロボット装置の制御の間で競合が発生し得る。
また、上記実施形態では、制御対象装置の動作を制御する制御値を発行する学習器として2つの学習器(第1のニューラルネットワーク5及び第2のニューラルネットワーク6)が利用されている。しかしながら、制御対象装置の動作を制御する制御値を発行する学習器の数は、2つに限られなくてもよく、3つ以上であってもよい。
<4.2>
上記制御装置1、データ収集用制御装置2、及び学習装置3それぞれの具体的なハードウェア構成に関して、実施の形態に応じて、適宜、構成要素の省略、置換及び追加が可能である。例えば、制御部11は、複数のプロセッサを含んでもよい。制御装置1及びデータ収集用制御装置2は、通信インタフェースを備え、ネットワークを介して他の情報処理装置とデータのやりとりが可能に構成されてもよい。制御装置1、データ収集用制御装置2、及び学習装置3はそれぞれ、複数台のコンピュータで構成されてもよい。
また、制御装置1及びデータ収集用制御装置2はそれぞれ、提供されるサービス専用に設計されたECU(Electronic Control Unit)等の情報処理装置の他、制御する対象となる制御対象装置に応じて、汎用のデスクトップPC、タブレットPC、携帯電話等が適宜用いられてもよい。また、学習装置3は、提供されるサービス専用に設計された情報処理装置の他、汎用のサーバ装置、デスクトップPC等が用いられてもよい。
<4.3>
また、上記実施形態では、図5〜図7に示されるとおり、各ニューラルネットワーク5〜8として、多層構造を有する一般的な順伝播型ニューラルネットワークを用いている。しかしながら、各ニューラルネットワーク5〜8の種類は、このような例に限定されなくてもよく、実施の形態に応じて適宜選択されてよい。例えば、入力データとして画像を用いる場合、各ニューラルネットワーク5〜8には、畳み込み層及びプーリング層を備える畳み込みニューラルネットワークを用いてもよい。また、例えば、入力データとして時系列データを用いる場合、各ニューラルネットワーク5〜8には、中間層から入力層等のように出力側から入力側に再帰する結合を有する再帰型ニューラルネットワークが用いられてもよい。なお、各ニューラルネットワーク5〜8の層数、各層におけるニューロンの個数、ニューロン同士の結合関係、及び各ニューロンの伝達関数は、実施の形態に応じて適宜決定されてよい。
<4.4>
また、上記ステップS103では、空調装置4の制御に競合を発生させるか否かを区別せずに、ステップS102で各ニューラルネットワーク(5、6)から取得した制御値を第3のニューラルネットワーク7に入力している。しかしながら、制御装置1の処理手順は、このような例に限定されなくてもよい。ステップS102で各ニューラルネットワーク(5、6)から取得した制御値が空調装置4の制御に競合を発生させる場合にのみ、制御部11は、当該ステップS102で取得した制御値を第3のニューラルネットワーク7に入力してもよい。この場合、ステップS102で各ニューラルネットワーク(5、6)から取得した制御値が空調装置4の制御に競合を発生させないときには、制御部11は、上記ステップS103を省略して、次のステップS104の処理を実行することで、各ニューラルネットワーク(5、6)から取得した制御値をそのまま空調装置4の制御に利用してもよい。
また、上記ステップS103では、第3のニューラルネットワーク7を用いて、空調装置4の制御に生じる競合の解消を行っている。しかしながら、空調装置4の制御に生じる競合の解消を行う方法は、このような例に限定されなくてもよい。ニューラルネットワークを用いずに、空調装置4の制御に生じる競合の解消が行われてもよい。
図11は、本変形例に係る制御装置1Aを模式的に例示する。制御装置1Aは、競合解消学習結果データ124を保持せず、ニューラルネットワークを利用しない競合解消部113Aを備える点を除き、上記制御装置1と同様に構成されている。この場合、制御部11は、上記ステップS103において、競合解消部113Aとして機能し、各ニューラルネットワーク(5、6)から取得した制御値により空調装置4の制御に競合が発生するか否かを判定する。例えば、制御部11は、空調装置4の動作をシミュレートすることで、当該空調装置4の制御に競合が発生するか否かを判定する。
そして、空調装置4の制御に競合が発生しないと判定した場合には、制御部11は、各ニューラルネットワーク(5、6)から取得した制御値に基づいて空調装置4の動作を制御する。一方、空調装置4の制御に競合が発生すると判定した場合には、制御部11は、競合を解消するように、各ニューラルネットワーク(5、6)から取得した制御値を修正し、修正した制御値に基づいて空調装置4の動作を制御する。
なお、制御値の修正方法は、上記ステップS205と同様に、実施の形態に応じて適宜選択されてよい。例えば、制御部11は、各ニューラルネットワーク(5、6)から取得した制御値のうちいずれか一方を優先することで、修正済みの修正値を決定してもよい。また、例えば、制御部11は、各ニューラルネットワーク(5、6)から取得した制御値を平均化することで、修正済みの制御値を決定してもよい。
<4.5>
また、上記実施形態では、制御部11は、空調装置4の制御にどのような競合を発生させるかを特定せずに、各ニューラルネットワーク(5、6)から取得した制御値を第3のニューラルネットワーク7に入力している。しかしながら、制御装置1の処理手順は、このような例に限定されなくてもよく、制御部11は、各ニューラルネットワーク(5、6)から取得した制御値が空調装置4の制御にどのような競合を発生させるかを特定してもよい。
図12は、本変形例に係る制御装置1Bを模式的に例示する。制御装置1Bは、各ニューラルネットワーク(5、6)から取得した制御値に基づいて、空調装置4の制御がどのように競合するかを示す競合種別情報125を特定する競合種別特定部114を備える点、特定した競合種別情報125を第3のニューラルネットワーク7の入力に利用する点を除き、上記制御装置1と同様に構成されている。
この場合、制御部11は、上記ステップS103を実行する前に、各ニューラルネットワーク(5、6)から取得した制御値に基づいて、空調装置4の制御がどのように競合するかを示す競合種別情報125を特定する。競合の種別(仕方)は、実施の形態に応じて適宜設定されてよい。そして、上記ステップS103において、制御部11は、各ニューラルネットワーク(5、6)から取得した制御値及び競合種別情報125を第3のニューラルネットワーク7の入力層71に入力する。
これにより、制御装置1Bは、競合の種別に応じて制御値の修正方法を確実に変更することができる。例えば、利用者Aが利用者Bよりも高い室温を所望している場合に、第3のニューラルネットワーク7は、各ニューラルネットワーク(5、6)から取得した制御値の平均値を修正済み制御値として出力するようにしてもよい。そして、利用者Bが利用者Aよりも高い室温を所望している場合に、第3のニューラルネットワーク7は、ニューラルネットワーク5から取得した制御値を修正済み制御値として優先して出力するようにしてもよい。
なお、図13に例示するように、空調装置4の制御がどのように競合するかの特定には、ニューラルネットワーク等の学習器が利用されてもよい。図13は、本変形例に係る制御装置1Cを模式的に例示する。制御装置1Cは、第4のニューラルネットワーク115を利用して競合種別情報125を特定する競合種別特定部114Cを備える点を除き、上記制御装置1Bと同様に構成されている。第4のニューラルネットワーク115は、各ニューラルネットワーク(5、6)から出力される制御値を入力すると、競合種別情報125に対応する出力値を出力するように学習済みである。第4のニューラルネットワーク115は、例えば、各ニューラルネットワーク5〜7と同様に構成されてよい。上記処理手順において、システムを起動した際に、制御部11は、学習結果データ126を参照して、第4のニューラルネットワーク115の構造、各ニューロン間の結合の重み及び各ニューロンの閾値の設定を行う。これにより、空調装置4の制御に生じる競合を複雑に分類することができ、各分類に適切な解消方法を採用することができるようになる。
<4.6>
また、上記実施形態(及び変形例)では、各学習器は、ニューラルネットワークにより構成されている。しかしながら、各学習器の種類は、ニューラルネットワークに限られなくてもよく、実施の形態に応じて適宜選択されてよい。各学習器には、例えば、サポートベクターマシン、自己組織化マップ、強化学習により学習を行う学習器等が用いられてもよい。
<4.7>
また、上記各ニューラルネットワーク(5、6)を作成するための学習装置を用意してもよい。例えば、機械学習に利用する学習データを上記学習データ223から各利用者(A、B)に適した制御を学習するための学習データに変更することで、上記学習装置3により、学習済みの各ニューラルネットワーク(5、6)を作成することができる。各利用者(A、B)に適した制御を学習させるための学習データは、各利用者(A、B)から取得した入力データとなる各種情報と、各利用者(A、B)の好みに適した教師データとなる本来の制御値とを組み合わせることで作成することができる。学習装置は、このような学習データを利用して、上記ステップS301〜303の処理を実行することで、学習済みの各ニューラルネットワーク(5、6)を構築し、各動作制御学習結果データ(122、123)を作成することができる。
同様に、上記第4のニューラルネットワーク115を作成するための学習装置を用意してもよい。例えば、機械学習に利用する学習データを上記学習データ223から競合の種別の特定を学習するための学習データに変更することで、上記学習装置3により、学習済みの第4のニューラルネットワーク115を作成することができる。競合の種別の特定を学習するための学習データは、各ニューラルネットワーク(5、6)から取得される入力データとなる制御値と、教師データとなる競合種別情報125に対応する出力値とを組み合わせることで作成することができる。学習装置は、このような学習データを利用して、上記ステップS301〜303の処理を実行することで、学習済みの第4のニューラルネットワーク115を構築し、学習結果データ126を作成することができる。
1・1A・1B・1C…制御装置、
11…制御部、12…記憶部、13…外部インタフェース、
111…第1の制御処理部、112…第2の制御処理部、
113・113A…競合解消部、
114・114C…競合種別特定部、
115…第4のニューラルネットワーク、
121…制御プログラム、122…第1動作制御学習結果データ、
123…第2動作制御学習結果データ、
124…競合解消学習結果データ、
125…競合種別情報、126…学習結果データ、
2…データ収集用制御装置、
21…制御部、22…記憶部、23…外部インタフェース、
211…第1の制御処理部、212…第2の制御処理部、
213…修正値決定部、214…学習データ作成部、
221…データ収集用制御プログラム、223…学習データ、
3…学習装置、
31…制御装置、32…記憶部、33…通信インタフェース、
34…入力装置、35…出力装置、36…ドライブ、
311…学習データ取得部、312…学習処理部、
321…学習プログラム、
5…第1のニューラルネットワーク、
51…入力層、52…中間層(隠れ層)、53…出力層、
6…第2のニューラルネットワーク、
61…入力層、62…中間層(隠れ層)、63…出力層、
7…第3のニューラルネットワーク、
71…入力層、72…中間層(隠れ層)、73…出力層、
8…学習用のニューラルネットワーク、
81…入力層、82…中間層(隠れ層)、83…出力層、
91…記憶媒体

Claims (12)

  1. 第1の制御対象装置の動作を制御するための学習を行った学習済みの第1の学習器から出力される制御値に基づいて、当該第1の制御対象装置の動作を制御する第1の制御処理部と、
    第2の制御対象装置の動作を制御するための学習を行った学習済みの第2の学習器から出力される制御値に基づいて、当該第2の制御対象装置の動作を制御する第2の制御処理部と、
    前記第1の学習器から出力される制御値に基づく前記第1の制御対象装置の制御と前記第2の学習器から出力される制御値に基づく前記第2の制御対象装置の制御とが競合する場合に、前記第1の制御対象装置及び前記第2の制御対象装置の制御を修正することで、当該競合を解消する競合解消部と、
    を備える、
    制御装置。
  2. 前記競合解消部は、前記第1の学習器から出力される前記第1の制御対象装置の制御値及び前記第2の学習器から出力される前記第2の制御対象装置の制御値を入力すると、前記競合を解消するように修正された前記第1の制御対象装置の制御値及び前記第2の制御対象装置の制御値を出力するように学習を行った学習済みの第3の学習器を利用して、前記競合を解消する、
    請求項1に記載の制御装置。
  3. 前記第1の学習器から出力される前記第1の制御対象装置の制御値及び前記第2の学習器から出力される前記第2の制御対象装置の制御値に基づいて、前記第1の制御対象装置及び前記第2の制御対象装置の制御がどのように競合するかを示す競合種別情報を特定する競合種別特定部を更に備え、
    前記競合解消部は、特定された前記競合種別情報を前記第3の学習器に更に入力する、
    請求項2に記載の制御装置。
  4. 前記競合種別特定部は、前記第1の学習器から出力される前記第1の制御対象装置の制御値及び前記第2の学習器から出力される前記第2の制御対象装置の制御値を入力すると、前記競合種別情報に対応する出力値を出力するように学習を行った学習済みの第4の学習器を利用して、前記競合種別情報を特定する、
    請求項3に記載の制御装置。
  5. 前記第1、第2、第3及び第4の学習器はそれぞれニューラルネットワークにより構成される、
    請求項4に記載の制御装置。
  6. 前記競合解消部は、前記第1の学習器から出力される制御値に基づく前記第1の制御対象装置の制御、及び前記第2の学習器から出力される制御値に基づく前記第2の制御対象装置の制御のいずれか一方を優先することで、前記競合を解消する、
    請求項1から5のいずれか1項に記載の制御装置。
  7. 前記第1の制御対象装置と前記第2の制御対象装置とは同一の制御対象装置であり、
    前記競合解消部は、前記第1の学習器から出力される制御値と前記第2の学習器から出力される制御値とを平均化することで、前記競合を解消する、
    請求項1から6のいずれか1項に記載の制御装置。
  8. 第1の制御対象装置及び第2の制御対象装置の動作を制御するコンピュータに、
    前記第1の制御対象装置の動作を制御するための学習を行った学習済みの第1の学習器から出力される前記第1の制御対象装置を制御するための制御値を取得するステップと、
    前記第2の制御対象装置の動作を制御するための学習を行った学習済みの第2の学習器から出力される前記第2の制御対象装置を制御するための制御値を取得するステップと、
    前記第1の学習器から出力される制御値に基づく前記第1の制御対象装置の制御と前記第2の学習器から出力される制御値に基づく前記第2の制御対象装置の制御とが競合する場合に、当該競合を解消するように修正された前記第1の制御対象装置の制御値及び前記第2の制御対象装置の制御値を取得するステップと、
    取得された前記制御値に基づいて前記第1の制御対象装置及び前記第2の制御対象装置を制御するステップと、
    を実行させるための制御プログラム。
  9. 第1の制御対象装置の動作を制御するための学習を行った学習済みの第1の学習器から出力される当該第1の制御対象装置を制御するための制御値を取得するステップと、
    第2の制御対象装置の動作を制御するための学習を行った学習済みの第2の学習器から出力される当該第2の制御対象装置を制御するための制御値を取得するステップと、
    前記第1の学習器から出力される制御値に基づく前記第1の制御対象装置の制御と前記第2の学習器から出力される制御値に基づく前記第2の制御対象装置の制御とが競合するか否かを判定するステップと、
    前記第1の学習器から出力される制御値に基づく前記第1の制御対象装置の制御と前記第2の学習器から出力される制御値に基づく前記第2の制御対象装置の制御とが競合する場合に、当該競合を解消するように前記第1の制御対象装置及び前記第2の制御対象装置の制御値の修正値を決定するステップと、
    前記第1の学習器から得られた制御値及び前記第2の学習器から得られた制御値を入力データとし、決定された前記修正値を教師データとして、学習器の学習を行うための学習データを作成するステップと、
    を備える、
    学習データ作成方法。
  10. 前記修正値は、オペレータの入力により決定される、
    請求項9に記載の学習データ作成方法。
  11. 前記修正値は、所定の規則に従って決定される、
    請求項9に記載の学習データ作成方法。
  12. 請求項9から11のいずれか1項に記載の学習データ作成方法により作成した前記学習データを取得するステップと、
    取得した前記学習データにより学習器の学習を行うステップと、
    を備える、
    学習方法。
JP2017096165A 2017-05-15 2017-05-15 制御装置、制御プログラム、学習データ作成方法、及び学習方法 Active JP6915371B2 (ja)

Priority Applications (2)

Application Number Priority Date Filing Date Title
JP2017096165A JP6915371B2 (ja) 2017-05-15 2017-05-15 制御装置、制御プログラム、学習データ作成方法、及び学習方法
PCT/JP2018/016703 WO2018211927A1 (en) 2017-05-15 2018-04-25 Control apparatus, control program, learning data creation method, and learning method

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2017096165A JP6915371B2 (ja) 2017-05-15 2017-05-15 制御装置、制御プログラム、学習データ作成方法、及び学習方法

Publications (2)

Publication Number Publication Date
JP2018194932A true JP2018194932A (ja) 2018-12-06
JP6915371B2 JP6915371B2 (ja) 2021-08-04

Family

ID=62200496

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2017096165A Active JP6915371B2 (ja) 2017-05-15 2017-05-15 制御装置、制御プログラム、学習データ作成方法、及び学習方法

Country Status (2)

Country Link
JP (1) JP6915371B2 (ja)
WO (1) WO2018211927A1 (ja)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2019144898A (ja) * 2018-02-21 2019-08-29 清水建設株式会社 装置制御システム及び装置制御方法
WO2020080069A1 (ja) 2018-10-16 2020-04-23 日東シンコー株式会社 樹脂組成物

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN114675539B (zh) * 2022-03-29 2024-01-23 江苏希尔登家居有限公司 一种自主学习的门窗智能控制***

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2002518725A (ja) * 1998-06-15 2002-06-25 デジマ・インコーポレイテッド 適応的エージェント指向ソフトウェアアーキテクチャを用いる適応的対話
JP2016532355A (ja) * 2013-07-12 2016-10-13 李 文 嵩 インテリジェント住宅システム及び操作方法

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP1563348A2 (en) * 2002-08-21 2005-08-17 Neal E. Solomon Systems, methods and apparatus for organizing groups of self-configurable mobile robotic agents in a multi-robotic system

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2002518725A (ja) * 1998-06-15 2002-06-25 デジマ・インコーポレイテッド 適応的エージェント指向ソフトウェアアーキテクチャを用いる適応的対話
JP2016532355A (ja) * 2013-07-12 2016-10-13 李 文 嵩 インテリジェント住宅システム及び操作方法

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2019144898A (ja) * 2018-02-21 2019-08-29 清水建設株式会社 装置制御システム及び装置制御方法
JP7121500B2 (ja) 2018-02-21 2022-08-18 清水建設株式会社 装置制御システム及び装置制御方法
WO2020080069A1 (ja) 2018-10-16 2020-04-23 日東シンコー株式会社 樹脂組成物

Also Published As

Publication number Publication date
WO2018211927A1 (en) 2018-11-22
JP6915371B2 (ja) 2021-08-04

Similar Documents

Publication Publication Date Title
JP6648352B2 (ja) 汎用学習済モデルの生成方法
EP1262844A1 (en) Method for controlling a man-machine-interface unit
JP2018194932A (ja) 制御装置、制御プログラム、学習データ作成方法、及び学習方法
JP5624562B2 (ja) ウェブサイト訪問者の評価値を計算するための方法及びシステム
JP2019046390A (ja) 学習装置、学習方法、およびプログラム
US10979242B2 (en) Intelligent personal assistant controller where a voice command specifies a target appliance based on a confidence score without requiring uttering of a wake-word
WO2015155977A1 (ja) 連携システム、装置、方法、および記録媒体
WO2018143019A1 (ja) 情報処理装置、情報処理方法およびプログラム記録媒体
CN108063701B (zh) 一种控制智能设备的方法及装置
JP2019101907A (ja) 物体間関係認識装置、学習済みモデル、認識方法及びプログラム
CN111598213A (zh) 网络训练方法、数据识别方法、装置、设备和介质
CN103218663A (zh) 信息处理装置、信息处理方法和程序
KR20210060146A (ko) 딥 뉴럴 네트워크 모델을 이용한 데이터 처리 방법 및 장치, 딥 뉴럴 네트워크 모델을 학습시키는 학습 방법 및 장치
JP2021089655A (ja) 学習モデル構築装置、学習モデル構築方法及びコンピュータプログラム
WO2019159483A1 (ja) デバイス選択装置、データセット選択装置、デバイス選択方法及びプログラム
WO2018135301A1 (ja) 情報処理装置および情報処理方法
US20220196275A1 (en) Air conditioner, air conditioning system and control method thereof
JP2019140557A (ja) 品質チェック装置、品質チェック方法及びプログラム
JP2023009344A (ja) 生成方法、情報処理装置、プログラム、及び情報処理システム
JP7510637B2 (ja) 汎用学習済モデルの生成方法
JP2020198135A (ja) ハイパーパラメータチューニング方法、装置及びプログラム
WO2020105161A1 (ja) エッジデバイス機械学習モデル切替システム、エッジデバイス機械学習モデル切替方法、プログラム、及びエッジデバイス
JP2020173576A (ja) プラント監視装置
JP7036271B1 (ja) モデル管理装置及びモデル管理方法
JP6528868B1 (ja) セッション制御装置、セッション制御方法及びプログラム

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20200305

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20210202

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20210317

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20210615

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20210628

R150 Certificate of patent or registration of utility model

Ref document number: 6915371

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250