JP2010176583A - 情報処理装置、情報処理方法、情報処理プログラム及び情報処理システム - Google Patents

情報処理装置、情報処理方法、情報処理プログラム及び情報処理システム Download PDF

Info

Publication number
JP2010176583A
JP2010176583A JP2009020841A JP2009020841A JP2010176583A JP 2010176583 A JP2010176583 A JP 2010176583A JP 2009020841 A JP2009020841 A JP 2009020841A JP 2009020841 A JP2009020841 A JP 2009020841A JP 2010176583 A JP2010176583 A JP 2010176583A
Authority
JP
Japan
Prior art keywords
information
learning
learning result
encrypted
external device
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2009020841A
Other languages
English (en)
Inventor
Masatake Fukunaga
正剛 福永
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Dai Nippon Printing Co Ltd
Original Assignee
Dai Nippon Printing Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Dai Nippon Printing Co Ltd filed Critical Dai Nippon Printing Co Ltd
Priority to JP2009020841A priority Critical patent/JP2010176583A/ja
Publication of JP2010176583A publication Critical patent/JP2010176583A/ja
Pending legal-status Critical Current

Links

Images

Landscapes

  • Storage Device Security (AREA)
  • Elevator Control (AREA)

Abstract

【課題】学習ルーチンや学習結果をセキュアに保護することができる情報処理装置、情報処理方法、情報処理プログラム及び情報処理システムを提供する。
【解決手段】収束性を有する所定の学習用のアルゴリズムに基づいて学習された学習結果を暗号化する第1の暗号化部11と、暗号化された学習結果を記憶する第1の記憶部12と、暗号化された学習結果を復号する第1の復号部13と、第1の情報が入力される入力部14と、外部機器に第2の情報を出力する出力部15と、第1の情報が入力されたときに、第1の記憶部12から暗号化された学習結果を読み出し、第1の復号部13により復号し、当該復号された学習結果を参照して、第1の情報に基づき、外部機器における次の動作を決定する動作情報を第2の情報として生成し、第2の情報としての動作情報を出力部15を介して外部機器に出力する制御部16と、を備えるとした。
【選択図】図1

Description

本発明は、情報を処理する情報処理装置、情報処理方法、情報処理プログラム及び情報処理システムに関する。
複数のユーザが使用する物、例えば、エレベータにおいて、効率的な運用を図るために、当該物を制御する制御装置が備えられている。ここで、エレベータの制御装置は、学習機能を有しており、当該学習機能の発揮によりエレベータを効率的に制御している。
ここで、特許文献1において、人工知能を利用したエレベータシステムのトラフィック予測精度を改善する学習方法について提案されている。
また、学習方法の代表例として強化学習機能がある。強化学習機能は、エレベータ等の製品に組み込まれ、より利便性の高いシステムを利用者に提供するための一機能として使用されている。
特開平05−213542号公報
ここで、実際のシステムに組み込まれて得られた学習機能における学習ルーチン(処理)や学習結果自体は、それぞれの製品等により異なるが、多大な資産価値があるため、不正に改ざんされたり、漏洩されたりすることから守りたいという要求が存在する。
また、学習ルーチン(処理)や学習結果が不正に改ざんされた場合、それらが組み込まれた製品にセキュリティや性能面での重大な影響を及ぼし、また、コードやルーチンが漏洩することで資産価値に大きな影響を及ぼすことが予想される。
そこで、本発明は、学習ルーチン(処理)や学習結果をセキュアに保護することができる情報処理装置、情報処理方法、情報処理プログラム及び情報処理システムを提供することを目的とする。
本発明は、以下のような解決手段により、前記課題を解決する。なお、理解を容易にするために、本発明の実施形態に対応する符号を付して説明するが、これに限定されるものではない。
請求項1の発明は、収束性を有する所定の学習用のアルゴリズムに基づいて学習された学習結果を暗号化する第1の暗号化手段(11)と、前記第1の暗号化手段により暗号化された前記学習結果を記憶する第1の記憶手段(12)と、前記第1の記憶手段に記憶されている暗号化された前記学習結果を復号する第1の復号手段(13)と、外部機器により生成された第1の情報が入力される入力手段(14)と、前記外部機器に第2の情報を出力する出力手段(15)と、前記入力手段に前記第1の情報が入力されたときに、前記第1の記憶手段に記憶されている暗号化された前記学習結果を読み出し、当該読み出した暗号化されている前記学習結果を前記第1の復号手段により復号し、当該復号された前記学習結果を参照して、前記第1の情報に基づき、前記外部機器における次の動作を決定する動作情報を第2の情報として生成し、前記第2の情報としての前記動作情報を前記出力手段を介して前記外部機器に出力する制御手段(16)と、を備えることを特徴とする情報処理装置(1)である。
請求項2の発明は、請求項1に記載の情報処理装置(1)において、前記制御手段により生成された前記動作情報を暗号化する第2の暗号化手段(17)と、前記第2の暗号化手段により暗号化された前記動作情報を記憶する第2の記憶手段(18)と、を備え、前記制御手段は、前記第2の記憶手段に記憶されている暗号化された前記動作情報を前記出力手段を介して前記外部機器に出力することを特徴とする情報処理装置である。
請求項3の発明は、請求項1又は2に記載の情報処理装置(1)において、前記アルゴリズムに基づいて学習を行う学習手段(19)を備え、前記制御手段(16)は、前記動作情報に基づいて動作をした結果である動作結果情報が前記外部機器から前記入力手段を介して入力されたときに、前記動作結果情報を参照して、前記学習手段により前記アルゴリズムに基づく学習を行わせ、当該学習により得られた学習結果を前記第1の暗号化手段により暗号化し、当該暗号化された前記学習結果を前記第1の記憶手段に書込み、前記第1の記憶手段に記憶されている学習結果を更新することを特徴とする情報処理装置である。
請求項4の発明は、請求項1から3までのいずれか1項に記載の情報処理装置(1)において、前記入力手段に入力される前記第1の情報は暗号化されており、暗号化された当該第1の情報を復号する第2の復号手段(20)を備え、前記制御手段(16)は、前記学習結果を参照して、前記第2の復号手段により復号された前記第1の情報に基づき、前記外部機器における次の動作を決定する動作情報を第2の情報として生成することを特徴とする情報処理装置である。
請求項5の発明は、請求項3に記載の情報処理装置(1)において、前記入力手段(14)により入力された前記第1の情報には、所定の時刻における環境情報が含まれており、前記学習手段(19)は、動的な環境に適したアルゴリズムと、静的な環境に適したアルゴリズムとを有しており、前記環境情報に基づいて、静的な環境であるか又は動的な環境であるかを判断し、当該判断の結果に基づいて最適となるアルゴリズムを選択し、選択したアルゴリズムに基づいて学習を行うことを特徴とする情報処理装置。
請求項6の発明は、収束性を有する所定の学習用のアルゴリズムに基づいて学習された学習結果を暗号化する暗号化工程と、前記暗号化工程により暗号化された前記学習結果を記憶部に記憶する記憶工程と、前記記憶部に記憶されている暗号化された前記学習結果を復号する復号工程と、外部機器により生成された第1の情報が入力される入力工程と、前記入力工程により前記第1の情報が入力されたときに、前記記憶部に記憶されている暗号化された前記学習結果を読み出し、当該読み出した暗号化されている前記学習結果を前記復号工程により復号し、当該復号された前記学習結果を参照して、前記第1の情報に基づき、前記外部機器における次の動作を決定する動作情報を第2の情報として生成し、前記第2の情報としての前記動作情報を前記外部機器に出力する制御工程と、を有することを特徴とする情報処理方法である。
請求項7の発明は、コンピュータに、収束性を有する所定の学習用のアルゴリズムに基づいて学習された学習結果を暗号化する暗号化工程と、前記暗号化工程により暗号化された前記学習結果を記憶部に記憶する記憶工程と、前記記憶部に記憶されている暗号化された前記学習結果を復号する復号工程と、外部機器により生成された第1の情報が入力される入力工程と、前記入力工程により前記第1の情報が入力されたときに、前記記憶部に記憶されている暗号化された前記学習結果を読み出し、当該読み出した暗号化されている前記学習結果を前記復号工程により復号し、当該復号された前記学習結果を参照して、前記第1の情報に基づき、前記外部機器における次の動作を決定する動作情報を第2の情報として生成し、前記第2の情報としての前記動作情報を前記外部機器に出力する制御工程と、を実行させるための情報処理プログラムである。
請求項8の発明は、情報処理装置と外部機器とを備えて所定の情報の処理を実行する情報処理システムにおいて、前記情報処理装置(1)は、収束性を有する所定の学習用のアルゴリズムに基づいて学習された学習結果を暗号化する第1の暗号化手段(11)と、前記第1の暗号化手段により暗号化された前記学習結果を記憶する第1の記憶手段(12)と、前記第1の記憶手段に記憶されている暗号化された前記学習結果を復号する第1の復号手段(13)と、外部機器により生成された第1の情報が入力される入力手段(14)と、前記外部機器に第2の情報を出力する第1の出力手段(15)と、前記入力手段に前記第1の情報が入力されたときに、前記第1の記憶手段に記憶されている暗号化された前記学習結果を読み出し、当該読み出した暗号化されている前記学習結果を前記第1の復号手段により復号し、当該復号された前記学習結果を参照して、前記第1の情報に基づき、前記外部機器における次の動作を決定する動作情報を第2の情報として生成し、前記第2の情報としての前記動作情報を前記第1の出力手段を介して前記外部機器に出力する制御手段(16)と、を備え、前記外部機器は、前記第1の情報を生成する情報生成手段(31)と、前記第1の情報を前記入力手段に出力する第2の出力手段(32)と、前記第2の情報としての前記動作情報に基づいて動作を実行する動作制御手段(33)と、を備えることを特徴とする情報処理システムである。
本発明によれば、以下の効果を奏することができる。
(1)本発明は、セキュリティデバイスであるICカードに内蔵されて、外部機器(例えば、エレベータ)に備えられているR/W(リーダライタ)部に挿入されることにより、設置されている場所、運転状況及び運転時間等に適応した外部機器の固有の動作(例えば、エレベータの昇降動作)を強化学習により制御し、その過程で得られた学習結果をセキュアに保護することができる。
また、本発明は、収束性を有する所定の学習用のアルゴリズムに基づいて学習された学習結果を利用するので、学習時間の経過にしたがってある一定の学習結果に収束するため、安定した学習結果によって外部機器を制御することができる。
(2)本発明は、資産価値がある学習ルーチン及び学習結果が不正に改ざんされたり、漏洩されたりする状況を回避することができる。
(3)本発明は、学習部を備えるので、外部機器に含まれている制御装置に学習機能が備わっていない場合であっても、収束性を有する所定の学習用のアルゴリズムにより得られる学習結果によって外部機器の動作を制御することができる。
(4)本発明は、セキュリティデバイスであるICカードに内蔵されて、外部機器(例えば、エレベータ)に備えられているR/W(リーダライタ)部に挿入されることにより、外部機器から暗号化された第1の情報(環境情報であって、例えば、報酬情報r(t)と環境情報S(t)等)が入力されてくるので、第1の情報を不正に利用されることがなく、安全性の高いシステムを構築することができる。
(5)本発明は、環境に適したアルゴリズムにより学習を行うので、環境に適した学習結果により外部機器を制御することができる。
情報処理装置の第1の構成を示す機能ブロック図である。 学習結果を保護するシステムの処理の流れについての説明に供するタイミングチャートである。 情報処理装置の第2の構成を示す機能ブロック図である。 情報処理装置の第3の構成を示す機能ブロック図である。 学習結果及び学習ルーチンを保護するシステムの処理の流れについての説明に供するタイミングチャートである。 情報処理装置の第4の構成を示す機能ブロック図である。 制御装置の構成を示す機能ブロック図である。 情報処理装置を外部機器の昇降制御に利用した場合におけるシステム構成を示す図である。
以下、図面等を参照しながら、本発明の実施の形態について、さらに詳しく説明する。図1は、外部機器と通信を行う情報処理装置1のブロック図である。情報処理装置1は、強化学習を利用して外部機器を効率的に制御し、その過程で得られる学習ルーチン(処理)や学習結果を、暗号化技術を利用して保護する機能を有しており、例えば、セキュリティデバイスであるICカード等のメディアに内蔵される。なお、当該メディアは、物理的あるいは論理的に内部の情報を読み取らせ難い機能(耐タンパ機能)を有している。また、以下では、「外部機器」には、外部機器(例えば、エレベータ)の動作を制御する制御装置が含まれているものとし、また、制御装置には、セキュリティデバイスであるICカード等のメディアに対して、情報の読み込み及び書込みが可能なR/W(リーダライタ)部が備えられているものとする。
当該機能を実現するために、情報処理装置1は、図1に示すように、第1の暗号化部11(第1の暗号化手段)と、第1の記憶部12(第1の記憶手段)と、第1の復号部13(第1の復号手段)と、入力部14(入力手段)と、出力部15(出力手段)と、制御部16(制御手段)とを備える。
第1の暗号化部11は、詳細を後述する、収束性を有する所定の学習用のアルゴリズムに基づいて学習された学習結果を暗号化する。ここで、「収束性を有する所定の学習用のアルゴリズム」について説明する。当該アルゴリズムは、エレベータ等の製品に組み込まれ、より利便性の高いシステムを利用者に提供するための強化学習を実行するアルゴリズムである。また、強化学習(例えば、Q−LearningやProfit Sharing)とは、行動の結果(出力)にのみ評価(報酬)を与え、その評価が最大になる出力を学習する仕組みを指す。また、強化学習では、学習するために様々な行動を試し、それぞれの結果に応じた評価を得て、高評価であった行動を優先的に実行する。そして、強化学習では、学習が完了すると、行動には特定の報酬が与えられた状態となり、報酬が高い行動は優先的に選択されるようになる。
第1の記憶部12は、第1の暗号化部11により暗号化された学習結果を記憶する。第1の復号部13は、第1の記憶部12に記憶されている暗号化された学習結果を復号する。入力部14は、外部機器により生成された第1の情報が入力される。出力部15は、外部機器に第2の情報を出力する。
制御部16は、入力部14に第1の情報が入力されたときに、第1の記憶部12に記憶されている暗号化された学習結果を読み出し、当該読み出した暗号化されている学習結果を第1の復号部13により復号し、当該復号された学習結果を参照して、第1の情報に基づき、外部機器における次の動作を決定する動作情報を第2の情報として生成し、第2の情報としての動作情報を、出力部15を介して当該外部機器に出力する。
また、学習結果を保護するシステムの処理の流れについて図2を参照しながら説明する。なお、図2では、情報処理装置1を有するデバイスをセキュリティデバイス101とし、外部機器における次の動作を決定する制御部16の機能を動作決定ルーチン102とし、外部機器を制御する装置を制御システム103とし、強化学習を実行する機能を学習ルーチン104とする。
学習ルーチン104は、学習結果をセキュリティデバイス101に供給する(S1)。セキュリティデバイス101では、学習結果を暗号化して第1の記憶部12に格納する。
制御システム103は、現状の情報を動作決定ルーチン102に供給し、次の動作の指示を要求する(S2)。動作決定ルーチン102は、現在、第1の記憶部12に格納されている学習結果に基づいて、次の動作を決定し(S3)、次の動作を指示する情報を制御システム103に供給する(S4)。
制御システム103は、動作決定ルーチン102から供給された次の動作を決定する情報に基づいて外部機器の動作を制御し、そのときの状況情報及び結果(乗客の待ち時間等)を学習ルーチン104に供給する(S5)。学習ルーチン104は、制御システム103から供給された状況情報及び結果に基づいて強化学習を実行する(S6)。また、制御システム103は、実行した学習結果をセキュリティデバイス101に供給する(S7)。セキュリティデバイス101では、学習結果を更新するために、新しい学習結果を暗号化して第1の記憶部12に格納する(古い学習結果を上書きする)。
このようにして構成される情報処理装置1は、例えば、セキュリティデバイスであるICカードに内蔵されて、外部機器(例えば、エレベータ)に備えられているR/W(リーダライタ)部に挿入されることにより、設置されている場所、運転状況及び運転時間等に適応した外部機器の固有の動作(例えば、エレベータの昇降動作)を強化学習により制御し、その過程で得られた学習結果をセキュアに保護することができる。したがって、情報処理装置1は、資産価値がある学習結果が不正に改ざんされたり、漏洩されたりする状況を回避することができる。また、情報処理装置1では、収束性を有する所定の学習用のアルゴリズムに基づいて学習された学習結果を利用するので、学習時間の経過にしたがってある一定の学習結果に収束するため、安定した学習結果によって外部機器を制御することができる。
また、情報処理装置1は、図3に示すように、図1に示す構成にさらに、第2の暗号化部17(第2の暗号化手段)と、第2の記憶部18(第2の記憶手段)とを備える構成であっても良い。なお、図3では、第2の暗号化部17の周辺の構成のみを示す。
第2の暗号化部17は、制御部16により生成された動作情報を暗号化する。第2の記憶部18は、第2の暗号化部17により暗号化された動作情報を記憶する。このように構成される場合には、制御部16は、第2の記憶部18に記憶されている暗号化された動作情報を、出力部15を介して外部機器に出力する。
このようにして構成される情報処理装置1は、例えば、セキュリティデバイスであるICカードに内蔵されて、外部機器(例えば、エレベータ)に備えられているR/W(リーダライタ)部に挿入されることにより、設置されている場所、運転状況及び運転時間等に適応した外部機器の固有の動作(例えば、エレベータの昇降動作)を強化学習により制御し、その過程で得られた動作情報としての学習ルーチン及び学習結果をセキュアに保護することができる。したがって、情報処理装置1は、資産価値がある学習ルーチンや学習結果が不正に改ざんされたり、漏洩されたりする状況を回避することができる。また、情報処理装置1では、収束性を有する所定の学習用のアルゴリズムに基づいて学習された学習結果を利用するので、学習時間の経過にしたがってある一定の学習結果に収束するため、安定した学習結果によって外部機器を制御することができる。
また、情報処理装置1は、図4に示すように、図1の構成にさらに、アルゴリズムに基づいて学習を行う学習部19(学習手段)を備える構成であっても良い。このような構成の場合には、制御部16は、動作情報に基づいて動作をした結果である動作結果情報が外部機器から入力部14を介して入力されたときに、動作結果情報を参照して、学習部19により収束性を有する所定の学習用のアルゴリズムにより学習を行わせ、当該学習により得られた学習結果を第1の暗号化部11により暗号化し、当該暗号化された学習結果を第1の記憶部12に書込み、第1の記憶部12に記憶されている学習結果を更新する。
また、学習結果及び学習ルーチンを保護するシステムの処理の流れについて図5を参照しながら説明する。なお、図5では、情報処理装置1を有するデバイスをセキュリティデバイス101とし、外部機器における次の動作を決定する制御部16の機能を動作決定ルーチン102とし、外部機器を制御する装置を制御システム103とし、強化学習を実行する機能を学習ルーチン104とする。
制御システム103は、現状の情報を動作決定ルーチン102に供給し、次の動作の指示を要求する(S11)。動作決定ルーチン102は、動作決定ルーチン102は、現在第1の記憶部12に格納されている学習結果に基づいて、次の動作を決定し(S12)、次の動作を指示する情報を制御システム103に供給する(S13)。
制御システム103は、動作決定ルーチン102から供給された次の動作を決定する情報に基づいて外部機器の動作(例えば、エレベータの昇降動作)を制御し(S14)、そのときの状況情報及び結果(乗客の待ち時間等)を学習ルーチン104に供給する(S15)。
学習ルーチン104は、制御システム103から供給された状況情報及び結果に基づいて強化学習を実行し、学習結果を更新する(S16)。具体的には、セキュリティデバイス101では、学習結果を更新するために、新しい学習結果を暗号化して第1の記憶部12に格納する(古い学習結果を上書きする)。また、学習ルーチン104は、更新された学習結果を動作決定ルーチン102に反映させる(S17)。
このようにして構成される情報処理装置1は、学習部19を備えるので、外部機器に含まれている制御装置に学習機能が備わっていない場合であっても、収束性を有する所定の学習用のアルゴリズムにより得られる学習結果によって外部機器の動作を制御することができる。
また、情報処理装置1は、図6に示すように、図1に示す構成にさらに、入力部14に入力される第1の情報は暗号化されており、暗号化された当該第1の情報を復号する第2の復号部20(第2の復号手段)を備える構成であっても良い。このような構成の場合には、制御部16は、学習結果を参照して、第2の復号部20により復号された第1の情報に基づき、外部機器における次の動作を決定する動作情報を第2の情報として生成する。また、入力部14に入力された第1の情報は、第2の復号部20により復号された後、学習部19に入力される。
このようにして構成される情報処理装置1は、例えば、セキュリティデバイスであるICカードに内蔵されて、外部機器(例えば、エレベータ)に備えられているR/W(リーダライタ)部に挿入されることにより、外部機器から暗号化された第1の情報(環境情報であって、例えば、後述する報酬情報r(t)と環境情報S(t)等)が入力されてくるので、第1の情報を不正に利用されることがなく、安全性の高いシステムを構築することができる。
ここで、学習部19により実行される学習方法について詳細に説明する。なお、以下では、強化学習としてQ−Learningアルゴリズムを適用した場合を想定して説明するが、これは一例であって、収束性を有する学習用のアルゴリズムであれば他のものであっても適用が可能である。また、以下では、外部機器3に含まれている制御装置2は、図7に示すように、第1の情報としての報酬情報(r(t))及び環境情報(S(t))を生成する情報生成部31と、第1の情報を情報処理装置1の入力部14に出力する出力部32と、第2の情報としての動作情報に基づいて外部機器3(例えば、エレベータ)の動作を制御する動作制御部33とを備えているものとする。また、出力部32は、第1の情報を暗号化して情報処理装置1に出力する機能を有しているものとする。
学習部19により利用される強化学習のための一般化式は、以下の通りである。時刻tにおける行動情報、報酬情報、環境情報、行動指標値を、それぞれa(t)、r(t)、S(t)、Q(t)とすると、基本的に以下の(1)式及び(2)式になる。
a(t)=f(S(t),Q(t))・・・(1)
Q(t+1)=E(r(t),S(t),a(t))・・・(2)
ここで、f(x)は、環境情報と行動指標値を用いて、行動を決定するための任意の関数であり、E(x)は、行動情報、報酬情報及び環境情報から行動指標値を更新するための任意の学習用関数である。なお、学習部19は、学習結果を収束させるように演算を行うため、Q(t)を収束させるような学習用関数を選択する。
また、情報処理装置1をICカードに内蔵させる構成においては、外部機器3から入力される各種の情報(第1の情報)は、暗号化して入力されることが要求される場合がある。その場合には、制御装置2の出力部32は、当該情報(第1の情報)を暗号化してICカードに出力する。ここで、暗号化に利用する鍵を「k」とし、暗号化対象データを「x」とした場合の任意の暗号化関数を、Enc(x)と表すと、ICカードに出力される情報(第1の情報)は、以下の(3)式及び(4)式となる。
S´(t)=Enc(S(t))・・・(3)
r´(t)=Enc(r(t))・・・(4)
なお、S´(t)及びr´(t)は、それぞれ暗号化された環境情報及び報酬情報である。また、情報処理装置1は、第2の復号部20により暗号化された第1の情報を復号する。ここで、復号関数をDec(x)とすると、第2の復号部20において実行されるべき関数は以下の(5)式及び(6)式になる。
a(t)=f(Dec(S´(t)),Q(t))・・・(5)
Q(t+1)=E(Dec(r´(t)),Dec(S´(t)),a(t))・・・(6)
また、この関数に適合する一例として、Q−Learningアルゴリズムの一般式に上記条件を適用すると、以下の(7)式になる。
Q(S,a)←Q(Dec(s´),a)+α(Dec(r´t+1)+γmaxQ(Dec(s´t+1),p)−Q(Dec(s´),a)・・・(7)
また、情報処理装置1では、上述したように、入力部14により入力された第1の情報には、所定の時刻tにおける環境情報Q(t)が含まれている。また、学習部19は、動的な環境に適した収束性を有する所定の学習用のアルゴリズム(例えば、Profit Sharingアルゴリズム)と、静的な環境に適した収束性を有する所定の学習用のアルゴリズム(例えば、Q−Learningアルゴリズム)とを有しており、環境情報Q(t)に基づいて、静的な環境であるか又は動的な環境であるかを判断し、当該判断の結果に基づいて最適となるアルゴリズムを選択し、選択したアルゴリズムに基づいて学習を行う。
このように構成されることにより、情報処理装置1は、環境に適したアルゴリズムにより学習を行うので、環境に適した学習結果により外部機器を制御することができる。
ここで、情報処理装置1をエレベータ(外部機器)の昇降制御に利用した場合について説明する。図8は、システム全体の模式図であり、外部機器としてのエレベータのカゴ201と、カゴ201の昇降動作を制御する制御システム202と、情報処理装置1を有するセキュリティデバイス203とから構成される。なお、制御システム202は、上述した制御システム103に対応する同一構成のシステムであり、セキュリティデバイス203は、上述したセキュリティデバイス101と同一構成のデバイスである。また、エレベータに関する制御の一つに停止階制御がある。停止階制御とは、例えば、高層の建物において、エレベータのカゴ201が4階に停止しているときに、1階と5階においてそれぞれ同時期に乗場押しボタンが押下された場合にカゴ201の移動(昇降)等を制御することである。
また、強化学習の観点で考えると、評価(報酬)として与えられるものは各階においてエレベータのカゴ201を待っている乗客の待ち時間となる。エレベータのカゴ201は4階に停止中において、例えば、1階で待っている乗客により上階への移動を指示するボタンが押下され、同時期に、5階で待っている乗客により下階への移動を指示するボタンが押下された場合には、エレベータのカゴ201の昇降を制御する制御システム202は、以下の2通りの昇降制御を指示することが考えられる。なお、エレベータのカゴ201の昇降動作には、移動する、停止する、上に移動する、下に移動する、の4つ動作があり、制御システム202は、各動作を制御する。
1.制御システム202は、1階の乗客を乗せるために、4階から1階にカゴ201を移動し、停止して(停止後、扉を開き、1階の乗客を乗せた後、扉を閉める)、1階から5階にカゴ201を移動し、停止して(途中階では停止指示がされなかったものとし、カゴ201の停止後、扉を開き、5階の乗客を乗せて、扉を閉める)、再び、5階から1階にカゴ201を移動し、停止する(停止後、扉を開き、乗客を降ろした後、扉を閉めて次の指示を待つ)。
2.制御システム202は、5階の乗客を乗せるために、4階から5階にカゴ201を移動し、停止して(停止後、扉を開き、5階の乗客を乗せた後、扉を閉める)、5階から1階にカゴ201を移動し、停止する(途中階では停止指示がされなかったものとする。また、停止後、扉を開き、乗客を降ろした後、扉を閉めて次の指示を待つ)。
カゴ201は、1.の動作の場合、最短でも4F→1F→5Fの順で移動するので、途中階における停止指示がない場合には、7階分移動しなければならない。一方、カゴ201は、2.の動作の場合、4F→5F→1Fの順で移動するので、途中階における停止指示がない場合には、5階分の移動で乗客の輸送が完了する。
情報処理装置1を有するセキュリティデバイス203は、1.の動作と2.の動作を試した結果、2.の動作に対し高い評価(報酬)を与えることとなる。なお、セキュリティデバイス203は、単に動作だけでなく、各階で待っている乗客の数や実際の利用状況を把握して強化学習を行うため、場合によっては、1.の動作に対して高い評価(報酬)を与えることもある。
また、保護すべき情報(資産価値が高い情報)は、行動(上階に異動するか、又は下階に移動するか)に対する評価結果(乗客の待ち時間)を学習する「学習ルーチン」、及び学習した結果を反映し、次の行動(エレベータのカゴ201の移動制御)に利用する「評価結果」となる。そのため、情報処理装置1では、学習ルーチンを実装したコードや評価結果を示すデータ等を暗号化して保護する。
したがって、情報処理装置1を利用したエレベータのカゴ201の昇降動作を制御するシステムにおいては、暗号化によりセキュアに保護されており、収束性を有する所定の学習用のアルゴリズムにより生成された評価結果を用いて、次のエレベータのカゴ201の移動順序について効率的に決定することができる。
また、情報処理装置1は、学習ルーチンが行動及び報酬に基づいた学習を評価結果に反映するので、学習を繰り返すごとに評価結果が変動し、学習回数が多くなるほど収束して安定した評価結果となって外部機器に入力される。また、情報処理装置1は、時間的に規則性のある条件ごと(例えば、曜日ごと、週ごと、月ごと等)に評価結果を生成しておき、各条件に沿って外部機器を制御するような構成であっても良い。
本実施例では、単一のエレベータのカゴの昇降制御について説明したが、これに限られず、複数台のエレベータが並ぶような場合における停止階制御に利用されても良いし、特定の階に停止しない不停止制御(フロアカット)に利用されても良いし、また、強化学習が適用可能な技術分野であればエレベータの昇降制御以外の制御に用いられても良い。
1 情報処理装置
2 制御装置
3 外部機器
11 第1の暗号化部
12 第1の記憶部
13 第1の復号部
14 入力部
15、32 出力部
16 制御部
17 第2の暗号化部
18 第2の記憶部
19 学習部
20 第2の復号部
31 情報生成部
33 動作制御部

Claims (8)

  1. 収束性を有する所定の学習用のアルゴリズムに基づいて学習された学習結果を暗号化する第1の暗号化手段と、
    前記第1の暗号化手段により暗号化された前記学習結果を記憶する第1の記憶手段と、
    前記第1の記憶手段に記憶されている暗号化された前記学習結果を復号する第1の復号手段と、
    外部機器により生成された第1の情報が入力される入力手段と、
    前記外部機器に第2の情報を出力する出力手段と、
    前記入力手段に前記第1の情報が入力されたときに、前記第1の記憶手段に記憶されている暗号化された前記学習結果を読み出し、当該読み出した暗号化されている前記学習結果を前記第1の復号手段により復号し、当該復号された前記学習結果を参照して、前記第1の情報に基づき、前記外部機器における次の動作を決定する動作情報を第2の情報として生成し、前記第2の情報としての前記動作情報を前記出力手段を介して前記外部機器に出力する制御手段と、を備えることを特徴とする情報処理装置。
  2. 請求項1に記載の情報処理装置において、
    前記制御手段により生成された前記動作情報を暗号化する第2の暗号化手段と、
    前記第2の暗号化手段により暗号化された前記動作情報を記憶する第2の記憶手段と、を備え、
    前記制御手段は、前記第2の記憶手段に記憶されている暗号化された前記動作情報を前記出力手段を介して前記外部機器に出力することを特徴とする情報処理装置。
  3. 請求項1又は2記載の情報処理装置において、
    前記アルゴリズムに基づいて学習を行う学習手段を備え、
    前記制御手段は、前記動作情報に基づいて動作をした結果である動作結果情報が前記外部機器から前記入力手段を介して入力されたときに、前記動作結果情報を参照して、前記学習手段により前記アルゴリズムに基づく学習を行わせ、当該学習により得られた学習結果を前記第1の暗号化手段により暗号化し、当該暗号化された前記学習結果を前記第1の記憶手段に書込み、前記第1の記憶手段に記憶されている学習結果を更新することを特徴とする情報処理装置。
  4. 請求項1から請求項3までのいずれか1項に記載の情報処理装置において、
    前記入力手段に入力される前記第1の情報は暗号化されており、暗号化された当該第1の情報を復号する第2の復号手段を備え、
    前記制御手段は、前記学習結果を参照して、前記第2の復号手段により復号された前記第1の情報に基づき、前記外部機器における次の動作を決定する動作情報を第2の情報として生成することを特徴とする情報処理装置。
  5. 請求項3に記載の情報処理装置において、
    前記入力手段により入力された前記第1の情報には、所定の時刻における環境情報が含まれており、
    前記学習手段は、動的な環境に適したアルゴリズムと、静的な環境に適したアルゴリズムとを有しており、前記環境情報に基づいて、静的な環境であるか又は動的な環境であるかを判断し、当該判断の結果に基づいて最適となるアルゴリズムを選択し、選択したアルゴリズムに基づいて学習を行うことを特徴とする情報処理装置。
  6. 収束性を有する所定の学習用のアルゴリズムに基づいて学習された学習結果を暗号化する暗号化工程と、
    前記暗号化工程により暗号化された前記学習結果を記憶部に記憶する記憶工程と、
    前記記憶部に記憶されている暗号化された前記学習結果を復号する復号工程と、
    外部機器により生成された第1の情報が入力される入力工程と、
    前記入力工程により前記第1の情報が入力されたときに、前記記憶部に記憶されている暗号化された前記学習結果を読み出し、当該読み出した暗号化されている前記学習結果を前記復号工程により復号し、当該復号された前記学習結果を参照して、前記第1の情報に基づき、前記外部機器における次の動作を決定する動作情報を第2の情報として生成し、前記第2の情報としての前記動作情報を前記外部機器に出力する制御工程と、を有することを特徴とする情報処理方法。
  7. コンピュータに、
    収束性を有する所定の学習用のアルゴリズムに基づいて学習された学習結果を暗号化する暗号化工程と、
    前記暗号化工程により暗号化された前記学習結果を記憶部に記憶する記憶工程と、
    前記記憶部に記憶されている暗号化された前記学習結果を復号する復号工程と、
    外部機器により生成された第1の情報が入力される入力工程と、
    前記入力工程により前記第1の情報が入力されたときに、前記記憶部に記憶されている暗号化された前記学習結果を読み出し、当該読み出した暗号化されている前記学習結果を前記復号工程により復号し、当該復号された前記学習結果を参照して、前記第1の情報に基づき、前記外部機器における次の動作を決定する動作情報を第2の情報として生成し、前記第2の情報としての前記動作情報を前記外部機器に出力する制御工程と、
    を実行させるための情報処理プログラム。
  8. 情報処理装置と外部機器とを備えて所定の情報の処理を実行する情報処理システムにおいて、
    前記情報処理装置は、
    収束性を有する所定の学習用のアルゴリズムに基づいて学習された学習結果を暗号化する第1の暗号化手段と、
    前記第1の暗号化手段により暗号化された前記学習結果を記憶する第1の記憶手段と、
    前記第1の記憶手段に記憶されている暗号化された前記学習結果を復号する第1の復号手段と、
    外部機器により生成された第1の情報が入力される入力手段と、
    前記外部機器に第2の情報を出力する第1の出力手段と、
    前記入力手段に前記第1の情報が入力されたときに、前記第1の記憶手段に記憶されている暗号化された前記学習結果を読み出し、当該読み出した暗号化されている前記学習結果を前記第1の復号手段により復号し、当該復号された前記学習結果を参照して、前記第1の情報に基づき、前記外部機器における次の動作を決定する動作情報を第2の情報として生成し、前記第2の情報としての前記動作情報を前記第1の出力手段を介して前記外部機器に出力する制御手段と、を備え、
    前記外部機器は、
    前記第1の情報を生成する情報生成手段と、
    前記第1の情報を前記入力手段に出力する第2の出力手段と、
    前記第2の情報としての前記動作情報に基づいて動作を制御する動作制御手段と、を備えることを特徴とする情報処理システム。
JP2009020841A 2009-01-30 2009-01-30 情報処理装置、情報処理方法、情報処理プログラム及び情報処理システム Pending JP2010176583A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2009020841A JP2010176583A (ja) 2009-01-30 2009-01-30 情報処理装置、情報処理方法、情報処理プログラム及び情報処理システム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2009020841A JP2010176583A (ja) 2009-01-30 2009-01-30 情報処理装置、情報処理方法、情報処理プログラム及び情報処理システム

Publications (1)

Publication Number Publication Date
JP2010176583A true JP2010176583A (ja) 2010-08-12

Family

ID=42707460

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2009020841A Pending JP2010176583A (ja) 2009-01-30 2009-01-30 情報処理装置、情報処理方法、情報処理プログラム及び情報処理システム

Country Status (1)

Country Link
JP (1) JP2010176583A (ja)

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2018216379A1 (ja) * 2017-05-26 2018-11-29 株式会社日立国際電気 機械学習モデル不正検知システム及び不正検知方法
JP2019101807A (ja) * 2017-12-04 2019-06-24 大日本印刷株式会社 デバイス、セキュアエレメント、プログラム、情報処理システム及び情報処理方法
JP2019109680A (ja) * 2017-12-18 2019-07-04 大日本印刷株式会社 デバイス、セキュアエレメント、プログラム、情報処理方法及び情報処理システム
WO2020024476A1 (zh) * 2018-08-01 2020-02-06 苏州汇川技术有限公司 校验方法、电梯控制设备以及电梯***设备
JP7460000B1 (ja) 2023-03-03 2024-04-02 フジテック株式会社 エレベータシステム及びプログラム

Citations (15)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS63211046A (ja) * 1987-02-27 1988-09-01 Toshiba Corp 携帯可能電子装置
JPS6473485A (en) * 1987-09-14 1989-03-17 Hudson Soft Co Ltd System card
JPH0544559A (ja) * 1991-08-20 1993-02-23 Nissan Motor Co Ltd エンジンの空燃比制御装置
JPH05213542A (ja) * 1991-10-15 1993-08-24 Otis Elevator Co “人工知能”を使用してエレベータシステムのトラフィック予測精度を改善する学習方法
JPH05298277A (ja) * 1992-04-24 1993-11-12 Hitachi Ltd ニュ−ラルネット学習装置及び学習方法
JPH08249009A (ja) * 1995-03-09 1996-09-27 Hitachi Ltd 制御用計算機のネットワークシステム
JP2000020494A (ja) * 1998-07-07 2000-01-21 Nippon Telegr & Teleph Corp <Ntt> マルチエージェントモデルを用いて経験強化型強化学習法と環境同定型強化学習法を統合する分散強化学習法
JP2000035956A (ja) * 1998-07-17 2000-02-02 Japan Science & Technology Corp エージェント学習装置
JP2002329180A (ja) * 2001-04-27 2002-11-15 Toshiba Corp 無線通信機能を有するメモリカード及びそのデータ通信方法
JP2002338153A (ja) * 2001-05-17 2002-11-27 Hitachi Building Systems Co Ltd エレベータ制御装置
JP2005173671A (ja) * 2003-12-08 2005-06-30 Nec Corp リンク診断装置、リンク診断方法およびリンク診断プログラム。
JP2006056676A (ja) * 2004-08-20 2006-03-02 Mitsubishi Electric Building Techno Service Co Ltd エレベータの保守システム
JP2006076773A (ja) * 2004-09-13 2006-03-23 Toshiba Elevator Co Ltd エレベータ用データ伝送システム
JP2007249263A (ja) * 2006-03-13 2007-09-27 Buffalo Inc 持ち運び可能なデータストレージデバイスおよびデータの書き込みおよび読み出し制御方法
JP2007328771A (ja) * 2006-05-09 2007-12-20 Matsushita Electric Ind Co Ltd 機密データ保護装置、自律移動ロボット、機密データ保護方法、コンピュータプログラム及び集積回路

Patent Citations (15)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS63211046A (ja) * 1987-02-27 1988-09-01 Toshiba Corp 携帯可能電子装置
JPS6473485A (en) * 1987-09-14 1989-03-17 Hudson Soft Co Ltd System card
JPH0544559A (ja) * 1991-08-20 1993-02-23 Nissan Motor Co Ltd エンジンの空燃比制御装置
JPH05213542A (ja) * 1991-10-15 1993-08-24 Otis Elevator Co “人工知能”を使用してエレベータシステムのトラフィック予測精度を改善する学習方法
JPH05298277A (ja) * 1992-04-24 1993-11-12 Hitachi Ltd ニュ−ラルネット学習装置及び学習方法
JPH08249009A (ja) * 1995-03-09 1996-09-27 Hitachi Ltd 制御用計算機のネットワークシステム
JP2000020494A (ja) * 1998-07-07 2000-01-21 Nippon Telegr & Teleph Corp <Ntt> マルチエージェントモデルを用いて経験強化型強化学習法と環境同定型強化学習法を統合する分散強化学習法
JP2000035956A (ja) * 1998-07-17 2000-02-02 Japan Science & Technology Corp エージェント学習装置
JP2002329180A (ja) * 2001-04-27 2002-11-15 Toshiba Corp 無線通信機能を有するメモリカード及びそのデータ通信方法
JP2002338153A (ja) * 2001-05-17 2002-11-27 Hitachi Building Systems Co Ltd エレベータ制御装置
JP2005173671A (ja) * 2003-12-08 2005-06-30 Nec Corp リンク診断装置、リンク診断方法およびリンク診断プログラム。
JP2006056676A (ja) * 2004-08-20 2006-03-02 Mitsubishi Electric Building Techno Service Co Ltd エレベータの保守システム
JP2006076773A (ja) * 2004-09-13 2006-03-23 Toshiba Elevator Co Ltd エレベータ用データ伝送システム
JP2007249263A (ja) * 2006-03-13 2007-09-27 Buffalo Inc 持ち運び可能なデータストレージデバイスおよびデータの書き込みおよび読み出し制御方法
JP2007328771A (ja) * 2006-05-09 2007-12-20 Matsushita Electric Ind Co Ltd 機密データ保護装置、自律移動ロボット、機密データ保護方法、コンピュータプログラム及び集積回路

Non-Patent Citations (3)

* Cited by examiner, † Cited by third party
Title
CSNB199700106001; 相澤 益男: ニューロ・ファジィ・AIハンドブック 第1版, 19940525, 第1088-1091頁, 株式会社 オーム社 *
JPN6012055187; 相澤 益男: ニューロ・ファジィ・AIハンドブック 第1版, 19940525, 第1088-1091頁, 株式会社 オーム社 *
JPN6012055188; 'エレベータの知能群管理方式 その2:学習論理' 情報処理学会論文誌 Vol.28,No.3, 19870315, 第299-309頁, 情報処理学会 *

Cited By (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2018216379A1 (ja) * 2017-05-26 2018-11-29 株式会社日立国際電気 機械学習モデル不正検知システム及び不正検知方法
JPWO2018216379A1 (ja) * 2017-05-26 2019-12-26 株式会社日立国際電気 機械学習モデル不正検知システム及び不正検知方法
US11544352B2 (en) 2017-05-26 2023-01-03 Hitachi Kokusai Electric Inc. Machine-learning model fraud detection system and fraud detection method
JP2019101807A (ja) * 2017-12-04 2019-06-24 大日本印刷株式会社 デバイス、セキュアエレメント、プログラム、情報処理システム及び情報処理方法
JP2022009575A (ja) * 2017-12-04 2022-01-14 大日本印刷株式会社 デバイス、セキュアエレメント、プログラム及び情報処理方法
JP7052325B2 (ja) 2017-12-04 2022-04-12 大日本印刷株式会社 デバイス、セキュアエレメント、プログラム、情報処理システム及び情報処理方法
JP7419325B2 (ja) 2017-12-04 2024-01-22 大日本印刷株式会社 デバイス、プログラム及び情報処理方法
JP2019109680A (ja) * 2017-12-18 2019-07-04 大日本印刷株式会社 デバイス、セキュアエレメント、プログラム、情報処理方法及び情報処理システム
WO2020024476A1 (zh) * 2018-08-01 2020-02-06 苏州汇川技术有限公司 校验方法、电梯控制设备以及电梯***设备
JP7460000B1 (ja) 2023-03-03 2024-04-02 フジテック株式会社 エレベータシステム及びプログラム

Similar Documents

Publication Publication Date Title
CN101427222B (zh) 数据处理装置、方法、程序生成装置、方法
JP2010176583A (ja) 情報処理装置、情報処理方法、情報処理プログラム及び情報処理システム
CN107851152A (zh) 用于安全控制器的分布式操作的技术
CN103761070A (zh) 微处理器以及相关的操作方法、以及加密方法
JP2004228786A (ja) 耐タンパマイクロプロセッサ及びキャッシュメモリ搭載プロセッサによるデータアクセス制御方法
CN101410850A (zh) 加密存储***中的数据
CN110245490A (zh) 有条件的结合代码标注与类型维度的收据存储方法和节点
CN110266644A (zh) 结合代码标注与交易类型的收据存储方法和节点
CN110263086A (zh) 结合用户类型与事件函数类型的收据存储方法和节点
WO2007091558A1 (ja) プログラム難読化装置
CN110008735A (zh) 区块链中实现合约调用的方法及节点、存储介质
CN110278193A (zh) 结合代码标注与交易、事件类型的收据存储方法和节点
CN110276684A (zh) 结合交易类型和事件函数类型的收据存储方法和节点
CN110245503A (zh) 结合代码标注与判断条件的收据存储方法和节点
CN110264198A (zh) 结合代码标注与交易类型的有条件的收据存储方法和节点
CN110245504A (zh) 结合多类型维度的条件限制的收据存储方法和节点
CN110245945A (zh) 结合代码标注与用户类型的收据存储方法和节点
CN107408072A (zh) 用于随机化计算机指令集、存储器寄存器和指针的方法和装置
CN110245946A (zh) 结合代码标注与多类型维度的收据存储方法和节点
CN110263090A (zh) 多类型维度的收据存储方法和节点
CN110264193A (zh) 结合用户类型与交易类型的收据存储方法和节点
CN110263088A (zh) 结合代码标注与事件类型的有条件的收据存储方法和节点
CN110263089A (zh) 结合交易与事件类型的条件限制的收据存储方法和节点
CN102483699A (zh) 密码密钥的虚拟化
Camp et al. Toward a secure internet of things: directions for research

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20111107

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20121016

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20121030

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20121225

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20130312

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20130709