JP7267966B2 - 情報処理装置及び情報処理方法 - Google Patents

情報処理装置及び情報処理方法 Download PDF

Info

Publication number
JP7267966B2
JP7267966B2 JP2020049231A JP2020049231A JP7267966B2 JP 7267966 B2 JP7267966 B2 JP 7267966B2 JP 2020049231 A JP2020049231 A JP 2020049231A JP 2020049231 A JP2020049231 A JP 2020049231A JP 7267966 B2 JP7267966 B2 JP 7267966B2
Authority
JP
Japan
Prior art keywords
value
parameter
target value
nth
target
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2020049231A
Other languages
English (en)
Other versions
JP2021149988A (ja
Inventor
英之 中川
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Toshiba Corp
Original Assignee
Toshiba Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Toshiba Corp filed Critical Toshiba Corp
Priority to JP2020049231A priority Critical patent/JP7267966B2/ja
Priority to US17/009,935 priority patent/US11550274B2/en
Publication of JP2021149988A publication Critical patent/JP2021149988A/ja
Application granted granted Critical
Publication of JP7267966B2 publication Critical patent/JP7267966B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G05CONTROLLING; REGULATING
    • G05BCONTROL OR REGULATING SYSTEMS IN GENERAL; FUNCTIONAL ELEMENTS OF SUCH SYSTEMS; MONITORING OR TESTING ARRANGEMENTS FOR SUCH SYSTEMS OR ELEMENTS
    • G05B13/00Adaptive control systems, i.e. systems automatically adjusting themselves to have a performance which is optimum according to some preassigned criterion
    • G05B13/02Adaptive control systems, i.e. systems automatically adjusting themselves to have a performance which is optimum according to some preassigned criterion electric
    • G05B13/0205Adaptive control systems, i.e. systems automatically adjusting themselves to have a performance which is optimum according to some preassigned criterion electric not using a model or a simulator of the controlled system
    • G05B13/024Adaptive control systems, i.e. systems automatically adjusting themselves to have a performance which is optimum according to some preassigned criterion electric not using a model or a simulator of the controlled system in which a parameter or coefficient is automatically adjusted to optimise the performance
    • GPHYSICS
    • G05CONTROLLING; REGULATING
    • G05BCONTROL OR REGULATING SYSTEMS IN GENERAL; FUNCTIONAL ELEMENTS OF SUCH SYSTEMS; MONITORING OR TESTING ARRANGEMENTS FOR SUCH SYSTEMS OR ELEMENTS
    • G05B13/00Adaptive control systems, i.e. systems automatically adjusting themselves to have a performance which is optimum according to some preassigned criterion
    • G05B13/02Adaptive control systems, i.e. systems automatically adjusting themselves to have a performance which is optimum according to some preassigned criterion electric
    • G05B13/04Adaptive control systems, i.e. systems automatically adjusting themselves to have a performance which is optimum according to some preassigned criterion electric involving the use of models or simulators
    • G05B13/048Adaptive control systems, i.e. systems automatically adjusting themselves to have a performance which is optimum according to some preassigned criterion electric involving the use of models or simulators using a predictor
    • GPHYSICS
    • G05CONTROLLING; REGULATING
    • G05BCONTROL OR REGULATING SYSTEMS IN GENERAL; FUNCTIONAL ELEMENTS OF SUCH SYSTEMS; MONITORING OR TESTING ARRANGEMENTS FOR SUCH SYSTEMS OR ELEMENTS
    • G05B17/00Systems involving the use of models or simulators of said systems
    • G05B17/02Systems involving the use of models or simulators of said systems electric
    • GPHYSICS
    • G05CONTROLLING; REGULATING
    • G05BCONTROL OR REGULATING SYSTEMS IN GENERAL; FUNCTIONAL ELEMENTS OF SUCH SYSTEMS; MONITORING OR TESTING ARRANGEMENTS FOR SUCH SYSTEMS OR ELEMENTS
    • G05B23/00Testing or monitoring of control systems or parts thereof
    • G05B23/02Electric testing or monitoring
    • G05B23/0205Electric testing or monitoring by means of a monitoring system capable of detecting and responding to faults
    • G05B23/0218Electric testing or monitoring by means of a monitoring system capable of detecting and responding to faults characterised by the fault detection method dealing with either existing or incipient faults
    • G05B23/0243Electric testing or monitoring by means of a monitoring system capable of detecting and responding to faults characterised by the fault detection method dealing with either existing or incipient faults model based detection method, e.g. first-principles knowledge model
    • G05B23/0254Electric testing or monitoring by means of a monitoring system capable of detecting and responding to faults characterised by the fault detection method dealing with either existing or incipient faults model based detection method, e.g. first-principles knowledge model based on a quantitative model, e.g. mathematical relationships between inputs and outputs; functions: observer, Kalman filter, residual calculation, Neural Networks
    • GPHYSICS
    • G11INFORMATION STORAGE
    • G11BINFORMATION STORAGE BASED ON RELATIVE MOVEMENT BETWEEN RECORD CARRIER AND TRANSDUCER
    • G11B5/00Recording by magnetisation or demagnetisation of a record carrier; Reproducing by magnetic means; Record carriers therefor
    • G11B5/48Disposition or mounting of heads or head supports relative to record carriers ; arrangements of heads, e.g. for scanning the record carrier to increase the relative speed
    • G11B5/54Disposition or mounting of heads or head supports relative to record carriers ; arrangements of heads, e.g. for scanning the record carrier to increase the relative speed with provision for moving the head into or out of its operative position or across tracks
    • G11B5/55Track change, selection or acquisition by displacement of the head
    • G11B5/5521Track change, selection or acquisition by displacement of the head across disk tracks
    • G11B5/5582Track change, selection or acquisition by displacement of the head across disk tracks system adaptation for working during or after external perturbation, e.g. in the presence of a mechanical oscillation caused by a shock
    • GPHYSICS
    • G11INFORMATION STORAGE
    • G11BINFORMATION STORAGE BASED ON RELATIVE MOVEMENT BETWEEN RECORD CARRIER AND TRANSDUCER
    • G11B5/00Recording by magnetisation or demagnetisation of a record carrier; Reproducing by magnetic means; Record carriers therefor
    • G11B5/48Disposition or mounting of heads or head supports relative to record carriers ; arrangements of heads, e.g. for scanning the record carrier to increase the relative speed
    • G11B5/58Disposition or mounting of heads or head supports relative to record carriers ; arrangements of heads, e.g. for scanning the record carrier to increase the relative speed with provision for moving the head for the purpose of maintaining alignment of the head relative to the record carrier during transducing operation, e.g. to compensate for surface irregularities of the latter or for track following
    • G11B5/596Disposition or mounting of heads or head supports relative to record carriers ; arrangements of heads, e.g. for scanning the record carrier to increase the relative speed with provision for moving the head for the purpose of maintaining alignment of the head relative to the record carrier during transducing operation, e.g. to compensate for surface irregularities of the latter or for track following for track following on disks
    • G11B5/59627Aligning for runout, eccentricity or offset compensation

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Automation & Control Theory (AREA)
  • General Physics & Mathematics (AREA)
  • Artificial Intelligence (AREA)
  • Evolutionary Computation (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Software Systems (AREA)
  • Medical Informatics (AREA)
  • Health & Medical Sciences (AREA)
  • Mathematical Physics (AREA)
  • Feedback Control In General (AREA)
  • Signal Processing For Digital Recording And Reproducing (AREA)

Description

本発明の実施形態は、情報処理装置及び情報処理方法に関する。
サーボ制御系は、制御対象の高性能化に伴い複雑化の傾向にある。そのため、調整すべき制御パラメータ数が増大している。従来の技術では、設計者がシミュレーションを実施しながら、段階的に、知識や経験に基づいて多数の制御パラメータを調整していた。そのため、従来の技術では、調整に時間がかかること、或いは、将来の制御対象の複雑化に伴い調整が困難になることなどの課題があった。上記の課題は、サーボ制御系に限られず、その他の制御系に対しても全般的に共通するところである。
米国特許第9691420号明細書
本発明が解決しようとする課題は、人間では調整に時間がかかる、或いは、調整が困難なパラメータを、機械学習を用いて自動的に最適化することができる情報処理装置及び情報処理方法を提供することである。
実施形態の情報処理装置は、第n調整部と、第n+1調整部とを持つ。第n調整部は、依存関係にある複数のパラメータのうち、少なくとも第nパラメータに基づく第n評価値を第n目標値に近づけるように前記第nパラメータを調整する。第n+1調整部は、前記複数のパラメータのうち、少なくとも第n+1パラメータに基づく第n+1評価値を第n+1目標値に近づけるように第n+1パラメータを調整する。第n調整部は、更に、前記第nパラメータの探索回数が所定数以下の場合、少なくとも1組以上の前記第nパラメータの初期値を取得し、前記取得した各初期値に基づく第n実測値又は第n予測値を取得し、前記取得した各初期値に基づく第n+1目標値を取得し、前記取得した第n実測値又は第n予測値と前記取得した第n+1目標値を使って、前記第n評価値を前記第n目標値に近づける制約下において、第n+1目標値を最適化する前記第nパラメータを探索し、前記第nパラメータの探索回数が前記所定数を超える場合、前記探索した第nパラメータに基づく第n実測値又は第n予測値を取得し、前記探索した第nパラメータに基づく第n+1目標値を取得し、前記取得した第n実測値又は第n予測値と前記取得した第n+1目標値を使って、前記第n評価値を前記第n目標値に近づける制約下において、第n+1目標値を最適化する前記第nパラメータを探索する。
実施形態に係る情報処理装置の構成の一例を表す図。 HDDのサーボ制御系の一例を表す図。 実施形態に係るパラメータ調整部の構成の一例を表す図。 実施形態に係る第nパラメータ調整部が実行する一連の処理の流れを表すフローチャート。 実施形態に係る情報処理装置が実行するパラメータの探索処理の流れを表すフローチャート。 関連技術を用いた第nパラメータの調整結果を表す図。 関連技術を用いた第n+1パラメータの調整結果を表す図。 実施形態の技術を用いた第nパラメータの調整結果を表す図。 実施形態の技術を用いた第n+1パラメータの調整結果を表す図。
以下、実施形態の情報処理装置及び情報処理方法を、図面を参照して説明する。実施形態における情報処理装置は、ある制御系(制御システム)を設計する際に考慮すべきパラメータを、機械学習を用いて自動的に調整或いは最適化する装置である。制御系は、例えば、サーボ制御系である。サーボ制御系は、HDD(Hard Disk Drive)のように、モータ等のアクチュエータをフィードバック制御するシステムである。パラメータの調整対象である制御系は、サーボ制御系に限られず、ロボットアームの制御システムといった多種多様なシステムであってよい。
以下、実施形態に係る情報処理装置100について説明する。実施形態に係る情報処理装置100は、単一の装置であってもよいし、ネットワークNWを介して接続された複数の装置が互いに協働して動作するシステムであってもよい。ネットワークNWには、例えば、WAN(Wide Area Network)やLAN(Local Area Network)などが含まれてよい。すなわち、情報処理装置100は、分散コンピューティングやクラウドコンピューティングを利用したシステムに含まれる複数のコンピュータ(プロセッサ)によって実装されてもよい。
[情報処理装置の構成]
図1は、実施形態に係る情報処理装置100の構成の一例を表す図である。実施形態の情報処理装置100は、例えば、通信部110と、制御部120と、記憶部160とを備える。
通信部110は、例えば、NIC(Network Interface Card)等の通信インターフェースや、DMA(Direct Memory Access)コントローラなどを含む。通信部110は、ネットワークNWを介して外部装置と通信する。外部装置は、例えば、制御系の設計者などが利用可能なコンピュータである。
制御部120は、例えば、取得部130と、出力制御部140と、パラメータ調整部150とを備える。これらの構成要素は、例えば、CPU(Central Processing Unit)やGPU(Graphics Processing Unit)などのプロセッサが記憶部160に格納されたプログラムを実行することにより実現される。また、制御部120の構成要素の一部または全部は、LSI(Large Scale Integration)、ASIC(Application Specific Integrated Circuit)、またはFPGA(Field-Programmable Gate Array)などのハードウェアにより実現されてもよいし、ソフトウェアとハードウェアの協働によって実現されてもよい。
記憶部160は、例えば、HDD、フラッシュメモリ、EEPROM(Electrically Erasable Programmable Read Only Memory)、ROM(Read Only Memory)、RAM(Random Access Memory)などにより実現される。記憶部160には、ファームウェアやアプリケーションプログラムなどの各種プログラムの他に、制御部120による演算結果や処理結果が記憶される。
取得部130は、通信部110を介して、設計者が利用可能なコンピュータ等から、各種情報を取得する。例えば、取得部130は、設計者が実験などを行って実測した評価値又は目標値、シミュレーションで予測した評価値又は目標値を取得してよい。
出力制御部140は、通信部110を介して、設計者が利用可能なコンピュータ等に、後述するパラメータ調整部150によるパラメータの調整結果を出力(送信)する。
パラメータ調整部150は、制御系を設計する際に考慮すべき複数のパラメータを機械学習を用いて調整(決定)する。複数のパラメータは依存関係下にある。例えば、複数のパラメータのうち、ある第nパラメータの調整は第n-1パラメータに依存し、第n+1パラメータの調整は第nパラメータに依存する。nは任意の自然数である。このような依存関係は、第nパラメータが、第n-1パラメータの調整結果を考慮して調整され、同様に、第n+1パラメータが、第nパラメータの調整結果を考慮して調整されるような場合に成立する。
図2は、HDDのサーボ制御系の一例を表す図である。図示のように、HDDのサーボ制御系では、複数のフィルタから構成される。このようなフィルタ構成の場合、各フィルタのパラメータは依存関係にある。例えば、第nパラメータは、VCM(Voice Coil Motor)側に影響する外乱を抑圧するためのフィルタ(例えば、図中のVCM Loop Shapingフィルタ)に関連したパラメータであり、第n+1パラメータは、MA(Micro Actuator)側に影響する外乱を抑圧するためのフィルタ(例えば、図中のMA Loop Shapingフィルタ)に関連したパラメータである。VCM側の外乱は、「第1の外乱」の一例であり、MA側の外乱は、「第2の外乱」の一例である。VCM側の外乱を抑圧するためのフィルタは、「第1フィルタ」の一例であり、MA側の外乱を抑圧するためのフィルタは、「第2フィルタ」の一例である。
VCMは、HDDの磁気ヘッドを支えるためのサスペンションアームを駆動させるためのアクチュエータである。MAは、VCMと同様に、サスペンションアームを駆動させるアクチュエータであり、VCMよりも細かくサスペンションアームの位置決めを可能とする。例えば、外乱を回転非同期振動(Non Repeatable Runout;NRRO)と見做した場合、各フィルタは、NRRO抑圧フィルタであってよい。NRRO抑圧フィルタのパラメータには、例えば、バンド幅、深さ、中心周波数、Q値などが含まれる。外乱は回転非同期振動に限られず、回転同期振動(Repeatable Runout;RRO)や他の種類の外乱であってもよい。この場合、フィルタは外乱の種類に応じて適宜変更されてよい。
一般的に、VCM用のフィルタとMA用のフィルタの調整には、順序或いは段階が存在する。例えば、設計者は、一方のフィルタの評価値を所定の目標値にできるだけ近づけるようにパラメータを調整した後に、その調整した一方のフィルタのパラメータを考慮した上で、他方のフィルタの評価値を所定の目標値にできるだけ近づけるようにパラメータを調整する。そのため、VCM用のフィルタのパラメータとMA用のフィルタのパラメータとは、一方向又は双方向の依存関係にある。
このような調整方法は、一方のフィルタの評価値を所定の目標値に近づけるようにパラメータを調整するほど、他方のフィルタの評価値が取るべき理想的な目標値が得られ、その結果として、他方のフィルタのパラメータを理想的な目標値に向けて調整できる、という前提に立った方法である。しかしながら、一方のフィルタのパラメータ調整により、評価値が所定の目標値から少し外れても(目標値に近づかなくとも)、他方のフィルタのよりよい目標値が得られる場合があり、その結果として、他方のフィルタの評価値を当該よりよい目標値に近づけるようにパラメータを調整することによって、従来よりもフィルタ性能を向上できる場合がある。このように前提に先立たないパラメータの調整は人間には困難である。
このようなことから、パラメータ調整部150は、順次的或いは段階的に調整されることで依存関係となり得る複数のパラメータを、機械学習を用いて調整する。
[パラメータ調整部の構成]
以下、パラメータ調整部150の詳細な構成について説明する。図3は、実施形態に係るパラメータ調整部150の構成の一例を表す図である。実施形態に係るパラメータ調整部150は、調整対象のパラメータを複数の段階を介して調整する場合、複数のパラメータ調整部を備える。例えば、調整対象のパラメータを3段階で調整する場合、図示のように、パラメータ調整部150は、第n-1パラメータ調整部150n-1と、第nパラメータ調整部150nと、第n+1パラメータ調整部150n+1とを備えてよい。
これら複数のパラメータ調整部の其々によって調整されるパラメータは互いに異なる。例えば、第n-1パラメータ調整部150n-1は、第n-1パラメータを調整し、第nパラメータ調整部150nは、第nパラメータを調整し、第n+1パラメータ調整部150n+1は、第n+1パラメータを調整する。
第n-1パラメータ調整部150n-1により第n-1パラメータが調整された後、第nパラメータ調整部150nは、少なくとも調整済みの第n-1パラメータを使用して、第nパラメータを調整する。そして、第nパラメータ調整部150nにより第nパラメータが調整された後、第n+1パラメータ調整部150n+1は、少なくとも調整済みの第nパラメータを使用して、第n+1パラメータを調整する。このように、各パラメータ調整部は、順番にパラメータを調整する。各パラメータ調整部によって調整されるパラメータは、一次元の値(スカラ)であってもよいし、多次元の値(ベクトル)であってもよい。
以下、複数のパラメータ調整部のうち、第nパラメータ調整部150nに着目して説明する。第nパラメータ調整部150nは、第n目標値生成部151nと、第n初期値生成部152nと、第n評価部153nと、第n+1目標値予測部154nと、第n探索部155nとを備える。第n-1パラメータ調整部150n-1や第n+1パラメータ調整部150n+1といった他のパラメータ調整部についても、これらの構成要素と同等の構成要素を備える。
第n目標値生成部151nは、第nパラメータを調整する際の目標値(以下、第n目標値と称する)を生成(決定)する。第n目標値は、一つの値であってもよいし、複数の値(関数のサンプル値)であってもよい。例えば、図2のサーボ制御系において、第nパラメータをVCM用のフィルタに関するパラメータとする場合、第n目標値には、VCM用のフィルタに関わる何らかの周波数特性を表すサンプル値が目標値として含まれてよい。
例えば、第n目標値生成部151nは、少なくとも前段の第n-1パラメータ調整部150n-1によって調整された第n-1パラメータに基づいて、第n目標値を生成する。具体的には、第n目標値生成部151nは、前段の第n-1パラメータ調整部150n-1から調整済みの第n-1パラメータを取得し、取得した第n-1パラメータを使った特定条件下の実験やシミュレーションにより第n目標値を得る。
ここでいう「少なくとも」とは、例えば、第n目標値が、前段の第n-1パラメータ調整部150n-1によって調整された第n-1パラメータに加えて、更に、2つ前段の第n-2パラメータ調整部150n-2によって調整された第n-2パラメータや、3つ前段の第n-3パラメータ調整部150n-3によって調整された第n-3パラメータなどに基づいて生成されてもよいことを意味する。
なお、第nパラメータ調整部150nが第1段目のパラメータ調整部であり、前段に他のパラメータ調整部が存在せず、特定条件下の実験やシミュレーションにより第n目標値を得ることができない場合、第nパラメータ調整部150nは、第n目標値を生成する代わりに、予め決められた第n目標値を代用してもよい。例えば、設計者が、過去の実験やシミュレーションなどの結果を基に第n目標値を適切に決定したとする。この場合、設計者は、コンピュータを利用して、決定した第n目標値を情報処理装置100に送信する。これを受けて、情報処理装置100の通信部110は、ネットワークNWを介して、設計者のコンピュータから第n目標値を受信し、これを記憶部160に記憶させる。このように、記憶部160に既に第n目標値が記憶されている場合、第n目標値生成部151nは、第n目標値を生成する代わりに、記憶部160から第n目標値を読み出してもよい。
第n初期値生成部152nは、第nパラメータを調整する際に初期値とするパラメータ値(以下、第n初期値と称する)を生成する。例えば、第n初期値生成部152nは、乱数を用いて第n初期値を無作為に生成してよい。また、第n初期値生成部152nは、乱数を用いて複数の第n初期値を生成しても良い。また、第n初期値生成部152nは、乱数を用いて複数の第n初期値を生成し、それら複数の第n初期値に基づく第n評価値の中から、第n目標値生成部151nによって生成された第n目標値に最も近い第n評価値を持つ第n初期値を選択してもよい。
第n評価部153nは、1回目の探索を行う場合、第n初期値生成部152nによって生成された第n初期値を用いて設計者等が実測した第n評価値を取得したり、第n初期値生成部152nによって生成された第n初期値を用いて設計者等がシミュレーションにより予測した第n評価値を取得したりする。設計者等がシミュレーションにより第n評価値を予測する代わりに、第n評価部153nがシミュレーションを行って第n評価値を予測してもよい。探索の1回目は、「所定数」の一例である。
また、第n評価部153nは、2回目以降の探索を行う場合、第n探索部155nによって探索された第nパラメータ値(以下、第n探索値と称する)を用いて設計者等が実測した第n評価値を取得したり、第n探索部155nによって探索された第n探索値を用いて設計者等がシミュレーションにより予測した第n評価値を取得したりする。設計者等がシミュレーションにより第n評価値を予測する代わりに、第n評価部153nがシミュレーションを行って第n評価値を予測してもよい。以下、第n初期値又は第n探索値を用いて実測された第n評価値を「第n実測値」と称し、第n初期値又は第n探索値を用いてシミュレーションにより予測された第n評価値を「第n予測値」と称して説明する。
第n+1目標値予測部154nは、少なくとも第n初期値生成部152nによって生成された第n初期値、又は第n探索部155nによって探索された第n探索値に基づいて、後段の第n+1パラメータ調整部150n+1によって調整される第n+1パラメータに基づく第n+1評価値の目標値(以下、第n+1目標値と称する)を予測する。第n+1目標値は、第n目標値と同様に、一つの値であってもよいし、複数の値(関数のサンプル値)であってもよい。例えば、図2のサーボ制御系において、第n+1パラメータをMA用のフィルタに関するパラメータとする場合、第n+1目標値には、MA用のフィルタに関わる何らかの周波数特性を表すサンプル値が目標値として含まれてよい。
ここでいう「少なくとも」とは、例えば、第n+1目標値が、第n初期値に加えて、更に、第n-1調整値、第n-2調整値、第n-3調整値といった前段で扱われるパラメータの調整値に基づいて予測されてもよいことを意味する。第n-1調整値は、1つ前段の第n-1パラメータ調整部150n-1によって調整済みの第n-1パラメータの値である。第n-2調整値は、2つ前段の第n-2パラメータ調整部150n-2によって調整済みの第n-2パラメータの値である。第n-3調整値は、3つ前段の第n-3パラメータ調整部150n-3によって調整済みの第n-3パラメータの値である。
また、「少なくとも」とは、例えば、第n+1目標値が、第n探索値に加えて、更に、上記の第n-1調整値、上記の第n-2調整値、上記の第n-3調整値といった前段で扱われるパラメータの調整値に基づいて予測されてもよいことも意味する。
例えば、第n+1目標値予測部154nは、第n初期値又は第n探索値を使った特定条件下の実験やシミュレーションにより第n+1目標値を得る。
このように、第n+1目標値予測部154nは、第n段目で調整される第nパラメータの初期値や探索値を利用して後段で調整される第n+1パラメータの目標値を予測したり、第n段目で調整される第nパラメータの初期値や探索値に加えて、第n段よりも前段で調整された第n-xパラメータの調整値を利用して、後段で調整される第n+1パラメータの目標値を予測したりする。
上述したように、例えば、第n+1目標値が関数の複数のサンプル値である場合、第n+1目標値として、その複数のサンプル値の中の代表的な1つのサンプル値を選択してもよいし、複数のサンプル値から何らかの値を導いてもよい。
第n探索部155nは、第n評価部153nによって取得した全ての第n実測値又は第n予測値と第n+1目標予測部によって予測した全ての第n+1目標値を使って、所定の制約下において、第n+1目標値を最適化する蓋然性が高い第nパラメータを探索し、探索によって得られた第nパラメータを上記の第n探索値とする。所定の制約とは、第n評価値を第n目標値生成部151nによって生成された第n目標値に近づけることである。なお、第n探索部155nは、全ての第n実測値又は第n予測値と、全ての第n+1目標値を使って第nパラメータを探索することに代えて、一部の第n実測値又は第n予測値と、一部の第n+1目標値を使って第nパラメータを探索してもよい。
例えば、第n探索部155nは、数式(1)の目的関数を最小化する第nパラメータを、最適化手法を用いて効率よく探索する。
Figure 0007267966000001
式中xは、第nパラメータを表している。obj(x)は、第nパラメータxを説明変数としたときの目的関数を表している。fn+1(x)は、第n+1目標値予測部154nによって予測される第n+1目標値を表している。wとg(x)との積は、目的関数obj(x)における制約項を表している。g(x)は、第n評価部153nによって取得される第n実測値、又は第n評価部153nによって予測される第n予測値と、第n目標値生成部151nによって生成された第n目標値との近さを表しており、例えば、第n実測値/第n予測値と、第n目標値との差分(誤差)を表している。g(x)は0以上の値となる。wは、目的関数obj(x)全体に対してg(x)をどの程度寄与させるのか、ということを表す重み係数で、正の値である。第n+1目標値fn+1(x)は、「第1項」の一例であり、制約項(w×g(x))は、「第2項」の一例である。
数式(1)の目的関数を最小化するためには、制約項(w×g(x))を小さくし、且つ第n+1目標値fn+1(x)を小さくする必要がある。そのため、第n探索部155nは、制約項(w×g(x))を小さくしつつ、第n+1目標値fn+1(x)を小さくする第nパラメータを探索する。
例えば、第n探索部155nは、最適化手法の一つであるSMBO(Sequential Model Based Optimization)を用いて、第nパラメータを探索してよい。SMBOは、ベイズ最適化とも呼ばれる。SMBO(ベイズ最適化)は、実験で実測された評価値(第n実測値)や、シミュレーションで予測された評価値(第n予測値)を活用して、より少ない試行回数で目的関数(目的変数)を最小化または最大化する方法の一つである。第n探索部155nは、SMBOに代えて、或いは加えて、遺伝的アルゴリズム(Genetic Algorithm;GA)に代表されるメタヒューリスティクス、数理最適化アルゴリズムといった他の最適化手法を用いて第nパラメータを探索してもよい。メタヒューリスティクスには、例えば、進化戦略(Evolution Strategy;ES)なども含まれる。数理最適化アルゴリズムには、例えば、準ニュートン法などが含まれる。
また、第n探索部155nは、数式(2)の目的関数を最大化する第nパラメータを、上述したSMBO等に代表されるような最適化手法を用いて探索してもよい。
Figure 0007267966000002
[全体の処理フロー]
以下、フローチャートに即して情報処理装置100の処理の流れについて説明する。図4は、実施形態に係る第nパラメータ調整部150nが実行する一連の処理の流れを表すフローチャートである。
まず、第n目標値生成部151nは、少なくとも前段の第n-1パラメータ調整部150n-1によって調整された第n-1パラメータに基づいて、当段で調整する第nパラメータに基づく評価値の目標値である第n目標値を生成する(ステップS100)。
次に、第n初期値生成部152nは、乱数などを用いて、第nパラメータの初期値である第n初期値を生成する(ステップS102)。
次に、第n評価部153nは、第n初期値生成部152nによって生成された第n初期値を用いて設計者が実測したり予測したりした第n評価値(つまり第n実測値や第n予測値)を取得する(ステップS104)。
例えば、設計者に実験で第n評価値を実測させたり、シミュレーションで第n評価値を予測させたりする場合、第n評価部153nは、出力制御部140に対して、第n初期値に関する情報を設計者のコンピュータに送信するように指示する。第n初期値に関する情報とは、第n初期値そのものや、第n初期値を視覚的に表現したグラフ等であってよい。指示を受けた出力制御部140は、通信部110を介して、第n初期値に関する情報を設計者のコンピュータに送信する。これによって、コンピュータのディスプレイには、第n初期値が表示されたり、第n初期値を視覚的に描画したグラフなどが表示される。設計者は、コンピュータのディスプレイに表示された値やグラフなどを見ながら、制御系の実機を用いて第nパラメータ値に基づく評価値を実測したり、コンピュータ上でシミュレートしたりする。そして、設計者は、第n評価値の実測結果やシミュレーション結果をコンピュータに入力する。コンピュータは、第n評価値の実測結果やシミュレーション結果が入力されると、それら結果をネットワークNWを介して情報処理装置100に送信する。これを受けて第n評価部153nは、通信部110を介して、設計者のコンピュータから、第n評価値の実測結果を第n実測値として取得したり、第n評価値のシミュレーション結果を第n予測値として取得したりする。なお、情報処理装置100にキーボードやタッチパネルといったユーザインターフェースが接続されており、設計者がそれらのユーザインターフェースを操作して実測結果やシミュレーション結果を入力した場合、第n評価部153nは、ユーザインターフェースを介して実測結果やシミュレーション結果を取得してもよい。
また、第n評価部153nは、設計者のコンピュータに第n初期値に関する情報を送信することで、設計者に第n評価値を実測させたり予測させたりすることに代えて、或いは加えて、自らが第n評価値をシミュレーションによって予測してもよい。すなわち、第n評価部153nは、インタラクティブに処理を進めるのに代えて、或いは加えて、非インタラクティブに処理を進めてもよい。このようにして、第n評価値の実測値である第n実測値や、第n評価値の予測値である第n予測値が得られる。
次に、第n+1目標値予測部154nは、少なくとも第n初期値生成部152nによって生成された第n初期値に基づいて、後段で調整される第n+1パラメータの目標値である第n+1目標値を予測する(ステップS106)。S106の処理は、S104の処理の前に行われてもよいし、S104の処理と並行して行われてもよい。
次に、第n探索部155nは、第n評価部153nによって取得した全ての第n実測値又は第n予測値と第n+1目標予測部154nによって予測した全ての第n+1目標値を使って、所定の制約下において、第n+1目標値を最適化する蓋然性が高い第nパラメータを探索する(ステップS108)。上述したように、所定の制約は、第n評価値を、第n目標値生成部151nによって生成された第n目標値に近づけることである。上述したように、第n探索部155nは、一部の第n実測値又は第n予測値と、一部の第n+1目標値を使って、所定の制約下において、第nパラメータを探索してもよい。
次に、第n探索部155nは、現在の探索のイテレーション回数iをインクリメントしたときに、その回数iが最大回数imaxよりも小さいか否かを判定する(ステップS110)。第n探索部155nは、インクリメントしたイテレーション回数iが最大回数imaxよりも大きい場合(i=i+1>imax)、本フローチャートの処理を終了する。
一方、第n探索部155nは、インクリメントしたイテレーション回数iが最大回数imaxと同じか小さい場合(i=i+1≦imax)、S104に処理を戻す。
これを受けて、第n評価部153nは、S104の処理として、第n探索部155nによって探索された第n探索値を用いて設計者が実測したり予測したりした第n評価値(つまり第n実測値や第n予測値)を取得する。例えば、第n評価部153nは、設計者のコンピュータに第n探索値に関する情報を送信することで、設計者に第n評価値を実測させたり予測させたりする。また、第n評価部153nは、第n探索部155nによって探索された第n探索値を用いて第n評価値を予測してもよい。
次に、第n+1目標値予測部154nは、S106の処理として、少なくとも第n探索部155nによって探索された第n探索値に基づいて、後段で調整される第n+1パラメータの目標値である第n+1目標値を予測する。
次に、第n探索部155nは、S108の処理として、第n評価部153nによって取得された全ての第n実測値又は第n予測値と第n+1目標予測部154nによって予測した全ての第n+1目標値を使って、所定の制約下において、第n+1目標値を最適化する蓋然性が高い第nパラメータを探索する。このように、情報処理装置100は、探索のイテレーション回数iが最大回数imaxよりも大きくなるまで、予測した第n+1目標値を最適化する第nパラメータを探索することを繰り返す。上述したように、第n探索部155nは、一部の第n実測値又は第n予測値と、一部の第n+1目標値を使って、所定の制約下において、第nパラメータを探索することを繰り返してもよい。
なお、上述したフローチャートでは、第nパラメータ調整部150nが、S104の処理として、第n評価値(第n実測値や第n予測値)を外部装置(例えば設計者のコンピュータ)から取得してもよいことを説明したがこれに限られない。例えば、第nパラメータ調整部150nは、S100の処理として、第n目標値を外部装置から取得してもよいし、S102の処理として、第n初期値を外部装置から取得してもよい。また、第nパラメータ調整部150nは、S106の処理として、第n+1目標値を外部装置から取得してもよい。
[パラメータ探索の処理フロー]
以下、フローチャートに即してパラメータの探索処理の流れについて説明する。図5は、実施形態に係る情報処理装置100が実行するパラメータの探索処理の流れを表すフローチャートである。本フローチャートの処理は、最適化手法としてSMBO(ベイズ最適化)を採用した場合のS108の処理に相当する。
まず、第n探索部155nは、1回目の探索を行う場合、第n初期値を用いて得られた第n実測値又は第n予測値と、第n初期値を用いて得られた第n+1目標値とに基づいて、目的関数を評価する(ステップS200)。
例えば、数式(1)の目的関数の場合、第n探索部155nは、第n目標値とある第nパラメータxに基づく第n実測値又は第n予測値を使って制約項(w×g(x))を求め、更に、その制約項(w×g(x))と、上記の第nパラメータXに基づく第n+1目標値(fn+1(x))との和を、目的関数obj(x)として導出する。
次に、第n探索部155nは、第nパラメータx(第n初期値又は第n探索値)と、導出した目的関数obj(x)の値(つまり目的変数)とを組みにした一つのデータを記憶部160に記憶させる(ステップS202)。以下、第nパラメータx(第n初期値又は第n探索値)と目的関数obj(x)の値とを組みにした一つのデータを「観測点」と称して説明する。
次に、第n探索部155nは、記憶部160に記憶させた観測点に基づいて、目的関数を表す予測モデルを生成する(ステップS204)。予測モデルは、例えば、ガウス過程の回帰モデルであってよい。ガウス過程の回帰は、ノンパラメトリック回帰手法の一つであり、未知の点における目的変数の平均値と分散を推定することができる手法である。
次に、第n探索部155nは、S204の処理で生成した目的関数の予測モデルを用いて、獲得関数を計算する(ステップS206)。
獲得関数は、最適なパラメータとなる蓋然性が高い次のパラメータを選択するために使われる関数である。獲得関数にはいくつかの種類があり、例えば、EI(Expected Improvement)がある。EIは、予測モデルの評価値と評価時点における最良値との差の期待値(改善量の期待値)を目的変数とした関数である。獲得関数には、EIの他に、PI(Probability of Improvement)、CB(Confidence Band)、MI(Mutual Information)などがある。以下、一例として、獲得関数がEIであるものとして説明する。
次に、第n探索部155nは、獲得関数EIが最大となる第nパラメータxを、新しい観測点(第n実測値/第n予測値、及び第n+1目標値に基づくobj(x)の値)を得るために次に試行すべき第nパラメータx(つまり第n探索値)に決定する(ステップS208)。言い換えれば、第n探索部155nは、最も改善が見込める第nパラメータxを、新しい観測点を得るために次に試行すべき第nパラメータxに決定する。
次に、第n探索部155nは、決定した第nパラメータxに関する情報を、上述した第n探索値に関する情報として出力する(ステップS210)。これによって、本フローチャートの処理が終了する。
[本実施形態の技術と関連技術の比較]
図6は、関連技術を用いた第nパラメータの調整結果を表す図である。図7は、関連技術を用いた第n+1パラメータの調整結果を表す図である。図8は、実施形態の技術(本技術)を用いた第nパラメータの調整結果を表す図である。図9は、実施形態の技術(本技術)を用いた第n+1パラメータの調整結果を表す図である。図は誤差の周波数特性を表している。そして、図中LN1は、第n段階目で調整された第nパラメータの評価値を表している。LN2は、第n段階目において第nパラメータの評価値がとるべき第n目標値を表している。LN3は、第n+1段階目で調整された第n+1パラメータの評価値を表している。LN4は、第n+1段階目において第n+1パラメータの評価値がとるべき第n+1目標値を表している。
図示のように、本実施形態の技術は、関連技術と比べて第n+1段階目における第n+1目標値が異なる。これにより、本実施形態の技術では、上述した目的関数のように、例えば、第n段階目にて、後段の第n+1段階目の第n+1目標値を最小化することによって、第n+1目標値を関連技術よりも低下させることができる。第n+1段階目では、関連技術よりも第n+1目標値が低下するため、その低下した第n+1目標値に向かって評価値が近づくように第n+1パラメータが調整される。この結果、本実施形態の技術は、関連技術よりも誤差を小さくすることができる。
以上説明した少なくとも一つの実施形態によれば、情報処理装置100は、1回目の探索を行う場合、少なくとも1組以上の第nパラメータの初期値である第n初期値を生成し、生成した各第n初期値に基づく第n実測値又は第n予測値を取得し、生成した各第n初期値に基づいて、第nパラメータと依存関係にある第n+1実測値又は第n+1予測値の目標値である第n+1目標値を予測し、取得した第n実測値又は第n予測値と予測した第n+1目標値を使って、第n評価値を第n目標値に近づける制約下において、第n+1目標値を最適化する第nパラメータを探索する。情報処理装置100は、2回目以降の探索を行う場合、前回の探索により得られた第nパラメータである第n探索値の第n実測値又は第n予測値を取得し、第n探索値に基づいて第n+1目標値を予測し、取得した第n実測値又は第n予測値と予測した第n+1目標値を使って、第n評価値を第n目標値に近づける制約下において、第n+1目標値を最適化する第nパラメータを探索することを繰り返す。これによって、人間では調整に時間がかかる、或いは、調整が困難なパラメータを、機械学習を用いて自動的に最適化することができる。
[他の表現例]
プログラムを格納した少なくとも一つのメモリと、
少なくとも一つのプロセッサと、を有し、
前記プロセッサは、前記プログラムを実行することにより、
依存関係にある複数のパラメータのうち、少なくとも第nパラメータに基づく第n評価値を第n目標値に近づけるように前記第nパラメータを調整し、
前記複数のパラメータのうち、少なくとも第n+1パラメータに基づく第n+1評価値を第n+1目標値に近づけるように前記第n+1パラメータを調整し、
前記第nパラメータの探索回数が所定数以下の場合、少なくとも1組以上の前記第nパラメータの初期値を取得し、前記取得した各初期値に基づく前記第n評価値の実測値である第n実測値又は前記第n評価値の予測値である第n予測値を取得し、前記取得した各初期値に基づく前記第n+1目標値を取得し、前記取得した第n実測値又は第n予測値と前記取得した第n+1目標値を使って、前記第n評価値を前記第n目標値に近づける制約下において、第n+1目標値を最適化する前記第nパラメータを探索し、
前記第nパラメータの探索回数が前記所定数を超える場合、前記探索した第nパラメータの前記第n評価値の実測値である第n実測値又は前記第n評価値の予測値である第n予測値を取得し、前記探索した第nパラメータに基づく第n+1目標値を取得し、前記取得した第n実測値又は第n予測値と前記取得した第n+1目標値を使って、前記第n評価値を前記第n目標値に近づける制約下において、第n+1目標値を最適化する前記第nパラメータを探索する、
ように構成されている情報処理装置。
本発明のいくつかの実施形態を説明したが、これらの実施形態は、例として提示したものであり、発明の範囲を限定することは意図していない。これら実施形態は、その他の様々な形態で実施されることが可能であり、発明の要旨を逸脱しない範囲で、種々の省略、置き換え、変更を行うことができる。これら実施形態やその変形は、発明の範囲や要旨に含まれると同様に、特許請求の範囲に記載された発明とその均等の範囲に含まれるものである。
100…情報処理装置、110…通信部、120…制御部、130…取得部、140…出力制御部、150…パラメータ調整部、150n-1…第n-1パラメータ調整部、150n…第nパラメータ調整部、150n+1…第n+1パラメータ調整部、160…記憶部

Claims (8)

  1. 依存関係にある複数のパラメータのうち、少なくとも第nパラメータに基づく第n評価値を第n目標値に近づけるように前記第nパラメータを調整する第n調整部と、
    前記複数のパラメータのうち、少なくとも第n+1パラメータに基づく第n+1評価値を第n+1目標値に近づけるように前記第n+1パラメータを調整する第n+1調整部と、を備え、
    前記第n調整部は、
    前記第nパラメータの探索回数が所定数以下の場合、少なくとも1組以上の前記第nパラメータの初期値を取得し、前記取得した各初期値に基づく前記第n評価値の実測値である第n実測値又は前記第n評価値の予測値である第n予測値を取得し、前記取得した各初期値に基づく前記第n+1目標値を取得し、前記取得した第n実測値又は第n予測値と前記取得した第n+1目標値とを使って、前記第n評価値を前記第n目標値に近づける制約下において、第n+1目標値を最適化する前記第nパラメータを探索し、
    前記第nパラメータの探索回数が前記所定数を超える場合、前記探索した第nパラメータに基づく前記第n評価値の実測値である第n実測値又は前記第n評価値の予測値である第n予測値を取得し、前記探索した第nパラメータに基づく前記第n+1目標値を取得し、前記取得した第n実測値又は第n予測値と前記取得した第n+1目標値とを使って、前記第n評価値を前記第n目標値に近づける制約下において、第n+1目標値を最適化する前記第nパラメータを探索する、
    情報処理装置。
  2. 前記第n目標値及び前記第n+1目標値の其々には、一つ又は複数の目標値が含まれる、
    請求項1に記載の情報処理装置。
  3. 前記第n調整部は、Sequential Model Based Optimizationを用いて、前記第nパラメータを探索する、
    請求項1又は2に記載の情報処理装置。
  4. 前記第n調整部は、前記第n+1目標値を第1項とし、前記第n実測値又は前記第n予測値と前記第n目標値との近さを表す指標値を第2項とした目的関数に基づいて、前記第nパラメータを探索する、
    請求項1から3のうちいずれか一項に記載の情報処理装置。
  5. 前記複数のパラメータは、ハードディスクドライブの設計に関連したパラメータであり、
    前記第nパラメータは、前記ハードディスクドライブの第1の外乱を抑圧する第1フィルタのパラメータであり、
    前記第n+1パラメータは、前記ハードディスクドライブの第2の外乱を抑圧する第2フィルタのパラメータである、
    請求項1から4のうちいずれか一項に記載の情報処理装置。
  6. 前記第n+1調整部は、前記第n調整部によって前記第nパラメータが調整された後に、前記第n+1パラメータを調整する、
    請求項1から5のうちいずれか一項に記載の情報処理装置。
  7. 前記所定数は、1である、
    請求項1から6のうちいずれか一項に記載の情報処理装置。
  8. コンピュータが、
    依存関係にある複数のパラメータのうち、少なくとも第nパラメータに基づく第n評価値を第n目標値に近づけるように前記第nパラメータを調整し、
    前記複数のパラメータのうち、少なくとも第n+1パラメータに基づく第n+1評価値を第n+1目標値に近づけるように前記第n+1パラメータを調整し、
    前記第nパラメータの探索回数が所定数以下の場合、少なくとも1組以上の前記第nパラメータの初期値を取得し、前記取得した各初期値に基づく前記第n評価値の実測値である第n実測値又は前記第n評価値の予測値である第n予測値を取得し、前記取得した各初期値に基づく前記第n+1目標値を取得し、前記取得した第n実測値又は第n予測値と前記取得した第n+1目標値とを使って、前記第n評価値を前記第n目標値に近づける制約下において、第n+1目標値を最適化する前記第nパラメータを探索し、
    前記第nパラメータの探索回数が前記所定数を超える場合、前記探索した第nパラメータに基づく前記第n評価値の実測値である第n実測値又は前記第n評価値の予測値である第n予測値を取得し、前記探索した第nパラメータに基づく前記第n+1目標値を取得し、前記取得した第n実測値又は第n予測値と前記取得した第n+1目標値とを使って、前記第n評価値を前記第n目標値に近づける制約下において、第n+1目標値を最適化する前記第nパラメータを探索する、
    情報処理方法。
JP2020049231A 2020-03-19 2020-03-19 情報処理装置及び情報処理方法 Active JP7267966B2 (ja)

Priority Applications (2)

Application Number Priority Date Filing Date Title
JP2020049231A JP7267966B2 (ja) 2020-03-19 2020-03-19 情報処理装置及び情報処理方法
US17/009,935 US11550274B2 (en) 2020-03-19 2020-09-02 Information processing apparatus and information processing method

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2020049231A JP7267966B2 (ja) 2020-03-19 2020-03-19 情報処理装置及び情報処理方法

Publications (2)

Publication Number Publication Date
JP2021149988A JP2021149988A (ja) 2021-09-27
JP7267966B2 true JP7267966B2 (ja) 2023-05-02

Family

ID=77747827

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2020049231A Active JP7267966B2 (ja) 2020-03-19 2020-03-19 情報処理装置及び情報処理方法

Country Status (2)

Country Link
US (1) US11550274B2 (ja)
JP (1) JP7267966B2 (ja)

Families Citing this family (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN114067847B (zh) * 2020-08-07 2023-08-11 株式会社东芝 磁盘装置以及磁盘装置的滤波器系数设定方法
JP2023136811A (ja) 2022-03-17 2023-09-29 株式会社東芝 磁気ディスク装置のrwパラメータ調整方法及び調整装置と磁気ディスク装置
CN115017844B (zh) * 2022-08-03 2022-11-08 阿里巴巴(中国)有限公司 设计参数调整方法、装置、电子设备和存储介质

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2016012285A (ja) 2014-06-30 2016-01-21 インターナショナル・ビジネス・マシーンズ・コーポレーションInternational Business Machines Corporation 情報処理装置、情報処理方法、及びプログラム
JP2019215750A (ja) 2018-06-13 2019-12-19 国立研究開発法人宇宙航空研究開発機構 解析装置、解析方法、およびプログラム
WO2020175460A1 (ja) 2019-02-25 2020-09-03 オムロン株式会社 制御装置、制御方法、及び制御プログラム

Family Cites Families (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105374372A (zh) 2014-08-28 2016-03-02 株式会社东芝 盘装置及控制装置
JP7137943B2 (ja) * 2018-03-20 2022-09-15 株式会社日立ハイテク 探索装置、探索方法及びプラズマ処理装置

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2016012285A (ja) 2014-06-30 2016-01-21 インターナショナル・ビジネス・マシーンズ・コーポレーションInternational Business Machines Corporation 情報処理装置、情報処理方法、及びプログラム
JP2019215750A (ja) 2018-06-13 2019-12-19 国立研究開発法人宇宙航空研究開発機構 解析装置、解析方法、およびプログラム
WO2020175460A1 (ja) 2019-02-25 2020-09-03 オムロン株式会社 制御装置、制御方法、及び制御プログラム

Also Published As

Publication number Publication date
US20210294281A1 (en) 2021-09-23
US11550274B2 (en) 2023-01-10
JP2021149988A (ja) 2021-09-27

Similar Documents

Publication Publication Date Title
JP7267966B2 (ja) 情報処理装置及び情報処理方法
CN108959728B (zh) 基于深度学习的射频器件参数优化方法
CN110832509B (zh) 使用神经网络的黑盒优化
JP5932612B2 (ja) 情報処理装置、制御方法、プログラム、及び記録媒体
WO2022105108A1 (zh) 一种网络数据分类方法、装置、设备及可读存储介质
US20040230325A1 (en) Automatic tuning of motion controllers using search techniques
JP6950756B2 (ja) ニューラルネットワークのランク最適化装置および最適化方法
US10635078B2 (en) Simulation system, simulation method, and simulation program
Thomas et al. Energetic natural gradient descent
Masri et al. Training neural networks by adaptive random search techniques
JP7111966B2 (ja) 最適化装置及び最適化装置の制御方法
US11853658B2 (en) Information processing apparatus, information processing method, and non-transitory computer readable medium
Dong et al. A kind of balance between exploitation and exploration on kriging for global optimization of expensive functions
KR20220032861A (ko) 하드웨어에서의 성능을 고려한 뉴럴 아키텍처 서치 방법 빛 장치
JERBI et al. Lyapunov-based Methods for Maximizing the Domain of Attraction
JP5816387B1 (ja) 非線形最適解探索システム
CN116861772A (zh) 一种多参数精加工的参数优化方法及***
Song et al. A data-efficient reinforcement learning method based on local Koopman operators
CN112488319B (zh) 一种具有自适应配置生成器的调参方法和***
Araujo et al. Hybrid intelligent design of morphological-rank-linear perceptrons for software development cost estimation
JP7047665B2 (ja) 学習装置、学習方法及び学習プログラム
EP4198831A1 (en) Automated feature engineering for predictive modeling using deep reinforcement learning
US20230259765A1 (en) System and method for structuring a tensor network
CN117252691A (zh) 基于多端时序模型的时域自适应股价预测方法及装置
JP2019061623A (ja) パラメータ推定装置、方法、及びプログラム

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20220302

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20230307

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20230322

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20230420

R151 Written notification of patent or utility model registration

Ref document number: 7267966

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R151