JP6339655B1 - 光源ユニットの光学部品の調芯手順を学習する機械学習装置および光源ユニット製造装置 - Google Patents

光源ユニットの光学部品の調芯手順を学習する機械学習装置および光源ユニット製造装置 Download PDF

Info

Publication number
JP6339655B1
JP6339655B1 JP2016245834A JP2016245834A JP6339655B1 JP 6339655 B1 JP6339655 B1 JP 6339655B1 JP 2016245834 A JP2016245834 A JP 2016245834A JP 2016245834 A JP2016245834 A JP 2016245834A JP 6339655 B1 JP6339655 B1 JP 6339655B1
Authority
JP
Japan
Prior art keywords
unit
light
lens
machine learning
state
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2016245834A
Other languages
English (en)
Other versions
JP2018101025A (ja
Inventor
道徳 前田
道徳 前田
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
FANUC Corp
Original Assignee
FANUC Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by FANUC Corp filed Critical FANUC Corp
Priority to JP2016245834A priority Critical patent/JP6339655B1/ja
Priority to DE102017011463.3A priority patent/DE102017011463B4/de
Priority to US15/839,217 priority patent/US10241324B2/en
Priority to CN201711372458.XA priority patent/CN108205180B/zh
Application granted granted Critical
Publication of JP6339655B1 publication Critical patent/JP6339655B1/ja
Publication of JP2018101025A publication Critical patent/JP2018101025A/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G02OPTICS
    • G02BOPTICAL ELEMENTS, SYSTEMS OR APPARATUS
    • G02B26/00Optical devices or arrangements for the control of light using movable or deformable optical elements
    • G02B26/08Optical devices or arrangements for the control of light using movable or deformable optical elements for controlling the direction of light
    • G02B26/0875Optical devices or arrangements for the control of light using movable or deformable optical elements for controlling the direction of light by means of one or more refracting elements
    • GPHYSICS
    • G02OPTICS
    • G02BOPTICAL ELEMENTS, SYSTEMS OR APPARATUS
    • G02B7/00Mountings, adjusting means, or light-tight connections, for optical elements
    • GPHYSICS
    • G02OPTICS
    • G02BOPTICAL ELEMENTS, SYSTEMS OR APPARATUS
    • G02B27/00Optical systems or apparatus not provided for by any of the groups G02B1/00 - G02B26/00, G02B30/00
    • G02B27/0012Optical design, e.g. procedures, algorithms, optimisation routines
    • GPHYSICS
    • G02OPTICS
    • G02BOPTICAL ELEMENTS, SYSTEMS OR APPARATUS
    • G02B27/00Optical systems or apparatus not provided for by any of the groups G02B1/00 - G02B26/00, G02B30/00
    • G02B27/62Optical apparatus specially adapted for adjusting optical elements during the assembly of optical systems
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N20/00Machine learning
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/004Artificial life, i.e. computing arrangements simulating life
    • G06N3/006Artificial life, i.e. computing arrangements simulating life based on simulated virtual individual or collective life forms, e.g. social simulations or particle swarm optimisation [PSO]
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods
    • G06N3/084Backpropagation, e.g. using gradient descent
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/048Activation functions
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02PCLIMATE CHANGE MITIGATION TECHNOLOGIES IN THE PRODUCTION OR PROCESSING OF GOODS
    • Y02P90/00Enabling technologies with a potential contribution to greenhouse gas [GHG] emissions mitigation
    • Y02P90/02Total factory control, e.g. smart factories, flexible manufacturing systems [FMS] or integrated manufacturing systems [IMS]

Landscapes

  • Physics & Mathematics (AREA)
  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Software Systems (AREA)
  • Computing Systems (AREA)
  • Artificial Intelligence (AREA)
  • Mathematical Physics (AREA)
  • Data Mining & Analysis (AREA)
  • Evolutionary Computation (AREA)
  • General Engineering & Computer Science (AREA)
  • Optics & Photonics (AREA)
  • Biomedical Technology (AREA)
  • Molecular Biology (AREA)
  • General Health & Medical Sciences (AREA)
  • Computational Linguistics (AREA)
  • Biophysics (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Medical Informatics (AREA)
  • Optical Couplings Of Light Guides (AREA)
  • Semiconductor Lasers (AREA)

Abstract

【課題】短時間で光源ユニットの光学部品の調芯作業を実施する手順を学習する機械学習装置を提供する。【解決手段】機械学習装置2は、光学部品の位置および姿勢と構成部品の品質情報とを含む状態データを取得する。機械学習装置2は、光学部品の位置および姿勢の調整時間と光測定器13にて測定した光の状態とを含む判定データを取得する。機械学習装置2は、光学部品の位置および姿勢を調整する手順を学習する学習部23を備える。学習部23は、調芯の調整時間および光の状態に基づいて報酬を計算する報酬計算部28と、報酬に基づいて価値関数を更新する価値関数更新部29とを含む。学習部23は、価値関数に基づいて、光学部品の移動方法を設定する意思決定部24を含む。【選択図】図2

Description

本発明は、光源ユニットの光学部品の調芯手順を学習する機械学習装置および光源ユニット製造装置に関する。
レーザダイオードモジュールなどの光源ユニットが多くの装置に使用されている。光源ユニットでは、発光素子、レンズ、および光ファイバーなどの光学部品が筐体に固定される。光源ユニットの製造工程では、発光素子を筐体の所定の位置に固定した後に、その他の光学部品を筐体に固定する。光学部品は、発光素子に対して相対的に最適な位置および姿勢になるように固定する必要がある。例えば、光学部品は、所定の向きに所定の強度にて光が出射されるように配置する必要がある。光学部品は、受光素子が受ける光の強度などが予め定められた基準を満足するように筐体に固定される(例えば、特開2008−176342号公報を参照)。
光学部品の位置および姿勢の調整を行う作業は、調芯と称されている。または、この作業は、光軸調整と称されている。光学部品の調芯を行う工程では、光学部品の位置および姿勢を変化させながら光の強度等を測定する。光の測定値が予め定められた基準を満足するまで位置および姿勢の変更が繰り返される。
従来の技術における調芯工程では、作業者は、予め経験的に調芯手順を決める。作業者は、光学部品の位置および姿勢を設定した後に光の測定値を分析する。この後に、作業者は、分析した結果に基づいて光学部品の位置および姿勢を修正する作業を繰り返していた。このように、調芯手順の見直しは、作業者の技量に依存しており、自動化が困難であった。
特開平7−084171号公報には、オートフォーカス用のレンズ駆動装置におけるサーチ駆動の際に、レンズ保持枠が機械端に衝突しないように制御できるレンズ駆動の制御装置が開示されている。
特開2008−176342号公報 特開平7−084171号公報
一般的に、光学部品の位置および姿勢は、3次元の座標系の各軸の位置(x,y,z)および各軸の周りの回転角度(θx,θy,θz)にて表すことができる。すなわち、1つの光学部品の位置および姿勢は、6個の軸を用いて調整することができる。作業者が経験に基づいて調芯手順を決める方法では、作業者は多くの手順の中から最適と考えられる手順を選定する。
この際に、光学部品の移動方法に依存して、最適な位置および最適な姿勢に到達するまでの作業時間に大きな差が生じる。作業者に依存して、光学部品の調芯作業に長い時間がかかる場合があり、生産効率が低くなる原因となっている。光学部品の位置および姿勢の調整が予め定められた時間内に終了しない場合には、一般的にアラームを出して作業を終了する。アラームが発信されると、作業者は部品が不良であると判定する。ところが、部品が不良でない場合があり、光源ユニットの歩留まりを悪化させる原因となっている。最終的に調芯が完了した場合であっても、調芯作業の途中に無駄な作業が生じている虞がある。または、調芯が最短時間で行われる場合に比べて長い時間を要している虞がある。
また、1種類の光源ユニットを製造する場合には、作業者は、部品の品質のばらつきを考慮せずに、同一の調芯手順にて作業を実施することができる。この方法は、品質が同一の部品の調芯を行う時に有効である。ところが、使用する部品の品質が変わった場合には、この調芯手順は最適でなくなる。作業者は、調芯手順を見直す必要がある。この結果、作業時間のばらつきが大きくなる。または、作業者は、無駄な手順を繰り返したり、光学部品の移動のやり直しに多大な時間がかかったりする場合がある。
光源ユニットの部品の品質は光学部品の調芯作業に影響することは分かっているものの、これらの品質の情報は、多くの種類が存在する。各軸の移動方法と部品の品質の情報との組み合わせは非常に多くなる。このために、作業者が部品の品質の情報と調芯手順とを理論的に関連づけて、調芯手順を決定することは困難である。
本開示の一態様の機械学習装置は、光源ユニットの光学部品の調芯を実施する手順を学習する。機械学習装置は、光学部品の位置および姿勢と光源ユニットの構成部品の品質情報とを含む状態データを取得する状態観測部を備える。機械学習装置は、光学部品の位置および姿勢の調整時間と光測定器にて測定した光の状態とを含む判定データを取得する判定データ取得部を備える。機械学習装置は、状態観測部にて取得した状態データおよび判定データ取得部にて取得した判定データに基づいて、光学部品の位置および姿勢を調整する手順を学習する学習部を備える。学習部は、判定データ取得部にて取得した調整時間および光の状態に基づいて報酬を計算する報酬計算部を含む。学習部は、報酬計算部にて設定された報酬に基づいて価値関数を更新する価値関数更新部を含む。学習部は、価値関数に基づいて、光学部品の移動方法を設定する意思決定部を含む。
本開示の一態様の光源ユニット製造装置は、発光素子から出射される光の状態を測定する光測定器と、光学部品を保持して移動させる移動装置と、移動装置を制御する制御器とを備える。制御器は、光学部品の位置および姿勢と構成部品の品質情報とを含む状態データを取得する状態観測部を含む。制御器は、光学部品の位置および姿勢の調整時間と光測定器にて測定した光の状態とを含む判定データを取得する判定データ取得部を含む。制御器は、状態観測部にて取得した状態データおよび判定データ取得部にて取得した判定データに基づいて、光学部品の位置および姿勢を調整する手順を学習する学習部を含む。学習部は、判定データ取得部にて取得した調整時間および光の状態に基づいて報酬を計算する報酬計算部を含む。学習部は、報酬計算部にて設定された報酬に基づいて価値関数を更新する価値関数更新部を含む。学習部は、価値関数に基づいて、光学部品の移動方法を設定する意思決定部を含む。
本開示の一態様によれば、短時間で光源ユニットの光学部品の調芯作業を実施する手順を学習する機械学習装置および光源ユニット製造装置を提供することができる。
実施の形態における光源ユニットの概略側面図である。 実施の形態における第1の製造システムのブロック図である。 実施の形態における光源ユニット製造装置にて第1のレンズの調芯を行っている時の側面図である。 レンズの調芯を実施している時のレンズおよびステージの側面図である。 x軸方向におけるレンズの位置に対する光の強度のグラフである。 ニューロンのモデルを模式的に示す図である。 複数のニューロンを組み合わせて構成した3層のニューラルネットワークの模式図である。 レンズの移動を説明する概略図である。 実施の形態における機械学習装置が行う学習の制御のフローチャートである。 第2のレンズの調芯を実施している時の光源ユニットの側面図である。 実施の形態における第2の製造システムのブロック図である。 実施の形態における第3の製造システムのブロック図である。
図1から図12を参照して、実施の形態における機械学習装置および光源ユニット製造装置について説明する。本実施の形態の機械学習装置および光源ユニット製造装置は、光源ユニットの光学部品の調芯を実施する手順を学習する。
図1に、本実施の形態における光源ユニットの概略側面図を示す。本実施の形態における光源ユニット4は、発光素子42から出射された光を、光ファイバー44に入射させる。光源ユニット4は、レーザー光などの光を出射する発光素子42を備える。発光素子42は、例えばレーザーダイオードである。光源ユニット4は、光の進行方向を変更する第1のレンズ45および第2のレンズ46を含む。第1のレンズ45および第2のレンズ46は、曲面状の表面が互いに対向するように配置されている。光源ユニット4は、第2のレンズ46から出射されたレーザー光を受光する受光素子43を備える。受光素子43の内部には、光ファイバー44が配置されている。
発光素子42および受光素子43は、筐体41に固定されている。第1のレンズ45は、筐体41の固定部41aに接着剤82にて固定されている。第2のレンズ46は、筐体41の固定部41bに接着剤82にて固定されている。発光素子42から出射された光は、第1のレンズ45によって平行光に変換される。第1のレンズ45を出射した光は、第2のレンズ46により集光される。そして、第2のレンズ46を出射した光は、受光素子43の内部の光ファイバー44に入射する。このように、光源ユニット4は、少なくとも1つの光学部品を含む。本実施の形態では、調芯を実施する光学部品としてレンズ45,46を例に取り上げて説明する。
図2に、本実施の形態における第1の製造システムのブロック図を示す。図3に、第1のレンズの調芯作業を実施している時の光源ユニットの側面図を示す。図2および図3を参照して、製造システム8は、光源ユニット製造装置1と機械学習装置2とを備える。光源ユニット製造装置1は、光源ユニット4に配置された光学部品の調芯を実施する。すなわち、光源ユニット製造装置1は、光学部品の位置および姿勢を調整する。機械学習装置2は、光源ユニット製造装置1と通信できるように、光源ユニット製造装置1に接続されている。機械学習装置2は、光源ユニット製造装置1から受信した情報およびレンズの品質情報31に基づいて、光学部品の位置および姿勢を調整する手順を学習する。
光源ユニット製造装置1は、光学部品を移動する光学部品移動装置としてのレンズ移動装置12を含む。本実施の形態のレンズ移動装置12は、レンズ45,46を保持するステージ18を含む。レンズ移動装置12は、ステージ18を駆動するための駆動モーター16と、駆動モーター16に取り付けられた回転位置検出器17とを含む。
光源ユニット製造装置1は、レンズ移動装置12を制御する制御器11を備える。制御器11は、バスを介して互いに接続されたCPU(Central Processing Unit)、RAM(Random Access Memory)、およびROM(Read Only Memory)等を備える演算処理装置にて構成されている。制御器11は、光測定器13およびレンズ移動装置12に動作指令を送出する動作制御部14を含む。レンズ移動装置12の駆動モーター16は、動作指令に基づいて駆動する。
駆動モーター16が駆動することにより、ステージ18の位置および姿勢が変化する。また、回転位置検出器17は、駆動モーター16の出力シャフトの回転位置を検出する。回転位置検出器17の出力に基づいて、レンズ45,46の位置および姿勢が検出される。
図4に、レンズの位置および姿勢を調整している時のステージおよびレンズの側面図を示す。ステージ18は、例えば吸着により、レンズ45を保持することができる。駆動モーター16が駆動することにより、ステージ18の位置および姿勢が変化すると共に、レンズ45の位置および姿勢が変化する。本実施の形態においては、レンズ45の位置は、3次元の座標系の各軸の位置(x,y,z)により表される。また、レンズ45の姿勢は、回転移動の駆動軸に沿った回転位置(θx,θy,θz)により表される。
本実施の形態においては、レンズ45において中心点45aが予め設定されている。レンズ45の位置を示す座標系としては、例えば筐体41における任意の位置を原点として、x軸、y軸およびz軸を含む座標系を設定することができる。レンズ45の姿勢(回転位置)を示す座標系としては、例えばレンズの中心点45aを原点として、x軸、y軸およびz軸を設定する。そして、x軸の周りの駆動軸、y軸の周りの駆動軸、およびz軸の周りの駆動軸を含む座標系を採用することができる。それぞれの駆動軸に沿った回転角度を、レンズ45の回転位置として定めることができる。例えば、x軸の周りの駆動軸の座標値は、回転角度θxにより表わすことができる。
本実施の形態のレンズ移動装置12は、6個の駆動軸に沿って、レンズ45の位置および姿勢を調整する。レンズ移動装置は、この形態に限られず、レンズの位置および姿勢が調整できるように形成されていれば構わない。例えば、光学部品の形状によっては、5個の駆動軸によりレンズの位置および姿勢を調整できる場合がある。この場合には、レンズ移動装置は、5個の駆動軸に基づいてステージが動くように形成されていれば構わない。また、レンズ移動装置は、レンズが配置される際に発生するレンズの位置および姿勢の相対的なずれを補正するために、画像処理装置および検出器を備えても良い。
図2および図3を参照して、光源ユニット製造装置1は、光測定器13を含む。光測定器13は、光の特性を検出可能なように形成されている。本実施の形態の光測定器13は光の強度の分布を検出可能に形成されている。光測定器13は、光の強度、光のモードパターン、光の中心位置を検出することができる。光の強度の分布によりモードパターンが定まる。例えば、モードパターンがシングルモードの場合に、レーザー光はガウシアンビームになる。
光測定器13としては、例えば、固定式の光センサーを用いることができる。光センサーは、CCD(Charge Coupled Device)を含み、CCDにより光の強度の分布を検出することができる。本実施の形態では、2次元の光センサーを用いている。光測定器13は、少なくとも1つの光の状態を検出可能な測定器を採用することができる。たとえば、走査式の光センサーを用いても構わない。
図3に示す例では、光測定器13は、支持部材19に支持されている。支持部材19は、固定部41bの上に置かれている。光測定器13は、受光素子43が配置される位置に固定されても構わない。また、光源ユニット製造装置は、光源ユニットの外側に光を導く反射鏡等を含んでいても構わない。この場合に、光測定器は、光源ユニットの外側に配置することができる。本実施の形態では、光測定器13は、発光素子42から出射される光の光軸81と交差するように配置されている。また、光測定器13は、受光面が光軸81に対して垂直になるように配置されている。光測定器13は、制御器11に制御されている。光測定器13にて測定された光の状態の情報は、制御器11に送信される。
本実施の形態の光源ユニット製造装置1では、6軸の方向に移動可能なステージ18により、2つのレンズ45,46の調芯を実施する。本実施の形態では、第1のレンズ45の調芯を行った後に、第2のレンズ46の調芯を行う。
それぞれのレンズ45,46の調芯においては、受光素子43が受光をする光の強度が所定の判定値よりも大きくなるようにレンズ45,46の位置および姿勢の調整を行う。また、光の強度の分布が理想のモードパターンに近くなるようにレンズ45,46の位置および姿勢の調整を行う。また、光の中心位置が光ファイバーの中心軸に近くなるようにレンズ45,46の位置および姿勢を調整する。
本実施の形態の調芯作業では、レンズ45,46を、予め定められた6軸のうち、1つの軸の方向に微小距離または微小角度にて移動する。次に、光測定器13にて受光した光の状態が改善しているか否かを判定する。この作業を、光測定器13にて受光する光の状態が予め定められた判定範囲内になるまで繰り返す。
図5に、x軸方向のレンズの中心位置と光測定器にて検出される光の強度との関係を説明するグラフを示す。図5は、同じ種類の2つの光源ユニットにおいて、同じ種類のレンズの調芯を実施した時のグラフを示している。このグラフには、レーザー光の強度とレンズの中心位置との関係が示されている。位置xsは、レンズの調芯を開始する時のレンズの中心位置である。第1の光源ユニットでは、レンズの中心位置が位置x1において、光の強度が最大になっている。これに対して、第2の光源ユニットでは、レンズの中心位置が位置x2において、光の強度が最大になっている。
第1の光源ユニットに取り付けられたレンズと第2の光源ユニットに取り付けられたレンズは同様の製造方法により製造された同じ設計仕様のレンズである。ところが、レンズの品質等に依存して、レンズの最適な位置および姿勢が異なっている。第1の光源ユニットでは、矢印91に示すように、調芯の開始の位置xsからx軸の負側にレンズを移動する必要ある。これに対して、第2の光源ユニットでは、矢印92に示すように、調芯の開始の位置xsからx軸の正側にレンズを移動する必要がある。
このように、同一仕様のレンズであるにもかかわらず、レンズの品質に依存してレンズの最適な位置は変化する。作業者が第1の光源ユニットの調芯を行った後に第2の光源ユニットの調芯を行う場合には、第1の光源ユニットの最適なレンズの位置x1を参考にする。作業者は、位置x1の近傍に調芯を開始する位置を設定することができる。または、作業者は、位置xsからx軸の負側にレンズを移動することができる。ところが、第2の光源ユニットの最適な位置x2は位置x1から離れている。第2の光源ユニットの最適な位置x2は、初期の位置xsに関して、位置x1の反対側に存在する。このために、第2の光源ユニットの調芯のための調整時間は長くなる。
本実施の形態では、6個の駆動軸に基づいてレンズ45,46を移動することができる。それぞれの駆動軸に沿って正側または負側にレンズ45,46を移動することができる。すなわち、レンズ45,46の移動においては、それぞれのレンズについて12個の移動方向のうち、いずれかの方向に移動させることができる。レンズ45,46の移動方向が数多く存在する。調芯のための調整時間は短いことが好ましいが、作業者が多くの移動方向から調整時間が短くなる様に最適な移動方向を選定することは難しい。
また、レンズの品質には、レンズの形状、レンズの材料の組成、レンズの屈折率、焦点距離、および表面に蒸着された光学薄膜の特性などが含まれる。多くの移動方向に加えてレンズの品質を考慮して、作業者が最適な移動方向を選定することは困難である。本実施の形態の機械学習装置は、レンズの移動方向およびレンズの品質を考慮して、調整時間が短くなるように調芯を実施する手順を学習する。ここで、本実施の形態の機械学習について説明する。
機械学習装置は、装置に入力されるデータの集合から、その中にある有用な規則、知識表現、および判断基準等を解析により抽出し、その判断結果を出力するとともに、知識の学習(機械学習)を行う機能を有する。機械学習の手法は様々であるが、大別すれば、例えば、「教師あり学習」、「教師なし学習」および「強化学習」に分けられる。本実施の形態では、機械学習のうち強化学習(Q学習)を実施する。さらに、強化学習を実現するうえで、特徴量の抽出を学習する「深層学習(ディープラーニング:Deep Learning)」と呼ばれる手法がある。
まず、強化学習の問題設定として、次のように考えられる。
・製造システム(例えば、光源ユニット製造装置の制御器および機械学習装置を含む)は、環境の状態を観測し、行動を決定する。
・環境は、何らかの規則に従って変化し、さらに、自分の行動が環境に変化を与えることもある。
・行動するたびに、報酬信号が帰ってくる。
・最大化したいのは、将来にわたっての(割引)報酬の合計である。
・行動が引き起こす結果を全く知らない、または、不完全にしか知らない状態から学習はスタートする。すなわち、機械学習装置は、実際に行動して初めて、その結果をデータとして得ることができる。つまり、試行錯誤しながら最適な行動を探索する必要がある。
・人間の動作を真似るように、事前学習(教師あり学習または逆強化学習といった手法)した状態を初期状態として、良いスタート地点から学習をスタートさせることもできる。
ここで、強化学習(Q学習)では、判定や分類だけではなく、行動を学習することにより、環境に行動が与える相互作用を踏まえて適切な行動を学習する。すなわち、強化学習では、将来的に得られる報酬を最大にするための方法を学ぶものである。
強化学習は、或る環境状態sの下で、行動aを選択する行動価値Q(s,a)を学習する方法である。つまり、或る状態sのとき、行動価値Q(s,a)の最も高い行動aを最適な行動として選択すればよい。しかし、最初は、状態sと行動aとの組合せについて、行動価値Q(s,a)の正しい値は全く分かっていない。そこで、エージェント(行動主体)は、或る状態sの下で様々な行動aを選択し、その時の行動aに対して、報酬が与えられる。それにより、エージェントは、より良い行動の選択、すなわち、正しい行動価値Q(s,a)を学習していく。
さらに、行動の結果、将来にわたって得られる報酬の合計を最大化したいので、最終的にQ(s,a)=E[Σ(γt)rt]となるようにすることを目指す。ここで、期待値は、最適な行動に従って状態変化したときに取得し、それは、分かっていないので、探索しながら学習することになる。このような行動価値Q(s,a)の更新式は、例えば、次の式(1)により表すことができる。
Figure 0006339655
上記の式(1)において、stは、時刻tにおける環境の状態を表し、atは、時刻tにおける行動を表す。行動atにより、状態はst+1に変化する。rt+1は、その状態の変化により得られる報酬を表している。また、「max」の付いた項は、状態st+1の下で、その時に分かっている最もQ値の高い行動aを選択した場合のQ値にγを乗じたものになる。ここで、γは、0<γ≦1のパラメータで、割引率と呼ばれる。また、αは、学習係数で、0<α≦1の範囲とする。
上述した式(1)は、試行atの結果、帰ってきた報酬rt+1を元に、状態stにおける行動atの行動価値Q(st,at)を更新する方法を表している。すなわち、状態sにおける行動aの行動価値Q(st,at)よりも、報酬rt+1と行動aによる次の状態における最良の行動max aの行動価値Q(st+1,max at+1)との和の方が大きければ、Q(st,at)を大きくし、反対に小さければ、Q(st,at)を小さくすることを示している。つまり、或る状態における或る行動の価値を、結果として即時帰ってくる報酬と、その行動による次の状態における最良の行動の価値に近付けるようにしている。
ここで、行動価値Q(s,a)の計算機上での表現方法は、すべての状態行動ペア(s,a)に対して、その値を行動価値テーブルとして保持しておく方法と、行動価値Q(s,a)を近似するような関数を用意する方法がある。後者の方法では、前述の式(1)は、確率勾配降下法等の手法で近似関数のパラメータを調整していくことにより、実現することができる。なお、近似関数としては、後述のニューラルネットワークを用いることができる。
ところで、強化学習での価値関数の近似アルゴリズムとして、ニューラルネットワークを用いることができる。図6は、ニューロンのモデルを模式的に示す図である。図7は、図6に示すニューロンを組み合わせて構成した三層のニューラルネットワークを模式的に示す図である。すなわち、ニューラルネットワークは、例えば、図6に示すようなニューロンのモデルを模した演算装置およびメモリ等で構成される。
図6に示されるように、ニューロンは、複数の入力x(図6では、一例として入力x1〜x3)に対する出力(結果)yを出力するものである。各入力x(x1,x2,x3)には、この入力xに対応する重みw(w1,w2,w3)が乗算される。これにより、ニューロンは、次の式(2)により表現される結果yを出力する。なお、入力x、結果yおよび重みwは、すべてベクトルである。また、下記の式(2)において、θは、バイアスであり、fkは、活性化関数である。
Figure 0006339655
図7を参照して、図6に示すニューロンを組み合わせて構成した三層のニューラルネットワークを説明する。図7に示されるように、ニューラルネットワークの左側から複数の入力x(ここでは、一例として、入力x1〜入力x3)が入力される。ニューラルネットワークの右側から結果y(ここでは、一例として、結果y1〜結果y3)が出力される。具体的に、入力x1,x2, x3は、3つのニューロンN11〜N13の各々に対して、対応する重みが掛けられて入力される。これらの入力に掛けられる重みは、まとめてW1と標記されている。
ニューロンN11〜N13は、それぞれ、z11〜z13を出力する。図7において、これらz11〜z13は、まとめて特徴ベクトルZ1と標記され、入力ベクトルの特徴量を抽出したベクトルとみなすことができる。この特徴ベクトルZ1は、重みW1と重みW2との間の特徴ベクトルである。z11〜z13は、2つのニューロンN21およびN22の各々に対して、対応する重みが掛けられて入力される。これらの特徴ベクトルに掛けられる重みは、まとめてW2と標記されている。
ニューロンN21,N22は、それぞれz21,z22を出力する。図7において、これらz21,z22は、まとめて特徴ベクトルZ2と標記されている。この特徴ベクトルZ2は、重みW2と重みW3との間の特徴ベクトルである。z21,z22は、3つのニューロンN31〜N33の各々に対して、対応する重みが掛けられて入力される。これらの特徴ベクトルに掛けられる重みは、まとめてW3と標記されている。
最後に、ニューロンN31〜N33は、それぞれ、結果y1〜結果y3を出力する。ニューラルネットワークの動作には、学習モードと価値予測モードとがある。例えば、学習モードにおいて、学習データセットを用いて重みWを学習し、そのパラメータを用いて予測モードにおいて、制御器の行動判断を行う。なお、便宜上、予測と書いたが、検出、分類、推論等の多様なタスクが可能である。
ここで、予測モードで実際に光源ユニット製造装置の制御器を動かして得られたデータを即時学習し、次の行動に反映させる(オンライン学習)ことができる。または、予め収集しておいたデータ群を用いてまとめた学習を行った後に、以降はそのパラメータで検知モードを行う(バッチ学習)こともできる。或いは、その中間的な、ある程度データが溜まるたびに学習モードを挟むということも可能である。
また、重みW1〜W3は、誤差逆伝搬法(誤差逆転伝播法:バックプロパゲーション:Backpropagation)により学習可能なものである。なお、誤差の情報は、右側から入り左側に流れる。誤差逆伝搬法は、各ニューロンについて、入力xが入力されたときの出力yと真の出力y(教師)との差分を小さくするように、それぞれの重みを調整(学習)する手法である。このようなニューラルネットワークは、三層以上に、さらに層を増やすことも可能であり、その学習方法は、深層学習と称される。
本実施の形態の機械学習装置2は、上記の強化学習を実施する。図2を参照して、機械学習装置2は、CPUおよびRAM等を含む演算処理装置にて構成されている。本実施の形態では、一つの駆動軸において微小距離または微小角度ごとにレンズを移動する行為が行動に相当する。そして、それぞれの位置から移動する行動に関して、価値関数に基づいて行動価値が算出される。行動価値に基づいて、移動方向が選定される。
機械学習装置2は、光学部品の位置および姿勢と光源ユニット4の構成部品の品質情報とを含む状態データを取得する状態観測部21を含む。本実施の形態の光学部品は、レンズである。状態観測部21は、レンズの位置および姿勢を光源ユニット製造装置1の制御器11から取得する。
作業者は、レンズの品質情報31を予め機械学習装置2の入力部25に入力する。機械学習装置2は、学習に関する任意の情報を記憶する記憶部26を含む。入力部25に入力されたレンズの品質情報31は、記憶部26に記憶される。レンズの品質情報31には、例えば、材料の組成、レンズの形状、屈折率、焦点距離、および表面に蒸着された光学薄膜の特性と、材料ロット、製造装置、作業者、製造プロセス、および製造年月日などの製造情報とが含まれる。レンズの品質情報31としては、これらの項目のうち少なくとも一つを採用することができる。状態観測部21は、記憶部26から構成部品の品質情報としてのレンズの品質情報31を取得する。
構成部品の品質情報は、1個の構成部品ごとの情報を入力することが好ましい。しかしながら、構成部品の品質情報は、構成部品の製造ロットごとの情報を代表値として使用しても構わない。また、構成部品の品質情報は、学習により調芯手順の最適化が行われた後に不要と判断された情報は、廃棄しても構わない。
機械学習装置2は、判定データを取得する判定データ取得部22を含む。判定データは、強化学習において価値関数における報酬を設定するために用いられる。判定データは、光測定器13にて測定した光の状態を含む。本実施の形態では、判定データ取得部22は、光の状態として、光の強度、光のモードパターン、および光の中心位置を取得する。
また、判定データ取得部22は、光学部品の位置および姿勢の調整時間を取得する。すなわち、判定データ取得部22は、調芯の開始から調芯の終了までに要した時間を取得する。光源ユニット製造装置1の制御器11は、調整時間測定部15を含む。調整時間測定部15は、微小距離または微小角度ごとにレンズを動かして光を測定した時の作業時間を検出する。そして、1回の移動に関する作業時間を積算することにより、調芯の開始から調芯の終了までに要した調整時間を算出することができる。判定データ取得部22は、調整時間を制御器11から取得する。
機械学習装置2は、光学部品の位置および姿勢を調整する手順を学習する学習部23を含む。学習部23は、状態観測部21にて取得した状態データおよび判定データ取得部22にて取得した判定データに基づいて学習を実施する。学習部23は、判定データ取得部22にて取得した調整時間および光の状態に基づいて報酬を計算する報酬計算部28を含む。学習部23は、報酬計算部28にて設定された報酬に基づいて価値関数を更新する価値関数更新部29を含む。
機械学習装置2は、学習部23にて設定された価値関数に基づいてレンズの移動方法を設定する意思決定部24を含む。本実施の形態では、意思決定部24は、レンズの移動方法として、レンズの移動方向を設定する。すなわち、意思決定部24は、現在のレンズの位置から移動する方向を、6個の駆動軸における正側の方向および負側の方向から選定する。なお、意思決定部24が設定するレンズの移動方法には、移動する距離または角度が含まれていても構わない。
意思決定部24にて設定された移動方向の指令は、光源ユニット製造装置1の制御器11に送信される。動作制御部14は、受信した移動方向の指令に基づいてレンズ移動装置12を駆動する。レンズ移動装置12は、レンズの位置および姿勢を変更する。
図8に、本実施の形態におけるレンズの移動を説明する概略図を示す。図8では、説明を簡略化するために、6個の駆動軸のうち、x軸およびy軸を示している。また、図8では、2次元の平面上にレンズ45が移動する例を示している。この例では、レンズ45は、x軸またはy軸に沿って移動する。
レンズ45が移動する可能性のある領域には、格子状に移動点MPmnが設定されている。それぞれの移動点同士の微小距離は一定である。ここでの例では、レンズ45は、移動点MP00に配置されている。レンズ45の中心点45aは、移動点MP00に配置されている。レンズ45は、x軸の正側および負側と、y軸の正側および負側とを含む4個の方向に移動可能である。4個の方向の移動について行動価値が算出される。意思決定部24は、それぞれの移動方向に対する行動価値に基づいて、移動点の移動方向を選定することができる。図8に示す例では、矢印93に示すように、レンズ45をx軸の正側に移動している。レンズ45の中心点45aは、移動点MP10に移動する。レンズ移動装置は、このようなレンズの移動を複数の駆動軸に基づいて実施することができる。
図9に、本実施の形態の機械学習の制御のフローチャートを示す。図2および図9を参照して、ステップ60において、作業者は、レンズの品質情報31を機械学習装置2の入力部25に入力する。記憶部26は、レンズの品質情報31を記憶する。
ステップ61において、意思決定部24は、調芯を開始するレンズの位置および姿勢を設定する。図9に示す例では、調芯を開始する位置は予め定められている。意思決定部24は、この位置を調芯の開始位置に設定する。
ステップ62において、光測定器13は、光の測定を行う。本実施の形態において、光測定器13は、光の強度、モードパターン、および光の中心位置を測定する。制御器11は、初期の位置における測定結果を受信する。判定データ取得部22は、制御器11から初期の位置における測定結果を取得する。
ステップ63において、意思決定部24は、現在の位置から移動する方向を設定する。意思決定部24は、行動価値の大きい方向を選定することができる。それぞれの移動点からの移動方向に関する行動価値の初期値は、予め定められている。または、ε-greedy法に基づいて、移動方向を設定しても構わない。すなわち、確率εにてランダムに方向を選定しても構わない。意思決定部24にて設定された移動方向は、制御器11に送信される。
ステップ64において、制御器11は、意思決定部24にて設定された移動方向に基づいてレンズ移動装置12を駆動する。レンズ45が微小距離または微小角度にて移動することにより、レンズ45の位置および姿勢が変更される。回転位置検出器17は、駆動モーター16の出力シャフトの回転位置を検出する。動作制御部14は、移動後の各軸の位置を取得する。
ステップ65において、光測定器13は、光の測定を行う。光測定器13は、光の強度、モードパターン、および光の中心位置を測定する。制御器11は、測定結果を受信する。
ステップ66において、機械学習装置2の状態観測部21は、状態データを取得する。状態観測部21は、各軸における位置を取得する。また、状態観測部21は、記憶部26に記憶されたレンズの品質情報31を記憶部26から取得する。判定データ取得部22は、判定データを取得する。判定データ取得部22は、制御器11から光の強度、モードパターン、および光の中心位置の測定結果を受信する。状態データおよび判定データは、記憶部26に記憶される。
ステップ67において、学習部23の報酬計算部28は、前回のレンズの位置および姿勢における光の強度よりも今回のレンズの位置および姿勢における光の強度が増加したか否かを判別する。ステップ67において、光の強度が増加した場合には、制御はステップ68に移行する。ステップ68において、報酬計算部28は、今回の移動に関する価値関数に含まれる報酬を増加する制御を行う。
ステップ67において、光の強度が増加していない場合には、制御はステップ69に移行する。ステップ69において、報酬計算部28は、今回の移動に関する価値関数に含まれる報酬を減少する制御を実施する。
次に、ステップ70において、報酬計算部28は、前回のレンズの位置および姿勢における光のモードパターンよりも今回のレンズの位置および姿勢における光のモードパターンが優れているか否かを判別する。すなわち、報酬計算部28は、モードパターンが改善したか否かを判別する。例えば、光がシングルモードの場合には、報酬計算部28は、光の強度分布の形状が強度の最大点に対して対称に近いか否かを判別することができる。報酬計算部28は、強度分布の形状が対称な形状に近いほど、モードパターンが優れていると判別することができる。または、報酬計算部28は、強度の分布の真円度が1に近いか否かを判別することができる。報酬計算部28は、真円度が1に近いほどモードパターンが優れていると判別することができる。
ステップ70において、前回のレンズの位置および姿勢における光のモードパターンよりも、今回のレンズの位置および姿勢における光のモードパターンが優れている場合には、制御はステップ71に移行する。ステップ71において、報酬計算部28は、今回の移動に関する価値関数に含まれる報酬を増加する制御を行う。ステップ70において、モードパターンが改善されていない場合には、制御はステップ72に移行する。ステップ72において、報酬計算部28は、今回の行動に関する価値関数に含まれる報酬を減少する制御を行う。
次に、ステップ73において、報酬計算部28は、光の中心位置が改善しているか否かを判別する。光は、受光素子43の光ファイバー44の中心軸の位置に入射することが好ましい。このような光の中心位置の最適点は、予め設定されている。報酬計算部28は、今回のレンズの位置および姿勢における光の強度の最大点が、前回のレンズの位置および姿勢における光の強度の最大点よりも、最適点に近いか否かを判定する。今回の光の強度の最大点が前回の光の強度の最大点よりも最適点に近い場合に、報酬計算部28は、光の中心位置が改善されていると判別することができる。
ステップ73において、光の中心位置が改善されている場合に、制御はステップ74に移行する。ステップ74において、報酬計算部28は、今回の移動に関する価値関数に含まれる報酬を増加する制御を実施する。ステップ73において、光の中心位置が改善されていない場合に、制御はステップ75に移行する。ステップ75において、報酬計算部28は、今回の移動に関する価値関数に含まれる報酬を減少する制御を実施する。
ステップ68,71,74において報酬の増加する場合には、任意の方法を採用することができる。例えば、判定基準が光強度の場合には、報酬計算部28は、光強度の増加量が大きくなるほど報酬を大きく増加させる制御を実施することができる。または、報酬計算部28は、予め定められた増加量にて報酬を増加する制御を実施しても構わない。
ステップ69,72,75において報酬の減少する場合には、任意の方法を採用することができる。例えば、判定基準が光強度の場合には、報酬計算部28は、光強度の減少量が大きいほど、報酬の減少量を大きくする制御を実施することができる。または、報酬計算部28は、予め定められた減少量にて報酬を減少する制御を実施しても構わない。
このように、報酬計算部28は、レンズの移動により光の状態が改善した場合には、報酬を増加する制御を実施する。また、報酬計算部28は、レンズの移動により光の状態が悪化した場合には、報酬を減少する制御を実施する。なお、ステップ67,70,73において、前回の光の状態が今回の光の状態と同じ場合には、報酬計算部は、報酬を減少する制御を行っているが、制御は、この形態に限られない。光の状態が変化しない場合に、報酬計算部は、報酬を現在の値に維持する制御を行っても構わない。
次に、ステップ76においては、価値関数更新部29は、報酬計算部28にて設定された報酬に基づいて価値関数を更新する。
次に、ステップ77において、機械学習装置2の意思決定部24は、光の強度、モードパターン、および光の中心位置が予め定められた判定範囲内であるか否かを判別する。すなわち、意思決定部24は、光の状態が所望の条件を満たしているか否かを判別する。ステップ77において、光の強度、モードパターンおよび光の中心位置が判定範囲内である場合には、この制御を終了する。ステップ77において、光の強度、モードパターンおよび光の中心位置のうち少なくとも1つが判定範囲から逸脱している場合には、制御はステップ63に戻る。ステップ63において、意思決定部24は、現在の位置および姿勢から移動する方向を設定する。そして、機械学習装置2は、光の状態が判定範囲内になるまで、ステップ63からステップ77の制御を繰り返すことができる。
ところで、制御器11の調整時間測定部15は、調芯の開始から調芯の終了までの時間を検出することができる。判定データ取得部22は、図9に示す制御が終了した後に、この調整時間を制御器11から取得する。そして、報酬計算部28は、調整時間に基づいて、それぞれの移動に関する価値関数の報酬を更新することができる。例えば、報酬計算部28は、調整時間が長いほど報酬を減少させる制御を行うことができる。または、報酬計算部28は、調整時間が短いほど報酬を増加させる制御を行うことができる。
次に、価値関数更新部29は、今回のレンズの調芯を行った全ての移動経路における価値関数を更新する。また、価値関数更新部29は、修正された価値関数に基づいて、それぞれの移動における行動価値を算出することができる。更新された行動価値に基づいて、次の光源ユニットのレンズの調芯を行うことができる。
このように、機械学習装置2は、レンズの位置および姿勢を調整する手順を学習することができる。そして、学習した結果に基づいてレンズの移動を行うことにより、短時間でレンズの調芯を行うことができる。第1のレンズ45の位置および姿勢の調整が終了した後に、第1のレンズ45は、接着剤82にて固定部41aに固定される。
上記の実施の形態においては、レンズの調芯を開始する位置は予め定められているが、この形態に限られない。レンズの調芯を開始する位置についても機械学習により学習することができる。例えば、レンズの調芯を開始する位置についても強化学習により学習することができる。状態観測部21は、レンズの品質情報と開始位置を取得することができる。判定データ取得部22は、調整時間測定部15から調芯に要した調整時間を取得することができる。そして、報酬計算部28は、調整時間に基づいて報酬を設定することができる。例えば、報酬計算部28は、調整時間が短いほど報酬を大きく増加させることができる。価値関数更新部29は、設定された報酬に基づいて価値関数を更新することができる。意思決定部24は、価値関数に基づいて算出された行動価値により、レンズの調芯を開始する位置を設定することができる。
または、レンズの調芯を開始する位置は、教師有り学習にて学習しても構わない。教師あり学習では、教師データ、すなわち、ある入力と結果(ラベル)のデータの組を大量に機械学習装置に与える。機械学習装置は、それらのデータセットにある特徴を学習し、入力から結果を推定するモデル(誤差モデル)、すなわち、その関係性を帰納的に獲得することができる。入力データとしては、部品の品質情報およびレンズの調芯の開始位置を入力することができる。機械学習装置は、出力データとして調芯時間を出力することができる。機械学習装置は、調芯時間が短くなるような開始位置を選定することができる。
図10に、本実施の形態における第2のレンズの位置および姿勢を調整する時の側面図を示す。本実施の形態では、第1のレンズ45の位置および姿勢の調整が終了した後に第2のレンズの位置および姿勢を調整する。光源ユニット製造装置1のステージ18は、第2のレンズ46を保持する。光測定器13は、筐体41の受光素子43が配置される位置に対応した位置に配置される。例えば、光測定器13は、発光素子42の光軸81が受光面と垂直になるように配置される。また、光測定器13は、受光面のほぼ中央部に光軸81が通るように配置される。
次に、前述の第1のレンズ45の調芯と同様の方法により、第2のレンズ46の位置および姿勢を調整することができる。第2のレンズ46の位置および姿勢の調整が終了した後には、接着剤82により、固定部41bに第2のレンズ46を固定することができる。
このように、第1のレンズ45の調芯および第2のレンズ46の調芯を実施することができる。本実施の形態では、第1のレンズ45の調芯を実施した後に、第2のレンズの調芯を実施しているが、この形態に限られない。第1のレンズ45の調芯と、第2のレンズの調芯とを同時に実施しても構わない。この場合に、光源ユニット製造装置は、第1のレンズを第1のステージにて保持し、第2のレンズを第2のステージにて保持することができる。光源ユニット製造装置は、第1のレンズまたは第2のレンズの一方を動かして光の状態を取得する制御を繰り返して実施することができる。このように、光源ユニット製造装置は、複数の光学部品の調芯を同時に行っても構わない。
図11に、本実施の形態における第2の製造システムのブロック図を示す。第2の製造システムは、複数の機械学習装置2が、通信装置を介して互いに接続されている。図11に示す例では、2つの機械学習装置2が通信装置を介して互いに接続されている。機械学習装置2は、他の機械学習装置と通信するための通信装置30を備える。1つの機械学習装置は、他の機械学習装置から状態データおよび判定データを受信する。
複数の機械学習装置が互いに接続されることにより、機械学習装置は、多くの学習データを共有することができる。また、複数の機械学習装置において、価値関数を共有することができる。この結果、価値関数の更新が早くなり、最適な価値関数および行動価値を求める時間を短くすることができる。すなわち、機械学習装置の学習時間が短くなる。
また、遠方に配置された機械学習装置同士を接続することができる。例えば、遠く離れた場所に新しい工場を建設した場合に、光源ユニットの調芯の条件の設定を短時間にて行うことができる。または、同一の光源ユニットの製造ラインの増設を行う場合には、調芯の条件の設定を短時間で行うことができる。この結果、工場における光源ユニットの製造効率が向上する。
上記の実施の形態においては、機械学習装置2が光源ユニット製造装置1に接続されているが、この形態に限られず、光源ユニット製造装置は、機械学習装置の機能を有していても構わない。
図12に、本実施の形態における第3の製造システムのブロック図を示す。第3の製造システムは、光源ユニット製造装置5を含む。光源ユニット製造装置5の制御器11は、第1の製造システムの機械学習装置2の機能を有する機械学習部51を含む。機械学習部51は、状態観測部21、判定データ取得部22、学習部23、および意思決定部24を含む。
判定データ取得部22は、光測定器13から光の状態を取得することができる。また判定データ取得部22は、調整時間測定部15からレンズの調芯に要した時間を取得することができる。状態観測部21は、レンズ移動装置12の回転位置検出器17の出力に基づいて、レンズの位置および姿勢を取得することができる。意思決定部24は、動作制御部14に、レンズの動作指令を送出することができる。
また、機械学習部51は、入力部25および記憶部26を含む。レンズの品質情報31は、入力部25に入力され、記憶部26に記憶される。状態観測部21は、記憶部26からレンズの品質情報31を取得する。機械学習部51のその他の構成および機能は、第1の製造システム8の機械学習装置2(図2参照)と同様である。
このように、光源ユニット製造装置の制御器が機械学習の機能を有することができる。この場合にも、複数台の光源ユニット製造装置の制御器同士が互いに接続されていても構わない。この構成により、複数台の光源ユニット製造装置は、価値関数および行動価値を共有することができて、学習時間を短くすることができる。
上記の実施の形態においては、入力部にレンズの品質情報が入力されるが、この形態に限られない。入力部には、光源ユニットの構成部品の品質情報を入力することができる。そして、状態観測部は、構成部品の品質情報を含む状態データを取得することができる。学習部は、この状態データに基づいて機械学習を実施することができる。
光源ユニットの構成部品には、光学部品が含まれる。光学部品としては、発光素子、受光素子、鏡、フィルタ、光ファイバー、およびスプリッタ等が含まれる。また、構成部品には、筐体が含まれる。例えば、発光素子の品質情報には、光の波長、光の強度、温度特性、および拡がり角度などの特性と、材料ロット、製造装置、作業者、製造プロセス、および製造年月日などの製造情報とが含まれる。発光素子の品質情報は、これらの項目のうち少なくとも一つを採用することができる。筐体の品質情報には、筐体の形状(筐体の形状の誤差)と、材料ロット、製造装置、作業者、製造プロセス、および製造年月日などの製造情報とが含まれる。筐体の品質情報は、これらの項目のうち少なくとも一つを採用することができる。構成部品の品質は、光学部品の調芯に影響を与える。状態観測部は、任意の構成部品の品質の情報を取得することができる。学習部は、取得した構成部品の品質に基づいて学習を実施することができる。
本実施の形態では、調芯を行う光学部品としてレンズを例に取り上げて説明したが、この形態に限られない。機械学習による位置および姿勢の調整は、光源ユニットに配置される任意の光学部品に適用することができる。
本実施の形態の光源ユニットは、2つのレンズ、1つの発光素子、および1つの受光素子を含むが、この形態に限られない。光源ユニットは、任意の数の光学部品を含むことができる。例えば、光源ユニットは、複数のレンズ同士の間に配置されたフィルタまたはミラーを含んだり、複数の発光素子から出射される光を1つの受光素子にて受光したりしても構わない。
上述のそれぞれの制御においては、機能および作用が変更されない範囲において適宜ステップの順序を変更することができる。
上記の実施の形態は、適宜組み合わせることができる。上述のそれぞれの図において、同一または相等する部分には同一の符号を付している。なお、上記の実施の形態は例示であり発明を限定するものではない。また、実施の形態においては、特許請求の範囲に示される実施の形態の変更が含まれている。
1,5 光源ユニット製造装置
2 機械学習装置
4 光源ユニット
11 制御器
12 レンズ移動装置
13 光測定器
15 調整時間測定部
17 回転位置検出器
18 ステージ
21 状態観測部
22 判定データ取得部
23 学習部
24 意思決定部
28 報酬計算部
29 価値関数更新部
31 レンズの品質情報
45,46 レンズ
51 機械学習部

Claims (5)

  1. 光源ユニットの光学部品の調芯を実施する手順を学習する機械学習装置であって、
    光学部品の位置および姿勢と光源ユニットの構成部品の品質情報とを含む状態データを取得する状態観測部と、
    光学部品の位置および姿勢の調整時間と光測定器にて測定した光の状態とを含む判定データを取得する判定データ取得部と、
    前記状態観測部にて取得した状態データおよび前記判定データ取得部にて取得した判定データに基づいて、光学部品の位置および姿勢を調整する手順を学習する学習部とを備え、
    前記学習部は、前記判定データ取得部にて取得した前記調整時間および前記光の状態に基づいて報酬を計算する報酬計算部と、
    前記報酬計算部にて設定された報酬に基づいて価値関数を更新する価値関数更新部と、
    前記価値関数に基づいて、光学部品の移動方法を設定する意思決定部とを含む、機械学習装置。
  2. 前記光の状態は、光の強度、モードパターン、および光の中心位置のうち少なくとも一つを含む、請求項1に記載の機械学習装置。
  3. 前記構成部品は、レンズであり、
    前記構成部品の品質情報は、材料の組成、レンズの形状、屈折率、焦点距離、表面に蒸着された光学薄膜の特性、材料ロット、製造装置、作業者、製造プロセス、および製造年月日のうち少なくとも一つを含む、請求項1または2に記載の機械学習装置。
  4. 他の機械学習装置と通信を行う通信装置を備え、
    前記他の機械学習装置から状態データおよび判定データを受信し、
    前記他の機械学習装置と前記価値関数を共有する、請求項1から3のいずれか一項に記載の機械学習装置。
  5. 発光素子から出射される光の状態を測定する光測定器と、
    光学部品を保持して移動させる移動装置と、
    移動装置を制御する制御器とを備え、
    前記制御器は、光学部品の位置および姿勢と構成部品の品質情報とを含む状態データを取得する状態観測部と、
    光学部品の位置および姿勢の調整時間と前記光測定器にて測定した光の状態とを含む判定データを取得する判定データ取得部と、
    前記状態観測部にて取得した状態データおよび前記判定データ取得部にて取得した判定データに基づいて、光学部品の位置および姿勢を調整する手順を学習する学習部とを含み、
    前記学習部は、前記判定データ取得部にて取得した前記調整時間および前記光の状態に基づいて報酬を計算する報酬計算部と、
    前記報酬計算部にて設定された報酬に基づいて価値関数を更新する価値関数更新部と、
    前記価値関数に基づいて、光学部品の移動方法を設定する意思決定部とを含む、光源ユニット製造装置。
JP2016245834A 2016-12-19 2016-12-19 光源ユニットの光学部品の調芯手順を学習する機械学習装置および光源ユニット製造装置 Active JP6339655B1 (ja)

Priority Applications (4)

Application Number Priority Date Filing Date Title
JP2016245834A JP6339655B1 (ja) 2016-12-19 2016-12-19 光源ユニットの光学部品の調芯手順を学習する機械学習装置および光源ユニット製造装置
DE102017011463.3A DE102017011463B4 (de) 2016-12-19 2017-12-12 Maschinenlerneinrichtung zum Lernen eines Verfahrens zum Justieren eines optischen Teils einer Lichtquelleneinheit und Lichtquelleneinheitsherstellungsvorrichtung
US15/839,217 US10241324B2 (en) 2016-12-19 2017-12-12 Machine learning device for learning procedure for aligning optical part of light source unit, and light-source unit manufacturing apparatus
CN201711372458.XA CN108205180B (zh) 2016-12-19 2017-12-19 机器学习装置以及光源单元制造装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2016245834A JP6339655B1 (ja) 2016-12-19 2016-12-19 光源ユニットの光学部品の調芯手順を学習する機械学習装置および光源ユニット製造装置

Publications (2)

Publication Number Publication Date
JP6339655B1 true JP6339655B1 (ja) 2018-06-06
JP2018101025A JP2018101025A (ja) 2018-06-28

Family

ID=62251859

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2016245834A Active JP6339655B1 (ja) 2016-12-19 2016-12-19 光源ユニットの光学部品の調芯手順を学習する機械学習装置および光源ユニット製造装置

Country Status (4)

Country Link
US (1) US10241324B2 (ja)
JP (1) JP6339655B1 (ja)
CN (1) CN108205180B (ja)
DE (1) DE102017011463B4 (ja)

Families Citing this family (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111610598B (zh) * 2019-02-25 2022-08-02 中国科学院光电技术研究所 一种基于强化学习的光纤耦合方法
JP2020148593A (ja) * 2019-03-13 2020-09-17 株式会社明電舎 自動操縦ロボットを制御する操作推論学習モデルの学習システム及び学習方法
GB201906551D0 (en) * 2019-05-09 2019-06-26 Microsoft Technology Licensing Llc Training behavior of an agent
JP6738466B1 (ja) * 2019-06-28 2020-08-12 Dmg森精機株式会社 情報処理装置、情報処理方法および情報処理プログラム
US11669077B2 (en) * 2019-07-03 2023-06-06 Mitsubishi Electric Corporation Machine learning apparatus, numerical control apparatus, wire electric discharge machine, and machine learning method
DE102019129695A1 (de) * 2019-11-04 2021-05-06 Carl Zeiss Microscopy Gmbh Verfahren zum Vorbereiten eines Mikroskops für das Abbilden einer Probe
JP2022095433A (ja) * 2020-12-16 2022-06-28 キヤノン株式会社 光学機器および生成方法
DE102021212601A1 (de) 2021-11-09 2023-05-11 Robert Bosch Gesellschaft mit beschränkter Haftung Verfahren und Vorrichtung zum Ausrichten eines Linsensystems
DE102022100929A1 (de) 2022-01-17 2023-07-20 Jenoptik Optical Systems Gmbh Justierverfahren und Justiervorrichtung zur Positionierung von optischen Elementen einer optischen Vorrichtung

Family Cites Families (17)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2538975B2 (ja) * 1988-03-28 1996-10-02 日産自動車株式会社 自動車車体の製造方法
JPH0784171A (ja) 1993-09-17 1995-03-31 Canon Inc レンズ駆動制御装置
JP3885183B2 (ja) 2000-01-17 2007-02-21 独立行政法人産業技術総合研究所 光学装置、光学装置の調整方法、およびその調整方法で実行する処理プログラムを記録した記録媒体
JP3645168B2 (ja) * 2000-10-18 2005-05-11 独立行政法人産業技術総合研究所 光軸調整方法およびその調整プログラムを記録した記録媒体
JP2004094900A (ja) * 2002-07-09 2004-03-25 National Institute Of Advanced Industrial & Technology 生産計画作成システム及び方法、並びにプログラム
JP2005235075A (ja) * 2004-02-23 2005-09-02 Toshiba Corp 医療検査機器部品交換支援システム
JP2005317841A (ja) * 2004-04-30 2005-11-10 Matsushita Electric Ind Co Ltd 半導体レーザ装置
US20060159140A1 (en) * 2005-01-17 2006-07-20 Fanuc Ltd Laser oscillator and method of estimating the lifetime of a pump light source
JP2006222411A (ja) * 2005-01-17 2006-08-24 Fanuc Ltd レーザ発振器及びレーザ発振器の励起光源の寿命推定方法
CN101206294A (zh) * 2006-12-14 2008-06-25 富士胶片株式会社 透镜光学***的偏心调整方法、偏心调整装置和偏心调整程序
JP5387877B2 (ja) * 2008-03-18 2014-01-15 富士電機株式会社 油入電気機器の余寿命推定方法
JP4287494B2 (ja) * 2008-04-07 2009-07-01 三菱電機株式会社 調芯固定方法および調芯固定装置
RU2529135C2 (ru) 2008-11-21 2014-09-27 Прецитек Кг Способ и устройство для контроля проводимого на обрабатываемой детали процесса лазерной обработки, а также лазерная обрабатывающая головка с подобным устройством
EP3490343B1 (en) * 2010-10-08 2021-03-10 Lantiq Beteiligungs-GmbH & Co.KG Laser diode control device
JP2013231937A (ja) * 2012-04-03 2013-11-14 Mitsubishi Electric Corp 光学装置およびその製造方法
DE102014102080B4 (de) 2014-02-19 2021-03-11 Carl Zeiss Ag Verfahren zur Bildaufnahme und Bildaufnahmesystem
JP6055058B1 (ja) * 2015-09-30 2016-12-27 ファナック株式会社 機械学習器及び組み立て・試験器を備えた生産設備

Also Published As

Publication number Publication date
CN108205180A (zh) 2018-06-26
US20180172983A1 (en) 2018-06-21
CN108205180B (zh) 2019-05-28
DE102017011463B4 (de) 2019-10-24
JP2018101025A (ja) 2018-06-28
DE102017011463A1 (de) 2018-06-21
US10241324B2 (en) 2019-03-26

Similar Documents

Publication Publication Date Title
JP6339655B1 (ja) 光源ユニットの光学部品の調芯手順を学習する機械学習装置および光源ユニット製造装置
US20200254622A1 (en) Machine learning device, robot system, and machine learning method for learning workpiece picking operation
US10921789B2 (en) Finish-machining amount prediction apparatus and machine learning device
US20170270434A1 (en) Machine learning apparatus, laser machining system and machine learning method
US10082771B2 (en) Machine learning method and machine learning apparatus learning operating command to electric motor and machine tool including machine learning apparatus
US11253999B2 (en) Machine learning device, robot control device and robot vision system using machine learning device, and machine learning method
JP6438450B2 (ja) レーザ加工ロボットの加工順序を学習する機械学習装置、ロボットシステムおよび機械学習方法
CN108568596B (zh) 激光加工装置以及机器学习装置
JP6470251B2 (ja) 数値制御装置及び機械学習装置
JP6502983B2 (ja) 洗浄工程最適化装置及び機械学習装置
US11093828B2 (en) Fiber laser device and machine learning device
US20180169856A1 (en) Machine learning device, robot system, and machine learning method for learning operations of robot and laser scanner
JP6499710B2 (ja) 加減速制御装置
US10242325B2 (en) Machine learning apparatus, laser apparatus and machine learning method
KR101700896B1 (ko) 공작물 레이저 가공 작업 모니터 방법 및 장치와 그 장치를 구비한 레이저 가공 헤드
US9952574B2 (en) Machine learning device, motor control system, and machine learning method for learning cleaning interval of fan motor
US10698380B2 (en) Numerical controller
JP2018171684A (ja) ロボットの制御装置、機械学習装置及び機械学習方法
JP2019136818A (ja) 制御装置及び機械学習装置
JP5051745B2 (ja) 光伝送路の光軸調整方法および装置
JP2022145915A (ja) 推論方法、推論プログラム、推論装置、学習方法、学習プログラム、学習装置およびモデル生成方法

Legal Events

Date Code Title Description
A975 Report on accelerated examination

Free format text: JAPANESE INTERMEDIATE CODE: A971005

Effective date: 20180301

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20180417

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20180510

R150 Certificate of patent or registration of utility model

Ref document number: 6339655

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150