JP7113778B2 - Work take-out device - Google Patents

Work take-out device Download PDF

Info

Publication number
JP7113778B2
JP7113778B2 JP2019060437A JP2019060437A JP7113778B2 JP 7113778 B2 JP7113778 B2 JP 7113778B2 JP 2019060437 A JP2019060437 A JP 2019060437A JP 2019060437 A JP2019060437 A JP 2019060437A JP 7113778 B2 JP7113778 B2 JP 7113778B2
Authority
JP
Japan
Prior art keywords
information processing
unit
gripping
work
workpiece
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2019060437A
Other languages
Japanese (ja)
Other versions
JP2020157436A (en
Inventor
博明 大庭
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
NTN Corp
Original Assignee
NTN Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by NTN Corp filed Critical NTN Corp
Priority to JP2019060437A priority Critical patent/JP7113778B2/en
Publication of JP2020157436A publication Critical patent/JP2020157436A/en
Application granted granted Critical
Publication of JP7113778B2 publication Critical patent/JP7113778B2/en
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Manipulator (AREA)

Description

本開示は、ワーク取り出し作業装置に関し、より特定的には、リンク機構による角度調整機能を備えるワーク取り出し作業装置の機械学習を用いた制御に関する。 TECHNICAL FIELD The present disclosure relates to a work picking device, and more particularly to control using machine learning for a work picking device having an angle adjustment function by a link mechanism.

自動化された機械加工または組立作業におけるワークピース(以下、ワークと称する)は、ロボットまたは組立装置等(所謂、ワーク取り出し作業装置)によって自動的にピックアップされ、加工装置または組立物にセットされることが多い。 A workpiece (hereinafter referred to as a workpiece) in automated machining or assembly work is automatically picked up by a robot or an assembly device (so-called work picking device) and set in a processing device or assembly. There are many.

取り出されたワークを後工程の組立作業で別のワークに組み付ける場合、ワーク取り出し作業装置は、ワークを1つずつ取り出す必要がある。しかし、バネやクリップの様に絡みやすいワークを扱う場合、ワーク取り出し作業装置は、2つ以上のワークを同時に把持してしまう可能性がある。そのため、ワーク取り出し作業装置には、ワークの取り出しだけでなく、ワーク同士の絡まりを解く機能(以下、絡まり解き機能と呼ぶ)が求められている。 When the removed work is assembled with another work in the post-process assembly work, the work picking device needs to take out the works one by one. However, when handling workpieces that tend to get entangled, such as springs and clips, the workpiece picking device may grip two or more workpieces at the same time. Therefore, the work unloading device is required to have a function of untangling the works (hereinafter referred to as untangling function) in addition to unloading the work.

また、近年、機械学習の手法が進歩してきたこともあり、ワーク取り出し作業装置の制御の精度向上のために、機械学習を導入することが望まれている。 In addition, in recent years, the technique of machine learning has progressed, and it is desired to introduce machine learning in order to improve the accuracy of control of the work picking device.

ワークの取り出し制御に関し、例えば、特許文献1(特開2017-030135号公報)は、多関節ロボットを用いた「バラ積みされた状態を含む、乱雑に置かれたワークを取り出すときのロボットの最適な動作が人間の介在無しに選択される機械学習装置」を開示している([要約]参照)。 Regarding work take-out control, for example, Patent Document 1 (Japanese Patent Application Laid-Open No. 2017-030135) describes "optimization of the robot when taking out randomly placed works, including randomly stacked states" using an articulated robot. A machine learning device in which a suitable action is selected without human intervention” (see [Abstract]).

また、絡まり取り制御に関し、例えば、特許文献2(特開平05-185388号公報)は、「ロボットハンドのワーク把持状態を絡み検出用カメラが撮像し、この撮像した撮像情報に基づいてロボットハンドが把持するワークに絡み状態が発生しているか否かを視覚装置にて判定する」部品供給装置を開示している([要約]参照)。 Regarding tangling control, for example, Patent Document 2 (Japanese Patent Application Laid-Open No. 05-185388) discloses that "a tangling detection camera captures an image of a workpiece gripping state of a robot hand, and based on the captured image information, the robot hand detects A visual device determines whether or not a workpiece to be gripped is entangled" (see [Summary]).

特開2017-030135号公報JP 2017-030135 A 特開平05-185388号公報JP-A-05-185388 特開2017-064910号公報JP 2017-064910 A 特開平06-144584号公報JP-A-06-144584

例えば、特許文献1および2に開示された技術はいずれも多関節ロボットを前提としている。多関節ロボットは、一般に特異点と呼ばれる構造的に制御できなくなる姿勢を含む。また、多関節ロボットは、ワークに加わる力やモーメントを検出するためのセンサーが必要であり、機械学習と組み合わせた場合に学習用のパラメータが多くなり、学習効率が悪くなる。 For example, the techniques disclosed in Patent Documents 1 and 2 are both based on articulated robots. Articulated robots contain poses that are structurally uncontrollable, commonly referred to as singularities. In addition, articulated robots require sensors to detect the force and moment applied to the workpiece, and when combined with machine learning, the number of learning parameters increases, resulting in poor learning efficiency.

そのため、多関節ロボットと異なり、構造的に特異点を有さず、効率よく機械学習を行うための技術が必要とされている。 Therefore, unlike multi-joint robots, there is a need for a technique for efficient machine learning that does not have singular points structurally.

本開示は、上記のような背景に鑑みてなされたものであって、ある局面における目的は、構造的に特異点を有さず、効率よく機械学習を行うための技術を提供することにある。 The present disclosure has been made in view of the above background, and an object in one aspect is to provide a technique for efficiently performing machine learning without structural singularities. .

ある実施の形態に従うワーク取り出しを行う作業装置は、ワークを容器から取り出して把持する把持部と、把持部が装着され、把持部の向きを調整する角度調整部と、角度調整部が装着される作業ヘッドと、複数の駆動部により作業ヘッドを移動させる位置調整部と、把持部の把持するワークを撮影する把持部撮像装置と、作業装置を制御する制御装置とを備える。角度調整部は、第1および第2のリンクハブと、第1および第2のリンクハブの間に並列に配置された複数のリンクと、複数のリンクのそれぞれを駆動させる複数の駆動部とを含む。制御装置は、把持部撮像装置が撮影した画像に基づいて、把持部が把持するワークの個数を検出し、把持部が把持するワークの個数が2以上であることに基づいて、把持部が把持するワークの個数および角度調整部の各駆動部のトルクを機械学習モデルのパラメータとし、機械学習モデルにより、位置調整部および角度調整部の各駆動部に送信するそれぞれの駆動信号を決定し、決定した駆動信号に基づいて、位置調整部の各駆動部および角度調整部の各駆動部を駆動させることにより、把持部にワークの絡まり解き動作をさせる。 A working device for picking up a workpiece according to an embodiment is equipped with a gripping section for gripping a workpiece after it is retrieved from a container, an angle adjusting section for adjusting the orientation of the gripping section, and an angle adjusting section. It includes a working head, a position adjusting section that moves the working head by a plurality of driving sections, a gripping section imaging device that captures an image of a workpiece gripped by the gripping section, and a control device that controls the working device. The angle adjusting section includes first and second link hubs, a plurality of links arranged in parallel between the first and second link hubs, and a plurality of driving sections for driving each of the plurality of links. include. The control device detects the number of workpieces gripped by the gripping part based on the image captured by the gripping part imaging device, and based on the fact that the number of workpieces gripped by the gripping part is two or more, the gripping part is gripped. The number of workpieces to be processed and the torque of each driving part of the angle adjusting part are used as parameters of the machine learning model, and the respective driving signals to be sent to each driving part of the position adjusting part and the angle adjusting part are determined by the machine learning model. By driving the respective driving portions of the position adjusting portion and the respective driving portions of the angle adjusting portion based on the generated drive signal, the grasping portion is caused to untangle the workpiece.

ある実施の形態によれば、構造的に特異点を有さず、効率よく機械学習を行うことが可能である。 According to an embodiment, it is possible to efficiently perform machine learning without structural singularities.

この発明の上記および他の目的、特徴、局面および利点は、添付の図面と関連して理解されるこの発明に関する次の詳細な説明から明らかとなるであろう。 The above and other objects, features, aspects and advantages of the present invention will become apparent from the following detailed description of the invention taken in conjunction with the accompanying drawings.

ある実施の形態に従うワーク取り出し作業システム100の一構成例を示す図である。1 is a diagram showing a configuration example of a work picking system 100 according to an embodiment; FIG. 角度調整機構111の一構成例を示す図である。4 is a diagram showing a configuration example of an angle adjustment mechanism 111; FIG. 角度調整機構111の回転軸42に姿勢制御用の電動アクチュエータ11を取り付けた一構成例を示す。A configuration example in which an electric actuator 11 for attitude control is attached to a rotation shaft 42 of an angle adjustment mechanism 111 is shown. 把持機構112の一構成例を示す図である。4 is a diagram showing a configuration example of a gripping mechanism 112; FIG. 把持機構112を取り付けた角度調整機構111の一例を示す図である。FIG. 4 is a diagram showing an example of an angle adjusting mechanism 111 to which a gripping mechanism 112 is attached; 情報処理装置102のハードウェアの一構成例を示す図である。3 is a diagram illustrating an example of hardware configuration of the information processing apparatus 102. FIG. 情報処理装置102を実現する機能の一構成例を示す図である。2 is a diagram illustrating a configuration example of functions that implement the information processing apparatus 102. FIG. 評価値関数部802の動作の一例を示す図である。8 is a diagram showing an example of the operation of an evaluation value function unit 802; FIG. 動作パターンテーブル803の一例を示す図である。8 is a diagram showing an example of an operation pattern table 803; FIG. ワーク取り出し作業システム100の処理の一例を示すフローチャートである。4 is a flow chart showing an example of processing of the work picking work system 100. FIG. 図10の処理の動作イメージの一例を示す図である。FIG. 11 is a diagram showing an example of an operation image of the process of FIG. 10; ワーク取り出し作業システム100の絡まり解き作業の学習処理の一例を示すフローチャートである。6 is a flow chart showing an example of learning processing of the untangling work of the work picking work system 100. FIG. 絡まり解き作業の初期学習処理(図12のステップ1230に対応)の一例を示すフローチャートである。13 is a flow chart showing an example of initial learning processing (corresponding to step 1230 in FIG. 12) for untangling work; 絡まり解き作業の学習処理(図12のステップ1260に対応)の一例を示すフローチャートである。FIG. 13 is a flow chart showing an example of a learning process (corresponding to step 1260 in FIG. 12) for untangling work; FIG. 評価値関数部802の評価値関数Fの更新処理の一例を示すフローチャートである。8 is a flowchart showing an example of update processing of an evaluation value function F of an evaluation value function unit 802;

以下、図面を参照しつつ、本開示に係る技術思想の実施の形態について説明する。以下の説明では、同一の部品には同一の符号を付してある。それらの名称および機能も同じである。したがって、それらについての詳細な説明は繰り返さない。 Hereinafter, embodiments of the technical concept according to the present disclosure will be described with reference to the drawings. In the following description, the same parts are given the same reference numerals. Their names and functions are also the same. Therefore, detailed description thereof will not be repeated.

<A.システム構成>
図1は、本実施の形態に従うワーク取り出し作業システム100の一構成例を示す図である。図1を参照して、ワーク取り出し作業システム100は、ワーク取り出し作業装置101と、情報処理装置102と、制御装置103と、撮像装置114,115とを備える。
<A. System configuration>
FIG. 1 is a diagram showing one configuration example of a work picking work system 100 according to the present embodiment. Referring to FIG. 1 , work picking system 100 includes work picking device 101 , information processing device 102 , control device 103 , and imaging devices 114 and 115 .

ワーク取り出し作業装置101は、架台104と、第1の直動ユニット105と、第2の直動ユニット106と、第3の直動ユニット107と、電動アクチュエータ108A,108B,108C(以降、総称する場合は電動アクチュエータ108と呼ぶ)と、作業ヘッド109と、回転ユニット取付部材110と、角度調整機構111と、把持機構112と、ワーク入れ113とを備える。 The workpiece picking device 101 includes a base 104, a first linear motion unit 105, a second linear motion unit 106, a third linear motion unit 107, and electric actuators 108A, 108B, and 108C (hereinafter collectively referred to as ), a working head 109 , a rotating unit mounting member 110 , an angle adjusting mechanism 111 , a gripping mechanism 112 , and a work holder 113 .

架台104は、第1の直動ユニット105と、第2の直動ユニット106と、第3の直動ユニット107と、それぞれの直動ユニットを駆動させる電動アクチュエータ108A,108B,108Cと、作業ヘッド109とからなる位置調整装置が装着される台である。 The pedestal 104 includes a first linear motion unit 105, a second linear motion unit 106, a third linear motion unit 107, electric actuators 108A, 108B, and 108C for driving the respective linear motion units, and a work head. 109 on which a position adjusting device is mounted.

第1の直動ユニット105、第2の直動ユニット106および第3の直動ユニット107は、それぞれ直交するX軸、Y軸、Z軸方向に作業ヘッド109を移動させる。ある局面において、各直動ユニットは、フレームと、リニアシャフトと、リニアブッシュと、電動アクチュエータ108から動力を伝達するための台形ネジおよびボールネジナットとを備えていてもよい。また、ある局面において、各直動ユニットは、リニアシャフトの代わりに、リニアガイドや、フレームの表面を滑るガイドローラーを備えていてもよい。また、ある局面において、各直動ユニットは、台形ネジの代わりに駆動ベルトを備えていてもよい。また、各直動ユニットの端部には、各電動アクチュエータ108の初期位置の決定と、安全機構のための、衝突検知センサーが設けられていてもよい。 The first linear motion unit 105, the second linear motion unit 106, and the third linear motion unit 107 move the working head 109 in orthogonal X-axis, Y-axis, and Z-axis directions, respectively. In one aspect, each linear motion unit may comprise a frame, a linear shaft, a linear bushing, a trapezoidal screw and a ball screw nut for transmitting power from the electric actuator 108. In one aspect, each linear motion unit may include a linear guide or a guide roller that slides on the surface of the frame instead of the linear shaft. In one aspect, each linear motion unit may include a drive belt instead of the trapezoidal screw. Also, the end of each linear motion unit may be provided with a collision detection sensor for determining the initial position of each electric actuator 108 and for a safety mechanism.

電動アクチュエータ108は、それぞれの直動ユニットを駆動させる。ある局面において、電動アクチュエータ108は、ステッピングモータであり、台形ネジや駆動ベルトを介して動力を各直動ユニットに伝達してもよい。また、ある局面において、電動アクチュエータ108は、ACサーボモータまたはエンコーダーを備えたギアードモータであってもよい。情報処理装置102は、ステッピングモータのステップ数や、エンコーダーの回転数によって、作業ヘッド109および把持機構112の現在位置を算出してもよい。 The electric actuator 108 drives each linear motion unit. In one aspect, the electric actuator 108 may be a stepping motor and transmit power to each linear motion unit via a trapezoidal screw or drive belt. Also, in one aspect, the electric actuator 108 may be an AC servomotor or a geared motor with an encoder. The information processing device 102 may calculate the current positions of the working head 109 and the gripping mechanism 112 based on the number of steps of the stepping motor and the number of revolutions of the encoder.

作業ヘッド109は、上下方向(Z軸方向)に動作するように第3の直動ユニット107に取り付けられている。また、作業ヘッド109は、作業に必要なパーツを取り付けるためのネジ穴やアタッチメントを備える。 The working head 109 is attached to the third linear motion unit 107 so as to move vertically (in the Z-axis direction). The working head 109 also has screw holes and attachments for attaching parts necessary for the work.

回転ユニット取付部材110は、作業ヘッド109に取り付けられており、角度調整機構111を取り付けるためのネジ穴やアタッチメントを備える。角度調整機構111は、把持機構112によって把持されたワークの向きを微調整する。また、角度調整機構111の根元は電動アクチュエータを用いた回転機構となっている。なお、回転機構は、角度調整機構111とは別体でもよい。角度調整機構111の詳細については後述する。把持機構112は、ワーク取り出し作業におけるワーク、例えば、C型サークリップや、ばね、コイル等を把持する。把持機構112の詳細については後述する。ワーク入れ113は、ワークを入れるための箱である。 The rotary unit attachment member 110 is attached to the working head 109 and has screw holes and attachments for attaching the angle adjustment mechanism 111 . The angle adjustment mechanism 111 finely adjusts the orientation of the workpiece gripped by the gripping mechanism 112 . Further, the base of the angle adjustment mechanism 111 is a rotation mechanism using an electric actuator. Note that the rotation mechanism may be separate from the angle adjustment mechanism 111 . Details of the angle adjustment mechanism 111 will be described later. The gripping mechanism 112 grips a workpiece, such as a C-shaped circlip, a spring, or a coil, in the workpiece picking operation. Details of the gripping mechanism 112 will be described later. A work container 113 is a box for containing a work.

情報処理装置102は、制御装置103を介して、ワーク取り出し作業装置101に対して制御命令を送信し、また、電動アクチュエータ108や角度調整機構111の電動アクチュエータのモータトルク値等を取得する。情報処理装置102の詳細は後述する。 The information processing device 102 transmits a control command to the work picking device 101 via the control device 103, and acquires the motor torque value of the electric actuator 108 and the electric actuator of the angle adjustment mechanism 111, and the like. Details of the information processing apparatus 102 will be described later.

制御装置103は、ワーク取り出し作業装置101および情報処理装置102の間のデータを相互に変換する。ある局面において、制御装置103は、マイクロコンピューターからなる制御基板であり、情報処理装置102から、ワーク取り出し作業装置101の電動アクチュエータ108や角度調整機構111の電動アクチュエータに対する指令(指令トルク、回転量、回転速度等)を受信し、それぞれの電動アクチュエータに制御信号を送信してもよい。 The control device 103 mutually converts data between the work picking device 101 and the information processing device 102 . In one aspect, the control device 103 is a control board made up of a microcomputer, and commands (command torque, rotation amount, rotational speed, etc.) and transmit control signals to the respective electric actuators.

撮像装置114は、ワーク入れ113を上から撮影することによって得られる画像または映像を情報処理装置102に送信する。情報処理装置102は、撮像装置114から受信した画像または映像に基づいて、ワークの位置を検出し、位置調整装置により、把持機構112をワークの取り出し位置まで移動させる。 The imaging device 114 transmits an image or video obtained by photographing the work container 113 from above to the information processing device 102 . The information processing device 102 detects the position of the work based on the image or video received from the imaging device 114, and moves the gripping mechanism 112 to the work pick-up position by the position adjusting device.

撮像装置115は、把持機構112が把持するワークを横から撮影することによって得られる画像または映像を情報処理装置102に送信する。情報処理装置102は、撮像装置115から受信した画像または映像に基づいて、把持機構112が把持するワークの個数を検出する。 The imaging device 115 transmits to the information processing device 102 an image or video obtained by photographing the workpiece gripped by the gripping mechanism 112 from the side. The information processing device 102 detects the number of workpieces gripped by the gripping mechanism 112 based on the image or video received from the imaging device 115 .

<B.システム構成部品のハードウェア構成>
図2は、角度調整機構111の一構成例を示す図である。図2を参照して、角度調整機構111は、基端側の第1リンクハブ32に対し先端側の第2リンクハブ33を3組のリンク機構34によって姿勢変更可能に連結したものである。先端側の第2リンクハブ33には、図1に示された把持機構112が取り付けられる。なお、ここでは3組のリンク機構34を有する角度調整機構111について示したが、リンク機構34の数は、4組以上であってもよい。
<B. Hardware Configuration of System Components>
FIG. 2 is a diagram showing a configuration example of the angle adjusting mechanism 111. As shown in FIG. Referring to FIG. 2, the angle adjustment mechanism 111 connects the second link hub 33 on the distal side to the first link hub 32 on the proximal side by three sets of link mechanisms 34 so that the attitude can be changed. The gripping mechanism 112 shown in FIG. 1 is attached to the second link hub 33 on the distal end side. Although the angle adjusting mechanism 111 having three link mechanisms 34 is shown here, the number of link mechanisms 34 may be four or more.

各リンク機構34は、基端側の端部リンク部材35、先端側の端部リンク部材36および中央リンク部材37で構成される。リンク機構34は、4つの回転対偶からなる4節連鎖のリンク機構である。基端側および先端側の端部リンク部材35,36はL字状の形状を有する。 Each link mechanism 34 is composed of a proximal end link member 35 , a distal end link member 36 and a central link member 37 . The link mechanism 34 is a four-bar chain link mechanism composed of four rotational pairs. The proximal and distal end link members 35, 36 have an L-shape.

基端側の端部リンク部材35の一端は、回転軸42を介して、基端側の第1リンクハブ32に回転自在に連結されている。先端側の端部リンク部材36の一端は、回転軸73を介して、先端側の第2リンクハブ33に回転自在に連結されている。中央リンク部材37は、回転軸55,75を介して、両端に端部リンク部材35,36の各他端がそれぞれ回転自在に連結されている。 One end of the end link member 35 on the proximal side is rotatably connected to the first link hub 32 on the proximal side via a rotating shaft 42 . One end of the end link member 36 on the tip side is rotatably connected to the second link hub 33 on the tip side via a rotating shaft 73 . The center link member 37 is rotatably connected to both ends of the end link members 35 and 36 via the rotation shafts 55 and 75, respectively.

角度調整機構111は、パラレルリンク機構であり、2つの球面リンク機構を組み合わせた構造を有する。端部リンク部材35,36と中央リンク部材37との各回転対偶の中心軸は、ある交差角を持っていてもよいし、平行であってもよい。 The angle adjusting mechanism 111 is a parallel link mechanism and has a structure in which two spherical link mechanisms are combined. The central axes of the rotational pairs of the end link members 35, 36 and the center link member 37 may have a certain crossing angle or may be parallel.

角度調整機構111は、リンクの動作のみで各リンクハブの中心軸の相対角度を調整可能であり、多関節ロボットのように直列に連結された複数の関節の動作を伴わない。このため、先端のわずかな動きに対して構成部材が大きく動くことは無く素早い動作が可能である。また、角度調整機構111は、リンクを駆動させる電動アクチュエータのモータトルク値から、任意の姿勢における把持機構112の先端に加わる力を検出できる。 The angle adjustment mechanism 111 can adjust the relative angle of the central axis of each link hub only by the operation of the link, and does not involve the operation of a plurality of joints connected in series like an articulated robot. For this reason, even a slight movement of the tip does not cause a large movement of the constituent members, enabling quick operation. Also, the angle adjusting mechanism 111 can detect the force applied to the tip of the gripping mechanism 112 in an arbitrary posture from the motor torque value of the electric actuator that drives the link.

第2リンクハブ33は、第1リンクハブ32から見て半球面上で姿勢を変える。そのため、第1リンクハブ32から見た第2リンクハブ33の目標位置と、各リンクの姿勢とは、必ず一対一で対応する。よって、角度調整機構111は、ロボットアーム等のマルチリンクを持つ構造と異なり、特異点を有さない。 The second link hub 33 changes its posture on the hemispherical surface when viewed from the first link hub 32 . Therefore, the target position of the second link hub 33 as viewed from the first link hub 32 and the orientation of each link always correspond one-to-one. Therefore, the angle adjustment mechanism 111 does not have a singular point, unlike a structure having multiple links such as a robot arm.

図3は、角度調整機構111の回転軸42に姿勢制御用の電動アクチュエータ11を取り付けた一構成例を示す。電動アクチュエータ11は、減速機構62を備えたロータリアクチュエータ(モータ)である。電動アクチュエータ11は、基端側の第1リンクハブ32の上面に、電動アクチュエータ11の回転軸と回転軸42とが同軸上に位置するように設置されている。電動アクチュエータ11および減速機構62は、一体として設けられてもよい。減速機構62は、モータ固定部材63により基端側の第1リンクハブ32に固定される。ある局面において、電動アクチュエータ11は、ACサーボモータまたはエンコーダーを備えたギアードモータであってもよい。 FIG. 3 shows a configuration example in which the electric actuator 11 for attitude control is attached to the rotating shaft 42 of the angle adjusting mechanism 111. As shown in FIG. The electric actuator 11 is a rotary actuator (motor) having a speed reduction mechanism 62 . The electric actuator 11 is installed on the upper surface of the first link hub 32 on the base end side so that the rotating shaft of the electric actuator 11 and the rotating shaft 42 are coaxially positioned. The electric actuator 11 and the deceleration mechanism 62 may be provided integrally. The speed reduction mechanism 62 is fixed to the first link hub 32 on the base end side by a motor fixing member 63 . In one aspect, electric actuator 11 may be an AC servomotor or a geared motor with an encoder.

図3に示す例では、電動アクチュエータ11が3組のリンク機構34の全てに設けられているが、本実施の形態に従う角度調整機構111はこれに限られない。角度調整機構111は、リンク機構34のうち少なくとも2組に姿勢制御用の電動アクチュエータ11が設けられていれば、基端側の第1リンクハブ32に対する先端側の第2リンクハブ33の姿勢を確定することができる。 In the example shown in FIG. 3, electric actuators 11 are provided in all three sets of link mechanisms 34, but angle adjustment mechanism 111 according to the present embodiment is not limited to this. If at least two sets of the link mechanisms 34 are provided with electric actuators 11 for attitude control, the angle adjustment mechanism 111 adjusts the attitude of the second link hub 33 on the distal side with respect to the first link hub 32 on the proximal side. can be determined.

図4は、把持機構112の一構成例を示す図である。把持機構112は、対向する2枚の爪で対象物を挟み込む。本実施の形態に従う把持機構112は、エアシリンダを用いて2枚の爪を開閉させる方式である。状態Aは把持機構112の開放時の状態を示す。状態Bは把持機構112の閉じた状態を示す。図4に示す把持機構112は一例であり、本実施の形態に従う把持機構112はこれに限られない。ある局面において、把持機構112は、電動式の開閉機構、対象物を吸着する機構または他の挟み込み機構であってもよい。 FIG. 4 is a diagram showing a configuration example of the gripping mechanism 112. As shown in FIG. The gripping mechanism 112 grips the object with two opposing claws. Gripping mechanism 112 according to the present embodiment is of a type that opens and closes two claws using an air cylinder. State A shows the state when the gripping mechanism 112 is opened. State B shows the gripping mechanism 112 closed. The gripping mechanism 112 shown in FIG. 4 is an example, and the gripping mechanism 112 according to the present embodiment is not limited to this. In one aspect, the gripping mechanism 112 may be a motorized opening and closing mechanism, an object suction mechanism, or other pinching mechanism.

図5は、把持機構112を取り付けた角度調整機構111の一例を示す図である。角度調整機構111の先端側の第2リンクハブ33は、把持機構112をネジ止めするネジ穴、はめ込み穴またはその他のアタッチメントを備えていてもよい。図5に示す構成によって、ワーク取り出し作業装置101は、把持機構112が複数のワークを把持したときにおける、絡まり解きの動作を行うことができる。 FIG. 5 is a diagram showing an example of the angle adjusting mechanism 111 to which the gripping mechanism 112 is attached. The second link hub 33 on the distal end side of the angle adjusting mechanism 111 may have a screw hole, a fitting hole, or other attachment for screwing the gripping mechanism 112 . With the configuration shown in FIG. 5, the work picking device 101 can perform the operation of untangling when the gripping mechanism 112 grips a plurality of workpieces.

なお、本実施の例では、位置調整装置は、角度調整機構111を移動させているが、本実施の形態に従うワーク取り出し作業装置101はこれに限られない。位置調整装置は、角度調整機構111、把持機構112およびワーク入れ113の中のワークを相対的に位置決めできればよく、ある局面において、位置調整装置は、ワーク入れ113を移動させる機構を含んでもよい。 In this embodiment, the position adjustment device moves the angle adjustment mechanism 111, but the work picking device 101 according to this embodiment is not limited to this. The position adjustment device only needs to be able to relatively position the workpieces in the angle adjustment mechanism 111 , the gripping mechanism 112 and the workpiece container 113 , and in some aspects the position adjustment device may include a mechanism for moving the workpiece container 113 .

<C.回路およびソフトウェア構成>
図6は、情報処理装置102のハードウェアの一構成例を示す図である。図6を参照して、情報処理装置102は、CPU(Central Processing Unit)701と、1次記憶装置702と、2次記憶装置703と、外部機器インターフェース704と、入力インターフェース705と、出力インターフェース706と、通信インターフェース707とを備える。
<C. Circuit and software configuration>
FIG. 6 is a diagram showing a configuration example of hardware of the information processing apparatus 102. As shown in FIG. 6, information processing apparatus 102 includes a CPU (Central Processing Unit) 701, a primary storage device 702, a secondary storage device 703, an external device interface 704, an input interface 705, and an output interface 706. and a communication interface 707 .

CPU701は、情報処理装置102で動作するプログラムやデータを処理する。1次記憶装置702は、CPU701によって実行されるプログラムおよび参照されるデータを格納する。ある局面において、DRAM(Dynamic Random Access Memory)が1次記憶装置702として使用されてもよい。 The CPU 701 processes programs and data that operate on the information processing apparatus 102 . Primary storage device 702 stores programs executed by CPU 701 and referenced data. In some aspects, dynamic random access memory (DRAM) may be used as primary storage 702 .

2次記憶装置703は、プログラムやデータ等を長期間記憶する。一般的に2次記憶装置703は、1次記憶装置702よりも低速であるため、CPU701で直接使用するデータは、1次記憶装置702に配置され、それ以外のデータは、2次記憶装置703に配置される。ある局面において、HDD(Hard Disk Drive)やSSD(Solid State Drive)等の不揮発性の記憶装置が2次記憶装置703として使用されてもよい。 A secondary storage device 703 stores programs, data, and the like for a long period of time. Since the secondary storage device 703 is generally slower than the primary storage device 702, data directly used by the CPU 701 is stored in the primary storage device 702, and other data is stored in the secondary storage device 703. placed in In one aspect, a non-volatile storage device such as a HDD (Hard Disk Drive) or SSD (Solid State Drive) may be used as the secondary storage device 703 .

外部機器インターフェース704は、情報処理装置102に補助デバイスを接続する場合等に使用される。ある局面において、USB(Universal Serial Bus)インターフェースが、外部機器インターフェース704として使用されてもよい。入力インターフェース705は、キーボードやマウス等を接続するために使用される。ある局面において、USBインターフェースが、入力インターフェース705として使用されてもよい。 The external device interface 704 is used, for example, when connecting an auxiliary device to the information processing apparatus 102 . In one aspect, a USB (Universal Serial Bus) interface may be used as the external device interface 704 . An input interface 705 is used to connect a keyboard, mouse, and the like. In one aspect, a USB interface may be used as input interface 705 .

出力インターフェース706は、ディスプレイ等の出力デバイスを接続するために使用される。ある局面において、HDMI(登録商標)(High-Definition Multimedia Interface)やDVI(Digital Visual Interface)が出力インターフェース706として使用されてもよい。 Output interface 706 is used to connect an output device such as a display. In one aspect, HDMI (registered trademark) (High-Definition Multimedia Interface) or DVI (Digital Visual Interface) may be used as the output interface 706 .

通信インターフェース707は、外部の通信機器と通信するために使用される。ある局面において、LAN(Local Area Network)ポートや、Wi-Fi(登録商標)(Wireless Fidelity)の送受信装置等が、通信インターフェース707として使用されてもよい。また、ある局面において、情報処理装置102は、PC(Personal Computer)またはワークステーションであってもよい。本実施の形態に従う情報処理装置102の処理は、図6に示すハードウェア上で、プログラムとして実行されてもよい。 A communication interface 707 is used to communicate with an external communication device. In one aspect, a LAN (Local Area Network) port, a Wi-Fi (registered trademark) (Wireless Fidelity) transceiver, or the like may be used as the communication interface 707 . In one aspect, the information processing apparatus 102 may be a PC (Personal Computer) or a workstation. The processing of information processing apparatus 102 according to the present embodiment may be executed as a program on the hardware shown in FIG.

図7は、情報処理装置102を実現する機能の一構成例を示す図である。ある局面において、図7に示す機能の一部は、図6に示すハードウェア上で、プログラムが実行されることにより実現され得る。図7を参照して、情報処理装置102は、信号入力部801と、評価値関数部802と、動作パターンテーブル803と、動作決定部804と、指令生成部805と、動作結果判定部806と、評価値関数学習部807とを含む。 FIG. 7 is a diagram showing a configuration example of functions realizing the information processing apparatus 102. As shown in FIG. In one aspect, part of the functions shown in FIG. 7 can be realized by executing a program on the hardware shown in FIG. 7, information processing apparatus 102 includes signal input unit 801, evaluation value function unit 802, motion pattern table 803, motion determination unit 804, command generation unit 805, and motion result determination unit 806. , and an evaluation value function learning unit 807 .

信号入力部801は、撮像装置114,115が撮影することによって取得された画像と、ワーク取り出し作業装置101から角度調整機構111の電動アクチュエータ11のモータトルク値とを取得する。ある局面において、信号入力部801は、さらに、位置調整装置の電動アクチュエータ108のモータトルク値を取得してもよい。 The signal input unit 801 acquires the images captured by the imaging devices 114 and 115 and the motor torque value of the electric actuator 11 of the angle adjustment mechanism 111 from the work picking device 101 . In one aspect, the signal input unit 801 may also acquire the motor torque value of the electric actuator 108 of the position adjustment device.

評価値関数部802は、後述する評価値関数Fを用いて信号入力部に入力された画像から検出されたワークの個数およびモータトルク値等に基づいて各動作パターンに対応するそれぞれの評価値を計算する。 The evaluation value function unit 802 calculates each evaluation value corresponding to each operation pattern based on the number of workpieces detected from the image input to the signal input unit and the motor torque value using the evaluation value function F, which will be described later. calculate.

動作パターンテーブル803は、位置調整装置および角度調整機構111の各電動アクチュエータの移動量および移動速度、加速度、指令トルク値の内の少なくとも1つが対応付けられた複数の動作パターンを保管する。動作パターンテーブル803は、角度調整機構111に関して、個別のアクチュエータの指令値ではなく、角度調整機構111の角度等を動作パターンに含めてもよい。 The operation pattern table 803 stores a plurality of operation patterns in which at least one of the movement amount and movement speed, acceleration, and command torque value of each electric actuator of the position adjustment device and angle adjustment mechanism 111 is associated. Regarding the angle adjustment mechanism 111, the operation pattern table 803 may include the angle of the angle adjustment mechanism 111 and the like in the operation pattern, instead of the command values of the individual actuators.

動作決定部804は、動作パターンテーブル803の動作パターンの中から、評価値が最大となる動作パターンをワーク取り出し作業装置101の次の動作として選択する。指令生成部805は、動作決定部804により選択された動作パターンに基づいて、ワーク取り出し作業装置101の各電動アクチュエータへの指令値を生成し、制御装置103を介して、当該指令値をワーク取り出し作業装置101に送信する。 The motion determining unit 804 selects the motion pattern with the maximum evaluation value from the motion patterns in the motion pattern table 803 as the next motion of the workpiece picking device 101 . The command generation unit 805 generates a command value for each electric actuator of the work picking device 101 based on the motion pattern selected by the motion determining unit 804, and transmits the command value to the work picking device 103 via the control device 103. It is transmitted to the work device 101 .

動作結果判定部806は、前回選択された動作パターンの実行前後における、把持機構112が把持しているワーク個数が1のときは報酬1を与え、2つ以上のワークを把持している場合は0を与える。さらに、動作パターンの実行回数が上限回数を超過した場合は-1を与える。 The motion result determination unit 806 gives a reward of 1 when the number of workpieces gripped by the gripping mechanism 112 before and after execution of the previously selected motion pattern is 1, and reward 1 when the gripping mechanism 112 grips two or more workpieces. give 0. Furthermore, -1 is given when the number of executions of the operation pattern exceeds the upper limit number of times.

評価値関数学習部807は、動作結果判定部が出力した報酬を教師信号として、動作パターンを選択した時の評価値と、教師信号との差に基づいて評価値関数Fを更新する。ある局面において、評価値関数学習部807は、予め定められた回数だけ評価値関数Fを更新するごとに、評価値関数部802で使用する評価値関数Fを最新状態に更新してもよい。 The evaluation value function learning unit 807 updates the evaluation value function F based on the difference between the evaluation value when the motion pattern is selected and the teacher signal, using the reward output by the motion result determination unit as a teacher signal. In one aspect, the evaluation value function learning unit 807 may update the evaluation value function F used in the evaluation value function unit 802 to the latest state each time the evaluation value function F is updated a predetermined number of times.

図8は、評価値関数部802の動作の一例を示す図である。評価値関数部802は、信号入力部801から、各撮像装置114,115が撮影することによって取得された画像およびモータトルク値等を取得して評価値関数Fに入力する。なお、情報処理装置102は、画像から検出したワークの個数を評価値関数Fに入力してもよい。評価値は動作パターンごとに算出される。図8に示す例では、評価値関数部802は、n個の各動作パターンa~aに対してそれぞれ評価値を算出する。ある局面において、評価値関数部802は、画像(もしくは、画像に写るワークの個数)やモータトルク値等を評価値関数Fの入力として受け付け、各動作パターンのそれぞれの評価値を計算するプログラムであってもよい。 FIG. 8 is a diagram showing an example of the operation of the evaluation value function unit 802. As shown in FIG. The evaluation value function unit 802 acquires the image and the motor torque value obtained by the imaging devices 114 and 115 from the signal input unit 801 and inputs them to the evaluation value function F. FIG. The information processing apparatus 102 may input the number of workpieces detected from the image to the evaluation value function F. FIG. An evaluation value is calculated for each operation pattern. In the example shown in FIG. 8, the evaluation value function unit 802 calculates evaluation values for each of the n operation patterns a 1 to a n . In one aspect, the evaluation value function unit 802 is a program that receives an image (or the number of workpieces shown in the image), a motor torque value, etc. as an input to the evaluation value function F, and calculates an evaluation value for each operation pattern. There may be.

評価値関数Fが出力するn個の評価値は、次に実行すべき動作パターンを選択するための指標であり、対応する評価値が最大の値を示す動作パターンが、次に実行すべき最適な動作であること示す。 The n evaluation values output by the evaluation value function F are indices for selecting the operation pattern to be executed next. indicates that it is a valid action.

そのため、動作決定部804は、n個の動作パターンの中から、最大の評価値に対応する動作パターンを次の動作として選択する。図9に示す例では、「評価値=0.614」が最大のため、動作決定部804は、「評価値=0.614」に対応する動作パターンan-3を選択する。 Therefore, the motion determining unit 804 selects the motion pattern corresponding to the maximum evaluation value from among the n motion patterns as the next motion. In the example shown in FIG. 9, since “evaluation value=0.614” is the maximum, the motion determining unit 804 selects motion pattern a n-3 corresponding to “evaluation value=0.614”.

動作決定部804は、選択した動作パターンan-3を指令生成部805に転送する。指令生成部805は、動作パターンテーブル803を参照し、an-3に対応する指令値を生成して制御装置103に出力する。 The motion determining unit 804 transfers the selected motion pattern a n-3 to the command generating unit 805 . The command generation unit 805 refers to the operation pattern table 803 to generate a command value corresponding to an -3 and outputs it to the control device 103 .

図9は、動作パターンテーブル803の一例を示す図である。動作パターンテーブル803は、動作パターンごとに、位置調整装置の電動アクチュエータ108の移動量、移動速度、加速度および指令トルク値と、角度調整機構111の根元の回転機構の回転角度、回転速度、加速度、減速度および指令トルク値と、角度調整機構111の折れ角変更量、旋回角変更量、回転速度、加速度、減速度および指令トルク値とを格納する。 FIG. 9 is a diagram showing an example of the operation pattern table 803. As shown in FIG. The operation pattern table 803 contains, for each operation pattern, the movement amount, movement speed, acceleration, and command torque value of the electric actuator 108 of the position adjustment device, and the rotation angle, rotation speed, acceleration, and rotation angle of the base rotation mechanism of the angle adjustment mechanism 111 . It stores the deceleration and command torque value, and the bending angle change amount, turning angle change amount, rotational speed, acceleration, deceleration and command torque value of the angle adjusting mechanism 111 .

ある局面において、動作パターンテーブル803は、角度調整機構111の個別の電動アクチュエータの移動量、移動速度、加速度、および指令トルク値を格納してもよい。また、ある局面において、動作パターンテーブル803は、2次記憶装置703に記憶され、1次記憶装置702に読み出されることにより、CPU701によって参照されてもよい。 In one aspect, the operation pattern table 803 may store the movement amount, movement speed, acceleration, and command torque value of the individual electric actuators of the angle adjustment mechanism 111 . In a certain aspect, operation pattern table 803 may be stored in secondary storage device 703 and read out to primary storage device 702 to be referred to by CPU 701 .

<D.ワーク取り出し作業における情報処理装置102の内部処理>
図10は、ワーク取り出し作業システム100の処理の一例を示すフローチャートである。ある局面において、図10の処理を実行するためのプログラムは2次記憶装置703に記憶され、1次記憶装置702に読み出されることにより、CPU701によって実行されてもよい。これ以降、情報処理装置102が図10の各ステップを実行するものとして当該処理を説明する。
<D. Internal Processing of Information Processing Apparatus 102 in Work Picking Work>
FIG. 10 is a flow chart showing an example of processing of the work picking work system 100. As shown in FIG. In one aspect, a program for executing the processing of FIG. Hereinafter, the processing will be described assuming that the information processing apparatus 102 executes each step in FIG.

ステップS1005において、情報処理装置102は、撮像装置114がワーク入れ113を上から撮影することによって得られた画像1に基づいて、ワーク入れ113の中のワークの位置を検出する。ある局面において、情報処理装置102は、画像1からワーク入れ113の中のワークの位置を検出するために、既存の画像認識技術を用いてもよい。 In step S1005, the information processing device 102 detects the position of the work in the work container 113 based on the image 1 obtained by the imaging device 114 capturing the work container 113 from above. In one aspect, the information processing device 102 may use existing image recognition technology to detect the position of the work in the work container 113 from the image 1 .

ステップS1010において、情報処理装置102は、画像1からワークを検出したか否かを判定する。情報処理装置102は、画像1からワークを検出した場合(ステップS1010にてYES)、制御をステップS1015に移す。そうでない場合(ステップS1010にてNO)、情報処理装置102は、ワーク入れ113内から全てのワークの取り出し処理が完了したと判定し、処理を終了する。 In step S<b>1010 , the information processing apparatus 102 determines whether or not a workpiece has been detected from image 1 . When information processing apparatus 102 detects a workpiece from image 1 (YES in step S1010), information processing apparatus 102 shifts control to step S1015. Otherwise (NO in step S1010), the information processing apparatus 102 determines that the process of removing all the works from the work container 113 has been completed, and ends the process.

ステップS1015において、情報処理装置102は、位置調整装置により、把持機構112をワークの取り出し作業のための予め定められた位置に移動させ、ワーク入れ113からワークを取り出す。 In step S<b>1015 , the information processing apparatus 102 uses the position adjustment device to move the gripping mechanism 112 to a predetermined position for picking up the work, and picks up the work from the work container 113 .

ステップS1020において、情報処理装置102は、撮像装置115が把持機構112の先端を側面から撮影することによって取得された画像2を基に、把持機構112が把持しているワークの個数を算出する。ある局面において、情報処理装置102は、画像2から把持機構112が把持しているワークの個数を算出するために、既存の画像認識技術を用いてもよい。 In step S1020, the information processing apparatus 102 calculates the number of works gripped by the gripping mechanism 112 based on the image 2 acquired by the imaging device 115 capturing the tip of the gripping mechanism 112 from the side. In one aspect, the information processing apparatus 102 may use existing image recognition technology to calculate the number of workpieces gripped by the gripping mechanism 112 from the image 2 .

ステップS1025において、情報処理装置102は、画像2の解析結果に基づいて、把持機構112がワークを1個だけ把持しているか否かを判定する。情報処理装置102は、把持機構112がワークを1個だけ把持していると判定した場合(ステップS1025にてYES)、制御をステップS1030に移す。そうでない場合(ステップS1025にてNO)、制御をステップS1035に移す。 In step S<b>1025 , the information processing apparatus 102 determines whether or not the gripping mechanism 112 grips only one workpiece based on the analysis result of Image 2 . When information processing apparatus 102 determines that gripping mechanism 112 grips only one workpiece (YES in step S1025), control proceeds to step S1030. Otherwise (NO in step S1025), control proceeds to step S1035.

ステップS1030において、情報処理装置102は、把持機構112が把持するワークを予め定められた位置に置き、処理を終了する。 In step S1030, the information processing apparatus 102 places the workpiece gripped by the gripping mechanism 112 at a predetermined position, and ends the process.

ステップS1035において、情報処理装置102は、画像2の解析結果に基づいて、把持機構112がワークを1個も把持していないか否かを判定する。情報処理装置102は、把持機構112がワークを1個も把持していないと判定した場合(ステップS1035にてYES)、処理を終了する。そうでない場合(ステップS1035にてNO)、情報処理装置102は制御をステップS1040に移す。 In step S<b>1035 , the information processing apparatus 102 determines whether or not the gripping mechanism 112 grips even one workpiece based on the analysis result of the image 2 . When the information processing apparatus 102 determines that the gripping mechanism 112 has not gripped even one workpiece (YES in step S1035), the process ends. Otherwise (NO in step S1035), information processing apparatus 102 shifts control to step S1040.

ステップS1040において、情報処理装置102は、撮像装置114,115が撮影した各画像と、各電動アクチュエータのモータトルク値とを取得する。ある局面において、情報処理装置102は、各画像および各電動アクチュエータのモータトルク値に加えて、各種センサー値を各種センサーから取得してもよい。 In step S1040, the information processing device 102 acquires each image captured by the imaging devices 114 and 115 and the motor torque value of each electric actuator. In one aspect, the information processing apparatus 102 may acquire various sensor values from various sensors in addition to the motor torque values of each image and each electric actuator.

ステップS1045において、情報処理装置102は、取得した各画像(もしくは、画像に写るワークの個数)および各電動アクチュエータのモータトルク値を評価値関数部802の入力として、動作パターンごとの評価値を算出する。ステップS1150において、情報処理装置102は、動作パターンごとに算出された評価値の中で最大の評価値を選択し、当該最大の評価値に対応する動作パターンaを次の動作として選択する。 In step S1045, the information processing apparatus 102 uses the obtained images (or the number of workpieces shown in the images) and the motor torque values of the electric actuators as inputs to the evaluation value function unit 802 to calculate an evaluation value for each operation pattern. do. In step S1150, the information processing apparatus 102 selects the maximum evaluation value among the evaluation values calculated for each motion pattern, and selects the motion pattern ak corresponding to the maximum evaluation value as the next motion.

ステップS1155において、情報処理装置102は、指令生成部805により、選択した動作パターンaを実行するための指令をワーク取り出し作業装置101に送信する。ワーク取り出し作業装置101は、受信した指令に基づいて、角度調整機構111の電動アクチュエータ11を駆動させることにより、把持機構112に絡まり解き動作をさせる。ある局面において、ワーク取り出し作業装置101は、角度調整機構111の電動アクチュエータ11および位置調整装置の電動アクチュエータ108を駆動させることにより、把持機構112に絡まり解き動作をさせてもよい。 In step S1155, the information processing device 102 causes the command generation unit 805 to transmit a command for executing the selected operation pattern ak to the work picking device 101. FIG. The work picking device 101 drives the electric actuator 11 of the angle adjusting mechanism 111 based on the received command, thereby causing the gripping mechanism 112 to perform an untangling operation. In one aspect, the workpiece removal work device 101 may cause the gripping mechanism 112 to perform an untangling operation by driving the electric actuator 11 of the angle adjustment mechanism 111 and the electric actuator 108 of the position adjustment device.

ステップS1160において、情報処理装置102は、再度、撮像装置115により把持機構112の先端を側面から撮影することによって取得された画像2を基に、把持機構112が把持しているワークの個数を算出する。 In step S1160, the information processing apparatus 102 again calculates the number of workpieces gripped by the gripping mechanism 112 based on the image 2 obtained by photographing the tip of the gripping mechanism 112 from the side using the imaging device 115. do.

ステップS1165において、情報処理装置102は、ステップS1160にて撮影された画像2の解析結果に基づいて、把持機構112がワークを1個だけ把持しているか否かを判定する。情報処理装置102は、把持機構112がワークを1個だけ把持していると判定した場合(ステップS1065にてYES)、絡まり解き作業は完了したため、制御をステップS1030に移す。そうでない場合(ステップS1065にてNO)、絡まり解き作業は未完了のため、情報処理装置102は制御をステップS1035に移す。 In step S1165, the information processing apparatus 102 determines whether or not the gripping mechanism 112 grips only one workpiece, based on the analysis result of image 2 captured in step S1160. If the information processing apparatus 102 determines that the gripping mechanism 112 grips only one workpiece (YES in step S1065), the untangling work is completed, and the control proceeds to step S1030. Otherwise (NO in step S1065), the untangling work has not been completed, so the information processing apparatus 102 shifts the control to step S1035.

ステップS1040~S1065において、情報処理装置102は、把持機構112が1個のワークを把持している状態になるまで、評価値に基づいて選択された動作パターンをワーク取り出し作業装置101に実行させ続けることで、ワークの絡まりを解くことができる。 In steps S1040 to S1065, the information processing device 102 continues to cause the workpiece picking device 101 to execute the operation pattern selected based on the evaluation value until the gripping mechanism 112 grips one workpiece. By doing so, it is possible to untangle the workpiece.

図11は、図10の処理の動作イメージの一例を示す図である。状態Xは、把持機構112がワーク入れ113からワークを取り出した直後を表している(ステップS1015に対応)。把持機構112は、絡まった状態の3個のワーク(ワークA,B,C)を把持している。 FIG. 11 is a diagram showing an example of an operation image of the processing of FIG. State X represents the state immediately after the gripping mechanism 112 takes out the work from the work container 113 (corresponding to step S1015). The gripping mechanism 112 grips three entangled works (works A, B, and C).

情報処理装置102は、状態Xから、図10のステップS1035~ステップS1065の処理を繰り返すことにより、ワーク取り出し作業装置101に絡まり解き作業をさせる。情報処理装置102は、状態Xのときの各画像(もしくは、画像に写るワークの個数)および各電動アクチュエータのモータトルク値を取得する(ステップS1040に対応)。次に、情報処理装置102は、状態Xのときの各画像(もしくは、画像に写るワークの個数)および各電動アクチュエータのモータトルク値を評価値関数Fの入力として、各動作パターンのそれぞれの評価値を算出する(ステップS1045に対応)。そして、情報処理装置102は、最も評価値の高い動作パターンan-3を選択し(ステップS1050に対応)、動作パターンan-3に対応する指令をワーク取り出し作業装置101に送信する(ステップS1055に対応)。 From the state X, the information processing device 102 repeats the processing of steps S1035 to S1065 in FIG. Information processing apparatus 102 acquires each image (or the number of workpieces in the image) in state X and the motor torque value of each electric actuator (corresponding to step S1040). Next, the information processing device 102 uses each image (or the number of workpieces shown in the image) in the state X and the motor torque value of each electric actuator as inputs to the evaluation value function F, and evaluates each operation pattern. A value is calculated (corresponding to step S1045). Then, the information processing device 102 selects the motion pattern a n-3 with the highest evaluation value (corresponding to step S1050), and transmits a command corresponding to the motion pattern a n-3 to the workpiece picking device 101 (step S1050). corresponding to S1055).

状態Yは、ワーク取り出し作業装置101が動作パターンan-3を実行した直後の様子を示す。情報処理装置102は、把持機構112がワークを1個把持しているか否かを判定する(ステップS1060およびS1065に対応)。状態Yにおいて、把持機構112が把持するワークの数は3個のままであり、絡まり解き作業は完了していない。よって、情報処理装置102は、再度ステップS1035からステップS1065までの処理を繰り返す。 State Y shows the state immediately after the work picking device 101 executes the operation pattern a n-3 . The information processing apparatus 102 determines whether or not the gripping mechanism 112 is gripping one workpiece (corresponding to steps S1060 and S1065). In the state Y, the number of workpieces gripped by the gripping mechanism 112 is still three, and the entanglement work has not been completed. Therefore, the information processing apparatus 102 repeats the processing from step S1035 to step S1065 again.

状態Zは、ワーク取り出し作業装置101が状態Yのときに動作パターンan-1を実行した直後の様子を示す。状態Zにおいて、ワークB,Cは落下しており、把持機構112が把持するワークの絡まり解き作業は完了していることがわかる。情報処理装置102は、撮像装置115が把持機構112の先端を側面から撮影することによって取得された画像2から、ワークの絡まり解き作業の完了を検出する。ワークの絡まり解き作業が完了した後は、情報処理装置102は、ワーク取り出し作業装置101に、ワークを予め定められた位置に運ばせる。その後、情報処理装置102は、ワーク取り出し作業装置101に、次のワークの取り出し作業を行うための指令を送信してもよい。 State Z shows the state immediately after execution of operation pattern a n-1 when work picking device 101 is in state Y. FIG. In the state Z, the works B and C have fallen, and it can be seen that the entanglement work of the works gripped by the gripping mechanism 112 has been completed. The information processing device 102 detects the completion of the untangling work from the image 2 acquired by the imaging device 115 capturing the tip of the gripping mechanism 112 from the side. After the untangling work of the work is completed, the information processing device 102 causes the work unloading device 101 to carry the work to a predetermined position. After that, the information processing device 102 may send a command to the work picking device 101 to perform the work of picking up the next work.

<E.ワーク取り出し作業の学習処理>
図10および図11で説明した例において、情報処理装置102は、撮像装置114,115により撮影することによって取得された画像1,2の撮影した画像(もしくは、画像に写るワークの個数)、角度調整機構111および位置調整装置の現在のモータトルク値等に基づいて各動作パターンのそれぞれの評価値を計算し、評価値が最大になる動作パターンを順次実行することで動作を成功させる。そのため、図8の評価値関数Fは、画像(もしくは、画像に写るワークの個数)およびモータトルク値等に基づいて次に実行すべき最適な動作パターンに対して最大の評価値を出力するよう最適化されている必要がある。
<E. Learning Processing of Work Picking Work>
In the example described with reference to FIGS. 10 and 11, the information processing apparatus 102 captures images 1 and 2 obtained by capturing images with the imaging devices 114 and 115 (or the number of workpieces captured in the images), angle An evaluation value for each operation pattern is calculated based on the current motor torque values of the adjustment mechanism 111 and the position adjustment device, and the operation pattern with the maximum evaluation value is sequentially executed to make the operation successful. Therefore, the evaluation value function F in FIG. 8 is designed to output the maximum evaluation value for the optimum operation pattern to be executed next based on the image (or the number of workpieces shown in the image) and the motor torque value. should be optimized.

しかし、ワーク取り出し処理の対象となるワークの初期状態(ワーク同士の絡まり方等)は、把持機構112に把持されるごとに変化する可能性ある。また、ワーク取り出し作業装置101が動作パターンを実行することで、把持機構112により把持されたワークの姿勢や絡まり方も変化する可能性がある。これらのあらゆる状態を想定したルールベースの動作プログラムの構築は困難である。よって、本実施の形態に従うワーク取り出し作業システム100は、強化学習により、繰り返し動作を試行する過程で評価値関数Fを最適化する。 However, there is a possibility that the initial state of the workpiece to be picked up (such as how the workpieces are entangled) changes each time the workpiece is gripped by the gripping mechanism 112 . In addition, there is a possibility that the posture and entanglement of the workpiece gripped by the gripping mechanism 112 may change as the workpiece picking device 101 executes the operation pattern. It is difficult to build a rule-based operating program that assumes all these states. Therefore, workpiece picking work system 100 according to the present embodiment optimizes evaluation value function F in the process of trying repeated motions by reinforcement learning.

図12は、ワーク取り出し作業システム100の絡まり解き作業の学習処理の一例を示すフローチャートである。ある局面において、図12の処理を実行するためのプログラムは、2次記憶装置703に記憶され、1次記憶装置702に読み出されることにより、CPU701によって実行されてもよい。これ以降、情報処理装置102が図12の各ステップを実行するものとして当該学習処理を説明する。 FIG. 12 is a flow chart showing an example of learning processing of the untangling work of the work picking work system 100 . In one aspect, a program for executing the process of FIG. 12 may be stored in secondary storage device 703 and read out to primary storage device 702 to be executed by CPU 701 . Hereinafter, the learning process will be described assuming that the information processing apparatus 102 executes each step in FIG. 12 .

ステップS1210において、情報処理装置102は、変数jに1を代入する。ステップS1220において、情報処理装置102は、変数jの値が定数J1以下であるか否かを判定する。情報処理装置102は、変数jの値が定数J1以下であると判定すると(ステップS1220にてYES)、ステップS1230に制御を移す。そうでない場合(ステップS1220にてNO)、情報処理装置102は、ステップS1250に制御を移す。評価値関数Fが未学習の初期状態において、情報処理装置102は、変数jが定数J1に達するまで、絡まり解き作業初期学習を繰り返し実行する。 In step S1210, the information processing apparatus 102 substitutes 1 for the variable j. In step S1220, the information processing apparatus 102 determines whether or not the value of the variable j is equal to or less than the constant J1. When information processing apparatus 102 determines that the value of variable j is equal to or less than constant J1 (YES in step S1220), the control proceeds to step S1230. Otherwise (NO in step S1220), information processing apparatus 102 shifts control to step S1250. In the initial state where the evaluation value function F is unlearned, the information processing device 102 repeatedly performs the initial learning of the untangling work until the variable j reaches the constant J1.

ステップS1230において、情報処理装置102は、絡まり解き作業の初期学習処理を実行する。絡まり解き作業の初期学習処理については後述する。ステップS1240において、情報処理装置102は、変数jの値をインクリメントする。以降は、情報処理装置102は、上限回数として予め定められた回数J1まで、絡まり解き作業の初期学習処理を繰り返し実行する。 In step S1230, the information processing apparatus 102 executes an initial learning process for untangling work. The initial learning process for the untangling work will be described later. In step S1240, the information processing device 102 increments the value of the variable j. After that, the information processing apparatus 102 repeatedly executes the initial learning process of the entanglement work up to the number of times J1 predetermined as the upper limit number of times.

ステップS1250において、情報処理装置102は、変数jの値が定数J2以下であるか否かを判定する。情報処理装置102は、変数jの値が定数J2以下であると判定すると(ステップS1250にてYES)、ステップS1260に制御を移す。そうでない場合(ステップS1250にてNO)、情報処理装置102は、学習処理を終了する。 In step S1250, the information processing apparatus 102 determines whether or not the value of the variable j is equal to or less than the constant J2. When information processing apparatus 102 determines that the value of variable j is equal to or less than constant J2 (YES in step S1250), the control proceeds to step S1260. Otherwise (NO in step S1250), information processing apparatus 102 terminates the learning process.

ステップS1260において、情報処理装置102は、絡まり解き作業の学習処理を実行する。絡まり解き作業の学習処理については後述する。ステップS1270において、情報処理装置102は、変数jの値をインクリメントする。以降は、情報処理装置102は、変数jが上限値として予め定められた定数J2より大きくなるまで、絡まり解き作業の学習処理を繰り返し実行する。 In step S1260, the information processing apparatus 102 executes learning processing for the untangling work. The learning process of the entanglement work will be described later. In step S1270, the information processing apparatus 102 increments the value of variable j. After that, the information processing apparatus 102 repeatedly executes the learning process of the entanglement untangling work until the variable j becomes larger than the constant J2 predetermined as the upper limit.

図13は、絡まり解き作業の初期学習処理(図12のステップS1230に対応)の一例を示すフローチャートである。ある局面において、図13の処理を実行するためのプログラムは、2次記憶装置703に記憶され、1次記憶装置702に読み出されることにより、CPU701によって実行されてもよい。これ以降、情報処理装置102が図13の各ステップを実行するものとして当該初期学習処理を説明する。 FIG. 13 is a flow chart showing an example of initial learning processing (corresponding to step S1230 in FIG. 12) for untangling work. In one aspect, a program for executing the process of FIG. 13 may be stored in secondary storage device 703 and read out to primary storage device 702 to be executed by CPU 701 . Hereinafter, the initial learning process will be described assuming that the information processing apparatus 102 executes each step in FIG.

ステップS1305において、情報処理装置102は、位置調整装置により、把持機構112を予め定められた位置(ワーク取り出し開始位置)に移動させるための指令をワーク取り出し作業装置101に送信する。 In step S1305, the information processing device 102 transmits a command to the work picking device 101 to move the gripping mechanism 112 to a predetermined position (work picking start position) by using the position adjusting device.

ステップS1310において、情報処理装置102は、変数iに1を代入する。ステップS1315において、情報処理装置102は、ワーク取り出し作業装置101の撮像装置114,115の撮影した画像(もしくは、画像に写るワークの個数)と、各電動アクチュエータのモータトルク値とを状態情報S1として取得する。なお、状態情報S1は、さらに、情報処理装置102が各種センサーから取得した各種センサー値を含んでいてもよい。 In step S1310, the information processing apparatus 102 substitutes 1 for the variable i. In step S1315, the information processing device 102 uses the image (or the number of workpieces captured in the image) captured by the imaging devices 114 and 115 of the workpiece picking device 101 and the motor torque value of each electric actuator as state information S1. get. The state information S1 may further include various sensor values obtained by the information processing device 102 from various sensors.

ステップS1320において、情報処理装置102は、動作決定部804により、乱数を用いて次に実行する動作パターンaを選択する。具体的には、情報処理装置102は、1~nの間の乱数に基づいて動作パターンのインデックス番号kを決定する。 In step S1320, the information processing apparatus 102 causes the motion determining unit 804 to select a motion pattern ak to be executed next using a random number. Specifically, the information processing device 102 determines the index number k of the movement pattern based on a random number between 1 and n.

ステップS1325において、情報処理装置102は、状態情報S1を評価値関数学習部807に保管した後、ワーク取り出し作業装置101に動作パターンaを実行させるための指令を送信する。 In step S1325, the information processing apparatus 102 stores the state information S1 in the evaluation value function learning unit 807, and then transmits an instruction to the workpiece picking device 101 to execute the operation pattern ak .

ステップS1330において、情報処理装置102は、ワーク取り出し作業装置101が動作パターンaを実行した後に、ワーク取り出し作業装置101の撮像装置114,115の撮影した画像(もしくは、画像に写るワークの個数)と、各電動アクチュエータのモータトルク値とを状態S2として取得する。なお、状態S2は、さらに、情報処理装置102が各種センサーから取得した各種センサー値を含んでいてもよい。 In step S1330, the information processing device 102 captures images captured by the imaging devices 114 and 115 of the workpiece picking device 101 after the workpiece picking device 101 executes the operation pattern ak (or the number of workpieces captured in the image). , and the motor torque value of each electric actuator are acquired as the state S2. The state S2 may further include various sensor values obtained by the information processing device 102 from various sensors.

ステップS1335において、情報処理装置102は、撮像装置115が把持機構112の先端を側面から撮影することによって取得された画像2を基に、把持機構112が把持しているワークの個数を算出する。ある局面において、情報処理装置102は、画像2から把持機構112が把持しているワークの個数を算出するために、既存の画像認識技術を用いてもよい。 In step S1335, the information processing apparatus 102 calculates the number of works gripped by the gripping mechanism 112 based on the image 2 acquired by the imaging device 115 capturing the tip of the gripping mechanism 112 from the side. In one aspect, the information processing apparatus 102 may use existing image recognition technology to calculate the number of workpieces gripped by the gripping mechanism 112 from the image 2 .

ステップS1340において、情報処理装置102は、画像2の解析結果に基づいて、把持機構112がワークを1個だけ把持しているか否かを判定する。情報処理装置102は、把持機構112がワークを1個だけ把持していると判定した場合(ステップS1340にてYES)、制御をステップS1345に移す。そうでない場合(ステップS1340にてNO)、情報処理装置102は制御をステップS1360に移す。 In step S<b>1340 , the information processing apparatus 102 determines whether or not the gripping mechanism 112 grips only one workpiece based on the analysis result of Image 2 . When information processing apparatus 102 determines that gripping mechanism 112 grips only one workpiece (YES in step S1340), control proceeds to step S1345. Otherwise (NO in step S1340), information processing apparatus 102 shifts control to step S1360.

ステップS1345において、情報処理装置102は、終了判定をTrue(完了)にし、「動作パターンa」に対する報酬Rを1にする。なお、本実施の例では、報酬Rは、成功のときは1、失敗のときは-1、それ以外のときは0とするが、報酬Rの例はこれに限られない。成功時や失敗時のときの報酬ごとに差があればよい。 In step S1345, the information processing apparatus 102 sets the end determination to True (completion) and sets the reward R to 1 for the “movement pattern a k ”. In the example of this embodiment, the reward R is 1 for success, -1 for failure, and 0 otherwise, but examples of the reward R are not limited to this. It is sufficient if there is a difference in rewards for success and failure.

ステップS1350において、情報処理装置102は、評価値関数学習部807に、実行した「動作パターンa」、「状態情報S1,S2」、「報酬R(R=1)」および「終了判定True(完了)」を保存する。ステップS1355において、情報処理装置102は、評価値関数Fの更新処理を実行する。 In step S<b>1350 , the information processing apparatus 102 instructs the evaluation value function learning unit 807 to perform “operation pattern a k ”, “state information S1, S2”, “reward R (R=1)”, and “end determination True ( Done)”. In step S1355, the information processing apparatus 102 executes update processing of the evaluation value function F. FIG.

ステップS1360において、情報処理装置102は、画像2の解析結果に基づいて、把持機構112がワークを1個も把持していないか否かを判定する。情報処理装置102は、把持機構112がワークを1個も把持していないと判定した場合(ステップS1360にてYES)、報酬Rを生成せず処理を終了する。そうでない場合(ステップS1360にてNO)、情報処理装置102は制御をステップS1365に移す。 In step S<b>1360 , the information processing apparatus 102 determines whether or not the gripping mechanism 112 grips even one workpiece based on the analysis result of the image 2 . When information processing apparatus 102 determines that gripping mechanism 112 has not gripped even one workpiece (YES in step S1360), it does not generate reward R and ends the process. Otherwise (NO in step S1360), information processing apparatus 102 shifts control to step S1365.

ステップS1365において、情報処理装置102は、変数iの値が定数N1より大きいか否かを判定する。定数N1は、絡まり解き作業中に繰り返してよい動作パターンの実行回数の上限値である。情報処理装置102は、変数iの値が定数N1より大きいと判定した場合(ステップS1365にてYES)、動作パターンの実行回数が上限に達したと判断し、制御をステップS1370に移す。そうでない場合(ステップS1365にてNO)、情報処理装置102は制御をステップS1375に移す。 In step S1365, the information processing device 102 determines whether the value of the variable i is greater than the constant N1. The constant N1 is the upper limit of the number of times the motion pattern can be repeated during the untangling work. When information processing apparatus 102 determines that the value of variable i is greater than constant N1 (YES in step S1365), information processing apparatus 102 determines that the number of executions of the motion pattern has reached the upper limit, and moves control to step S1370. Otherwise (NO in step S1365), the information processing device 102 shifts the control to step S1375.

ステップS1370において、情報処理装置102は、終了判定をTrueにし、動作パターンaに対する報酬Rを-1にする。ステップS1350以降の処理は前述した通りになる。ステップS1375において、情報処理装置102は、変数iの値をインクリメントする。ステップS1380において、情報処理装置102は、終了判定をFalseにし、実行した「動作パターンa」に対する報酬Rを0にする。 In step S1370, the information processing apparatus 102 sets the end determination to True, and sets the reward R for the motion pattern ak to -1. The processing after step S1350 is as described above. In step S1375, the information processing apparatus 102 increments the value of the variable i. In step S1380, the information processing apparatus 102 sets the end determination to False, and sets the reward R for the executed "movement pattern a k " to zero.

ステップS1385において、情報処理装置102は、評価値関数学習部807に、実行した「動作パターンa」、「状態情報S1,S2」、「報酬R(R=0)」および「終了判定False(未完了)」を保存する。ステップS1390において、情報処理装置102は、評価値関数Fの更新処理を実行する。 In step S<b>1385 , the information processing apparatus 102 instructs the evaluation value function learning unit 807 to perform “operation pattern a k ”, “state information S1, S2”, “reward R (R=0)”, and “termination determination False ( incomplete)”. In step S1390, the information processing apparatus 102 executes update processing of the evaluation value function F. FIG.

図14は、絡まり解き作業の学習処理(図12のステップS1260に対応)の一例を示すフローチャートである。ある局面において、図14の処理を実行するためのプログラムは、2次記憶装置703に記憶され、1次記憶装置702に読み出されることにより、CPU701によって実行されてもよい。これ以降、情報処理装置102が図14の各ステップを実行するものとして当該学習処理を説明する。また、図14において、前述の処理と同一の処理には、同一の符号を付してある。したがって、同一の処理の説明は繰り返さない。 FIG. 14 is a flow chart showing an example of learning processing for untangling work (corresponding to step S1260 in FIG. 12). In one aspect, a program for executing the process of FIG. 14 may be stored in secondary storage device 703 and read out to primary storage device 702 to be executed by CPU 701 . Hereinafter, the learning process will be described assuming that the information processing apparatus 102 executes each step in FIG. 14 . Further, in FIG. 14, the same reference numerals are assigned to the same processes as those described above. Therefore, description of the same processing will not be repeated.

ステップS1410において、情報処理装置102は、評価値関数部802により、状態情報S1に基づいて、各動作パターンのそれぞれの評価値を算出する。ステップS1420において、情報処理装置102は、動作パターンテーブル803を参照して、最も評価値が高い動作パターンを選択する。 In step S1410, the information processing apparatus 102 uses the evaluation value function unit 802 to calculate an evaluation value for each operation pattern based on the state information S1. In step S1420, the information processing apparatus 102 refers to the motion pattern table 803 and selects the motion pattern with the highest evaluation value.

図13の絡まり解きの初期学習処理においては、学習情報が十分にないため、情報処理装置102は、ステップS1320において、乱数で次の動作パターンを選択している。これに対して、図14の絡まり解きの学習処理においては、一定量以上の学習情報が評価値関数学習部807に蓄積されているため、情報処理装置102は、ステップS1410において、評価値関数Fに基づいて各動作パターンの評価値を算出する。情報処理装置102は、図14の処理においても、随時、評価値関数Fを更新することで絡まり解き作業の精度を向上させる。 In the initial learning process for untangling in FIG. 13, since there is not enough learning information, the information processing apparatus 102 selects the next movement pattern with a random number in step S1320. On the other hand, in the tangling-untangling learning process of FIG. 14, since a certain amount or more of learning information is accumulated in the evaluation value function learning unit 807, the information processing apparatus 102 performs the evaluation value function F An evaluation value for each operation pattern is calculated based on. The information processing apparatus 102 also updates the evaluation value function F as needed in the process of FIG. 14 to improve the accuracy of the entanglement work.

図15は、評価値関数部802の評価値関数Fの更新処理の一例を示すフローチャートである。ある局面において、図15の処理を実行するためのプログラムは2次記憶装置703に記憶され、1次記憶装置702に読み出されることにより、CPU701によって実行されてもよい。これ以降、情報処理装置102が図15の各ステップを実行するものとして更新処理を説明する。 FIG. 15 is a flowchart showing an example of update processing of the evaluation value function F of the evaluation value function unit 802. As shown in FIG. In one aspect, a program for executing the processing of FIG. Hereinafter, update processing will be described assuming that the information processing apparatus 102 executes each step in FIG. 15 .

ステップS1510において、情報処理装置102は、評価値関数学習部807に保存されている各動作パターンaの「状態情報S1,S2」、「報酬R」および「終了判定」を読み出す。 In step S 1510 , the information processing apparatus 102 reads “state information S 1 , S 2 ”, “reward R”, and “termination determination” of each motion pattern ak stored in the evaluation value function learning unit 807 .

ステップS1520において、情報処理装置102は、ステップS1510にて読み出した各種データを用いて、学習用の評価値関数F’の内部パラメータを更新する。評価値関数F’は、評価値の算出に使用される評価値関数Fとは別に用意する学習用の評価値関数である。評価値関数F’は、評価値関数学習部807によって使用される。評価値関数Fは、評価値関数部802によって使用される。 In step S1520, the information processing apparatus 102 updates the internal parameters of the learning evaluation value function F' using the various data read out in step S1510. The evaluation value function F' is a learning evaluation value function prepared separately from the evaluation value function F used for calculating the evaluation value. Evaluation value function F′ is used by evaluation value function learning unit 807 . Evaluation value function F is used by evaluation value function unit 802 .

ステップS1530において、情報処理装置102は、学習処理を予め定められた回数繰り返すごとに、評価値関数F’を評価値関数Fにコピーする。情報処理装置102は、図12~図14の処理中においても、図15の処理を随時実行してもよい。 In step S1530, the information processing apparatus 102 copies the evaluation value function F' to the evaluation value function F each time the learning process is repeated a predetermined number of times. The information processing apparatus 102 may execute the process of FIG. 15 at any time during the processes of FIGS. 12 to 14 as well.

以下に、評価値関数Fの学習処理の詳細について説明する。評価値関数Fはニューラルネットワークのため、学習には教師信号が必要になる。情報処理装置102は、終了判定に応じて教師信号yを次のように決定する。 Details of the learning process of the evaluation value function F will be described below. Since the evaluation value function F is a neural network, a teacher signal is required for learning. The information processing device 102 determines the teacher signal y as follows according to the end determination.

絡まり解き処理の終了判定がTrueの場合の教師信号yは以下のようになる。 The teacher signal y when the untangling process end determination is True is as follows.

Figure 0007113778000001
Figure 0007113778000001

絡まり解き処理の終了判定がFalseの場合の教師信号yは以下のようになる。 The teacher signal y when the untangling process end determination is False is as follows.

Figure 0007113778000002
Figure 0007113778000002

ここで、「s'=T2、a'」は「Q(s,a)」が最大になる動作パターンを意味する。情報処理装置102は、上記の教師信号yと、評価値関数Fとの2乗誤差Eを求め、誤差逆伝搬法によりニューラルネットワークの学習を行う。評価値関数Fは、下記の式(3)の式で表される。 Here, 's'=T2, a'' means an operation pattern that maximizes 'Q(s, a)'. The information processing device 102 obtains the squared error E between the teacher signal y and the evaluation value function F, and performs neural network learning by the error back propagation method. The evaluation value function F is represented by the following formula (3).

Figure 0007113778000003
Figure 0007113778000003

また、情報処理装置102は、式(3)を下記の式(4)に代入して誤差を算出する。 Further, the information processing apparatus 102 substitutes the formula (3) into the following formula (4) to calculate the error.

Figure 0007113778000004
Figure 0007113778000004

誤差逆伝搬法は、上記Eが0になるようにニューラルネットワークの内部パラメータを最適化する。よって、学習が進むにしたがって下記の式(5)の値が0に近づいていく。 The error backpropagation method optimizes the internal parameters of the neural network so that E becomes zero. Therefore, the value of the following equation (5) approaches 0 as learning progresses.

Figure 0007113778000005
Figure 0007113778000005

強化学習も同様に、学習が十分に行われると、下記の式(6)が成り立つので、誤差逆伝搬法によるニューラルネットワークの学習は強化学習の学習結果と同様になる。 Similarly, in reinforcement learning, if the learning is sufficiently performed, the following equation (6) holds, so that the learning result of the neural network by the error backpropagation method is the same as the learning result of the reinforcement learning.

Figure 0007113778000006
Figure 0007113778000006

以上説明したように、本実施の形態に従うワーク取り出し作業装置101は、直列多関節の構造を有さず、代わりに直動機構およびパラレルリンクのみの構成を有する。その結果、多関節ロボットが持つ特異点の問題が発生せず、多関節ロボットよりも少ないスペースでの作業を可能にする。また、ワーク取り出し作業装置101は、機械学習においても、パラレルリンクの基端側リンクハブに取付けられた電動アクチュエータおよび位置調整装置の電動アクチュエータのモータトルク値のみを学習データとすることができる。そのため、ワーク取り出し作業装置101は、多関節ロボットと比較して、ワークの絡まり解き処理における学習パラメータが少なく機械学習が容易になる。よって、C型サークリップや、ばね、コイル等の絡まりやすいワークの取り出し作業における絡まり解き処理の精度を向上させることが可能となる。 As described above, the workpiece picking device 101 according to the present embodiment does not have a series multi-joint structure, but instead has only a linear motion mechanism and a parallel link. As a result, the singularity problem of articulated robots does not occur, and work can be done in a smaller space than articulated robots. Also, in machine learning, the workpiece picking device 101 can use only the motor torque values of the electric actuators attached to the base-end link hub of the parallel link and the electric actuator of the position adjusting device as learning data. Therefore, the work picking device 101 has fewer learning parameters in work untangling processing than an articulated robot, and machine learning is facilitated. Therefore, it is possible to improve the accuracy of the untangling process in the work of removing easily tangled workpieces such as C-shaped circlips, springs, and coils.

今回開示された実施の形態は全ての点で例示であって制限的なものではないと考えられるべきである。本発明の範囲は上記した説明ではなくて特許請求の範囲によって示され、特許請求の範囲と均等の意味及び範囲内で全ての変更が含まれることが意図される。 It should be considered that the embodiments disclosed this time are illustrative in all respects and not restrictive. The scope of the present invention is indicated by the scope of the claims rather than the above description, and is intended to include all modifications within the meaning and scope equivalent to the scope of the claims.

11,108A,108B,108C 電動アクチュエータ、32 第1リンクハブ、33 第2リンクハブ、34 リンク機構、35,36 端部リンク部材、37 中央リンク部材、42,55,73,75 回転軸、62 減速機構、63 モータ固定部材、100 合作業システム、101 合作業装置、102 情報処理装置、103 制御装置、104 架台、105 第1の直動ユニット、106 第2の直動ユニット、107 第3の直動ユニット、109 作業ヘッド、110 回転ユニット取付部材、111 角度調整機構、112 把持機構、113 ワーク入れ、114,115 撮像装置、702 1次記憶装置、703 2次記憶装置、704 外部機器インターフェース、705 入力インターフェース、706 出力インターフェース、707 通信インターフェース、801 信号入力部、802 評価値関数部、803 動作パターンテーブル、804 動作決定部、805 指令生成部、806 動作結果判定部、807 評価値関数学習部。 Reference Signs List 11, 108A, 108B, 108C Electric actuator 32 First link hub 33 Second link hub 34 Link mechanism 35, 36 End link member 37 Center link member 42, 55, 73, 75 Rotating shaft 62 Reduction mechanism 63 Motor fixing member 100 Cooperative work system 101 Cooperative work device 102 Information processing device 103 Control device 104 Base 105 First linear motion unit 106 Second linear motion unit 107 Third Linear motion unit 109 Working head 110 Rotation unit mounting member 111 Angle adjustment mechanism 112 Gripping mechanism 113 Work container 114, 115 Imaging device 702 Primary storage device 703 Secondary storage device 704 External device interface 705 input interface, 706 output interface, 707 communication interface, 801 signal input unit, 802 evaluation value function unit, 803 operation pattern table, 804 operation determination unit, 805 command generation unit, 806 operation result determination unit, 807 evaluation value function learning unit .

Claims (11)

ワークの取り出しを行う作業装置であって、
ワークを容器から取り出して把持する把持部と、
前記把持部が装着され、前記把持部の向きを調整する角度調整部と、
前記角度調整部が装着される作業ヘッドと、
複数の駆動部により前記作業ヘッドを移動させる位置調整部と、
前記把持部の把持するワークを撮影する第1の撮像装置と、
前記作業装置を制御する情報処理装置とを備え、
前記角度調整部は、
第1および第2のリンクハブと、
前記第1および第2のリンクハブの間に並列に配置された複数のリンクと、
前記複数のリンクのそれぞれを駆動させる複数の駆動部とを含み、
前記情報処理装置は、
前記第1の撮像装置が撮影した画像に基づいて、前記把持部が把持するワークの個数を検出し、
前記把持部が把持するワークの個数が2以上であることに基づいて、前記把持部が把持するワークの個数および画像、前記角度調整部の各駆動部のトルクを機械学習モデルのパラメータとし、前記機械学習モデルにより、前記位置調整部および前記角度調整部の各駆動部に送信するそれぞれの駆動信号を決定し、
決定した前記駆動信号に基づいて、前記位置調整部の各駆動部および前記角度調整部の各駆動部を駆動させることにより、前記把持部にワークの絡まり解き動作をさせる、作業装置。
A working device for picking up a workpiece,
a gripping portion for gripping the workpiece after taking it out of the container;
an angle adjustment unit to which the gripping portion is attached and which adjusts the orientation of the gripping portion;
a working head on which the angle adjustment part is mounted;
a position adjusting unit that moves the working head by a plurality of driving units;
a first imaging device that captures an image of the workpiece gripped by the gripping unit;
an information processing device that controls the working device;
The angle adjuster is
first and second link hubs;
a plurality of links arranged in parallel between the first and second link hubs;
and a plurality of driving units for driving each of the plurality of links,
The information processing device is
detecting the number of workpieces gripped by the gripping unit based on the image captured by the first imaging device;
Based on the fact that the number of workpieces gripped by the gripping unit is two or more, the number and image of workpieces gripped by the gripping unit and the torque of each driving unit of the angle adjusting unit are parameters of a machine learning model, and using a machine learning model to determine each drive signal to be transmitted to each drive unit of the position adjustment unit and the angle adjustment unit;
A work device that causes the gripping section to perform an untangling operation of the workpiece by driving each driving section of the position adjusting section and each driving section of the angle adjusting section based on the determined drive signal.
前記情報処理装置は、
前記把持部が絡まり解き動作を実行した後に、再度、前記第1の撮像装置が撮影した画像に基づいて、前記把持部が把持するワークの個数を検出し、
前記把持部が把持するワークの個数が2以上であることに基づいて、前記把持部にワークの絡まり解き動作を再度実行させる、請求項1に記載の作業装置。
The information processing device is
detecting the number of workpieces gripped by the gripping unit again based on the image captured by the first imaging device after the gripping unit performs the untangling operation;
2. The working device according to claim 1, wherein the gripping section is caused to re-execute the untangling operation of the workpieces based on the fact that the number of workpieces gripped by the gripping section is two or more.
前記情報処理装置は、
前記第1の撮像装置が撮影した画像に基づいて、前記把持部が把持するワークの個数が1であるか否かを判定し、
前記把持部が把持するワークの個数が1であることに基づいて、ワークの絡まり解き作業が完了したと判定し、
前記機械学習モデルの学習に用いる報酬データを生成し、前記機械学習モデルに入力する学習データに前記報酬データを加える、請求項1または2に記載の作業装置。
The information processing device is
determining whether or not the number of workpieces gripped by the gripping unit is 1 based on the image captured by the first imaging device;
Based on the fact that the number of workpieces gripped by the gripping unit is 1, it is determined that the unentangling work of the workpieces has been completed,
3. The working device according to claim 1, wherein reward data used for learning of said machine learning model is generated, and said reward data is added to learning data input to said machine learning model.
前記情報処理装置は、
前記第1の撮像装置が撮影した画像に基づいて、前記把持部が把持するワークの個数が0であるか否かを判定し、
前記把持部が把持するワークの個数が0個であることに基づいて、前記機械学習モデルの学習に用いる報酬データを生成せずに、絡まり解き作業を終了する、請求項3に記載の作業装置。
The information processing device is
determining whether or not the number of workpieces gripped by the gripping unit is 0 based on the image captured by the first imaging device;
4. The working device according to claim 3, wherein the unentanglement work is terminated without generating reward data used for learning of the machine learning model based on the fact that the number of workpieces gripped by the gripping unit is 0. .
前記容器内のワークを撮影する第2の撮像装置をさらに備え、
前記情報処理装置は、
前記第2の撮像装置が撮影した画像に基づいて、前記容器内にワークがあるか否かを判定し、
前記容器内にワークがあると判定したことに基づいて、前記把持部を予め定められた取り出し作業の位置に移動させるための前記駆動信号を前記位置調整部および前記角度調整部の各駆動部に送信する、請求項1~4のいずれか1項に記載の作業装置。
further comprising a second imaging device for imaging the workpiece in the container,
The information processing device is
determining whether or not there is a workpiece in the container based on the image captured by the second imaging device;
the drive signal for moving the gripping section to a predetermined position for the take-out operation is sent to each drive section of the position adjustment section and the angle adjustment section based on determination that there is a work in the container; The work device according to any one of claims 1 to 4, which transmits.
前記情報処理装置は、
前記第2の撮像装置が撮影した画像に基づいて、前記容器内にワークがないと判定すると、前記容器内からのワークの取り出し作業を終了する、請求項5に記載の作業装置。
The information processing device is
6. The working device according to claim 5, wherein when it is determined that there is no workpiece in the container based on the image captured by the second imaging device, the operation of removing the workpiece from the container is finished.
前記情報処理装置は、前記位置調整部および前記角度調整部の各駆動部に送信するそれぞれの前記駆動信号を決定するとき、さらに、前記位置調整部の各駆動部のトルクを取得し、前記位置調整部の各駆動部のトルクを前記機械学習モデルのパラメータに加える、請求項1~6のいずれか1項に記載の作業装置。 When determining the respective drive signals to be transmitted to the drive units of the position adjustment unit and the angle adjustment unit, the information processing device further obtains torque of each drive unit of the position adjustment unit, The working device according to any one of claims 1 to 6, wherein the torque of each driving part of the adjustment part is added to the parameters of the machine learning model. 前記位置調整部および前記角度調整部の各駆動部に送信されるそれぞれの前記駆動信号は、各駆動部のそれぞれの指令トルク、回転速度および回転量に関する情報を含む、請求項1~7のいずれか1項に記載の作業装置。 8. The drive signal transmitted to each drive unit of the position adjustment unit and the angle adjustment unit includes information on command torque, rotation speed and amount of rotation of each drive unit. or the work device according to item 1. 前記位置調整部は、3軸の直動機構を含む、請求項1~8のいずれか1項に記載の作業装置。 The working device according to any one of claims 1 to 8, wherein the position adjusting section includes a three-axis linear motion mechanism. 前記位置調整部の駆動部は、ステッピングモータである、請求項1~9のいずれか1項に記載の作業装置。 The working device according to any one of claims 1 to 9, wherein the driving portion of the position adjusting portion is a stepping motor. 前記角度調整部の駆動部は、ステッピングモータである、請求項1~10いずれか1項に記載の作業装置。 The working device according to any one of claims 1 to 10, wherein the driving portion of the angle adjusting portion is a stepping motor.
JP2019060437A 2019-03-27 2019-03-27 Work take-out device Active JP7113778B2 (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2019060437A JP7113778B2 (en) 2019-03-27 2019-03-27 Work take-out device

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2019060437A JP7113778B2 (en) 2019-03-27 2019-03-27 Work take-out device

Publications (2)

Publication Number Publication Date
JP2020157436A JP2020157436A (en) 2020-10-01
JP7113778B2 true JP7113778B2 (en) 2022-08-05

Family

ID=72641015

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2019060437A Active JP7113778B2 (en) 2019-03-27 2019-03-27 Work take-out device

Country Status (1)

Country Link
JP (1) JP7113778B2 (en)

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20110211938A1 (en) 2008-08-29 2011-09-01 Abb Research Ltd. Compliant End Of Arm Tooling For A Robot
JP5185388B2 (en) 2007-10-05 2013-04-17 クゥアルコム・インコーポレイテッド Variable feedback in amplifiers
US20140100696A1 (en) 2012-10-04 2014-04-10 Electronics And Telecommunications Research Institute Working method using sensor and working system for performing same
JP2017154231A (en) 2016-03-03 2017-09-07 ファナック株式会社 Picking system and method for bulk workpiece
WO2019004481A1 (en) 2017-06-27 2019-01-03 正好 石井 Information processing device, manipulator control system, and natural language processing system
JP6466536B1 (en) 2017-09-08 2019-02-06 Ntn株式会社 Work device using parallel link mechanism

Family Cites Families (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP3151900B2 (en) * 1992-01-14 2001-04-03 株式会社デンソー Parts supply device
JP5265296B2 (en) * 2008-10-10 2013-08-14 本田技研工業株式会社 Work removal method

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP5185388B2 (en) 2007-10-05 2013-04-17 クゥアルコム・インコーポレイテッド Variable feedback in amplifiers
US20110211938A1 (en) 2008-08-29 2011-09-01 Abb Research Ltd. Compliant End Of Arm Tooling For A Robot
US20140100696A1 (en) 2012-10-04 2014-04-10 Electronics And Telecommunications Research Institute Working method using sensor and working system for performing same
JP2017154231A (en) 2016-03-03 2017-09-07 ファナック株式会社 Picking system and method for bulk workpiece
WO2019004481A1 (en) 2017-06-27 2019-01-03 正好 石井 Information processing device, manipulator control system, and natural language processing system
JP6466536B1 (en) 2017-09-08 2019-02-06 Ntn株式会社 Work device using parallel link mechanism

Also Published As

Publication number Publication date
JP2020157436A (en) 2020-10-01

Similar Documents

Publication Publication Date Title
EP2224303B1 (en) Robot with automatic selection of task-specific representations for imitation learning
US20180029221A1 (en) Robot and robot system
US11833682B2 (en) Robot, method, and manipulating system
US10272568B2 (en) Robot apparatus, robot controlling method, program, recording medium, and assembly manufacturing method
JP6472214B2 (en) Robot apparatus control method and robot apparatus
US11040451B2 (en) Teaching device and teaching method
JP7117237B2 (en) ROBOT CONTROL DEVICE, ROBOT SYSTEM AND ROBOT CONTROL METHOD
CN114516060A (en) Apparatus and method for controlling a robotic device
US20180085920A1 (en) Robot control device, robot, and robot system
WO2019176478A1 (en) Operation control device for robot
CN112757284A (en) Robot control apparatus, method and storage medium
WO2019039006A1 (en) Robot
JP7113778B2 (en) Work take-out device
Torres-Jara Obrero: A platform for sensitive manipulation
CN208584552U (en) A kind of flexible grabbing device and robot
JP2019111604A (en) Control device, robot and robot system
JP7290439B2 (en) Mating device
JP4715296B2 (en) Robot hand holding and gripping control method.
US20230046345A1 (en) Robot hand, handling system, robot hand control device, method for controlling robot hand, and storage medium
US20240083023A1 (en) Robot model learning device, robot model machine learning method, recording medium storing robot model machine learning program, robot control device, robot control method, and recording medium storing robot control program
TWI781708B (en) Learning apparatus, learning method, learning program, control apparatus, control method, and control program
US20230038804A1 (en) Master-slave system and controlling method
CN118081837A (en) Robot, training device, robot equipment, training system and training method of training system
CN113664815B (en) Triggering and compensating method for teaching position and posture
US20230234231A1 (en) Teleoperation assist device, teleoperation assist method, and storage medium

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20210916

TRDD Decision of grant or rejection written
A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20220630

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20220705

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20220726

R150 Certificate of patent or registration of utility model

Ref document number: 7113778

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150