DE102020208169A1 - Verfahren und Vorrichtung zum Betreiben einer Maschine - Google Patents

Verfahren und Vorrichtung zum Betreiben einer Maschine Download PDF

Info

Publication number
DE102020208169A1
DE102020208169A1 DE102020208169.7A DE102020208169A DE102020208169A1 DE 102020208169 A1 DE102020208169 A1 DE 102020208169A1 DE 102020208169 A DE102020208169 A DE 102020208169A DE 102020208169 A1 DE102020208169 A1 DE 102020208169A1
Authority
DE
Germany
Prior art keywords
sequence
states
model
skill
state
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
DE102020208169.7A
Other languages
English (en)
Inventor
Andras Gabor Kupcsik
Leonel Rozo
Meng Guo
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Robert Bosch GmbH
Original Assignee
Robert Bosch GmbH
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Robert Bosch GmbH filed Critical Robert Bosch GmbH
Priority to DE102020208169.7A priority Critical patent/DE102020208169A1/de
Priority to US17/355,961 priority patent/US20210402606A1/en
Priority to CN202110727240.1A priority patent/CN113867137A/zh
Publication of DE102020208169A1 publication Critical patent/DE102020208169A1/de
Pending legal-status Critical Current

Links

Images

Classifications

    • BPERFORMING OPERATIONS; TRANSPORTING
    • B25HAND TOOLS; PORTABLE POWER-DRIVEN TOOLS; MANIPULATORS
    • B25JMANIPULATORS; CHAMBERS PROVIDED WITH MANIPULATION DEVICES
    • B25J9/00Programme-controlled manipulators
    • B25J9/16Programme controls
    • B25J9/1656Programme controls characterised by programming, planning systems for manipulators
    • B25J9/1671Programme controls characterised by programming, planning systems for manipulators characterised by simulation, either to verify existing program or to create and verify new program, CAD/CAM oriented, graphic oriented programming systems
    • BPERFORMING OPERATIONS; TRANSPORTING
    • B25HAND TOOLS; PORTABLE POWER-DRIVEN TOOLS; MANIPULATORS
    • B25JMANIPULATORS; CHAMBERS PROVIDED WITH MANIPULATION DEVICES
    • B25J9/00Programme-controlled manipulators
    • B25J9/16Programme controls
    • B25J9/1656Programme controls characterised by programming, planning systems for manipulators
    • B25J9/1664Programme controls characterised by programming, planning systems for manipulators characterised by motion, path, trajectory planning
    • GPHYSICS
    • G05CONTROLLING; REGULATING
    • G05BCONTROL OR REGULATING SYSTEMS IN GENERAL; FUNCTIONAL ELEMENTS OF SUCH SYSTEMS; MONITORING OR TESTING ARRANGEMENTS FOR SUCH SYSTEMS OR ELEMENTS
    • G05B13/00Adaptive control systems, i.e. systems automatically adjusting themselves to have a performance which is optimum according to some preassigned criterion
    • G05B13/02Adaptive control systems, i.e. systems automatically adjusting themselves to have a performance which is optimum according to some preassigned criterion electric
    • G05B13/04Adaptive control systems, i.e. systems automatically adjusting themselves to have a performance which is optimum according to some preassigned criterion electric involving the use of models or simulators
    • G05B13/042Adaptive control systems, i.e. systems automatically adjusting themselves to have a performance which is optimum according to some preassigned criterion electric involving the use of models or simulators in which a parameter or coefficient is automatically adjusted to optimise the performance
    • BPERFORMING OPERATIONS; TRANSPORTING
    • B25HAND TOOLS; PORTABLE POWER-DRIVEN TOOLS; MANIPULATORS
    • B25JMANIPULATORS; CHAMBERS PROVIDED WITH MANIPULATION DEVICES
    • B25J9/00Programme-controlled manipulators
    • B25J9/0081Programme-controlled manipulators with master teach-in means
    • BPERFORMING OPERATIONS; TRANSPORTING
    • B25HAND TOOLS; PORTABLE POWER-DRIVEN TOOLS; MANIPULATORS
    • B25JMANIPULATORS; CHAMBERS PROVIDED WITH MANIPULATION DEVICES
    • B25J9/00Programme-controlled manipulators
    • B25J9/16Programme controls
    • B25J9/1656Programme controls characterised by programming, planning systems for manipulators
    • B25J9/1661Programme controls characterised by programming, planning systems for manipulators characterised by task planning, object-oriented languages
    • GPHYSICS
    • G05CONTROLLING; REGULATING
    • G05BCONTROL OR REGULATING SYSTEMS IN GENERAL; FUNCTIONAL ELEMENTS OF SUCH SYSTEMS; MONITORING OR TESTING ARRANGEMENTS FOR SUCH SYSTEMS OR ELEMENTS
    • G05B19/00Programme-control systems
    • G05B19/02Programme-control systems electric
    • G05B19/42Recording and playback systems, i.e. in which the programme is recorded from a cycle of operations, e.g. the cycle of operations being manually controlled, after which this record is played back on the same machine
    • G05B19/423Teaching successive positions by walk-through, i.e. the tool head or end effector being grasped and guided directly, with or without servo-assistance, to follow a path
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F9/00Arrangements for program control, e.g. control units
    • G06F9/06Arrangements for program control, e.g. control units using stored programs, i.e. using an internal store of processing equipment to receive or retain programs
    • G06F9/44Arrangements for executing specific programs
    • G06F9/448Execution paradigms, e.g. implementations of programming paradigms
    • G06F9/4498Finite state machines
    • GPHYSICS
    • G05CONTROLLING; REGULATING
    • G05BCONTROL OR REGULATING SYSTEMS IN GENERAL; FUNCTIONAL ELEMENTS OF SUCH SYSTEMS; MONITORING OR TESTING ARRANGEMENTS FOR SUCH SYSTEMS OR ELEMENTS
    • G05B2219/00Program-control systems
    • G05B2219/30Nc systems
    • G05B2219/36Nc in input of data, input key till input tape
    • G05B2219/36416Adapt teached position as function of deviation 3-D, 2-D position of end effector, tool
    • GPHYSICS
    • G05CONTROLLING; REGULATING
    • G05BCONTROL OR REGULATING SYSTEMS IN GENERAL; FUNCTIONAL ELEMENTS OF SUCH SYSTEMS; MONITORING OR TESTING ARRANGEMENTS FOR SUCH SYSTEMS OR ELEMENTS
    • G05B2219/00Program-control systems
    • G05B2219/30Nc systems
    • G05B2219/39Robotics, robotics to robotics hand
    • G05B2219/39205Markov model
    • GPHYSICS
    • G05CONTROLLING; REGULATING
    • G05BCONTROL OR REGULATING SYSTEMS IN GENERAL; FUNCTIONAL ELEMENTS OF SUCH SYSTEMS; MONITORING OR TESTING ARRANGEMENTS FOR SUCH SYSTEMS OR ELEMENTS
    • G05B2219/00Program-control systems
    • G05B2219/30Nc systems
    • G05B2219/40Robotics, robotics mapping to robotics vision
    • G05B2219/40391Human to robot skill transfer

Landscapes

  • Engineering & Computer Science (AREA)
  • Robotics (AREA)
  • Mechanical Engineering (AREA)
  • Software Systems (AREA)
  • General Physics & Mathematics (AREA)
  • Physics & Mathematics (AREA)
  • Automation & Control Theory (AREA)
  • Artificial Intelligence (AREA)
  • Medical Informatics (AREA)
  • Evolutionary Computation (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Health & Medical Sciences (AREA)
  • Theoretical Computer Science (AREA)
  • General Engineering & Computer Science (AREA)
  • Feedback Control In General (AREA)
  • Manipulator (AREA)

Abstract

Vorrichtung und Verfahren zum Betreiben einer Maschine (104), wobei das Verfahren Bereitstellen einer Abfolge von Fertigkeiten (132) der Maschine (104) zum Ausführen einer Aufgabe, Auswählen einer Abfolge von Zuständen aus mehreren Abfolgen von Zuständen, in Abhängigkeit von einer Wahrscheinlichkeit, umfasst, wobei die Wahrscheinlichkeit in Abhängigkeit von einer Übergangswahrscheinlichkeit aus einem letzten Zustand einer ersten Unterabfolge von Zuständen der Abfolge von Zuständen für eine erste Fertigkeit in der Abfolge von Fertigkeiten (132) zu einem anfänglichen Zustand einer zweiten Unterabfolge von Zuständen der Abfolge von Zuständen für eine zweite Fertigkeit in der Abfolge von Fertigkeiten (132) bestimmt wird.

Description

  • Hintergrund
  • Es ist wünschenswert, komplexe Zusammenbauaufgaben unter Verwendung von Roboterautomatisierung mit Roboterfertigkeiten zu lösen, die dem Roboter manuell über kinästhetisches Lehren gezeigt wurden.
  • Offenbarung der Erfindung
  • Dies wird durch ein Verfahren und eine Vorrichtung zum Betreiben einer Maschine (die, insbesondere, eine Robotermaschine sein kann) gemäß den unabhängigen Ansprüchen erreicht.
  • Das Verfahren zum Betreiben der Maschine umfasst Bereitstellen einer Abfolge von Fertigkeiten der Maschine zum Ausführen einer Aufgabe, Auswählen einer Abfolge von Zuständen aus mehreren Abfolgen von Zuständen, in Abhängigkeit von einer Wahrscheinlichkeit, wobei die Wahrscheinlichkeit in Abhängigkeit von einer Übergangswahrscheinlichkeit aus einem letzten Zustand einer ersten Unterabfolge von Zuständen der Abfolge von Zuständen für eine erste Fertigkeit in der Abfolge von Fertigkeiten zu einem anfänglichen Zustand einer zweiten Unterabfolge von Zuständen der Abfolge von Zuständen für eine zweite Fertigkeit in der Abfolge von Fertigkeiten bestimmt wird. Eine optimale Zustandsabfolge wird auf diese Weise basierend auf einem gewünschten Ziel der Aufgabe und einem anfänglichen Zustand der Maschine oder Umgebung gefunden.
  • Das Verfahren kann Bereitstellen eines ersten Modells für die erste Fertigkeit, wobei ein Parameter des ersten Modells eine Trajektorie in einem Zustand der ersten Unterabfolge von Zuständen definiert, oder Bereitstellen eines ersten Modells für die zweite Fertigkeit, wobei ein Parameter des ersten Modells eine Trajektorie in einem Zustand der zweiten Unterabfolge von Zuständen definiert, umfassen, wobei das Verfahren ferner Bestimmen des Parameters für den Zustand der Abfolge von Zuständen und Bestimmen eines Steuersignals zum Betreiben der Maschine gemäß der Trajektorie in Abhängigkeit vom Parameter umfasst. Die Trajektorie ist eine Referenz für eine optimale Steuerung der Maschine.
  • Das Verfahren kann Bereitstellen eines zweiten Modells, umfassend die mehreren Abfolgen von Zuständen, Bestimmen der Wahrscheinlichkeit für zumindest eine Abfolge der mehreren Abfolgen in Abhängigkeit von den Übergangswahrscheinlichkeiten zwischen den Unterabfolgen von Zuständen für die Fertigkeiten in der zumindest einen Abfolge, Auswählen der Abfolge von Zuständen aus dem zweiten Modell, die eine höhere Wahrscheinlichkeit aufweist im Vergleich mit zumindest einer anderen Abfolge von Zuständen der mehreren Abfolgen von Zuständen, umfassen. Das zweite Modell umfasst Kaskaden von ersten Modellen, die zusammengestellt sind zum Bestimmen der optimalen Abfolge von Zuständen unter Verwendung eines Viterbi-Algorithmus.
  • Das Verfahren kann Abbilden einer ersten Beobachtung für die Maschine auf den ersten Zustand, wobei die Abfolge von Zuständen beim ersten Zustand startet, und/oder Abbilden einer zweiten Beobachtung auf den zweiten Zustand, wobei die Abfolge von Zuständen beim zweiten Zustand endet, umfassen. Dies ermöglicht, die gesamte optimale Abfolge von Zuständen aus zwei Beobachtungen zu bestimmen.
  • Die erste Beobachtung kann die Maschine oder die Umgebung der Maschine vor Ausführen einer ersten Fertigkeit in der Abfolge von Fertigkeiten charakterisieren und/oder wobei die zweite Beobachtung die Maschine oder die Umgebung der Maschine nach Ausführen einer letzten Fertigkeit in der Abfolge von Fertigkeiten charakterisieren kann. Dies ermöglicht einen vereinfachten Viterbi-Algorithmus nur basierend auf der anfänglichen und der letzten Beobachtung in der Aufgabe.
  • Bereitstellen des zweiten Modells kann Bestimmen der Übergangswahrscheinlichkeit vom letzten Zustand der ersten Unterabfolge gemäß der ersten Fertigkeit zu mehreren anfänglichen Zuständen von unterschiedlichen zweiten Unterabfolgen gemäß unterschiedlichen Instanzen der zweiten Fertigkeit umfassen. Dies kaskadiert unterschiedliche Unterabfolgen für die zweite Fertigkeit mit einer Unterabfolge der ersten Fertigkeit.
  • Der letzte Zustand der ersten Unterabfolge kann in Abhängigkeit von einer letzten Komponente einer Instanz der ersten Fertigkeit bestimmt werden. Die Instanz der ersten Fertigkeit kann ein TP-HSMM mit mehreren letzten Komponenten, d. h. unterschiedlichen ersten Unterabfolgen, sein. Die letzte Komponente definiert den letzten Zustand einer ersten Unterabfolge und ist daher verknüpfbar mit der anfänglichen Komponente des anfänglichen Zustands der zweiten Unterabfolge.
  • Zumindest ein anfänglicher Zustand der zweiten Unterabfolge kann in Abhängigkeit von einer anfänglichen Komponente einer Instanz der zweiten Fertigkeit bestimmt werden.
  • Die Übergangswahrscheinlichkeit kann in Abhängigkeit von einer Divergenz zwischen einem ersten Gaußschen Mischverteilungsmodell für die letzte Komponente und einem zweiten Gaußschen Mischverteilungsmodell für die anfängliche Komponente bestimmt werden.
  • Die Instanz der ersten Fertigkeit und/oder die Instanz der zweiten Fertigkeit kann durch ein aufgabenparametrisiertes verstecktes Semi-Markovmodell definiert werden.
  • Eine Vorrichtung zum Betreiben einer Maschine ist dazu angepasst, die Schritte des Verfahrens durchzuführen.
  • Weitere vorteilhafte Ausführungsformen können aus der folgenden Beschreibung und der Zeichnung abgeleitet werden. In der Zeichnung:
    • 1 stellt einen Teil eines Steuerungssystems dar,
    • 2 stellt einen Teil einer Einrichtung dar,
    • 3 stellt Aspekte von ersten Modellen für einen Betrieb einer Maschine dar,
    • 4 stellt Aspekte eines zweiten Modells für den Betrieb der Maschine dar,
    • 5 stellt Schritte eines Verfahrens dar.
  • 1 stellt einen Teil eines Steuerungssystems 100 dar, umfassend eine Steuerung 102 zum Steuern einer Maschine 104. Die Steuerung 102 ist angepasst zum Ausgeben eines Steuersignals 106 zum Steuern der Maschine 104.
  • Die Maschine 104 kann ein Roboter sein. Die Steuerung 102 kann dazu angepasst sein, die Maschine 104 in Abhängigkeit von Informationen über einen Zustand der Maschine 104 oder ihre Umgebung zu steuern. Die Umgebung kann zumindest ein Objekt umfassen, das durch die Maschine 104 manipulierbar ist. Die Maschine 104 und/oder ihre Umgebung wird hier als System bezeichnet.
  • Ein Ansatz zum Lösen komplexer Zusammenbauaufgaben ist Roboterautomatisierung mit Roboterfertigkeiten, die dem Roboter manuell über kinästhetisches Lehren gezeigt wurden. Kinästhetisches Lehren ist einfach durch jeden Arbeiter durchzuführen, der mit einem Zusammenbauprozess vertraut ist. Verschiedene Vorführungen werden für jede einzigartige Roboterfertigkeit, z. B. Einsetzen eines Stiftes in ein Loch, gesammelt.
  • Zum Erfassen der Stochastizität von menschlichen Vorführungen werden die gezeigten Fertigkeiten in statistischen Modellen codiert, wie etwa in aufgabenparametrisierten Semi-Markovmodellen, TP-HSMMs.
  • Gemäß der folgenden Beschreibung wird eine bestimmte Fertigkeit in einem ersten Modell codiert, und Sequenzierung wird mit unterschiedlichen ersten Modellen von unterschiedlichen Fertigkeiten durchgeführt, um ein zweites Modell zu bestimmen.
  • Im Kontext der Beschreibung bezieht sich ein Modellzustand auf eine Gaußsche Verteilung des TP-HSMM. Systemzustand bezieht sich auf einen Roboterzustand, beispielsweise, eine Position-Ausrichtung seines Endeffektors, oder eine Position und Geschwindigkeit seines Endeffektors. Beobachtung bezieht sich auf Daten, die zum Trainieren einer Fertigkeit, d. h. zum Trainieren eines TP-HSMM, oder zum Reproduzieren einer Fertigkeit unter Verwendung eines Viterbi-Algorithmus mit einer anfänglichen Beobachtung für einen Start der Fertigkeit und einer Zielbeobachtung für das Ende der Fertigkeit verwendet werden. Diese Beobachtungen können dem Systemzustand entsprechen oder diesen umfassen. Beobachtungen können einige zusätzliche Variablen umfassen, die spezifisch für das Problem sind.
  • Der Ansatz verwendet Kaskadieren von mehreren ersten Modellen, z. B. in TP-HSMMs codierten Modellzuständen, zusammen zum Errichten eines größeren zweiten Modells entsprechend einer mehrstufigen Zusammenbauprozedur. Beispielsweise wird, für einen Fall eines ersten Modells für eine Aufnahmefertigkeit und eines ersten Modells für eine Ablagefertigkeit, das zweite Modell für eine Aufnahme-und-Ablage-Fertigkeit erzeugt, das einem einzelnen TP-HSMM entspricht. Das erste Modell für eine bestimmte Fertigkeit kann multimodale Trajektorieverteilungen für diese bestimmte Fertigkeit codieren, um Allgemeinheit und Flexibilität sicherzustellen. Beispielsweise kann eine Aufnahmefertigkeit einen Objektaufnahmeansatz von einer Seite, einer Oberseite, einer Unterseite eines Objekts durchführen.
  • Gemäß diesem Ansatz wird eine Anzahl von möglichen Trajektorieverteilungsmodi in dem kaskadierten, d. h. sequenzierten, zweiten Modell codiert. Die Anzahl von möglichen Trajektorieverteilungen wächst exponentiell mit einer Anzahl von Fertigkeiten in der Kaskade.
  • Gemäß diesem Ansatz wird bestimmt, welchem Trajektorieverteilungsmodus die Maschine 104 folgen soll, um ein Ziel der Aufgabe zu erfüllen. Nachfolgend wird ein Rahmenwerk beschrieben, das in der Lage ist, die wahrscheinlichste Fertigkeitsabfolgeninstanziierung zu finden, die das Ziel erfüllt.
  • Gemäß einem Beispiel wird ein kaskadiertes Modell für Aufnahme-und-Ablage bereitgestellt. Bei gegebenem Ziel als ein Zielort zum Ablegen eines Objekts findet ein Vorwärtsschritt und ein Rückwärtsschritt des zweiten Modells eine Zustandsabfolge, die am wahrscheinlichsten das Ziel erfüllt, verglichen mit anderen Zustandsabfolgen, die gemäß dem zweiten Modell gefunden werden können.
  • In einem Beispiel wird eine Ausrichtung eines Endeffektorzustands eines Roboters als Einheitsquaternion codiert und dargestellt. Die Quaternion gehört zu einer S3-Hypersphäre, die als eine Riemannsche Mannigfaltigkeit beschrieben werden kann.
  • In dem Beispiel ist der Zustand in einer Riemannschen Mannigfaltigkeit MR = ℝ3 × S3 × ℝ1 definiert. Die Modellierungstechnik TP-HSMM wird angepasst, um mit Variablen in Riemannschen Mannigfaltigkeiten umzugehen.
  • Die Steuerung 102 kann dienen zur linear-quadratischen Verfolgung zum Lösen eines Steuerungsproblems, z. B. zum Abrufen einer optimalen Trajektorie für eine Zustandsabfolge in Abhängigkeit von Informationen 108 über die Zustandsabfolge. Die Steuerung 102 kann gemäß einem skalierbaren linear-quadratischen Verfolgungssteuerungsalgorithmus mit finitem Horizont für Riemannsche Mannigfaltigkeiten angepasst werden.
  • Die Steuerung 102 kann eine optimale Riemannsche Steuerung sein: bei optimaler linear-quadratischer Verfolgung ist die Dynamik in Zuständen und Aktionen definitionsgemäß linear. Die Kostenfunktion zum Minimieren ist in Zuständen und Aktionen quadratisch. Bei gegebenem anfänglichem Zustand des Systems ist die vollständige Zustandsabfolge als eine Funktion von Steuerungsaktionen zu jedem Zeitschritt definiert. Ferner können Zustände und Steuerungsaktionen bei jedem Zeitschritt in zwei große Spaltenvektoren und ihre Dynamikbeziehung in eine große quadratische Matrix verkettet werden. Quadratische Kosten sind als eine lineare Funktion der Steuerungsaktionen definiert. Schließlich können die optimalen Steuerungsaktionen durch eine Matrixinversion erhalten werden.
  • Allerdings skaliert Matrixinversion kubisch mit der Größe der Matrix. Die Größe ist in dem beispielhaften Fall die Anzahl von Zeitschritten multipliziert mit der Dimensionalität der Zustände. Diese Lösung wird rein aus linear-algebraischen Schritten abgeleitet und erlaubt das Berechnen der optimalen Steuerung und Zustandsabfolge in einem Stapel.
  • Anstatt das Steuerungsproblem in einer Stapelform zu lösen, kann die Steuerung 102 als eine optimale Vorwärts- oder Rückkopplungssteuerung umgesetzt sein, die das Steuerungsproblem rekursiv löst. Die Bellman-Gleichung kann verwendet werden, wie nachfolgend beschrieben, um das Steuerungsproblem unter Verwendung einer Ausführungskostenfunktion zu lösen. Entsprechend verringert eine optimale Aktion in einem Zustand ihre Ausführungskostenfunktion in der steilsten Richtung. Durch Ausnutzen dieser Eigenschaft der Ausführungskostenfunktion werden die optimalen Steuerungsaktionen rekursiv gefunden. In diesem Beispiel wird die nachfolgend beschriebene rekursive Formulierung für Riemannsche Mannigfaltigkeiten verwendet. Diese Lösung lässt sich kostengünstiger berechnen.
  • In einem Aspekt ist die Steuerung 102 angepasst zum Steuern der Maschine 104 gemäß einer Referenztrajektorie entsprechend einer in Abhängigkeit von der Ausführungskostenfunktion bereitgestellten Zustandsabfolge. Der Viterbi-Algorithmus kann verwendet werden, um die Zustandsabfolge zu bestimmen.
  • Die optimale Steuerungslösung wird in Abhängigkeit von der Beschreibung des Systems A, B definiert, beispielsweise als: P t = ˜ k t 1 + A T P ˜ t + 1 ( I Q t P ˜ t + 1 ) A
    Figure DE102020208169A1_0001
    wobei Q t = B ( R + B T P ˜ t + 1 B ) 1 B T
    Figure DE102020208169A1_0002
    P ˜ t + 1 = A μ ^ k t + 1 μ ^ k t P t + 1 A μ ^ k t + 1 μ ^ k t T
    Figure DE102020208169A1_0003
    und d t = ( A T A T P ˜ t + 1 Q t ) × ( d ˜ t + 1 + 2 P ˜ t + 1 ( L o g μ ^ k t ( L o g μ ^ k t + 1 ) A L o g μ ^ k t ( μ ^ k t ) ) )
    Figure DE102020208169A1_0004
    wobei d ˜ t + 1 = A μ ^ k t + 1 μ ^ k t d t + 1
    Figure DE102020208169A1_0005
    Figure DE102020208169A1_0006
    wobei
    Figure DE102020208169A1_0007
    wobei
    Figure DE102020208169A1_0008
    und wobei A μ ^ k t + 1 x t
    Figure DE102020208169A1_0009
    eine parallele Transportoperation zwischen xt und μ ^ k t + 1
    Figure DE102020208169A1_0010
    definiert und wobei R Parameter der Steuerung definiert.
  • Für die optimale Steuerungslösung werden, allgemein gesprochen, die Eigenschaften von A und B grundsätzlich durch das Systemdynamikmodell diktiert. Die R-Matrix wird üblicherweise manuell konzipiert.
  • Die Informationen 108 können der Steuerung 102 durch eine Einrichtung 110 zum Planen von Zuständen für den Betrieb der Maschine 104 bereitgestellt werden.
  • 2 stellt einen Teil der Einrichtung 110 dar. Die Einrichtung 110 umfasst zumindest einen Prozessor 112 und zumindest einen Speicher 114. Die Einrichtung 110 im Beispiel umfasst zumindest einen Eingang 116 für zumindest eine Beobachtung 118. Die Beobachtung 118 kann den Zustand definieren. Die Einrichtung 110 im Beispiel umfasst zumindest einen Ausgang 120 für die Informationen 108 über die Zustandsabfolge. Die Einrichtung 110 kann eine Benutzerschnittstelle umfassen (nicht dargestellt). Die Benutzerschnittstelle kann dazu angepasst sein, eine durch die Maschine 104 auszuführende Aufgabe aus der Benutzereingabe zu detektieren.
  • Die Einrichtung 110 und die Steuerung 102 sind dazu angepasst, Schritte im nachfolgend beschriebenen Verfahren zum Steuern der Maschine 104 auszuführen. Der zumindest eine Prozessor 112 kann dazu angepasst sein, in dem zumindest einen Speicher 114 gespeicherte Anweisungen auszuführen, um Schritte des Verfahrens durchzuführen, um die Informationen 108 für den zumindest einen Ausgang 120 aus zumindest einer an dem zumindest einen Eingang 116 empfangenen Beobachtung 118 zu bestimmen.
  • Eine Beobachtung 118 kann durch einen Datenpunkt definiert sein, der einen Zustand des Systems definiert. Bei einem Training können mehrere Beobachtungen 118 zum Durchführen einer Fertigkeit durch zumindest einen Sensor aus einer menschlichen Vorführung erfasst werden. Vorzugsweise wird eine räumlich-zeitliche Abfolge von Beobachtungen erfasst, während der Mensch die Fertigkeit vorführt.
  • In dem Beispiel ist die Maschine 104 dazu angepasst, mehrere unterschiedliche Fertigkeiten durchzuführen.
  • Eine Menge von Vorführungen 122 kann für die mehreren unterschiedlichen Fertigkeiten aufgezeichnet werden. 3 stellt beispielhaft drei Vorführungen 122-1, 122-2, 122-3 für drei unterschiedliche Fertigkeiten dar. 3 stellt beispielhaft drei räumlich-zeitliche Abfolgen von Beobachtungen 122-11, 122-12, 122-13 für die gleiche Vorführung 122-1 dar. In einem Beispiel ist die Maschine 104 ein Roboter, dazu angepasst, ein Objekt in einem Arbeitsraum des Roboters aufzunehmen, abzulegen oder zu bewegen. Die Maschine 104 kann dazu angepasst sein, die gleiche Fertigkeit an mehreren unterschiedlichen Objekten oder am gleichen Objekt bei mehreren unterschiedlichen Positionen im Arbeitsraum durchzuführen. Die hier beschriebene Prozedur kann auf jede andere Fertigkeit des Roboters oder der Maschine 104 und auf jedes andere Objekt angewendet werden.
  • Räumliche Koordinaten einer räumlich-zeitlichen Abfolge von Beobachtungen sind in dem relativ zu einem Koordinatensystem, das einen Ursprung aufweist, definierten Beispiel einem Objekt zugeordnet. Die räumlich-zeitliche Abfolge zum Ausüben einer spezifischen Fertigkeit mit einem spezifischen Objekt kann aus einer Perspektive eines spezifischen Koordinatensystems aufgezeichnet und in einen Rahmen transformiert werden. In dem Beispiel umfasst die Menge an Vorführungen 122 mehrere räumlich-zeitliche Abfolgen von Beobachtungen, aufgezeichnet aus mehreren menschlichen Vorführungen aus unterschiedlichen Perspektiven, die in Rahmen transformiert sind, die unterschiedlichen Objekten zugeordnet sind. Die Vorführung in dem Beispiel ist eine menschliche Vorführung. Die Vorführung kann auch eine Vorführung durch eine Trainingsvorrichtung sein.
  • Die Einrichtung 110 ist dazu angepasst, mehrere erste Modelle 124 in Abhängigkeit von der Menge von Vorführungen 122 zu bestimmen. In 3 werden ein Modell 124-1, definiert durch eine erste Vorführung 122-1 einer ersten Fertigkeit, ein Modell 124-2, definiert durch eine zweite Vorführung 122-2 einer zweiten Fertigkeit, und ein Modell 124-3, definiert durch eine dritte Vorführung 122-3 einer dritten Fertigkeit, dargestellt. In dem Beispiel ist das Modell 124-1 ein aufgabenparametrisiertes verstecktes Semi-Markovmodell, TP-HSMM, das Modell 124-2 ist ein TP-HSMM, und das Modell 124-3 ist ein TP-HSMM.
  • Die Einrichtung 110 kann dazu angepasst sein, ein TP-HSMM in Abhängigkeit von einer Anzahl von Gaußschen Komponenten eines Gaußschen Mischverteilungsmodells, GMM, zu bestimmen.
  • Die Einrichtung 110 ist dazu angepasst, zumindest einen Aufgabenparameter 126-1 für das Modell 124-1, zumindest einen Aufgabenparameter 126-2 für das Modell 124-2 und zumindest einen Aufgabenparameter 126-3 für das Modell 124-3 zu bestimmen. Der zumindest eine Aufgabenparameter 126-1 kann Modellparameter 126-11 für einen Zustand vor Ausführen der ersten Fertigkeit (Vorbedingungsmodell) und Modellparameter 126-12 für eine Vorhersage eines Zustands nach Ausführen der ersten Fertigkeit (Modell mit vorhergesagtem abschließendem Zustand) umfassen. Die Einrichtung 110 ist dazu angepasst, diese Parameter in Abhängigkeit von zumindest einem Rahmen zu bestimmen, der durch zumindest eine Beobachtung für den ersten Zustand des Systems vor Ausführen der ersten Fertigkeit bestimmt wird. Der zumindest eine Zustandsparameter 126-1 kann weitere Modellparameter 126-13 für den Zustand nach Ausführen der ersten Fertigkeit umfassen (Modell mit abschließender Bedingung). Diese können als GMMs umgesetzt sein. Die Einrichtung 110 kann dazu angepasst sein, die weiteren Modellparameter 126-13 in Abhängigkeit von zumindest einem Rahmen zu bestimmen, der durch zumindest eine Beobachtung für den Zustand des Systems nach Ausführen der ersten Fertigkeit bestimmt wird. Die Einrichtung 110 ist in dem Beispiel dazu angepasst, diese Modellparameter auch für das Modell 124-2 und 124-3 zu bestimmen.
  • 4 stellt Aspekte eines zweiten Modells 128 für den Betrieb der Maschine 104 dar. Das zweite Modell wird in dem Beispiel zum Bestimmen der Zustandsabfolge für den Betrieb der Maschine 104 verwendet.
  • Die Einrichtung 110 ist dazu angepasst, das zweite Modell 128 in Abhängigkeit von einer Abfolge von Fertigkeiten 130 zum Durchführen einer Aufgabe 132 zu bestimmen. Die Aufgabe 132 kann Manipulieren eines Objekts mit der Maschine 104 umfassen. Die Aufgabe 132 wird in dem Beispiel durch einen Benutzer der Maschine 104 durch Benutzereingabe über die Benutzerschnittstelle bereitgestellt.
  • Für die beispielhafte Aufgabe 132 können die erste Fertigkeit 122-1, die zweite Fertigkeit 122-2 und die dritte Fertigkeit 122-3 in dieser Reihenfolge ausgeführt werden, um die Aufgabe 132 durchzuführen. Die Einrichtung 110 ist in diesem Fall dazu angepasst, die Aufgabe 132 auf diese Reihenfolge der drei Fertigkeiten abzubilden.
  • In dem Beispiel ist die Einrichtung 110 dazu angepasst, eine Kaskade einer Instanz 128-1 des Modells 124-1 mit einer ersten Instanz 128-2 für das Modell 124-2 und einer zweiten Instanz 128-3 für das Modell 124-2 zu bestimmen.
  • Die Einrichtung 110 ist dazu angepasst, das zweite Modell 128 gemäß der Instanz 128-1 des Modells 126-1 und der ersten Instanz 128-2 des Modells 126-2 zu aktualisieren. Die Einrichtung 110 ist dazu angepasst, das zweite Modell 128 gemäß der Instanz 128-1 des Modells 126-1 und der zweiten Instanz 128-3 des Modells 124-3 zu aktualisieren. Insbesondere kann das zweite Modell 128 entsprechend einer ersten Kaskade, umfassend die Instanz 128-1 und die erste Instanz 128-2, und entsprechend einer zweiten Kaskade, umfassend die Instanz 128-1 und die zweite Instanz 128-2, aktualisiert werden.
  • Das zweite Modell 128 umfasst im Beispiel zumindest eine Abfolge entsprechend der ersten Kaskade und zumindest eine Abfolge entsprechend der zweiten Kaskade. Die erste Kaskade umfasst in dem Beispiel unterschiedliche Instanzen des Modells 124-3 für mehrere Komponenten des Modells 124-2, und die zweite Kaskade umfasst in dem Beispiel unterschiedliche Instanzen des Modells 124-3 für mehrere Komponenten des Modells 124-2.
  • Dies bedeutet, dass, für unterschiedliche Abfolgen, die gleiche Abfolge von Fertigkeiten in mehreren unterschiedlichen Kaskaden resultieren kann. Das zweite Modell 128 umfasst mehrere Abfolgen von Zuständen.
  • Die Einrichtung 110 ist dazu angepasst, eine optimale Abfolge von Zuständen ŝ* für die Steuerung der Maschine 104 in Abhängigkeit von einer Abfolge von Modellzuständen im zweiten Modell 128 zu bestimmen. Die Einrichtung 110 ist, in einem Aspekt, dazu angepasst, einen Viterbi-Algorithmus anzuwenden, um zu bestimmen, welche Abfolge von Modellzuständen im zweiten Modell 128 als die optimale Abfolge von Zuständen ŝ* auszuwählen ist.
  • Ein Verfahren zum Bestimmen der optimalen Abfolge von Zuständen ŝ* ist nachfolgend beschrieben. Eine Abfolge von Modellzuständen vom Modell 128 wird, beispielsweise, als optimal erachtet, wenn ihr eine höchste Wahrscheinlichkeit von allen zu den verfügbaren Abfolgen von Modellzuständen im zweiten Modell 128 zugeordneten Wahrscheinlichkeiten zugeordnet ist. Es kann für die Abfolge von Modellzuständen ausreichend sein, eine höhere Wahrscheinlichkeit als eine andere Abfolge von Modellzuständen zu haben, um nützlich zu sein. Daher ist die Idee nicht auf die optimale Abfolge von Zuständen ŝ*. beschränkt.
  • Die Eingabe für das Verfahren ist eine Abfolge von Fertigkeiten a*, ein anfänglicher Zustand x0, ein Zielzustand xG, mehrere erste Modelle Θa für die Fertigkeiten a in der Abfolge von Fertigkeiten a* und ihre entsprechenden Modellparameter Γa.
  • Das Verfahren umfasst Berechnen des zweiten Modells 128, nachfolgend als Θ̂a. bezeichnet, in Abhängigkeit von der Abfolge a* von Fertigkeiten a1, a2, ... durch Kaskadieren von TP-HSMMs für die Fertigkeiten a1, a2, ..., in ihrer nachfolgenden Reihenfolge in der Abfolge a*, beginnend mit einer ersten Fertigkeit a1 und endend mit einer letzten Fertigkeit der Abfolge.
  • Das folgende Beispiel beschreibt die Kaskade eines TP-HSMM für die erste Fertigkeit Θa 1 und ein TP-HSMM für die zweite Fertigkeit Θa 2 . Zusammengesetzte Modellparameter Γ\̂ können aus den GMMs in Verbindung mit der ersten Fertigkeit Γa 1 und der zweiten Fertigkeit Γa 2 bestimmt werden, wie nachfolgend beschrieben. Andere Paare von Fertigkeiten können ähnlich verarbeitet werden, z. B. a2, a3 oder a3, a4.
  • Das zweite Modell Θ̂a. kann alle möglichen Kaskaden umfassen.
  • Das TP-HSMM für die erste Fertigkeit Θa 1 und das TP-HSMM für die zweite Fertigkeit Θa 2 umfassen:
    1. a) für alle letzten Komponenten kf ∈ Θa 1 :
      • i) Erstellen einer Kopie: Θ a 2 k f = Θ a 2
        Figure DE102020208169A1_0011
      • ii) Berechnen der Übergangswahrscheinlichkeit von einer letzten Komponente ak f des TP-HSMM für die erste Fertigkeit Θa 1 für die erste Fertigkeit a1 für alle anfänglichen Komponenten k i Θ a 2 k f
        Figure DE102020208169A1_0012
        des TP-HSMM für die zweite Fertigkeit a2 durch: a k f , k i e x p ( p P c K L ( Γ T , a 1 ( p ) ( k f ) Γ 1, a 2 ( p ) ( k i ) ) )
        Figure DE102020208169A1_0013
      • wobei KL eine Kullback-Leibler-Divergenz ist, wie beschrieben in J. R. Hershey und P. A. Olsen, „Approximating the Kullback Leibler divergence between Gaussian mixture models", in Intl. Conf. on Acoustics, Speech and Signal Processing (ICASSP), vol. 4. IEEE, 2007, S. IV-317; wobei Γ T , a 1 ( p ) ( k f )
        Figure DE102020208169A1_0014
        das GMM in Verbindung mit Komponente kf für Rahmen p ist, wobei Γ 1, a 2 ( p ) ( k i )
        Figure DE102020208169A1_0015
        das GMM in Verbindung mit Komponente ki für Rahmen p ist, wobei Pc = PT,a 1 , ∩ P1,a 2 die Menge von gemeinsamen Rahmen ist, die durch diese zwei Modelle gemeinsam genutzt werden, die veranlasst werden können, nicht leer zu sein, indem stets der globale Rahmen addiert wird.
      • iii) Aktualisieren des TP-HSMM für die zweite Fertigkeit Θ a 2 k f
        Figure DE102020208169A1_0016
        und des GMM Γ T , a 2 ( k f )
        Figure DE102020208169A1_0017
        für die letzte Komponente kf der zweiten Fertigkeit a2 durch: ( μ ^ k ( p ^ ) , ^ k ( p ^ ) ) μ k ( p ) , k ( p ) b k f ( p ^ ) A k f ( p ^ )
        Figure DE102020208169A1_0018
        wobei ⊗ definiert ist als ^ k = [ p = 1 P ( ^ k ( p ) ) 1 ] 1 , μ ^ k = [ p = 1 P ( ^ k ( p ) ) 1 μ ^ k ( p ) ]
        Figure DE102020208169A1_0019
        wobei die Parameter der aktualisierten Gaußschen Komponenten an jedem Rahmen p berechnet werden als: μ ^ k ( p ) = A ( p ) μ k ( p ) + b ( p )
        Figure DE102020208169A1_0020
        und ^ k ( p ) = A ( p ) k ( p ) A ( p ) T
        Figure DE102020208169A1_0021
      • iv) Addieren einer Kaskade von Θa 1 und Θ a 2 k f
        Figure DE102020208169A1_0022
        zum zweiten Modell Θ̂a* b) Optional, Festlegen zusätzlicher Parameter des zweiten Modells Θ̂a* c) Optional können die zusammengesetzten Modellparameter Γ̂ für das Modell bestimmt werden durch Γ ^ = { Γ ^ 1 , Γ ^ T , Γ ^ 1 T } = { Γ 1, a 1 , Γ T , a 2 , Γ 1 T , a 2 k f , k f }
        Figure DE102020208169A1_0023
  • Das Verfahren umfasst ferner Berechnen der nachfolgenden optimalen Abfolge von Zuständen, ŝ*, durch:
    1. a) Bestimmen, für alle Kaskaden des zweiten Modells Θ̂a. in Abhängigkeit von einer gegebenen anfänglichen Beobachtung ξ0 und einer gegebenen letzten Beobachtung ξT für die Aufgabe, die die optimale Abfolge durchführen soll, für jede Fertigkeit a in der Kaskade, einer Wahrscheinlichkeit d t ( j ) = max d D max i j d t d ( i ) a i j p j ( d ) t ' = t d + 1 t b ˜ j ( ξ t ' ) ,
      Figure DE102020208169A1_0024
      d 1 ( j ) = b j ( σ j ) π j p j ( 1 ) ,
      Figure DE102020208169A1_0025
      wobei dt(j) die Wahrscheinlichkeit eines Vorliegens des Modellzustands j bei Schritt oder Zeitpunkt t und eines Nichtvorliegens des Modellzustands j bei Schritt oder Zeitpunkt t + 1 ist und b ˜ j ( ξ t ' ) = { N ( ξ t ' | μ ^ j , j ) t = 1 t = T 1 1 < t < T
      Figure DE102020208169A1_0026
      wobei (µ̂j, Σ̂j) eine globale Gaußsche Komponente für den Modellzustand j im Modell Θa für die Fertigkeit a ist, und wobei Modellzustand j ein Zustand einer Abfolge von Modellzuständen in der Gaußschen Komponente des zweiten Modells ist.
  • In dem Beispiel werden die zwei Argumente d und i, die die Wahrscheinlichkeit maximieren, für den Modellzustand j in der Kaskade aufgezeichnet.
  • Der Viterbi-Algorithmus wird verwendet, um die wahrscheinlichste Abfolge von Zuständen unter Verwendung einer Übergangsmatrix und von Emissionswahrscheinlichkeiten zu berechnen. Die Übergangsmatrix wird als Eingabe in den Vorwärtsschritt des Viterbi-Algorithmus verwendet. Wenn die Fertigkeit, repräsentiert durch ein HSMM, die anfängliche Beobachtung und eine letzte Beobachtung gegeben sind, werden die beiden obigen Gleichungen verwendet, um die wahrscheinlichste Abfolge von HSMM-Zuständen zu berechnen. Diese Abfolge von HSMM-Zuständen entspricht den Gaußschen Komponenten der TP-GMM. Diese Abfolge von Zuständen ist für jeden Zeitschritt eines Zeithorizonts gegeben. Der Zeithorizont kann speziell z. B. durch einen Experten gegeben sein. Das heißt, bei jedem Zeitschritt des Zeithorizonts gibt es ein einzelnes TP-HSMM, das als das wahrscheinlichste zugeordnet ist.
    • b) Bestimmen, im zweiten Modell Θ̂a* des letzten Modellzustands j der letzten Fertigkeit a* von Fertigkeiten a1, a2, ..., die die höchste Wahrscheinlichkeit hat.
    • c) Bestimmen einer Abfolge von Modellzuständen zum ersten Zustand, vorhergehende Modellzustände j des letzten Modellzustands j der letzten Fertigkeit in der Abfolge a* von Fertigkeiten a1, a2, ... auswählend, die die höchste Wahrscheinlichkeit hat. In dem Beispiel wird der Viterbi-Algorithmus verwendet, um die Wahrscheinlichkeiten von mehreren Abfolgen von Modellzuständen im zweiten Modell 128 zu evaluieren. In einem Aspekt werden die Wahrscheinlichkeiten als die Beobachtungswahrscheinlichkeit vom anfänglichen Zustand des Zielzustands über die Modellzustände in dem kaskadierten Modell evaluiert. Die Abfolge von Modellzuständen, die die höchste Wahrscheinlichkeit hat, wird dann als die optimale Abfolge ausgewählt.
  • Das Verfahren umfasst ferner Steuern der Maschine 104 zum Ausführen der einzelnen Fertigkeiten ah der Abfolge a* von Fertigkeiten a1, a2, ... durch
    1. a) Beobachten eines aktuellen Systemzustands xh,0
    2. b) Aktualisieren der Parameter des entsprechenden ersten Modells, d. h. der globalen Gaußschen Komponenten (µ̂j,Σ̂j) für die Modellzustände j einer Unterabfolge s ^ h *
      Figure DE102020208169A1_0027
      der optimalen Abfolge ŝ*, beginnend beim gegebenen aktuellen Systemzustand xh,0. Dies bedeutet, dass die Unterabfolge sh die optimale Abfolge von Modellzuständen für die Fertigkeit ah ist.
    3. c) Nachverfolgen der Trajektorie, bereitgestellt durch die globalen Gaußschen Komponenten (µ̂j, Σ̂j) für die Modellzustände j der Abfolge s ^ h * .
      Figure DE102020208169A1_0028
      Dies bedeutet, dass die Trajektorie der optimalen Unterabfolge s ^ h *
      Figure DE102020208169A1_0029
      für die Fertigkeit ah bis zum letzten Modellzustand für die Fertigkeit ah. nachverfolgt wird.
  • Beginnend bei der ersten Fertigkeit a1 können die späteren Schritte a) bis c) wiederholt werden, bis das Ziel der Aufgabe erfüllt ist, d. h., bis der letzte Modellzustand der letzten Fertigkeit in der Abfolge von a* ausgeführt wurde.
  • Ein beispielhaftes Verfahren zum Betreiben der Maschine 104 wird nachfolgend Bezug nehmend auf 5 beschrieben. Die Abfolge von Modellzuständen kann bei einem gegebenen ersten Systemzustand x0 beginnen und bei einem gegebenen zweiten Systemzustand xG enden.
  • Das Verfahren umfasst einen Schritt 502.
  • In Schritt 502 wird eine Abfolge a* von Fertigkeiten 132 der Maschine 104 zum Ausführen einer Aufgabe bereitgestellt.
  • Danach wird ein Schritt 504 ausgeführt.
  • Schritt 504 kann Bereitstellen des TP-HSMM für die erste Fertigkeit umfassen. Schritt 504 kann Bereitstellen des TP-HSMM für die zweite Fertigkeit umfassen.
  • Die Parameter (µ̂j.Σ̂j) des TP-HSMM definieren eine Trajektorie in einem Modellzustand j einer entsprechenden Unterabfolge von Modellzuständen für die entsprechende Fertigkeit.
  • Danach wird ein Schritt 506 ausgeführt.
  • In Schritt 506 wird das zweite Modell 128 bereitgestellt. Das zweite Modell 128 umfasst die mehreren Abfolgen von Modellzuständen.
  • Bestimmen des zweiten Modells 128 kann Bestimmen der Übergangswahrscheinlichkeit akf vom letzten Modellzustand der ersten Unterabfolge gemäß der ersten Fertigkeit zu mehreren anfänglichen Modellzuständen von unterschiedlichen zweiten Unterabfolgen gemäß unterschiedlichen Instanzen der zweiten Fertigkeit umfassen.
  • Der letzte Modellzustand der ersten Unterabfolge kann in Abhängigkeit von einer letzten Komponente kf ∈ Θa 1 einer Instanz der ersten Fertigkeit bestimmt werden.
  • Der zumindest eine anfängliche Modellzustand der zweiten Unterabfolge kann in Abhängigkeit von einer anfänglichen Komponente k i Θ a 2 k f
    Figure DE102020208169A1_0030
    einer Instanz der zweiten Fertigkeit bestimmt werden.
  • Die Übergangswahrscheinlichkeit ak f kann in Abhängigkeit von einer Divergenz zwischen einem ersten Gaußschen Mischverteilungsmodell für die letzte Komponente kf und einem zweiten Gaußschen Mischverteilungsmodell für die anfängliche Komponente ki bestimmt werden, wie z. B. oben basierend auf der Kullback-Leiber-Divergenz beschrieben.
  • Die Instanz der ersten Fertigkeit und/oder die Instanz der zweiten Fertigkeit kann durch ein entsprechendes TP-HSMM definiert werden.
  • Das Verfahren kann in einem Schritt 508 Abbilden einer ersten Beobachtung ξ0 für die Maschine 104 auf den ersten Systemzustand x0 umfassen. Die optimale Abfolge von Zuständen ŝ* kann bei einem ersten Systemzustand x0 beginnen, der mit der ersten Beobachtung ξ0 übereinstimmt.
  • Das Verfahren kann in einem Schritt 510 Bereitstellen des zweiten Systemzustands xG umfassen. Der zweite Systemzustand xG kann eine Abbildung einer vorbestimmten zweiten Beobachtung ξT auf den zweiten Zustand xG sein. Die optimale Abfolge von Zuständen ŝ* endet beim zweiten Systemzustand xG.
  • Die erste Beobachtung ξ0 kann die Maschine 104 oder die Umgebung der Maschine 104 vor Ausführen einer ersten Fertigkeit in der Abfolge a* von Fertigkeiten 132 charakterisieren. Die zweite Beobachtung ξT kann die Maschine 104 oder die Umgebung der Maschine 104 nach Ausführen einer letzten Fertigkeit in der Abfolge a* von Fertigkeiten 132 charakterisieren.
  • Danach wird ein Schritt 512 ausgeführt.
  • Schritt 512 umfasst Auswählen der optimalen Abfolge von Zuständen ŝ* aus den mehreren Abfolgen von Modellzuständen des zweiten Modells 128, in Abhängigkeit von der Wahrscheinlichkeit für die entsprechende Abfolge von Modellzuständen.
  • Die Wahrscheinlichkeit wird in Abhängigkeit von der Übergangswahrscheinlichkeit bestimmt, wie oben beschrieben.
  • Dies bedeutet, dass die Wahrscheinlichkeit für zumindest eine Abfolge der mehreren Abfolgen bestimmt wird.
  • Die Abfolge von Modellzuständen, die aus dem zweiten Modell 128 ausgewählt wird, hat eine höhere Wahrscheinlichkeit, verglichen mit mindestens einer anderen Abfolge von Modellzuständen der mehreren Abfolgen von Zuständen.
  • Danach wird ein Schritt 514 ausgeführt.
  • In Schritt 514 werden die Parameter (µ̂j,Σ̂j) für einen aktuellen Modellzustand j der optimalen Abfolge von Zuständen ŝ* bestimmt.
  • Die Parameter (µ̂j,Σ̂j) können als die Parameter (µj,Σ̂j) des TP-HSMM bestimmt werden, das die Trajektorie des Modellzustands j einer entsprechenden Unterabfolge von Zuständen für die entsprechende Fertigkeit definiert.
  • Danach wird ein Schritt 516 ausgeführt.
  • Schritt 516 umfasst Bestimmen einer Steuersignals û* zum Betreiben der Maschine 104 gemäß der Trajektorie in Abhängigkeit vom Parameter (µ̂j.Σ̂j). In dem Beispiel wird die optimale Steuerungslösung, wie oben beschrieben, rekursiv bestimmt.
  • Danach wird der Schritt 514 für einen nächsten Zustand in der Abfolge von Zuständen ausgeführt, bis der letzte Zustand j der letzten Fertigkeit in der Abfolge a* von Fertigkeiten erreicht ist.
  • ZITATE ENTHALTEN IN DER BESCHREIBUNG
  • Diese Liste der vom Anmelder aufgeführten Dokumente wurde automatisiert erzeugt und ist ausschließlich zur besseren Information des Lesers aufgenommen. Die Liste ist nicht Bestandteil der deutschen Patent- bzw. Gebrauchsmusteranmeldung. Das DPMA übernimmt keinerlei Haftung für etwaige Fehler oder Auslassungen.
  • Zitierte Nicht-Patentliteratur
    • J. R. Hershey und P. A. Olsen, „Approximating the Kullback Leibler divergence between Gaussian mixture models“, in Intl. Conf. on Acoustics, Speech and Signal Processing (ICASSP), vol. 4. IEEE, 2007, S. IV-317 [0057]

Claims (12)

  1. Verfahren zum Betreiben einer Maschine (104), gekennzeichnet durch Bereitstellen (502) einer Abfolge von Fertigkeiten (132) der Maschine (104) zum Ausführen einer Aufgabe, Auswählen (512) einer Abfolge von Zuständen aus mehreren Abfolgen von Zuständen, in Abhängigkeit von einer Wahrscheinlichkeit, wobei die Wahrscheinlichkeit in Abhängigkeit von einer Übergangswahrscheinlichkeit aus einem letzten Zustand einer ersten Unterabfolge von Zuständen der Abfolge von Zuständen (110) für eine erste Fertigkeit in der Abfolge von Fertigkeiten (132) zu einem anfänglichen Zustand einer zweiten Unterabfolge von Zuständen der Abfolge von Zuständen für eine zweite Fertigkeit in der Abfolge von Fertigkeiten (132) bestimmt wird.
  2. Verfahren nach Anspruch 1, gekennzeichnet durch Bereitstellen (504) eines ersten Modells (124-1, 124-2, 124-3) für die erste Fertigkeit, wobei ein Parameter des ersten Modells (124-1, 124-2, 124-3) eine Trajektorie in einem Zustand der ersten Unterabfolge von Zuständen definiert, oder Bereitstellen (504) eines ersten Modells (124-1, 124-2, 124-3) für die zweite Fertigkeit, wobei ein Parameter des ersten Modells (124-1, 124-2, 124-3) eine Trajektorie in einem Zustand der zweiten Unterabfolge von Zuständen definiert, wobei das Verfahren ferner Bestimmen (514) des Parameters für den Zustand der Abfolge von Zuständen und Bestimmen (516) eines Steuersignals zum Betreiben der Maschine (104) gemäß der Trajektorie in Abhängigkeit vom Parameter umfasst.
  3. Verfahren nach einem der vorhergehenden Ansprüche, gekennzeichnet durch Bereitstellen (506) eines zweiten Modells (128), umfassend die mehreren Abfolgen von Zuständen, Bestimmen (512) der Wahrscheinlichkeit für zumindest eine Abfolge der mehreren Abfolgen in Abhängigkeit von den Übergangswahrscheinlichkeiten zwischen den Unterabfolgen von Zuständen für die Fertigkeiten in der zumindest einen Abfolge, Auswählen der Abfolge von Zuständen aus dem zweiten Modell (128), die eine höhere Wahrscheinlichkeit aufweist, verglichen mit zumindest einer anderen Abfolge von Zuständen der mehreren Abfolgen von Zuständen.
  4. Verfahren nach einem der vorhergehenden Ansprüche, gekennzeichnet durch Abbilden (508) einer ersten Beobachtung für die Maschine (104) auf den ersten Zustand, wobei die Abfolge von Zuständen beim ersten Zustand startet, und/oder Abbilden (510) einer zweiten Beobachtung auf den zweiten Zustand, wobei die Abfolge von Zuständen beim zweiten Zustand endet.
  5. Verfahren nach einem der vorhergehenden Ansprüche, dadurch gekennzeichnet, dass die erste Beobachtung die Maschine (104) oder die Umgebung der Maschine (104) vor Ausführen einer ersten Fertigkeit in der Abfolge von Fertigkeiten (132) charakterisiert und/oder wobei die zweite Beobachtung die Maschine (104) oder die Umgebung der Maschine (104) nach Ausführen einer letzten Fertigkeit in der Abfolge von Fertigkeiten (132) charakterisiert.
  6. Verfahren nach einem der vorhergehenden Ansprüche, dadurch gekennzeichnet, dass Bereitstellen (506) des zweiten Modells (128) Bestimmen der Übergangswahrscheinlichkeit vom letzten Zustand der ersten Unterabfolge gemäß der ersten Fertigkeit zu mehreren anfänglichen Zuständen von unterschiedlichen zweiten Unterabfolgen gemäß unterschiedlichen Instanzen der zweiten Fertigkeit umfasst.
  7. Verfahren nach Anspruch 6, dadurch gekennzeichnet, dass der letzte Zustand der ersten Unterabfolge in Abhängigkeit von einer letzten Komponente einer Instanz der ersten Fertigkeit bestimmt wird.
  8. Verfahren nach Anspruch 6 oder 7, dadurch gekennzeichnet, dass der zumindest eine anfängliche Zustand der zweiten Unterabfolge in Abhängigkeit von einer anfänglichen Komponente einer Instanz der zweiten Fertigkeit bestimmt wird.
  9. Verfahren nach Anspruch 8, dadurch gekennzeichnet, dass die Übergangswahrscheinlichkeit in Abhängigkeit von einer Divergenz zwischen einem ersten Gaußschen Mischverteilungsmodell für die letzte Komponente und einem zweiten Gaußschen Mischverteilungsmodell für die anfängliche Komponente bestimmt wird.
  10. Verfahren nach einem der Ansprüche 6 bis 9, wobei die Instanz der ersten Fertigkeit und/oder die Instanz der zweiten Fertigkeit durch ein aufgabenparametrisiertes verstecktes Semi-Markovmodell definiert werden.
  11. Vorrichtung zum Betreiben einer Maschine (104), dadurch gekennzeichnet, dass die Vorrichtung dazu angepasst ist, die Schritte des Verfahrens nach einem der Ansprüche 1 bis 10 durchzuführen.
  12. Computerprogramm, dadurch gekennzeichnet, dass das Computerprogramm computerlesbare Anweisungen umfasst, die, wenn sie durch einen Computer ausgeführt werden, den Computer veranlassen, die Schritte des Verfahrens nach einem der Ansprüche 1 bis 10 durchzuführen.
DE102020208169.7A 2020-06-30 2020-06-30 Verfahren und Vorrichtung zum Betreiben einer Maschine Pending DE102020208169A1 (de)

Priority Applications (3)

Application Number Priority Date Filing Date Title
DE102020208169.7A DE102020208169A1 (de) 2020-06-30 2020-06-30 Verfahren und Vorrichtung zum Betreiben einer Maschine
US17/355,961 US20210402606A1 (en) 2020-06-30 2021-06-23 Method and device for operating a machine
CN202110727240.1A CN113867137A (zh) 2020-06-30 2021-06-29 用于操作机器的方法和装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
DE102020208169.7A DE102020208169A1 (de) 2020-06-30 2020-06-30 Verfahren und Vorrichtung zum Betreiben einer Maschine

Publications (1)

Publication Number Publication Date
DE102020208169A1 true DE102020208169A1 (de) 2021-12-30

Family

ID=78826906

Family Applications (1)

Application Number Title Priority Date Filing Date
DE102020208169.7A Pending DE102020208169A1 (de) 2020-06-30 2020-06-30 Verfahren und Vorrichtung zum Betreiben einer Maschine

Country Status (3)

Country Link
US (1) US20210402606A1 (de)
CN (1) CN113867137A (de)
DE (1) DE102020208169A1 (de)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
DE102021204697A1 (de) 2021-05-10 2022-11-10 Robert Bosch Gesellschaft mit beschränkter Haftung Verfahren zum Steuern einer Robotervorrichtung
DE102022206381A1 (de) 2022-06-24 2024-01-04 Robert Bosch Gesellschaft mit beschränkter Haftung Verfahren zum Steuern einer Robotervorrichtung

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
DE102019216229A1 (de) 2019-10-07 2021-04-08 Robert Bosch Gmbh Vorrichtung und Verfahren zum Steuern einer Robotervorrichtung
DE102019216560A1 (de) 2019-10-28 2021-04-29 Robert Bosch Gmbh Verfahren und Vorrichtung zum Trainieren von Manipulationsfertigkeiten eines Robotersystems

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
DE102019216229A1 (de) 2019-10-07 2021-04-08 Robert Bosch Gmbh Vorrichtung und Verfahren zum Steuern einer Robotervorrichtung
DE102019216560A1 (de) 2019-10-28 2021-04-29 Robert Bosch Gmbh Verfahren und Vorrichtung zum Trainieren von Manipulationsfertigkeiten eines Robotersystems

Non-Patent Citations (4)

* Cited by examiner, † Cited by third party
Title
Havoutis I., Calinon S. : Supervisory teleoperation with online learning and optimal control. In: 2017 IEEE International Conference on Robotics and Automation (ICRA), June 2017, 1534 - 1540. https://ieeexplore.ieee.org/stamp/stamp.jsp?tp=&arnumber=7989183 [abgerufen am 06.05.2021]
J. R. Hershey und P. A. Olsen, „Approximating the Kullback Leibler divergence between Gaussian mixture models", in Intl. Conf. on Acoustics, Speech and Signal Processing (ICASSP), vol. 4. IEEE, 2007, S. IV-317
Schwenkel L., GuoM., Bürger M.: Optimizing Sequences of Probabilistic Manipulation Skills Learned from Demonstration. In: 3rd Conference on Robot Learning (CoRL 2019), 2019, 273-282. http://proceedings.mlr.press/v100/schwenkel20a.html [abgerufen am 06.05.2021]
Xi B., Wang S., Ye X., Cai Y., Lu T., Wang R.: A robotic shared control teleoperation method based on learning from demonstrations. In: International Journal of Advanced Robotic Systems, Juli-August 2019, 1-13. https://journals.sagepub.com/doi/pdf/10.1177/1729881419857428 [abgerufen am 06.05.2021]

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
DE102021204697A1 (de) 2021-05-10 2022-11-10 Robert Bosch Gesellschaft mit beschränkter Haftung Verfahren zum Steuern einer Robotervorrichtung
DE102021204697B4 (de) 2021-05-10 2023-06-01 Robert Bosch Gesellschaft mit beschränkter Haftung Verfahren zum Steuern einer Robotervorrichtung
DE102022206381A1 (de) 2022-06-24 2024-01-04 Robert Bosch Gesellschaft mit beschränkter Haftung Verfahren zum Steuern einer Robotervorrichtung

Also Published As

Publication number Publication date
CN113867137A (zh) 2021-12-31
US20210402606A1 (en) 2021-12-30

Similar Documents

Publication Publication Date Title
DE102019002065B4 (de) Maschinelle Lernvorrichtung, Robotersteuervorrichtung und Robotervisionssystem, das eine maschinelle Lernvorrichtung verwendet, und maschinelles Lernverfahren
DE102017007729B4 (de) Maschinenlerneinrichtung, Robotersystem und Maschinenlernverfahren zum Lernen einer Bewegung eines Roboters, der an einer gemeinsam durch einen Menschen und einen Roboter ausgeführten Aufgabe beteiligt ist
DE102019216229B4 (de) Vorrichtung und Verfahren zum Steuern einer Robotervorrichtung
DE112019002310B4 (de) Ausführen einer &#34;peg in hole&#34;-aufgabe mit unbekannter neigung
DE102014108287A1 (de) Schnelles Erlernen durch Nachahmung von Kraftdrehmoment-Aufgaben durch Roboter
DE102019216560B4 (de) Verfahren und Vorrichtung zum Trainieren von Manipulationsfertigkeiten eines Robotersystems
DE102020005646A1 (de) Slot-Filling mit kontextbezogenen Informationen
DE102020208169A1 (de) Verfahren und Vorrichtung zum Betreiben einer Maschine
DE102020207085A1 (de) Verfahren zum steuern eines roboters und robotersteuereinheit
DE102018001571A1 (de) Laserverarbeitungsgerät und Vorrichtung zum maschinellen Lernen
DE102020214633A1 (de) Vorrichtung und Verfahren zum Steuern einer Robotervorrichtung
DE102020214231A1 (de) Verfahren zum steuern einer robotervorrichtung und robotersteuereinrichtung
DE102020204351A1 (de) Vorrichtung und verfahren zum planen einer mehrzahl von aufträgen für eine vielzahl von maschinen
DE102020210352A1 (de) Verfahren und Vorrichtung zum Transferlernen zwischen modifizierten Aufgaben
WO2020187591A1 (de) Verfahren und vorrichtung zum ansteuern eines roboters
DE102021201777A1 (de) Verfahren zur Verhaltenserkennung, Vorrichtung zur Verhaltenserkennung und computerlesbares Aufzeichnungsmedium
DE102020212658A1 (de) Vorrichtung und Verfahren zum Steuern einer Robotervorrichtung
DE112020004135T5 (de) Robotersteuerungsvorrichtung
DE102020124379A1 (de) Robotersystem, das einen Arbeitsvorgang eines Arbeiters unterstützt, Steuerverfahren, Maschinenlernvorrichtung und Maschinenlernverfahren
DE102020211648A1 (de) Vorrichtung und Verfahren zum Steuern einer Robotervorrichtung
DE102022201116B4 (de) Verfahren zum Steuern einer Robotervorrichtung
DE102019207410A1 (de) Verfahren und Vorrichtung für eine automatisierte Beeinflussung eines Aktuators
DE102019210372A1 (de) Verfahren, Vorrichtung und Computerprogramm zum Erstellen einer Strategie für einen Roboter
DE102019000749A1 (de) Steuervorrichtung und maschinelle Lernvorrichtung
DE102019201045B4 (de) Verfahren, Vorrichtung und Computerprogramm zum Ermitteln einer Aktion oder Trajektorie eines Roboters

Legal Events

Date Code Title Description
R163 Identified publications notified