-
Technisches Gebiet
-
Die Erfindung betrifft ein computerimplementiertes maschinelles Lernsystem, eine Trainingsvorrichtung zum Trainieren des maschinellen Lernsystems, ein Computerprogramm und ein maschinenlesbares Speichermedium.
-
Stand der Technik
-
Aus der
EP 19 174 931.6 ist ein Verfahren zum robusten Trainieren eines maschinellen Lernsystems gegenüber adverseriellen Beispielen bekannt.
-
Vorteile der Erfindung
-
Aufzeichnungen von Sensoren unterliegen typischerweise einem mehr oder weniger starken Rauschen, welches sich in den durch die Sensoren ermittelten Sensorsignalen niederschlägt. Bei einer automatischen Verarbeitung solcher Sensorsignale mittels eines maschinellen Lernsystems ist dieses Rauschen eine typische Störquelle, die eine Vorhersagegenauigkeit des maschinellen Lernsystems erheblich verschlechtern kann. Insbesondere bei einer Verarbeitung von Zeitreihen von Sensorsignalen kann ein Rauschen einen stark negativen Einfluss auf die Vorhersagegenauigkeit haben.
-
Es ist daher wünschenswert ein maschinelles Lernsystem zur Verarbeitung von Zeitreihen derart zu trainieren, dass das maschinelle Lernsystem robust gegenüber Rauschen wird. Der Vorteil des maschinellen Lernsystems mit Merkmalen gemäß des Anspruchs 1 ist, dass das maschinelle Lernsystem durch seine Konstruktion robuster gegenüber Rauschen wird. Überraschenderweise konnten die Erfinder feststellen, dass Methoden des adverseriellen Trainierens (engl. adversarial training) auch verwendet werden können, um das maschinelles Lernsystem derart zu trainieren, dass es robust gegenüber Rauschen wird.
-
Offenbarung der Erfindung
-
In einem ersten Aspekt betrifft die Erfindung ein computerimplementiertes maschinelles Lernsystem (60), wobei das maschinelle Lernsystem eingerichtet ist basierend auf einer Zeitreihe von Eingabesignalen eines technischen Systems ein Ausgabesignal zu ermitteln, welches eine Klassifikation und/oder ein Regressionsergebnis zumindest eines ersten Betriebszustands und/oder zumindest einer ersten Betriebsgröße des technischen Systems charakterisiert, wobei ein Training des maschinellen Lernsystems folgende Schritte umfasst:
- a. Ermitteln einer ersten Trainingszeitreihe von Eingabesignalen aus einer Mehrzahl von Trainingszeitreihen sowie einem mit der ersten Trainingszeitreihe korrespondierenden gewünschten Trainingsausgabesignal, wobei das gewünschte Trainingsausgabesignal eine gewünschte Klassifikation und/oder gewünschtes Regressionsergebnis der ersten Trainingszeitreihe charakterisiert;
- b. Ermitteln einer schlechtestmöglichen Trainingszeitreihe, wobei die schlechtestmögliche Trainingszeitreihe eine Überlagerung der ersten Trainingszeitreihe mit einem ermittelten ersten Rauschsignal charakterisiert;
- c. Ermitteln eines Trainingsausgabesignals basierend auf der schlechtestmöglichen Trainingszeitreihe mittels des maschinellen Lernsystems;
- d. Anpassen zumindest eines Parameters des maschinellen Lernsystems gemäß eines Gradienten eines Verlustwertes, wobei der Verlustwert eine Abweichung des gewünschten Ausgabesignals zum ermittelten Trainingsausgabesignal charakterisiert.
-
Vorzugsweise können die Eingabesignale der Zeitreihe jeweils einen zweiten Betriebszustand und/oder eine zweite Betriebsgröße des technischen Systems zu einem vordefinierten Zeitpunkt charakterisieren. Ein Eingabesignal kann insbesondere mittels eines Sensors, insbesondere eines Sensors des technischen Systems, aufgezeichnet werden. Hierbei kann der erste Betriebszustand oder die erste Betriebsgröße insbesondere eine Temperatur und/oder einen Druck und/oder eine Spannung und/oder eine Kraft und/oder eine Geschwindigkeit und/oder eine Drehrate und/oder ein Drehmoment des technischen Systems charakterisiert.
-
Das maschinelle Lernsystem kann daher auch als ein virtueller Sensor verstanden werden, mittels welchem ein erster Betriebszustand bzw. eine erste Betriebsgröße von einer Mehrzahl von zweiten Betriebszuständen bzw. zweiten Betriebsgrößen abgeleitet werden kann.
-
Das Training des maschinellen Lernsystems kann als ein überwachtes Training verstanden werden. Die für das Training verwendete erste Trainingszeitreihen kann vorzugsweise Eingabesignale umfassen, die jeweils einen zweiten Betriebszustand und/oder eine zweite Betriebsgröße des technischen Systems oder eines baugleichen technischen Systems oder eines bauähnlichen technischen Systems oder eine Simulation des zweiten Betriebszustandes und/oder der zweiten Betriebsgröße zu einem vordefinierten Zeitpunkt charakterisieren. Mit anderen Worten können Trainingszeitreihen der Mehrzahl von Trainingszeitreihen auf Eingabesignalen des technischen Systems selber beruhen. Alternativ oder zusätzlich ist möglich, dass die Trainingszeitreihe Eingabesignale von einem ähnlichen technischen System aufgezeichnet werden, wobei ein ähnliches technisches System beispielsweise ein Prototyp oder eine Vorentwicklung des technischen Systems sein kann. Auch ist möglich, dass aus einem anderen technischen System die Eingabesignale der Trainingszeitreihe ermittelt werden, z.B. aus einem anderen technischen System eines gleichen Produktionsreihe oder Produktionsserie. Auch ist möglich, dass die Eingabesignale der Trainingszeitreihe auf Basis einer Simulation des technischen Systems ermittelt werden.
-
Typischerweise sind die Eingabesignale der ersten Trainingszeitreihe den Eingabesignalen der Zeitreihe ähnlich, insbesondere sollten die Eingabesignale der Trainingszeitreihe die gleiche zweite Betriebsgröße charakterisieren wie die Eingabesignale der Zeitreihe.
-
Zum Training können die Trainingszeitreihen insbesondere aus einer Datenbank bereitgestellt werden, wobei die Datenbank die Mehrzahl von Trainingszeitreihen umfasst. Das maschinelle Lernsystem kann die Schritte a. - d. vorzugsweise iterativ durchführen. Vorzugsweise kann in jeder Iteration auch eine Mehrzahl von Trainingszeitreihen zur Ermittlung des Verlustwertes verwendet werden, d.h. es kann mit einem Stapel (engl. batch) von Trainingszeitreihen trainiert werden.
-
Die Ausgabesignale können eine Klassifikation und/oder ein Regressionsergebnis umfassen. Als Regressionsergebnis ist hierbei ein Ergebnis einer Regression zu verstehen. Das maschinelle Lernsystem kann daher als Klassifikator und/oder Regressor angesehen werden. Unter Regressor kann eine Vorrichtung verstanden werden, die bezüglich zumindest eines reellen Wertes zumindest einen reellen Wert prädiziert.
-
Die Zeitreihe und die Trainingszeitreihe liegt jeweils vorzugsweise als Spaltenvektor vor, wobei jeweils eine Dimension des Vektors einen Messwert zu einem bestimmten Zeitpunkt innerhalb der Zeitreihe oder der Trainingszeitreihe charakterisiert.
-
Die schlechtestmögliche Trainingszeitreihe kann als eine Trainingszeitreihe verstanden werden, die entsteht, wenn die erste Trainingszeitreihe mit einem Rauschsignal derart überlagert wird, dass ein Abstand einer Trainingsausgabe des maschinellen Lernsystems für die so überlagerte Trainingszeitreihe zur für die erste Trainingszeitreihe ermittelte Trainingsausgabe größtmöglich wird. Insbesondere kann das Rauschen noch bezüglich geeigneter Randbedingungen eingeschränkt werden, sodass die schlechtestmögliche Trainingszeitreihe kein triviales Ergebnis der Überlagerung ist. In der beschriebenen Erfindung wird das Rauschsignal insbesondere derart eingeschränkt, dass es einem erwartbaren Rauschsignal entspricht. Das erwartbare Rauschsignal kann insbesondere basierend auf der Mehrzahl von Trainingszeitreihen verstanden werden. In diesem Sinne kann das Verfahren als eine Form von adverseriellem Training verstanden werden, wobei das adverserielle Trainings vorteilhaft auf ein für die Trainingszeitreihen charakteristisches Rauschen eingeschränkt wird. Die Erfinder konnten herausfinden, dass so das adverserielle Training auch überaschenderweise und vorteilhafterweise zum einem gegenüber Rauschen robusteren maschinellen Lernsystem führt.
-
Vorzugsweise kann in Schritt b. das erste Rauschsignal durch eine Optimierung derart ermittelt wird, dass ein Abstand eines zweiten Ausgabesignals zum gewünschten Ausgabesignal vergrößert wird, wobei das zweite Ausgabesignal vom maschinellen Lernsystem basierend auf einer Überlagerung der Trainingszeitreihe mit dem ersten Rauschsignal ermittelt wird.
-
Das Rauschsignal kann insbesondere in Form eines Vektors vorliegen, wobei der Vektor die gleiche Dimensionalität hat wie die Vektorform der ersten Trainingszeitreihe. Die Überlagerung kann dann zum Beispiel als eine Summe des Vektors der ersten Trainingszeitreihe und des Vektors des Rauschsignals. Als Optimierung kann hier eine mathematische Optimierung unter Randbedingungen verstanden werden. Als Randbedingungen kann im Verfahren insbesondere ein zu erwartendes Rauschsignal eingebracht werden.
-
In einer bevorzugten Ausbildung des maschinellen Lernsystems kann daher in Schritt b. das erste Rauschsignal basierend auf einem zu erwartenden Rauschwert der Mehrzahl von Trainingszeitreihen ermittelt wird, wobei der zu erwartende Rauschwert eine durchschnittliche Stärke eines Rauschens der Trainingszeitreihen charakterisiert.
-
Insbesondere kann der zu erwartende Rauschwert ein durchschnittlicher Abstand einer Trainingszeitreihe der Mehrzahl von Trainingszeitreihen von einer jeweiligen entrauschten Trainingszeitreihe ist.
-
In einer bevorzugten Ausbildung des maschinellen Lernsystems kann der zu erwartende Rauschwert gemäß der Formel
ermittelt wird, wobei n die Anzahl der Trainingszeitreihen der Mehrzahl von Trainingszeitreihen ist, z
i die zur Trainingszeitreihe
xi entrauschte Trainingszeitreihe ist und ||·||
2 eine Euklidische Norm ist.
-
Dies kann derart verstanden werden, als dass eine Trainingszeitreihe zunächst entrauscht wird und anschließend ein Abstand der Trainingszeitreihe zur entrauschten Trainingszeitreihe ermittelt wird. Der durchschnittliche Abstand über alle oder zumindest Teile der Mehrzahl von Trainingszeitreihen kann dann als das zu erwartende Rauschen verstanden werden. Daher kann das zu erwartende Rauschen als ein skalarer Wert verstanden werden.
-
Bevorzugt kann die entrauschte Trainingszeitreihe gemäß der Formel
ermittelt werden, wobei
eine pseudo-inverse Kovarianzmatrix ist.
-
Hierbei kann die pseudo-inverse Kovarianzmatrix durch folgende Schritte ermittelt wird:
- e. Ermitteln einer zweiten Kovarianzmatrix, wobei die zweite Kovarianzmatrix die Kovarianzmatrix der Mehrzahl von Trainingszeitreihen (xi ) ist;
- f. Ermitteln einer vordefinierten Mehrzahl von größten Eigenwerten der zweiten Kovarianzmatrix sowie zu den Eigenwerten korrespondieren Eigenvektoren;
- g. Ermitteln der pseudo-inversen Kovarianzmatrix gemäß der Formel
wobei λi der i-te Eigenwert der Mehrzahl von größten Eigenwerten ist und k die Anzahl von größten Eigenwerten in der vordefinierten Mehrzahl von größten Eigenwerten ist.
-
Die pseudo-inverse Kovarianzmatrix kann als Teil eines Rauschmodells verstanden werden. Mittels der pseudo-inversen Kovarianzmatrix kann wie oben beschrieben die erste Trainingszeitreihe xi entrauscht werden und so die entrauschte Trainingszeitreihe zi ermittelt werden. Ein Abstand der ersten Trainingszeitreihe zur entrauschten Trainingszeitreihe kann dann als ein Rauschwert der ersten Trainingszeitreihe verstanden werden.
-
Die Mehrzahl von größten Eigenwerten umfasst daher eine vordefinierte Anzahl von Eigenwerten, wobei nur die größten Eigenwerte der Kovarianzmatrix in der Mehrzahl von größten Eigenwerten enthalten sind.
-
Die Eigenvektoren können hierbei als Spaltenvektoren verstanden werden.
-
In einer bevorzugten Ausbildung des maschinellen Lernsystems kann das erste Rauschsignal basierend auf einer bereitgestellten adverseriellen Perturbation (engl. adversarial perturbation) ermittelt wird, wobei die bereitgestellte adverserielle Perturbation gemäß des zu erwartenden Rauschwerts eingeschränkt ist.
-
Als adverserielle Perturbation kann eine Perturbation verstanden werden, mittels welcher ein adverserielles Beispiel (engl. adversarial example) erzeugt wird, wenn eine entsprechende Trainingszeitreihe mit der adverseriellen Perturbation überlagert wird.
-
In einer bevorzugten Ausbildung des maschinellen Lernsystems wird die adverserielle Perturbation derart eingeschränkt ist, dass ein Rauschwert der adverseriellen Perturbation nicht größer ist als der zu erwartende Rauschwert. Bevorzugt kann die adverserielle Perturbation gemäß folgender Schritte bereitgestellt wird:
- h. Bereitstellen einer ersten adverseriellen Perturbation;
- i. Ermitteln einer zweiten adverseriellen Perturbation, wobei die zweite adverserielle Perturbation stärker ist als die erste adverserielle Perturbation;
- j. Falls ein Abstand der zweiten adverseriellen Perturbation zur ersten adverseriellen Perturbation kleiner oder gleich einem vordefinierten Schwellenwert ist, bereitstellen der zweiten adverseriellen Perturbation als adverserielle Perturbation;
- k. Andernfalls, falls der Rauschwert der zweiten adverserielle Perturbation kleiner oder gleich dem zu erwartenden Rauschwert ist, ausführen des Schrittes i., wobei beim Ausführen des Schrittes i. die zweite adverseriellen Perturbation als erste adverserielle Perturbation verwendet wird;
- l. Andernfalls ermitteln einer projizierten Perturbation und Ausführen des Schrittes j., wobei beim Ausführen des Schrittes j. die projizierte Perturbation als zweite adverserielle Perturbation verwendet wird, ferner wobei die projizierte Perturbation durch eine Optimierung derart ermittelt wird, dass ein Abstand der projizierten Perturbation zur zweiten adverseriellen Perturbation kleinstmöglich wird und der Rauschwert der projizierte Perturbation gleich dem zu erwartenden Rauschwert ist.
-
Die erste adverserielle Perturbation kann zufällig ermittelt werden oder zumindest einen vordefinierten Wert enthalten. Da eine adverserielle Perturbation vorzugsweise in Form eines Vektors vorliegt, kann die erste adverserielle Perturbation in Schritt h. beispielsweise ein Nullvektor oder ein Zufallsvektor sein.
-
Eine zweite adverserielle Perturbation kann als stärker als eine erste adverserielle Perturbation verstanden werden, wenn ein bezüglich einer mit der zweiten adverseriellen Perturbation überlagerten Trainingszeitreihe ermitteltes zweite Trainingsausgabesignal einen größeren Abstand zum gewünschten Trainingsausgabesignal der Trainingszeitreihe hat als ein bezüglich einer mit der ersten adverseriellen Perturbation überlagerten Trainingszeitreihe ermitteltes erstes Trainingsausgabesignal.
-
Ein Rauschwert einer adverseriellen Perturbation kann gemäß der Formel
ermittelt wird, wobei δ die adverserielle Perturbation ist.
-
Bevorzugt kann in Schritt i. die zweite adverserielle Perturbation gemäß der Formel
ermittelt wird, wobei δ
1 die erste adverserielle Perturbation ist, α ein vordefinierter Schrittweitenwert ist, C
k eine erste Kovarianzmatrix ist und g ein Gradient ist.
-
Diese Ausprägung kann als eine Anpassung eines projizierten Gradientenabstiegsverfahrens (engl. projected gradient descent) verstanden werdne, wobei der Gradient entsprechend dem Rauschmodell angepasst wird. Die Erfinder konnten feststellen, dass hierdurch das ermittelte Rauschsignal wesentlich näher an realen Rauschsignalen liegt an mittels normalem projizierten Gradientenabstieg ermittelte Rauschsignale. Durch das verbesserte Rauschsignal kann das maschinelle Lernsystem gegenüber zu erwartendem Rauschen wesentlich robuster gemacht werden.
-
Der Gradient g kann gemäß der Formel
ermittelt wird, wobei L eine Verlustfunktion ist,
ti das gewünschte Trainingsausgabesignal bezüglich der Trainingszeitreihe ist und f (x
i + δ
1) das Ergebnis des maschinellen Lernsystems ist, wenn dem maschinellen Lernsystem die mit der ersten adverseriellen Perturbation δ
1 überlagerte Trainingszeitreihe übergeben wird.
-
Kovarianzmatrix kann gemäß der Formel
ermittelt wird.
-
Die projizierte adverserielle Perturbation kann gemäß der Formel
ermittelt wird.
-
Des Weiteren ist möglich, dass das Ausgabesignal eine Regression zumindest des ersten Betriebszustands und/oder zumindest der ersten Betriebsgröße des technischen Systems charakterisiert, wobei der Verlustwert einen quadrierten Euklidischen Abstand zwischen der ermittelten Trainingsausgabe und der gewünschten Trainingsausgabe charakterisiert.
-
Insbesondere kann das technische System eine Einspritzvorrichtung einer Verbrennungskraftmaschine sein und die Eingabesignale der Zeitreihe jeweils zumindest einen Druckwert oder einen durchschnittlichen Druckwert der Einspritzvorrichtung, z.B. eines Common-Rail-Diesels, charakterisieren und das Ausgabesignal eine Einspritzmenge eines Kraftstoffs charakterisiert, wobei ferner die Eingabesignale der Trainingszeitreihe jeweils zumindest einen Druckwert oder einen durchschnittlichen Druckwert der Verbrennungskraftmaschine oder einer baugleichen Verbrennungskraftmaschine oder einer bauähnlichen Verbrennungskraftmaschine oder einer Simulation der Verbrennungskraftmaschine charakterisiert und das gewünschte Trainingsausgabesignal eine Einspritzmenge des Kraftstoffs charakterisiert.
-
Alternativ ist auch möglich, dass das technische System eine Fertigungsmaschine ist, die zumindest ein Werkstück fertigt, wobei die Eingabesignale der Zeitreihe jeweils eine Kraft und/oder ein Drehmoment der Fertigungsmaschine charakterisieren und das Ausgabesignal eine Klassifikation charakterisiert, ob das Werkstück korrekt gefertigt wurde oder nicht, wobei ferner die Eingabesignale der Trainingszeitreihe jeweils eine Kraft und/oder ein Drehmoment der Fertigungsmaschine oder einer baugleichen Fertigungsmaschine oder einer bauähnlichen Fertigungsmaschine oder einer Simulation der Fertigungsmaschine charakterisieren und das gewünschte Trainingsausgabesignal eine Klassifikation ist, ob ein Werkstück korrekt gefertigt wurde.
-
In einem weiteren Aspekt betrifft die Erfindung eine Trainingsvorrichtung, welche ausgebildet ist das maschinelle Lernsystem entsprechend der Schritte a. bis d. zu trainieren.
-
Nachfolgend werden Ausführungsformen der Erfindung unter Bezugnahme auf die beiliegenden Zeichnungen näher erläutert. In den Zeichnungen zeigen:
- 1 schematisch ein Trainingssystem zum Trainieren eines Klassifikators;
- 2 schematisch einen Aufbau eines Steuerungssystems zur Ansteuerung eines Aktors mittels des Klassifikators;
- 3 schematisch ein Ausführungsbeispiel zur Steuerung eines Fertigungssystems;
- 4 schematisch ein Ausführungsbeispiel zur Steuerung eines Einspritzsystems;
-
Beschreibung der Ausführungsbeispiele
-
1 zeigt ein Ausführungsbeispiel eines Trainingssystems (140) zum Trainieren eines maschinellen Lernsystems (60) mittels eines Trainingsdatensatzes (T). Vorzugsweise umfasst das maschinelle Lernsystem (60) ein neuronales Netz. Der Trainingsdatensatz (T) umfasst eine Mehrzahl von Trainingszeitreihen (xi ) von Eingabesignalen eines Sensors eines technischen Systems, wobei die Trainingszeitreihen (xi ) die zum Trainieren des maschinellen Lernsystems (60) verwendet werden, wobei der Trainingsdatensatz (T) ferner zu jeweils einer Trainingszeitreihe (xi ) ein gewünschtes Trainingsausgabesignal (ti ) umfasst, welches mit der Trainingszeitreihe (xi ) korrespondiert und eine Klassifikation und/oder ein Regressionsergebnis bzgl. der Trainingszeitreihe (xi ) charakterisiert. Die Trainingszeitreihen (xi ) liegen vorzugsweise in Form eines Vektors vor, wobei die Dimensionen jeweils Zeitpunkte der Trainingszeitreihen (xi ) charakterisieren.
-
Zum Training greift eine Trainingsdateneinheit (
150) auf eine computerimplementierte Datenbank (
St2 ) zu, wobei die Datenbank (
St2 ) den Trainingsdatensatz (
T) zur Verfügung stellt. Die Trainingsdateneinheit (
150) ermittelt aus der Mehrzahl von Trainingszeitreihen (
xi ) zunächst eine erste Kovarianzmatrix. Hierfür ermittelt die Trainingsdateneinheit (
150) zunächst die empirische Kovarianzmatrix der Trainingszeitreihen (
xi ). Anschließend werden die k größten Eigenwerte sowie die zugehörigen Eigenvektoren ermittelt und die erste Kovarianzmatrix C
k gemäß der Formel
Ermittelt, wobei λ
i zu den k größten Eigenwerten gehört, v
i der zu λ
i gehörige Eigenvektor in Spaltenform ist und k ein vordefinierter Wert. Zusätzlich wird eine pseudo-inverse Kovarianzmatrix
gemäß der Formel
ermittelt. Außerdem wird ein zu erwartender Rauchwert Δ gemäß der Formel
ermittelt, wobei n die Anzahl der Trainingszeitreihen (
xi ) im Trainingsdatensatz (
T) ist.
-
Die Trainingsdateneinheit (150) ermittelt anschließend aus dem Trainingsdatensatz (T) vorzugsweise zufällig zumindest eine erste Trainingszeitreihe (xi ) und das zur Trainingszeitreihe (xi ) korrespondierende gewünschte Trainingsausgabesignal (ti ). Basierend auf dem maschinellen Lernsystem (60) ermittelt die Trainingsdateneinheit (150) dann eine schlechtestmögliche Trainingszeitreihe (xi ) gemäß folgender Schritt:
- m. Bereitstellen einer ersten adverseriellen Perturbation δ1, wobei als erste adverserielle Perturbation ein Nullvektor gewählt wird der die gleiche Dimensionalität wie die erste Trainingszeitreihe (xi ) hat;
- n. Ermitteln eines Gradienten g gemäß der Formel
wobei f (xi + δ1) die Ausgabe des maschinellen Lernsystems (60) bezüglich einer Überlagerung der ersten Trainingszeitreihe;
- o. Ermitteln einer zweiten adverseriellen Perturbation gemäß der Formel
wobei α eine vordefinierte Schrittweite ist;
- p. Falls ein Euklidischer Abstand der zweiten adverseriellen Perturbation zur ersten adverseriellen Perturbation kleiner oder gleich einem vordefinierten Schwellenwert ist, bereitstellen der zweiten adverseriellen Perturbation als adverserielle Perturbation δ;
- q. Andernfalls, falls der Rauschwert
der zweiten adverserielle Perturbation kleiner oder gleich dem zu erwartenden Rauschwert Δ ist, ausführen des Schrittes n., wobei beim Ausführen des Schrittes n. die zweite adverseriellen Perturbation als erste adverserielle Perturbation verwendet wird;
- r. Andernfalls ermitteln einer projizierten Perturbation gemäß der Formel
und Ausführen des Schrittes p., wobei beim Ausführen des Schrittes p. die projizierte Perturbation als zweite adverserielle Perturbation verwendet wird.
-
Basierend auf der bereitgestellten adverseriellen Perturbation wird dann die schlechtestmögliche Trainingszeitreihe
gemäß der Formel
-
Dem maschinellen Lernsystem (
60) wird dann die schlechtestmögliche Trainingszeitreihe
übermittelt und vom maschinellen Lernsystem für die schlechtestmögliche Trainingszeitreihe
ein Trainingsausgabesignal (
yi ) ermittelt.
-
Das gewünschte Trainingsausgabesignal (ti ) und das ermittelte Trainingsausgabesignal (yi ) werden an eine Veränderungseinheit (180) übermittelt.
-
Basierend auf dem gewünschten Trainingsausgabesignal (ti ) und dem ermittelten Ausgabesignal (yi ) werden dann von der Veränderungseinheit (180) neue Parameter (Φ') für das maschinelle Lernsystem (60) bestimmt. Hierfür vergleicht die Veränderungseinheit (180) das gewünschte Trainingsausgabesignal (ti ) und das ermittelte Trainingsausgabesignal (yi ) mittels einer Verlustfunktion (engl. loss function). Die Verlustfunktion ermittelt einen ersten Verlustwert, der charakterisiert, wie weit das ermittelte Trainingsausgabesignal (yi ) vom gewünschten Trainingsausgabesignal (tii) abweicht. Als Verlustfunktion wird im Ausführungsbeispiel eine negative logarithmierte Plausibilitätsfunktion (engl. negative log-likehood function) gewählt. In alternativen Ausführungsbeispielen sind auch andere Verlustfunktion denkbar.
-
Die Veränderungseinheit (180) ermittelt auf Grundlage des ersten Verlustwertes die neuen Parameter (Φ'). Im Ausführungsbeispiel geschieht dies mittels eines Gradientenabstiegsverfahren, vorzugsweise Stochastic Gradient Descent, Adam, oder AdamW.
-
Die ermittelten neuen Parameter (Φ') werden in einem Modellparameterspeicher (St1 ) gespeichert. Vorzugsweise werden die ermittelten neuen Parameter (Φ') als Parameter (Φ) dem Klassifikator (60) bereitgestellt.
-
In weiteren bevorzugten Ausführungsbeispielen wird das beschriebene Training iterativ für eine vordefinierte Anzahl an Iterationsschritten wiederholt oder iterativ wiederholt, bis der erste Verlustwert einen vordefinierten Schwellenwert unterschreitet. Alternativ oder zusätzlich ist auch vorstellbar, dass das Training beendet wird, wenn ein durchschnittlicher erster Verlustwert bezüglich eines Test- oder Validierungsdatensatzes einen vordefinierten Schwellenwert unterschreitet.
-
In mindestens einer der Iterationen werden die in einer vorherigen Iteration bestimmten neuen Parameter (Φ') als Parameter (Φ) des Klassifikators (60) verwendet.
-
Des Weiteren kann das Trainingssystem (140) mindestens einen Prozessor (145) und mindestens ein maschinenlesbares Speichermedium (146) umfassen, welches Befehle enthält, welche, wenn sie durch den Prozessor (145) ausgeführt werden, das Trainingssystem (140) veranlassen, ein Trainingsverfahren nach einem der Aspekte der Erfindung auszuführen.
-
2 zeigt ein Steuerungssystem (40) welches mittels eines maschinellen Lernsystems (60) einen Aktor (10) eines technischen Systems steuert, wobei das maschinelle Lernsystem (60) mittels der Trainingsvorrichtung (140) trainiert wurde. In vorzugsweise regelmäßigen zeitlichen Abständen wird eine zweite Betriebsgröße oder ein zweiter Betriebszustand mit einem Sensor (30) erfasst. Das erfasste Eingabesignal (S) des Sensors (30) wird an das Steuerungssystem (40) übermittelt. Das Steuerungssystem (40) empfängt somit eine Folge von Eingabesignale (S). Das Steuerungssystem (40) ermittelt hieraus Ansteuersignale (A), welche an den Aktor (10) übertragen werden.
-
Das Steuerungssystem (40) empfängt die Folge von Eingabesignalen (S) des Sensors (30) in einer Empfangseinheit (50), die die Folge von Eingabesignalen (S) in eine Zeitreihe (x) umwandelt. Dies kann zum Beispiel über ein Hintereinanderreihen einer vordefinierten Anzahl von zuletzt aufgenommenen Eingabesignalen (S) erfolgen. Mit anderen Worten wird die Zeitreihe (x) abhängig von den Eingabesignalen (S) ermittelt. Die Folge von Eingabesignalen (x) wird dem maschinellen Lernsystem (60) zugeführt.
-
Das maschinelle Lernsystem (60) ermittelt aus der Zeitreihe (x) ein Ausgabesignal (y). Die Ausgabesignale (y) werden einer optionalen Umformeinheit (80) zugeführt, die hieraus Ansteuersignale (A) ermittelt, welche dem Aktor (10) zugeführt werden, um den Aktor (10) entsprechend anzusteuern.
-
Der Aktor (10) empfängt die Ansteuersignale (A), wird entsprechend angesteuert und führt eine entsprechende Aktion aus. Der Aktor (10) kann hierbei eine (nicht notwendigerweise baulich integrierte) Ansteuerlogik umfassen, welches aus dem Ansteuersignal (A) ein zweites Ansteuersignal ermittelt, mit dem dann der Aktor (10) angesteuert wird.
-
In weiteren Ausführungsformen umfasst das Steuerungssystem (40) den Sensor (30). In noch weiteren Ausführungsformen umfasst das Steuerungssystem (40) alternativ oder zusätzlich auch den Aktor (10).
-
In weiteren bevorzugten Ausführungsformen umfasst das Steuerungssystem (40) zumindest einen Prozessor (45) und zumindest ein maschinenlesbares Speichermedium (46), auf dem Anweisungen gespeichert sind, die dann, wenn sie auf dem zumindest einen Prozessor (45) ausgeführt werden, das Steuerungssystem (40) veranlassen, das erfindungsgemäße Verfahren auszuführen.
-
In alternativen Ausführungsformen ist alternativ oder zusätzlich zum Aktor (10) eine Anzeigeeinheit (10a) vorgesehen.
-
3 zeigt ein Ausführungsbeispiel, in dem das Steuerungssystem (40) zur Ansteuerung einer Fertigungsmaschine (11) eines Fertigungssystems (200) verwendet wird, indem ein die Fertigungsmaschine (11) steuernder Aktor (10) angesteuert wird. Bei der Fertigungsmaschine (11) kann es sich beispielsweise um eine Maschine zum Schweißen.
-
Bei dem Sensor (30) kann es vorzugsweise um einen Sensor (30), der eine Spannung des Schweißgeräts der Fertigungsmaschine (11) ermittelt. Das maschinelle Lernsystem (60) kann insbesondere derart trainiert sein, dass es auf Grund einer Zeitreihe (x) von Spannungen klassifiziert, ob der Schweißvorgang erfolgreich war oder nicht. Der Aktor (10) kann bei einem nicht erfolgreichen Schweißvorgang ein entsprechendes Werkstück automatisiert aussortieren.
-
In alternativen Ausführungsbeispiel ist auch möglich, dass die Fertigungsmaschine (11) mittels eines Drucks zwei Werkstücke fügt. In diesem Fall kann der Sensor (30) ein Drucksensor sein und das maschinelle Lernsystem (60) ermitteln, ob die Fügung korrekt war oder nicht.
-
4 zeigt ein Ausführungsbeispiel zur Steuerung eines Injektors (40) einer Verbrennungskraftmaschine. Im Ausführungsbeispiel ist der Sensor (30) ein Drucksensor, der einen Druck eines Einspritzsystems (10) ermittelt, welches den Injektor (40) mit Kraftstoff versorgt. Das maschinelle Lernsystem (60) kann insbesondere derart ausgebildet sein, dass es auf Basis der Zeitreihe (x) von Druckwerten eine Einspritzmenge des Kraftstoffs genau ermittelt.
-
Basierend auf der ermittelten Einspritzmenge kann dann der Aktor (10) in zukünftigen Einspritzvorgängen derart angesteuert werden, dass eine zu große Menge von eingespritztem Kraftstoff oder eine zu kleine Menge von eingespritzten Kraftstoff entsprechend kompensiert wird.
-
In alternativen Ausführungsformen ist alternativ oder zusätzlich zur Steuereinheit (40) vorgesehen, dass mittels des Ansteuersignals (A) zumindest eine weitere Vorrichtung (10a) angesteuert wird. Die Vorrichtung (10a) kann beispielsweise eine Pumpe eines Common-Rail-Systems sein, zu welchem der Injektor (20) gehört. Alternativ oder zusätzlich ist vorstellbar, dass die Vorrichtung ein Steuergerät der Verbrennungskraftmaschine ist. Alternativ oder zusätzlich ist auch vorstellbar, dass die Vorrichtung (10a) eine Anzeigeeinheit ist, mittels welcher einer Person (z.B. einem Fahrer oder einem Mechaniker) die vom maschinellen Lernsystem (60) ermittelte Kraftstoffmenge entsprechend angezeigt werden kann.
-
Der Begriff „Computer“ umfasst beliebige Geräte zur Abarbeitung vorgebbarer Rechenvorschriften. Diese Rechenvorschriften können in Form von Software vorliegen, oder in Form von Hardware, oder auch in einer Mischform aus Software und Hardware.
-
Im Allgemeinen kann eine Mehrzahl als indexiert verstanden werden, d.h. jedem Element der Mehrzahl wird ein eindeutiger Index zugewiesen, vorzugsweise durch Zuweisung aufeinanderfolgender Ganzzahlen an die in der Mehrzahl enthaltenen Elemente. Vorzugsweise, wenn eine Mehrzahl N Elemente umfasst, wobei N die Anzahl der Elemente in der Mehrzahl ist, werden den Elementen die ganzen Zahlen von 1 bis N zugewiesen.
-
ZITATE ENTHALTEN IN DER BESCHREIBUNG
-
Diese Liste der vom Anmelder aufgeführten Dokumente wurde automatisiert erzeugt und ist ausschließlich zur besseren Information des Lesers aufgenommen. Die Liste ist nicht Bestandteil der deutschen Patent- bzw. Gebrauchsmusteranmeldung. Das DPMA übernimmt keinerlei Haftung für etwaige Fehler oder Auslassungen.
-
Zitierte Patentliteratur
-