DE202020107432U1

DE202020107432U1 - Vorrichtung zur robusten Klassifikation und Regression von Zeitreihen

Info

Publication number: DE202020107432U1
Application number: DE202020107432.6U
Authority: DE
Original assignee: Robert Bosch GmbH
Current assignee: Robert Bosch GmbH
Priority date: 2020-12-21
Filing date: 2020-12-21
Publication date: 2021-01-22
Anticipated expiration: 2030-12-22
Also published as: WO2022135959A1; CN116670669A; DE102021201179A1; US20230419179A1

Abstract

Computerimplementiertes maschinelles Lernsystem (60), wobei das maschinelle Lernsystem (60) eingerichtet ist basierend auf einer Zeitreihe (x) von Eingabesignalen eines technischen Systems ein Ausgabesignal (y) zu ermitteln, welches eine Klassifikation und/oder ein Regressionsergebnis zumindest eines ersten Betriebszustands und/oder zumindest einer ersten Betriebsgröße des technischen Systems charakterisiert, wobei ein Training des maschinellen Lernsystems (60) folgende Schritte umfasst:
a. Ermitteln einer ersten Trainingszeitreihe (x_i) von Eingabesignalen aus einer Mehrzahl von Trainingszeitreihen (x_i) sowie einem mit der ersten Trainingszeitreihe (x_i) korrespondierenden gewünschten Trainingsausgabesignal (t_i), wobei das gewünschte Trainingsausgabesignal (t_i) eine gewünschte Klassifikation und/oder gewünschtes Regressionsergebnis der ersten Trainingszeitreihe (x_i) charakterisiert;
b. Ermitteln einer schlechtestmöglichen Trainingszeitreihe

(x_{i}^{'}),

wobei die schlechtestmögliche Trainingszeitreihe

(x_{i}^{'})

eine Überlagerung der ersten Trainingszeitreihe (x_i) mit einem ermittelten ersten Rauschsignal charakterisiert;
c. Ermitteln eines Trainingsausgabesignals (y_i) basierend auf der schlechtestmöglichen Trainingszeitreihe (x_i) mittels des maschinellen Lernsystems (60);
d. Anpassen zumindest eines Parameters des maschinellen Lernsystems (60) gemäß eines Gradienten eines Verlustwertes, wobei der Verlustwert eine Abweichung des gewünschten Ausgabesignals (t_i) zum ermittelten Trainingsausgabesignal (y_i) charakterisiert.

Description

Technisches Gebiet
Die Erfindung betrifft ein computerimplementiertes maschinelles Lernsystem, eine Trainingsvorrichtung zum Trainieren des maschinellen Lernsystems, ein Computerprogramm und ein maschinenlesbares Speichermedium.
Stand der Technik
Aus der EP 19 174 931.6 ist ein Verfahren zum robusten Trainieren eines maschinellen Lernsystems gegenüber adverseriellen Beispielen bekannt.
Vorteile der Erfindung
Aufzeichnungen von Sensoren unterliegen typischerweise einem mehr oder weniger starken Rauschen, welches sich in den durch die Sensoren ermittelten Sensorsignalen niederschlägt. Bei einer automatischen Verarbeitung solcher Sensorsignale mittels eines maschinellen Lernsystems ist dieses Rauschen eine typische Störquelle, die eine Vorhersagegenauigkeit des maschinellen Lernsystems erheblich verschlechtern kann. Insbesondere bei einer Verarbeitung von Zeitreihen von Sensorsignalen kann ein Rauschen einen stark negativen Einfluss auf die Vorhersagegenauigkeit haben.
Es ist daher wünschenswert ein maschinelles Lernsystem zur Verarbeitung von Zeitreihen derart zu trainieren, dass das maschinelle Lernsystem robust gegenüber Rauschen wird. Der Vorteil des maschinellen Lernsystems mit Merkmalen gemäß des Anspruchs 1 ist, dass das maschinelle Lernsystem durch seine Konstruktion robuster gegenüber Rauschen wird. Überraschenderweise konnten die Erfinder feststellen, dass Methoden des adverseriellen Trainierens (engl. adversarial training) auch verwendet werden können, um das maschinelles Lernsystem derart zu trainieren, dass es robust gegenüber Rauschen wird.
Offenbarung der Erfindung
In einem ersten Aspekt betrifft die Erfindung ein computerimplementiertes maschinelles Lernsystem (60), wobei das maschinelle Lernsystem eingerichtet ist basierend auf einer Zeitreihe von Eingabesignalen eines technischen Systems ein Ausgabesignal zu ermitteln, welches eine Klassifikation und/oder ein Regressionsergebnis zumindest eines ersten Betriebszustands und/oder zumindest einer ersten Betriebsgröße des technischen Systems charakterisiert, wobei ein Training des maschinellen Lernsystems folgende Schritte umfasst:

a. Ermitteln einer ersten Trainingszeitreihe von Eingabesignalen aus einer Mehrzahl von Trainingszeitreihen sowie einem mit der ersten Trainingszeitreihe korrespondierenden gewünschten Trainingsausgabesignal, wobei das gewünschte Trainingsausgabesignal eine gewünschte Klassifikation und/oder gewünschtes Regressionsergebnis der ersten Trainingszeitreihe charakterisiert;
b. Ermitteln einer schlechtestmöglichen Trainingszeitreihe, wobei die schlechtestmögliche Trainingszeitreihe eine Überlagerung der ersten Trainingszeitreihe mit einem ermittelten ersten Rauschsignal charakterisiert;
c. Ermitteln eines Trainingsausgabesignals basierend auf der schlechtestmöglichen Trainingszeitreihe mittels des maschinellen Lernsystems;
d. Anpassen zumindest eines Parameters des maschinellen Lernsystems gemäß eines Gradienten eines Verlustwertes, wobei der Verlustwert eine Abweichung des gewünschten Ausgabesignals zum ermittelten Trainingsausgabesignal charakterisiert.

Vorzugsweise können die Eingabesignale der Zeitreihe jeweils einen zweiten Betriebszustand und/oder eine zweite Betriebsgröße des technischen Systems zu einem vordefinierten Zeitpunkt charakterisieren. Ein Eingabesignal kann insbesondere mittels eines Sensors, insbesondere eines Sensors des technischen Systems, aufgezeichnet werden. Hierbei kann der erste Betriebszustand oder die erste Betriebsgröße insbesondere eine Temperatur und/oder einen Druck und/oder eine Spannung und/oder eine Kraft und/oder eine Geschwindigkeit und/oder eine Drehrate und/oder ein Drehmoment des technischen Systems charakterisiert.
Das maschinelle Lernsystem kann daher auch als ein virtueller Sensor verstanden werden, mittels welchem ein erster Betriebszustand bzw. eine erste Betriebsgröße von einer Mehrzahl von zweiten Betriebszuständen bzw. zweiten Betriebsgrößen abgeleitet werden kann.
Das Training des maschinellen Lernsystems kann als ein überwachtes Training verstanden werden. Die für das Training verwendete erste Trainingszeitreihen kann vorzugsweise Eingabesignale umfassen, die jeweils einen zweiten Betriebszustand und/oder eine zweite Betriebsgröße des technischen Systems oder eines baugleichen technischen Systems oder eines bauähnlichen technischen Systems oder eine Simulation des zweiten Betriebszustandes und/oder der zweiten Betriebsgröße zu einem vordefinierten Zeitpunkt charakterisieren. Mit anderen Worten können Trainingszeitreihen der Mehrzahl von Trainingszeitreihen auf Eingabesignalen des technischen Systems selber beruhen. Alternativ oder zusätzlich ist möglich, dass die Trainingszeitreihe Eingabesignale von einem ähnlichen technischen System aufgezeichnet werden, wobei ein ähnliches technisches System beispielsweise ein Prototyp oder eine Vorentwicklung des technischen Systems sein kann. Auch ist möglich, dass aus einem anderen technischen System die Eingabesignale der Trainingszeitreihe ermittelt werden, z.B. aus einem anderen technischen System eines gleichen Produktionsreihe oder Produktionsserie. Auch ist möglich, dass die Eingabesignale der Trainingszeitreihe auf Basis einer Simulation des technischen Systems ermittelt werden.
Typischerweise sind die Eingabesignale der ersten Trainingszeitreihe den Eingabesignalen der Zeitreihe ähnlich, insbesondere sollten die Eingabesignale der Trainingszeitreihe die gleiche zweite Betriebsgröße charakterisieren wie die Eingabesignale der Zeitreihe.
Zum Training können die Trainingszeitreihen insbesondere aus einer Datenbank bereitgestellt werden, wobei die Datenbank die Mehrzahl von Trainingszeitreihen umfasst. Das maschinelle Lernsystem kann die Schritte a. - d. vorzugsweise iterativ durchführen. Vorzugsweise kann in jeder Iteration auch eine Mehrzahl von Trainingszeitreihen zur Ermittlung des Verlustwertes verwendet werden, d.h. es kann mit einem Stapel (engl. batch) von Trainingszeitreihen trainiert werden.
Die Ausgabesignale können eine Klassifikation und/oder ein Regressionsergebnis umfassen. Als Regressionsergebnis ist hierbei ein Ergebnis einer Regression zu verstehen. Das maschinelle Lernsystem kann daher als Klassifikator und/oder Regressor angesehen werden. Unter Regressor kann eine Vorrichtung verstanden werden, die bezüglich zumindest eines reellen Wertes zumindest einen reellen Wert prädiziert.
Die Zeitreihe und die Trainingszeitreihe liegt jeweils vorzugsweise als Spaltenvektor vor, wobei jeweils eine Dimension des Vektors einen Messwert zu einem bestimmten Zeitpunkt innerhalb der Zeitreihe oder der Trainingszeitreihe charakterisiert.
Die schlechtestmögliche Trainingszeitreihe kann als eine Trainingszeitreihe verstanden werden, die entsteht, wenn die erste Trainingszeitreihe mit einem Rauschsignal derart überlagert wird, dass ein Abstand einer Trainingsausgabe des maschinellen Lernsystems für die so überlagerte Trainingszeitreihe zur für die erste Trainingszeitreihe ermittelte Trainingsausgabe größtmöglich wird. Insbesondere kann das Rauschen noch bezüglich geeigneter Randbedingungen eingeschränkt werden, sodass die schlechtestmögliche Trainingszeitreihe kein triviales Ergebnis der Überlagerung ist. In der beschriebenen Erfindung wird das Rauschsignal insbesondere derart eingeschränkt, dass es einem erwartbaren Rauschsignal entspricht. Das erwartbare Rauschsignal kann insbesondere basierend auf der Mehrzahl von Trainingszeitreihen verstanden werden. In diesem Sinne kann das Verfahren als eine Form von adverseriellem Training verstanden werden, wobei das adverserielle Trainings vorteilhaft auf ein für die Trainingszeitreihen charakteristisches Rauschen eingeschränkt wird. Die Erfinder konnten herausfinden, dass so das adverserielle Training auch überaschenderweise und vorteilhafterweise zum einem gegenüber Rauschen robusteren maschinellen Lernsystem führt.
Vorzugsweise kann in Schritt b. das erste Rauschsignal durch eine Optimierung derart ermittelt wird, dass ein Abstand eines zweiten Ausgabesignals zum gewünschten Ausgabesignal vergrößert wird, wobei das zweite Ausgabesignal vom maschinellen Lernsystem basierend auf einer Überlagerung der Trainingszeitreihe mit dem ersten Rauschsignal ermittelt wird.
Das Rauschsignal kann insbesondere in Form eines Vektors vorliegen, wobei der Vektor die gleiche Dimensionalität hat wie die Vektorform der ersten Trainingszeitreihe. Die Überlagerung kann dann zum Beispiel als eine Summe des Vektors der ersten Trainingszeitreihe und des Vektors des Rauschsignals. Als Optimierung kann hier eine mathematische Optimierung unter Randbedingungen verstanden werden. Als Randbedingungen kann im Verfahren insbesondere ein zu erwartendes Rauschsignal eingebracht werden.
In einer bevorzugten Ausbildung des maschinellen Lernsystems kann daher in Schritt b. das erste Rauschsignal basierend auf einem zu erwartenden Rauschwert der Mehrzahl von Trainingszeitreihen ermittelt wird, wobei der zu erwartende Rauschwert eine durchschnittliche Stärke eines Rauschens der Trainingszeitreihen charakterisiert.
Insbesondere kann der zu erwartende Rauschwert ein durchschnittlicher Abstand einer Trainingszeitreihe der Mehrzahl von Trainingszeitreihen von einer jeweiligen entrauschten Trainingszeitreihe ist.
In einer bevorzugten Ausbildung des maschinellen Lernsystems kann der zu erwartende Rauschwert gemäß der Formel $Δ = \frac{1}{n} \sum_{i = 1}^{n} {‖ x_{i} - C_{k}^{+} - z_{i} ‖}_{2}$
ermittelt wird, wobei n die Anzahl der Trainingszeitreihen der Mehrzahl von Trainingszeitreihen ist, z_i die zur Trainingszeitreihe x_i entrauschte Trainingszeitreihe ist und ||·||₂ eine Euklidische Norm ist.
Dies kann derart verstanden werden, als dass eine Trainingszeitreihe zunächst entrauscht wird und anschließend ein Abstand der Trainingszeitreihe zur entrauschten Trainingszeitreihe ermittelt wird. Der durchschnittliche Abstand über alle oder zumindest Teile der Mehrzahl von Trainingszeitreihen kann dann als das zu erwartende Rauschen verstanden werden. Daher kann das zu erwartende Rauschen als ein skalarer Wert verstanden werden.
Bevorzugt kann die entrauschte Trainingszeitreihe gemäß der Formel $z_{i} = C_{k}^{+} \cdot x_{i}$
ermittelt werden, wobei $C_{k}^{+}$
eine pseudo-inverse Kovarianzmatrix ist.
Hierbei kann die pseudo-inverse Kovarianzmatrix durch folgende Schritte ermittelt wird:

e. Ermitteln einer zweiten Kovarianzmatrix, wobei die zweite Kovarianzmatrix die Kovarianzmatrix der Mehrzahl von Trainingszeitreihen (x_i ) ist;
f. Ermitteln einer vordefinierten Mehrzahl von größten Eigenwerten der zweiten Kovarianzmatrix sowie zu den Eigenwerten korrespondieren Eigenvektoren;
g. Ermitteln der pseudo-inversen Kovarianzmatrix gemäß der Formel $C_{k}^{+} = \sum_{i = 1}^{k} \frac{1}{λ_{i}} \cdot v_{i} v_{i}^{T},$

_i

Die pseudo-inverse Kovarianzmatrix kann als Teil eines Rauschmodells verstanden werden. Mittels der pseudo-inversen Kovarianzmatrix kann wie oben beschrieben die erste Trainingszeitreihe x_i entrauscht werden und so die entrauschte Trainingszeitreihe z_i ermittelt werden. Ein Abstand der ersten Trainingszeitreihe zur entrauschten Trainingszeitreihe kann dann als ein Rauschwert der ersten Trainingszeitreihe verstanden werden.
Die Mehrzahl von größten Eigenwerten umfasst daher eine vordefinierte Anzahl von Eigenwerten, wobei nur die größten Eigenwerte der Kovarianzmatrix in der Mehrzahl von größten Eigenwerten enthalten sind.
Die Eigenvektoren können hierbei als Spaltenvektoren verstanden werden.
In einer bevorzugten Ausbildung des maschinellen Lernsystems kann das erste Rauschsignal basierend auf einer bereitgestellten adverseriellen Perturbation (engl. adversarial perturbation) ermittelt wird, wobei die bereitgestellte adverserielle Perturbation gemäß des zu erwartenden Rauschwerts eingeschränkt ist.
Als adverserielle Perturbation kann eine Perturbation verstanden werden, mittels welcher ein adverserielles Beispiel (engl. adversarial example) erzeugt wird, wenn eine entsprechende Trainingszeitreihe mit der adverseriellen Perturbation überlagert wird.
In einer bevorzugten Ausbildung des maschinellen Lernsystems wird die adverserielle Perturbation derart eingeschränkt ist, dass ein Rauschwert der adverseriellen Perturbation nicht größer ist als der zu erwartende Rauschwert. Bevorzugt kann die adverserielle Perturbation gemäß folgender Schritte bereitgestellt wird:

h. Bereitstellen einer ersten adverseriellen Perturbation;
i. Ermitteln einer zweiten adverseriellen Perturbation, wobei die zweite adverserielle Perturbation stärker ist als die erste adverserielle Perturbation;
j. Falls ein Abstand der zweiten adverseriellen Perturbation zur ersten adverseriellen Perturbation kleiner oder gleich einem vordefinierten Schwellenwert ist, bereitstellen der zweiten adverseriellen Perturbation als adverserielle Perturbation;
k. Andernfalls, falls der Rauschwert der zweiten adverserielle Perturbation kleiner oder gleich dem zu erwartenden Rauschwert ist, ausführen des Schrittes i., wobei beim Ausführen des Schrittes i. die zweite adverseriellen Perturbation als erste adverserielle Perturbation verwendet wird;
l. Andernfalls ermitteln einer projizierten Perturbation und Ausführen des Schrittes j., wobei beim Ausführen des Schrittes j. die projizierte Perturbation als zweite adverserielle Perturbation verwendet wird, ferner wobei die projizierte Perturbation durch eine Optimierung derart ermittelt wird, dass ein Abstand der projizierten Perturbation zur zweiten adverseriellen Perturbation kleinstmöglich wird und der Rauschwert der projizierte Perturbation gleich dem zu erwartenden Rauschwert ist.

Die erste adverserielle Perturbation kann zufällig ermittelt werden oder zumindest einen vordefinierten Wert enthalten. Da eine adverserielle Perturbation vorzugsweise in Form eines Vektors vorliegt, kann die erste adverserielle Perturbation in Schritt h. beispielsweise ein Nullvektor oder ein Zufallsvektor sein.
Eine zweite adverserielle Perturbation kann als stärker als eine erste adverserielle Perturbation verstanden werden, wenn ein bezüglich einer mit der zweiten adverseriellen Perturbation überlagerten Trainingszeitreihe ermitteltes zweite Trainingsausgabesignal einen größeren Abstand zum gewünschten Trainingsausgabesignal der Trainingszeitreihe hat als ein bezüglich einer mit der ersten adverseriellen Perturbation überlagerten Trainingszeitreihe ermitteltes erstes Trainingsausgabesignal.
Ein Rauschwert einer adverseriellen Perturbation kann gemäß der Formel $r (δ, C_{k}^{+}) = {‖ δ - C_{k}^{+} \cdot δ ‖}_{2}$
ermittelt wird, wobei δ die adverserielle Perturbation ist.
Bevorzugt kann in Schritt i. die zweite adverserielle Perturbation gemäß der Formel $δ_{2} = δ_{1} + α \cdot C_{k} \cdot g$
ermittelt wird, wobei δ₁ die erste adverserielle Perturbation ist, α ein vordefinierter Schrittweitenwert ist, C_k eine erste Kovarianzmatrix ist und g ein Gradient ist.
Diese Ausprägung kann als eine Anpassung eines projizierten Gradientenabstiegsverfahrens (engl. projected gradient descent) verstanden werdne, wobei der Gradient entsprechend dem Rauschmodell angepasst wird. Die Erfinder konnten feststellen, dass hierdurch das ermittelte Rauschsignal wesentlich näher an realen Rauschsignalen liegt an mittels normalem projizierten Gradientenabstieg ermittelte Rauschsignale. Durch das verbesserte Rauschsignal kann das maschinelle Lernsystem gegenüber zu erwartendem Rauschen wesentlich robuster gemacht werden.
Der Gradient g kann gemäß der Formel $g = \nabla_{x i} [L ((x_{i} + δ_{1}), t_{i})]$
ermittelt wird, wobei L eine Verlustfunktion ist, t_i das gewünschte Trainingsausgabesignal bezüglich der Trainingszeitreihe ist und f (x_i + δ₁) das Ergebnis des maschinellen Lernsystems ist, wenn dem maschinellen Lernsystem die mit der ersten adverseriellen Perturbation δ₁ überlagerte Trainingszeitreihe übergeben wird.
Kovarianzmatrix kann gemäß der Formel $C_{k}^{} = \sum_{i = 1}^{k} λ_{i} \cdot v_{i} v_{i}^{T}$
ermittelt wird.
Die projizierte adverserielle Perturbation kann gemäß der Formel $δ_{p} = \underset{d, r (d, C_{k}^{+}) = Δ}{argmin} {‖ d - δ_{2} ‖}_{2}$
ermittelt wird.
Des Weiteren ist möglich, dass das Ausgabesignal eine Regression zumindest des ersten Betriebszustands und/oder zumindest der ersten Betriebsgröße des technischen Systems charakterisiert, wobei der Verlustwert einen quadrierten Euklidischen Abstand zwischen der ermittelten Trainingsausgabe und der gewünschten Trainingsausgabe charakterisiert.
Insbesondere kann das technische System eine Einspritzvorrichtung einer Verbrennungskraftmaschine sein und die Eingabesignale der Zeitreihe jeweils zumindest einen Druckwert oder einen durchschnittlichen Druckwert der Einspritzvorrichtung, z.B. eines Common-Rail-Diesels, charakterisieren und das Ausgabesignal eine Einspritzmenge eines Kraftstoffs charakterisiert, wobei ferner die Eingabesignale der Trainingszeitreihe jeweils zumindest einen Druckwert oder einen durchschnittlichen Druckwert der Verbrennungskraftmaschine oder einer baugleichen Verbrennungskraftmaschine oder einer bauähnlichen Verbrennungskraftmaschine oder einer Simulation der Verbrennungskraftmaschine charakterisiert und das gewünschte Trainingsausgabesignal eine Einspritzmenge des Kraftstoffs charakterisiert.
Alternativ ist auch möglich, dass das technische System eine Fertigungsmaschine ist, die zumindest ein Werkstück fertigt, wobei die Eingabesignale der Zeitreihe jeweils eine Kraft und/oder ein Drehmoment der Fertigungsmaschine charakterisieren und das Ausgabesignal eine Klassifikation charakterisiert, ob das Werkstück korrekt gefertigt wurde oder nicht, wobei ferner die Eingabesignale der Trainingszeitreihe jeweils eine Kraft und/oder ein Drehmoment der Fertigungsmaschine oder einer baugleichen Fertigungsmaschine oder einer bauähnlichen Fertigungsmaschine oder einer Simulation der Fertigungsmaschine charakterisieren und das gewünschte Trainingsausgabesignal eine Klassifikation ist, ob ein Werkstück korrekt gefertigt wurde.
In einem weiteren Aspekt betrifft die Erfindung eine Trainingsvorrichtung, welche ausgebildet ist das maschinelle Lernsystem entsprechend der Schritte a. bis d. zu trainieren.
Nachfolgend werden Ausführungsformen der Erfindung unter Bezugnahme auf die beiliegenden Zeichnungen näher erläutert. In den Zeichnungen zeigen:

1 schematisch ein Trainingssystem zum Trainieren eines Klassifikators;
2 schematisch einen Aufbau eines Steuerungssystems zur Ansteuerung eines Aktors mittels des Klassifikators;
3 schematisch ein Ausführungsbeispiel zur Steuerung eines Fertigungssystems;
4 schematisch ein Ausführungsbeispiel zur Steuerung eines Einspritzsystems;

Beschreibung der Ausführungsbeispiele
1 zeigt ein Ausführungsbeispiel eines Trainingssystems (140) zum Trainieren eines maschinellen Lernsystems (60) mittels eines Trainingsdatensatzes (T). Vorzugsweise umfasst das maschinelle Lernsystem (60) ein neuronales Netz. Der Trainingsdatensatz (T) umfasst eine Mehrzahl von Trainingszeitreihen (x_i ) von Eingabesignalen eines Sensors eines technischen Systems, wobei die Trainingszeitreihen (x_i ) die zum Trainieren des maschinellen Lernsystems (60) verwendet werden, wobei der Trainingsdatensatz (T) ferner zu jeweils einer Trainingszeitreihe (x_i ) ein gewünschtes Trainingsausgabesignal (t_i ) umfasst, welches mit der Trainingszeitreihe (x_i ) korrespondiert und eine Klassifikation und/oder ein Regressionsergebnis bzgl. der Trainingszeitreihe (x_i ) charakterisiert. Die Trainingszeitreihen (x_i ) liegen vorzugsweise in Form eines Vektors vor, wobei die Dimensionen jeweils Zeitpunkte der Trainingszeitreihen (x_i ) charakterisieren.
Zum Training greift eine Trainingsdateneinheit (150) auf eine computerimplementierte Datenbank (St₂ ) zu, wobei die Datenbank (St₂ ) den Trainingsdatensatz (T) zur Verfügung stellt. Die Trainingsdateneinheit (150) ermittelt aus der Mehrzahl von Trainingszeitreihen (x_i ) zunächst eine erste Kovarianzmatrix. Hierfür ermittelt die Trainingsdateneinheit (150) zunächst die empirische Kovarianzmatrix der Trainingszeitreihen (x_i ). Anschließend werden die k größten Eigenwerte sowie die zugehörigen Eigenvektoren ermittelt und die erste Kovarianzmatrix C_k gemäß der Formel $C_{k} = \sum_{i = 1}^{k} λ_{i} \cdot v_{i} v_{i}^{T}$
Ermittelt, wobei λ_i zu den k größten Eigenwerten gehört, v_i der zu λ_i gehörige Eigenvektor in Spaltenform ist und k ein vordefinierter Wert. Zusätzlich wird eine pseudo-inverse Kovarianzmatrix $C_{k}^{+}$
gemäß der Formel $C_{k}^{+} = \sum_{i = 1}^{k} \frac{1}{λ_{i}} \cdot v_{i} v_{i}^{T}$
ermittelt. Außerdem wird ein zu erwartender Rauchwert Δ gemäß der Formel $Δ = \frac{1}{n} \sum_{i = 1}^{n} {‖ x_{i} - C_{k}^{+} - x_{i} ‖}_{2}$
ermittelt, wobei n die Anzahl der Trainingszeitreihen (x_i ) im Trainingsdatensatz (T) ist.
Die Trainingsdateneinheit (150) ermittelt anschließend aus dem Trainingsdatensatz (T) vorzugsweise zufällig zumindest eine erste Trainingszeitreihe (x_i ) und das zur Trainingszeitreihe (x_i ) korrespondierende gewünschte Trainingsausgabesignal (t_i ). Basierend auf dem maschinellen Lernsystem (60) ermittelt die Trainingsdateneinheit (150) dann eine schlechtestmögliche Trainingszeitreihe (x_i ) gemäß folgender Schritt:

m. Bereitstellen einer ersten adverseriellen Perturbation δ₁, wobei als erste adverserielle Perturbation ein Nullvektor gewählt wird der die gleiche Dimensionalität wie die erste Trainingszeitreihe (x_i ) hat;
n. Ermitteln eines Gradienten g gemäß der Formel $g = \nabla_{x i} [L ((x_{i} + δ_{1}), t_{i})],$
wobei f (x_i + δ₁) die Ausgabe des maschinellen Lernsystems (60) bezüglich einer Überlagerung der ersten Trainingszeitreihe;
o. Ermitteln einer zweiten adverseriellen Perturbation gemäß der Formel $δ_{2} = δ_{1} + α \cdot C_{k} \cdot g,$
wobei α eine vordefinierte Schrittweite ist;
p. Falls ein Euklidischer Abstand der zweiten adverseriellen Perturbation zur ersten adverseriellen Perturbation kleiner oder gleich einem vordefinierten Schwellenwert ist, bereitstellen der zweiten adverseriellen Perturbation als adverserielle Perturbation δ;
q. Andernfalls, falls der Rauschwert $r (δ, C_{k}^{+}) = {‖ δ - C_{k}^{+} \cdot δ ‖}_{2}$
der zweiten adverserielle Perturbation kleiner oder gleich dem zu erwartenden Rauschwert Δ ist, ausführen des Schrittes n., wobei beim Ausführen des Schrittes n. die zweite adverseriellen Perturbation als erste adverserielle Perturbation verwendet wird;
r. Andernfalls ermitteln einer projizierten Perturbation gemäß der Formel $δ_{p} = \underset{d, r (d, C_{k}^{+}) = Δ}{argmin} {‖ d - δ_{2} ‖}_{2}$
und Ausführen des Schrittes p., wobei beim Ausführen des Schrittes p. die projizierte Perturbation als zweite adverserielle Perturbation verwendet wird.

Basierend auf der bereitgestellten adverseriellen Perturbation wird dann die schlechtestmögliche Trainingszeitreihe $(x_{i}^{'})$
gemäß der Formel $x_{i}^{'} = x_{i} + δ$
Dem maschinellen Lernsystem (60) wird dann die schlechtestmögliche Trainingszeitreihe $(x_{i}^{'})$
übermittelt und vom maschinellen Lernsystem für die schlechtestmögliche Trainingszeitreihe $(x_{i}^{'})$
ein Trainingsausgabesignal (y_i ) ermittelt.
Das gewünschte Trainingsausgabesignal (t_i ) und das ermittelte Trainingsausgabesignal (y_i ) werden an eine Veränderungseinheit (180) übermittelt.
Basierend auf dem gewünschten Trainingsausgabesignal (t_i ) und dem ermittelten Ausgabesignal (y_i ) werden dann von der Veränderungseinheit (180) neue Parameter (Φ') für das maschinelle Lernsystem (60) bestimmt. Hierfür vergleicht die Veränderungseinheit (180) das gewünschte Trainingsausgabesignal (t_i ) und das ermittelte Trainingsausgabesignal (y_i ) mittels einer Verlustfunktion (engl. loss function). Die Verlustfunktion ermittelt einen ersten Verlustwert, der charakterisiert, wie weit das ermittelte Trainingsausgabesignal (y_i ) vom gewünschten Trainingsausgabesignal (tii) abweicht. Als Verlustfunktion wird im Ausführungsbeispiel eine negative logarithmierte Plausibilitätsfunktion (engl. negative log-likehood function) gewählt. In alternativen Ausführungsbeispielen sind auch andere Verlustfunktion denkbar.
Die Veränderungseinheit (180) ermittelt auf Grundlage des ersten Verlustwertes die neuen Parameter (Φ'). Im Ausführungsbeispiel geschieht dies mittels eines Gradientenabstiegsverfahren, vorzugsweise Stochastic Gradient Descent, Adam, oder AdamW.
Die ermittelten neuen Parameter (Φ') werden in einem Modellparameterspeicher (St₁ ) gespeichert. Vorzugsweise werden die ermittelten neuen Parameter (Φ') als Parameter (Φ) dem Klassifikator (60) bereitgestellt.
In weiteren bevorzugten Ausführungsbeispielen wird das beschriebene Training iterativ für eine vordefinierte Anzahl an Iterationsschritten wiederholt oder iterativ wiederholt, bis der erste Verlustwert einen vordefinierten Schwellenwert unterschreitet. Alternativ oder zusätzlich ist auch vorstellbar, dass das Training beendet wird, wenn ein durchschnittlicher erster Verlustwert bezüglich eines Test- oder Validierungsdatensatzes einen vordefinierten Schwellenwert unterschreitet.
In mindestens einer der Iterationen werden die in einer vorherigen Iteration bestimmten neuen Parameter (Φ') als Parameter (Φ) des Klassifikators (60) verwendet.
Des Weiteren kann das Trainingssystem (140) mindestens einen Prozessor (145) und mindestens ein maschinenlesbares Speichermedium (146) umfassen, welches Befehle enthält, welche, wenn sie durch den Prozessor (145) ausgeführt werden, das Trainingssystem (140) veranlassen, ein Trainingsverfahren nach einem der Aspekte der Erfindung auszuführen.
2 zeigt ein Steuerungssystem (40) welches mittels eines maschinellen Lernsystems (60) einen Aktor (10) eines technischen Systems steuert, wobei das maschinelle Lernsystem (60) mittels der Trainingsvorrichtung (140) trainiert wurde. In vorzugsweise regelmäßigen zeitlichen Abständen wird eine zweite Betriebsgröße oder ein zweiter Betriebszustand mit einem Sensor (30) erfasst. Das erfasste Eingabesignal (S) des Sensors (30) wird an das Steuerungssystem (40) übermittelt. Das Steuerungssystem (40) empfängt somit eine Folge von Eingabesignale (S). Das Steuerungssystem (40) ermittelt hieraus Ansteuersignale (A), welche an den Aktor (10) übertragen werden.
Das Steuerungssystem (40) empfängt die Folge von Eingabesignalen (S) des Sensors (30) in einer Empfangseinheit (50), die die Folge von Eingabesignalen (S) in eine Zeitreihe (x) umwandelt. Dies kann zum Beispiel über ein Hintereinanderreihen einer vordefinierten Anzahl von zuletzt aufgenommenen Eingabesignalen (S) erfolgen. Mit anderen Worten wird die Zeitreihe (x) abhängig von den Eingabesignalen (S) ermittelt. Die Folge von Eingabesignalen (x) wird dem maschinellen Lernsystem (60) zugeführt.
Das maschinelle Lernsystem (60) ermittelt aus der Zeitreihe (x) ein Ausgabesignal (y). Die Ausgabesignale (y) werden einer optionalen Umformeinheit (80) zugeführt, die hieraus Ansteuersignale (A) ermittelt, welche dem Aktor (10) zugeführt werden, um den Aktor (10) entsprechend anzusteuern.
Der Aktor (10) empfängt die Ansteuersignale (A), wird entsprechend angesteuert und führt eine entsprechende Aktion aus. Der Aktor (10) kann hierbei eine (nicht notwendigerweise baulich integrierte) Ansteuerlogik umfassen, welches aus dem Ansteuersignal (A) ein zweites Ansteuersignal ermittelt, mit dem dann der Aktor (10) angesteuert wird.
In weiteren Ausführungsformen umfasst das Steuerungssystem (40) den Sensor (30). In noch weiteren Ausführungsformen umfasst das Steuerungssystem (40) alternativ oder zusätzlich auch den Aktor (10).
In weiteren bevorzugten Ausführungsformen umfasst das Steuerungssystem (40) zumindest einen Prozessor (45) und zumindest ein maschinenlesbares Speichermedium (46), auf dem Anweisungen gespeichert sind, die dann, wenn sie auf dem zumindest einen Prozessor (45) ausgeführt werden, das Steuerungssystem (40) veranlassen, das erfindungsgemäße Verfahren auszuführen.
In alternativen Ausführungsformen ist alternativ oder zusätzlich zum Aktor (10) eine Anzeigeeinheit (10a) vorgesehen.
3 zeigt ein Ausführungsbeispiel, in dem das Steuerungssystem (40) zur Ansteuerung einer Fertigungsmaschine (11) eines Fertigungssystems (200) verwendet wird, indem ein die Fertigungsmaschine (11) steuernder Aktor (10) angesteuert wird. Bei der Fertigungsmaschine (11) kann es sich beispielsweise um eine Maschine zum Schweißen.
Bei dem Sensor (30) kann es vorzugsweise um einen Sensor (30), der eine Spannung des Schweißgeräts der Fertigungsmaschine (11) ermittelt. Das maschinelle Lernsystem (60) kann insbesondere derart trainiert sein, dass es auf Grund einer Zeitreihe (x) von Spannungen klassifiziert, ob der Schweißvorgang erfolgreich war oder nicht. Der Aktor (10) kann bei einem nicht erfolgreichen Schweißvorgang ein entsprechendes Werkstück automatisiert aussortieren.
In alternativen Ausführungsbeispiel ist auch möglich, dass die Fertigungsmaschine (11) mittels eines Drucks zwei Werkstücke fügt. In diesem Fall kann der Sensor (30) ein Drucksensor sein und das maschinelle Lernsystem (60) ermitteln, ob die Fügung korrekt war oder nicht.
4 zeigt ein Ausführungsbeispiel zur Steuerung eines Injektors (40) einer Verbrennungskraftmaschine. Im Ausführungsbeispiel ist der Sensor (30) ein Drucksensor, der einen Druck eines Einspritzsystems (10) ermittelt, welches den Injektor (40) mit Kraftstoff versorgt. Das maschinelle Lernsystem (60) kann insbesondere derart ausgebildet sein, dass es auf Basis der Zeitreihe (x) von Druckwerten eine Einspritzmenge des Kraftstoffs genau ermittelt.
Basierend auf der ermittelten Einspritzmenge kann dann der Aktor (10) in zukünftigen Einspritzvorgängen derart angesteuert werden, dass eine zu große Menge von eingespritztem Kraftstoff oder eine zu kleine Menge von eingespritzten Kraftstoff entsprechend kompensiert wird.
In alternativen Ausführungsformen ist alternativ oder zusätzlich zur Steuereinheit (40) vorgesehen, dass mittels des Ansteuersignals (A) zumindest eine weitere Vorrichtung (10a) angesteuert wird. Die Vorrichtung (10a) kann beispielsweise eine Pumpe eines Common-Rail-Systems sein, zu welchem der Injektor (20) gehört. Alternativ oder zusätzlich ist vorstellbar, dass die Vorrichtung ein Steuergerät der Verbrennungskraftmaschine ist. Alternativ oder zusätzlich ist auch vorstellbar, dass die Vorrichtung (10a) eine Anzeigeeinheit ist, mittels welcher einer Person (z.B. einem Fahrer oder einem Mechaniker) die vom maschinellen Lernsystem (60) ermittelte Kraftstoffmenge entsprechend angezeigt werden kann.
Der Begriff „Computer“ umfasst beliebige Geräte zur Abarbeitung vorgebbarer Rechenvorschriften. Diese Rechenvorschriften können in Form von Software vorliegen, oder in Form von Hardware, oder auch in einer Mischform aus Software und Hardware.
Im Allgemeinen kann eine Mehrzahl als indexiert verstanden werden, d.h. jedem Element der Mehrzahl wird ein eindeutiger Index zugewiesen, vorzugsweise durch Zuweisung aufeinanderfolgender Ganzzahlen an die in der Mehrzahl enthaltenen Elemente. Vorzugsweise, wenn eine Mehrzahl N Elemente umfasst, wobei N die Anzahl der Elemente in der Mehrzahl ist, werden den Elementen die ganzen Zahlen von 1 bis N zugewiesen.
ZITATE ENTHALTEN IN DER BESCHREIBUNG
Diese Liste der vom Anmelder aufgeführten Dokumente wurde automatisiert erzeugt und ist ausschließlich zur besseren Information des Lesers aufgenommen. Die Liste ist nicht Bestandteil der deutschen Patent- bzw. Gebrauchsmusteranmeldung. Das DPMA übernimmt keinerlei Haftung für etwaige Fehler oder Auslassungen.
Zitierte Patentliteratur

EP 19174931 [0002]

Claims

Computerimplementiertes maschinelles Lernsystem (60), wobei das maschinelle Lernsystem (60) eingerichtet ist basierend auf einer Zeitreihe (x) von Eingabesignalen eines technischen Systems ein Ausgabesignal (y) zu ermitteln, welches eine Klassifikation und/oder ein Regressionsergebnis zumindest eines ersten Betriebszustands und/oder zumindest einer ersten Betriebsgröße des technischen Systems charakterisiert, wobei ein Training des maschinellen Lernsystems (60) folgende Schritte umfasst: a. Ermitteln einer ersten Trainingszeitreihe (x_i) von Eingabesignalen aus einer Mehrzahl von Trainingszeitreihen (x_i) sowie einem mit der ersten Trainingszeitreihe (x_i) korrespondierenden gewünschten Trainingsausgabesignal (t_i), wobei das gewünschte Trainingsausgabesignal (t_i) eine gewünschte Klassifikation und/oder gewünschtes Regressionsergebnis der ersten Trainingszeitreihe (x_i) charakterisiert; b. Ermitteln einer schlechtestmöglichen Trainingszeitreihe $(x_{i}^{'}),$
wobei die schlechtestmögliche Trainingszeitreihe $(x_{i}^{'})$
eine Überlagerung der ersten Trainingszeitreihe (x_i) mit einem ermittelten ersten Rauschsignal charakterisiert; c. Ermitteln eines Trainingsausgabesignals (y_i) basierend auf der schlechtestmöglichen Trainingszeitreihe (x_i) mittels des maschinellen Lernsystems (60); d. Anpassen zumindest eines Parameters des maschinellen Lernsystems (60) gemäß eines Gradienten eines Verlustwertes, wobei der Verlustwert eine Abweichung des gewünschten Ausgabesignals (t_i) zum ermittelten Trainingsausgabesignal (y_i) charakterisiert.
Maschinelles Lernsystem (60) nach Anspruch 1, wobei in Schritt b. das erste Rauschsignal durch eine Optimierung derart ermittelt wird, dass ein Abstand eines zweiten Ausgabesignals zum gewünschten Ausgabesignal vergrößert wird, wobei das zweite Ausgabesignal vom maschinellen Lernsystem (60) basierend auf einer Überlagerung der ersten Trainingszeitreihe (x_i) mit dem ersten Rauschsignal ermittelt wird.
Maschinelles Lernsystem (60) nach einem der Ansprüche 1 oder 2, wobei in Schritt b. das erste Rauschsignal basierend auf einem zu erwartenden Rauschwert der Mehrzahl von Trainingszeitreihen (x_i) ermittelt wird, wobei der zu erwartende Rauschwert eine durchschnittliche Stärke eines Rauschens der Trainingszeitreihen (x_i) charakterisiert.
Maschinelles Lernsystem (60) nach Anspruch 3, wobei der zu erwartende Rauschwert ein durchschnittlicher Abstand einer Trainingszeitreihe (x_i) der Mehrzahl von Trainingszeitreihen (x_i) von einer jeweiligen entrauschten Trainingszeitreihe ist.
Maschinelles Lernsystem (60) nach Anspruch 4, wobei der zu erwartende Rauschwert gemäß der Formel $Δ = \frac{1}{n} \sum_{i = 1}^{n} {‖ x_{i} - z_{i} ‖}_{2}$
ermittelt wird, wobei n die Anzahl der Trainingszeitreihen (x_i) der Mehrzahl von Trainingszeitreihen (x_i) ist, z_i die zur Trainingszeitreihe x_i entrauschte Trainingszeitreihe ist und ||·||₂ eine Euklidische Norm ist.
Maschinelles Lernsystem (60) nach Anspruch 5, wobei die entrauschte Trainingszeitreihe gemäß der Formel $z_{i} = C_{k}^{+} \cdot x_{i}$
ermittelt wird, wobei $C_{k}^{+}$
eine pseudo-inverse Kovarianzmatrix ist.
Maschinelles Lernsystem (60) nach Anspruch 6, wobei die pseudo-inverse Kovarianzmatrix durch folgende Schritte ermittelt wird: e. Ermitteln einer zweiten Kovarianzmatrix, wobei die zweite Kovarianzmatrix die Kovarianzmatrix der Mehrzahl von Trainingszeitreihen (x_i) ist; f. Ermitteln einer vordefinierten Mehrzahl von größten Eigenwerten der zweiten Kovarianzmatrix sowie zu den Eigenwerten korrespondieren Eigenvektoren; g. Ermitteln der pseudo-inversen Kovarianzmatrix gemäß der Formel $C_{k}^{+} = \sum_{i = 1}^{k} \frac{1}{λ_{i}} \cdot v_{i} v_{i}^{T},$
wobei λ_i der i-te Eigenwert der Mehrzahl von größten Eigenwerten ist und k die Anzahl von größten Eigenwerten in der vordefinierten Mehrzahl von größten Eigenwerten ist.
Maschinelles Lernsystem (60) nach einem der Ansprüche 3 bis 7, wobei das erste Rauschsignal basierend auf einer bereitgestellten adverseriellen Perturbation (engl. adversarial perturbation) ermittelt wird, wobei die bereitgestellte adverserielle Perturbation gemäß des zu erwartenden Rauschwerts eingeschränkt ist.
Maschinelles Lernsystem (60) nach Anspruch 8, wobei die adverserielle Perturbation derart eingeschränkt ist, dass ein Rauschwert der adverseriellen Perturbation nicht größer ist als der zu erwartende Rauschwert.
Maschinelles Lernsystem (60) nach Anspruch 9, wobei ein Rauschwert einer adverseriellen Perturbation gemäß der Formel $r (δ, C_{k}^{+}) = {‖ δ - C_{k}^{+} \cdot δ ‖}_{2}$
ermittelt wird, wobei δ die adverserielle Perturbation ist.
Maschinelles Lernsystem (60) nach einem der Ansprüche 8 bis 10, wobei die adverserielle Perturbation gemäß folgender Schritte bereitgestellt wird: h. Bereitstellen einer ersten adverseriellen Perturbation; i. Ermitteln einer zweiten adverseriellen Perturbation, wobei die zweite adverserielle Perturbation bezüglich der ersten Trainingszeitreihe (x_i) stärker ist als die erste adverserielle Perturbation; j. Falls ein Abstand der zweiten adverseriellen Perturbation zur ersten adverseriellen Perturbation kleiner oder gleich einem vordefinierten Schwellenwert ist, bereitstellen der zweiten adverseriellen Perturbation als adverserielle Perturbation; k. Andernfalls, falls der Rauschwert der zweiten adverserielle Perturbation kleiner oder gleich dem zu erwartenden Rauschwert ist, ausführen des Schrittes i., wobei beim Ausführen des Schrittes i. die zweite adverseriellen Perturbation als erste adverserielle Perturbation verwendet wird; I. Andernfalls ermitteln einer projizierten Perturbation und Ausführen des Schrittes j., wobei beim Ausführen des Schrittes j. die projizierte Perturbation als zweite adverserielle Perturbation verwendet wird, ferner wobei die projizierte Perturbation durch eine Optimierung derart ermittelt wird, dass ein Abstand der projizierten Perturbation zur zweiten adverseriellen Perturbation kleinstmöglich wird und der Rauschwert der projizierte Perturbation gleich dem zu erwartenden Rauschwert ist.
Maschinelles Lernsystem (60) nach Anspruch 11, wobei im Schritt h. die erste adverserielle Perturbation zufällig ermittelt wird.
Maschinelles Lernsystem (60) nach Anspruch 11, wobei im Schritt h. die erste adverserielle Perturbation zumindest einen vordefinierten Wert enthält.
Maschinelles Lernsystem (60) nach einem der Ansprüche 11 bis 13, wobei im Schritt i. die zweite adverserielle Perturbation gemäß der Formel $δ_{2} = δ_{1} + α \cdot C_{k} \cdot g$
ermittelt wird, wobei δ₁ die erste adverserielle Perturbation ist, α ein vordefinierter Schrittweitenwert ist, C_k eine erste Kovarianzmatrix ist und g ein Gradient ist.
Maschinelles Lernsystem (60) nach Anspruch 14, wobei der Gradient g gemäß der Formel $g = \nabla_{x i} [L ((x_{i} + δ_{1}), t_{i})]$
ermittelt wird, wobei L eine Verlustfunktion ist, t_i das gewünschte Trainingsausgabesignal (t_i) bezüglich der ersten Trainingszeitreihe (x_i) ist und f (x_i + δ₁) das Ergebnis des maschinellen Lernsystems (60) ist, wenn dem maschinellen Lernsystem (60) die mit der ersten adverseriellen Perturbation δ₁ überlagerte erste Trainingszeitreihe (x_i) übergeben wird.
Maschinelles Lernsystem (60) nach einem der Ansprüche 14 oder 15, wobei die erste Kovarianzmatrix gemäß der Formel $C_{k} = \sum_{i = 1}^{k} λ_{i} \cdot v_{i} v_{i}^{T}$
ermittelt wird.
Maschinelles Lernsystem (60) nach einem der Ansprüche 11 bis 16, wobei in Schritt I. die projizierte adverserielle Perturbation gemäß der Formel $δ_{p} = \underset{d, r (d, C_{k}^{+}) = Δ}{argmin} {‖ d - δ_{2} ‖}_{2}$
ermittelt wird.
Maschinelles Lernsystem (60) nach einem der Ansprüche 1 bis 17, wobei ein Eingabesignal jeweils eine Temperatur und/oder einen Druck und/oder eine Spannung und/oder eine Kraft und/oder eine Geschwindigkeit und/oder eine Drehrate und/oder ein Drehmoment des technischen Systems charakterisiert.
Maschinelles Lernsystem (60) nach Anspruch 18, wobei die Eingabesignale jeweils mit zumindest einem Sensor (30) aufgezeichnet werden.
Maschinelles Lernsystem (60) nach einem der Ansprüche 1 bis 19, wobei die Eingabesignale der Zeitreihe (x) jeweils einen zweiten Betriebszustand und/oder eine zweite Betriebsgröße des technischen Systems zu einem vordefinierten Zeitpunkt charakterisieren und die Eingabesignale der ersten Trainingszeitreihe (x_i) jeweils einen zweiten Betriebszustand und/oder eine zweite Betriebsgröße des technischen Systems oder eines baugleichen technischen Systems oder eines bauähnlichen technischen Systems oder eine Simulation des zweiten Betriebszustandes und/oder der zweiten Betriebsgröße zu einem vordefinierten Zeitpunkt charakterisieren.
Maschinelles Lernsystem (60) nach einem der Ansprüche 1 bis 20, wobei das Ausgabesignal (y) eine Regression zumindest des ersten Betriebszustands und/oder zumindest der ersten Betriebsgröße des technischen Systems charakterisiert, wobei der Verlustwert einen quadrierten Euklidischen Abstand zwischen der ermittelten Trainingsausgabe (y_i) und der gewünschten Trainingsausgabe (t_i) charakterisiert.
Maschinelles Lernsystem (60) nach Anspruch 21, wobei das technische System eine Einspritzvorrichtung einer Verbrennungskraftmaschine ist und die Eingabesignale der Zeitreihe (x) jeweils zumindest einen Druckwert oder einen durchschnittlichen Druckwert der Einspritzvorrichtung charakterisieren und das Ausgabesignal (y) eine Einspritzmenge eines Kraftstoffs charakterisiert, wobei ferner die Eingabesignale der ersten Trainingszeitreihe (x_i) jeweils zumindest einen Druckwert oder einen durchschnittlichen Druckwert der Verbrennungskraftmaschine oder einer baugleichen Verbrennungskraftmaschine oder einer bauähnlichen Verbrennungskraftmaschine oder einer Simulation der Verbrennungskraftmaschine charakterisiert und das gewünschte Trainingsausgabesignal (y_i) eine Einspritzmenge des Kraftstoffs charakterisiert.
Maschinelles Lernsystem (60) nach einem der Ansprüche 1 bis 20, wobei das technische System eine Fertigungsmaschine ist, die zumindest ein Werkstück fertigt, wobei die Eingabesignale der Zeitreihe (x) jeweils eine Kraft und/oder ein Drehmoment der Fertigungsmaschine charakterisieren und das Ausgabesignal (y) eine Klassifikation charakterisiert, ob das Werkstück korrekt gefertigt wurde oder nicht, wobei ferner die Eingabesignale der ersten Trainingszeitreihe (x_i) jeweils eine Kraft und/oder ein Drehmoment der Fertigungsmaschine oder einer baugleichen Fertigungsmaschine oder einer bauähnlichen Fertigungsmaschine oder einer Simulation der Fertigungsmaschine charakterisieren und das gewünschte Trainingsausgabesignal (y_i) eine Klassifikation ist, ob ein Werkstück korrekt gefertigt wurde.
Maschinelles Lernsystem (60) nach einem der Ansprüche 1 bis 23, wobei das maschinelle Lernsystem (60) das Ausgabesignal (y) mittels eines neuronalen Netzes ermittelt
Maschinelles Lernsystem (60) nach Anspruch 24, wobei das neuronale Netz ein rekurrentes neuronales Netz (engl. recurrent neural network, RNN) ist.
Maschinelles Lernsystem (60) nach einem der Ansprüche 24 oder 25, wobei das maschinelle Lernsystem (60) ein faltendes neuronales Netz (engl. convolutional neural network, CNN) ist.
Maschinelles Lernsystem (60) nach Anspruch 24, wobei das neuronale Netz ein Transformer ist.
Maschinelles Lernsystem (60) nach Anspruch 24, wobei das neuronale Netz ein mehrschichtiges Perzeptron (engl. multilayer perceptron, MLP) ist.
Trainingsvorrichtung, welche ausgebildet ist das maschinelle Lernsystem (60) entsprechend der Schritte a. bis d. zu trainieren.
Computerprogramm, welches eingerichtet ist, die Schritte a. bis d. nach einem der Ansprüche 1 bis 29 auszuführen, wenn es durch einen Prozessor (45, 145) ausgeführt wird.
Maschinenlesbares Speichermedium (46, 146), auf dem das Computerprogramm nach Anspruch 30 gespeichert ist.