DE202020107432U1 - Vorrichtung zur robusten Klassifikation und Regression von Zeitreihen - Google Patents

Vorrichtung zur robusten Klassifikation und Regression von Zeitreihen Download PDF

Info

Publication number
DE202020107432U1
DE202020107432U1 DE202020107432.6U DE202020107432U DE202020107432U1 DE 202020107432 U1 DE202020107432 U1 DE 202020107432U1 DE 202020107432 U DE202020107432 U DE 202020107432U DE 202020107432 U1 DE202020107432 U1 DE 202020107432U1
Authority
DE
Germany
Prior art keywords
time series
machine learning
perturbation
learning system
training
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
DE202020107432.6U
Other languages
English (en)
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Robert Bosch GmbH
Original Assignee
Robert Bosch GmbH
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Robert Bosch GmbH filed Critical Robert Bosch GmbH
Priority to DE202020107432.6U priority Critical patent/DE202020107432U1/de
Publication of DE202020107432U1 publication Critical patent/DE202020107432U1/de
Priority to DE102021201179.9A priority patent/DE102021201179A1/de
Priority to PCT/EP2021/084995 priority patent/WO2022135959A1/de
Priority to US18/252,031 priority patent/US20230419179A1/en
Priority to CN202180086134.8A priority patent/CN116670669A/zh
Priority to US18/248,432 priority patent/US20240005209A1/en
Priority to PCT/EP2021/084990 priority patent/WO2022135958A1/de
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N20/00Machine learning
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/044Recurrent networks, e.g. Hopfield networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/045Combinations of networks

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Software Systems (AREA)
  • Physics & Mathematics (AREA)
  • Mathematical Physics (AREA)
  • Artificial Intelligence (AREA)
  • Data Mining & Analysis (AREA)
  • Evolutionary Computation (AREA)
  • Computing Systems (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Medical Informatics (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Health & Medical Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Biomedical Technology (AREA)
  • Biophysics (AREA)
  • Computational Linguistics (AREA)
  • General Health & Medical Sciences (AREA)
  • Molecular Biology (AREA)
  • Feedback Control In General (AREA)
  • Measurement Of Mechanical Vibrations Or Ultrasonic Waves (AREA)

Abstract

Computerimplementiertes maschinelles Lernsystem (60), wobei das maschinelle Lernsystem (60) eingerichtet ist basierend auf einer Zeitreihe (x) von Eingabesignalen eines technischen Systems ein Ausgabesignal (y) zu ermitteln, welches eine Klassifikation und/oder ein Regressionsergebnis zumindest eines ersten Betriebszustands und/oder zumindest einer ersten Betriebsgröße des technischen Systems charakterisiert, wobei ein Training des maschinellen Lernsystems (60) folgende Schritte umfasst:
a. Ermitteln einer ersten Trainingszeitreihe (xi) von Eingabesignalen aus einer Mehrzahl von Trainingszeitreihen (xi) sowie einem mit der ersten Trainingszeitreihe (xi) korrespondierenden gewünschten Trainingsausgabesignal (ti), wobei das gewünschte Trainingsausgabesignal (ti) eine gewünschte Klassifikation und/oder gewünschtes Regressionsergebnis der ersten Trainingszeitreihe (xi) charakterisiert;
b. Ermitteln einer schlechtestmöglichen Trainingszeitreihe ( x i ' ) ,
Figure DE202020107432U1_0001
wobei die schlechtestmögliche Trainingszeitreihe ( x i ' )
Figure DE202020107432U1_0002
eine Überlagerung der ersten Trainingszeitreihe (xi) mit einem ermittelten ersten Rauschsignal charakterisiert;
c. Ermitteln eines Trainingsausgabesignals (yi) basierend auf der schlechtestmöglichen Trainingszeitreihe (xi) mittels des maschinellen Lernsystems (60);
d. Anpassen zumindest eines Parameters des maschinellen Lernsystems (60) gemäß eines Gradienten eines Verlustwertes, wobei der Verlustwert eine Abweichung des gewünschten Ausgabesignals (ti) zum ermittelten Trainingsausgabesignal (yi) charakterisiert.

Description

  • Technisches Gebiet
  • Die Erfindung betrifft ein computerimplementiertes maschinelles Lernsystem, eine Trainingsvorrichtung zum Trainieren des maschinellen Lernsystems, ein Computerprogramm und ein maschinenlesbares Speichermedium.
  • Stand der Technik
  • Aus der EP 19 174 931.6 ist ein Verfahren zum robusten Trainieren eines maschinellen Lernsystems gegenüber adverseriellen Beispielen bekannt.
  • Vorteile der Erfindung
  • Aufzeichnungen von Sensoren unterliegen typischerweise einem mehr oder weniger starken Rauschen, welches sich in den durch die Sensoren ermittelten Sensorsignalen niederschlägt. Bei einer automatischen Verarbeitung solcher Sensorsignale mittels eines maschinellen Lernsystems ist dieses Rauschen eine typische Störquelle, die eine Vorhersagegenauigkeit des maschinellen Lernsystems erheblich verschlechtern kann. Insbesondere bei einer Verarbeitung von Zeitreihen von Sensorsignalen kann ein Rauschen einen stark negativen Einfluss auf die Vorhersagegenauigkeit haben.
  • Es ist daher wünschenswert ein maschinelles Lernsystem zur Verarbeitung von Zeitreihen derart zu trainieren, dass das maschinelle Lernsystem robust gegenüber Rauschen wird. Der Vorteil des maschinellen Lernsystems mit Merkmalen gemäß des Anspruchs 1 ist, dass das maschinelle Lernsystem durch seine Konstruktion robuster gegenüber Rauschen wird. Überraschenderweise konnten die Erfinder feststellen, dass Methoden des adverseriellen Trainierens (engl. adversarial training) auch verwendet werden können, um das maschinelles Lernsystem derart zu trainieren, dass es robust gegenüber Rauschen wird.
  • Offenbarung der Erfindung
  • In einem ersten Aspekt betrifft die Erfindung ein computerimplementiertes maschinelles Lernsystem (60), wobei das maschinelle Lernsystem eingerichtet ist basierend auf einer Zeitreihe von Eingabesignalen eines technischen Systems ein Ausgabesignal zu ermitteln, welches eine Klassifikation und/oder ein Regressionsergebnis zumindest eines ersten Betriebszustands und/oder zumindest einer ersten Betriebsgröße des technischen Systems charakterisiert, wobei ein Training des maschinellen Lernsystems folgende Schritte umfasst:
    1. a. Ermitteln einer ersten Trainingszeitreihe von Eingabesignalen aus einer Mehrzahl von Trainingszeitreihen sowie einem mit der ersten Trainingszeitreihe korrespondierenden gewünschten Trainingsausgabesignal, wobei das gewünschte Trainingsausgabesignal eine gewünschte Klassifikation und/oder gewünschtes Regressionsergebnis der ersten Trainingszeitreihe charakterisiert;
    2. b. Ermitteln einer schlechtestmöglichen Trainingszeitreihe, wobei die schlechtestmögliche Trainingszeitreihe eine Überlagerung der ersten Trainingszeitreihe mit einem ermittelten ersten Rauschsignal charakterisiert;
    3. c. Ermitteln eines Trainingsausgabesignals basierend auf der schlechtestmöglichen Trainingszeitreihe mittels des maschinellen Lernsystems;
    4. d. Anpassen zumindest eines Parameters des maschinellen Lernsystems gemäß eines Gradienten eines Verlustwertes, wobei der Verlustwert eine Abweichung des gewünschten Ausgabesignals zum ermittelten Trainingsausgabesignal charakterisiert.
  • Vorzugsweise können die Eingabesignale der Zeitreihe jeweils einen zweiten Betriebszustand und/oder eine zweite Betriebsgröße des technischen Systems zu einem vordefinierten Zeitpunkt charakterisieren. Ein Eingabesignal kann insbesondere mittels eines Sensors, insbesondere eines Sensors des technischen Systems, aufgezeichnet werden. Hierbei kann der erste Betriebszustand oder die erste Betriebsgröße insbesondere eine Temperatur und/oder einen Druck und/oder eine Spannung und/oder eine Kraft und/oder eine Geschwindigkeit und/oder eine Drehrate und/oder ein Drehmoment des technischen Systems charakterisiert.
  • Das maschinelle Lernsystem kann daher auch als ein virtueller Sensor verstanden werden, mittels welchem ein erster Betriebszustand bzw. eine erste Betriebsgröße von einer Mehrzahl von zweiten Betriebszuständen bzw. zweiten Betriebsgrößen abgeleitet werden kann.
  • Das Training des maschinellen Lernsystems kann als ein überwachtes Training verstanden werden. Die für das Training verwendete erste Trainingszeitreihen kann vorzugsweise Eingabesignale umfassen, die jeweils einen zweiten Betriebszustand und/oder eine zweite Betriebsgröße des technischen Systems oder eines baugleichen technischen Systems oder eines bauähnlichen technischen Systems oder eine Simulation des zweiten Betriebszustandes und/oder der zweiten Betriebsgröße zu einem vordefinierten Zeitpunkt charakterisieren. Mit anderen Worten können Trainingszeitreihen der Mehrzahl von Trainingszeitreihen auf Eingabesignalen des technischen Systems selber beruhen. Alternativ oder zusätzlich ist möglich, dass die Trainingszeitreihe Eingabesignale von einem ähnlichen technischen System aufgezeichnet werden, wobei ein ähnliches technisches System beispielsweise ein Prototyp oder eine Vorentwicklung des technischen Systems sein kann. Auch ist möglich, dass aus einem anderen technischen System die Eingabesignale der Trainingszeitreihe ermittelt werden, z.B. aus einem anderen technischen System eines gleichen Produktionsreihe oder Produktionsserie. Auch ist möglich, dass die Eingabesignale der Trainingszeitreihe auf Basis einer Simulation des technischen Systems ermittelt werden.
  • Typischerweise sind die Eingabesignale der ersten Trainingszeitreihe den Eingabesignalen der Zeitreihe ähnlich, insbesondere sollten die Eingabesignale der Trainingszeitreihe die gleiche zweite Betriebsgröße charakterisieren wie die Eingabesignale der Zeitreihe.
  • Zum Training können die Trainingszeitreihen insbesondere aus einer Datenbank bereitgestellt werden, wobei die Datenbank die Mehrzahl von Trainingszeitreihen umfasst. Das maschinelle Lernsystem kann die Schritte a. - d. vorzugsweise iterativ durchführen. Vorzugsweise kann in jeder Iteration auch eine Mehrzahl von Trainingszeitreihen zur Ermittlung des Verlustwertes verwendet werden, d.h. es kann mit einem Stapel (engl. batch) von Trainingszeitreihen trainiert werden.
  • Die Ausgabesignale können eine Klassifikation und/oder ein Regressionsergebnis umfassen. Als Regressionsergebnis ist hierbei ein Ergebnis einer Regression zu verstehen. Das maschinelle Lernsystem kann daher als Klassifikator und/oder Regressor angesehen werden. Unter Regressor kann eine Vorrichtung verstanden werden, die bezüglich zumindest eines reellen Wertes zumindest einen reellen Wert prädiziert.
  • Die Zeitreihe und die Trainingszeitreihe liegt jeweils vorzugsweise als Spaltenvektor vor, wobei jeweils eine Dimension des Vektors einen Messwert zu einem bestimmten Zeitpunkt innerhalb der Zeitreihe oder der Trainingszeitreihe charakterisiert.
  • Die schlechtestmögliche Trainingszeitreihe kann als eine Trainingszeitreihe verstanden werden, die entsteht, wenn die erste Trainingszeitreihe mit einem Rauschsignal derart überlagert wird, dass ein Abstand einer Trainingsausgabe des maschinellen Lernsystems für die so überlagerte Trainingszeitreihe zur für die erste Trainingszeitreihe ermittelte Trainingsausgabe größtmöglich wird. Insbesondere kann das Rauschen noch bezüglich geeigneter Randbedingungen eingeschränkt werden, sodass die schlechtestmögliche Trainingszeitreihe kein triviales Ergebnis der Überlagerung ist. In der beschriebenen Erfindung wird das Rauschsignal insbesondere derart eingeschränkt, dass es einem erwartbaren Rauschsignal entspricht. Das erwartbare Rauschsignal kann insbesondere basierend auf der Mehrzahl von Trainingszeitreihen verstanden werden. In diesem Sinne kann das Verfahren als eine Form von adverseriellem Training verstanden werden, wobei das adverserielle Trainings vorteilhaft auf ein für die Trainingszeitreihen charakteristisches Rauschen eingeschränkt wird. Die Erfinder konnten herausfinden, dass so das adverserielle Training auch überaschenderweise und vorteilhafterweise zum einem gegenüber Rauschen robusteren maschinellen Lernsystem führt.
  • Vorzugsweise kann in Schritt b. das erste Rauschsignal durch eine Optimierung derart ermittelt wird, dass ein Abstand eines zweiten Ausgabesignals zum gewünschten Ausgabesignal vergrößert wird, wobei das zweite Ausgabesignal vom maschinellen Lernsystem basierend auf einer Überlagerung der Trainingszeitreihe mit dem ersten Rauschsignal ermittelt wird.
  • Das Rauschsignal kann insbesondere in Form eines Vektors vorliegen, wobei der Vektor die gleiche Dimensionalität hat wie die Vektorform der ersten Trainingszeitreihe. Die Überlagerung kann dann zum Beispiel als eine Summe des Vektors der ersten Trainingszeitreihe und des Vektors des Rauschsignals. Als Optimierung kann hier eine mathematische Optimierung unter Randbedingungen verstanden werden. Als Randbedingungen kann im Verfahren insbesondere ein zu erwartendes Rauschsignal eingebracht werden.
  • In einer bevorzugten Ausbildung des maschinellen Lernsystems kann daher in Schritt b. das erste Rauschsignal basierend auf einem zu erwartenden Rauschwert der Mehrzahl von Trainingszeitreihen ermittelt wird, wobei der zu erwartende Rauschwert eine durchschnittliche Stärke eines Rauschens der Trainingszeitreihen charakterisiert.
  • Insbesondere kann der zu erwartende Rauschwert ein durchschnittlicher Abstand einer Trainingszeitreihe der Mehrzahl von Trainingszeitreihen von einer jeweiligen entrauschten Trainingszeitreihe ist.
  • In einer bevorzugten Ausbildung des maschinellen Lernsystems kann der zu erwartende Rauschwert gemäß der Formel Δ = 1 n i = 1 n x i C k + z i 2
    Figure DE202020107432U1_0003
    ermittelt wird, wobei n die Anzahl der Trainingszeitreihen der Mehrzahl von Trainingszeitreihen ist, zi die zur Trainingszeitreihe xi entrauschte Trainingszeitreihe ist und ||·||2 eine Euklidische Norm ist.
  • Dies kann derart verstanden werden, als dass eine Trainingszeitreihe zunächst entrauscht wird und anschließend ein Abstand der Trainingszeitreihe zur entrauschten Trainingszeitreihe ermittelt wird. Der durchschnittliche Abstand über alle oder zumindest Teile der Mehrzahl von Trainingszeitreihen kann dann als das zu erwartende Rauschen verstanden werden. Daher kann das zu erwartende Rauschen als ein skalarer Wert verstanden werden.
  • Bevorzugt kann die entrauschte Trainingszeitreihe gemäß der Formel z i = C k + x i
    Figure DE202020107432U1_0004
    ermittelt werden, wobei C k +
    Figure DE202020107432U1_0005
    eine pseudo-inverse Kovarianzmatrix ist.
  • Hierbei kann die pseudo-inverse Kovarianzmatrix durch folgende Schritte ermittelt wird:
    • e. Ermitteln einer zweiten Kovarianzmatrix, wobei die zweite Kovarianzmatrix die Kovarianzmatrix der Mehrzahl von Trainingszeitreihen (xi ) ist;
    • f. Ermitteln einer vordefinierten Mehrzahl von größten Eigenwerten der zweiten Kovarianzmatrix sowie zu den Eigenwerten korrespondieren Eigenvektoren;
    • g. Ermitteln der pseudo-inversen Kovarianzmatrix gemäß der Formel C k + = i = 1 k 1 λ i v i v i T ,
      Figure DE202020107432U1_0006
    wobei λi der i-te Eigenwert der Mehrzahl von größten Eigenwerten ist und k die Anzahl von größten Eigenwerten in der vordefinierten Mehrzahl von größten Eigenwerten ist.
  • Die pseudo-inverse Kovarianzmatrix kann als Teil eines Rauschmodells verstanden werden. Mittels der pseudo-inversen Kovarianzmatrix kann wie oben beschrieben die erste Trainingszeitreihe xi entrauscht werden und so die entrauschte Trainingszeitreihe zi ermittelt werden. Ein Abstand der ersten Trainingszeitreihe zur entrauschten Trainingszeitreihe kann dann als ein Rauschwert der ersten Trainingszeitreihe verstanden werden.
  • Die Mehrzahl von größten Eigenwerten umfasst daher eine vordefinierte Anzahl von Eigenwerten, wobei nur die größten Eigenwerte der Kovarianzmatrix in der Mehrzahl von größten Eigenwerten enthalten sind.
  • Die Eigenvektoren können hierbei als Spaltenvektoren verstanden werden.
  • In einer bevorzugten Ausbildung des maschinellen Lernsystems kann das erste Rauschsignal basierend auf einer bereitgestellten adverseriellen Perturbation (engl. adversarial perturbation) ermittelt wird, wobei die bereitgestellte adverserielle Perturbation gemäß des zu erwartenden Rauschwerts eingeschränkt ist.
  • Als adverserielle Perturbation kann eine Perturbation verstanden werden, mittels welcher ein adverserielles Beispiel (engl. adversarial example) erzeugt wird, wenn eine entsprechende Trainingszeitreihe mit der adverseriellen Perturbation überlagert wird.
  • In einer bevorzugten Ausbildung des maschinellen Lernsystems wird die adverserielle Perturbation derart eingeschränkt ist, dass ein Rauschwert der adverseriellen Perturbation nicht größer ist als der zu erwartende Rauschwert. Bevorzugt kann die adverserielle Perturbation gemäß folgender Schritte bereitgestellt wird:
    • h. Bereitstellen einer ersten adverseriellen Perturbation;
    • i. Ermitteln einer zweiten adverseriellen Perturbation, wobei die zweite adverserielle Perturbation stärker ist als die erste adverserielle Perturbation;
    • j. Falls ein Abstand der zweiten adverseriellen Perturbation zur ersten adverseriellen Perturbation kleiner oder gleich einem vordefinierten Schwellenwert ist, bereitstellen der zweiten adverseriellen Perturbation als adverserielle Perturbation;
    • k. Andernfalls, falls der Rauschwert der zweiten adverserielle Perturbation kleiner oder gleich dem zu erwartenden Rauschwert ist, ausführen des Schrittes i., wobei beim Ausführen des Schrittes i. die zweite adverseriellen Perturbation als erste adverserielle Perturbation verwendet wird;
    • l. Andernfalls ermitteln einer projizierten Perturbation und Ausführen des Schrittes j., wobei beim Ausführen des Schrittes j. die projizierte Perturbation als zweite adverserielle Perturbation verwendet wird, ferner wobei die projizierte Perturbation durch eine Optimierung derart ermittelt wird, dass ein Abstand der projizierten Perturbation zur zweiten adverseriellen Perturbation kleinstmöglich wird und der Rauschwert der projizierte Perturbation gleich dem zu erwartenden Rauschwert ist.
  • Die erste adverserielle Perturbation kann zufällig ermittelt werden oder zumindest einen vordefinierten Wert enthalten. Da eine adverserielle Perturbation vorzugsweise in Form eines Vektors vorliegt, kann die erste adverserielle Perturbation in Schritt h. beispielsweise ein Nullvektor oder ein Zufallsvektor sein.
  • Eine zweite adverserielle Perturbation kann als stärker als eine erste adverserielle Perturbation verstanden werden, wenn ein bezüglich einer mit der zweiten adverseriellen Perturbation überlagerten Trainingszeitreihe ermitteltes zweite Trainingsausgabesignal einen größeren Abstand zum gewünschten Trainingsausgabesignal der Trainingszeitreihe hat als ein bezüglich einer mit der ersten adverseriellen Perturbation überlagerten Trainingszeitreihe ermitteltes erstes Trainingsausgabesignal.
  • Ein Rauschwert einer adverseriellen Perturbation kann gemäß der Formel r ( δ , C k + ) = δ C k + δ 2
    Figure DE202020107432U1_0007
    ermittelt wird, wobei δ die adverserielle Perturbation ist.
  • Bevorzugt kann in Schritt i. die zweite adverserielle Perturbation gemäß der Formel δ 2 = δ 1 + α C k g
    Figure DE202020107432U1_0008
    ermittelt wird, wobei δ1 die erste adverserielle Perturbation ist, α ein vordefinierter Schrittweitenwert ist, Ck eine erste Kovarianzmatrix ist und g ein Gradient ist.
  • Diese Ausprägung kann als eine Anpassung eines projizierten Gradientenabstiegsverfahrens (engl. projected gradient descent) verstanden werdne, wobei der Gradient entsprechend dem Rauschmodell angepasst wird. Die Erfinder konnten feststellen, dass hierdurch das ermittelte Rauschsignal wesentlich näher an realen Rauschsignalen liegt an mittels normalem projizierten Gradientenabstieg ermittelte Rauschsignale. Durch das verbesserte Rauschsignal kann das maschinelle Lernsystem gegenüber zu erwartendem Rauschen wesentlich robuster gemacht werden.
  • Der Gradient g kann gemäß der Formel g = x i [ L ( ( x i + δ 1 ) , t i ) ]
    Figure DE202020107432U1_0009
    ermittelt wird, wobei L eine Verlustfunktion ist, ti das gewünschte Trainingsausgabesignal bezüglich der Trainingszeitreihe ist und f (xi + δ1) das Ergebnis des maschinellen Lernsystems ist, wenn dem maschinellen Lernsystem die mit der ersten adverseriellen Perturbation δ1 überlagerte Trainingszeitreihe übergeben wird.
  • Kovarianzmatrix kann gemäß der Formel C k = i = 1 k λ i v i v i T
    Figure DE202020107432U1_0010
    ermittelt wird.
  • Die projizierte adverserielle Perturbation kann gemäß der Formel δ p = argmin d , r ( d , C k + ) = Δ d δ 2 2
    Figure DE202020107432U1_0011
    ermittelt wird.
  • Des Weiteren ist möglich, dass das Ausgabesignal eine Regression zumindest des ersten Betriebszustands und/oder zumindest der ersten Betriebsgröße des technischen Systems charakterisiert, wobei der Verlustwert einen quadrierten Euklidischen Abstand zwischen der ermittelten Trainingsausgabe und der gewünschten Trainingsausgabe charakterisiert.
  • Insbesondere kann das technische System eine Einspritzvorrichtung einer Verbrennungskraftmaschine sein und die Eingabesignale der Zeitreihe jeweils zumindest einen Druckwert oder einen durchschnittlichen Druckwert der Einspritzvorrichtung, z.B. eines Common-Rail-Diesels, charakterisieren und das Ausgabesignal eine Einspritzmenge eines Kraftstoffs charakterisiert, wobei ferner die Eingabesignale der Trainingszeitreihe jeweils zumindest einen Druckwert oder einen durchschnittlichen Druckwert der Verbrennungskraftmaschine oder einer baugleichen Verbrennungskraftmaschine oder einer bauähnlichen Verbrennungskraftmaschine oder einer Simulation der Verbrennungskraftmaschine charakterisiert und das gewünschte Trainingsausgabesignal eine Einspritzmenge des Kraftstoffs charakterisiert.
  • Alternativ ist auch möglich, dass das technische System eine Fertigungsmaschine ist, die zumindest ein Werkstück fertigt, wobei die Eingabesignale der Zeitreihe jeweils eine Kraft und/oder ein Drehmoment der Fertigungsmaschine charakterisieren und das Ausgabesignal eine Klassifikation charakterisiert, ob das Werkstück korrekt gefertigt wurde oder nicht, wobei ferner die Eingabesignale der Trainingszeitreihe jeweils eine Kraft und/oder ein Drehmoment der Fertigungsmaschine oder einer baugleichen Fertigungsmaschine oder einer bauähnlichen Fertigungsmaschine oder einer Simulation der Fertigungsmaschine charakterisieren und das gewünschte Trainingsausgabesignal eine Klassifikation ist, ob ein Werkstück korrekt gefertigt wurde.
  • In einem weiteren Aspekt betrifft die Erfindung eine Trainingsvorrichtung, welche ausgebildet ist das maschinelle Lernsystem entsprechend der Schritte a. bis d. zu trainieren.
  • Nachfolgend werden Ausführungsformen der Erfindung unter Bezugnahme auf die beiliegenden Zeichnungen näher erläutert. In den Zeichnungen zeigen:
    • 1 schematisch ein Trainingssystem zum Trainieren eines Klassifikators;
    • 2 schematisch einen Aufbau eines Steuerungssystems zur Ansteuerung eines Aktors mittels des Klassifikators;
    • 3 schematisch ein Ausführungsbeispiel zur Steuerung eines Fertigungssystems;
    • 4 schematisch ein Ausführungsbeispiel zur Steuerung eines Einspritzsystems;
  • Beschreibung der Ausführungsbeispiele
  • 1 zeigt ein Ausführungsbeispiel eines Trainingssystems (140) zum Trainieren eines maschinellen Lernsystems (60) mittels eines Trainingsdatensatzes (T). Vorzugsweise umfasst das maschinelle Lernsystem (60) ein neuronales Netz. Der Trainingsdatensatz (T) umfasst eine Mehrzahl von Trainingszeitreihen (xi ) von Eingabesignalen eines Sensors eines technischen Systems, wobei die Trainingszeitreihen (xi ) die zum Trainieren des maschinellen Lernsystems (60) verwendet werden, wobei der Trainingsdatensatz (T) ferner zu jeweils einer Trainingszeitreihe (xi ) ein gewünschtes Trainingsausgabesignal (ti ) umfasst, welches mit der Trainingszeitreihe (xi ) korrespondiert und eine Klassifikation und/oder ein Regressionsergebnis bzgl. der Trainingszeitreihe (xi ) charakterisiert. Die Trainingszeitreihen (xi ) liegen vorzugsweise in Form eines Vektors vor, wobei die Dimensionen jeweils Zeitpunkte der Trainingszeitreihen (xi ) charakterisieren.
  • Zum Training greift eine Trainingsdateneinheit (150) auf eine computerimplementierte Datenbank (St2 ) zu, wobei die Datenbank (St2 ) den Trainingsdatensatz (T) zur Verfügung stellt. Die Trainingsdateneinheit (150) ermittelt aus der Mehrzahl von Trainingszeitreihen (xi ) zunächst eine erste Kovarianzmatrix. Hierfür ermittelt die Trainingsdateneinheit (150) zunächst die empirische Kovarianzmatrix der Trainingszeitreihen (xi ). Anschließend werden die k größten Eigenwerte sowie die zugehörigen Eigenvektoren ermittelt und die erste Kovarianzmatrix Ck gemäß der Formel C k = i = 1 k λ i v i v i T
    Figure DE202020107432U1_0012
    Ermittelt, wobei λi zu den k größten Eigenwerten gehört, vi der zu λi gehörige Eigenvektor in Spaltenform ist und k ein vordefinierter Wert. Zusätzlich wird eine pseudo-inverse Kovarianzmatrix C k +
    Figure DE202020107432U1_0013
    gemäß der Formel C k + = i = 1 k 1 λ i v i v i T
    Figure DE202020107432U1_0014
    ermittelt. Außerdem wird ein zu erwartender Rauchwert Δ gemäß der Formel Δ = 1 n i = 1 n x i C k + x i 2
    Figure DE202020107432U1_0015
    ermittelt, wobei n die Anzahl der Trainingszeitreihen (xi ) im Trainingsdatensatz (T) ist.
  • Die Trainingsdateneinheit (150) ermittelt anschließend aus dem Trainingsdatensatz (T) vorzugsweise zufällig zumindest eine erste Trainingszeitreihe (xi ) und das zur Trainingszeitreihe (xi ) korrespondierende gewünschte Trainingsausgabesignal (ti ). Basierend auf dem maschinellen Lernsystem (60) ermittelt die Trainingsdateneinheit (150) dann eine schlechtestmögliche Trainingszeitreihe (xi ) gemäß folgender Schritt:
    • m. Bereitstellen einer ersten adverseriellen Perturbation δ1, wobei als erste adverserielle Perturbation ein Nullvektor gewählt wird der die gleiche Dimensionalität wie die erste Trainingszeitreihe (xi ) hat;
    • n. Ermitteln eines Gradienten g gemäß der Formel g = x i [ L ( ( x i + δ 1 ) , t i ) ] ,
      Figure DE202020107432U1_0016
      wobei f (xi + δ1) die Ausgabe des maschinellen Lernsystems (60) bezüglich einer Überlagerung der ersten Trainingszeitreihe;
    • o. Ermitteln einer zweiten adverseriellen Perturbation gemäß der Formel δ 2 = δ 1 + α C k g ,
      Figure DE202020107432U1_0017
      wobei α eine vordefinierte Schrittweite ist;
    • p. Falls ein Euklidischer Abstand der zweiten adverseriellen Perturbation zur ersten adverseriellen Perturbation kleiner oder gleich einem vordefinierten Schwellenwert ist, bereitstellen der zweiten adverseriellen Perturbation als adverserielle Perturbation δ;
    • q. Andernfalls, falls der Rauschwert r ( δ , C k + ) = δ C k + δ 2
      Figure DE202020107432U1_0018
      der zweiten adverserielle Perturbation kleiner oder gleich dem zu erwartenden Rauschwert Δ ist, ausführen des Schrittes n., wobei beim Ausführen des Schrittes n. die zweite adverseriellen Perturbation als erste adverserielle Perturbation verwendet wird;
    • r. Andernfalls ermitteln einer projizierten Perturbation gemäß der Formel δ p = argmin d , r ( d , C k + ) = Δ d δ 2 2
      Figure DE202020107432U1_0019
      und Ausführen des Schrittes p., wobei beim Ausführen des Schrittes p. die projizierte Perturbation als zweite adverserielle Perturbation verwendet wird.
  • Basierend auf der bereitgestellten adverseriellen Perturbation wird dann die schlechtestmögliche Trainingszeitreihe ( x i ' )
    Figure DE202020107432U1_0020
    gemäß der Formel x i ' = x i + δ
    Figure DE202020107432U1_0021
  • Dem maschinellen Lernsystem (60) wird dann die schlechtestmögliche Trainingszeitreihe ( x i ' )
    Figure DE202020107432U1_0022
    übermittelt und vom maschinellen Lernsystem für die schlechtestmögliche Trainingszeitreihe ( x i ' )
    Figure DE202020107432U1_0023
    ein Trainingsausgabesignal (yi ) ermittelt.
  • Das gewünschte Trainingsausgabesignal (ti ) und das ermittelte Trainingsausgabesignal (yi ) werden an eine Veränderungseinheit (180) übermittelt.
  • Basierend auf dem gewünschten Trainingsausgabesignal (ti ) und dem ermittelten Ausgabesignal (yi ) werden dann von der Veränderungseinheit (180) neue Parameter (Φ') für das maschinelle Lernsystem (60) bestimmt. Hierfür vergleicht die Veränderungseinheit (180) das gewünschte Trainingsausgabesignal (ti ) und das ermittelte Trainingsausgabesignal (yi ) mittels einer Verlustfunktion (engl. loss function). Die Verlustfunktion ermittelt einen ersten Verlustwert, der charakterisiert, wie weit das ermittelte Trainingsausgabesignal (yi ) vom gewünschten Trainingsausgabesignal (tii) abweicht. Als Verlustfunktion wird im Ausführungsbeispiel eine negative logarithmierte Plausibilitätsfunktion (engl. negative log-likehood function) gewählt. In alternativen Ausführungsbeispielen sind auch andere Verlustfunktion denkbar.
  • Die Veränderungseinheit (180) ermittelt auf Grundlage des ersten Verlustwertes die neuen Parameter (Φ'). Im Ausführungsbeispiel geschieht dies mittels eines Gradientenabstiegsverfahren, vorzugsweise Stochastic Gradient Descent, Adam, oder AdamW.
  • Die ermittelten neuen Parameter (Φ') werden in einem Modellparameterspeicher (St1 ) gespeichert. Vorzugsweise werden die ermittelten neuen Parameter (Φ') als Parameter (Φ) dem Klassifikator (60) bereitgestellt.
  • In weiteren bevorzugten Ausführungsbeispielen wird das beschriebene Training iterativ für eine vordefinierte Anzahl an Iterationsschritten wiederholt oder iterativ wiederholt, bis der erste Verlustwert einen vordefinierten Schwellenwert unterschreitet. Alternativ oder zusätzlich ist auch vorstellbar, dass das Training beendet wird, wenn ein durchschnittlicher erster Verlustwert bezüglich eines Test- oder Validierungsdatensatzes einen vordefinierten Schwellenwert unterschreitet.
  • In mindestens einer der Iterationen werden die in einer vorherigen Iteration bestimmten neuen Parameter (Φ') als Parameter (Φ) des Klassifikators (60) verwendet.
  • Des Weiteren kann das Trainingssystem (140) mindestens einen Prozessor (145) und mindestens ein maschinenlesbares Speichermedium (146) umfassen, welches Befehle enthält, welche, wenn sie durch den Prozessor (145) ausgeführt werden, das Trainingssystem (140) veranlassen, ein Trainingsverfahren nach einem der Aspekte der Erfindung auszuführen.
  • 2 zeigt ein Steuerungssystem (40) welches mittels eines maschinellen Lernsystems (60) einen Aktor (10) eines technischen Systems steuert, wobei das maschinelle Lernsystem (60) mittels der Trainingsvorrichtung (140) trainiert wurde. In vorzugsweise regelmäßigen zeitlichen Abständen wird eine zweite Betriebsgröße oder ein zweiter Betriebszustand mit einem Sensor (30) erfasst. Das erfasste Eingabesignal (S) des Sensors (30) wird an das Steuerungssystem (40) übermittelt. Das Steuerungssystem (40) empfängt somit eine Folge von Eingabesignale (S). Das Steuerungssystem (40) ermittelt hieraus Ansteuersignale (A), welche an den Aktor (10) übertragen werden.
  • Das Steuerungssystem (40) empfängt die Folge von Eingabesignalen (S) des Sensors (30) in einer Empfangseinheit (50), die die Folge von Eingabesignalen (S) in eine Zeitreihe (x) umwandelt. Dies kann zum Beispiel über ein Hintereinanderreihen einer vordefinierten Anzahl von zuletzt aufgenommenen Eingabesignalen (S) erfolgen. Mit anderen Worten wird die Zeitreihe (x) abhängig von den Eingabesignalen (S) ermittelt. Die Folge von Eingabesignalen (x) wird dem maschinellen Lernsystem (60) zugeführt.
  • Das maschinelle Lernsystem (60) ermittelt aus der Zeitreihe (x) ein Ausgabesignal (y). Die Ausgabesignale (y) werden einer optionalen Umformeinheit (80) zugeführt, die hieraus Ansteuersignale (A) ermittelt, welche dem Aktor (10) zugeführt werden, um den Aktor (10) entsprechend anzusteuern.
  • Der Aktor (10) empfängt die Ansteuersignale (A), wird entsprechend angesteuert und führt eine entsprechende Aktion aus. Der Aktor (10) kann hierbei eine (nicht notwendigerweise baulich integrierte) Ansteuerlogik umfassen, welches aus dem Ansteuersignal (A) ein zweites Ansteuersignal ermittelt, mit dem dann der Aktor (10) angesteuert wird.
  • In weiteren Ausführungsformen umfasst das Steuerungssystem (40) den Sensor (30). In noch weiteren Ausführungsformen umfasst das Steuerungssystem (40) alternativ oder zusätzlich auch den Aktor (10).
  • In weiteren bevorzugten Ausführungsformen umfasst das Steuerungssystem (40) zumindest einen Prozessor (45) und zumindest ein maschinenlesbares Speichermedium (46), auf dem Anweisungen gespeichert sind, die dann, wenn sie auf dem zumindest einen Prozessor (45) ausgeführt werden, das Steuerungssystem (40) veranlassen, das erfindungsgemäße Verfahren auszuführen.
  • In alternativen Ausführungsformen ist alternativ oder zusätzlich zum Aktor (10) eine Anzeigeeinheit (10a) vorgesehen.
  • 3 zeigt ein Ausführungsbeispiel, in dem das Steuerungssystem (40) zur Ansteuerung einer Fertigungsmaschine (11) eines Fertigungssystems (200) verwendet wird, indem ein die Fertigungsmaschine (11) steuernder Aktor (10) angesteuert wird. Bei der Fertigungsmaschine (11) kann es sich beispielsweise um eine Maschine zum Schweißen.
  • Bei dem Sensor (30) kann es vorzugsweise um einen Sensor (30), der eine Spannung des Schweißgeräts der Fertigungsmaschine (11) ermittelt. Das maschinelle Lernsystem (60) kann insbesondere derart trainiert sein, dass es auf Grund einer Zeitreihe (x) von Spannungen klassifiziert, ob der Schweißvorgang erfolgreich war oder nicht. Der Aktor (10) kann bei einem nicht erfolgreichen Schweißvorgang ein entsprechendes Werkstück automatisiert aussortieren.
  • In alternativen Ausführungsbeispiel ist auch möglich, dass die Fertigungsmaschine (11) mittels eines Drucks zwei Werkstücke fügt. In diesem Fall kann der Sensor (30) ein Drucksensor sein und das maschinelle Lernsystem (60) ermitteln, ob die Fügung korrekt war oder nicht.
  • 4 zeigt ein Ausführungsbeispiel zur Steuerung eines Injektors (40) einer Verbrennungskraftmaschine. Im Ausführungsbeispiel ist der Sensor (30) ein Drucksensor, der einen Druck eines Einspritzsystems (10) ermittelt, welches den Injektor (40) mit Kraftstoff versorgt. Das maschinelle Lernsystem (60) kann insbesondere derart ausgebildet sein, dass es auf Basis der Zeitreihe (x) von Druckwerten eine Einspritzmenge des Kraftstoffs genau ermittelt.
  • Basierend auf der ermittelten Einspritzmenge kann dann der Aktor (10) in zukünftigen Einspritzvorgängen derart angesteuert werden, dass eine zu große Menge von eingespritztem Kraftstoff oder eine zu kleine Menge von eingespritzten Kraftstoff entsprechend kompensiert wird.
  • In alternativen Ausführungsformen ist alternativ oder zusätzlich zur Steuereinheit (40) vorgesehen, dass mittels des Ansteuersignals (A) zumindest eine weitere Vorrichtung (10a) angesteuert wird. Die Vorrichtung (10a) kann beispielsweise eine Pumpe eines Common-Rail-Systems sein, zu welchem der Injektor (20) gehört. Alternativ oder zusätzlich ist vorstellbar, dass die Vorrichtung ein Steuergerät der Verbrennungskraftmaschine ist. Alternativ oder zusätzlich ist auch vorstellbar, dass die Vorrichtung (10a) eine Anzeigeeinheit ist, mittels welcher einer Person (z.B. einem Fahrer oder einem Mechaniker) die vom maschinellen Lernsystem (60) ermittelte Kraftstoffmenge entsprechend angezeigt werden kann.
  • Der Begriff „Computer“ umfasst beliebige Geräte zur Abarbeitung vorgebbarer Rechenvorschriften. Diese Rechenvorschriften können in Form von Software vorliegen, oder in Form von Hardware, oder auch in einer Mischform aus Software und Hardware.
  • Im Allgemeinen kann eine Mehrzahl als indexiert verstanden werden, d.h. jedem Element der Mehrzahl wird ein eindeutiger Index zugewiesen, vorzugsweise durch Zuweisung aufeinanderfolgender Ganzzahlen an die in der Mehrzahl enthaltenen Elemente. Vorzugsweise, wenn eine Mehrzahl N Elemente umfasst, wobei N die Anzahl der Elemente in der Mehrzahl ist, werden den Elementen die ganzen Zahlen von 1 bis N zugewiesen.
  • ZITATE ENTHALTEN IN DER BESCHREIBUNG
  • Diese Liste der vom Anmelder aufgeführten Dokumente wurde automatisiert erzeugt und ist ausschließlich zur besseren Information des Lesers aufgenommen. Die Liste ist nicht Bestandteil der deutschen Patent- bzw. Gebrauchsmusteranmeldung. Das DPMA übernimmt keinerlei Haftung für etwaige Fehler oder Auslassungen.
  • Zitierte Patentliteratur
    • EP 19174931 [0002]

Claims (31)

  1. Computerimplementiertes maschinelles Lernsystem (60), wobei das maschinelle Lernsystem (60) eingerichtet ist basierend auf einer Zeitreihe (x) von Eingabesignalen eines technischen Systems ein Ausgabesignal (y) zu ermitteln, welches eine Klassifikation und/oder ein Regressionsergebnis zumindest eines ersten Betriebszustands und/oder zumindest einer ersten Betriebsgröße des technischen Systems charakterisiert, wobei ein Training des maschinellen Lernsystems (60) folgende Schritte umfasst: a. Ermitteln einer ersten Trainingszeitreihe (xi) von Eingabesignalen aus einer Mehrzahl von Trainingszeitreihen (xi) sowie einem mit der ersten Trainingszeitreihe (xi) korrespondierenden gewünschten Trainingsausgabesignal (ti), wobei das gewünschte Trainingsausgabesignal (ti) eine gewünschte Klassifikation und/oder gewünschtes Regressionsergebnis der ersten Trainingszeitreihe (xi) charakterisiert; b. Ermitteln einer schlechtestmöglichen Trainingszeitreihe ( x i ' ) ,
    Figure DE202020107432U1_0024
    wobei die schlechtestmögliche Trainingszeitreihe ( x i ' )
    Figure DE202020107432U1_0025
    eine Überlagerung der ersten Trainingszeitreihe (xi) mit einem ermittelten ersten Rauschsignal charakterisiert; c. Ermitteln eines Trainingsausgabesignals (yi) basierend auf der schlechtestmöglichen Trainingszeitreihe (xi) mittels des maschinellen Lernsystems (60); d. Anpassen zumindest eines Parameters des maschinellen Lernsystems (60) gemäß eines Gradienten eines Verlustwertes, wobei der Verlustwert eine Abweichung des gewünschten Ausgabesignals (ti) zum ermittelten Trainingsausgabesignal (yi) charakterisiert.
  2. Maschinelles Lernsystem (60) nach Anspruch 1, wobei in Schritt b. das erste Rauschsignal durch eine Optimierung derart ermittelt wird, dass ein Abstand eines zweiten Ausgabesignals zum gewünschten Ausgabesignal vergrößert wird, wobei das zweite Ausgabesignal vom maschinellen Lernsystem (60) basierend auf einer Überlagerung der ersten Trainingszeitreihe (xi) mit dem ersten Rauschsignal ermittelt wird.
  3. Maschinelles Lernsystem (60) nach einem der Ansprüche 1 oder 2, wobei in Schritt b. das erste Rauschsignal basierend auf einem zu erwartenden Rauschwert der Mehrzahl von Trainingszeitreihen (xi) ermittelt wird, wobei der zu erwartende Rauschwert eine durchschnittliche Stärke eines Rauschens der Trainingszeitreihen (xi) charakterisiert.
  4. Maschinelles Lernsystem (60) nach Anspruch 3, wobei der zu erwartende Rauschwert ein durchschnittlicher Abstand einer Trainingszeitreihe (xi) der Mehrzahl von Trainingszeitreihen (xi) von einer jeweiligen entrauschten Trainingszeitreihe ist.
  5. Maschinelles Lernsystem (60) nach Anspruch 4, wobei der zu erwartende Rauschwert gemäß der Formel Δ = 1 n i = 1 n x i z i 2
    Figure DE202020107432U1_0026
    ermittelt wird, wobei n die Anzahl der Trainingszeitreihen (xi) der Mehrzahl von Trainingszeitreihen (xi) ist, zi die zur Trainingszeitreihe xi entrauschte Trainingszeitreihe ist und ||·||2 eine Euklidische Norm ist.
  6. Maschinelles Lernsystem (60) nach Anspruch 5, wobei die entrauschte Trainingszeitreihe gemäß der Formel z i = C k + x i
    Figure DE202020107432U1_0027
    ermittelt wird, wobei C k +
    Figure DE202020107432U1_0028
    eine pseudo-inverse Kovarianzmatrix ist.
  7. Maschinelles Lernsystem (60) nach Anspruch 6, wobei die pseudo-inverse Kovarianzmatrix durch folgende Schritte ermittelt wird: e. Ermitteln einer zweiten Kovarianzmatrix, wobei die zweite Kovarianzmatrix die Kovarianzmatrix der Mehrzahl von Trainingszeitreihen (xi) ist; f. Ermitteln einer vordefinierten Mehrzahl von größten Eigenwerten der zweiten Kovarianzmatrix sowie zu den Eigenwerten korrespondieren Eigenvektoren; g. Ermitteln der pseudo-inversen Kovarianzmatrix gemäß der Formel C k + = i = 1 k 1 λ i v i v i T ,
    Figure DE202020107432U1_0029
    wobei λi der i-te Eigenwert der Mehrzahl von größten Eigenwerten ist und k die Anzahl von größten Eigenwerten in der vordefinierten Mehrzahl von größten Eigenwerten ist.
  8. Maschinelles Lernsystem (60) nach einem der Ansprüche 3 bis 7, wobei das erste Rauschsignal basierend auf einer bereitgestellten adverseriellen Perturbation (engl. adversarial perturbation) ermittelt wird, wobei die bereitgestellte adverserielle Perturbation gemäß des zu erwartenden Rauschwerts eingeschränkt ist.
  9. Maschinelles Lernsystem (60) nach Anspruch 8, wobei die adverserielle Perturbation derart eingeschränkt ist, dass ein Rauschwert der adverseriellen Perturbation nicht größer ist als der zu erwartende Rauschwert.
  10. Maschinelles Lernsystem (60) nach Anspruch 9, wobei ein Rauschwert einer adverseriellen Perturbation gemäß der Formel r ( δ , C k + ) = δ C k + δ 2
    Figure DE202020107432U1_0030
    ermittelt wird, wobei δ die adverserielle Perturbation ist.
  11. Maschinelles Lernsystem (60) nach einem der Ansprüche 8 bis 10, wobei die adverserielle Perturbation gemäß folgender Schritte bereitgestellt wird: h. Bereitstellen einer ersten adverseriellen Perturbation; i. Ermitteln einer zweiten adverseriellen Perturbation, wobei die zweite adverserielle Perturbation bezüglich der ersten Trainingszeitreihe (xi) stärker ist als die erste adverserielle Perturbation; j. Falls ein Abstand der zweiten adverseriellen Perturbation zur ersten adverseriellen Perturbation kleiner oder gleich einem vordefinierten Schwellenwert ist, bereitstellen der zweiten adverseriellen Perturbation als adverserielle Perturbation; k. Andernfalls, falls der Rauschwert der zweiten adverserielle Perturbation kleiner oder gleich dem zu erwartenden Rauschwert ist, ausführen des Schrittes i., wobei beim Ausführen des Schrittes i. die zweite adverseriellen Perturbation als erste adverserielle Perturbation verwendet wird; I. Andernfalls ermitteln einer projizierten Perturbation und Ausführen des Schrittes j., wobei beim Ausführen des Schrittes j. die projizierte Perturbation als zweite adverserielle Perturbation verwendet wird, ferner wobei die projizierte Perturbation durch eine Optimierung derart ermittelt wird, dass ein Abstand der projizierten Perturbation zur zweiten adverseriellen Perturbation kleinstmöglich wird und der Rauschwert der projizierte Perturbation gleich dem zu erwartenden Rauschwert ist.
  12. Maschinelles Lernsystem (60) nach Anspruch 11, wobei im Schritt h. die erste adverserielle Perturbation zufällig ermittelt wird.
  13. Maschinelles Lernsystem (60) nach Anspruch 11, wobei im Schritt h. die erste adverserielle Perturbation zumindest einen vordefinierten Wert enthält.
  14. Maschinelles Lernsystem (60) nach einem der Ansprüche 11 bis 13, wobei im Schritt i. die zweite adverserielle Perturbation gemäß der Formel δ 2 = δ 1 + α C k g
    Figure DE202020107432U1_0031
    ermittelt wird, wobei δ1 die erste adverserielle Perturbation ist, α ein vordefinierter Schrittweitenwert ist, Ck eine erste Kovarianzmatrix ist und g ein Gradient ist.
  15. Maschinelles Lernsystem (60) nach Anspruch 14, wobei der Gradient g gemäß der Formel g = x i [ L ( ( x i + δ 1 ) , t i ) ]
    Figure DE202020107432U1_0032
    ermittelt wird, wobei L eine Verlustfunktion ist, ti das gewünschte Trainingsausgabesignal (ti) bezüglich der ersten Trainingszeitreihe (xi) ist und f (xi + δ1) das Ergebnis des maschinellen Lernsystems (60) ist, wenn dem maschinellen Lernsystem (60) die mit der ersten adverseriellen Perturbation δ1 überlagerte erste Trainingszeitreihe (xi) übergeben wird.
  16. Maschinelles Lernsystem (60) nach einem der Ansprüche 14 oder 15, wobei die erste Kovarianzmatrix gemäß der Formel C k = i = 1 k λ i v i v i T
    Figure DE202020107432U1_0033
    ermittelt wird.
  17. Maschinelles Lernsystem (60) nach einem der Ansprüche 11 bis 16, wobei in Schritt I. die projizierte adverserielle Perturbation gemäß der Formel δ p = argmin d , r ( d , C k + ) = Δ d δ 2 2
    Figure DE202020107432U1_0034
    ermittelt wird.
  18. Maschinelles Lernsystem (60) nach einem der Ansprüche 1 bis 17, wobei ein Eingabesignal jeweils eine Temperatur und/oder einen Druck und/oder eine Spannung und/oder eine Kraft und/oder eine Geschwindigkeit und/oder eine Drehrate und/oder ein Drehmoment des technischen Systems charakterisiert.
  19. Maschinelles Lernsystem (60) nach Anspruch 18, wobei die Eingabesignale jeweils mit zumindest einem Sensor (30) aufgezeichnet werden.
  20. Maschinelles Lernsystem (60) nach einem der Ansprüche 1 bis 19, wobei die Eingabesignale der Zeitreihe (x) jeweils einen zweiten Betriebszustand und/oder eine zweite Betriebsgröße des technischen Systems zu einem vordefinierten Zeitpunkt charakterisieren und die Eingabesignale der ersten Trainingszeitreihe (xi) jeweils einen zweiten Betriebszustand und/oder eine zweite Betriebsgröße des technischen Systems oder eines baugleichen technischen Systems oder eines bauähnlichen technischen Systems oder eine Simulation des zweiten Betriebszustandes und/oder der zweiten Betriebsgröße zu einem vordefinierten Zeitpunkt charakterisieren.
  21. Maschinelles Lernsystem (60) nach einem der Ansprüche 1 bis 20, wobei das Ausgabesignal (y) eine Regression zumindest des ersten Betriebszustands und/oder zumindest der ersten Betriebsgröße des technischen Systems charakterisiert, wobei der Verlustwert einen quadrierten Euklidischen Abstand zwischen der ermittelten Trainingsausgabe (yi) und der gewünschten Trainingsausgabe (ti) charakterisiert.
  22. Maschinelles Lernsystem (60) nach Anspruch 21, wobei das technische System eine Einspritzvorrichtung einer Verbrennungskraftmaschine ist und die Eingabesignale der Zeitreihe (x) jeweils zumindest einen Druckwert oder einen durchschnittlichen Druckwert der Einspritzvorrichtung charakterisieren und das Ausgabesignal (y) eine Einspritzmenge eines Kraftstoffs charakterisiert, wobei ferner die Eingabesignale der ersten Trainingszeitreihe (xi) jeweils zumindest einen Druckwert oder einen durchschnittlichen Druckwert der Verbrennungskraftmaschine oder einer baugleichen Verbrennungskraftmaschine oder einer bauähnlichen Verbrennungskraftmaschine oder einer Simulation der Verbrennungskraftmaschine charakterisiert und das gewünschte Trainingsausgabesignal (yi) eine Einspritzmenge des Kraftstoffs charakterisiert.
  23. Maschinelles Lernsystem (60) nach einem der Ansprüche 1 bis 20, wobei das technische System eine Fertigungsmaschine ist, die zumindest ein Werkstück fertigt, wobei die Eingabesignale der Zeitreihe (x) jeweils eine Kraft und/oder ein Drehmoment der Fertigungsmaschine charakterisieren und das Ausgabesignal (y) eine Klassifikation charakterisiert, ob das Werkstück korrekt gefertigt wurde oder nicht, wobei ferner die Eingabesignale der ersten Trainingszeitreihe (xi) jeweils eine Kraft und/oder ein Drehmoment der Fertigungsmaschine oder einer baugleichen Fertigungsmaschine oder einer bauähnlichen Fertigungsmaschine oder einer Simulation der Fertigungsmaschine charakterisieren und das gewünschte Trainingsausgabesignal (yi) eine Klassifikation ist, ob ein Werkstück korrekt gefertigt wurde.
  24. Maschinelles Lernsystem (60) nach einem der Ansprüche 1 bis 23, wobei das maschinelle Lernsystem (60) das Ausgabesignal (y) mittels eines neuronalen Netzes ermittelt
  25. Maschinelles Lernsystem (60) nach Anspruch 24, wobei das neuronale Netz ein rekurrentes neuronales Netz (engl. recurrent neural network, RNN) ist.
  26. Maschinelles Lernsystem (60) nach einem der Ansprüche 24 oder 25, wobei das maschinelle Lernsystem (60) ein faltendes neuronales Netz (engl. convolutional neural network, CNN) ist.
  27. Maschinelles Lernsystem (60) nach Anspruch 24, wobei das neuronale Netz ein Transformer ist.
  28. Maschinelles Lernsystem (60) nach Anspruch 24, wobei das neuronale Netz ein mehrschichtiges Perzeptron (engl. multilayer perceptron, MLP) ist.
  29. Trainingsvorrichtung, welche ausgebildet ist das maschinelle Lernsystem (60) entsprechend der Schritte a. bis d. zu trainieren.
  30. Computerprogramm, welches eingerichtet ist, die Schritte a. bis d. nach einem der Ansprüche 1 bis 29 auszuführen, wenn es durch einen Prozessor (45, 145) ausgeführt wird.
  31. Maschinenlesbares Speichermedium (46, 146), auf dem das Computerprogramm nach Anspruch 30 gespeichert ist.
DE202020107432.6U 2020-12-21 2020-12-21 Vorrichtung zur robusten Klassifikation und Regression von Zeitreihen Active DE202020107432U1 (de)

Priority Applications (7)

Application Number Priority Date Filing Date Title
DE202020107432.6U DE202020107432U1 (de) 2020-12-21 2020-12-21 Vorrichtung zur robusten Klassifikation und Regression von Zeitreihen
DE102021201179.9A DE102021201179A1 (de) 2020-12-21 2021-02-09 Verfahren und Vorrichtung zum Trainieren eines Klassifikators oder Regressors zur robusten Klassifikation und Regression von Zeitreihen
PCT/EP2021/084995 WO2022135959A1 (de) 2020-12-21 2021-12-09 Vorrichtung zur robusten klassifikation und regression von zeitreihen
US18/252,031 US20230419179A1 (en) 2020-12-21 2021-12-09 Device for a robust classification and regression of time series
CN202180086134.8A CN116670669A (zh) 2020-12-21 2021-12-09 用于对时间序列进行鲁棒的分类和回归的设备
US18/248,432 US20240005209A1 (en) 2020-12-21 2021-12-09 Method and device for training a classifier or regressor for a robust classification and regression of time series
PCT/EP2021/084990 WO2022135958A1 (de) 2020-12-21 2021-12-09 Verfahren und vorrichtung zum trainieren eines klassifikators oder regressors zur robusten klassifikation und regression von zeitreihen

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
DE202020107432.6U DE202020107432U1 (de) 2020-12-21 2020-12-21 Vorrichtung zur robusten Klassifikation und Regression von Zeitreihen

Publications (1)

Publication Number Publication Date
DE202020107432U1 true DE202020107432U1 (de) 2021-01-22

Family

ID=74565301

Family Applications (2)

Application Number Title Priority Date Filing Date
DE202020107432.6U Active DE202020107432U1 (de) 2020-12-21 2020-12-21 Vorrichtung zur robusten Klassifikation und Regression von Zeitreihen
DE102021201179.9A Pending DE102021201179A1 (de) 2020-12-21 2021-02-09 Verfahren und Vorrichtung zum Trainieren eines Klassifikators oder Regressors zur robusten Klassifikation und Regression von Zeitreihen

Family Applications After (1)

Application Number Title Priority Date Filing Date
DE102021201179.9A Pending DE102021201179A1 (de) 2020-12-21 2021-02-09 Verfahren und Vorrichtung zum Trainieren eines Klassifikators oder Regressors zur robusten Klassifikation und Regression von Zeitreihen

Country Status (4)

Country Link
US (1) US20230419179A1 (de)
CN (1) CN116670669A (de)
DE (2) DE202020107432U1 (de)
WO (1) WO2022135959A1 (de)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN117933104B (zh) * 2024-03-25 2024-06-07 中国人民解放军国防科技大学 固体姿轨控发动机燃气调节阀压强修正方法

Also Published As

Publication number Publication date
WO2022135959A1 (de) 2022-06-30
CN116670669A (zh) 2023-08-29
DE102021201179A1 (de) 2022-06-23
US20230419179A1 (en) 2023-12-28

Similar Documents

Publication Publication Date Title
DE102018106808B4 (de) Zustandsbestimmungsvorrichtung
DE102018006024A1 (de) Controller und maschinelle Lernvorrichtung
DE102016009106A1 (de) Mit Steuerung ausgerüstete Bearbeitungsvorrichtung mit Bearbeitungszeit- Messfunktion und Messfunktion auf der Maschine
DE102018208763A1 (de) Verfahren, Vorrichtung und Computerprogramm zum Betreiben eines maschinellen Lernsystems
EP3701433B1 (de) Verfahren, vorrichtung und computerprogramm zur erstellung eines tiefen neuronalen netzes
DE102019002156A1 (de) Steuergerät und maschinelle Lernvorrichtung
DE102017209262A1 (de) Verfahren und Vorrichtung zur automatischen Gestenerkennung
DE102019104922A1 (de) Kollisionspositionsschätzvorrichtung und maschinenlernvorrichtung
DE202020107432U1 (de) Vorrichtung zur robusten Klassifikation und Regression von Zeitreihen
DE102019210507A1 (de) Vorrichtung und computerimplementiertes Verfahren für die Verarbeitung digitaler Sensordaten und Trainingsverfahren dafür
DE102021200889A1 (de) Verfahren zum Schätzen eines Fahrzeugparameters für den Betrieb eines Fahrzeugs
DE102018003244A1 (de) Numerische Steuerung
DE102021200042A1 (de) Vorrichtung und Verfahren zum Verfahren zum Trainieren des neuronalen Driftnetzwerks und des neuronalen Diffusionsnetzwerks einer neuronalen stochastischen Differentialgleichung
DE102017220954A1 (de) Verfahren, Vorrichtung und Computerprogramm zur Ermittlung einer Anomalie
DE102019202523A1 (de) Verfahren und Vorrichtung zum Betreiben eines Steuerungssystems
DE102019209463A1 (de) Verfahren zur Bestimmung eines Vertrauenswertes eines Objektes einer Klasse
DE102020205962B3 (de) Vorrichtung und Verfahren zum Betreiben eines Prüfstands
DE102013206274A1 (de) Verfahren und Vorrichtung zum Anpassen eines nicht parametrischen Funktionsmodells
DE102020213527A1 (de) Verfahren zum Optimieren einer Strategie für einen Roboter
EP3748574A1 (de) Adaptive bereinigung von messdaten um unterschiedliche arten von störungen
DE102019220453A1 (de) Verfahren und Vorrichtung zum Erstellen einer Sicherheitsfunktion für das Vermessen eines Fertigungssystems
DE202019103233U1 (de) Vorrichtung zum Einstellen eines Hyperparameters
DE102018216078A1 (de) Verfahren und Vorrichtung zum Betreiben eines Steuerungssystems
DE102020205964B3 (de) Vorrichtung und Verfahren zum Betreiben eines Prüfstands
WO2022135958A1 (de) Verfahren und vorrichtung zum trainieren eines klassifikators oder regressors zur robusten klassifikation und regression von zeitreihen

Legal Events

Date Code Title Description
R207 Utility model specification
R150 Utility model maintained after payment of first maintenance fee after three years