WO2020152060A1

WO2020152060A1 - Vorrichtung und verfahren zum trainieren eines neuronalen netzwerks

Info

Publication number: WO2020152060A1
Application number: PCT/EP2020/051170
Authority: WO
Inventors: Michael Feigenbutz
Original assignee: Rockwell Collins Deutschland Gmbh
Priority date: 2019-01-23
Filing date: 2020-01-17
Publication date: 2020-07-30
Also published as: US20220121933A1; EP3915054A1; DE102019101617A1

Abstract

Ein Verfahren zum Trainieren eines Neuronalen Netzwerks weist die Schritte auf: - Bereitstellen eines zu trainierenden Neuronalen Netzwerks (8) zum Erbringen einer vorgegebenen Funktionalität zum Verarbeiten von Eingangsdaten (10), mit einem Eingang zum Zuführen der Eingangsdaten (10) und einem Ausgang zum Ausgeben von als Ergebnissen dienenden Ausgangsdaten (11); - Bereitstellen einer Auswertevorrichtung (1) zum Erbringen einer vorgegebenen Funktionalität, mit einem Eingang zum Zuführen von Eingangsdaten (3) und einem Ausgang zum Ausgeben von als Ergebnissen dienenden Ausgangsdaten (4); - Betreiben der Auswertevorrichtung (1) und des Neuronalen Netzwerks (8) parallel zueinander; - Vergleichen der Ausgangsdaten (4) der Auswertevorrichtung (1) mit den Ausgangsdaten (11) des Neuronalen Netzwerks (8) und Bestimmen der Qualität der Ausgangsdaten (11) des Neuronalen Netzwerks (8) im Verhältnis zu den Ausgangsdaten (4) der Auswertevorrichtung (1); - Rückmelden der Qualität der Ausgangsdaten (11) an das Neuronale Netzwerk (8).

Description

Vorrichtung und Verfahren zum Trainieren eines Neuronalen Netzwerks

Die Erfindung betrifft eine Vorrichtung und ein Verfahren zum Trainieren eines Neuronalen Netzwerks .

Neuronale Netzwerke sind bekannt. Sie werden insbesondere für technische Zwe cke als künstliche Neuronale Netzwerke realisiert und dienen z.B . der Informati onsverarbeitung bei Anwendungen, bei denen kein oder nur geringes explizites bzw. systematisches Wissen über das zu lösende Problem vorliegt. Dies sind zum Beispiel Erkennungsverfahren, wie zum Beispiel die Texterkennung, Bilderken nung, Objekterkennung und Gesichtserkennung, bei denen einige hunderttausend bis Millionen Bildpunkte in eine im Vergleich dazu geringe Anzahl von erlaubten Ergebnissen überführt werden müssen. Auch in der Regelungstechnik kommen (künstliche) Neuronale Netzwerke zum Einsatz, um herkömmliche Regler zu erset zen oder ihnen Sollwerte vorzugeben, die das Netz aus einer selbst entwickelten Prognose über den Prozessverlauf ermittelt hat. Die Anwendungsmöglichkeiten sind aber nicht auf technische oder techniknahe Gebiete begrenzt. Bei der Vor hersage von Veränderungen in komplexen Systemen werden häufig Neuronale Netzwerke unterstützend hinzugezogen, so zum Beispiel zur Früherkennung sich abzeichnender Tornados oder auch zur Abschätzung der weiteren Entwicklung wirtschaftlicher Prozesse .

Zum Erreichen der gewünschten Funktionalität eines Neuronalen Netzwerkes ist es erforderlich, dass das Neuronale Netzwerk angelernt bzw. trainiert wird. Dem entsprechend sind Lernverfahren bekannt, die dazu dienen, ein Neuronales Netz werk dazu zu bringen, für bestimmte Eingangsmuster zugehörige Ausgabemuster zu erzeugen. Die Lernverfahren lassen sich klassifizieren in überwachtes Lernen (Supervised Learning), unüberwachtes Lernen und bestärkendes Lernen.

Beim Supervised Learning ist es erforderlich, das Neuronale Netzwerk mit einer großen Menge an Testdaten anzulernen. Diese Menge an Testdaten muss vorab generiert werden, wobei die Erzeugung dieser Datensätze in der Regel sehr zeit- aufwändig und je nach Anwendungsfall auch schwierig sein kann.

Erfolgreich angelernte (trainierte) Neuronale Netzwerke bieten im Vergleich zu herkömmlichen Lösungen den Vorteil, dass sie häufig eine schnellere und / oder kostengünstigere und unter Umständen sogar die einzige Möglichkeit zur effizien ten Verarbeitung von großen Datenmengen darstellen. Für die Trainings phase von Neuronalen Netzwerken sind je nach Anwendung Hunderttausende oder gar Millionen von Testdatensätzen erforderlich. Für be stimmte, sehr spezielle Anwendungen (zum Beispiel die luftgestützte Identifizie rung kleinerer Objekte) sind solche Daten insbesondere auch in Verbindung mit speziellen Sensoren, wie etwa bildgebendes RADAR, LIDAR, IR etc. (noch) nicht verfügbar und in der erforderlichen Menge auch nicht effizient zu erzeugen.

Andererseits können Neuronale Netzwerk im Aufbau, in der Realisierung und im Betrieb relativ kostengünstig sein, so dass sie sich dazu anbieten, konventionelle (teure) Systeme zu ersetzen.

Der Erfindung liegt daher die Aufgabe zugrunde, eine Vorrichtung und ein Verfah ren anzugeben, mit denen ein Neuronales Netzwerk effizient trainiert werden kann.

Die Aufgabe wird erfindungsgemäß durch eine Vorrichtung nach Anspruch 1 und ein Verfahren gemäß dem nebengeordneten Anspruch gelöst. Vorteilhafte Ausge staltungen sind in den abhängigen Ansprüchen angegeben.

Es wird eine Vorrichtung zum Trainieren eines Neuronales Netzwerks angegeben, mit einem zu trainierenden Neuronalen Netzwerk zum Erbringen einer vorgegebe nen Funktionalität zum Verarbeiten von Eingangsdaten, mit einem Eingang zum Zuführen der Eingangsdaten und einem Ausgang zum Ausgeben von als Ergebnis sen dienenden Ausgangsdaten, und mit einer Auswertevorrichtung zum Erbringen einer vorgegebenen Funktionalität, mit einem Eingang zum Zuführen von Ein gangsdaten und einem Ausgang zum Ausgeben von als Ergebnissen dienenden Ausgangsdaten. Die Auswertevorrichtung und das Neuronale Netzwerk sind paral lel zueinander angeordnet, wobei eine Vergleichseinrichtung vorgesehen ist, zum Vergleichen der Ausgangsdaten der Auswertevorrichtung mit den Ausgangsdaten des Neuronalen Netzwerks und zum Bestimmen der Qualität der Ausgangsdaten des Neuronalen Netzwerks im Verhältnis zu den Ausgangsdaten der Auswertevor richtung. Weiterhin ist eine Rückmeldeeinrichtung vorgesehen, zum Rückmelden der von der Vergleichseinrichtung bestimmten Qualität der Ausgangsdaten an das Neuronale Netzwerk.

Analog wird ein Verfahren zum Trainieren eines Neuronalen Netzwerks angegeben, mit den Schritten Bereitstellen eines zu trainierenden Neuronalen Netzwerks zum Erbringen einer vorgegebenen Funktionalität zum Verarbeiten von Eingangsdaten, mit einem Eingang zum Zuführen der Eingangsdaten und einem Ausgang zum Ausgeben von als Ergebnissen dienenden Ausgangsdaten;

Bereitstellen einer Auswertevorrichtung zum Erbringen einer vorgegebenen Funktionalität, mit einem Eingang zum Zuführen von Eingangsdaten und einem Ausgang zum Ausgeben von als Ergebnissen dienenden Ausgangsdaten;

Betreiben der Auswertevorrichtung und des Neuronalen Netzwerks parallel zueinander;

Vergleichen der Ausgangsdaten der Auswertevorrichtung mit den Ausgangsdaten des Neuronalen Netzwerks und Bestimmen der Qualität der Ausgangsdaten des Neuronalen Netzwerks im Verhältnis zu den Ausgangsdaten der Auswertevorrichtung;

Rückmelden der Qualität der Ausgangsdaten an das Neuronale Netzwerk.

Erfindungsgemäß können dementsprechend die Auswertevorrichtung und das Neuronale Netzwerk parallel zueinander angeordnet bzw. geschaltet werden. Bei der Auswertevorrichtung kann es sich um ein bekanntes , konventionelles System handeln, das - unter Umständen konform mit vorgegebenen technischen Regel werken - die gewünschte Funktionalität bereits zuverlässig erfüllt. Insbesondere kann aber die Auswertevorrichtung relativ teuer sein, so dass es angestrebt wird, die Auswertevorrichtung durch das vorab zu trainierende Neuronale Netzwerk zu ersetzen.

Dabei übernimmt die Auswertevorrichtung das Training des Neuronalen Netz werks , indem sie parallel dazu betrieben wird. Die Auswertevorrichtung kann so mit auch als Trainingsvorrichtung bezeichnet werden.

Wie erläutert, kann es sich bei der Auswertevorrichtung um eine konventionelle Vorrichtung handeln, die nicht auf einem Neuronalen Netzwerk basiert. Ebenso ist es aber auch möglich, dass die Auswertevorrichtung ihrerseits ein Neuronales Netzwerk aufweist, das dann jedoch bereits voll angelernt bzw. trainiert ist.

Unter dem Begriff der "Funktionalität" können beliebige Anwendungen, Aufgaben bzw. Ziele verstanden werden, die durch die Auswertevorrichtung einerseits und das zu trainierende Neuronale Netzwerk andererseits erbracht werden sollen.

Beim Betrieb der Auswertevorrichtung und des Neuronalen Netzwerks parallel zu einander werden somit beide Systeme mit möglichst identischen Eingangssituati- onen konfrontiert. Nur dann ist es möglich, das Verhalten und die Erkenntnisse des einen Systems (der bewährten Auswertevorrichtung) auf das andere System (das anzulernende Neuronale Netzwerk) zu übertragen. Je identischer die Ein- gangssituationen sind und damit die daraus resultierenden Eingangsdaten, desto zuverlässiger kann das Neuronale Netzwerk trainiert werden.

Die Vergleichseinrichtung dient dazu, die (im Wesentlichen korrekten und be währten) Ausgangsdaten der Auswertevorrichtung mit den Ausgangdaten des Neu ronalen Netzwerks zu vergleichen und dadurch die Qualität der Ausgangsdaten des Neuronalen Netzwerks im Verhältnis zu den Ausgangsdaten der Auswertevor richtung zu bestimmen. Die Daten werden dabei insbesondere bewertet, so dass die nachfolgend erforderliche Rückmeldung mit Hilfe der Rückmeldeeinrichtung erfolgen kann.

Die Rückmeldeeinrichtung ist dazu ausgebildet, die von der Vergleichseinrichtung bestimmte Qualität der Ausgangsdaten an das Neuronale Netzwerk zurückzumel den, um auf diese Weise einen Trainingseffekt für das Neuronale Netzwerk und damit nachfolgend eine Verbesserung der Qualität der Ausgangsdaten des Neuro nalen Netzwerks zu bewirken.

Unter " Qualität" der Ausgangsdaten kann zum Beispiel die Korrektheit der von dem Neuronalen Netzwerk gelieferten Wahrscheinlichkeiten (auch als "Prediction" bezeichnet) verstanden werden. Üblicherweise sind Neuronale Netzwerke dazu ausgebildet, bestimmte Wahrscheinlichkeiten festzustellen und daraus Schluss folgerungen zu ziehen. Diese Wahrscheinlichkeiten können mit den wesentlich exakteren Daten der (konventionellen) Auswertevorrichtung verglichen werden, wobei das Ergebnis an das Neuronale Netzwerk zurückzumelden ist.

Ein Beispiel: Einem Neuronalen Netzwerk wird über eine angeschlossene Video kamera ein Hund präsentiert. Aufgrund seines Trainingszustands gibt das Neuro nale Netzwerk an, dass das präsentierte Objekt zu 80 % ein Hund, zu 80 % eine Katze oder zu 10 % ein Fisch sein kann. Die Qualität dieser Ergebnisse wird dann ermittelt und als Rückmeldung in das Neuronale Netzwerk zurück gespeist:

Hund: richtig (der Wahrscheinlichkeitswert von 80% kann aber noch ver bessert werden, in Richtung 100 % ) ,

Katze : falsch (der Wahrscheinlichkeitswert von 80 % ist nicht korrekt und sollte niedriger sein) , Fisch: richtig (weil mit 10 % bereits eine sehr geringe Wahrscheinlichkeit festgestellt wurde ; soll aber zu 0 % gesetzt werden).

Bei einem nachfolgenden Erkennungsvorgang unter ähnlichen Bedingungen wird dann die Wahrscheinlichkeit für "Hund" größer als 80 % sein, während die für "Katze" geringer sein wird. Auch die für "Fisch" wird noch geringer als 10 % sein.

Für die Rückmeldung der Qualitäts Information zu den Ausgangsdaten an das Neuronale Netzwerk können übliche Verfahren genutzt werden, wie zum Beispiel die Back Propagation, Rückkopplung, Fehlerrückführung.

In der Trainingsphase lernt das Neuronale Netzwerk anhand des vorgegebenen Lernmaterials . Dementsprechend werden in der Regel die Gewichte zwischen den einzelnen Neuronen modifiziert. Lernregeln geben dabei die Art und Weise an, wie das Neuronale Netz diese Veränderungen vornimmt. Die erfindungsgemäße Vor richtung bzw. das erfindungsgemäße Verfahren erlauben es , Neuronale Netzwerke automatisiert anzulernen und dabei auf die Vorab-Generierung von Testdatensät zen zu verzichten. Vielmehr werden echte Datensätze im Betrieb der (herkömmli chen) Auswertevorrichtung generiert, die zum Trainieren des Neuronalen Netz werks genutzt werden können.

Dazu wird in der Anlernphase (Trainingsphase) eine bereits vorhandene Lösung (konventionelle Auswertevorrichtung) mit einer neuen, auf einem Neuronalen Netzwerk basierenden Lösung kombiniert. Dabei ist es möglich, dass für die bei den dann kombinierten Systeme unterschiedliche Sensoriken verwendet werden. Die vorhandene Lösung übernimmt dabei das Training der neuen Lösung (des Neuronalen Netzwerks) .

Die Eingangs - und Ausgangs -Parameter der vorhandenen Lösung werden genutzt, um das Feedback für die Rückmeldung (zum Beispiel der sog. Backpropagation) des Neuronalen Netzwerks zu erzeugen.

Nach der automatisierten ( "online" ) Anlernphase kann auf den konventionellen, häufig langsameren und / oder teureren herkömmlichen Mechanismus (Auswerte vorrichtung) und dessen Komponenten (Sensoren, Rechner) verzichtet werden. Ebenso ist es aber auch möglich, die neue Lösung (Neuronales Netzwerk) parallel zu betreiben, um das Gesamtsystem mit zusätzlichen Eigenschaften aufzuwerten und zum Beispiel die Qualität der Ergebnisse zu verbessern. Die Eingangsdaten für die Auswertevorrichtung und die Eingangsdaten für das Neuronale Netzwerk können jeweils von einer Sensorvorrichtung bereitgestellt werden. Als Sensorvorrichtung eignet sich dabei jede Art von Messwertaufnahme , wie zum Beispiel auch eine (Video- )Kamera, ein Videosensor (z.B . IR) , ein bildge bender RADAR-Sensor, ein LIDAR-Sensor, eine 2D-Kamera, eine 3D-Kamera, ein Mikrofon. Die Sensorvorrichtung ist dazu ausgebildet, die Eingangsdaten in einer Weise zu generieren, dass sie von dem Neuronalen Netzwerk bzw. der Auswerte vorrichtung verarbeitet werden können. Selbstverständlich können dabei auch weitere Komponenten zwischengeschaltet werden, um eine entsprechende Aufbe reitung der Daten vorzunehmen, wenn dies aufgrund der Charakteristik der Sen sorvorrichtung erforderlich ist.

Die Eingangsdaten für die Auswertevorrichtung und die Eingangsdaten für das Neuronale Netzwerk können von unterschiedlichen Sensorvorrichtungen bereitge stellt werden. Es ist somit nicht zwingend erforderlich, dass beide Sensorvorrich tungen identisch aufgebaut sind. So ist es zum Beispiel möglich, die Auswertevor richtung mit einem Videosensor zu koppeln, während das Neuronale Netzwerk Eingangsdaten von einem LIDAR-Sensor erhält.

Die Auswertevorrichtung und die zugeordnete Sensorvorrichtung können Aus gangsdaten in einer zufriedenstellenden Qualität liefern. Wie oben erläutert, han delt es sich bei der Auswertevorrichtung um ein herkömmliches bzw. konventio nelles System, das bereits in der Vergangenheit in der Lage war, Ausgangsdaten in einer Qualität zu liefern, die den jeweiligen Anforderungen entspricht. Die An forderungen können zum Beispiel durch technische Regelwerke oder aber auch herstellerseitig vorgegeben sein. Unter "zufriedenstellender Qualität" ist somit zu verstehen, dass die Qualität ausreicht, um den angestrebten Zweck bzw. die ge wünschte Funktionalität zu erfüllen.

Die Qualität kann auch als zufriedenstellend angesehen werden, wenn eine defi nierte minimale prozentuale Erkennungsrate bzw. - umgekehrt - eine definierte maximale Fehlerrate in Bezug auf die zu erkennenden " Objekte" erreicht wird.

Nach Erreichen einer zufriedenstellenden Qualität oder nach Erreichen eines vor gegebenen Quantums an Rückmeldungen (z. B . Hunderttausend, eine Million o.ä. ) kann ein Abschluss der Trainings phase festgestellt werden. Das Trainieren des Neuronalen Netzwerks sollte möglichst effizient durchgeführt werden und kann daher beendet werden, wenn das Neuronale Netzwerk Ergebnisse mit zufrieden stellender Qualität liefert. Insbesondere kann dieser Zustand erreicht sein, wenn nur noch geringe bzw. ver nachlässigbare Abweichungen der Ergebnisse des Neuronalen Netzwerkes von de nen der Auswertevorrichtung festgestellt werden. Ebenso ist es auch möglich, die Anzahl der Iterationen bzw. Rückmeldungen zu ermitteln und bei Erreichen einer vorgegebenen Anzahl an Datensätzen (z. B . Hunderttausend oder Millionen) davon auszugehen, dass das Neuronale Netzwerk ausreichend trainiert wurde . In diesen Fällen wird der Abschluss der Trainingsphase festgestellt, so dass das Neuronale Netzwerk nachfolgend auch autark betrieben werden kann.

Nach Abschluss der Trainingsphase kann eine Trennung der Auswertevorrichtung von dem Neuronalen Netzwerk erfolgen, wobei ein autarker Betrieb des Neurona len Netzwerks erfolgen kann, ohne dass weiterhin ein paralleler Betrieb der Aus - wertevorrichtung erfolgen muss . Das Neuronale Netzwerk kann dann in Alleinstel lung, ohne die Auswertevorrichtung betrieben werden. Die Auswerteeinrichtung kann somit aus der Anordnung entfernt werden.

Bei einer Variante kann nach Abschluss der Trainingsphase ein paralleler Betrieb der Auswertevorrichtung und des Neuronalen Netzwerks erfolgen. In diesem Fall können sich die Auswertevorrichtung und das Neuronale Netzwerk ergänzen, so dass die Arbeitsqualität des aus beiden Systemen bestehenden Gesamtsystems verbessert werden kann. Ebenso ist es möglich, zusätzliche Eigenschaften bereit zustellen.

Zum Beispiel kann ein System mit einer Auswertevorrichtung und einem Vi deosensor durch ein Neuronales Netzwerk mit einem bildgebenden RADAR- , IR- oder LIDAR-Sensor ergänzt werden, um aus der Summe der Erkenntnisse mit ho her Präzision Objekte eines Eingangsbilds zu erkennen.

Neuronale Netzwerke können für vielerlei Funktionalitäten genutzt werden, wobei die vorgegebene Funktionalität ausgewählt sein kann aus der Gruppe Erkennen eines Objekts oder mehrerer Objekte , Erkennen von Texten, Schrift, Bildern, Mus tern, Fahrzeugen, Personen oder Gesichtern, Erkennen räumlicher Korrelationen, Optimierungsprozesse , Regelung und Analyse komplexer Prozesse , Frühwarnsys teme , Optimierung, Zeitreihenanalyse , Sprachgenerierung, Data-Mining, Maschi nenübersetzung, medizinische Diagnostik, Epidemiologie , Biometrie , Klangsyste me , Navigation mit bildgebender Sensorik, Erkennung chronologischer Sequenzen, Vorausschauende Instandhaltung etc . Diese und weitere Vorteile und Merkmale werden nachfolgend von Beispielen un ter Zuhilfenahme der begleitenden Figuren näher erläutert. Es zeigen:

Figur 1 in schematischer Darstellung ein konventionelles System mit einer herkömmlichen Auswertevorrichtung;

Figur 2 eine erfindungsgemäße Vorrichtung zum Trainieren eines Neu ronalen Netzwerks ; und

Figur 3 ein Beispiel für einen Anwendungsfall eines bereits trainierten

Neuronalen Netzwerks .

Figur 1 zeigt in schematischer Darstellung den Aufbau eines konventionellen Sys tems mit einer herkömmlichen Auswertevorrichtung 1 , die mit einem Videosensor 2 gekoppelt ist.

Die an sich bekannte Auswertevorrichtung 1 ist in dem gezeigten Beispiel dazu ausgebildet, um eine Video-basierte Objekterkennung durchzuführen. So ist sie in der Lage , aufgrund von Videosensor 2 erzeugten Eingangsdaten 3 Objekte zu er kennen und als Ausgangsdaten 4 Informationen über identifizierte (klassifizierte) Objekte 5 zu liefern.

In dem gezeigten Beispiel wird eine reale Situation 6 mit realen Objekten 7 durch den Videosensor 2 erfasst und in Form von Eingangsdaten 3 an die Auswertevor- richtung 1 geliefert. Die Funktionalität der Auswertevorrichtung 1 ermöglicht es , aus den Eingangsdaten 3 Informationen über die realen Objekte 7 zu ermitteln und in Form der Ausgangsdaten 4 auszugeben, so dass damit die identifizierten (von der Auswertevorrichtung 1 erkannten) Objekte 5 als Ergebnisse der Auswer tevorrichtung 1 ermittelt werden.

Derartige bewährte Systeme zur Objekterkennung können z.B . für die Erkennung von Verkehrszeichen durch Pkws oder Erkennung von Fußgängern durch autono me Fahrzeuge genutzt werden. Ebenso können diese Systeme beispielsweise auch zur Erkennung von Objekten auf Förderbändern eingesetzt werden.

Figur 2 zeigt ein Beispiel für eine erfindungsgemäße Vorrichtung zum Trainieren eines Neuronalen Netzwerks . Teil dieser Vorrichtung ist die im Zusammenhang mit Figur 1 bereits erläuterte Auswertevorrichtung 1 mit dem Videosensor 2. Die realen Objekte 7 in der realen Situation 6 können somit durch die Auswertevorrichtung als Ausgangsdaten 4 mit den identifizierten Objekten 5 als Ergebnis ausgegeben werden.

Parallel zu der Auswertevorrichtung 1 ist ein Neuronales Netz 8 (auch als Neuro nales Netzwerk bezeichnet) angeordnet, das durch die Auswertevorrichtung 1 trai niert werden soll. Das Neuronale Netz 8 ist somit zunächst in einem Ausgangszu stand noch nicht in der Lage , zufriedenstellende Ergebnisse zu liefern.

Das Neuronale Netz 8 kann ebenfalls mit einen Videosensor 2 gekoppelt sein. Im konkreten Beispiel ist das Neuronale Netz 8 jedoch mit einem LIDAR-Sensor 9 ge koppelt. LIDAR (auch LADAR genannt) ist eine dem Radar verwandte Methode zur optischen Abstands - und Geschwindigkeitsmessung unter Nutzung von Laser strahlen. LIDAR-Sensoren haben sich vor allem zur Erkennung dreidimensionaler Situationen bewährt.

Der LIDAR-Sensor 9 wird mit der gleichen realen Situation 6 und damit mit den gleichen realen Objekten 7 konfrontiert wie der Videosensor 2 bzw. die Auswerte vorrichtung 1 .

Der LIDAR-Sensor 9 liefert somit eigene Eingangsdaten 10 , die in dem Neuronalen Netz 8 verarbeitet werden. Die Ergebnisse des Neuronale Netzes 8 werden als Aus gangsdaten 1 1 bereitgestellt und bestehen insbesondere aus Gewichtungen. Aus den Ergebnissen bzw. Gewichtungen ergeben sich entsprechende Erkenntnisse hinsichtlich der identifizierten Objekte 5. Die Ergebnisse werden in der Regel auch als Wahrscheinlichkeiten ( "Prediction" ) angegeben.

Selbstverständlich können auch mehrere Sensoren mit dem Neuronalen Netzwerk 8 gekoppelt werden, wenn dies für den geplanten Anwendungsfall sinnvoll ist.

In dem in Figur 2 gezeigten Beispiel ist erkennbar, dass das Neuronale Netz 8 noch unvollständig trainiert ist und von den beiden realen Objekten 7 lediglich das Quadrat als einziges identifiziertes Objekt 5 erkannt hat, nicht jedoch das Dreieck als weiteres reales Objekt 7. Für die zuverlässige Erkennung des Dreiecks muss das Neuronale Netz 8 somit noch weiter trainiert werden.

Die Ergebnisse der Auswertevorrichtung 1 und des Neuronalen Netzes 8 in Form der Ausgangsdaten 4, 1 1 werden einer Vergleichseinrichtung 12 zugeführt, die eine Bewertung der Ergebnisse des Neuronalen Netzes 8 vornimmt, insbesondere im Vergleich zu den Ergebnissen der Auswertevorrichtung 1 . Dabei können die Ausgangsdaten 4, 1 1 miteinander verglichen werden, um auf diese Weise die Qua lität der Ausgangsdaten 1 1 des Neuronalen Netzes 8 im Verhältnis zu den Aus gangsdaten 4 der Auswertevorrichtung 1 zu bestimmen.

Die Erkenntnisse der Vergleichseinrichtung 12 werden mit Hilfe einer Rückmelde einrichtung 13 zurück zu dem Neuronalen Netz 8 geführt. Die Rückmeldung dient insbesondere als Fehlerrückführung, um Fehler des Neuronalen Netzwerks zu korrigieren. Die Rückmeldung wird häufig auch als "Backpropagation" bezeichnet und kann durch bekannte Verfahren verwirklicht werden.

Ein bewährtes Verfahren ist zum Beispiel das Gradientenabstiegsverfahren, das mit einer zufällig gewählten Gewichtskombination startet, für welche der Gradient bestimmt und um eine vorgegebene Länge - der Lernrate - hinabgestiegen wird. Dadurch werden die Gewichte entsprechend verändert. Für die neu erhaltene Ge wichtskombination wird wiederum der Gradient bestimmt und abermals eine Mo difikation der Gewichte vorgenommen. Dieses Verfahren wiederholt sich so lange , bis ein lokales Minimum bzw. globales Minimum erreicht ist oder eine zuvor fest gelegte maximale Anzahl von Wiederholungen erreicht worden ist.

Auf diese Weise wird das Neuronale Netz 8 trainiert, so dass sich die von ihm er zeugten Ergebnisse immer mehr den Ergebnissen der bewährten, herkömmlichen Auswertevorrichtung 1 annähern.

Schließlich ist es möglich, das (ausreichend trainierte) Neuronale Netz 8 von der Auswertevorrichtung 1 zu entkoppeln, wie Figur 3 zeigt.

Die Auswertevorrichtung 1 ist für diesen Fall nicht mehr erforderlich.

Das Neuronale Netz 8 kann entsprechend dem Aufbau von Figur 3 autark betrie ben werden und liefert Ergebnisse in ausreichender Qualität. So ist das Neuronale Netz 8 in dem gezeigten Beispiel geeignet, als identifizierte Objekte 5 sowohl das Quadrat als auch das Dreieck zu identifizieren.

Da das Neuronale Netz 8 parallel zu der herkömmlichen Auswertevorrichtung 1 betrieben werden kann, ist es problemlos möglich, das Neuronale Netz 8 auch im realen Betrieb, das heißt im realen Einsatz der Auswertevorrichtung 1 zu trainie ren. Die von der Auswertevorrichtung 1 generierten "Testdaten" sind dabei konk- ret nutzbare Daten, die quasi als "Nebenprodukt" auch für das Training des Neu ronalen Netzes 8 genutzt werden können. Es ist somit nicht erforderlich, eine ei genständige Trainings phase einzurichten. Vielmehr könnte das Training im nor malen Regelbetrieb der Auswertevorrichtung 1 erfolgen.

Der Einsatz neuer Sensorik mit der Auswertung durch ein Neuronales Netzwerk wird insbesondere dort vereinfacht, wo keine oder nur wenige Trainings daten ver fügbar sind. Das Verfahren kann außerdem das kontinuierliche Weiterlernen des Neuronalen Netzwerks auch über einen längeren Zeitraum ermöglichen, um die Zuverlässigkeit des Neuronalen Netzwerks immer mehr zu erhöhen.

Claims

Patentansprüche

1. Vorrichtung zum Trainieren eines Neuronalen Netzwerks (8), mit

einem zu trainierenden Neuronalen Netzwerk (8) zum Erbringen einer vorgegebenen Funktionalität zum Verarbeiten von Eingangsdaten (10), mit einem Eingang zum Zuführen der Eingangsdaten (10) und einem Ausgang zum Ausgeben von als Ergebnissen dienenden Ausgangsdaten (11); und mit

einer Auswertevorrichtung (1) zum Erbringen einer vorgegebenen Funktionalität, mit einem Eingang zum Zuführen von Eingangsdaten (3) und einem Ausgang zum Ausgeben von als Ergebnissen dienenden Ausgangsdaten (4); wobei

die Auswertevorrichtung (1) und das Neuronale Netzwerk (8) parallel zueinander angeordnet sind;

eine Vergleichseinrichtung (12) vorgesehen ist, zum Vergleichen der Ausgangsdaten (4) der Auswertevorrichtung (1) mit den Ausgangsdaten (11) des Neuronalen Netzwerks (8) und zum Bestimmen der Qualität der Ausgangsdaten (11) des Neuronalen Netzwerks (8) im Verhältnis zu den Ausgangsdaten (4) der Aus Wertevorrichtung (1); und wobei

eine Rückmeldeeinrichtung (13) vorgesehen ist, zum Rückmelden der von der Vergleichseinrichtung (12) bestimmten Qualität der Ausgangsdaten (11) an das Neuronale Netzwerk (8).

2. Verfahren zum Trainieren eines Neuronalen Netzwerks, mit den Schritten

Bereitstellen eines zu trainierenden Neuronalen Netzwerks (8) zum

Erbringen einer vorgegebenen Funktionalität zum Verarbeiten von Eingangsdaten (10), mit einem Eingang zum Zuführen der Eingangsdaten (10) und einem Ausgang zum Ausgeben von als Ergebnissen dienenden Ausgangsdaten (11);

Bereitstellen einer Auswertevorrichtung (1) zum Erbringen einer vorgegebenen Funktionalität, mit einem Eingang zum Zuführen von Eingangsdaten (3) und einem Ausgang zum Ausgeben von als Ergebnissen dienenden Ausgangsdaten (4);

Betreiben der Auswertevorrichtung (1) und des Neuronalen Netzwerks (8) parallel zueinander;

Vergleichen der Ausgangsdaten (4) der Auswertevorrichtung (1) mit den Ausgangsdaten (11) des Neuronalen Netzwerks (8) und Bestimmen der Qualität der Ausgangsdaten (11) des Neuronalen Netzwerks (8) im Verhältnis zu den Ausgangsdaten (4) der Auswertevorrichtung (1);

Rückmelden der Qualität der Ausgangsdaten (11) an das Neuronale Netzwerk (8).

3. Verfahren nach Anspruch 2 , wobei die Eingangsdaten (3) für die Auswertevorrichtung ( 1 ) und die Eingangsdaten ( 10) für das Neuronale Netzwerk (8) jeweils von einer Sensorvorrichtung (2 , 9) bereitgestellt werden.

4. Verfahren nach Anspruch 2 oder 3 , wobei die Eingangsdaten (3) für die Auswertevorrichtung ( 1 ) und die Eingangsdaten ( 1 1 ) für das Neuronale Netzwerk (8) von unterschiedlichen Sensorvorrichtungen (2 , 9) bereitgestellt werden.

5. Verfahren nach einem der Ansprüche 2 bis 4, wobei die Auswertevorrichtung ( 1 ) und die zugeordnete Sensorvorrichtung (2 ) Ausgangsdaten (4) in einer zufriedenstellenden Qualität liefern.

6. Verfahren nach einem der Ansprüche 2 bis 5 , wobei nach Erreichen einer zufriedenstellenden Qualität oder nach Erreichen eines vorgegebenen Quantums an Rückmeldungen ein Abschluss der Trainingsphase festgestellt wird.

7. Verfahren nach einem der Ansprüche 2 bis 6 , wobei

nach Abschluss der Trainingsphase eine Trennung der Auswertevorrichtung ( 1 ) von dem Neuronalen Netzwerk (8) erfolgt; und wobei

ein autarker Betrieb des Neuronalen Netzwerks (8) erfolgt, ohne dass ein paralleler Betrieb der Auswertevorrichtung ( 1 ) erfolgt.

8. Verfahren nach einem der Ansprüche 2 bis 7 , wobei nach Abschluss der Trainingsphase ein paralleler Betrieb der Auswertevorrichtung ( 1 ) und des Neuronalen Netzwerks (8) erfolgt.

9. Vorrichtung nach Anspruch 1 oder Verfahren nach einem der Ansprüche 2 bis 8 , wobei die vorgegebene Funktionalität ausgewählt ist aus der Gruppe

Erkennen eines Objekts oder mehrerer Objekte ;

Erkennen von Texten, Schrift, Bildern, Mustern, Fahrzeugen, Personen oder Gesichtern;

Erkennen räumlicher Korrelationen;

Optimierung;

Regelung und Analyse komplexer Prozesse ;

Frühwarnsysteme ;

Optimierung;

Zeitreihenanalyse wie Wetter oder Aktien;

Spracherkennung- und -generierung; Data-Mining;

Maschinenübersetzung;

Medizinische Diagnostik, Epidemiologie , Biometrie ; Klangsysteme ;

- Navigation mit bildgebender Sensorik;

Erkennung chronologischer Sequenzen;

Vorausschauende Instandhaltung.