DE69120444T2 - Vorrichtung zur Erkennung von Sequenzen in einem mehrdimensionalen Signal - Google Patents

Vorrichtung zur Erkennung von Sequenzen in einem mehrdimensionalen Signal

Info

Publication number
DE69120444T2
DE69120444T2 DE69120444T DE69120444T DE69120444T2 DE 69120444 T2 DE69120444 T2 DE 69120444T2 DE 69120444 T DE69120444 T DE 69120444T DE 69120444 T DE69120444 T DE 69120444T DE 69120444 T2 DE69120444 T2 DE 69120444T2
Authority
DE
Germany
Prior art keywords
sequence
recognized
values
vectors
correlation
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
DE69120444T
Other languages
English (en)
Other versions
DE69120444D1 (de
Inventor
Francois Micheron
Dominique Potier
Philippe Refregier
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Thales SA
Original Assignee
Thomson CSF SA
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Thomson CSF SA filed Critical Thomson CSF SA
Application granted granted Critical
Publication of DE69120444D1 publication Critical patent/DE69120444D1/de
Publication of DE69120444T2 publication Critical patent/DE69120444T2/de
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/20Image preprocessing
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/70Arrangements for image or video recognition or understanding using pattern recognition or machine learning
    • G06V10/74Image or video pattern matching; Proximity measures in feature spaces
    • G06V10/75Organisation of the matching processes, e.g. simultaneous or sequential comparisons of image or video features; Coarse-fine approaches, e.g. multi-scale approaches; using context analysis; Selection of dictionaries

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Multimedia (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Computing Systems (AREA)
  • Artificial Intelligence (AREA)
  • Health & Medical Sciences (AREA)
  • Databases & Information Systems (AREA)
  • Evolutionary Computation (AREA)
  • General Health & Medical Sciences (AREA)
  • Medical Informatics (AREA)
  • Software Systems (AREA)
  • Image Analysis (AREA)
  • Image Processing (AREA)

Description

  • Die Erfindung gehört in das Gebiet der Erkennung von Sequenzen von multidimensionalen Signalen und insbesondere von Bildsignalen.
  • Unter multidimensionalen Signalen werden Signale verstanden, die aus multidimensionalen Elementen oder Vektoren bestehen. Im Fall von Bildsignalen ist jedes Bild ein Vektor des Signals.
  • Die Erfindung ist beispielsweise auf die automatische Erfassung einer bestimmten Untersequenz von Bildern in einer Bildfolge anwendbar, die von einem Videoprogramm ausgestrahlt wird, so daß die automatische Steuerung von selektiven Speicherungen möglich wird. Die Erfindung kann auch als eine Vorrichtung verwendet werden, um Zugang zum Speicher einer Bilddatenbank über den Inhalt zu erlangen.
  • Die Erfindung läßt sich auf vielfältige Weise in der Bildverarbeitung und automatischen Bildanzeige, beispielsweise in der Robotertechnik einsetzen.
  • Ganz allgemein betrifft die Erfindung die Erkennung einer beliebigen Art von multidimensionalen Signalen, wie z.B. die Zeit-Frequenz-Spektren von akustischen Signalen, die Radarsignale und die Signale von mehreren Sonden.
  • Es sind mehrere Methoden zur Erfassung einer vorab bekannten Signalfolge bekannt.
  • Die Druckschrift EP-A-106 534 beschreibt eine Vorrichtung zur Zeichenerkennung mit einer ersten Korrelationsschaltung, um die ersten Korrelationen zwischen jedem Teil eines Bildzeichens und Daten bezüglich der Bezugszeichen zu berechnen, und mit einer zweiten Korrelationsschaltung, die die Lage eines dem Bezugszeichen möglichst nahekommenden Zeichens erkennt, indem der Maximalwert der ersten Korrelationen R(x) durch die Umwandlung jeder der ersten Korrelationen R(x) in eine zweite, folgendermaßen ausgedrückte Korrelation in Evidenz gebracht wird: [R(x) - R(x-α)] - [R(x
  • + α) - R(x)], wobei x ein variabler Faktor ist, der eine Zone darstellt, in der der Teil der Daten des Bildes von Zeichen erfaßt wird, während a ein vorbestimmter Wert ist, der im Einklang mit der Größe der Daten der Bezugszeichen bestimmt wird.
  • Die Druckschrift GB-A-2 029 994 bezieht sich auf eine Vorrichtung zur Zeichenerkennung mit Leseschaltungen, Speicherschaltungen und Schaltungen zur Segmentierung und Standardisierung. Der so erhaltene charakteristische Vektor wird dann mit Hilfe einer Vektorstandardisierungsschaltung standardisiert und dann auf eine Gruppe von Eigenvektoren entsprechend den Klassen von Zeichen projiziert, die erkannt werden sollen. Schließlich erfolgt eine Auswahl in Verbindung mit einem vorbestimmten Algorithmus unter Verwendung der Projektionsergebnisse.
  • Die Druckschrift EP-A-0 063 765 beschreibt eine Vorrichtung zur Zeichenerkennung, bei der ein Eingangszeichen in eine Mehrzahl von Unterzeichen zerlegt wird, die dann mit einer Mehrzahl von charakteristischen genormten Zeichenteilen verglichen werden, um eine Ähnlichkeitsmatrix der Eingangszeichen zu bilden. Die Matrix wird dann mit einer Mehrzahl von Bezugsähnlichkeitsmatrizen verglichen, die standardisierte Bezugszeichen enthalten, wobei das Eingangszeichen als das standardisierte Zeichen erkannt wird, das ihm am ähnlichsten ist. Dies erfolgt mit Hilfe einer ersten Schaltung zur Berechnung der Ähnlichkeit der Eingangsvektoren und einer zweiten Schaltung zur Ähnlichkeitsberechnung, die die Ähnlichkeiten zwischen der Ähnlichkeitsmatrix der Eingangsvektoren und der Bezugs-Ähnlichkeitsmatrix berechnet. Ein Komparator identifiziert jeweils ein Bezugszeichen.
  • Die am meisten verwendete Technik ist die einer linearen Filterung oder einer Korrelation gemäß einem gegebenen Standard. Wenn die Erkennung die Invarianzeigenschaften nicht berücksichtigt, insbesondere hinsichtlich einer Drehung oder Maßstabsänderung, ist, genauer, betrachtet die Filtertechnik die im Rahmen der Signalverarbeitung am weitesten verbreitete Technik.
  • Wenn jedoch das zu analysierende Signal sehr viele Informationen enthält, beispielsweise im Fall der Videobilder, in denen die Vektoren viele Dimensionen haben, erfordert die Anwendung der linearen Filtertechnik sehr viel teure Rechenzeit. Außerdem ist in diesem Fall der für die Speicherung der Merkmale des Filters notwendige Speicher sehr groß.
  • Eine einfachere Methode hinsichtlich der Kriterien der Komplexität der Rechnung und der erforderlichen Speichergröße besteht darin, den zu analysierenden Signalvektor vor dem Filtern zu komprimieren. Diese Kompression muß einfach sein, um in Echtzeit durchgeführt werden zu können. Im Fall eines Bildes mit hoher Auflösung kann man Unterbilder geringer Auflösung definieren, die einige zehn Bildpunkte in Zeilen und Spaltenrichtung besitzen, beispielsweise indem Werte im Inneren von Gruppen von Bildpunkten des hochauflösenden Bilds gemittelt werden.
  • Diese Transformation, die vom Ausgangsvektor unabhängig ist, führt unweigerlich zu einem Informationsverlust und damit zu einem Verlust bei der Diskriminierung.
  • Es ist möglich, diesen Nachteil zu beheben, indem gleichzeitig mehrere Vektoren der analysierten Folge gefiltert oder korreliert werden. Dies führt jedoch zu einer deutlichen Vergrößerung der Rechenleistung und der erforderlichen Speichergröße
  • Ziel der Erfindung ist es, diese Nachteile zu beheben.
  • Insbesondere soll die Erfindung eine Vorrichtung zur Erkennung von Folgen mehrdimensionaler Signale vorschlagen, die gute Diskriminationseigenschaften besitzt.
  • Ein ergänzendes Ziel der Erfindung ist es, eine solche Vorrichtung anzugeben, die wenig komplexe Filteroder Korrelationsmittel erfordert, insbesondere hinsichtlich der Rechenleistung und der Speichergröße.
  • Ein weiteres Ziel der Erfindung ist es, eine solche Vorrichtung anzugeben, die preiswert herzustellen ist und deshalb für die breite Masse in Frage kommt.
  • Schließlich ist es ein Ziel der Erfindung, eine solche Vorrichtung vorzuschlagen, die leicht neu programmiert werden kann, d.h. bei der man schnell die zu erkennenden Folgen verändern kann.
  • Diese und weitere Ziele, die nachfolgend erläutert werden, werden mit einer Vorrichtung zur Erkennung von Folgen in einem kontinuierlich erzeugten Signal erreicht, das aus mehrdimensionalen Vektoren besteht, wobei die Vorrichtung für jede der zu erkennenden Folgen aufweist:
  • - erste Mittel zur Korrelation (im weitesten Sinn) von für das Signal repräsentativen Vektoren mit einem Maskenvektor aufweist, der ausgehend von für die zu erkennende Folge repräsentativen Vektoren bestimmt ist, wobei diese Mittel eine Folge von Werten entsprechend dem Ähnlichkeitsgrad der beiden korrelierten Werte erzeugen,
  • - zweite Korrelationsmittel zur Korrelation einer Folge von Werten mit einer Bezugsfolge, die aufgrund von die zu erken nende Folge bildenden Werten bestimmt wird, wobei diese Mittel Werte erzeugen, die dem Ähnlichkeitsgrad der beiden korrelierten Folgen entsprechen,
  • - und Mittel, die über die Gültigkeit der Erkennung durch Vergleich der dem Ähnlichkeitsgrad der beiden korrelierten Folgen entsprechenden Werte mit einem Schwellwert entscheiden.
  • Auf diese Weise erlaubt die erfindungsgemäße Vorrichtung in Kaskadenform eine räumliche und eine zeitliche Erkennung der zu erkennenden Folge.
  • Vorzugsweise werden die für das Signal repräsentativen Vektoren von Mitteln zur Informationskompression geliefert, die von den das Signal bildenden Werten gespeist werden.
  • In einer besonderen Ausführungsform der Erfindung führen die Informationskompressionsmittel eine Mittelung durch.
  • Vorzugsweise enthalten die ersten Korrelationsmittel und/oder die zweiten Korrelationsmittel Mittel zur Berechnung eines euklidischen Standards.
  • In diesem Fall ist die erfindungsgemäße Vorrichtung eine nicht-lineare Vorrichtung. Die größere Komplexität der Berechnungen im Vergleich zu einer linearen Vorrichtung wird leicht durch die verringerte Anzahl von erforderlichen Operationen kompensiert.
  • In einer bevorzugten Ausführungsform der Erfindung weist die Vorrichtung Mittel auf, um den Schwellwert an den zulässigen Rauschpegel anzupassen.
  • Die Vorrichtung kann auch Mittel zur Umwandlung des Ähnlichkeitsgrads, beispielsweise abhängig vom maximalen Schwellenwert, aufweisen.
  • Vorzugsweise enthält die Vorrichtung Mittel zur Bestimmung des Maskenvektors und/oder der Bezugsfolge, die eine die Rauschempfindlichkeit minimisierende Lemregel verwenden.
  • Vorzugsweise weisen die Mittel zur Bestimmung des Maskenvektors Mittel, die die Vektoren der zu erkennenden Folge ausmitteln, und Mittel zur Bestimmung der Bezugsfolge auf, die jeden für die zu erkennende Folge repräsentativen Vektor mit dem Maskenvektor korrelieren.
  • Dieser relativ einfache Lernprozeß führt dazu, daß die Vorrichtung leicht erneut programmiert werden kann.
  • Andere Merkmale und Vorzüge der Erfindung werden nun anhand eines nicht beschränkend zu verstehenden bevorzugten Ausführungsbeispiels und der beiliegenden Zeichnungen näher erläutert.
  • Figur 1 zeigt ein Übersichtsschema einer erfindungsgemäßen Vorrichtung zur Erkennung von Bildfolgen.
  • Figur 2 zeigt schematisch die Verarbeitung einer Bildfolge in der Vorrichtung aus Figur 1.
  • In der dargestellten bevorzugten Ausführungsform geht es um die Erkennung von bekannten Bildunterfolgen in einer kontinuierlich erzeugten Folge von Bildern. Beispielsweise kann eine solche Vorrichtung im Rahmen eines Programmiersystems für einen Videorecorder angewendet werden.
  • Figur 1 zeigt ein Übersichtsschema einer solchen Vorrichtung.
  • Jedes der empfangenen Bilder 10 wird zuerst in einem Informationskompressionsmodul 11 komprimiert. So werden die Bilder 10 der zu analysierenden Folge, beispielsweise mit einer Auflösung von 400 Spalten und 625 Zeilen, auf komprimierte Bilder 12 oder Bildchen reduziert, die beispielsweise 20 20 Bildpunkte enthalten. Die Berechnung erfolgt in Echtzeit beim Eintreffen jedes neuen Bilds, d.h. beispielsweise für die Videofrequenz alle 40 ms.
  • Der Informationskompressionsmodul 11 ist kein für die Erfindung obligatorisches Element. Er hat nur die Aufgabe, die Menge von zu verarbeitenden Informationen zu verringern. Dies führt jedoch zu einem Diskriminationsverlust im Vergleich zu den ursprünglichen Bildern.
  • Die Erfindung enthält im wesentlichen zwei Korrelationsmoduln in Kaskade, die eine räumliche Erkennung jedes Bilds oder Bildchens 12 und dann eine zeitliche Erkennung der Bildfolge 16 durchführen. Der erste Korrelationsmodul 13 arbeitet mit der gleichen Bildgeschwindigkeit wie der Kompressionsmodul 11 und berechnet die Korrelation jedes komprimierten Bilds 12 mit einer Bezugsmaske 14. Der Rechen algorithmus sowie die Art, wie die Bezugsmaske vom Lemmodul 15 ermittelt wird, werden nachfolgend erläutert.
  • Diese Verarbeitung liefert eine zeitliche Folge 16, nämlich die Folge der Korrelationen der komprimierten Bilder 12 mit der Bezugsmaske 14. Ein zweiter Korrelationsmodul 17 führt einen Vergleich zwischen der zeitlichen Folge 16 und der Bezugsfolge 18 durch, die von der zu erfassenden Folge 19 erhalten wurde. Das Ergebnis dieser Berechnung, die alle 40 ms durchgeführt wird, liefert den Ähnlichkeitsgrad 20 zwischen der laufenden beobachteten Bildfolge und der zu erkennenden Folge.
  • Ein Schwellenmodul 21 vergleicht diesen Ahnlichkeitsgrad 20 mit einer Schwelle 22 und entscheidet, ob die gesuchte Folge erkannt wurde oder nicht. Die laufende Folge wird als erkannt betrachtet, wenn der Ähnlichkeitsgrad S(t) unter der gegebenen Schwelle SSchwelle liegt.
  • Die Schwelle 22 kann eine feste oder variable Schwelle sein, die insbesondere vom zulässigen Rauschpegel abhängt.
  • Jede Transformationsfunktion S(t) kann verwendet werden. In diesem Fall bestimmt ein Modul 23 für die Berechnung des Schwellwerts den Wert der anzulegenden Schwelle 22. Das kann aus verschiedenen Gründen interessant sein, wie z.B. zur Verringerung der Ausgangsdynamik, zur Erkennung eines Maximalsignals oder Binärsignals in der Folge usw.
  • Eine mögliche Transformation ist beispielsweise:
  • S(t) T log(1-S(t)/SmaX)
  • Hierbei ist Smax der maximal mögliche Wert von S(t).
  • Die beschriebene Vorrichtung kann auf die Suche nach mehreren Bildfolgen erweitert werden. In diesem Fall werden für jede zu erkennende Folge zwei eigene Korrelationsmoduln 13 und/oder 17 eingesetzt.
  • In der Praxis reichen ein räumlicher Korrelationsmodul 13 und ein zeitlicher Korrelationsmodul 17 aus, während die Masken und Bezugsfolgen entsprechend jeder zu erkennenden Folge selektiv verwendet werden.
  • Figur 2 zeigt die an jedem Bild 30 durchgeführte Verarbeitung. Das Bild 30 wird in ein Unterbild 31 komprimiert, wobei die Gruppe von Bildpunkten 32 dem Bildpunkt 33 des komprimierten Bilds 31 entspricht. Dieses komprimierte Bild wird dann mit der Maske 34 korreliert. Der Korrelationswert 35 ist umso größer, je mehr sich das komprimierte Bild von der Maske 34 unterscheidet. Die Folge 36 der Korrelationswerte 35 wird mit der Bezugsfolge korreliert. Dies entspricht also einer Messung in einem gleitenden Fenster 37.
  • Mathematisch gesehen kann die Verarbeitung in drei Schritte zerlegt werden, nämlich die Bildkompression, die Korrelation mit einer Maske und die Korrelation mit einer Bezugs folge.
  • Die Kompression des Bildes kann durch die nachfolgende Gleichung entsprechend einer Mittelung für jeden Bildpunkt i des komprimierten Bilds erhalten werden:
  • Hierbei gilt:
  • Imtj ist der j-te Bildpunkt des unkomprimierten Anfangsbilds im Zeitpunkt t.
  • Xti ist der i-te Bildpunkt des komprimierten Bilds im Zeitpunkt t.
  • Wi.j sind Gewichtungskoeffizienten. Im einfachsten Fall gilt
  • Wi,j = 1 für alle i,j, aber ein beliebiges anderes Gewichtungsfenster kann auch in Betracht gezogen werden.
  • f(i,j) definiert die Umgebung der Bildpunkte, in der die Gewichtung durchgeführt wird, um den komprimierten Bildpunkt i zu erhalten.
  • N ist die Anzahl der Bildpunkte, über die die Gewichtung erfolgt, d.h. die Kompression.
  • Der Schritt der Korrelation mit einer Maske wird durch folgende Gleichung bestimmt:
  • yt = N&sub1;( xt> F> ) (2)
  • Hierbei gilt: Yt ist die Korrelation im Sinn einer Standardisierung zumindest in der Umgebung der zu erkennenden Bildchen zwischen Xti und Fi.
  • Xt> und F> sind Vektorgrößen entsprechend Xti bzw. Fi der auf die komprimierten Bilder angewandten Maske.
  • N&sub1;(.) stellt einen Standard zumindest in der Nähe der Bildchen der Folge dar:
  • X¹&sub0;> F> , X²&sub0;> - F), ..., Xt&sub0;> - F). T ist die Anzahl von Bildern der Folge.
  • Der dritte Schritt entspricht der folgenden Gleichung:
  • S(t) = N&sub2;(Y(t)-h)
  • Hierbei gilt:
  • S(t) bildet den Ausgang des Systems zum Zeitpunkt t.
  • Y(t) ist die vektorielle Schreibweise entsprechend (yi+1-T, ... Yi).
  • h ist die vektorielle Schreibweise entsprechend (h¹, h²,... hT). Wenn also, genauer betrachtet,
  • X¹&sub0;> X²&sub0;> ,..., XT&sub0;>
  • die T Bildchen der zu erfassenden Unterfolge darstellen (die ihrerseits aus T Bildern berechnet wurden), dann bilden h¹,
  • h²,... hT die Ausgänge
  • y¹&sub0;, y²&sub0; ..., YT
  • die aus dieser Folge mit der Maske F> erhalten wurden. N&sub2; stellt einen Standard dar.
  • Das gesetzte Ziel ist die Erkennung einer vorab bekannten Bildfolge. Ein geeignetes Maß für die Korrelation im weitesten Sinn zwischen der zu erkennenden Folge in der beobachteten Folge ist also eher ein Standard als ein Skalarprodukt, wie es im allgemeinen für die Korrelationsmessung Verwendung findet.
  • In diesem Fall verwendet die erfindungsgemäße Vorrichtung eine nicht-lineare Kaskadenverarbeitung. Dies führt zu wirkungsvolleren Rechnungen. Die Erfindung hat den Vor teil, die Anzahl der durchzuführenden Berechnungen zu verringern, wodurch die Quadrierungen entsprechend den Standardbedingungen in Echtzeit durchgeführt werden können.
  • Die Standards N&sub1; und N&sub2; können vorzugsweise euklidische Standards sein.
  • Diese Standards ermöglichen nämlich eine Verringerung der Anzahl von Bildfolgen, die die gleiche zeitliche Folge yt ergeben würden, sobald die Korrelation mit dem Bezugsfilter erfolgt ist. Außerdem ergibt sich eine Unempfindlichkeit gegenüber dem Rauschen.
  • In diesem Fall lassen sich die Gleichungen (2) und (3) folgendermaßen schreiben:
  • (Hierbei ist M die Anzahl der Punkte des komprimierten Bilds Xt> )
  • Der Betrieb der Erkennungsvorrichtung erfordert eine Lernphase für die beiden Korrelationsmoduln ausgehend von der zu erkennenden Bildfolge. Man kann insbesondere die beiden folgenden Lemregeln verwenden:
  • Hierbei ist Xa1i der Punkt i des Bildes 1 der zu erkennenden Folge.
  • Die Einfachheit dieser Lemregeln erlaubt die Herstellung von programmierbaren Systemen, d.h. Systemen, bei denen man rasch und einfach die zu erkennende Folge oder Folgen ändern kann.
  • Es ist auch möglich, andere Lemregeln anzuwenden, die gegen eine mehr oder weniger komplexe Berechnung eine wirksamere Maske und eine wirksamere Bezugsfolge ergeben, d.h. die Anzahl von falsch erkannten Korrelationen verringern.
  • Da die Anzahl der zu speichernden Koeffizienten gering ist, kann man mehrere Masken und Bezugsfolgen verwenden und so mehrere Bildfolgen suchen, ohne daß die Speichergröße allzu sehr zunimmt.
  • Mit einer solchen Vorrichtung entspricht eine Maske F> einer Größe von 20 20 Bildpunkten, die je mit einem Byte kodiert werden, einem Speicher von 400 Bytes. Beträgt die Dauer der analysierten Folge 2 Sekunden, dann ergibt sich die Speichergröße zum Speichern der Koeffizienten h mit 100 Bytes, wenn sie mittels zweier Bytes kodiert werden. Dies erfordert also global einen Speicher von 500 Bytes.
  • Die erforderliche Rechenleistung beträgt in diesem Fall n b(M+T)N, wobei nb die Anzahl der Elementaroperationen, T die Anzahl der Bilder in der zu erkennenden Folge, N die Anzahl von Bildern je Sekunde und M die Anzahl von Bildpunkten des komprimierten Bilds bedeuten.
  • Im Fall eines komprimierten Bilds mit 400 Bildpunkten mit einer Bildfolge von 25 Bildern je Sekunde und für eine zu erkennende Folge von 2 Sekunden, wobei drei Elementaroperationen erforderlich sind, beträgt die notwendige Rechenleistung 33.000 Operationen je Sekunde. Dies erfordert keinen sehr leistungsfähigen Prozessor, so daß ein für die breite Öffentlichkeit bestimmtes, kostengünstiges System ausreicht.
  • Die Bildkompression wird bei dieser Berechnung nicht berücksichtigt. Spezialisierte Schaltungen können diese Aufgabe erfüllen, wie z.B. Schaltungen, die in für die breite Öffentlichkeit bestimmten Videorecordern verwendet werden, um Bilder einzuprägen.
  • So verbindet die erfindungsgemäße Vorrichtung gute Unterscheidungseigenschaften mit einer geringen erforderlichen Rechenleistung und kleinem Speicher.
  • Zahlreiche andere Ausführungsformen der Erfindung können in Betracht gezogen werden. So ist es möglich, andere bekannte Rechentechniken sowohl für die Bildkorrelation mit der Maske als auch für die Korrelation der laufenden Folge mit der Bezugsfolge einzusetzen.
  • Die Erfindung ist nicht auf die Erkennung von Videobildern beschränkt. Sie läßt sich auch in zahlreichen Fällen in der Robotertechnik einsetzen. Beispielsweise kann man mit ihr Gegenstände klassifizieren, die auf einem Förderband durchlaufen und von einer ortsfesten Kamera gefilmt werden.
  • In diesem Fall werden verschiedene Sequenzen entsprechend jedem der zu klassifizierenden Gegenstände gesucht. Es ist dann möglich, spezifische Korrelations- und Lernmittel zu verwenden, die insbesondere die Rotationsinvarianz berücksichtigen, um den Gegenstand unabhängig von seiner Lage zu erkennen.
  • Eine andere Anwendung der Erfindung in der Robotertechnik liegt in der Erfassung von Fehlfunktionen. Im Fall eines Roboters, der immer dieselbe Aufgabe löst, entspricht die zu erkennende Folge der vom Roboter durchgeführten Folge von Aktionen. Solange kein Fehler auftritt, stimmt die erkannte Folge stets. Sobald aber der Ausgangswert 20 des zweiten Korrelators eine gewisse Schwelle überschreitet, meldet die erfindungsgemäße Vorrichtung einen Fehler im Betrieb des Roboters.
  • Diese Anwendungen im Bereich der Robotertechnik sind besonders preisgünstig, insbesondere im Vergleich mit den spezialisierten Bildverarbeitungssystemen. Die erfindungs gemäße Vorrichtung kann beispielsweise in einem üblichen, mit der Kamera gekoppelten Mikrorechner implementiert sein.
  • Ganz allgemein kann jede Folge von mehrdimensionalen Signalen durch die erfindungsgemäße Vorrichtung mit Vorteil verarbeitet werden und insbesondere die Zeit-Frequenz-Spektren von akustischen Signalen, von Signalen aus mehreren Sonden und von Radarsignalen. In diesem Fall werden die diese Signale bildenden Vektoren genauso verarbeitet wie oben für die Bilder eines Videosignals beschrieben.

Claims (8)

1. Vorrichtung zum Erkennen von Folgen (19) in einem kontinuierlich erzeugten Signal (10), das von mehrdimensionalen Vektoren gebildet wird, dadurch gekennzeichnet, daß sie für jede der zu erkennenden Folgen (19) aufweist:
- erste Mittel (13) zur räumlichen Korrelation von für das Signal (10) repräsentativen Vektoren (12; 33) mit einem Maskenvektor (14; 34), der ausgehend von für die zu erkennende Folge (19) repräsentativen Vektoren bestimmt ist, wobei diese Mittel eine Folge (36) von Werten (16; 35) entsprechend dem Ähnlichkeitsgrad der beiden korrelierten Werte (12, 14; 33, 34) erzeugt,
- zweite zeitliche Korrelationsmittel zur Korrelation einer Folge (36) von Werten (16; 35) mit einer Bezugsfolge (18; 37), die aufgrund von die zu erkennende Folge (19), bildenden Werten bestimmt wird, wobei diese Mittel Werte (20) erzeugen, die dem Ähnlichkeitsgrad der beiden korrelierten Folgen (16, 18) entsprechen,
- und Mittel (21), die über die Gültigkeit der Erkennung durch Vergleich der dem Ähnlichkeitsgrad der beiden korrelierten Folgen entsprechenden Werte (20) mit einem Schwellwert (22) entscheiden.
2. Vorrichtung nach Anspruch 1, dadurch gekennzeichnet, daß die für das Signal (10) repräsentativen Vektoren (12; 33) von Mitteln (11) zur Informationskompression geliefert werden, die von den das Signal (10) bildenden Werten (30) gespeist werden.
3. Vorrichtung nach Anspruch 2, dadurch gekennzeichnet, daß die Informationskompressionsmittel (11) eine Mittelung durchführen.
4 Vorrichtung nach einem beliebigen der Ansprüche 1 und 3, dadurch gekennzeichnet, daß die ersten Korrelationsmittel (13) und/oder die zweiten Korrelationsmittel (17) Mittel zur Berechnung eines euklidischen Standards enthalten.
5. Vorrichtung nach einem beliebigen der Ansprüche 1 bis 4, dadurch gekennzeichnet, daß sie Mittel (23) aufweist, um den Schwellwert an den zulässigen Rauschpegel anzupassen.
6. Vorrichtung nach einem beliebigen der Ansprüche 1 bis 5, dadurch gekennzeichnet, daß sie Mittel (24) zur Umwandlung des Ähnlichkeitsgrads (20) beispielsweise abhängig vom maximalen Schwellwert besitzen.
7. Vorrichtung nach einem beliebigen der Ansprüche 1 bis 6, dadurch gekennzeichnet, daß Mittel (15) zur Bestimmung des Maskenvektors (14) und/oder der Bezugsfolge (18) vorgesehen sind, die eine die Rauschempfindlichkeit minimisierende Lemregel verwenden.
8. Vorrichtung nach Anspruch 7, dadurch gekennzeichnet, daß die Mittel (15) zur Bestimmung des Maskenvektors (14) Mittel aufweisen, die die Vektoren der zu erkennenden Folge ausmitteln, und daß die Mittel (15) zur Bestimmung der Bezugsfolge (18) Mittel zur Korrelation jedes für die zu erkennende Folge repräsentativen Vektors (12) mit dem Maskenvektor (14) enthalten.
DE69120444T 1990-03-13 1991-03-08 Vorrichtung zur Erkennung von Sequenzen in einem mehrdimensionalen Signal Expired - Fee Related DE69120444T2 (de)

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
FR9003170A FR2659817B1 (fr) 1990-03-13 1990-03-13 Dispositif de reconnaissance de sequences dans un signal multidimensionnel.

Publications (2)

Publication Number Publication Date
DE69120444D1 DE69120444D1 (de) 1996-08-01
DE69120444T2 true DE69120444T2 (de) 1996-11-28

Family

ID=9394659

Family Applications (1)

Application Number Title Priority Date Filing Date
DE69120444T Expired - Fee Related DE69120444T2 (de) 1990-03-13 1991-03-08 Vorrichtung zur Erkennung von Sequenzen in einem mehrdimensionalen Signal

Country Status (4)

Country Link
US (1) US5214716A (de)
EP (1) EP0447306B1 (de)
DE (1) DE69120444T2 (de)
FR (1) FR2659817B1 (de)

Families Citing this family (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5363521A (en) * 1992-06-01 1994-11-15 Fisher-Price, Inc. Collapsible playpen
US5640492A (en) * 1994-06-30 1997-06-17 Lucent Technologies Inc. Soft margin classifier
US5841907A (en) * 1994-11-14 1998-11-24 The University Of Connecticut Spatial integrating optical correlator for verifying the authenticity of a person, product or thing
FR2727215B1 (fr) * 1994-11-18 1996-12-20 Thomson Csf Dispositif de veille panoramique infrarouge statique a detecteurs matriciels multiples
WO1996030854A1 (fr) * 1995-03-31 1996-10-03 Tadashi Shibata Logique de calcul a semi-conducteur
US5661527A (en) * 1995-07-07 1997-08-26 Tektronix, Inc. Automatic video signal identification
FR2750487B1 (fr) * 1996-06-28 2005-10-21 Thomson Csf Revetement pour la protection personnelle d'un fantassin
DE502004004734D1 (de) * 2004-07-30 2007-10-04 Brainlab Ag Optimierung der Bildsignal-Interpretation für analoge Bildsignale von medizinischen Bildaufnahmevorrichtungen, insbesondere Röntgengeräten

Family Cites Families (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US3993976A (en) * 1974-05-13 1976-11-23 The United States Of America As Represented By The Secretary Of The Air Force Method and apparatus for pattern analysis
US4241329A (en) * 1978-04-27 1980-12-23 Dialog Systems, Inc. Continuous speech recognition method for improving false alarm rates
US4259661A (en) * 1978-09-01 1981-03-31 Burroughs Corporation Apparatus and method for recognizing a pattern
JPS57178578A (en) * 1981-04-27 1982-11-02 Toshiba Corp Pattern recognition system
JPS5951536A (ja) * 1982-09-14 1984-03-26 Fujitsu Ltd パタ−ン認識方法及びその装置
US4998286A (en) * 1987-02-13 1991-03-05 Olympus Optical Co., Ltd. Correlation operational apparatus for multi-dimensional images
US4977604A (en) * 1988-02-17 1990-12-11 Unisys Corporation Method and apparatus for processing sampled data signals by utilizing preconvolved quantized vectors

Also Published As

Publication number Publication date
EP0447306B1 (de) 1996-06-26
FR2659817A1 (fr) 1991-09-20
EP0447306A1 (de) 1991-09-18
FR2659817B1 (fr) 1992-05-29
DE69120444D1 (de) 1996-08-01
US5214716A (en) 1993-05-25

Similar Documents

Publication Publication Date Title
DE3689416T2 (de) Mustermerkmalextraktion.
DE68928895T2 (de) Verfahren und Gerät für universelle adaptiv lernende Bildmessung und -erkennung
DE69628282T2 (de) Verfahren zur kompression mehrerer videobilder
DE69424196T2 (de) Automatische Zeichenerkennung mit Verwendung statischer und dynamischer Parameter
DE60307224T2 (de) Computergestütztes verfahren zur entdeckung von mustern in unbekannten hochdimensionalen daten
DE69516733T2 (de) Verfahren und System mit neuronalem Netzwerk zur Bestimmung der Lage und der Orientierung
EP0645037B1 (de) Verfahren zur detektion von änderungen in bewegtbildern
EP0517324B1 (de) Vorrichtung zur Steuerung des Quantisierers eines Hybridkodierers
EP0523407B1 (de) Verfahren zur Klassifikation von Signalen
DE19634768A1 (de) Vorrichtung und Verfahren zur Erfassung eines Gesichts in einem Videobild
DE69330021T2 (de) Verbessertes System zur Mustererkennung für Sonar und andere Anwendungen
DE69223447T2 (de) Lernverfahren für neuronales Netzwerk und Klassifizieranlage zum Anwenden dieses Verfahrens
DE69120444T2 (de) Vorrichtung zur Erkennung von Sequenzen in einem mehrdimensionalen Signal
DE69517249T2 (de) Anordnung zur segmentierung eines diskreten datensatzes
DE2813157C2 (de) Gerät zur selbsttätigen, lageunabhängigen Mustererkennung
EP1989662B1 (de) Verfahren zum erkennen von objekten und objekterkennungssystem
EP1709587B1 (de) Bildverarbeitungssystem
DE69129284T2 (de) Gerät und Verfahren zur Bildverarbeitung
EP2359308B1 (de) Vorrichtung zur erzeugung und/oder verarbeitung einer objektsignatur, überwachungsvorrichtung, verfahren und computerprogramm
DE10210926A1 (de) Vorrichtung zur Verfolgung wenigstens eines Objekts in einer Szene
DE10252731A1 (de) Verfahren zur Überwachung einer Szene mit wenigstens einem bildgebenden Sensor
EP1998272A2 (de) Vorrichtung zur Bestimmung einer Objekt- und/oder Existenzwahrscheinlichkeit eines Suchobjekts in einem Auslesefenster eines Bildes, Verfahren sowie Computerprogramm
WO1998027511A1 (de) Verfahren und vorrichtung zur orts- und grössenunabhängigen erfassung von merkmalen aus einem bild
EP0710927A2 (de) Verfahren zur objektorientierten Erkennung bewegter Objekte
DE69228412T2 (de) Trainieren neuronaler Netzwerke unter Ausnutzung von invarianten Merkmalen der Eingangsmuster

Legal Events

Date Code Title Description
8364 No opposition during term of opposition
8320 Willingness to grant licences declared (paragraph 23)
8339 Ceased/non-payment of the annual fee