DE69434131T2 - Vorrichtung zur Segmentierung von aus Texturen bestehenden Bildern - Google Patents

Vorrichtung zur Segmentierung von aus Texturen bestehenden Bildern Download PDF

Info

Publication number
DE69434131T2
DE69434131T2 DE69434131T DE69434131T DE69434131T2 DE 69434131 T2 DE69434131 T2 DE 69434131T2 DE 69434131 T DE69434131 T DE 69434131T DE 69434131 T DE69434131 T DE 69434131T DE 69434131 T2 DE69434131 T2 DE 69434131T2
Authority
DE
Germany
Prior art keywords
image
texture
subunit
memory
segmentation
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
DE69434131T
Other languages
English (en)
Other versions
DE69434131D1 (de
Inventor
Christophe Oddou
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Koninklijke Philips NV
Original Assignee
Koninklijke Philips Electronics NV
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Priority claimed from FR9305365A external-priority patent/FR2705005A1/fr
Application filed by Koninklijke Philips Electronics NV filed Critical Koninklijke Philips Electronics NV
Publication of DE69434131D1 publication Critical patent/DE69434131D1/de
Application granted granted Critical
Publication of DE69434131T2 publication Critical patent/DE69434131T2/de
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T7/00Image analysis
    • G06T7/10Segmentation; Edge detection
    • G06T7/11Region-based segmentation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T7/00Image analysis
    • G06T7/10Segmentation; Edge detection
    • G06T7/155Segmentation; Edge detection involving morphological operators
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/20Image preprocessing
    • G06V10/26Segmentation of patterns in the image field; Cutting or merging of image elements to establish the pattern region, e.g. clustering-based techniques; Detection of occlusion
    • G06V10/267Segmentation of patterns in the image field; Cutting or merging of image elements to establish the pattern region, e.g. clustering-based techniques; Detection of occlusion by performing operations on regions, e.g. growing, shrinking or watersheds
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T2207/00Indexing scheme for image analysis or image enhancement
    • G06T2207/20Special algorithmic details
    • G06T2207/20112Image segmentation details
    • G06T2207/20152Watershed segmentation

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Multimedia (AREA)
  • Image Analysis (AREA)
  • Image Processing (AREA)
  • Facsimile Image Signal Circuits (AREA)
  • Compression Or Coding Systems Of Tv Signals (AREA)
  • Compression Of Band Width Or Redundancy In Fax (AREA)

Description

  • Diese Erfindung betrifft eine Vorrichtung zur Segmentierung von aus Texturen bestehenden Bildern anhand von die besagten Bilder darstellenden digitalen Signalen und durch Kennzeichnung jeder Textur mit Hilfe von darstellenden Parametern und Zergliederung jedes Bilds in mit den besagten Texturen verbundene Regionen, wobei die besagte Vorrichtung enthält:
    • (A) Für die besagte Kennzeichnung der Textur eine Untereinheit (100) zur direktionalen morphologischen Filterung gefolgt von einer Untereinheit (200) zur Bestimmung von Texturparametern;
    • (B) am Ausgang der besagten Untereinheit zur Bestimmung von Parametern eine Untereinheit (300) zur Segmentierung in Regionen mit der so genannten Technik zur Extraktion von Wasserscheidelinien, auf ein Bild mit in Blöcke bestimmter Größe unterteilten Texturparameter angewendet;
    • (C) eine Sequenzierungsstufe (600) für die Ausgabe der verschiedenen Steuersignale der besagten Untereinheiten.
  • Die Übertragung oder Speicherung von Bildern in sehr kurzen Zeiten erfordert sehr hohe Datenraten, die allgemein sowohl aus wirtschaftlichen als auch aus technischen Gründen nicht in Betracht kommen. Es ist demnach unumgänglich, die zu übertragenden (oder zu speichernden) Informationen zu komprimieren. Die derzeitigen Techniken zur Kompression von Daten beruhen entweder auf herkömmliche Art auf einer Verarbeitung des Signals durch orthogonale Transformationen mit Kompressionsraten nahe 10 oder in einer anderen Perspektive gründend auf einer besseren Analyse der betreffenden Bilder, was zu höheren Kompressionsraten führt, auf einer Vorverarbeitung der Bilder, die darin besteht, sie als aus einer Einheit homogener Regionen gebildet zu betrachten, die jeweils mit einer Kontur und einer innere Textur definiert sind.
  • Eine solche Vorverarbeitung der Bilder, beschriebenen z. B. in dem Dokument „Segmentation adaptative pour le codage d'images", Doktorarbeit Nr. 691 (1987), präsentiert von Herrn R. Leonardi vom Département d'Électricité de l'Ecole Polytechnique Fédérale de Lausanne, ermöglicht den Erhalt einer korrekten Segmentierung in homogene Regionen, wenn die Leuchtdichte in jeder dieser Regionen wenig variiert, führt aber zu einer starken Segmentierung, wenn die besagten Regionen Texturen vom Typ Gras, Bast, Holz etc ... oder auf allgemeine Weise Zonen entsprechen, wo man eine Art strukturierten oder mehr oder weniger periodischen Aspekt beobachten kann, definiert mit einer primären Körnung und einem oder mehreren Anordnungs- oder Wiederholungsgesetzen für diese Körnung über die gesamte Fläche. Für die Verarbeitung solcher Texturen schlägt die französische Patentanmeldung Nr. 2660459, die in ihrer Einleitung die Vielfältigkeit der bislang bekannten Segmentierungsverfahren nach dem vorgefundenen Texturtyp unterstreicht, allerdings eine Segmentierungsmethode vor, die sich ungeachtet des Bildtyps eignen könnte und insbesondere folgende Basisschritte beinhaltet: Charakterisierung jeder Textur mit einer Einheit von Parametern zur Bildung eines prototypischen Sektors und Klassifizierung durch Zergliederung des Bildes in mit den verschiedenen Regionen verbundenen Texturen mit eventueller Verbindung der erhaltenen Regionen.
  • Das Ziel der Erfindung ist es, eine Vorrichtung zur Segmentierung von aus Texturen bestehenden Bildern vorzuschlagen, die unter Einhaltung dieser Basisschritte eine völlig neue Umsetzung vorschlägt.
  • Zu diesem Zweck betrifft die Erfindung eine Vorrichtung zur Segmentierung wie im einleitenden Absatz definiert und dadurch gekennzeichnet, dass:
    • (A) Die besagte Untereinheit (100) zur direktionalen morphologischen Filterung enthält:
    • (a) Einen ersten Speicher (10) der das zu segmentierende Bild darstellenden digitalen Signale;
    • (b) am Ausgang dieses ersten Speichers einen ersten Umschalter (5) mit vier Positionen, parallel gefolgt von vier direktionalen morphologischen Filterschaltungen (11, 12, 13, 14);
    • (c) einen zweiten Speicher (20) zur Ablage der nacheinander erhaltenen vier Bilder;
    • (d) einen Subtrahierer (25) und an dessen Ausgang einen dritten Speicher (30) zur Ablage von vier Restbildern, nacheinander über die Differenz zwischen dem Originalbild und den jeweils vier gefilterten Bildern erhalten;
    • (B) die besagte Untereinheit (200) zur Bestimmung von Texturparametern enthält:
    • (e) eine Schaltung (35) zur Integration der Restbilder;
    • (f) am Ausgang einen zweiten Umschalter (36) mit vier Positionen gefolgt von vier parallelen Zweigen mit jeweils in Serie einem vierten Speicher zur Ablage des Bildes charakteristischer Textur in Verbindung mit einer entsprechenden Filterung, einer räumlichen Untermusterungsschaltung dieses Bildes, einer Schaltung zur Berechnung des morphologischen Gradienten und einem fünften Speicher zur Ablage des besagten Gradienten;
    • (g) einen Addierer (59) der Ausgänge des besagten fünften Speichers;
    • (h) einen sechsten Speicher (60) zur Ablage des so genannten globalen, am Ausgang des besagten Addierers vorhandenen Gradienten.
  • Die Struktur der so vorgeschlagenen Vorrichtung ist aus folgendem Grund Original. Die mathematische Morphologie, welche ein sehr effizientes Werkzeug mit der Bezeichnung Wasserscheidelinientechnik aufweist, um die Segmentierung des Bildes auszuführen, verwendet üblicherweise dieses Werkzeug auf grau getönten Bildern ohne Textur, das heißt um Zonen mit praktisch oder relativ konstanter Leuchtdichte zu isolieren. Im Falle von aus Texturen zusammengesetzten Bildern ist diese Technik im Prinzip nicht anwendbar, da die jeder Textur entsprechenden Zonen keine konstanten Leuchtdichte haben, doch das so gestellte Problem konnte mit der originalen Vorverarbeitung von Bildern umgangen werden, auf die die morphologischen Operatoren angewendet werden können.
  • In einer weiterentwickelten Variante ist die Vorrichtung zur Segmentierung nach der Erfindung außerdem dadurch gekennzeichnet, dass am Ausgang der Untereinheit zur Segmentierung eine Untereinheit zur Verfeinerung der Konturen durch Erneuerung der Extraktionen der Wasserscheidelinien für die Unterteilung des Bildes in Blöcke geringerer Größen enthält, und dies auf iterative Weise bis zur Auflösung eines Bildpunktes.
  • Es werden jetzt die Besonderheiten und Vorteile der Erfindung anhand der folgenden Beschreibung und der beigefügten Zeichnungen besser verdeutlicht, die als nicht erschöpfende Beispiele gegeben werden und in denen:
  • Die 1 bis 4 verschiedene morphologische Basistransformationen einer Funktion mit einem Strukturierungselement darstellen;
  • die 5 und 6 nach ihrer Assoziation ein Ausführungsbeispiel einer der Erfindung entsprechenden Vorrichtung zur Segmentierung zeigen;
  • die 7 und 8 in der Funktionsweise der der Erfindung entsprechenden Vorrichtung die Art zeigen, wie die morphologische Filterung des globalen Gradienten durch geodätische Erosionen bewerkstelligt wird;
  • die 9 und 10 zwei Ausführungsbeispiele eines Systems zur Segmentierung zeigen.
  • Vor der folgenden Beschreibung der veranschaulichten Ausführungsformen sind einige Erinnerungen in Bezug auf Texturen und die Techniken von Nutzen, die deren Analyse ermöglichen. Obwohl es keine strikte Definition des Begriffs Textur gibt, kann man damit jede Region bezeichnen, die ungeachtet der beobachteten Zone einen selben visuellen Eindruck erzeugt, allerdings mit der Anmerkung, dass die so beobachtete Textur als Makrotextur oder im Gegensatz dazu als Mikrotextur abhängig davon betrachtet werden kann, in welchem Abstand man sie betrachtet. Eine Makrotextur scheint mit einem Grundmuster definiert werden zu können – eine Art Körnung – und von Anordnungsregeln dieses Musters im Raum, z. B. durch mehr oder weniger regelmäßige Wiederholung. Eine solche Textur hat einen relativ strukturierten und periodischen, und somit geordneten Aspekt, aber von weiter entfernt betrachtet können diese Struktur und diese Periodizität verschwinden und der Aspekt dagegen umgeordnet werden.
  • Diese Schwierigkeit, ein Grundmuster und seine Anordnungsregeln formell zu beschreiben, führt zur Suche nach einfacher berechenbaren Texturmerkmalen. Diese Suche verläuft über die aufeinanderfolgenden Analyseschritte der Extraktion der charakteristischen Parameter der betreffenden Textur und der Segmentierung, um ein Bild in Regionen homogener Texturcharakteristika zu teilen, wobei diese Schritte oft von einem Syntheseschritt gefolgt werden mit dem Ziel, die Textur z. B. anhand der Parameter wiederzugeben, die ursprünglich für jede Region extrahiert wurden.
  • Die verwendeten Segmentierungstechniken suchen im allgemeinen in einem Bild Diskontinuitäten oder im Gegenteil dazu Ähnlichkeiten bei den Charakteristika des Bildes zu erkennen, was dem gleichkommt, die reellen Konturen der Objekte (d. h. die Diskontinuitäten im Bild) bei gleichzeitiger Minimierung der Anzahl an Regionen so präzise wie möglich zu reproduzieren, um die Bildung von künstlichen Grenzen zu vermeiden, die keiner Diskontinuität entspricht. Insbesondere die mathematische Morphologie umfasst eine sehr effiziente Technik, um die Segmentierung eines Bildes auszuführen, aber nur in Anwendungen, wo die betreffenden Bilder grau getönt und ohne Textur Objekten mit relativ konstanter Leuchtdichte entsprechen. Diese Technik mit der Bezeichnung Wasserscheidelinie (und in der Folge wie im Englischen abgekürzt mit WSL bezeichnet) wird insbesondere in dem Dokument „Morphological segmentation" von F.
  • Meyer und S. Beucher beschrieben, erschienen in „Journal of Visual Communication and Image Representation", Band 1, Nr. 1, September 1990, Seiten 21–46.
  • Für ein besseres Verständnis der mathematischen Morphologie und insbesondere dieser WSL-Technik ist es ratsam, sich die Funktion der Leuchtdichte als Relief vorzustellen, wobei die Bildpunkte mit Graustufen umso heller erscheinen, umso höher sie liegen. Dasselbe gilt für den Gradienten dieser Funktion der Leuchtdichte, und in diesem Relief entsprechen die Kammlinien des Gradienten den Grenzen der zu segmentierenden Regionen. Dann kann ein Bild als Aneinanderreihung von Becken betrachtet werden, auf deren Boden sich ein lokales Minimum befindet, eine Art aus weitgehend gleichförmigen Höhepunkten gebildetes Plateau, wobei alle benachbarten Punkte höhere Höhen haben. Wenn man ein Loch an der Stelle jedes lokalen Minimums bohrt und dann eine allmähliche Überschwemmungen des Reliefs ausgehend von den lokalen Minima unter Betrachtung dessen ausführt, dass der Pegel des Wassers konstant steigt, kann man jedesmal, wenn die aus zwei lokalen Minima kommenden Wässer sich begegnen, entlang der dieser Begegnungslinie entsprechenden Kammlinie einen Damm bauen, damit die aus den beiden jeweils gesonderten Becken kommenden Wässer sich nicht vermischen.
  • Die so mit dieser LPE-Technik erhaltene Segmentierung kann allerdings nicht auf Texturbilder angewendet werden, da diese keine konstante Leuchtdichte haben. Die von der antragstellenden Firma ausgeführten Arbeiten bestanden dann darin, zu versuchen, diese Technik trotzdem zu verwenden, aber nicht mehr an einen Leuchtdichtenbild, sondern ein einem Bild, das anhand von korrekt ausgewählten Texturparametern aufgebaut wurde. Denn bei einem ursprünglich in Blöcke aus Bildpunkten (oder Pixeln) unterteilten Bild haben diese Blöcke ähnliche Texturparameter, wenn sie zur selben Textur gehören. Folglich sind in den Bildern, die keine Originalbilder sondern Parameterbilder sind, die von diesen Originalbildern aufgebaut wurden, die Pixelblöcke einer selben Textur dann durch sehr nahe aneinander liegende Graustufen charakterisiert. Folglich ist es möglich, die LPE-Technik nicht auf die Leuchtdichte, sondern eine andere Größe anzuwenden, d. h. einen dieser Parameter, und z. B. in der hiernach beschriebenen Anwendungen den morphologischen Gradienten G, der weiter unten genauer definiert wird.
  • Tatsächlich ist es nützlich, hier vorweg an die wichtigsten morphologischen Werkzeuge zu erinnern, die derzeit für die Analyse der geometrischen Struktur von Bildern verwendet wird. Die morphologische Transformation eines binären Bildes, von einer diskreten Dateneinheit mit der Bezeichnung X dargestellt und im Raum N der relativen Ganzzahlen definiert, greift auf ein strukturierendes Element mit der Bezeichnung B zurück und das, unter Berücksichtigung des gestellten Problems (Form, Dimension, Orientation etc ...) die Aufgabe hat, mit dem Bild zu interagieren, um daraus die nützlichen geometrischen Informationen zu extrahieren. Die verschiedenen Basistransformationen, welche ein solches strukturierendes Element B zulässt, sind die Erosion und die Dilatation, auf der 1 und 2 dargestellt, sowie das Öffnen und das Schließen, die davon Kombinationen sind (und die auf 3 und 4 gezeigt werden).
  • Die morphologische Erosion eines Bildes X durch ein strukturierendes Element B wird hier mit dem Begriff X(–)B definiert und bewirkt, dieses Bild zu verengen.
  • Man kann diese Verengung folgendermaßen schreiben: X(–)B = [X + (–b)]wobei X + (–b) das Resultat einer Translation des Wertes b von Bild X ist.
  • Das entstehende Bild wird z. B. geschriebenen: Y = „erodiert Y von X mit B" = EB(X)
  • Die morphologische Dilatation von X mit B wird hier mit dem Begriff X(+)B mit der Wirkung definiert, das Bild auszudehnen, wobei diese Dilatation auch hier [X + (+b)] geschrieben werden kann und wie zuvor einer Werttranslation b des Bildes X entspricht, aber in entgegengesetzter Richtung, um ein Bild Y zu erhalten, das sich schreibt: Y = „gedehnt Y von X mit B" = DB(X).
  • Diese beiden Basisoperationen können für die Ausführung komplexer morphologischer Transformationen miteinander verbunden werden. Das Öffnen eines Bildes X von einem strukturierenden Element B, hier mit dem Begriff [X(–)B](+)B definiert, besteht in der Ausführung einer Erosion, gefolgt von einer Dilatation, und das daraus hervorgehende Bild wird z. B. geschrieben: P = DB[EB(X)]
  • Ebenso besteht das Schließen eines Bildes X von B, definiert mit dem Begriff [X(+)B](–)B, wobei das daraus hervorgehende Bild geschrieben wird: F = EB[DB(X)]in der Ausführung einer Dilatation, gefolgt von einer Erosion.
  • Diese beiden letzten Transformationen bewirken, die Konturen der Einheiten zu glätten, auf die sie wirken. Denn ein Öffnen entfernt auf den Konturen die Erhebungen, die kleinerer Dimension als die des strukturierenden Elements sind, und ein Schließen schließt auf diesen Konturen die Vertiefungen, die kleinerer Dimension als die des strukturierenden Elements sind Allgemein eliminieren diese beiden Transformationen demnach die Komponenten, die kleiner als das verwendete strukturierende Elemente sind.
  • Die so definierten Operatoren für die einfachen geometrischen Grenzen und im Falle von binären Bildern können auf Bilder mit Grautönen generalisiert werden. Wenn (x, y) die Position eines Pixels X im Bild mit Graustufen a(x, y) definiert, wird die erodierte Graustufe E(x, y) von X mit B mit folgendem Ausdruck erhalten: E(x, y) = min [a(x – i, y – j) – b(–i, –j)]wobei b(i, j) = 0 oder ¥ (minus dem Unendlichen), je nachdem, ob (i, j) zu B gehört oder nicht. Die gedehnte Graustufe D(x, y) von X mit B wird ebenfalls mit dem dualen Ausdruck erhalten: D(x, y) = max[a(x + i, y + j) + b(i, j)]
  • Wie es die Beispiele der 1 und 2 zeigen, die jeweils die Erosion und die Dilatation einer Funktion f durch ein strukturierendes Element der Fläche B darstellen, tendiert die Erosion zur Verringerung der Kämme, d. h. zur Entfernung der hellen Flecken geringer Dicke, und die Dilatation tendiert zur Füllung der Täler, d. h. zur Entfernung der dunklen Flecken ebenfalls geringer Dicke. Ebenso haben im Grauton das Öffnen P und das Schließen F einer Funktion f durch das strukturierende Element B, auf den 3 dargestellt und respektive geschrieben: P(x, y) = sup[EB(f(u, v))] F(x, y) = inf[DB(f(u, v))]mit (u, v) zu B gehörend, die jeweilige Wirkung, die Leuchtdichtenspitzen und die Leuchtdichtentiefen zu entfernen, deren Größe unter der des strukturierenden Elements liegt, wobei die anderen Formen praktisch unverändert belassen werden.
  • Schließlich kann man unter anderen Transformationstypen den morphologischen Gradienten G definieren, der mit dem Ausdruck erhalten wird: G(f) = [(f(+)B) – (f(–)B)]/2und der demnach gewissermaßen der halben Differenz zwischen der Dilatation von f durch B und der Erosion von f durch B entspricht.
  • Nachdem nun an die Texturen und an die morphologischen Transformationstechniken erinnert wurde, kann jetzt die Vorrichtung zur Segmentierung von Bildern nach der Erfindung beschrieben werden. Diese Vorrichtung, auf der 5 und 6 gemeinsam zu betrachten, enthält zuerst eine Untereinheit 100 zur direktionalen morphologischen Filterung. Diese Untereinheit 100 enthält selbst einen ersten Speicher 10 zur Ablage der das Bild darstellenden digitalen Signale (hier unter Berücksichtigung der verschiedenen Texturen, welche es enthält, zu segmentieren). Der Ausgang dieses ersten Speichers 10 ist hier mit dem gemeinsamen Eingang eines ersten Umschalters 5 mit vier Positionen verbunden, an seinen vier parallelen Ausgängen gefolgt von vier Schaltungen 11, 12, 13, 14 zur direktionalen morphologischen Filterung. Die vier Filterschaltungen 11 bis 14 ermöglichen die Ausführung an dem Bild von vier Transformationen, hier nacheinander bestehend aus einem Öffnen und einem Schließen, und für die das strukturierende Element flach ist, einer Dicke von 1 Pixel, einer Länge von 3 Pixeln und einer Orientierung von respektive 0°, 45°, 90°, und 135°. Die vier gefilterten Bilder werden nacheinander in einem zweiten Speicher 20 abgelegt. Ein dritter Speicher 30 ermöglicht für jedes strukturierende Element die Speicherung des so genannten Restbildes, welches am Ausgang eines Subtrahierers 25 aus der Differenz zwischen dem im Speicher 10 abgelegten Originalbild und jedem der im Speicher 20 abgelegten gefilterten Bilder erhalten wurde (jeder Rest wird aus dem absoluten Wert dieser Differenz erhalten). Der Wert dieses Rests bildet für jedes Pixel und für jede der vier morphologischen Filterungen einen Texturparameter, und man könnte selbstverständlich eben so viele Texturparameterkarten erstellen, wie es Varianten von solchen Filterungen gibt.
  • An dieser Stelle der Umsetzung der Vorrichtung der 5 und 6 wird demnach jedes Pixel des Bildes durch vier Informationen ersetzt, deren Gruppierung als Vektor mit vier Komponenten betrachtet werden kann. Allerdings kann eine Textur nicht ausgehend von punktuellen Attributen definiert werden, denn ein einziges Pixel stellt weder die Körnung noch die Regeln für die Anordnung der Struktur dar, und man muss auf die Nachbarschaft dieses Pixels zurückgreifen. Um auf objektive Weise Charakteristika der Textur extrahieren zu können ist es notwendig, ein Muster von ihr mit einer ausreichenden Größe zu kennen, um den vorhandenen Texturteil effektiv wieder erkennen zu können.
  • Zu diesem Zweck ist am Ausgang der Untereinheit 100 eine Untereinheit 200 zur Bestimmung der Texturparameter vorgesehen. Diese Untereinheit 200 enthält zuerst eine Schaltung 35 zur Integration des Restbilds, am Ausgang des dritten Speichers 30 vorgesehenen, und die die Bildung von homogenen Zonen ermöglicht, in denen der Wert der vektoriellen Komponenten über große Bereiche praktisch konstant ist. Die Größe m × n des Integrationsfensters hängt selbstverständlich vom Typ des Originalbildes Art: In diesem Fall hat man eine Fenstergröße von 24 × 24 Pixeln für Bilder gewählt, die aus 512 × 512 Pixeln gebildet werden, doch ist offenbar, dass das Vorhandensein von Makrotextur im Bild eine höhere Auflösung erfordern würde, damit die Fenster sämtliche Informationen der Textur enthalten können. Andererseits ist die so ausgeführte Integration eine einfache Durchschnittsberechnung, doch man könnte in solch einer Rechnung z. B. den Einfluss jedes Pixels unter Berücksichtigung seines Abstands zum Mittelpunkt des Fensters wägen.
  • Der Ausgang der Integrationsschaltung 35 ist mit dem gemeinsamen Eingang eines zweiten Umschalters 36 verbunden, dessen nicht gemeinsamen Ausgänge, hier Stücker vier, mit vier parallelen Zweigen verbunden sind, die selbst in Serie die so genannten vierten Speicher 41 bis 44 und die Untermusterungsschaltungen 45 bis 48 enthalten. Die Speicher 41 bis 44 ermöglichen es, nacheinander parallel über vier Bilder zu verfügen, deren Texturcharakteristika jeder der vier ausgeführten morphologischen Filterungen entsprechenden. Die Untermusterungsschaltungen 45 bis 48 ermöglichen jeweils die Ausführung einer räumlichen Untermusterung dieser Bilder alle p × q Pixel in jeweils horizontaler und vertikaler Richtung, und jeder Block von p × q wird jetzt von einem Untermuster ersetzt, welches man in der folgenden Beschreibung mit Makropixel bezeichnet (im beschriebenen Beispiel nimmt man p = q = 16). Mit jedem dieser Makropixel ist ein aus den Speichern 41 bis 44 entnommener Wert verbunden, der dem Durchschnittswert der Texturparameter entspricht, die nach Integration in dem gewählten Fenster erhalten wurden. Diese Untermusterung ermöglicht jetzt die Ausführung aller Operationen nach der Auflösung p × q, wobei die Elementareinheit der Block p × q und nicht das Pixel ist. Im Innern eines solchen Blocks, dies muss angegeben werden, hat man gewählt, eine einfache Berechnung der Mittelwerte vorzunehmen, aber es können auch andere, komplexere Berechnungen ausgeführt werden. Man kann auch, insbesondere für die Verfeinerung der Grenzen zwischen den Blöcken, den Beitrag jedes Pixels unter Berücksichtigung seines Abstands zum Blockmittelpunkt nach z. B. einem gaußschen Gesetz wägen.
  • In den vier parallelen Zweigen werden darauf hin vier Schaltungen 51 bis 54 zur Berechnung des morphologischen Gradienten, und dann vier Speicher 55 bis 58 zum Ablegen der so berechneten Gradienten mit der Bezeichnung 05. Speicher vorgesehen. Die Ausgänge dieser fünften Speicher bilden diejenigen der vier Zweige und werden einer identischen Anzahl an Eingängen eines Addierers 59 zugeführt, um einen globalen Gradienten GG auszugeben, der in einem sechsten Speicher 60 abgelegt wird. Zuvor wurde einerseits dargelegt, aus was die LPE-Technik besteht, und andererseits die getroffene technische Wahl, diese Technik auf Bilder anzuwenden, die anhand von relevanten Texturparametern aufgebaut sind, und insbesondere anhand des morphologischen Gradienten. Denn im Innern einer Textur sind die Variationen des Gradienten G relativ unwichtig, während auf dem Niveau der Grenzen zwischen verschiedenen Texturregionen der globale Gradient höher ist (umso mehr, je größer der Kontrast zwischen diesen Regionen groß ist).
  • Es wird jetzt die eigentliche Segmentierung in einer Untereinheit 300 zur Segmentierung ausgeführt. Diese Segmentierung mit der LPE-Technik gliedert in zwei Schritte, wobei der erste im Markieren der Regionen besteht, die man extrahieren möchte, und der zweite in der definitiven Umgrenzung der Bildregionen. Ein Markierer, der eine kleine in der Region enthaltene Pixeleinheit ist und gewissermaßen den Keim für ihre Entwicklung bildet, muss der Region, die er markiert, auf einzigartige Weise entsprechen. Ein guter Kandidat, um die Rolle des Markierers zu übernehmen, ist das Minimum des globalen Gradienten G in jeder Region. Man kann allerdings feststellen, dass die Anwendung der LPE-Technik auf alle erkannten lokalen Minima aufgrund der Tatsache zu einer relativ großen Übersegmentierung führt, dass einige von ihnen nicht wirklich signifikant sind (sie gründen nur auf schwachen Fluktuationen des Gradienten im Inneren einer selben Textur).
  • Um diese Übersegmentierung zu vermeiden führt man in einer Untereinheit 300 eine Vorverarbeitung aus, welche diese nicht signifikanten Minima eliminiert. Diese Vorverarbeitung wird hier mit Hilfe einer Schaltung 65 zur morphologischen Filterung durch geodätische Erosion ausgeführt. Es wird hier zusätzlich zu den weiter oben gemachten Erinnerungen in Bezug auf einige Basisoperatoren der mathematischen Morphologie präzisiert, dass die geodätische Distanz dZ(x, y) zwischen Zeitpunkten x und y einer Einheit Z die untere Begrenzung der verschiedenen zwischen x und y in Z möglichen Weglängen ist. Diese Distanz kann sich schreiben dZ(x, y) = inf[Längen C(x, y)], wobei C einen beliebigen Weg in Z zwischen x und y bezeichnet (zwischen zwei in zwei verschiedenen Becken befindlichen Punkten, wie man sie mit der LPE-Technik erhalten würde, diese Distanz wird demnach konventionell als unendlich betrachtet, da die beiden Punkte nicht verbunden werden können). Man benennt dann geodätische Kugel mit Radius R zentriert bei x die Einheit S(x, r) der dort zur selben Einheit Z gehörenden Punkte, solange ihre geodätische Distanz dZ(x, y) im Punkt x kleiner oder gleich dem Radius R ist. An einer solchen geodätischen Kugel kann man dann mit Hilfe eines strukturierenden Elements B eine Erosion oder eine Dilatation entsprechend der beiden zuvor definierten morphologischen Transformationen mit dem selben Glättungseffekt auf der Oberfläche der Kugel vornehmen.
  • In der hier beschriebenen Ausführung wählt man, die lokalen Minima nur mit einer Höhe h bedingt beizubehalten. 7 zeigt ein Beispiel der Funktion G (globaler Gradient), über der die Funktion G + h konstruiert wurde, wobei h eine positive Konstante ist, und 8 zeigt in Bezug auf die Initialfunktion G die nach der geodätischen Erosionen durch die Schaltung 65 erhaltene Endfunktion. Ein in Serie mit dieser Schaltung 65 vorgesehener siebter Speicher 70 versichert die Speicherung des so gefilterten Gradientenbilds (in diesem schließlich erhaltenen Bild bestand die Vorverarbeitung tatsächlich darin, die Täler zu entfernen, deren Höhe unter h liegt, und die anderen auf eine Höhe h zu füllen). Der Ausgang des Speichers 70 wird einer ersten Schaltung 75 zur Segmentierung durch Berechnung der Wasserscheidelinie zugeführt (dabei handelt es sich um die direkte Anwendung der LPE-Technik), und diese Initialsegmentierung gibt eine Bild-, Label- (oder Etikett-)Karte aus, welche die Identifizierung der aus der besagten Segmentierung hervorgegangenen Regionen ermöglicht. Dieses Labelbild wird in einem achten Speicher M abgelegt. Das Verfahren zur Segmentierung ist beendet, unter dem Vorbehalt einer eventuellen Verbindung von angrenzenden Regionen, um einer eventuellen Übersegmentierung des Bildes entgegenzuwirken. Dieses Verfahren zur Verbindung wird wie jetzt erklärt ausgeführt.
  • Mit einer angemessenen Wahl der Konstanten h (nicht zu großer Wert) wird das Bild meist nur moderat übersegmentiert. Diese Übersegmentierung kann mit der Ausführung eines Verfahrens zur eventuellen Zusammenlegung angrenzender Regionen vermindert werden, das hier mit Hilfe einer Untereinheit 400 zur Verbindung von Regionen verwirklicht wird. Die in dieser Untereinheit aufgeführte Verbindungsverarbeitung verläuft im folgenden Schritten:
    • (a) Aufstellung einer hierarchischen Klassifizierung der Regionen, deren aufeinanderfolgenden Elemente in absteigender Abstandsfolge Paare (Ra, Rb) angrenzender Regionen sind;
    • (b) für jedes der Regionenpaare dieser Klassifizierung Assoziation (mit jeder der beiden verglichenen Regionen) einer repräsentativen Größe ihrer Punkteverteilung;
    • (c) Entscheidung zur Verbindung der beiden Regionen oder nicht unter Berücksichtigung eines an die besagten repräsentativen Größen gebundenen Kriteriums.
  • Diese Schritte können detaillierter beschrieben werden. Zuerst betrachtet ausgehend von den Begrenzungsinformationen der Regionen (aus dem achten Speicher 80 ausgegeben) und der Texturparameter (hier der Durchschnittswert der Texturparameter auf dem Integrationsfenster nach Unterabtastung) eine Klassifizierungsschaltung 401 der Reihe nach alle angrenzenden Regionen paarweise auffolgende Art. Für eine bestimmte Region Ri bezeichnet man Pi, Prototyp der Region Ri, den Durchschnittsvektor der Vektoreneinheit der Blockparameter, welche die Region Ri bilden, was in folgender Form geschrieben werden kann: Pi = (1/Ni) × Σpk wobei Ni die Anzahl an Blöcken der Region Ri und pk der Parametervektor von Block k ist. Da so jede Region von einem Prototypvektor erkannt wird, kann die Distanz d(Ri, Rj) zwischen jeder Region Ri und jeder angrenzenden Region Rj bewertet werden, z. B. unter Verwendung der Definition der euklidischen Distanz:
    Figure 00120001
    wobei N die Anzahl an Komponenten jedes Sektors, und wobei pi und pj die besagten Komponenten für die jeweiligen Prototypvektoren Pi und PJ sind.
  • Nachdem alle möglichen Paare (Ri, Rj) angrenzender Regionen unter Berücksichtigung der Distanz eingeordnet wurden, die sie (ungeachtet der für diese Distanz gewählten Definition) voneinander trennt, mit als erstem Klassifizierungselement dasjenige Paar (Ra, Rb), dessen Parametervektoren am nächsten sind, verarbeitet eine Schaltung 402 zur Berechnung der repräsentativen Größe jeder Region der Reihe nach jedes Paar (Ri, Rj) der besagten Klassifizierung, um für jede der beiden Regionen des Paares eine Größe zu bestimmen, die für die Verteilung der Punktewolke, welche die Region bildet, kennzeichnend ist. Diese Größe, die für die Bildung einer Art Kompaktheitsindex der Region bestimmt ist, wird z. B. gleich der Standardabweichung S gewählt, mit:
    Figure 00120002
    wobei Ni wie bereits gesehen die Anzahl repräsentativer Punkte (d. h. die Anzahl an Blöcken) der Region Ri und d ist die Distanz entsprechend der gewählten Metrik (im vorhergehenden Beispiel die euklidische Distanz) ist.
  • Eine Entscheidungschaltung 403 genehmigt dann (oder nicht) die Verbindung zwischen den beiden Regionen eines Paares auf der Grundlage eines mit den repräsentativen Größen verbundenen Kriteriums, wenn z. B. folgende Ungleichheit für zwei Regionen Ra, Rb geprüft wird: Dist(Ra, Rb) < min (Sa, Sb),d. h. wenn die Distanz (entsprechend der gewählten Metrik) zwischen den beiden betreffenden Regionen unter dem kleinsten der weiten Werte Sa, Sb der respektive an jede Region gebundenen Standardabweichung bleibt (was weitgehend der Situation entspricht, in der der Schwerpunkt jeder Punktewolke im Innern der anderen enthalten ist). Die Verbindung wird dagegen nicht ausgeführt, wenn die Ungleichheit nicht überprüft wird. Wenn die beiden Regionen verbunden werden, wird ein neuer Prototypvektor für die so gebildete neue Regionen berechnet. Dann wird ein Ausgang der Schaltung 403 einerseits an den Speicher 80 geleitet, um die Begrenzungsinformationen der Regionen zu aktualisieren, und andererseits an die Schaltungen 401 und 402, um die respektive von der Schaltung 401 ausgeführte Klassifizierung und die von der Schaltung 402 ausgeführte Berechnung der Standardabweichung zu aktualisieren und somit die Folge der Verbindungsentscheidungen, der Neuklassifizierung und der Verarbeitung aller angrenzenden Regionenpaare erneuern zu können, bis das Verbindungskriterium nicht mehr überprüft wird.
  • Diese eventuelle Zusammenlegung angrenzender Regionen beendet die Segmentierung definitiv. Vom Initialbild wird substituiert ein Teil dieses Bildes in Zonen ähnlicher Textur erhalten, wobei der Grundziegelstein bzw. das Elementargebilde dieser Aufteilung wie man sah der Bildblock der Größe p × q ist. Die Auflösung der Grenzen dieser Zonen ist demnach ebenfalls gleich der Größe dieser Blöcke.
  • Selbstverständlich beschränkt sich diese Erfindung nicht auf das auf der 5 und 6 dargestellte Ausführungsbeispiel oder die bereits aufgeführten Varianten.
  • Mankann insbesondere die Segmentierung verbessern, die hiervor ausgeführt wurde, indem man die Auflösung erhöht. Denn nach der Ausführung der Segmentierung nach der zuvor beschriebenen LPE-Technik und dann der eventuellen Verbindung der Regionen ist die Auflösung der Grenzen der aus dem Segmentierungs- und Verbindungsverfahren hervorgehenden Regionengrenzen gleich der Größe der Zuteilungsblöcke der Texturparameter (Blöcke mit 16 × 16 Pixeln bei dem beschriebenen Beispiel), was diesen Grenzen eine Treppenstufenform verleiht. Diesen Restfehler beseitigt man, indem man am Ausgang der Untereinheit 400 eine Untereinheit 500 zur Verfeinerung der Konturen anbringt (siehe 6).
  • Diese Untereinheit 500 enthält zuerst eine Schaltung 501 für die Extraktion von Markierern gefolgt von einem neunten Speicher 90 für die Ablage des so gebildeten Markiererbilds. Am Ausgang dieses Speichers ist eine zweite Schaltung 503 zur Segmentierung durch Berechnung der Wasserscheidelinien vorgesehen, die einerseits das Bild des globalen Gradienten erhält, welches am Ausgang des sechsten Speichers 60 vorhanden ist, und andererseits das Markiererbild, das am Ausgang dieses neunten Sprechers 90 vorhanden ist. Die Funktionsweise dieser Untereinheit 500 ist folgende. Während die Bilder der Texturparameter und die Gradienten bislang Makropixel von 16 × 16 Pixeln verwendet haben, reduziert man (z. B. mit einer Division durch zwei, ohne dass dieses Beispiel erschöpfen sei) die Dimensionen der so gebildeten Blöcke und fährt mit dem Verfahren zur Extraktion der Wasserscheidelinien ausgehend von einem neuen globalen Gradienten verbesserter Auflösung fort (doppelt im Falle einer Divisionen der Dimensionen durch zwei), und unter Verwendung des Kerns der aus der bereits bewerkstelligten Segmentierung hervorgegangenen Regionen als Markierer (der Kern einer Region ist die Einheit der Makropixel der gewählten Größe, die sich nicht auf den Konturen befinden). Dieses Verfahren bringt ein neues Labelbild hervor, welches das zuvor im achten Speicher 80 abgelegte ersetzt. Dann reduziert man erneuert (z. B. durch eine erneute Division durch zwei) die Größe der Blöcke oder Makropixel für ein neues Extraktionsverfahren der Wasserscheidelinien usw. eventuell bis zur Auflösung eines Pixels. Die Segmentierung wird dann definitiv abgeschlossen.
  • Mit oder ohne den Einbezug dieser Operationen zur Verfeinerung der Konturen enthält die Vorrichtung zur Segmentierung entsprechend der Erfindung auf jeden Fall eine Stufe 600 zur Sequenzierung, welche die Steuerlogik bildet, um die verschiedenen notwendigen Steuersignale ausgeben zu können. Diese Signale sind folgende:
    • (a) Ein Signal S1 zur Steuerung der Position der Umschalter, welche die verschiedenen morphologischen Filterungen und die dementsprechenden Speicherungen der vier Bilder der Texturcharakteristiken zulassen;
    • (b) ein Signal S2, welches es ermöglicht die Größe der Makropixel zu regeln, zuerst auf die gewählte Größe für die erste Segmentierung (hier 16 × 16 Pixel) und dann auf die folgenden Größen (durch Division der Größe durch zwei) bei der Verfeinerung der Konturen;
    • (c) ein Signal S3 zur Initialisierung der Operationen zur eventuellen Verbindung angrenzender Regionen;
    • (d) ein Signal S4 zur Auslösung des Vorgangs zur Segmentierung durch Berechnungen der Wasserscheidelinien während der Initialsegmentierung;
    • (e) ein Signal S5 zur Auslösung des Vorganges zur zusätzlichen Segmentierung während der Verfeinerung der Konturen der nach der besagten Initialsegmentierung erhaltenen Regionen.
  • Das Signal S1 wird demnach von den Umschaltern 5 und 36 erhalten, das Signal S2 von den Unterabtastschaltungen 45 bis 48, das Signal S3 von der Klassifizierungsschaltung 401, das Signal S4 von der ersten Segmentierungsschaltung 75 und das Signal S5 von der zweiten Segmentierungsschaltung 503.
  • Außerdem ist gut zu beachten, dass man hier die Beschreibung und Ausführung einer Vorrichtung zur Segmentierung mit vier Wegen gewählt hat, die jeweils einer gesonderten morphologischen Filterung entsprechen, aber dass die Erfindung bereits umgesetzt ist, wenn sie mindestens einen Weg enthält, was in diesem Fall einer einzigen morphologischen Filterung entspricht. In diesem vereinfachten Ausführungsbeispiel müssen die Umschalter 5 und 36 und der Addierer 59 nicht mehr vorgekehrt werden. Diese Ausführung mit einem einzigen Weg ermöglicht die Segmentierung des Bildes mit der Isolierung einer Region vom Rest dieses Bildes. Auch ist zu beachten, dass ungeachtet der Anzahl an Wegen die Größe, Form und Orientierungen des strukturierenden Elements verändert werden können, um jeden Merkmalstyp der Textur zu extrahieren, ohne deshalb über den Rahmen der Erfindung hinauszugehen.
  • Die hiervor beschriebene Erfindung ist für die Segmentierung von Bildern geeignet, die nur aus Texturen zusammengesetzt sind. Allerdings wird meistens jedes Bild aus einer Nebeneinanderstellung von Regionen mit Texturen und Regionen ohne solche Texturen gebildet. Ein vollständigeres System zur Segmentierung muss dann vorgesehen sein, und dieses auf 9 in einem ersten Ausführungsbeispiel dargestellte System enthält in diesem Beispiel folgende Untereinheiten, mit einer ersten Untereinheit 150 zur Segmentierung der Textur, identisch zur hiervor beschriebenen Vorrichtung zur Segmentierung (5 und 6). Da die Elemente der Untereinheit 150 dieselben wie die der Vorrichtung sind, werden sie nicht alle auf 9 dargestellt: Man beschränkt sich auf die Darstellung des Eingangspeichers 10, welcher die das zu segmentierende Bild darstellenden digitalen Signale enthält, und den Ausgangspeicher 80, der das Labelbild enthält, welches die Identifizierung der verschiedenen aus der Segmentierung der Textur hervorgegangenen Regionen ermöglicht. Die auf 5 und 6 zwischen diesen beiden Speichern vorhandenen Zwischenschaltungen werden auf dieser 9 konventionell mit der Referenz 18 bezeichnet.
  • Der von dieser Untereinheit 150 zugelassene Vorgang zur Segmentierung führt zu einer Teilung des Bildes in Regionen, von denen nur einige effektiv diesen Texturen entsprechen. Um die Unterscheidung zwischen diesen Regionen und denjenigen zu machen, die nicht oder nicht nur den Texturen entsprechen, ist eine zweite Untereinheit 250 zur Trennung der Regionen vorgesehen.
  • Diese Untereinheit 250 enthält zuerst eine polynomische Näherungsschaltung 251, welche die Assoziation zu jeder Region der Attribute oder Parameter ermöglicht – hier insbesondere zweidimensionale Polynome, mit Hilfe derer eine analytische Näherung dieser Region verfügbar ist. Diese Operation ermöglicht die Modellierung der langsamen Variationen (Niederfrequenz) der internen Textur einer bestimmten Region wie aus der Segmentierung hervorgegangen.
  • Diese polynomische Näherungsschaltung 251 wird von einer polynomischen Syntheseschaltung 252, gefolgt, welche die Wiedergabe der Funktion ermöglicht, die die Leuchtdichte der Originalregion annähert. Die Ausgangssignale der Schaltung 252 werden für jede Region in einem Speicher 253 abgelegt, den man in der Folge abgekürzt Polynombildspeicher benennen wird. Eine Subtraktionsschaltung 254, welche die Ausgänge des Speichers 10 des Originalbildes und dieses Speichers 253 des Polynombilds erhält, bestimmt die Restdifferenz – oder den Rest – zwischen der Originalleuchtdichte jeder Region und der entsprechenden Polynomfunktion. Dieses Verfahren ermöglicht die Extraktion der eventuellen Niederfrequenzkomponente, welche einer Textur in einer bestimmten Region überlagert sein kann (z. B. ein Schatten auf einem aus Ziegeln oder Schindeln gebildeten Dach). Der Restwert für jede Region wird in einem Speicher 255 abgelegt, der von einer ersten Testschaltung 256 gefolgt wird.
  • Dieser Test wird die Trennung der aus der Initialsegmentierung hervorgegangenen Regionen, von der Untereinheit 150 ausgeführt, in so genannte homogene Regionen und so genannte heterogene Regionen ermöglichen. Die so genannten homogenen Regionen sind hier diejenigen, die nach der Segmentierung als lediglich aus Texturen zusammengesetzt betrachtet werden (es wurde bereits das Beispiel von Ziegeln oder Schindeln eines Daches, Backsteine einer Mauer etc ... erwähnt), selbst wenn dies eine Niederfrequenzkomponente überlagert, oder aber diejenigen mit ausschließlicher (oder fast ausschließlicher, mit schwacher zu verbleibender Texturfläche) langsamer Leuchtdichtenvariation. Die so genannten heterogenen Regionen sind in diesem Fall alle anderen Regionen, d. h. diejenigen, die keinerlei Textur enthalten oder die davon nur unerheblich auf ihrer Fläche enthalten und deren Segmentierung zweifellos nicht vollständig ist, da die Untereinheit 150 spezifisch diejenigen Texturregionen sucht, auf denen sie nicht effizient wirken konnte (man wird später sehen, warum diese unerheblichen Texturzonen in diesen Regionen vorkommen können). Bei einer heterogenen Region hat der Rest noch starke Variationen, eine wichtige Dynamik, denn die polynomische Funktion konnte die Variationen der Leuchtdichte in der betreffenden Region nicht vollständig modellieren. Dagegen enthält bei einer homogenen Region mit Textur oder langsamer Luminanzvariation der Rest nur noch die eventuelle Texturinformation und seine statistischen Merkmale ersten Ranges (Durchschnitt, Varianz) sind praktisch konstant. Der ausgeführte Test wird demnach in dem hier beschriebenen Beispiel aus der Berechnung eines lokalen Durchschnitts (unter lokal versteht man einen Durchschnitt, der über eine Nachbarschaft mit vom laufenden Punkt bestimmten Dimensionen bewertet wurde) an jedem Punkt der untersuchten Region und der Prüfung bestehen, wie dieser Durchschnitt variiert (sehr schwach oder dagegen beträchtlich). Wenn die Region ausschließlich einer Textur entspricht, bleibt dieser lokalen Durchschnitt immer unter einem Grenzwert. Wenn die Region heterogen ist (weil sie nicht oder nicht ausschließlich einer Textur entspricht), genügt der lokale Durchschnitt solch einem Kriterium nicht. Das Testergebnis wird von seinen beiden möglichen Ausgangssignalen HM und EH definiert. Je nachdem, ob dieses Signal HM oder EH ist, entspricht die betreffende Region nur einer Textur oder ist dagegen heterogen.
  • Der Vergleichstest mit einem Grenzwert kann einfach und direkt den Wert der Restdifferenz jedes Punktes der betreffenden Region oder aber andere Größentypen einbeziehen, die direkt an diese Restdifferenz gebunden sind, ohne dass diese Wahl erschöpfend ist. In dem beschriebenen Beispiel, wo die Wahl einen lokalen Durchschnitt einbezog, wird der besagte Durchschnitt z. B. über eine Nachbarschaft von 24 × 24 über jeden Punkt der Region bewegte Bildpunkte bewertet. Bei dieser Bewegung achte man hier allerdings darauf, diejenigen Punkte nicht zu berücksichtigen, deren Nachbarschaft nicht völlig in der Region enthalten ist. Um zu prüfen, ob der besagte lokale Durchschnitt nicht zu sehr variiert, bestimmt man seinen Maximalwert Min(mi), mit mi = Durchschnitt des Restwerts über eine auf einen Punkt i zentrierte Nachbarschaft, und man prüft, ob die Differenz (Max(mi) – Min(mi)) unter einem ersten Grenzwert T1 bleibt. Wenn diese Bedingung nicht geprüft wird, muss die betreffende Region, die als heterogen betrachtet wird, nochmals segmentiert werden (um die verschiedenen homogenen Regionen mit langsamer Luminanzvariation zu trennen, die in den heterogenen Regionen verbleiben, und die allerdings, um daran zu erinnern, auf unerhebliche Weise kleine Texturzonen enthalten können), bevor sie eventuell kodiert werden. Im gegenteiligen Falle ist die Region homogen und kann als solche verarbeitet und eventuell kodiert werden.
  • Das der Erfindung entsprechende System enthält für diesen Zweck am Ausgang der zweiten Untereinheit 250 zur Trennung der Regionen eine dritte Untereinheit 350 zum Sortieren der homogenen Regionen in Regionen mit Textur und Regionen mit langsamer Leuchtdichtenvariation. Diese Untereinheit 350 enthält selbst zuerst einen Validierungsunterbrecher 355, der nur geschlossen ist, wenn er das Ausgangssignal HM von der Testschaltung 256 erhält, dann am Ausgang dieses Unterbrechers eine zweite Schaltung 351 zum Testen durch Berechnung über die gesamte Region der Standardabweichung des Rests in Bezug auf den Durchschnitt (die im Prinzip gleich Null sein muss) und Vergleichen dieser Standardabweichung mit einem zweiten Grenzwert T2. Wenn diese Standardabweichung unter dem Grenzwert T2 bleibt, bedeutet dies, dass der Rest keine Textur enthält und dass die betreffende Region nur eine Region mit langsamer (oder keiner) Variation der Leuchtdichte ist. Die Modellierung endet: Denn die Informationen zu Kontur (erhalten vom im Speicher 80 vorhandenen Labelbild) und Inhalt der Region (erhalten von dem von der Schaltung 251 extrahierten polynomischen Koeffizienten) reichen zur Definition dieser Region aus und können, wenn Kodiermittel für die verschiedenen aus der Segmentierung hervorgegangenen Informationen in der Untereinheit 350 vorgesehen sind, auch über die Validierungsunterbrecher 356 und 357, die von der Schaltung 351 ein Steuersignal für ihr Schließen erhalten, an eine Schaltung 352 zur Kodierung der Konturen und eine Schaltung 353 zur polynomischen Kodierung versendet werden, die dann kodierte Signale ausgeben, die diesem ersten Regionentyp entsprechen (homogene Regionen mit langsamer Luminanzvariation). Wenn im Gegenteil die Standardabweichung nicht unter diesem zweiten Grenzwert T2 bleibt, ist die betreffende Region eine Texturregion, und die Informationen zu Kontur und Inhalt der Region werden diesmal, wenn die besagten Kodiermittel vorgesehen sind, ebenfalls über einen Validierungsunterbrecher 358, der von der Schaltung 351 ein Signal für sein Schließen erhält, einer Schaltung 354 zu Kodierung der Texturregion bereitgestellt.
  • Diese Schaltung 354, wenn sie vorgesehen ist, kann z. B. von dem Typ Kodierungsvorrichtungen sein, wie sie in den europäischen Patentanmeldungen EP 0545475 und EP 0547696 , wie von den anmeldenden Gesellschaften hinterlegt, beschrieben wird und daher hier nicht weiter im Detail erläutert. Man erinnere einfach daran, dass das Prinzip einer solchen Kodierung auf der Tatsache beruht, dass die Textursignale einen gewissen Wiederholungseffekt aufweisen und dass die Entnahme eines Texturmusters ausreichen kann, um die gesamte Textur wiederherzustellen. Genauer gesagt besteht diese Kodierung im Extrahieren eines Musters mit M × N Bildpunkten aus der Region, das kodiert und übertragen und/oder gespeichert wird und gleichzeitig zur Definition eines Wörterbuchs dient, ausgehend von Blöcken allgemein gleicher Größe, aus dem Muster extrahiert, und in der Übertragung für jeden Block der gesamten betroffenen Regionen der am nächsten im Wörterbuch liegenden Adresse (die Nähedefinition verläuft z. B. über der Bewertung der minimalen quadratischen Distanz).
  • Eine solche Kodierung ist dagegen nicht mehr besonders interessant, wenn die Texturregionen eine zu schwache Oberfläche haben. Aus diesem Grund akzeptiert man bei der Segmentierung in Texturregionen, dass in den betrachteten Regionen nach der besagten Segmentierung ohne Textur Texturzonen unerheblicher Oberfläche in Bezug auf die Oberfläche des Rests der Region verbleiben, wo sich derartige Zonen befinden. Denn diese schwachen Oberflächen sind tatsächlich benachbart oder kleiner als die des Texturmusters, welches aus solch einer Zone extrahiert werden würde, während dieses Kodierverfahren (durch Musterextraktion, dessen Übertragung und Synthese der wieder herzustellenden Regionen durch die Suche der am nächsten im vorgebildeten Wörterbuch liegenden Blöcke) nur wirklich interessant und ökonomisch ist, wenn die Oberfläche dieser Region deutlich größer als diejenige des ihr entsprechenden Musters ist. Es ist demnach absolut zulässig, dass die Initialvorrichtung zur Segmentierung von aus Texturen zusammengesetzten Bildern eine mehrauflösende Näherung vorsieht, die zu Beginn keine Erfassung der kleinen Texturregionen beinhaltet.
  • Wenn die betrachtete Region dagegen heterogen ist, sah man, dass sie erneut segmentiert werden musste, bevor man sie eventuell kodiert. Für diese Operation beinhaltet das System nach der Erfindung, ebenfalls am Ausgang der Untereinheit 250 zur Trennung der Regionen, eine vierte Untereinheit 450a zur komplementären Segmentierung der heterogenen Regionen. Diese Untereinheit 450a enthält in dem hier beschriebenen Beispiel in Serie eine Schaltung 460 zur ausschließlichen Auswahl der heterogenen Regionen, die einerseits die Ausgänge der Speicher 10 und 80 und andererseits das Ausgangssignal HE der Testschaltung 256 erhält, einen Speicher 451 für die Ablage dieser heterogenen Regionen, eine komplementäre Vorrichtung zur Segmentierung 455 klassischen Typs, einen Speicher 458 für die Ablage des Labelbilds, das aus der besagten Segmentierung hervorgeht, und eine Schaltung 551 zur polynomischen Näherung, die ebenfalls den Ausgang des besagten Speichers 451 erhält und zu der der Schaltung 251 identischer Struktur ist. Wenn Mittel für die Kodierung der diversen Informationen der Segmentierung in der Untereinheit 450a vorgesehen sind, enthalten diese hier dann in Serie mit der Schaltung 551 eine Schaltung 553 zur polynomischen in Kodierung, identisch zur Schaltung 353, sowie ebenfalls in Serie mit dem Speicher 458, aber parallel über den Abschnitt mit den Schaltungen 551 und 553, eine Schaltungen 552 zur Kodierung der Kontur. Die Schaltungen 552 und 553 geben die kodierten Signale ab, die jeweils den Regionen entsprechen, die aus der komplementären Segmentierung der heterogenen Regionen hervorgingen und die jetzt homogene Regionen mit langsamer Leuchtdichtenvariation sind.
  • Außerdem ist es im Falle des Systems zur Segmentierung von Bildern, welches auf 9 dargestellt ist, möglich, die Anzahl der Schaltungen und somit die Kosten für das System zu reduzieren, was mit der vereinfachten Variante dieses auf 10 dargestellten Systems verwirklicht wird. In der vierten Untereinheit zur komplementären Segmentierung der heterogenen Regionen, welche jetzt die Referenz 450b trägt, wird der Ausgang der Schaltung 460 zur ausschließlichen Auswahl der heterogenen Regionen nicht mehr an den Speicher 451 übertragen, der nicht mehr vorgesehen ist, sondern an den ersten Speicher 10 digitalen Signals, welches das zu segmentierende Initialbild darstellt. Ein Ausgang dieses Speichers 10 wird jetzt an die Vorrichtung zur komplementären Segmentierung 455 übertragen. Der Ausgang dieser Vorrichtung 455 wird nicht mehr an den Speicher 458 übertragen, der nicht mehr vorgesehen ist, sondern an den achten Speicher 80 für die Ablage des Labelbilds, in dem nunmehr, nach der besagten komplementären Segmentierung, das neue Labelbild vorhanden ist, welches der Regioneneinheit entspricht, die im Laufe der gesamten ausgeführten Segmentierungsoperationen erkannt wurde. Die eventuelle Kodierung der diversen Informationen der Segmentierung, die in der Untereinheit 450a von den Schaltungen 552 und 553 ausgeführt wurde, wird jetzt von den Schaltungen 352 und 353 wahrgenommen.
  • Man bemerke noch, dass die Größen der Polynome sowie der Grenzwerte nicht für immer festgelegt werden. Diese Werte können über (auf den Figuren nicht dargestellte) Steuerungen ausgehend von den Stufen zur Sequenzierung 600 der Vorrichtung zur Segmentierung geändert werden.
  • Schließlich wurden hier einfach eine Vorrichtung und ein System zur Segmentierung beschrieben, wobei offenbar ist, dass dieses System zur Segmentierung Mittel zur Kodierung der diversen Informationen enthalten kann, die infolge der Operationen zur Segmentierung erhalten werden und die jeweils einer der erkannten Regionen entsprechen. Solche Mittel zur Kodierung wurden im Laufe der Beschreibung mit eventueller Angabe Ihres Wesens erwähnt, und sie enthalten genauer gesagt die Schaltungen 352 bis 354 und die Schaltungen 552 und 553. Es ist selbst möglich, die Schaltungen 352 und 552, die identisch sind, durch eine einzige die selbe Funktion wahrnehmende Schaltung zu ersetzen, genau wie die Schaltungen 353 und 553, die ebenfalls identisch sind, durch eine andere einzige Schaltung. Mit oder ohne Austausch können die Mittel zur Kodierung anstatt in eine der Untereinheiten 350 oder 450a oder 450b eingebaut zu werden in einer Untereinheit zur Kodierung gruppiert werden, wie auf 9 und 10 mit der jeweiligen Präferenz 950a oder 950b dargestellt.

Claims (2)

  1. Vorrichtung zur Segmentierung von aus Texturen bestehenden Bildern anhand von die besagten Bilder darstellenden digitalen Signalen und durch Kennzeichnung jeder Textur mit Hilfe von darstellenden Parametern und Zergliederung jedes Bilds in mit den besagten Texturen verbundene Regionen, wobei die besagte Vorrichtung enthält: (A) Für die besagte Kennzeichnung der Textur eine Untereinheit (100) zur direktionalen morphologischen Filterung gefolgt von einer Untereinheit (200) zur Bestimmung von Texturparametern; (B) am Ausgang der besagten Untereinheit zur Bestimmung von Parametern eine Untereinheit (300) zur Segmentierung in Regionen mit der so genannten Technik zur Extraktion von Wasserscheidelinien, auf ein Bild mit in Blöcke bestimmter Größe unterteilten Texturparameter angewendet; (C) eine Sequenzierungsstufe (600) für die Ausgabe der verschiedenen Steuersignale der besagten Untereinheiten; wobei die besagte Vorrichtung außerdem dadurch gekennzeichnet ist, dass: (A) Die besagte Untereinheit (100) zu direktionalen morphologischen Filterung enthält: (a) Einen ersten Speicher (10) der das zu segmentierende Bild darstellenden digitalen Signale; (b) am Ausgang dieses ersten Speichers einen ersten Umschalter (5) mit vier Positionen, parallel gefolgt von vier direktionalen morphologischen Filterschaltungen (11, 12, 13, 14); (c) einen zweiten Speicher (20) zur Ablage der nacheinander erhaltenen vier Bilder; (d) einen Subtrahierer (25) und an dessen Ausgang einen dritten Speicher (30) zur Ablage von vier Restbildern, nacheinander über die Differenz zwischen dem Originalbild und den jeweils vier gefilterten Bildern erhalten; (B) die besagte Untereinheit (200) zur Bestimmung von Texturparametern enthält: (e) Eine Schaltung (35) zur Integration der Restbilder; (f) an deren Ausgang einen zweiten Umschalter (36) mit vier Positionen gefolgt von vier parallelen Zweigen mit jeweils in Serie einem vierten Speicher zur Ablage des Bildes charakteristischer Textur in Verbindung mit einer entsprechenden Filterung, einer räumlichen Untermusterungsschaltung dieses Bildes, einer Schaltung zur Berechnung des morphologischen Gradienten und einem fünften Speicher zur Ablage des besagten Gradienten; (g) einen Addierer (59) der Ausgänge des besagten fünften Speichers; (h) einen sechsten Speicher (60) zur Ablage des so genannten globalen, am Ausgang des besagten Addierers vorhandenen Gradienten.
  2. Vorrichtung zur Segmentierung nach Anspruch 1, dadurch gekennzeichnet, dass sie am Ausgang der Untereinheit zur Segmentierung eine Untereinheit (500) zur Verfeinerung der Konturen durch Erneuerung der Extraktionen der Wasserscheidelinien für die Unterteilung des Bildes in Blöcke geringerer Größen enthält, und dies auf iterative Weise bis zur Auflösung eines Bildpunktes.
DE69434131T 1993-05-05 1994-04-28 Vorrichtung zur Segmentierung von aus Texturen bestehenden Bildern Expired - Fee Related DE69434131T2 (de)

Applications Claiming Priority (4)

Application Number Priority Date Filing Date Title
FR9305365A FR2705005A1 (fr) 1993-05-05 1993-05-05 Dispositif de segmentation d'images composées de textures à partir de signaux numériques représentatifs desdites images.
FR9305365 1993-05-05
FR9310998 1993-09-15
FR9310998 1993-09-15

Publications (2)

Publication Number Publication Date
DE69434131D1 DE69434131D1 (de) 2004-12-23
DE69434131T2 true DE69434131T2 (de) 2005-11-03

Family

ID=26230303

Family Applications (1)

Application Number Title Priority Date Filing Date
DE69434131T Expired - Fee Related DE69434131T2 (de) 1993-05-05 1994-04-28 Vorrichtung zur Segmentierung von aus Texturen bestehenden Bildern

Country Status (4)

Country Link
US (1) US5577131A (de)
EP (1) EP0627693B1 (de)
JP (1) JPH0773330A (de)
DE (1) DE69434131T2 (de)

Families Citing this family (25)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
FR2733336A1 (fr) * 1995-04-20 1996-10-25 Philips Electronique Lab Procede et dispositif de traitement d'images pour la detection automatique d'objets dans des images numerisees
US5787208A (en) * 1995-06-07 1998-07-28 Neopath, Inc. Image enhancement method and apparatus
WO1997001152A1 (en) * 1995-06-20 1997-01-09 Cambridge Consultants Limited Improved data processing method and apparatus
US6307962B1 (en) * 1995-09-01 2001-10-23 The University Of Rochester Document data compression system which automatically segments documents and generates compressed smart documents therefrom
FR2740220B1 (fr) * 1995-10-18 1997-11-21 Snecma Procede de detection automatique des zones expertisables dans des images de pieces mecaniques
WO1997016030A1 (en) * 1995-10-25 1997-05-01 Philips Electronics N.V. Segmented picture coding method and system, and corresponding decoding method and system
US6192160B1 (en) * 1996-09-19 2001-02-20 Hyundai Microelectronics Co., Ltd. Hardware architectures for image dilation and erosion operations
US6011872A (en) * 1996-11-08 2000-01-04 Sharp Laboratories Of America, Inc. Method of generalized content-scalable shape representation and coding
KR100236933B1 (ko) * 1997-06-18 2000-01-15 정선종 컬러 정보를 이용한 공간 기울기 검출 방법
US6400831B2 (en) * 1998-04-02 2002-06-04 Microsoft Corporation Semantic video object segmentation and tracking
US6711278B1 (en) 1998-09-10 2004-03-23 Microsoft Corporation Tracking semantic objects in vector image sequences
US7016531B1 (en) * 1999-02-01 2006-03-21 Thomson Licensing Process to extract regions of homogeneous color in a digital picture
US6424741B1 (en) * 1999-03-19 2002-07-23 Samsung Electronics Co., Ltd. Apparatus for analyzing image texture and method therefor
DE19928231C2 (de) * 1999-06-21 2003-03-27 Max Planck Gesellschaft Verfahren und Vorrichtung zur Segmentierung einer Punkteverteilung
KR100788642B1 (ko) * 1999-10-01 2007-12-26 삼성전자주식회사 디지털 영상 텍스쳐 분석 방법
GB2375908B (en) * 2001-05-23 2003-10-29 Motorola Inc Image transmission system image transmission unit and method for describing texture or a texture-like region
FR2832832A1 (fr) * 2001-11-23 2003-05-30 Ge Med Sys Global Tech Co Llc Procede de detection et de caracterisation automatique de nodules dans une image tomographique et systeme d'imagerie medicale par tomodensimetrie correspondant
US20030165263A1 (en) * 2002-02-19 2003-09-04 Hamer Michael J. Histological assessment
DE10253191A1 (de) * 2002-11-15 2004-05-27 Philips Intellectual Property & Standards Gmbh Verfahren zur selektiven Darstellung von Körperstrukturen
JP4067957B2 (ja) * 2002-12-20 2008-03-26 富士通株式会社 境界検出方法、プログラム、及び画像処理装置
KR20090062561A (ko) * 2007-12-13 2009-06-17 삼성전자주식회사 특이점을 고려한 에지 향상 방법 및 장치
US9837013B2 (en) * 2008-07-09 2017-12-05 Sharp Laboratories Of America, Inc. Methods and systems for display correction
JP5434621B2 (ja) * 2010-01-19 2014-03-05 ソニー株式会社 情報処理装置、情報処理方法、及びそのプログラム
US9842410B2 (en) * 2015-06-18 2017-12-12 Samsung Electronics Co., Ltd. Image compression and decompression with noise separation
CN110059555B (zh) * 2019-03-14 2021-04-20 中国人民解放军战略支援部队信息工程大学 基于多分辨谱图分水岭图像分割及决策树的信号调制分类识别方法及装置

Family Cites Families (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
NL183790C (nl) * 1980-11-21 1989-01-16 Nederlanden Staat Werkwijze voor karaktersegmentatie.
DE3107521A1 (de) * 1981-02-27 1982-09-16 Siemens AG, 1000 Berlin und 8000 München Verfahren zum automatischen erkennen von bild- und text- oder graphikbereichen auf druckvorlagen
EP0087284A1 (de) * 1982-02-19 1983-08-31 THE GENERAL ELECTRIC COMPANY, p.l.c. Bildspeicher- und Übertragungsysteme
FR2660459B1 (fr) * 1990-03-27 1994-07-29 Thomson Csf Procede de segmentation d'images par analyse de textures.
US5335298A (en) * 1991-08-19 1994-08-02 The United States Of America As Represented By The Secretary Of The Army Automated extraction of airport runway patterns from radar imagery
IT1252026B (it) * 1991-11-29 1995-05-27 Apparecchio di illuminazione in particolare per ambienti privi di luce naturale
FR2684830B1 (fr) * 1991-12-10 1998-06-12 Gen Electric Cgr Procede d'analyse d'images.
EP0547696B1 (de) * 1991-12-18 1999-04-21 Laboratoires D'electronique Philips S.A.S. System zum Übertragen und/oder Speichern von Signalen von texturierten Bildern

Also Published As

Publication number Publication date
EP0627693B1 (de) 2004-11-17
JPH0773330A (ja) 1995-03-17
DE69434131D1 (de) 2004-12-23
US5577131A (en) 1996-11-19
EP0627693A1 (de) 1994-12-07

Similar Documents

Publication Publication Date Title
DE69434131T2 (de) Vorrichtung zur Segmentierung von aus Texturen bestehenden Bildern
DE69429464T2 (de) Bildverarbeitungsverfahren- und gerät
DE3853885T2 (de) Vektorisationsverfahren.
DE69432093T2 (de) Bildverarbeitungsvorrichtung
DE69715076T2 (de) Vorrichtung zur Erzeugung eines Binärbildes
DE69523135T2 (de) Bildverarbeitungsvorrichtung und Verfahren
DE69812882T2 (de) Verfahren zur bewegungskompensierten Mehrhalbbildverbesserung von Videostandbildern
DE69430336T2 (de) Vergrösserung von digitalen Bildern mittels Kantenabbildung
DE69327928T2 (de) Vorrichtung zur Kodierung von unbeweglichen Bildern
DE60003032T2 (de) Verfahren zur bildsegmentation
DE69413148T2 (de) Verfahren zur Bestimmung von Bewegungsvektoren in kleinen Bildsegmenten in Fernsehbildern
DE2557553C2 (de) Maschinelles Verfahren zur Verdichtung und -Wiederausdehnung eines beliebigen Schwarzweiß-Bildes und Einrichtung zur Durchführung des Verfahrens
DE69937785T2 (de) Verfahren zur Selektion von Farbblockpunkten für die Blockkodierung
DE69028160T2 (de) Verfahren zur Teilung des Bewegungsfeldes eines Bildes zum Kodieren eines Videobildes
DE4005492C2 (de) Bildcodierverfahren
DE69618759T2 (de) Verfahren und system zur kodierung einer sequenz von segmentierten bildern , kodiertes signal und speichermedium, verfahren und system zur dekodierung des kodierten signals
DE69201377T2 (de) Bildverarbeitungsverfahren durch hierarchische warteschlangen.
DE69512824T2 (de) Kompressions- und Dekompressionsverfahren für mehrdimensionale mehrwertige Farbbilder
DE69904843T2 (de) Kompression- und kodierungsverfahren eines 3d maschennetzwerks
WO2008034599A2 (de) Verfahren und vorrichtung zur bildverarbeitung
DE69612284T2 (de) Datenverarbeitungsverfahren- und vorrichtung
DE69721913T2 (de) Filterverfahren und dazugehöriges filtersystem
DE69214405T2 (de) Verfahren und Einrichtung zur Restitution von Textursignalen
DE68915957T2 (de) Datenkompression.
DE69424230T2 (de) Verfahren und Vorrichtung zum Suchen nach einem Prädiktionsblock in prädiktive Bildkompression

Legal Events

Date Code Title Description
8364 No opposition during term of opposition
8339 Ceased/non-payment of the annual fee