DE69827232T2 - Mosaikbildverarbeitungssystem - Google Patents

Mosaikbildverarbeitungssystem Download PDF

Info

Publication number
DE69827232T2
DE69827232T2 DE69827232T DE69827232T DE69827232T2 DE 69827232 T2 DE69827232 T2 DE 69827232T2 DE 69827232 T DE69827232 T DE 69827232T DE 69827232 T DE69827232 T DE 69827232T DE 69827232 T2 DE69827232 T2 DE 69827232T2
Authority
DE
Germany
Prior art keywords
images
image
strip
scene
dimensional
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Lifetime
Application number
DE69827232T
Other languages
English (en)
Other versions
DE69827232D1 (de
Inventor
Shmuel Peleg
Benny Rousso
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Yissum Research Development Co of Hebrew University of Jerusalem
Original Assignee
Yissum Research Development Co of Hebrew University of Jerusalem
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Yissum Research Development Co of Hebrew University of Jerusalem filed Critical Yissum Research Development Co of Hebrew University of Jerusalem
Application granted granted Critical
Publication of DE69827232D1 publication Critical patent/DE69827232D1/de
Publication of DE69827232T2 publication Critical patent/DE69827232T2/de
Anticipated expiration legal-status Critical
Expired - Lifetime legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T3/00Geometric image transformations in the plane of the image
    • G06T3/40Scaling of whole images or parts thereof, e.g. expanding or contracting
    • G06T3/4038Image mosaicing, e.g. composing plane images from plane sub-images

Landscapes

  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Image Processing (AREA)
  • Studio Devices (AREA)
  • Studio Circuits (AREA)
  • Other Liquid Machine Or Engine Such As Wave Power Use (AREA)
  • Steroid Compounds (AREA)
  • Testing, Inspecting, Measuring Of Stereoscopic Televisions And Televisions (AREA)
  • Polarising Elements (AREA)

Description

  • Gebiet der Erfindung
  • Diese Erfindung betrifft eine Videobildmosaikbildung zum Erhalten von Panoramamosaiken einer Szene.
  • Stand der Technik
  • Verweise auf den Stand der Technik, die als Hintergrund der Erfindung als relevant betrachtet werden, werden im folgenden aufgelistet. Eine Anerkennung der Verweisquellen hierin soll nicht als Absicht gedeutet werden, daß diese in irgendeiner Weise für die Patentfähigkeit der Erfindung relevant sind, die hierin offenbart wird. Jeder Verweis durch eine in rechteckigen Klammern eingeschlossene Zahl und folglich der Stand der Technik wird über die gesamte Beschreibung hinweg durch in rechteckige Klammern eingeschlossene Zahlen bezeichnet.
    • [1] ARPA Image Understanding Workshop, Monterey, Kalifornien, November 1994, Morgan Kaufmann.
    • [2] Fifth International Conference on Computer Vision, Cambridge, MA, Juni 1995, IEEE-CS.
    • [3] IEEE Conference on Computer Vision and Pattern Recognition, San Francisco, Kalifornien, Juni 1996.
    • [4] P.J. Burt und E.H. Adelson. A multiresolution spline with application to image mosaics . ACM Trans. on Graphics, 2 (4), Seiten 217-236, Oktober 1983.
    • [5] P.J. Burt und P. Anandan. Image stabilization by registration to a reference mosaic. In ARPA Image Understanding Workshop [1], Seiten 425-434.
    • [6] S.E. Chen und L. Williams. View interpolation for image syn thesis. In SIGGRAPH, Seiten 279-288, Anaheim, Kalifornien, August 1993, ACM.
    • [7] T.R. Halfhill. See you around. Byte Magazine, Seiten 85-90, Mai 1995.
    • [8] M. Hansen, P. Anandan, K. Dana, G. van der Wal und P.J. Burt. Real-time scene stabilization and mosaic construction. In ARPA Image Understanding Workshop [1], Seiten 457-465.
    • [9] M. Irani, P. Anandan, und S. Hsu. Mosaic based representations of video sequences and their applications. In Fifth International Conference on Computer Vision [2], Seiten 605-611.
    • [10] P. Jaillon und A. Montanvert. Image mosaicing applied to three-dimensional surfaces. In 12 International Conference on Pattern Recognition, Seiten 253-257, Jerusalem, Israel, Oktober 1994, IEEE-CS.
    • [11] A. Krishnan und N. Ahuja. Panoramic image acquisition. In IEEE Conference on Computer Vision and Pattern Recognition [3], Seiten 379-384.
    • [12] S. Mann und R. Picard. Virtual bellows: Constructing high quality stills from video. In First IEEE International Conference on Image Processing, Austin, Texas, November 1994.
    • [13] L. McMillan und G. Bishop. Plenoptic modeling: An imagebased rendering system. In SIGGRAPH, Los Angeles, Kalifornien, August 1995, ACM.
    • [14] D.L. Milgram. Computer methods for creating photomosaics. IEEE Trans. on Computers, C-24 Seiten 1113-1119, 1975.
    • [15] D.L. Milgram. Adaptive techniques for photomosaicing. IEEE Trans. on Computers, C-26 Seiten 1175-1180, 1977.
    • [16] S. Peleg, Elimination of seams from photomosaics. Computer Graphics and Image Processing, 16, Seiten 90-94, Mai 1981.
    • [17] B. Rousso, S. Avidan, A. Shashua und S. Peleg. Robust recovery of camera rotation from three frames. In IEEE Conference on Computer Vision and Pattern Recognition [3], Seiten 796-802.
    • [18] H.S. Sawhney, S. Ayer und M. Gorkani. Model-based 2D and 3D dominant motion estimation for mosaicing and video representation. In Fifth International Conference on Computer Vision [2], Seiten 583-590.
    • [19] S. Seitz und C. Dyer. Physically valid view synthesis by image interpolation. In Proc. IEEE Workshop on Representation of Visual Scenes, Cambridge, MA, Juni 1995, IEEE-CS.
    • [20] R. Hartley und R. Gupta Linear pushbroom cameras. In J.O. Eklundh, Herausgeber, Third European Conference on Computer Vision, Seiten 555-566, Stockholm, Schweden, Mai 1994, Springer.
    • [21] M. Irani, B. Rousso und S. Peleg. Detecting and tracking multiple moving objects using temporal integration. In G. Sandini, Herausgeber, Second European Conference on Computer Vision, Seiten 282-287, Santa Margherita, Italien, Mai 1992, Springer.
    • [23] R. Szeliski. Video mosaics for virtual environments. IEEE Computer Graphics and Applications, Seiten 22-30, März 1996.
    • [24] R. Szeliski und S.B. Kang. Direct methods for visual scene reconstruction. In Proc. IEEE Workshop on Representation of Visual Scenes, Cambridge, MA, Juni 1995, IEEE-CS, Seiten 26-33.
    • [25] J.Y. Zheng und S. Tsuji. Panoramic representation for route recognition by a mobile robot. International Journal of Computer Vision, B. 9, Seiten 55-76, 1992.
    • [26] L Teodosio und W. Bender. Salient-video stills: content and context preserved. Proceedings of the ACM Multimedia Conference, Anaheim, August 1993, Seiten 39-46.
  • Hintergrund der Erfindung
  • Das Bedürfnis, Bilder zu Panoramamosaiken zu kombinieren, existierte seit dem Beginn der Photographie, da das Sichtfeld der Kamera immer kleiner als das menschliche Gesichtsfeld ist. Außerdem können häufig große Objekte nicht in einem einzigen Bild aufgenommen werden, und nur eine Photomosaikbildung ermöglicht eine vollständigere Ansicht. Die Digitalphotographie schaffte neue Anwendungen zur Mosaikbildung [14, 15, 16, 4, 24, 23], die zuerst für Luft- und Satellitenbilder implementiert wurden.
  • Es sind drei Hauptprobleme in der herkömmlichen Bildmosaikbildung wichtig:
    • (i) eine Bildausrichtung, die die Transformation bestimmt, die die Bilder ausrichtet, die in einem Mosaik kombiniert werden sollen. Eine Papier-Photomosaikbildung verwendet starre Transformationen zur Ausrichtung: Bildtranslationen (Verschiebungen) und Rotationen. Eine digitale Verarbeitung ermöglicht allgemeinere Transformationen, wie affine oder planar-projektive.
    • (ii) Es ist ein Bildausschneiden und Einsetzen notwendig, da die meisten Bereiche in der Panoramamosaik überlappend sind, und durch mehr als ein Bild abgedeckt werden. Das Auschneide- und Einsetzverfahren beinhaltet entweder ein Auswahl eines einzelnen Bildes für jeden überlappenden Bereich oder eine gewisse Art Kombination aller überlappenden Bilder.
    • (iii) Es ist eine Bildmischung notwendig, um den Intensitätsunterschied zwischen Bildern zu überwinden, Unterschiede, die selbst dann vorhanden sind, wenn Bilder perfekt ausgerichtet sind. Solche Unterschiede werden durch eine dynamische Änderung der Kameraverstärkung erzeugt.
  • Die einfachsten Mosaiken werden aus einem Satz von Bildern erzeugt, deren gegenseitige Verschiebungen reine Bildebenentranslationen sind. Dies ist annähernd der Fall bei einigen Satellitenbildern. Solchen Translationen können entweder berechnet werden, indem manuell auf entsprechende Punkte gezeigt wird, oder durch Bildkorrelationsverfahren. Andere einfache Mosaiken werden erzeugt, indem die Kamera um ihren optischen Mittelpunkt gedreht wird, wobei eine spezielle Vorrichtung verwendet wird, und ein Panoramabild erzeugt wird, das die Projektion der Szene auf einen Zylinder [7, 11, 12, 13] oder eine Kugel repräsentiert. Da es nicht einfach ist, eine reine Rotation um den optischen Mittelpunkt sicherzustellen, können solche Mosaiken nur in begrenzten Fällen verwendet werden.
  • In allgemeineren Kamerabewegungen, die sowohl Kameratranslationen als auch Kamerarotationen umfassen können, werden allgemeinere Transformationen zur Bildausrichtung verwendet [5, 8, 9, 10, 18]. In den meisten Fällen werden Bilder paarweise ausgerichtet, wobei eine parametrische Transformation wie eine affine Transformation oder planar-projektive Transformation verwendet werden (siehe zum Beispiel [26]). Diese Transformationen enthalten eine ihnen innewohnende Annahme hinsichtlich der Struktur der Szene, wie daß sie planar ist. Es wird ein Bezugsrahmen ausgewählt, und alle Bilder werden mit diesem Bezugsrahmen ausgerichtet und kombiniert, um das Panoramamosaik zu erzeugen. Diese Verfahren werden daher als Verfahren bezeichnet, die auf Bezugsrahmen beruhen.
  • Die Ausrichtung aller Rahmen an einem einzelnen Bezugsrahmen ist vernünftig, wenn die Kamera weit weg ist und ihre Bewegung hauptsächlich eine Seitwärtstranslation und eine Rotation um die optische Achse ist. Es werden beträchtliche Verzerrungen erzeugt, wenn die Kamerabewegungen andere Rotationen enthalten. 1 zeigt die Auswirkungen großer Rotationen auf Verfahren, die auf einem Bezugsrahmen beruhen. Die Objekte a, b, x, y, c, d, w, z werden von zwei Kameras C1 und C2 betrachtet. Das Bild I1 wird als ein Bezugsrahmen ausgewählt, und das Bild I2 wird auf diesen Bezugsrahmen projiziert. Große Rotationen erzeugen Verzerrungen, wenn auf den Bezugsrahmen projiziert wird, und die Information, die von Rahmen mit solchen Rotationen abgeleitet werden, ist unscharf und fast nutzlos. Außerdem kann in langen Sequenzen, in denen sich die Kamera auf einem komplexen Weg bewegt, ein Rahmen nicht lange als Bezugsrahmen verwendet werden, und eine Projektion der gesamten Sequenz auf diesen Rahmen wird unzweckmäßig.
  • Das Mannigfaltigkeitsprojektionsverfahren wurde in [25] eingeführt, wo ein Mosaik konstruiert wird, indem eine Szene mit einer eindimensionalen, geraden Anordnung abgetastet wird.
  • Jedoch kann keines der obigen Verfahren Fälle behandeln, wo Bilder infolge einer Parallaxe nicht ausgerichtet werden können, oder Fälle einer Brennweitenverstellung und Vorwärtsbewegung.
  • Eine Mannigfaltigkeitsprojektion simuliert die Abtastung einer Szene unter Verwendung einer linearen eindimensionalen Sensoranordnung, siehe 2. Ein solcher eindimensionaler Sensor kann die Szene durch beliebige Kombinationen von Rotationen und Translationen abtasten, und in allen Fällen wird die Abtastung zu einem sinnvollen Panoramabild führen, wenn herausbekommen werden könnte, wie die ankommenden eindimensionalen Bildstreifen ausgerichtet werden sollen. Einige Satellitenbilder werden erzeugt, indem die Erde mit einem eindimensionalen Sensor abgetastet wird, der einen rotierenden Spiegel verwendet. Da in diesem Fall die Ausrichtung der Sensoren unter Verwendung des Ortes des Satelliten und der Position des Spiegels geschehen kann, werden leicht zweidimensionale Panoramabilder erhalten. 2 zeigt eine Luftaufnahme mit einem linearen eindimensio nalen Abtastsystem.
  • In allgemeineren Fällen kann die Bewegung der Abtastungsebene nicht bekannt sein. Es scheint unmöglich zu sein, die eindimensionalen Bildstreifen auszurichten, die von einer beliebigen Ebenenabtastung kommen, jedoch wird das Problem leichter, wenn die Eingabe eine Videosequenz ist. Ein zweidimensionaler Rahmen in einer Videosequenz kann so betrachtet werden, als würde er einen eindimensionalen Streifen irgendwo in der Mitte des Bildes („Mittenstreifen") aufweisen, der in das zweidimensionale Bild eingebettet ist, um die Ausrichtung zu erleichtern. Die Bewegung der Abtastungsebene kann dann aus dem gesamten Bild berechnet werden und auf den Mittenstreifen zur Ausrichtung und Mosaikbildung angewendet werden.
  • Die Bildtransformationen der eindimensionalen Streifen, die durch die Abtastungsebene erzeugt werden, sind nur starre Transformationen: Bildebenentranslationen und Rotationen. Daher sind starre Transformationen auch die Transformationen, die in einer Mannigfaltigkeitsprojektion verwendet werden. Es sollte beachtet werden, daß allgemeine Kamerabewegungen im allgemeinen nichtstarre Bildebenen-Transformationen verursachen. Um jedoch die Ebenenabtastung zu simulieren, werden nur starre Transformationen für den Mittenstreifen verwendet.
  • Das Panoramamosaik, das durch Kombination der ausgerichteten eindimensionalen Mittenstreifen erzeugt wird, bildet die Mannigfaltigkeitsprojektion. Dies ist eine Projektion der Szene in eine allgemeine Mannigfaltigkeit, die eine glatte Mannigfaltigkeit ist, die durch die Mitten aller Bildebenen geht, die das Mosaik aufbauen. Im Fall reiner Kameratranslationen (3a) stellt sich heraus, daß die Mannigfaltigkeitsprojektionen eine parallele Projektion auf eine Ebene sind. Im Fall reiner Kamerarotationen (3b) ist das eine Projektion auf einen Zylinder, dessen Hauptachse die Rotationsachse ist. Wenn jedoch sowohl Kameratranslationen als auch Rotationen beteiligt sind, wie in 3c, ist die Mannigfaltigkeit keine einfache Mannigfaltigkeit mehr. In den 3a, 3b und 3c befindet sich die Kamera an der Spitze des „Sichtfeld"-Kegels, und die Bildebene wird durch ein festes Segment angezeigt. Die Fähigkeit, solche beliebigen Kombinationen von Kamerarotationen und Translationen zu behandeln, ist der Hauptunterschied zwischen einer Mannigfaltigkeitsprojektion und allen vorhergehenden Mosaikbildungsverfahren.
  • Die Proceedings of first ACM international conference on multimedia, 2-6. August 1993, Anaheim, CA, US, „Salient Video Stills: Content and Context Preserved" betreffen Bilder, die als ausgeprägte Standbilder bezeichnet werden. Diese Bilder repräsentieren keinen diskreten Zeitpunkt, wie es eine Photographie oder ein einzelner Videorahmen tun. Durch die Anwendung einer affinen Transformation und einer nichtlinearen zeitlichen Verarbeitung werden mehrere Rahmen einer Bildfolge, die Variationen der Brennweite des Gesichtsfeldes enthalten können, kombiniert, um ein einzelnes Standbild zu erzeugen. Die Bilder werden so verzerrt, daß die gesamte Überlappung zwischen den Bildern die bestmögliche Übereinstimmung aufweist.
  • In Hinblick auf das vorhergehende sollte klar sein, daß es einen Bedarf gibt, ein Verfahren für die Erzeugung von Panoramabildmosaiken in den Fällen bereitzustellen, die im Stand der Technik nicht behandelt werden. Solche Fälle umfassen Kameratranslationen mit einer Bildparallaxe; Vorwärtsbewegung; Kamerabewegungen, die Kombinationen von Translationen und Rotationen sind; und eine Kamerabrennweitenverstellung.
  • Zusammenfassung der Erfindung
  • Es wichtig zu beachten, daß wann auch immer die Ausdrücke „Video", „Film", „Rahmen", „Bild" oder „Bildnis" verwendet werden, sie irgendeine Darstellung eines Bildes oder eines Films (Laufbild) bezeichnen. Ein Standbild kann durch eine herkömmliche Kamera, durch eine Digitalkamera, durch einen Scanner oder irgendeine andere Vorrichtung auf einen Film aufgezeichnet werden, der Standbilder aufzeichnet. Ein Video (oder ein Laufbild) kann durch eine Filmkamera, ein analoges oder ein digitales Videoband oder irgendeine andere Vorrichtung aufgezeichnet werden, die Laufbilder aufzeichnet. Der Bereich der Bildmosaikbildung im allgemeinen, und diese Erfindung im besonderen, ist auf alle Formen von Bildern anwendbar, die durch geeignete Vorrichtungen manipuliert werden können, seien sie mechanisch, optisch, digital oder irgendeine andere Technologie.
  • Panoramamosaiken werden konstruiert, indem Streifen aus der Bildfolge kombiniert werden. Erfindungsgemäß werden die Form, Größe und Position der Streifen für jedes Bild gemäß der Art der Kamerabewegung bestimmt. Die Streifen werden aus den Bildern ausgeschnitten und in das Panoramamosaik eingesetzt, nachdem sie transformiert werden, so daß das resultierende Mosaik zusammenhängend bleibt.
  • Erfindungsgemäß werden vorzugsweise (jedoch nicht notwendigerweise) die folgenden Randbedingungen verwendet, um mit allgemeinen Bildebenentransformationen umzugehen:
    • (a) die Streifen sollten annähernd senkrecht zum optischen Fluß verlaufen.
    • (b) die Streifen, die zum Einsetzen gesammelt werden, sollten vor dem Einsetzen in das Panoramabild verzerrt werden, so daß nach dem Verzerren ihres ursprünglichen optischen Flusses er annähernd parallel zu der Richtung wird, in der das Panoramabild konstruiert wird.
  • Unter diesen Bedingungen können Fälle einer Brennweitenver stellung und Vorwärtsbewegung ebenso gut wie die anderen einfachen Fälle behandelt werden. Zum Beispiel im Fall einer Brennweitenverstellung oder Vorwärtsbewegung ermöglichen diese Eigenschaften das Ausschneiden kreisförmiger Streifen und deren geeignete Biegung vor dem Einsetzen in das Panoramabild.
  • Diese Erfindung beschreibt auch, wie die Breite der Streifen zu bestimmen ist. Um zum Beispiel die Bildparallaxe richtig zu behandeln, kann die Größe der Streifen aus der dreidimensionalen Bewegung der Kamera bestimmt werden, die aus der Folge selbst berechnet werden kann, oder die durch äußere Vorrichtungen gemessen werden kann.
  • Um glatte Mosaiken zu ermöglichen, selbst wenn Rahmen, die kombiniert werden sollen, von unterschiedlichen Standpunkten aufgenommen werden und eine wesentliche Parallaxe aufweisen, können Ansichten für Zwischenkamerapositionen synthetisiert werden. Für die glattesten Mosaiken wird die Anzahl der Zwischenkamerapositionen so ausgewählt, daß der Streifen schmal ist, z.B. eine Breite von einem einzigen Pixel aufweist.
  • Die vorliegende Erfindung stellt ein Verfahren bereit zur Kombination einer Folge zweidimensionaler Bilder einer Szene, um ein Panoramamosaik der Szene zu erhalten, wobei die Folge zweidimensionaler Bilder durch eine sich bewegende Kamera erfaßt wird, die sich in Relativbewegung bezüglich der Szene befindet, wobei die Relativbewegung einen optischen Fluß zwischen den Bildern hervorruft, wobei die Vektoren des optischen Flusses mindestens teilweise nicht-parallel zueinander sind, wobei das Verfahren aufweist: a) Verzerren der Bilder, so daß die Richtung der Vektoren des optischen Flusses im wesentlichen parallel zueinander und zu einer Richtung wird, in der das Mosaik konstruiert wird; b) Einsetzen der verzerrten Bilder, so daß die Folge zweidimensionaler Bilder für die Szene zusammenhängend ist, um dadurch das Panoramamosaik der Szene zu konstruieren.
  • Die Erfindung sorgt desweiteren für eine Kombination einer Folge zweidimensionaler Bilder einer Szene, um ein Panoramamosaik der Szene zu erhalten, wobei die Folge zweidimensionaler Bilder durch eine sich bewegende Kamera erfaßt wird, die sich in Relativbewegung bezüglich der Szene befindet, wobei die Kamerabewegung einen optischen Fluß zwischen den Bildern hervorruft, wobei das Verfahren die Schritte aufweist: a) Auswählen für jedes Bild der Folge zweidimensionaler Bilder mindestens einer Schar von Linien, die senkrecht zum optischen Fluß verlaufen und Streifen definieren, die eine Vorderkante, durch die der optische Fluß eintritt, und eine Hinterkante aufweisen, durch die optische Fluß austritt, damit jeder Streifen im wesentlichen senkrecht zum optischen Fluß verläuft; b) Verzerren der Streifen, um nichtrechteckige Streifen zu erzeugen, damit der optische Fluß im wesentlichen parallel zu einer Richtung wird, in der das Mosaik konstruiert wird; und c) Einsetzen der nicht-rechteckigen Streifen, damit die Folge zweidimensionaler Bilder für die Szene zusammenhängend wird, wodurch das Panoramamosaik der Szene konstruiert wird.
  • Durch eine Ausführungsform weist das Verfahren ferner den Schritt auf:
    (a') Verzerren der Vorderkante eines Streifens, der an einem zweidimensionalen Bild definiert wird, so daß er im wesentlichen mit der Hinterkante eines Streifen ausgerichtet wird, der an einem benachbarten zweidimensionalen Bild definiert wird.
  • Durch eine weitere Ausführungsform werden die Streifen durch Verzerren in Streifen transformiert, die Kanten einer beliebigen Form aufweisen, bevor die Streifen zusammengesetzt werden.
  • Durch noch eine weitere Ausführungsform werden die Streifen durch Verzerren in Streifen transformiert, die gerade Kanten aufweisen, bevor die Streifen miteinander kombiniert werden. Gemäß noch einer weiteren Ausführungsform stehen die zweidimensionalen Bilder durch eine affine Transformation oder durch eine planar-projektive Transformation in Beziehung.
  • Gemäß einer weiteren Ausführungsform werden die Bilder auf einen dreidimensionalen Zylinder projiziert, dessen Hauptachse den Weg der Kameramitten der Bilder annähert, wobei die Kombination der Streifen erzielt wird, indem die projizierten zweidimensionalen Bilder im wesentlichen längs der Zylinderoberfläche des dreidimensionalen Zylinders translatiert werden.
  • Gemäß noch einer weiteren Ausführungsform definieren alle zwei aufeinanderfolgenden Bilder ihren eigenen Zylinder, dessen Hauptachse im wesentlichen durch den optischen Mittelpunkt der Kameras geht, und die Zylinder sind im wesentlichen längs der Bildfolge verkettet.
  • Gemäß noch einer weiteren Ausführungsform wird eine Transformation abhängig von einem gewünschten Standpunkt auf das Panoramamosaik angewendet.
  • Gemäß einer weiteren Ausführungsform wird die Bilderfolge durch Sätze interpolierter Bilder erweitert bzw. vermehrt, die zwischen den Bildern der Bilderfolge liegen, und die Streifen werden mit Streifen erweitert bzw. vermehrt, die an den interpolierten Bildern definiert werden.
  • Gemäß einer weiteren Ausführungsform kombiniert das System ferner eine Folge zweidimensionaler Bilder einer Szene, um ein Panoramamosaik der Szene zu erhalten, wobei die Bilderfolge durch eine Kamera erfaßt wird, die sich in Relativbewegung bezüglich der Szene befindet, wobei die Relativbewegung einen optischen Fluß zwischen den Bildern hervorruft, wobei die Vektoren des optischen Flusses mindestens teilweise nicht-parallel zueinander sind, wobei das System aufweist: eine Verzerrungseinrich tung zur Verzerrung der Bilder, so daß die Richtung der Vektoren des optischen Flusses zwischen den Bildern im wesentlichen parallel zueinander und zu einer Richtung wird, in der das Mosaik konstruiert wird; und eine Einsetzeinrichtung zum Einsetzen der verzerrten Bilder, so daß die Folge zweidimensionaler Bilder für die Szene zusammenhängend ist.
  • Desweiteren sorgt die Erfindung für eine Kombination einer Folge zweidimensionaler Bilder einer Szene, um ein Panoramamosaik der Szene zu erhalten, wobei die Folge zweidimensionaler Bilder durch eine sich bewegende Kamera erfaßt wird, die sich in Relativbewegung bezüglich der Szene befindet, wobei die Kamerabewegung einen optischen Fluß zwischen den Bildern hervorruft, wobei das System aufweist: einen Selektor zur Auswahl für jedes Bild der Folge zweidimensionaler Bilder mindestens einer Schar von Linien, die zum optischen Fluß senkrecht verlaufen und mindestens einen Streifen definieren, der eine Vorderkante, durch die der optische Fluß eintritt, und eine Hinterkante aufweist, durch die der optische Fluß austritt, so daß jeder Streifen im wesentlichen senkrecht zum optischen Fluß ist; eine Verzerrungseinrichtung zur Verzerrung des Streifens, um nicht-rechteckige Streifen zu erzeugen, so daß der optische Fluß im wesentlichen parallel zu einer Richtung wird, in der das Mosaik konstruiert wird; eine Einsetzeinrichtung zum Einsetzen der nicht-rechtekkigen Streifen, so daß die Folge zweidimensionaler Bilder für die Szene zusammenhängend wird.
  • Desweiteren stellt die Erfindung einen Speicher bereit, der eine Datei enthält, die ein Panoramamosaik einer Szene repräsentiert.
  • Das hierin beschriebene Verfahren kann alternativ unter Verwendung dreidimensionaler Projektionen der Bilder auf Zylinder („Rohre") interpretiert werden, deren Hauptachse die Richtung der Kamerabewegung ist. Solche Projektionen erzeugen Verzerrungen der Bilder, so daß der optischen Fluß parallel wird.
  • Kurze Beschreibung der Zeichnungen
  • Für ein besseres Verständnis wird die Erfindung nun lediglich beispielhaft unter Bezugnahme auf die beigefügten Zeichnungen beschrieben. Es zeigen:
  • 1 die Auswirkungen von großen Rotationen auf Verfahren, die auf einem Bezugsrahmen beruhen;
  • 2 eine Luftaufnahme mit einem eindimensionalen Abtastsystem;
  • 3a eine Mannigfaltigkeitsprojektion für eine Kamera, die eine reine Translation ausführt, wobei die Projektion eine parallele Projektion auf eine Ebene ist;
  • 3b eine Mannigfaltigkeitsprojektion für eine Kamera, die eine reine Rotation ausführt, wobei die Projektion auf eine zylindrische Mannigfaltigkeit stattfindet;
  • 3c eine Mannigfaltigkeitsprojektion für eine Kamera, die sowohl eine Translation als auch eine Rotation ausführt, wobei die Projektion auf eine Mannigfaltigkeit stattfindet, die keine einfache geometrische Form aufweist;
  • 4 einen allgemeinen Ablaufplan der prinzipiellen Schritte des Panoramaerzeugungsverfahrens der Erfindung;
  • 5 die Wirkungen der Parallaxe auf die Ausrichtungs- und Vereinigungsverfahren;
  • 6 ein Mosaik, das aus Bildern aufgebaut wird, die durch eine Kamera aufgenommen werden, die sich in einer Seitwärtsbewegung befindet, wobei vertikale lineare Streifen verwendet werden, die zur optischen Achse der Kamera und zum optischen Fluß senkrecht verlaufen, der von rechts nach links verläuft, wenn die Kamera von links nach rechts translatiert, gemäß einem bekannten Verfahren.
  • 7a ein Mosaik, das aus Bildern aufgebaut wird, die durch eine Kamera aufgenommen werden, die sich in Vorwärtsbewegung befindet, mit einer Translation längs der optischen Achse der Kamera, und optional mit einer Brennweitenverstellung; der optische Fluß verläuft radial von der Mitte des Bildes nach außen, und die Streifen sind kreisförmig;
  • 7b das Ergebnis der Anwendung der Transformation, die die Streifen „biegt", auf ein ganzes Bild;
  • 8 ein Mosaik, das aus Bildern aufgebaut wird, die durch eine Kamera aufgenommen werden, die sich in einer Translation von links nach rechts längs einer Linie befindet, die einen Zwischenwinkel (zwischen 0 und 90 Grad) mit der optischen Achse einschließt; der optische Fluß verläuft radial vom Expansionsmittelpunkt, der sich auf der rechten Seite des Bildes befindet, und die Streifen sind kreisförmige oder elliptische Bögen;
  • 9 die Form von Streifen für unterschiedliche Fälle einer affinen Bewegung:
  • 9a einen geraden vertikalen Streifen für eine horizontale Bewegung;
  • 9b einen geraden horizontalen Streifen für eine vertikale Bewegung;
  • 9c einen kreisförmigen Streifen für eine Vorwärtsbewegung;
  • 9d einen elliptischen Streifen für eine allgemeine Bewegung;
  • 10 ein Beispiel des Ausschneidens und Einsetzens von Streifen für den Fall einer affinen Bewegung:
  • 10a10c Streifen, die senkrecht zum optischen Fluß verlau fen. Die Linie F2 wird im Bild I2 ausgewählt und die Linie F3 wird Bild I3 ausgewählt. Die Abbildung der Linie F3 (in I3) in das Bild I2 unter Verwendung derselben affinen Transformation ist die Linie F3'. Der Streifen S2, der aus dem Bild I2 entnommen wird, ist zwischen den Linien F2 und F3' begrenzt;
  • 10d Streifen, die verzerrt und eingesetzt werden, so daß der optische Fluß parallel wird, wobei ihre Rückseite fest ist (z.B. F2 im Streifen S2) und ihre Vorderseite (z.B. F3' im Streifen S2) verzerrt wird, um zur Rückseite des nächsten Streifens zu passen;
  • 11 die Projektion eines Bildes auf ein Rohr, um einen parallelen optischen Fluß zu erhalten;
  • 12a die Auswahl von Streifen aus unterschiedlichen Bildern gemäß der Auflösung, die aus jedem Bild erhalten wird, wenn die Bilder auf ein Rohr projiziert werden;
  • 12b die Verkettung von Rohren im Fall eines komplexen Kamerawegs;
  • 13 die Wahl der Streifenbreite, die erforderlich ist, um die ursprüngliche Auflösung für den Fall einer reinen Rotation zu erhalten; und
  • 14 die Wahl der Streifenbreite, die erforderlich ist, um die ursprüngliche Auflösung für den Fall einer reinen Translation zu erhalten.
  • 15 die Erzeugung eines Panoramabildes, wobei eine Ansichtinterpolation verwendet wird, indem synthetische Ansichten von zwischenkamerapositionen erzeugt werden und schmale Streifen aus jeder Zwischenansicht entnommen werden, um das Mosaik zu konstruieren; für entweder den Fall der Translation P1 oder für den Fall der Rotation P2;
  • 16 die Erzeugung konsistenter Panoramamosaiken beim Vorhandensein einer Parallaxe.
  • Detaillierte Beschreibung der Erfindung
  • Die Aufmerksamkeit wird zuerst auf 4 gelenkt, die einen allgemeinen Ablaufplan der prinzipiellen Schritte des Panoramaerzeugungsverfahrens gemäß einer Ausführungsform der Erfindung zeigt. Bei Schritt 401 wird eine Bewegungsrückgewinnung durchgeführt. Dieser Schritt kann die Bilder ebenso wie irgendeine äußere Bewegungsinformation verwenden. Bei Schritt 402 wird eine Synthese neuer Ansichten durchgeführt. Dieser Schritt kann die Eingangsbilder und die Bewegungsinformation verwenden. Bei Schritt 403 wird eine Bestimmung der Streifengröße durchgeführt. Dieser Schritt kann ebenfalls die Bewegungsinformation verwenden. Bei Schritt 404 wird eine Bestimmung der Streifenform durchgeführt. Das Ausschneide- und Einsetzverfahren wird bei Schritt 405 durchgeführt. Dieser Schritt kann die Eingangsbilder, die synthetischen Bilder für die Zwischenansichten, die Bewegungsinformation, die Streifengröße und die Streifenform verwenden. Das Ergebnis dieses Verfahrens ist ein realistisches Panorama. Die Schritte 402, 403 und 404 sind optional, und der Einbau dieser Schritte ist ein Verfahren, das durch diese Erfindung abgedeckt wird.
  • Es wird ein detailliertes Beispiel des Verfahrens der vorliegenden Erfindung gegeben und auf einen sehr gewöhnlichen Fall angewendet, in dem die Bewegung zwischen allen zwei aufeinanderfolgenden Bildern als eine zweidimensionale affine Bewegung modelliert werden kann. Dies deckt die einfachsten Szenarien ab, und außerdem die Brennweitenverstellung und Vorwärtsbewegung in den Fälle einer ebenen Szene, die parallel zur Bildebene ist. Die erzeugten Mosaiken weisen verglichen mit den ursprünglichen Bildern minimale Verzerrungen auf, da keine globale Skalierung durchgeführt wird.
  • Eine mögliche geometrische Interpretation des Verfahrens der Erfindung wird für eine allgemeine Kameratranslation angegeben. Dies geschieht, indem eine Projektion verwendet wird, die wir als Rohrprojektion bezeichnen. Diese Rohrprojektion kann als eine Implementierung des vorgeschlagenen Verfahrens verwendet werden, wenn eine dreidimensionale Kamerabewegung zurückgewonnen werden kann. Diese Interpretation des Verfahrens demonstriert die Art, in der Streifen in einer solchen Weise gesammelt und transformiert werden können, daß komplizierte Fälle einer schiefen Ansicht immer noch durch das vorgeschlagene Verfahren behandelt werden können.
  • Die vorgeschlagene dreidimensionale Interpretation des Verfahrens ist es, daß Bilder einer Videosequenz durch eine schiefe Projektion des Bildes auf ein Betrachtungsrohr transformiert werden, dessen Mittelachse durch die Trajektorie der Kamera definiert ist. Nach dieser Transformation wird der optische Fluß zwischen Rahmen parallel, und mit den Rahmen kann längs des Betrachtungsrohrs leicht ein Mosaik gebildet werden, wobei einfach Ausschneiden und Einsetzen verwendet wird. Das auf diese Weise erzeugt Rohrmosaik umfaßt den größten Teil der Details, die durch die sich bewegende Kamera beobachtet werden, wobei jeder Bereich aus dem Bild entnommen wird, wo er mit der höchsten Auflösung aufgenommen wurde. Eine Betrachtung dieses Rohrmosaiks aus verschiedenen Richtungen kann zu den verschiedenen Mosaiken gleichwertige Ergebnisse liefern, die unter Verwendung einer zweidimensionalen Implementierung erzielt werden.
  • Form der Streifen
  • Ohne Parallaxe und mit einer reinen Bildtranslation ist die Konstruktion des Panoramas aus den Bildern einfach. Da über einen Überlappungsbereich zwischen zwei Bildern die Ausrichtung sehr gut ist, ist irgendeine Auswahl des besonderen Bildes, das irgendeinen gegebenen Bereich abdeckt, üblicherweise nicht kritisch. Die Form des Streifens wird in den Fällen ohne eine Parallaxe hauptsächlich bei einer Bildvergrößerung, wie im Fall der Brennweitenverstellung wichtig. Jedoch wird mit einer Bildparallaxe die Ausrichtung über einen Überlappungsbereich zwischen Bildern nicht perfekt sein, und die Auswahl, welches Bild einen Bereich im Panorama bedecken wird, wird kritisch.
  • 5 zeigt die Wirkungen der Parallaxe auf die Ausrichtungs- und Vereinigungsverfahren. Die Objekte A, B, C, D, E befinden sich auf einer ebenen Fläche oben auf der Figur. Die Objekte C, X und Y verursachen eine Parallaxe in den beiden Eingangsbildern I1 und I2, die durch eine translatierte Kamera bei C1 und C2 aufgenommen werden. Alle Objekte C, X, oder Y können als ausgerichtete Bereiche verwendet werden, was folglich drei unterschiedliche Arten ergibt, Panoramabilder zu erzeugen, die als P1, P2 und P3 am unteren Teil der Figur gezeigt werden.
  • Das Mosaikbildungsverfahren kann als das Ausschneiden von „Streifen" aus jedem Bild und dem Zusammensetzen dieser Streifen zu einem größeren Panorama präsentiert werden. Es wird gezeigt werden, daß die Art der Kamerabewegung die Form dieser Streifen bestimmt. Dies steht im Widerspruch zu früheren Vorschlägen, eine „Voronoi Tessellation" zu verwenden, um das Panoramamosaik aus den Bildern zu erzeugen, ein Vorschlag, der die dreidimensionale Kamerabewegung überhaupt nicht berücksichtigt, sondern nur die zweidimensionale Bildverschiebung der Bildmitten.
  • Zum Beispiel wird sich eine bessere Mosaikbildung ergeben, wenn die Begrenzungen der Streifen so vorgenommen werden, daß sich annähernd senkrecht zum „optischen Fluß" (der lokalen Bildverschiebung) verlaufen, der durch die Kamerabewegung erzeugt wird. Beispiele sind Kameratranslationen: Seitwärtsbewegung, Vorwärtsbewegung und eine allgemeine Translation; ebenso wie eine Kamerabrennweitenverstellung.
  • Der Fall einer Seitwärtsbewegung wurde schon in [25] angesprochen. In diesem Fall sind, wie in 6 gezeigt, die Streifen an der Mitte der Bilder linear oder rechteckig. Drei Eingangsrahmen 601, 602 und 603 vorausgesetzt, wird das Panoramamosaik 604 erzeugt, indem der Streifen S1 aus dem Bild 601, der Streifen S2 aus dem Bild 602 und der Streifen S3 aus dem Bild 603 entnommen werden. Die Bilder sind ausgerichtet, so daß der Bereich S1 im Bild 601 zum Bereich S1 im Bild 602 paßt, der Bereich S2 im Bild 602 zu den Bereichen S2 in den Bildern 601 und 603 paßt, und der Bereich S3 im Bild 603 zum Bereich S3 im Bild 602 paßt.
  • In den Fällen einer Vorwärtsbewegung und einer Brennweitenverstellung können die Streifen nicht durch gerade Linien begrenzt werden. In diesen Fälle sind die Streifen vorzugsweise kreisförmig und am Expansionsmittelpunkt des Bildes zentriert. Im Beispiel, das in 7a gezeigt wird, befindet sich der Expansionsmittelpunkt in der Mitte des Bildes. Das Panoramamosaik 704 wird durch „Entfaltung" des Streifens S1 aus dem Bild 701, des Streifens S2 aus dem Bild 702 und des Streifens S3 aus dem Bild 703 und deren zueinander benachbarten Plazierung erzeugt.
  • Wenn die Streifen breit sind, wird deren „Entfaltung" (durch Verzerren) einen nicht-rechteckigen Streifen erzeugen. Außerdem werden die Streifen infolge von Skalierungsunterschieden nicht an den Nahtstellen ausgerichtet sein. In diesem Fall kann jeder Streifen zu einem rechteckigen Streifen umskaliert werden, was folglich das zusammenhängende Panoramamosaik 705 aus dem Panoramamosaik 704 ergibt. Eine solche Umskalierung wird die Ausrichtung an Nahtstellen verbessern. Die Stelle, wo der Kreis vor seiner Entfaltung „geöffnet" wird, ist beliebig, und wird mög licherweise durch die Richtung bestimmt, in der das Panoramamosaik konstruiert wird. Das konstruierte Mosaikbild kann als die Mantelfläche eines Zylinders betrachtet werden, wie im folgenden unter Bezugnahme auf die dreidimensionale Interpretation des Verfahrens detaillierter beschrieben wird.
  • Es sollte beachtet werden, daß die „Entfaltung" der kreisförmigen Streifen zu geraden Streifen bewirken könnte, daß das Mosaik 705 verzerrt aussieht. Es wird erwartet, daß nur Teilbestandteile aus solchen Mosaiken verwendet werden, zum Beispiel der Teil, der den oberen Teil des Bildes betrifft, oder der Teil, der die linke Seite des Bildes betrifft, usw. Ein solcher Teil wird üblicherweise ein rechteckiger Teilstreifen des Mosaiks 705 sein. Bevor ein solcher Teil angezeigt wird, kann das Mosaik durch „Biegen" seiner geraden Seiten zu Bögen eines Kreises berichtigt werden, dessen Radius zum Beispiel der Außenradius des ursprünglichen kreisförmigen Streifens (z.B. des Streifen S3 in Bild 703) sein kann.
  • Die Transformation, die den Streifen S1 im Bild 701 auf den Streifen S1 im Mosaik 705 abbildete, verwandelt den radialen optischen Fluß im Bild 701 in den parallelen optischen Fluß im Bild 705. Wenn dieselbe Transformation auf das gesamte Bild 701 anstatt nur auf den Streifen S1 angewendet wird, wird das transformierte Bild die Form aufweisen, die in 7b gezeigt wird. Wie im folgenden detaillierter beschrieben wird, können solche Transformationen durch die dreidimensionale Interpretation modelliert werden, wobei die Projektion auf einen Zylinder verwendet wird.
  • Der Fall einer Kamerabrennweitenverstellung ist von speziellem Interesse. Während eine Brennweitenverstellung zu einer entfernten Szene hin, und eine Mosaikbildung, wie in 7a, ein Mosaikbild mit einer höheren Auflösung an Stellen liefern wird, die die Mitte des Bildes betreffen, ist der Fall einer Kamera, die Objekte von der Seite betrachtet, anders. Angenommen, die Kamera ist an der Seite einer sehr langen Wand angeordnet, wobei die optische Achse parallel zur Wand verläuft (7). In diesem Fall sind die nächstgelegenen Teile der Wand an der Kante des Bildes in allen Einzelheiten zu sehen, während die entfernten Teile der Wand näher zur Mitte des Bildes kleiner zu sehen sind. Wenn die Brennweite vergrößert wird, werden die weiter weg gelegenenen Teile vergrößert und kommen der Kante des Bildes näher, und das Mosaik wird daher eine Rekonstruktion der Wand mit der höchst möglichen Auflösung werden. Unter gewissen Umständen kann die Wand sogar so rekonstruiert werden, als würde sie von vorn gesehen, überall mit einer einheitlichen Auflösung.
  • In einem allgemeineren Fall einer Kameratranslation, der in 8 gezeigt wird, kann es jeden Winkel zwischen der Richtung der Kamerabewegung und der optischen Achse geben. In diesem Beispiel kann der optische Fluß radial vom Expansionsmittelpunkt verlaufen, der sich irgendwo außerhalb des Bildes befindet, und daher ist die bevorzugte Form für den Streifen ein kreisförmiger oder ein elliptischer Bogen. Drei Eingangsrahmen 801, 802 und 803 vorausgesetzt, wird das Panoramamosaik 804 erzeugt, indem der Streifen S1 aus dem Bild 801, der Streifen S2 aus dem Bild 802 und der Streifen S3 aus dem Bild 803 entnommen werden. Die Bilder werden ausgerichtet, so daß der Streifen S1 im Bild 801 zum Streifen S1 in Bild 802 paßt, der Streifen S2 im Bild 802 zu den Streifen S2 in den Bildern 801 und 803 paßt, und der Streifen S3 im Bild 803 zum Streifen S3 im Bild 802 paßt.
  • Die Streifen in den Eingangsbildern, wie der Streifen S1 im Bild 801 und der Streifen S2 im Bild 802, sind durch Bögen konzentrischer Kreise begrenzt, die am Expansionsmittelpunkt zentriert sind. Da die Radien der beiden Kreise unterschiedlich sind, sind ihre Krümmungen unterschiedlich, und die Streifen können nicht ohne Lücken zusammengesetzt werden, die sich zwischen den Kanten der Streifen bilden. Um ein Einsetzen der Streifen ohne die Bildung von Lücken zu erreichen, werden die Streifen vor dem Einsetzen verzerrt.
  • Der Streifen 810 zeigt ein Beispiel eines ursprünglichen kreisförmigen Streifens an, der aus einem Eingangsbild ausgeschnitten wird. Der Radius r1 des linken Bogens 811 ist größer als der Radius r2 des rechten Bogens 812, der dem Expansionsmittelpunkt näher liegt. Der Streifen 810 kann verzerrt werden, um den Streifen 820 zu ergeben, der die folgenden Eigenschaften aufweist: Der Bogen 821 und der Bogen 822 weisen beide den Radius r1 auf; die Länge des Bogens 821 ist dieselbe wie die Länge des Bogens 811; die Länge des Bogens 822 ist die Länge des Bogens 812 multipliziert mit r1/r2. Diese Anordnung stellt nicht nur sicher, daß die Streifen ohne Lücken zusammenpassen werden, sondern auch daß Merkmale des Bildes zur besseren Ausrichtung an der Nahtstelle neu bemessen werden.
  • Obwohl die obige Diskussion über die Form des Streifens eine gleichmäßige Kamerabewegung längs einer Folge annimmt, kann sich die Kamerabewegung ändern, wobei sie die Form des Streifens beeinflußt. Man setze zum Beispiel eine Vorwärtsbewegung zwischen dem Rahmen I1 und dem Rahmen I2, und eine Seitwärtsbewegung zwischen dem Rahmen I2 und dem Rahmen I3 voraus. Der Streifen, der aus dem Rahmen I2 entnommen wird, kann eine kreisförmige Bogengrenze auf der Seite des Rahmens I1, und eine gerade Liniengrenze auf der Seite des Rahmens I3 aufweisen.
  • Beispiel: Mosaikbildung für eine affine Bewegung
  • Es wird nun ein Beispiel einer Streifenformung für den speziellen Fall einer affinen Bewegung beschrieben. Eine affine Be wegung beruht auf einer affinen Transformation und liefert eine gute Näherung für viele Arten von Bewegungen. Beruhend auf der detaillierten Beschreibung, die im folgenden gegeben wird, wird es einem Fachmann klar sein, daß andere Arten von Bewegungen in einer ähnlichen Weise behandelt werden können.
  • Die affine Transformation kann wie folgt ausgedrückt werden:
    Figure 00240001
    wobei Pn–1 = (xn–1 – yn–1) und Pn = (xn, yn) die Koordinaten entsprechender Punkte in den Bildern In–1 und In sind und die Parameter der affinen Transformation A (a, b, c, d, e, f) sind. (u, v) ist der optische Flußvektor als eine Funktion der Position (xn, yn). Die Transformation A (und der optische Fluß) variieren mit der Bilderfolge andauernd. Es existieren zahlreiche Verfahren, um die Parameter einer affinen Transformation [21, 18] zurückzugewinnen, und sie werden hier nicht beschrieben.
  • Gemäß dem Verfahren der vorliegenden Erfindung ist es erforderlich, um die Form eines Streifens zu definieren, eine Linie F(x,y) = 0 zu finden, die senkrecht zum optischen Fluß ist. Es sollte beachtet werden, daß diese Linie nicht notwendigerweise eine gerade Linie ist, und eine gekrümmte Linie sein kann. Die Normale zur Linie F = 0 verläuft in die Richtung
    Figure 00240002
    und sollte folglich in derselben Richtung wie (u, v) verlaufen. Diese Einschränkung kann für einen gewissen Wert von k wie folgt ausgedrückt werden:
    Figure 00240003
  • Wenn e = c, erhalten wir durch Integrieren die Liniengleichung:
    Figure 00250001
  • Man beachte, daß diese Liniengleichung nur existiert, wenn e = c. In den meisten Fällen ist die Differenz zwischen den Werten von c und e auf die Rotation des Bildes um die optische Achse um ω (Winkel im Bogenmaß) zurückzuführen, so daß er –ω zu c und +ω zu e beiträgt. Um die Bedingungen
    Figure 00250002
    annähernd zu erfüllen, ist es daher möglich, das Bild um seine Mitte um
    Figure 00250003
    zu drehen, nachdem die affine Transformation zurückgewonnen ist, und dann die affine Transformation neu zu berechnen.
  • Folglich definiert Gleichung 3 eine Schar von Linien, die die alle senkrecht zum optischen Fluß sind. M wird verwendet, um eine spezifische Linie auszuwählen. Es wird vorgeschlagen, daß M gleich einem Wert gesetzt wird, für den die Linie eine maximale Anzahl von Pixeln im Bild enthält. Wenn viele Optionen vorhanden sind, dann wird vorgeschlagen, daß eine Linie ausgewählt wird, die der Mitte des Bildes so nah wie möglich ist, um Linsenverzerrungen zu minimieren. Diese Auswahl sollte sicherstellen, daß Pixel, die im Mosaik verwendet werden, von dem Bild stammen werden, das die beste Auflösung an dieser Stelle aufweist.
  • Gleichung 3 kann für einige einfache Fälle leicht verstanden werden:
    • (i) Im Fall eines einheitlichen horizontalen optischen Flusses (entweder ein kleiner Schwenk oder eine Seitwärtstranslation der Kamera), nimmt die affine Transformation A die Form A = (a, 0, 0, 0, 0, 0) an, folglich wird die ausgewählte Linie 901 0 = F(x, y) = ax + M, was eine gerade vertikale Linie ist (siehe 9a).
    • (ii) Im Fall eines einheitlichen vertikalen optischen Flus ses (entweder eine kleine Neigung oder eine vertikale Translation der Kamera), nimmt die affine Transformation die Form A = (0, 0, 0, d, 0, 0) an, folglich wird die ausgewählte Linie 902 0 = F(x,y) = dy + M, was eine gerade horizontale Linie ist (siehe 9b).
    • (iii) Im Fall einer Brennweitenverstellung oder Vorwärtsbewegung (zu einer ebenen Fläche hin, die parallel zur Bildebene ist) , nimmt die affine Transformation die Form A = (0, b, 0, 0, 0, f) an, wobei b ein Skalierungsfaktor ist (f = b). Folglich wird die ausgewählte Linie 903
      Figure 00260001
      was ein Kreis um die Mitte des Bildes 904 ist (siehe 9c).
  • Für allgemeine Translationen der Kamera wird die Linie ein Kreis um den Expansionsmittelpunkt sein. In allgemeineren Fällen kann die Linie durch eine elliptische Kurve 905 angenähert werden:
    Figure 00260002
    (siehe 9d).
  • Das Mosaik wird konstruiert, indem Streifen zusammengesetzt werden, die aus den ursprünglichen Bildern entnommen werden. Die Form des Streifens und seine Breite hängen von der Bildbewegung ab. Es wird nun ein Beispiel beschrieben, wie diese Streifen im Fall einer affinen Bewegung zu bestimmen sind, um sich der Methodologie der Auswahl der besten Auflösung anzupassen. Die Streifenauswahl für andere Arten der Bildbewegung können in einer ähnlichen weise ausgeführt werden.
  • Es wird die folgende Schreibweise verwendet, um die Streifensammlung längs der Bilderfolge zu beschreiben: die Linie Fn(xn, yn) = 0 ist die Linie im Bild In in seinem Koordinatensystem, die senkrecht zum optischen Fluß ist, der durch die affine Transformation An = (an, bn, cn, dn, en, fn) beschrieben wird. Diese affine Transformation An setzt die Punkte pn in Bild In mit entsprechenden Punkten pn–1 in Bild In–1 in Beziehung.
  • Um den Streifen zu bestimmen, der aus dem Bild In entnommen wird, sollten der vorhergehende Rahmen In–1 und der nachfolgende Rahmen In+1 berücksichtigt werden. An sei die affine Transformation, die die Punkte pn = (xn, yn) im Bild In mit den entsprechenden Punkten pn–1 = (xn–1, Yn–1) in Bild In–1 in Beziehung setzt, und An+1 sei die affine Transformation, die die Punkte pn+1 = (xn+1, yn+1) im Bild In+1 mit den entsprechenden Punkten pn = (xn, yn) im Bild In in Beziehung setzt.
  • Wenn die affinen Transformationen An und An+1 vorausgesetzt werden, werden die Linien Fn(xn, yn) = 0 bzw. Fn+1(xn+1, yn+1) = 0 ausgewählt (siehe 10a bis 10c). Die Linie Fn(xn, yn) = 0 in In entspricht der Linie F'n(xn–1, yn–1) = 0 in In–1, wobei die affine Transformation An verwendet wird. Auf dieselbe Weise entspricht die Linie Fn+1(xn+1, yn+1) = 0 in In+1 der Linie F'n+1(xn, yn) = 0 in In, wobei die affine Transformation An+1 verwendet wird.
  • Der Streifen, der aus dem Bild In entnommen wird, ist zwischen den beiden Linien Fn(xn, yn) = 0 und F'n+1(xn, yn) = 0 in In begrenzt (siehe 10a bis 10c). Zum Beispiel wird in 10b die Linie F2 in Bild I2 ausgewählt, und in 10c wird die Linie F3 im Bild I3 ausgewählt. Die Abbildung der Linie F3 (in I3) im Bild I2 unter Verwendung der affinen Transformation ist die Linie F3'. Folglich wird der Streifen S2, der aus dem Bild I2 in 10b entnommen wird, zwischen den Linien F2 und F3' begrenzt. Es sollte beachtet werden, daß die Streifen S1, S2 und S3 senkrecht zu den Linien des optischen Flusses 1001 verlaufen.
  • Bei Verwendung dieser Auswahl wird die erste Grenze des Streifens, die durch die ausgewählte Linie Fn definiert wird, hinsichtlich des vorherigen Bildes folglich exakt orthogonal zum optischen Fluß sein. Die zweite Grenze des Streifens wird durch die Linie F'n+1 definiert, die die Projektion der Linie Fn+1 auf das gegenwärtige Bild In ist, die im nächsten Bild dieselbe Eigenschaft aufweist.
  • Diese Auswahl der Grenzen des Streifens stellt sicher, daß längs der Streifensammlung weder eine Information ausgelassen noch dupliziert wird, da die Orthogonalität mit dem optischen Fluß erhalten wird.
  • Wir betrachten die übliche Herangehensweise an die Mosaikbildung, wo einer der Rahmen als ein Bezugsrahmen verwendet wird, und alle anderen Rahmen vor dem Einsetzen an dem Bezugsrahmen ausgerichtet werden. Hinsichtlich der Streifen wird der erste Streifen in das Panoramabild eingesetzt, wie er ist. Der zweite Streifen wird verzerrt, um zu den Grenzen des ersten Streifens zu passen. Der dritte Streifen wird nun verzerrt, um zu den Grenzen des schon verzerrten zweiten Streifens zu passen, usw. Folglich ist das Mosaikbild zusammenhängend. Jedoch können größere Verzerrungen durch die summierten Verwindungen und Verzerrungen verursacht werden. Große Rotationen können nicht behandelt werden, und Fälle, wie eine Vorwärtsbewegung oder Brennweitenverstellung, verursachen üblicherweise eine unzumutbare Expansion (oder Schrumpfung) des Bildes.
  • Um zusammenhängende Mosaikbilder zu erzeugen, während summierte Verzerrungen vermieden werden, wird durch diese Erfindung vorgeschlagen, daß die Verzerrung der Streifen nur von den benachbarten ursprünglichen Rahmen abhängen sollte, unabhängig von der Geschichte der vorherigen Verzerrungen.
  • Erfindungsgemäß wird es bevorzugt, daß eine Seite jedes Streifens, z.B. die Rückseite, nicht verzerrt wird. Dies ist die Seite des Streifens, die der Grenze zwischen dem Bild In–1 und dem Bild In entspricht, und durch Fn definiert ist. Zum Beispiel ist in 10b die Linie F2 die Rückseite des Streifens S2 des Bil des I2. Die Vorderseite des Streifens wird so verzerrt, daß sie zur Rückseite des nächsten Streifens paßt. Dies ist die Grenze zwischen dem Bild In und Bild In+1, die durch F'n+1 definiert wird. Zum Beispiel ist in 10b die Linie F3' die Vorderseite des Streifens S2 des Bildes I2.
  • Im Beispiel, das in 10d beschrieben wird, wird der erste Streifen S1 so verzerrt, daß sich seine linke Seite (d.h. Rückseite) 1002 nicht ändert, während seine rechte Seite (d.h. Vorderseite) 1003 so verzerrt wird, daß sie zur linken Seite des ursprünglichen zweiten Streifens S2 paßt. Im zweiten Streifen S2 ändert sich die linke Seite 1004 nicht, während die rechte Seite 1005 so verzerrt wird, daß sie zur linken Seite 1006 des dritten Streifens S3 paßt, usw.
  • Folglich ist das konstruierte Bild zusammenhängend. Wenn der ursprüngliche optische Fluß durch dieselbe Verzerrung verzerrt wird, wie die, die an den Streifen ausgeführt wird, wird der resultierende Fluß außerdem annähernd parallel zu der Richtung werden, in der das Panoramamosaik konstruiert wird. Außerdem werden keine sich summierenden Verzerrungen angetroffen, da jeder Streifen so verzerrt wird, daß er zu genau einem anderen ursprüngliche Streifen paßt, wobei sich summierende Verzerrungen vermieden werden.
  • Mögliche dreidimensionale Interpretation der Streifenformung
  • Bei einer allgemeinen Kamerabewegung wird der optische Fluß durch eine Kameratranslation und durch eine Kamerarotation induziert. Der Rotationsteil kann zurückgewonnen und kompensiert werden, falls notwendig, da er nicht von der Struktur der Szene abhängt (siehe zum Beispiel [17]). Eine Kameratranslation (und Brennweitenverstellung) verursacht einen radialen optischen Fluß, der vom Expansionsmittelpunkt ausgeht, mit der Ausnahme des Einzelfalls einer Seitwärtstranslation, in der der optische Fluß parallel ist.
  • Fälle eines radialen optischen Flusses sind sehr viel komplizierter zur Mosaikbildung, da der optische Fluß nicht parallel ist und von der Struktur der Szene abhängt.
  • Erfindungsgemäß wird ein Beispiel einer möglichen dreidimensionalen Interpretation des vorgeschlagenen Mosaikbildungsverfahrens präsentiert. Es ist außerdem möglich, die folgende Beschreibung zu verwenden, um das Mosaikbildungsverfahren, das in dieser Erfindung vorgeschlagen wird, für Fälle zu implementieren, in denen die dreidimensionale Bewegungsinformation entweder aus den Bildern [21, 17] oder aus äußeren Vorrichtungen zur Verfügung steht. Die Prozedur der Auswahl gekrümmter Streifen, die annähernd senkrecht zum optischen Fluß sind, und deren Verzerrung, um sie aneinander anzupassen, wenn sie eingesetzt werden, kann als Transformieren der Videobilderfolge durch eine schiefe Projektion des Bildes auf ein Betrachtungsrohr angesehen werden, dessen Mittelachse durch die Trajektorie der Kamera definiert ist. Nach dieser Transformation wird der optische Fluß zwischen den projizierten Bildern annähernd parallel zur Mittelachse des Rohrs, und es kann leicht eine Mosaikbildung an ihnen vorgenommen werden, wobei einfache (herkömmliche) Streifenausschneide- und Einsetzprozeduren längs des Rohrs verwendet werden. Das auf diese Weise erzeugte Rohrmosaik enthält die meisten Details, die durch die sich bewegende Kamera beobachtet werden, wobei jeder Bereich aus dem Bild entnommen wird, wo er mit der höchsten Auflösung aufgenommen wurde, wodurch folglich ein Streifen in diesem Bild gebildet wird.
  • Um die Projektion auf das Rohr zu definieren, wird die folgende Schreibweise verwendet: der Buchstabe O wird verwendet, um den Ursprung zweier Kartesischer Koordinatensysteme mit einem gemeinsamen Ursprung zu bezeichnen. Ein Koordinatensystem ist ein globales Koordinatensystem mit Achsen, die durch X, Y, Z bezeichnet werden. Die Kamera befindet sich am Ursprung und die Bildebene befindet sich bei Z = fc, wobei fc die Brennweite ist. Das andere Koordinatensystem definiert das Rohr und wird unten beschrieben. Die Position eines Punkts P im dreidimensionalen Raum ist durch seine Koordinaten in jedem der Koordinatensysteme gegeben, zum Beispiel P = (Px, Py, Pz) im X, Y, Z-Koordinatensystem. Der Vektor OP wird ebenfalls durch den Buchstaben P bezeichnet.
  • Wenn eine Bilderfolge vorausgesetzt wird, die durch eine translatierte Kamera aufgenommen wird, schlägt das Verfahren der Erfindung vor, daß die Bilder in einer solchen Weise transformiert werden, daß der radiale optische Fluß in der transformierten Darstellung in einen annähernd parallelen optischen Fluß umgewandelt wird. Um die erforderliche Transformation zu erzielen, wird das zweidimensionale planare Bild auf einen dreidimensionalen Zylinder projiziert, der hierin als ein „Rohr" 1101 bezeichnet wird (siehe 11). Die Achse des Rohrs 1102 wird so gewählt, daß sie durch den optischen Mittelpunkt O = (0,0,0) der Kamera und durch den Expansionsmittelpunkt S = (sx, sy, fc) geht, wobei fc die Brennweite ist. Diese Achse ist die Trajektorie von der gegenwärtigen dreidimensionalen Kameraposition zur dreidimensionalen Kameraposition im nächsten Rahmen. Die Richtung der Achse des Rohrs ist durch den Einheitsvektor
    Figure 00310001
    gegeben. Jeder Bildpunkt P = (x, y, fc) in der Bildebene 1103 wird auf seinen entsprechenden Punkt Q auf dem Rohr projiziert. Der Punkt Q ist mit O und P kollinear, und sein Abstand von der Achse des Rohrs 1102 ist R (der Radius des Rohrs).
  • In der Rohrdarstellung des Bildes ist der optische Fluß jedes entsprechenden Punktes Q auf dem Rohr nun annähernd parallel zur Richtung der Achse des Rohrs s (1102). Dies ermöglicht ein einfaches Mosaikbildungsverfahren auf dem Rohr selbst, da aufeinanderfolgende Bilder, nachdem sie auf das Rohr projiziert werden, nur längs des Rohrs verschoben werden müssen, um mit den vorhergehenden Bildern ausgerichtet zu werden. Diese Translation längs des Rohrs reduziert die Auflösung nicht, wie es gewöhnlich in Mosaikbildungsverfahren passiert, die auf einer Ausrichtung mit einem Bezugsrahmen beruhen.
  • Ein rohrfestes Kartesisches Koordinatensystem wird durch die drei Einheitsvektoren r ^, d ^ und s ^ definiert, wobei s der Einheitsvektor in die Richtung der Achse des Rohrs ist und r ^ und d ^ so gewählt werden, daß sie zueinander und zu s ^ senkrecht sind.
  • Der Punkt L sei die Projektion des Punktes Q auf die Achse 1102 des Rohrs 1101, und k sei die Entfernung von. L zu O. Der Winkel α bezeichnet den Winkel zwischen der Linie, die L und Q verbindet, und dem Einheitsvektor d ^. Folglich bestimmen k und α die Position eines Punktes Q auf dem Rohr 1101. Die dreidimensionale Position eines Punktes Q auf dem Rohr 1101 ist durch die Kartesischen Komponenten (Qx, Qy, Qz) gegeben, die aus den Komponenten des Vektors Q = ks ^ + Rcos (α)d ^ + Rsin(α)r ^ bezüglich des rohrfesten Systems erhalten werden können. Das entsprechende Pixel in der Bildebene 1103 für den Punkt Q ist P = (x, y, fc) = fcQx/Qz, fcQy/Qz, fc).
  • Pixel in der Bildebene 1103, deren ursprünglicher Abstand von der Achse 1102 kleiner als R ist, werden auf dem Rohr vergrößert, wenn sie jedoch auf das Bild zurück projiziert werden, erhalten sie ihre Auflösung zurück. Pixel mit einem Abstand, der größer als R ist, schrumpfen jedoch auf dem Rohr, wobei sie folg lich ihre ursprüngliche Auflösung verlieren. Aus diesem Grund ist es empfehlenswert, R so zu wählen, daß er gleich
    Figure 00330001
    ist, wobei w und h die Breite und Höhe des Bildes sind, wodurch folglich sichergestellt wird, daß kein Pixel eine reduzierte Auflösung aufweisen wird, wenn es auf das Rohr projiziert wird. Alternativ reicht es in vielen einfachen Szenarien aus, R so zu wählen, daß er gleich fc ist.
  • In der Rohrdarstellung werden Rohrbilder durch eine einfache Translation (Verschiebung) längs der Hauptachse des Rohrs aneinander ausgerichtet, und die Erzeugung des Rohrmosaiks beinhaltet, die Pixel mit der besten Auflösung unter allen projizierten Bildern für jeden Punkt auf dem Rohr zu nehmen. Es sollte beachtet werden, daß andere Verfahren verwendet werden könnten, um den Wert für jeden Punkt auf dem Rohr auszuwählen, einschließlich Superauflösungsverfahren. Die Auflösung wird für Pixel am besten erhalten, deren Fläche, wenn sie auf das Rohr projiziert wird, 1 mal 1 Pixel beträgt (was bedeutet, daß ein einzelnes Pixel ohne künstliche Skalierung auf ein einzelnes Pixel auf dem Rohr projiziert wird). Unter Verwendung dieser Kriterien kann das Verhältnis zwischen der Fläche, die auf dem Rohr verbraucht wird, und der Fläche auf dem ursprünglichen Bildrahmen als ein Maß betrachtet werden, so daß die Auflösung am besten erhalten wird, wenn dieses Verhältnis so nah wie möglich bei 1 liegt. Folglich werden für jeden Punkt auf dem Rohr seine entsprechenden Pixel in den Bildern betrachtet, und das mit dem Verhältnis, das 1 am nächsten liegt, kann für die beste Auflösung ausgewählt werden. Als Daumenregel kann dieses Verhältnis grob gemäß dem Verhältnis der Abstände längs der Z-Achse Qz/fc angenähert werden, das so nah wie möglich bei 1 liegen sollte. Unter Verwendung dieses Näherungsmaßes werden Pixel auf dem Bild an der Schnittlinie des Rohrs mit dem Bild (Qz = fc) als die angesehen, die die Auflösung am besten erhalten, und die Auflösungserhaltung nimmt gemäß |Qz – fc| ab. Für jeden Punkt auf dem Rohr werden die Bildwerte (z.B. Farbe und Intensität) aus dem Bild entnommen, in dem der Wert von |Qz – fc| minimal ist, was folglich die beste Auflösungserhaltung aufweist. Diese Definition bildet einen Streifen in jedem Bild, der der Bereich ist, in dem dieses Bild, wenn es auf das Rohr projiziert wird, verglichen mit den entsprechenden Bereichen in anderen Bildern die Auflösung am besten erhält (siehe 12a).
  • Diese Rohrdarstellung schlägt eine verallgemeinerte Interpretation auch für herkömmliche Mosaikbildungsverfahren vor. Verfahren, die auf einer Ausrichtung mit einem Bezugsrahmen beruhen, können simuliert werden, indem das Rohr aus derselben Orientierung wie der ausgewählte Bezugsrahmen betrachtet wird. Verfahren, die auf eine reine Seitwärtstranslation beschränkt sind, werden identische Ergebnisse wie die Verwendung eines Rohrmosaiks ergeben, wobei die Bilder auf die Seite des Rohrs projiziert werden.
  • Fälle, wie eine schiefe Ansicht, eine Vorwärtsbewegung und eine Brennweitenverstellung können unter Verwendung der Rohrprojektion gut definiert werden, und ergeben optimale Ergebnisse, während frühere Mosaikbildungsverfahren in diesen Fällen versagen können. Das durch diese Erfindung abgedeckte Mosaikbildungsverfahren verwendet verallgemeinerte Streifen (deren Form, Größe und Verzerrungsverfahren gemäß den Bewegungs- und Auflösungsüberlegungen bestimmt wird), und kann durch die obige Beschreibung der Rohrmosaikbildung interpretiert werden, wodurch folglich die bekannten Verfahren verallgemeinert werden, um ebenso für die problematischen Fälle zu funktionieren.
  • Die Rohrdarstellung kann zur Behandlung komplizierter Trajektorien und Rotationen durch eine Verknüpfung von Rohren längs des Weges der Kamera verallgemeinert werden (siehe 12b).
  • Streifenbreite in dreidimensionaler Darstellung
  • Wenn die dreidimensionale Kamerabewegung T = (TX, TY, TZ) und Ω = (ΩX, ΩY, ΩZ) (Translation und Rotation) aus äußeren Vorrichtungen oder aus der Verwendung von Algorithmen zur Kamerabewegungsrückgewinnung aus den Bildern [21, 17] zur Verfügung steht, dann kann eines davon zur Einstellung der Größe der Streifen verwendet werden.
  • Anschließend an die Beschreibung des Mosaikbildungsverfahrens, das das „Rohr" verwendet, können die Projektionen zweier Bilder auf das Rohr durch eine einfache Verschiebung längs der Achse des Rohrs miteinander ausgerichtet werden. Eine Verschiebung des projizierten Bildes um L Pixel kann einen Streifen mit einer Breite von L Pixeln bilden. Es wird nun ein Verfahren beschrieben, um die Breite L eines Streifens für zwei Eingangsrahmen anzunäheren.
  • Man beachte, daß in diesem Abschnitt angenommen wird, daß der Radius des Rohrs als R = fc gewählt wird, obwohl andere Werte von R möglich sind, und der Wert von L entsprechend skaliert werden kann.
  • Es ist erforderlich, die Breite des Streifens L in einer solchen Weise zu berechnen, daß die Auflösung des resultierenden Panoramabildes nicht kleiner als die Auflösung der ursprüngliche Bilderfolge ist. Zum Beispiel kann die Breite des Streifens ohne Parallaxe gleich der Bildverschiebung zwischen den beiden Rahmen sein.
  • 13 zeigt die Wahl der Streifenbreite, die erforderlich ist, um die ursprüngliche Auflösung für den Fall einer reinen Rotation zu erhalten. Die Breite des Streifens L von der Mitte des Bildes I1 zur Mitte von I2 kann auf
    Figure 00360001
    eingestellt werden, wobei fc die Brennweite der Kamera (oder der Radius des Rohrs ist), x der Kreuzproduktoperator ist, und ()t der Transpositionsoperator ist. Dies wird ähnliche Ergebnisse wie in anderen Panorama-Mosaikbildungsverfahren ergeben, die auf eine reine Rotation beschränkt sind.
  • 14 zeigt die Wahl der Streifenbreite, die erforderlich ist, um die ursprüngliche Auflösung für den Fall einer reinen Translation zu erhalten. Im Fall einer reinen Translation wäre es am besten, wenn das Ergebnis denselben Effekt wie den einer orthographischen Projektion hätte (parallaxenunabhängig). Es wird dafür vorgeschlagen, daß die Auflösung des resultierenden Bildes in einer solchen Weise berücksichtigt wird, daß alle Objekte, deren Entfernung von der Kamera mindestens Zmin beträgt, ihre Auflösung beibehalten oder verbessern werden. Zmin kann gemäß der Anwendung definiert werden, und entspricht im allgemeinen dem nächstgelegenen Objekt, das die größte Bild- (oder Rohr)-Verschiebung aufweist.
  • Zum Beispiel beschreibt 14 eine Szene mit Objekten, die der Kamera nicht näher als eine bestimmte Entfernung Zmin sind. Ein Objekt der Länge M wird höchstens m = fcM/Zmin Pixel in der Bildebene aufweisen, wobei fc die Brennweite der Kamera ist. Wir betrachten eine Kamera, die mit |T| = M translatiert, so daß die Mitte des ersten Bildes auf ein Ende des Objekts schaut, und die Mitte des zweiten Bildes auf das andere Ende des Objekts schaut. Dies bedeutet, daß die Kamera das Objekt gerade von einem Ende zum anderen passiert hat, folglich sind L = m Pixel dazwischen erforderlich, um die ursprüngliche Auflösung des Objekts im Panoramabild zu erhalten. Folglich wird die folgende Definition fc|T|/Zmin für die Breite eines Streifens für den Fall einer reinen Translation vorgeschlagen, wobei fc die Brennweite (oder der Radius des Rohrs) ist. Ein Streifen, dessen Breite mindestens L Pixel beträgt, kann zur Erzeugung des Panoramabildes verwendet werden (oder einige schmalere Streifen, wie L Streifen aus L Zwischenansichten, wobei jeder ein Pixel breit ist, wie später beschrieben wird). Diese Definition kann bewirken, daß alle Objekte in einer Entfernung Z > Zmin eine bessere Auflösung als in der ursprünglichen Bilderfolge aufweisen.
  • Im Fall einer allgemeinen Bewegung kann die Breite des Streifens L zwischen I1 und I2 direkt aus fc (der Brennweite), T (dem Translationsvektor) und Ω (dem Rotationsvektor) bestimmt werden. Zum Beispiel kann die folgende Gleichung verwendet werden: l = fc|T/Zmin + Ω × (0, 0, 1)t
  • Man beachte, daß T und Z für gewöhnlich nur bis zu einen Skalierungsfaktor zurückgewonnen werden können, jedoch kann die Beziehung zwischen ihnen eindeutig zurückgewonnen werden. Der Term fc|T|/Zmin definiert die maximale Größe des durch die Kameratranslation verursachten optischen Flusses, der zurückgewinnbar ist. Diese Definition hängt nicht von irgendeinem spezifischen Bereich im Bild ab, und hängt nur von den Kamerabewegungsparametern ab, folglich ist sie längs der Bilderfolge konsistent, und ermöglicht die Erzeugung realistischer Panoramamosaiken.
  • Mosaikbildung, wobei die Erzeugung einer neuen Ansicht verwendet wird
  • Um eine Mannigfaltigkeitsprojektion zu erzeugen, werden die Bilder als eine eindimensionale (nicht notwendigerweise lineare) Abtastung der Szene betrachtet, die eine Sammlung von Streifen ist, die annähernd senkrecht zur Richtung der Kamerabewegung verlaufen.
  • Streifen von unterschiedlichen Bildern mit Streifenbreiten von mehr als einem Pixel zu nehmen, funktioniert nur dann gut, wenn es keine Parallaxe gibt. Für den allgemeinen Fall, der eine Parallaxe aufweist, können, anstatt einen Streifen mit einer Breite von L Pixeln zu nehmen, synthetisch Zwischenbilder hergestellt werden, und es können schmalere Streifen verwendet werden. Zum Beispiel kann eine Sammlung von L Streifen mit jeweils einer Breite von einem Pixel aus interpolierten Ansichten zwischen den ursprünglichen Kamerapositionen entnommen werden.
  • 15 zeigt die Erzeugung eines Panoramabildes, wobei eine Ansichtinterpolation verwendet wird, indem synthetische Ansichten von Zwischenkamerapositionen für zwei Beispiele verwendet werden, eine für den Fall einer Translation, und eine für den Fall einer Rotation. Im Fall der Translation sind die Objekte A, B, X, Y, C, D in den beiden aufeinanderfolgenden Rahmen I1 und I2 sichtbar, die durch eine Kamera aufgenommen werden, die sich von der Position C1 zur Position C2 verschiebt. Alle erforderlichen Zwischenbilder werden für die Zwischenansichten N1, N2, ... zurückgewonnen und es wird ein einziger Streifen (ein Pixel breit) aus jedem Zwischenbild entnommen. Das Verfahren der Erzeugung dieser Zwischenansichten und der Sammlung dieser Streifen ergibt als Ergebnis das Panoramamosaik P1. Dieses Panorama ist realistisch und leidet nicht an Parallaxeneffekten.
  • Derselbe Mechanismus trifft auch für den Fall einer Rotation zu. Hier sind die Objekte E, F, W, Z, L, M in den beiden aufeinanderfolgenden Rahmen I3 und I4 sichtbar, die durch eine Kamera aufgenommen werden, deren Ort fest ist, und deren Orientierung sich von C3 zu C4 ändert. Alle erforderlichen Zwischenbilder werden für die Zwischenansichten N7, N8, ... zurückgewonnen, und es wird ein schmaler Streifen aus jedem Zwischenbild entnommen. Das Ergebnis dieses Verfahrens ist das Panoramamosaik P2. Dieses Panorama ist so gut wie das Panorama, das durch einige frühere Verfahren erzeugt wird, da bei einer reinen Rotation keine Parallaxeneffekte angetroffen werden.
  • Um neue Ansichten zu synthetisieren, können verschiedene bekannte Verfahren verwendet werden, wie eine Interpolation des optischen Flusses [6, 19], trilineare Tensorverfahren [17] und andere. In den meisten Fällen werden Näherungsverfahren gute Ergebnisse ergeben. Die Erzeugung der Zwischenansichten sollte nur eine Ansichtinterpolation erfordern, da in den meisten Anwendung keine Ansichtextrapolation erforderlich ist.
  • Die Verwendung von Zwischenansichten zur Streifensammlung ergibt den Effekt einer orthographischen Projektion, die Parallaxendiskontinuitäten vermeidet. Zum Beispiel zeigt 16 die Erzeugung von passenden Panoramamosaiken beim Vorhandensein einer Parallaxe. Das oben beschriebene Verfahren überwindet die Schwierigkeiten einer Parallaxe unter Verwendung einer Ansichtinterpolation, und das Ergebnis bleibt realistisch.
  • Obwohl die vorliegende Erfindung in einem bestimmten Maß an Genauigkeit beschrieben worden ist, sollte zu verstehen sein, daß verschiedene Abänderungen und Modifikationen vorgenommen werden könnten, ohne den Bereich der Erfindung zu verlassen, der im folgenden beansprucht wird.

Claims (18)

  1. Verfahren zur Kombination einer Folge zweidimensionaler Bilder einer Szene, um ein Panoramamosaik der Szene zu erhalten, wobei die Folge zweidimensionaler Bilder durch eine sich bewegende Kamera erfaßt wird, die sich bezüglich der Szene in einer Relativbewegung befindet, wobei die Relativbewegung einen optischen Fluß zwischen den Bildern hervorruft, wobei die Vektoren des optischen Flusses mindestens teilweise nicht-parallel zueinander sind, wobei das Verfahren aufweist: a) Verzerren der Bilder, so daß die Richtung der Vektoren des optischen Flusses im wesentlichen zueinander und zu einer Richtung parallel wird, in der das Mosaik konstruiert wird; b) Einsetzen der verzerrten Bilder, so daß die Folge zweidimensionaler Bilder für die Szene zusammenhängend wird, wodurch das Panoramamosaik der Szene konstruiert wird.
  2. Verfahren zur Kombination einer Folge zweidimensionaler Bilder einer Szene, um ein Panoramamosaik der Szene zu erhalten, wobei die Folge zweidimensionaler Bilder durch eine sich bewegende Kamera erfaßt wird, die sich bezüglich der Szene in einer Relativbewegung befindet, wobei die Kamerabewegung einen optischen Fluß zwischen den Bildern hervorruft, wobei das Verfahren die Schritte aufweist: a) Auswählen für jedes Bild der Folge zweidimensionaler Bilder mindestens einer Schar von Linien, die senkrecht zum optischen Fluß verlaufen und Streifen definieren, die eine Vorderkante, durch die der optische Fluß eintritt, und eine Hinterkante aufweisen, durch die der optische Fluß austritt, damit jeder Streifen im wesentlichen senkrecht zum optischen Fluß verläuft; b) Verzerren der Streifen, um nicht-rechteckige Streifen zu erzeugen, damit der optische Fluß im wesentlichen parallel zu einer Richtung wird, in der das Mosaik konstruiert wird; und (c) Einsetzen der nicht-rechteckigen Streifen, damit die Folge zweidimensionaler Bilder für die Szene zusammenhängend wird, wodurch das Panoramamosaik der Szene konstruiert wird.
  3. Verfahren nach Anspruch 2, wobei der Schritt b) des Verzerrens der Streifen das Transformieren der Streifen zu Streifen aufweist, von denen mindestens eine ihrer Vorder- und Hinterkanten zu einer Kante eines benachbarten Streifens paßt.
  4. Verfahren nach Anspruch 2, wobei der Schritt b) des Verzerrens der Streifen das Transformieren der Streifen zu Streifen aufweist, die gerade Kanten aufweisen, bevor die Streifen miteinander kombiniert werden.
  5. Verfahren nach Anspruch 2, wobei der Schritt b) des Verzerrens der Streifen eine Umskalierung der Streifen, die auf einem zweidimensionalen Bild definiert sind, in rechteckige Streifen aufweist, so daß ihre Vorderkante im wesentlichen mit der Hinterkante eines Streifens ausgerichtet ist, der auf einem benachbarten zweidimensionalen Bild definiert wird.
  6. Verfahren nach Anspruch 5, wobei der Streifen ein kreisförmiger Streifen ist, wobei die Vorderkante des kreisförmigen Streifens ein Bogen der Länge l1 mit einem Radius r1 ist, die Hinterkante des kreisförmigen Streifens ein Bogen der Länge l2 mit einem Radius r2 ist und die Umskalierung eine Multiplikation von l1 mit r1/r2 aufweist.
  7. Verfahren nach Anspruch 2, wobei der Schritt a) des Auswählens für jedes Bild der Folge zweidimensionaler Bilder mindestens einer Schar von Linien, die mindestens einen Streifen definieren, aufweists – Bestimmen einer Form für den Streifen; – Bestimmen einer Größe und einer Breite für den Streifen; – Definieren einer Position des Streifens auf einem zweidimensionalen Bild; und – Ausschneiden des Streifens aus dem zweidimensionalen Bild.
  8. Verfahren nach Anspruch 2, wobei die zweidimensionalen Bilder durch eine affine Transformation oder durch eine planarprojektive Transformation in Beziehung stehen.
  9. Verfahren nach Anspruch 8, wobei die Transformation abhängig von einem gewünschten Standpunkt auf das Panoramamosaik angewendet wird.
  10. Verfahren nach Anspruch 1 oder 2, wobei die Bilder auf einen dreidimensionalen Zylinder projiziert werden, dessen Hauptachse den Weg des optischen Mittelpunkts der Kamera annähert, wobei eine Kombination der Streifen erzielt wird, indem die projizierten zweidimensionalen Bilder im wesentlichen längs der Zylinderoberfläche des dreidimensionalen Zylinders translatiert werden.
  11. Verfahren nach Anspruch 10, wobei alle zwei aufeinanderfolgenden Bilder ihren eigenen Zylinder definieren, dessen Hauptachse im wesentlichen durch den optischen Mittelpunkt der Kamera geht, und die Zylinder im wesentlichen längs der Bildfolge verkettet sind.
  12. Verfahren nach Anspruch 1 oder 2, wobei die Bilderfolge durch Sätze interpolierter Bilder erweitert wird, die zwischen den Bildern der Bilderfolge liegen, und wobei die Streifen mit Streifen erweitert werden, die an den interpolierten Bildern definiert werden.
  13. Verfahren nach einem der Ansprüche 1 bis 12, das ferner das Speichern von Daten in einem Speicher aufweist, die für das Panoramamosaik der Szene repräsentativ sind.
  14. Computerprogramm, das eine Computerprogrammcodeeinrichtung zur Durchführung aller Schritte der Ansprüche 1 bis 13 aufweist, wenn das Programm auf einem Computer ausgeführt wird.
  15. Computerprogramm nach Anspruch 14, das auf einem computerlesbaren Medium enthalten ist.
  16. Verwendung des Verfahrens nach Anspruch 1 oder 2, zur Be handlung mindestens eines Falls aus der Gruppe, die aus einer Bildparallaxe, einer Kamerabrennweitenverstellung, einer Vorwärtskamerabewegung und einer allgemeinen Kamerabewegung besteht, die eine Translation und Rotation kombiniert.
  17. System zur Kombination einer Folge zweidimensionaler Bilder einer Szene, um ein Panoramamosaik der Szene zu erhalten, wobei die Bilderfolge durch eine Kamera erfaßt wird, die sich bezüglich der Szene in einer Relativbewegung befindet, wobei die Relativbewegung einen optischen Fluß zwischen den Bildern hervorruft, wobei die Vektoren des optischen Flusses mindestens teilweise nicht-parallel zueinander sind, wobei das System aufweist: eine Verzerrungseinrichtung zur Verzerrung der Bilder, so daß die Richtung der Vektoren des optischen Flusses zwischen den Bildern im wesentlichen zueinander und zu einer Richtung parallel wird, in der das Mosaik konstruiert ist; und eine Einsetzeinrichtung zum Einsetzen der verzerrten Bilder, so daß die Folge zweidimensionaler Bilder für die Szene zusammenhängend ist.
  18. System zur Kombination einer Folge zweidimensionaler Bilder einer Szene, um ein Panoramamosaik der Szene zu erhalten, wobei die Folge zweidimensionaler Bilder durch eine sich bewegende Kamera erfaßt wird, die sich in Relativbewegung bezüglich der Szene befindet, wobei die Kamerabewegung einen optischen Fluß zwischen den Bildern hervorruft, wobei das System aufweist: einen Selektor, um für jedes Bild der Folge zweidimensionaler Bilder mindestens eine Schar von Linien auszuwählen, die senkrecht zum optischen Fluß verlaufen und mindestens einen Streifen definieren, der eine Vorderkante, durch die der optische Fluß eintritt, und eine Hinterkante aufweist, durch die der optische Fluß austritt, so daß jeder Streifen im wesentlichen senkrecht zum optischen Fluß verläuft; eine Verzerrungseinrichtung zur Verzerrung des Streifens, um nicht-rechteckige Streifen zu erzeugen, so daß der optische Fluß im wesentlichen parallel zu einer Richtung wird, in der das Mosaik konstruiert ist; eine Einsetzeinrichtung zum Einsetzen der nicht-rechteckigen Streifen, so daß die Folge zweidimensionaler Bilder für die Szene zusammenhängend ist.
DE69827232T 1997-01-30 1998-01-20 Mosaikbildverarbeitungssystem Expired - Lifetime DE69827232T2 (de)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
US3657197P 1997-01-30 1997-01-30
US36571P 1997-01-30
PCT/IL1998/000026 WO1998034195A1 (en) 1997-01-30 1998-01-20 Generalized panoramic mosaic

Publications (2)

Publication Number Publication Date
DE69827232D1 DE69827232D1 (de) 2004-12-02
DE69827232T2 true DE69827232T2 (de) 2005-10-20

Family

ID=21889339

Family Applications (1)

Application Number Title Priority Date Filing Date
DE69827232T Expired - Lifetime DE69827232T2 (de) 1997-01-30 1998-01-20 Mosaikbildverarbeitungssystem

Country Status (8)

Country Link
US (2) US6532036B1 (de)
EP (1) EP0954828B1 (de)
JP (1) JP4007619B2 (de)
AT (1) ATE280978T1 (de)
AU (1) AU5573698A (de)
DE (1) DE69827232T2 (de)
IL (1) IL131056A (de)
WO (1) WO1998034195A1 (de)

Families Citing this family (91)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH10178564A (ja) * 1996-10-17 1998-06-30 Sharp Corp パノラマ画像作成装置及び記録媒体
ATE280978T1 (de) * 1997-01-30 2004-11-15 Yissum Res Dev Co Mosaikbildverarbeitungssystem
AU1048399A (en) * 1997-11-10 1999-05-31 Gentech Corporation System and method for generating super-resolution-enhanced mosaic images
US6362850B1 (en) * 1998-08-04 2002-03-26 Flashpoint Technology, Inc. Interactive movie creation from one or more still images in a digital imaging device
AU4837100A (en) * 1999-05-11 2000-11-21 Microsoft Corporation Rendering method using concentric mosaics images
US7620909B2 (en) 1999-05-12 2009-11-17 Imove Inc. Interactive image seamer for panoramic images
JP2001034737A (ja) * 1999-07-16 2001-02-09 Minolta Co Ltd 画像合成装置、画像合成処理方法および画像合成処理プログラムを記録したコンピュータ読み取り可能な記録媒体
US7098914B1 (en) * 1999-07-30 2006-08-29 Canon Kabushiki Kaisha Image synthesis method, image synthesis apparatus, and storage medium
EP1234278B1 (de) * 1999-08-20 2009-12-02 Yissum Research Development Company Of The Hebrew University Of Jerusalem System und verfahren zur berichtigung eines durch eine mobile kamera aufgezeichneten mosaikaehnlichen bildes
US7477284B2 (en) * 1999-09-16 2009-01-13 Yissum Research Development Company Of The Hebrew University Of Jerusalem System and method for capturing and viewing stereoscopic panoramic images
GB2360413A (en) * 2000-03-16 2001-09-19 Lee Scott Friend Wide angle parabolic imaging and image mapping apparatus
US7313289B2 (en) * 2000-08-30 2007-12-25 Ricoh Company, Ltd. Image processing method and apparatus and computer-readable storage medium using improved distortion correction
US7095905B1 (en) 2000-09-08 2006-08-22 Adobe Systems Incorporated Merging images to form a panoramic image
US6959120B1 (en) * 2000-10-27 2005-10-25 Microsoft Corporation Rebinning methods and arrangements for use in compressing image-based rendering (IBR) data
JP2002236100A (ja) * 2001-02-09 2002-08-23 Hitachi Ltd 非破壊検査方法およびその装置
US7006707B2 (en) * 2001-05-03 2006-02-28 Adobe Systems Incorporated Projecting images onto a surface
US7103236B2 (en) * 2001-08-28 2006-09-05 Adobe Systems Incorporated Methods and apparatus for shifting perspective in a composite image
DE10213931C1 (de) * 2002-03-28 2003-03-27 Hunger Ibak H Gmbh & Co Kg Verfahren zum Inspizieren von Kanalrohren
MY137246A (en) * 2002-04-30 2009-01-30 Jfe Steel Corp Method and instrument for measuring bead cutting shape of electric welded tube
JP4211292B2 (ja) * 2002-06-03 2009-01-21 ソニー株式会社 画像処理装置および画像処理方法、プログラム並びにプログラム記録媒体
AU2002950210A0 (en) * 2002-07-11 2002-09-12 Mediaware Solutions Pty Ltd Mosaic construction from a video sequence
US7831088B2 (en) * 2003-06-13 2010-11-09 Georgia Tech Research Corporation Data reconstruction using directional interpolation techniques
US7746404B2 (en) * 2003-11-10 2010-06-29 Hewlett-Packard Development Company, L.P. Digital camera with panoramic image capture
WO2005050560A1 (en) * 2003-11-20 2005-06-02 Yissum Research Development Company Of The Hebrew University Of Jerusalem Image mosaicing responsive to camera ego motion
TWI276044B (en) * 2003-12-26 2007-03-11 Ind Tech Res Inst Real-time image warping method for curve screen
US7324137B2 (en) 2004-01-29 2008-01-29 Naomichi Akizuki System for automatically generating continuous developed still image from video image of inner wall of tubular object
US20050168589A1 (en) * 2004-01-30 2005-08-04 D. Amnon Silverstein Method and system for processing an image with an image-capturing device
RU2006134306A (ru) * 2004-02-27 2008-04-10 Интергрэф Софтвеа Текнолоджис Кампэни Способ и система обработки изображения и машиночитаемый носитель
GB0407013D0 (en) * 2004-03-27 2004-04-28 Koninkl Philips Electronics Nv Image capture device and related method
US7813589B2 (en) * 2004-04-01 2010-10-12 Hewlett-Packard Development Company, L.P. System and method for blending images into a single image
CN1998153A (zh) * 2004-05-10 2007-07-11 辉达公司 用于视频数据的处理器
WO2005109339A1 (en) * 2004-05-10 2005-11-17 Koninklijke Philips Electronics N.V. Creating an output image
TWI250780B (en) * 2004-10-13 2006-03-01 Creative Sensor Inc Light gathering structure of scanning module
US7852370B2 (en) * 2004-11-05 2010-12-14 Yissum Research Development Company Of The Hebrew University Of Jerusalem Method and system for spatio-temporal video warping
WO2006053271A1 (en) 2004-11-12 2006-05-18 Mok3, Inc. Method for inter-scene transitions
US8645870B2 (en) 2005-03-31 2014-02-04 Adobe Systems Incorporated Preview cursor for image editing
US7813590B2 (en) * 2005-05-13 2010-10-12 Given Imaging Ltd. System and method for displaying an in-vivo image stream
DE602006014302D1 (de) * 2005-09-12 2010-06-24 Trimble Jena Gmbh Vermessungsinstrument und Verfahren zur Bereitstellung von Vermessungsdaten unter Verwendung eines Vermessungsinstruments
US7499586B2 (en) * 2005-10-04 2009-03-03 Microsoft Corporation Photographing big things
US8303505B2 (en) * 2005-12-02 2012-11-06 Abbott Cardiovascular Systems Inc. Methods and apparatuses for image guided medical procedures
US7660464B1 (en) 2005-12-22 2010-02-09 Adobe Systems Incorporated User interface for high dynamic range merge image selection
US20070147812A1 (en) * 2005-12-22 2007-06-28 Nokia Corporation Digital panoramic camera
JP4818747B2 (ja) * 2006-02-23 2011-11-16 公益財団法人鉄道総合技術研究所 長尺画像を用いた鉄道車両検査方法及びその装置
EP2013849A1 (de) * 2006-04-24 2009-01-14 Nxp B.V. Verfahren und vorrichtung zum erzeugen eines panoramabildes aus einer videosequenz
US20100289922A1 (en) * 2006-05-29 2010-11-18 Bit-Side Gmbh Method and system for processing data sets of image sensors, a corresponding computer program, and a corresponding computer-readable storage medium
DE102006025651A1 (de) * 2006-05-29 2007-12-06 Thomas Brenner Verfahren und Anordnung zur Behandlung von Datensätzen bildgebender Sensoren sowie ein entsprechendes Computerprogramm und ein entsprechendes computerlesbares Speichermedium
US8144919B2 (en) * 2006-09-22 2012-03-27 Fuji Xerox Co., Ltd. Annealing algorithm for non-rectangular shaped stained glass collages
JP4516554B2 (ja) * 2006-10-05 2010-08-04 ノザワ電子工業株式会社 管内壁面画像展開システム
US8107769B2 (en) * 2006-12-28 2012-01-31 Casio Computer Co., Ltd. Image synthesis device, image synthesis method and memory medium storage image synthesis program
US7901094B2 (en) * 2007-01-24 2011-03-08 Seiko Epson Corporation View projection: one-touch setup of light displays on arbitrary surfaces
US8593506B2 (en) * 2007-03-15 2013-11-26 Yissum Research Development Company Of The Hebrew University Of Jerusalem Method and system for forming a panoramic image of a scene having minimal aspect distortion
WO2008111080A1 (en) * 2007-03-15 2008-09-18 Yissum Research Development Company Of The Hebrew University Of Jerusalem Method and system for forming a panoramic image of a scene having minimal aspect distortion
US8200039B2 (en) * 2007-04-05 2012-06-12 Adobe Systems Incorporated Laying out multiple images
US7936915B2 (en) * 2007-05-29 2011-05-03 Microsoft Corporation Focal length estimation for panoramic stitching
JP4377932B2 (ja) * 2007-07-26 2009-12-02 株式会社モルフォ パノラマ画像生成装置およびプログラム
JP2009077362A (ja) * 2007-08-24 2009-04-09 Sony Corp 画像処理装置、動画再生装置、これらにおける処理方法およびプログラム
US8380298B2 (en) * 2007-11-29 2013-02-19 Tom Chi Magnetic acupuncture needle
RU2460187C2 (ru) * 2008-02-01 2012-08-27 Рокстек Аб Переходная рама с встроенным прижимным устройством
US20100026822A1 (en) * 2008-07-31 2010-02-04 Itt Manufacturing Enterprises, Inc. Multiplexing Imaging System for Area Coverage and Point Targets
JP5347890B2 (ja) * 2009-10-09 2013-11-20 ソニー株式会社 画像処理装置および方法、並びにプログラム
JP5647878B2 (ja) * 2010-05-31 2015-01-07 東北電力株式会社 鋼管内部腐食解析装置及び鋼管内部腐食解析方法
US8818131B2 (en) * 2010-08-20 2014-08-26 Adobe Systems Incorporated Methods and apparatus for facial feature replacement
JP5510238B2 (ja) * 2010-09-22 2014-06-04 ソニー株式会社 画像処理装置、撮像装置、および画像処理方法、並びにプログラム
US8861890B2 (en) 2010-11-24 2014-10-14 Douglas Alan Lefler System and method for assembling and displaying individual images as a continuous image
US8957944B2 (en) 2011-05-17 2015-02-17 Apple Inc. Positional sensor-assisted motion filtering for panoramic photography
US9762794B2 (en) 2011-05-17 2017-09-12 Apple Inc. Positional sensor-assisted perspective correction for panoramic photography
US8600194B2 (en) * 2011-05-17 2013-12-03 Apple Inc. Positional sensor-assisted image registration for panoramic photography
US9088714B2 (en) 2011-05-17 2015-07-21 Apple Inc. Intelligent image blending for panoramic photography
US9247133B2 (en) 2011-06-01 2016-01-26 Apple Inc. Image registration using sliding registration windows
KR20130001541A (ko) * 2011-06-27 2013-01-04 삼성전자주식회사 다시점 영상의 해상도 복원 방법 및 장치
WO2013016825A1 (en) 2011-08-02 2013-02-07 Viewsiq Inc. Apparatus and method for digital microscopy imaging
EP2555156B1 (de) 2011-08-05 2015-05-06 ST-Ericsson SA Bildmosaikbildung
US8923392B2 (en) 2011-09-09 2014-12-30 Adobe Systems Incorporated Methods and apparatus for face fitting and editing applications
US9098922B2 (en) 2012-06-06 2015-08-04 Apple Inc. Adaptive image blending operations
US10306140B2 (en) 2012-06-06 2019-05-28 Apple Inc. Motion adaptive image slice selection
US8902335B2 (en) 2012-06-06 2014-12-02 Apple Inc. Image blending operations
FR2995484B1 (fr) * 2012-09-13 2014-10-03 Centre Nat Etd Spatiales Dispositif optique de prise de vue et procede de prise de vue
US9036002B2 (en) * 2012-10-30 2015-05-19 Eastman Kodak Company System for making a panoramic image
FR2998400B1 (fr) * 2012-11-21 2016-01-15 Thales Sa Procede de reconstruction 3d et de mosaiquage 3d panoramique d'une scene
US9305371B2 (en) 2013-03-14 2016-04-05 Uber Technologies, Inc. Translated view navigation for visualizations
US9712746B2 (en) 2013-03-14 2017-07-18 Microsoft Technology Licensing, Llc Image capture and ordering
US9398215B2 (en) * 2013-04-16 2016-07-19 Eth Zurich Stereoscopic panoramas
US9832378B2 (en) 2013-06-06 2017-11-28 Apple Inc. Exposure mapping and dynamic thresholding for blending of multiple images using floating exposure
KR101797042B1 (ko) * 2015-05-15 2017-11-13 삼성전자주식회사 의료 영상 합성 방법 및 장치
JP6543517B2 (ja) * 2015-06-15 2019-07-10 ハンファテクウィン株式会社 画像処理方法、画像処理装置及びプログラム
US9892488B1 (en) * 2015-08-28 2018-02-13 Amazon Technologies, Inc. Multi-camera frame stitching
US10257501B2 (en) * 2016-04-06 2019-04-09 Facebook, Inc. Efficient canvas view generation from intermediate views
EP3306937A1 (de) 2016-10-05 2018-04-11 Thomson Licensing Verfahren und vorrichtung zur codierung und decodierung eines videos
US10419669B2 (en) 2017-01-17 2019-09-17 Disney Enterprises, Inc. Omnistereoscopic panoramic video
CN113012194B (zh) * 2020-12-25 2024-04-09 深圳市铂岩科技有限公司 目标追踪方法、装置、介质和设备
AU2022286641A1 (en) * 2021-06-01 2023-11-30 Squaremind Method for constructing an image from an optical device with variable focal length

Family Cites Families (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5130794A (en) * 1990-03-29 1992-07-14 Ritchey Kurtis J Panoramic display system
TW221312B (de) * 1991-06-27 1994-02-21 Eastman Kodak Co
US5481479A (en) 1992-12-10 1996-01-02 Loral Fairchild Corp. Nonlinear scanning to optimize sector scan electro-optic reconnaissance system performance
US5649032A (en) * 1994-11-14 1997-07-15 David Sarnoff Research Center, Inc. System for automatically aligning images to form a mosaic image
JP3569992B2 (ja) * 1995-02-17 2004-09-29 株式会社日立製作所 移動体検出・抽出装置、移動体検出・抽出方法及び移動体監視システム
US5768447A (en) * 1996-06-14 1998-06-16 David Sarnoff Research Center, Inc. Method for indexing image information using a reference model
US5936615A (en) * 1996-09-12 1999-08-10 Digital Equipment Corporation Image-based touchscreen
ATE280978T1 (de) * 1997-01-30 2004-11-15 Yissum Res Dev Co Mosaikbildverarbeitungssystem
US6078701A (en) * 1997-08-01 2000-06-20 Sarnoff Corporation Method and apparatus for performing local to global multiframe alignment to construct mosaic images
US5956026A (en) * 1997-12-19 1999-09-21 Sharp Laboratories Of America, Inc. Method for hierarchical summarization and browsing of digital video

Also Published As

Publication number Publication date
US20030076406A1 (en) 2003-04-24
US6532036B1 (en) 2003-03-11
WO1998034195A1 (en) 1998-08-06
ATE280978T1 (de) 2004-11-15
EP0954828A1 (de) 1999-11-10
IL131056A0 (en) 2001-01-28
EP0954828B1 (de) 2004-10-27
JP4007619B2 (ja) 2007-11-14
IL131056A (en) 2003-07-06
AU5573698A (en) 1998-08-25
JP2001510585A (ja) 2001-07-31
US7006124B2 (en) 2006-02-28
DE69827232D1 (de) 2004-12-02

Similar Documents

Publication Publication Date Title
DE69827232T2 (de) Mosaikbildverarbeitungssystem
DE69735488T2 (de) Verfahren und vorrichtung zum ausrichten von bildern
EP1354292B1 (de) Verfahren und Vorrichtung zum Erzeugen hochauflösender Bilder
DE19782037C2 (de) Verfahren und Einrichtung zur Erzeugung eines zusammengesetzten Bildes
Peleg et al. Panoramic mosaics by manifold projection
DE112011103011T5 (de) Stereoskopische (3D) Panoramaerstellung auf tragbaren Geräten
US7006709B2 (en) System and method deghosting mosaics using multiperspective plane sweep
DE69722378T2 (de) Verfahren und vorrichtung zur bearbeitung eines dreidimensionalen bildes mit hilfe der parallaxgeometrie von punktpaaren
US7092016B2 (en) Method and system for motion image digital processing
DE102004049676A1 (de) Verfahren zur rechnergestützten Bewegungsschätzung in einer Vielzahl von zeitlich aufeinander folgenden digitalen Bildern, Anordnung zur rechnergestützten Bewegungsschätzung, Computerprogramm-Element und computerlesbares Speichermedium
DE112013000762T5 (de) Bildverarbeitungsvorrichtung und Bildverarbeitungsverfahren
DE19746910A1 (de) Übertragung von Texturen fotografischer Bilder auf CAD-Ebenen
WO2011103865A2 (de) Verfahren und autostereoskopische anzeige zur erzeugung von dreidimensionalen bildern
DE19825303A1 (de) System für virtuelle Szenen mit mehreren Kameras unter Verwendung von Standbildspeicherrahmenpuffern für jede Kamera
Keller et al. Video super-resolution using simultaneous motion and intensity calculations
EP1177690B1 (de) Verfahren und anordnungen zur rechnergestützten bewegungskompensation eines digitalisierten bildes sowie computerprogramm-erzeugnisse und computerlesbare speichermedien
Weibel et al. Contrast-enhancing seam detection and blending using graph cuts
CN117173012A (zh) 无监督的多视角图像生成方法、装置、设备及存储介质
DE102019104397B4 (de) Bildsynthesevorrichtung und Steuerverfahren
US20060120615A1 (en) Frame compensation for moving imaging devices
Gao et al. FAST: Flow-assisted shearlet transform for densely-sampled light field reconstruction
Lee et al. Techniques for flexible image/video resolution conversion with heterogeneous terminals
DE102016209662A1 (de) Verfahren und Vorrichtung zum Bestimmen eines Übergangs zwischen zwei Anzeigebildern, und Fahrzeug
Yamada et al. High-quality stereo panorama generation using a three-camera system
EP1177526B1 (de) Verfahren und anordnung zur ermittlung einer bewegung, der ein digitalisiertes bild unterliegt, sowie computerprogramm-erzeugnis und computerlesbares speichermedium

Legal Events

Date Code Title Description
8364 No opposition during term of opposition