WO2019073925A1 - 画像生成装置および画像生成方法 - Google Patents

画像生成装置および画像生成方法 Download PDF

Info

Publication number
WO2019073925A1
WO2019073925A1 PCT/JP2018/037367 JP2018037367W WO2019073925A1 WO 2019073925 A1 WO2019073925 A1 WO 2019073925A1 JP 2018037367 W JP2018037367 W JP 2018037367W WO 2019073925 A1 WO2019073925 A1 WO 2019073925A1
Authority
WO
WIPO (PCT)
Prior art keywords
image
unit
computer graphics
augmented reality
post
Prior art date
Application number
PCT/JP2018/037367
Other languages
English (en)
French (fr)
Inventor
良徳 大橋
Original Assignee
株式会社ソニー・インタラクティブエンタテインメント
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 株式会社ソニー・インタラクティブエンタテインメント filed Critical 株式会社ソニー・インタラクティブエンタテインメント
Priority to US16/652,101 priority Critical patent/US11100716B2/en
Publication of WO2019073925A1 publication Critical patent/WO2019073925A1/ja

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T15/003D [Three Dimensional] image rendering
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T15/003D [Three Dimensional] image rendering
    • G06T15/10Geometric effects
    • G06T15/20Perspective computation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T19/00Manipulating 3D models or images for computer graphics
    • G06T19/006Mixed reality
    • GPHYSICS
    • G09EDUCATION; CRYPTOGRAPHY; DISPLAY; ADVERTISING; SEALS
    • G09GARRANGEMENTS OR CIRCUITS FOR CONTROL OF INDICATING DEVICES USING STATIC MEANS TO PRESENT VARIABLE INFORMATION
    • G09G5/00Control arrangements or circuits for visual indicators common to cathode-ray tube indicators and other visual indicators
    • GPHYSICS
    • G09EDUCATION; CRYPTOGRAPHY; DISPLAY; ADVERTISING; SEALS
    • G09GARRANGEMENTS OR CIRCUITS FOR CONTROL OF INDICATING DEVICES USING STATIC MEANS TO PRESENT VARIABLE INFORMATION
    • G09G5/00Control arrangements or circuits for visual indicators common to cathode-ray tube indicators and other visual indicators
    • G09G5/36Control arrangements or circuits for visual indicators common to cathode-ray tube indicators and other visual indicators characterised by the display of a graphic pattern, e.g. using an all-points-addressable [APA] memory
    • G09G5/39Control of the bit-mapped memory
    • G09G5/391Resolution modifying circuits, e.g. variable screen formats

Definitions

  • the present invention relates to an apparatus and method for generating an image.
  • a head mounted display connected to a game machine is mounted on a head, and while watching a screen displayed on the head mounted display, game play is performed by operating a controller or the like.
  • the head mounted display is attached, the user can not see anything other than the image displayed on the head mounted display, so the sense of immersion in the image world is enhanced, and the effect of further enhancing the entertainment of the game can be obtained.
  • a virtual image of virtual reality VR (Virtual Reality)
  • VR Virtual Reality
  • a user wearing a non-transmissive head mounted display can not directly view the outside world, but a camera mounted on the head mounted display can capture an image of the outside world and display it on a display panel.
  • a video see-through type head mounted display There is also a video see-through type head mounted display.
  • augmented reality is realized by superimposing virtual world objects generated by computer graphics (CG (Computer Graphics)) on external images captured by a camera. Images can also be generated and displayed.
  • CG Computer Graphics
  • the image of augmented reality is an extension of the real world with virtual objects, and the user experiences the virtual world while being aware of the connection with the real world Can.
  • the camera mounted on the head mounted display is superimposed while the external image is captured at a high frame rate in conjunction with the movement of the head of the user
  • the virtual world takes longer to render, so the frame rate of the virtual world is lower than that of the camera. Therefore, the augmented reality image can not be generated according to the high frame rate of the camera, and the user feels a slight delay in the augmented reality image and loses a sense of connection with the real world.
  • the frequency of post-processing applied to the image of augmented reality is also performed at the frequency of rendering, so the quality of the image is degraded.
  • the present invention has been made in view of these problems, and an object thereof is to provide an image generation apparatus and an image generation method capable of improving the visual quality of computer graphics.
  • an image generating apparatus includes a rendering unit that renders an object in virtual space to generate a computer graphics image, and a post-processing unit that performs post-processing on computer graphics images. And.
  • the post-processing unit post-processes the computer graphics image at a frequency higher than a frame rate at which the rendering unit generates the computer graphics image.
  • This apparatus comprises: a rendering unit that renders an object in a virtual space to generate a computer graphics image; a superimposition unit that superimposes the computer graphics image on a photographed image in real space to generate an augmented reality image; And a post-processing unit for post-processing the real image.
  • the superimposing unit superimposes the plurality of photographed images provided at a frame rate higher than a frame rate of the computer graphics image generated by the rendering unit on the same computer graphics image to generate the augmented reality image
  • Yet another aspect of the present invention is an image generation method.
  • the method comprises the steps of rendering an object in a virtual space to generate a computer graphics image, superimposing the computer graphics image on a photographed image in real space to generate an augmented reality image, and the expansion. And post-processing steps for post-processing the real image.
  • the superimposing step superimposes the plurality of photographed images provided at a frame rate higher than a frame rate of the computer graphics image generated by the rendering unit on the same computer graphics image to generate the augmented reality image.
  • the visual quality of computer graphics can be improved.
  • FIG. 1 is a configuration diagram of an image generation system according to the present embodiment. It is a function block diagram of a head mounted display. It is a functional block diagram of the image generation apparatus concerning this Embodiment. It is a figure explaining the composition of the image generation system used as a premise for superimposing a CG image on a camera image, and generating an augmented reality image. It is a figure explaining the production
  • FIG. 1 is an external view of a head mounted display 100.
  • the head mounted display 100 is a display device mounted on the head of the user for viewing still images, moving images, and the like displayed on the display and listening to sounds, music, and the like output from headphones.
  • a camera unit is mounted on the head mounted display 100, and while the user is wearing the head mounted display 100, the outside world can be photographed.
  • the head mounted display 100 is an example of a “wearable display”.
  • a method of generating an image displayed on the head mounted display 100 will be described.
  • the method of generating an image according to the present embodiment is not limited to the head mounted display 100 in a narrow sense, but a glasses, glasses type display, glasses type camera, It can also be applied when wearing headphones, headsets (headphones with microphones), earphones, earrings, earpiece cameras, hats, camera hats, hair bands etc.
  • FIG. 2 is a block diagram of an image generation system according to the present embodiment.
  • the head mounted display 100 is connected to the image generation apparatus 200 by an interface 300 such as HDMI (High-Definition Multimedia Interface), which is a standard of a communication interface that transmits video and audio as digital signals, as an example. .
  • HDMI High-Definition Multimedia Interface
  • the image generation apparatus 200 predicts the position / attitude information of the head mounted display 100 from the current position / attitude information of the head mounted display 100 in consideration of the delay from the generation of an image to the display, and predicts the head mounted display 100 An image to be displayed on the head mounted display 100 is drawn on the premise of the position / posture information and transmitted to the head mounted display 100.
  • An example of the image generation device 200 is a game machine.
  • the image generation device 200 may be further connected to a server via a network.
  • the server may provide the image generation apparatus 200 with an online application such as a game in which a plurality of users can participate via the network.
  • the head mounted display 100 may be connected to a computer or a portable terminal instead of the image generation device 200.
  • FIG. 3 is a functional block diagram of the head mounted display 100. As shown in FIG.
  • the control unit 10 is a main processor that processes and outputs signals such as image signals and sensor signals, and instructions and data.
  • the input interface 20 receives an operation signal and a setting signal from the user and supplies the control unit 10 with the operation signal and the setting signal.
  • the output interface 30 receives an image signal from the control unit 10 and displays it on the display panel 32.
  • the communication control unit 40 transmits data input from the control unit 10 to the outside through wired or wireless communication via the network adapter 42 or the antenna 44.
  • the communication control unit 40 also receives data from the outside by wired or wireless communication via the network adapter 42 or the antenna 44, and outputs the data to the control unit 10.
  • the storage unit 50 temporarily stores data to be processed by the control unit 10, parameters, operation signals and the like.
  • the attitude sensor 64 detects position information of the head mounted display 100 and attitude information such as a rotation angle or tilt of the head mounted display 100.
  • the attitude sensor 64 is realized by appropriately combining a gyro sensor, an acceleration sensor, an angular acceleration sensor, and the like.
  • a motion sensor combining at least one or more of a three-axis geomagnetic sensor, a three-axis acceleration sensor, and a three-axis gyro (angular velocity) sensor may be used to detect front / rear, left / right, up / down motion of the user's head.
  • the external input / output terminal interface 70 is an interface for connecting peripheral devices such as a USB (Universal Serial Bus) controller.
  • the external memory 72 is an external memory such as a flash memory.
  • the camera unit 80 includes components necessary for photographing such as a lens, an image sensor, and a distance measuring sensor, and supplies the photographed image of the outside world and depth information to the control unit 10.
  • the control unit 10 controls focusing and zooming of the camera unit 80.
  • the HDMI transmitting and receiving unit 90 transmits and receives digital signals of video and audio to and from the image generating apparatus 200 according to the HDMI.
  • the HDMI transmitting and receiving unit 90 receives external images and depth information captured by the camera unit 80 from the control unit 10, and transmits the image to the image generation apparatus 200 through the HDMI transmission path.
  • the HDMI transmitting and receiving unit 90 receives an image generated by the image generating apparatus 200 from the image generating apparatus 200 through the HDMI transmission path, and supplies the image to the control unit 10.
  • the control unit 10 can supply an image or text data to the output interface 30 for display on the display panel 32, or can supply the image or text data to the communication control unit 40 to be transmitted to the outside.
  • the current position / attitude information of the head mounted display 100 detected by the attitude sensor 64 is notified to the image generation apparatus 200 via the communication control unit 40 or the external input / output terminal interface 70.
  • the HDMI transmitting / receiving unit 90 may transmit the current position / attitude information of the head mounted display 100 to the image generating apparatus 200.
  • FIG. 4 is a functional configuration diagram of the image generation apparatus 200 according to the present embodiment.
  • the figure depicts a block diagram focusing on functions, and these functional blocks can be realized in various forms by hardware only, software only, or a combination thereof.
  • At least a part of the functions of the image generation device 200 may be implemented on the head mounted display 100. Alternatively, at least a part of the functions of the image generation device 200 may be implemented on a server connected to the image generation device 200 via a network.
  • the position and orientation acquisition unit 210 acquires current position and orientation information of the head mounted display 100 from the head mounted display 100.
  • the viewpoint and line of sight setting unit 220 sets the viewpoint position and the line of sight direction of the user using the position and orientation information of the head mounted display 100 acquired by the position and orientation acquiring unit 210.
  • the HDMI transmitting and receiving unit 280 receives an image of the real space captured by the camera unit 80 from the head mounted display 100, and supplies the image to the image signal processing unit 250.
  • the image signal processing unit 250 performs image signal processing such as RGB conversion (demosaicing), white balance, color correction, noise reduction, and the like on the Raw image captured by the camera unit 80 of the head mounted display 100 (ISP (Image Signal Processing) ), And a distortion correction process is performed to remove distortion and the like due to the optical system of the camera unit 80.
  • the image signal processing unit 250 supplies the RGB image subjected to the image signal processing and the distortion correction processing to the image generation unit 230.
  • the image generation unit 230 reads out data necessary for generating computer graphics from the image storage unit 260, renders an object in the virtual space to generate a CG image, and a camera in real space provided by the image signal processing unit 250 By superimposing on an image, an augmented reality image is generated and output to the image storage unit 260.
  • the image generation unit 230 includes a rendering unit 232, an AR superposition unit 234, a post processing unit 236, a reverse reprojection unit 238, a reprojection unit 240, and a distortion processing unit 242.
  • the rendering unit 232 renders an object in a virtual space viewed from the viewpoint position of the user wearing the head mounted display 100 according to the viewpoint position and the line of sight of the user set by the viewpoint / line of sight setting unit 220. It is supplied to the superimposing unit 234.
  • the AR superimposing unit 234 generates an augmented reality image by superimposing the CG image generated by the rendering unit 232 on the camera image supplied from the image signal processing unit 250, and supplies the augmented reality image to the post processing unit 236.
  • the post processing unit 236 performs post processing such as depth of field adjustment, tone mapping, and anti-aliasing on the augmented reality image, and the augmented reality image in which the virtual object is superimposed on the image in real space is smooth and natural Post-process to make it visible.
  • the reprojection unit 240 receives the latest position / attitude information of the head mounted display 100 from the position / attitude acquiring unit 210, performs reprojection processing on the post-processed augmented reality image, and Convert to the image seen from the latest viewpoint position and gaze direction.
  • the movement of the head mounted display 100 is detected, the CPU issues a drawing command, the GPU (Graphics Processing Unit) executes rendering, and the drawn image is output to the head mounted display 100.
  • draw is performed at a frame rate of, for example, 60 fps (frames / second), and there is a delay of one frame from detection of movement of the head mounted display 100 to output of an image. This is about 16.67 ms at a frame rate of 60 fps, which is a sufficient time for a human to detect a shift.
  • time warp or “reprojection” is performed to correct the rendered image in accordance with the latest position and posture of the head mounted display 100 so that it is difficult for a human to detect a deviation.
  • the distortion processing unit 242 performs processing to distort and distort the image according to distortion generated in the optical system of the head mount display 100 with respect to the augmented reality image subjected to the reprojection processing, and the image storage unit 260
  • the distortion processing unit 242 performs processing to distort and distort the image according to distortion generated in the optical system of the head mount display 100 with respect to the augmented reality image subjected to the reprojection processing, and the image storage unit 260
  • the HDMI transmitting and receiving unit 280 reads the frame data of the augmented reality image generated by the image generating unit 230 from the image storage unit 260, and transmits the frame data to the head mounted display 100 according to the HDMI.
  • the CG image of the viewpoint position and gaze direction corresponds to the past CG image It is necessary to perform reverse reprojection processing on the camera image in order to conform to the above.
  • the reverse reprojection unit 238 performs reverse reprojection processing to restore the camera image supplied from the image signal processing unit 250 to an image viewed from the past viewpoint position and line of sight direction, and supplies the result to the AR superimposing unit 234.
  • the AR superimposing unit 234 generates an augmented reality image by superimposing the CG image of the past viewpoint position and line of sight direction generated by the rendering unit 232 on the back-reprojected camera image, and provides the post-processing unit 236 with the augmented reality image.
  • FIG. 5 is a diagram for explaining the configuration of an image generation system as a premise for generating an augmented reality image by superimposing a CG image on a camera image.
  • FIG. 5 main configurations of the head mounted display 100 and the image generation apparatus 200 for generating an augmented reality image are illustrated and described.
  • An external camera image captured by the camera unit 80 of the head mounted display 100 is transmitted to the image generation apparatus 200 and supplied to the image signal processing unit 250.
  • the image signal processing unit 250 performs image signal processing and distortion correction processing on the camera image, and supplies it to the AR superimposing unit 234.
  • the rendering unit 232 of the image generation device 200 generates a virtual object viewed from the viewpoint position / line of sight of the user wearing the head mounted display 100 and supplies the virtual object to the AR superimposing unit 234.
  • the AR superimposing unit 234 superimposes a CG image on a camera image to generate an augmented reality image.
  • the post processing unit 236 performs post processing on the augmented reality image.
  • the reprojection unit 240 transforms the post-processed augmented reality image so as to fit the latest viewpoint position and gaze direction.
  • the distortion processing unit 242 performs distortion processing on the augmented reality image after reprojection.
  • the final RGB image after distortion processing is transmitted to the head mounted display 100 and displayed on the display panel 32.
  • FIG. 6 is a diagram for explaining a generation procedure of an augmented reality image by the image generation system of FIG.
  • the camera unit 80 of the head mounted display 100 captures the outside world and outputs a Raw image (S10).
  • the image signal processing unit 250 performs image signal processing and distortion correction processing on the Raw image taken by the camera unit 80, and generates a camera image to be used for Simultaneous Localization and Mapping (SLAM) (S12).
  • the IMU data indicating the current attitude information of the head mounted display 100 is acquired from an inertial measurement unit (IMU (Inertial Measurement Unit)) such as the attitude sensor 64 of the head mounted display 100 (S14).
  • IMU Inertial Measurement Unit
  • SLAM processing that simultaneously performs self-position estimation and environmental map creation is executed, and the posture of the user wearing the head mounted display 100 is estimated (S16).
  • the rendering unit 232 renders an object in the virtual space and generates a CG image (S20).
  • the image signal processing unit 250 performs image signal processing and distortion correction processing on the Raw image captured by the camera unit 80, and generates a camera image for providing a see-through image to the head mounted display 100 (S22).
  • the AR superimposing unit 234 generates an augmented reality image by superimposing the CG image on the camera image (S24).
  • the post processing unit 236 performs post processing on the augmented reality image (S26).
  • post-processing is processing for the entire image, and therefore can be performed in a shorter time than rendering, regardless of the number of virtual objects.
  • IMU data indicating the latest attitude information of the head mounted display 100 is acquired from the inertial measurement unit (S28).
  • the reprojection unit 240 converts the augmented reality image according to the latest attitude information of the head mounted display 100 (S30).
  • the distortion processing unit 242 subjects the augmented reality image after reprojection to lens distortion processing, and outputs the augmented reality image subjected to lens distortion processing (S32).
  • the camera image is superimposed in accordance with the frame rate of rendering. Since rendering takes time, the frame rate of rendering of the virtual space by the rendering unit 232 is slower than the frame rate of imaging of the real space by the camera unit 80. For example, even if shooting at 120 fps is performed by the camera unit 80, rendering may be possible only at 60 fps. As a result, the frame rate of the see-through image displayed on the display panel of the head mounted display 100 decreases in accordance with the frame rate of rendering, and the see-through image becomes jerky and results of not seeing reality even when viewing augmented reality images It becomes.
  • FIG. 7 is a diagram for explaining the configuration of an image generation system according to the present embodiment for generating an augmented reality image by superimposing a CG image on a camera image. Description overlapping with the explanation of the premise technology in FIG. 5 is omitted as appropriate, and a configuration improved from the premise technology will be described.
  • the reverse reprojection unit 238 performs image signal processing and distortion correction by the image signal processing unit 250 in order to superimpose the camera image by the camera unit 80 multiple times on the CG image which is one rendering result by the rendering unit 232.
  • a reverse reprojection process is performed on the processed camera image to convert it into an image viewed from the viewpoint position and the line of sight direction of the head mounted display 100 in the past, and is supplied to the AR superimposing unit 234.
  • the AR superimposing unit 234 synthesizes the camera image supplied from the image signal processing unit 250 for the first time to the CG image of the rendering result of one time by the rendering unit 232, but for the second and subsequent times, the same CG image
  • the reverse reprojection unit 238 synthesizes the reverse reprojected camera image.
  • the post-processing unit 236 performs post-processing on the augmented reality image synthesized by the AR superimposing unit 234 in any case.
  • the subsequent processing is the same as the base technology of FIG.
  • the first and second and subsequent times may be distinguished from each other, and the first re-projection portion 238 may be configured to combine a camera image reversely re-projected with the CG image of the rendering result.
  • FIG. 8 is a diagram for explaining a generation procedure of an augmented reality image by the image generation system of FIG. 7.
  • the camera unit 80 of the head mounted display 100 captures the outside world, and outputs the (n-1) -th Raw image (S40).
  • the image signal processing unit 250 performs image signal processing and distortion correction processing on the (n ⁇ 1) th Raw image captured by the camera unit 80, and generates a camera image to be used for SLAM (S42).
  • IMU data indicating current attitude information of the head mounted display 100 is acquired from the inertial measurement unit (S44).
  • SLAM processing is executed using the camera image and the IMU data, and the posture of the user wearing the head mounted display 100 is estimated (S46).
  • the rendering unit 232 renders an object in the virtual space and generates an (n-1) th CG image (S50).
  • the image signal processing unit 250 performs image signal processing and distortion correction processing on the (n ⁇ 1) th Raw image captured by the camera unit 80 and provides a see-through image to the head mounted display 100 (n ⁇ 1 ) Generates the second camera image (S52).
  • the AR superimposing unit 234 generates the (n-1) th augmented reality image by superimposing the (n-1) th CG image on the (n-1) th camera image (S54).
  • the post processing unit 236 performs post processing on the (n-1) th augmented reality image (S56).
  • IMU data indicating the latest attitude information of the head mounted display 100 is acquired from the inertial measurement unit (S58).
  • the reprojection unit 240 predicts the viewpoint position and line of sight two frames ahead on the basis of the latest attitude information of the head mounted display 100, and the (n-1) th augmented reality image is the (n + 1) th augmented reality image Converted to (S60). In order to delay by two frames by rendering, reprojection is performed by predicting two frames ahead.
  • the distortion processing unit 242 applies lens distortion processing to the (n + 1) th augmented reality image after reprojection, and outputs (n + 1) th augmented reality image subjected to lens distortion processing at the (n + 1) th Vsync timing. (S62).
  • the camera unit 80 of the head mounted display 100 shoots the outside world, and outputs the n-th Raw image (S70).
  • the image signal processing unit 250 performs image signal processing and distortion correction processing on the nth Raw image captured by the camera unit 80, and generates an nth camera image for providing a see-through image to the head mounted display 100. (S72).
  • IMU data indicating the latest attitude information of the head mounted display 100 is acquired from the inertial measurement unit (S74).
  • the reverse reprojection unit 238 converts the n-th camera image into an (n-1) -th camera image viewed from the viewpoint position and line-of-sight direction one frame before based on the latest IMU data (S76).
  • the AR superimposing unit 234 superimposes the (n-1) th CG image rendered in step S50 on the (n-1) th camera image subjected to reverse reprojection by superposing the (n-1) th expansion.
  • a real image is generated (S78).
  • the post processing unit 236 performs post processing on the (n-1) th augmented reality image (S80).
  • IMU data indicating the latest attitude information of the head mounted display 100 is acquired from the inertial measurement unit (S82).
  • the reprojection unit 240 predicts the viewpoint position and the line of sight three frames ahead on the basis of the latest attitude information of the head mounted display 100, and the (n-1) th augmented reality image is the (n + 2) th augmented reality image Converted to (S84). It should be noted that, since the camera image is returned to the previous frame by the reverse reprojection process, the reprojection process of step S84 is advanced by 3 frames.
  • the distortion processing unit 242 applies lens distortion processing to the (n + 2) th augmented reality image after reprojection, and outputs (n + 2) th camera image subjected to lens distortion processing at the timing of (n + 2) th Vsync. (S86).
  • the (n-1) th CG image is generated, the (n-1) th CG image is superimposed on the (n-1) th camera image and the nth camera image, and post processing is performed Applied.
  • post processing is performed twice as often as the camera frame rate, so a smooth image is generated.
  • two camera images are superimposed on the same CG image in one rendering and post processing is performed, but if rendering takes more time, one rendering is performed
  • a plurality of camera images may be superimposed on the CG image according to and may be subjected to a plurality of post processes.
  • Reverse reprojection is performed to match the time stamp of the 3D graphics viewpoint with the time stamp of the camera image used during post processing, and in order to calculate the difference in posture applied in reverse reprojection, Use IMU data acquired between two timestamps.
  • the IMU data is constantly acquired from the inertial measurement unit, and the attitude can be predicted using all the IMU data of the section necessary for reprojection.
  • the acquisition cycle of IMU data is 1 millisecond or less, which is shorter than the Vsync interval. In the section where the IMU data is insufficient, the prediction time may be linearly interpolated.
  • a plurality of camera images are superimposed on a CG image of one rendering result, and post processing is performed a plurality of times, so that an apparent frame rate is apparent. Can go up to the frame rate of the camera image and produce a smooth and natural augmented reality image.
  • the augmented reality image obtained by superimposing a CG image on a camera image is post-processed at a frequency higher than the frequency of rendering to generate a smooth augmented reality image.
  • tracking of the display but also when the angle of the virtual camera generally used for rendering is changing, it is effective even if it applies.
  • the apparent quality can be improved by anti-aliasing or noise reduction.
  • multi-layer rendering may be post-processed more frequently than the rendering frequency. For example, objects in close range with high motion are rendered at high frame rate, objects in long distance and relatively low motion are rendered at low frame rate, both are combined and post-processed. Increasing the frequency of post processing can improve the apparent quality.
  • SYMBOLS 10 control part 20 input interface, 30 output interface, 32 display panel, 40 communication control part, 42 network adapter, 44 antenna, 50 storage part, 64 attitude sensor, 70 external input / output terminal interface, 72 external memory, 80 camera unit 100 head mounted display, 200 image generation device, 210 position and orientation acquisition unit, 220 viewpoint and line of sight setting unit, 230 image generation unit, 232 rendering unit, 234 AR superposition unit, 236 post processing unit, 238 reverse reprojection unit, 240 reprojection unit, 242 distortion processing unit, 250 image signal processing unit, 260 image storage unit, 280 HDMI transceiver unit, 300 interface.
  • the invention can be applied to the field of image generation.

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Computer Graphics (AREA)
  • Computer Hardware Design (AREA)
  • General Engineering & Computer Science (AREA)
  • Software Systems (AREA)
  • Computing Systems (AREA)
  • Geometry (AREA)
  • Processing Or Creating Images (AREA)
  • Controls And Circuits For Display Device (AREA)
  • Image Generation (AREA)

Abstract

レンダリング部232は、仮想空間のオブジェクトをレンダリングしてコンピュータグラフィックス画像を生成する。AR重畳部234は、現実空間の撮影画像にコンピュータグラフィックス画像を重畳して拡張現実画像を生成する。ポストプロセス部236は、拡張現実画像にポストプロセスを施す。AR重畳部234は、レンダリング部232により生成されるコンピュータグラフィックス画像のフレームレートよりも高いフレームレートで提供される複数枚の撮影画像を同一のコンピュータグラフィックス画像に重畳して拡張現実画像を生成する。

Description

画像生成装置および画像生成方法
 この発明は、画像を生成する装置および方法に関する。
 ゲーム機に接続されたヘッドマウントディスプレイを頭部に装着して、ヘッドマウントディスプレイに表示された画面を見ながら、コントローラなどを操作してゲームプレイすることが行われている。ヘッドマウントディスプレイを装着すると、ヘッドマウントディスプレイに表示される映像以外はユーザは見ないため、映像世界への没入感が高まり、ゲームのエンタテインメント性を一層高める効果がある。また、ヘッドマウントディスプレイに仮想現実(VR(Virtual Reality))の映像を表示させ、ヘッドマウントディスプレイを装着したユーザが頭部を回転させると、360度見渡せる全周囲の仮想空間が表示されるようにすると、さらに映像への没入感が高まり、ゲームなどのアプリケーションの操作性も向上する。
 また、非透過型ヘッドマウントディスプレイを装着したユーザは外界を直接見ることができなくなるが、ヘッドマウントディスプレイに搭載されたカメラによって外界の映像を撮影してディスプレイパネルに表示することのできるビデオ透過(ビデオシースルー)型ヘッドマウントディスプレイもある。ビデオ透過型ヘッドマウントディスプレイでは、カメラで撮影される外界の映像にコンピュータグラフィックス(CG(Computer Graphics))によって生成された仮想世界のオブジェクトを重畳させることで拡張現実(AR(Augmented Reality))の映像を生成して表示することもできる。拡張現実の映像は、現実世界から切り離された仮想現実とは違って、現実世界が仮想オブジェクトで拡張されたものであり、ユーザは現実世界とのつながりを意識しつつ、仮想世界を体験することができる。
 拡張現実の映像をヘッドマウントディスプレイに表示する場合、ヘッドマウントディスプレイに搭載されたカメラではユーザの頭部の動きに連動して高フレームレートで外界の映像が取り込まれるのに対して、重畳される仮想世界はレンダリングに時間がかかるため、仮想世界のフレームレートはカメラに比べると低い。そのため、カメラの高フレームレートに合わせて拡張現実の映像を生成することができず、ユーザは拡張現実の映像に微妙な遅れを感じ、現実世界とのつながり感を失うことになる。また、拡張現実の映像に施すポストプロセスの頻度もレンダリングの頻度で行われるため映像の品質が低下する。
 本発明はこうした課題に鑑みてなされたものであり、その目的は、コンピュータグラフィックスの見た目の品質を向上させることのできる画像生成装置および画像生成方法を提供することにある。
 上記課題を解決するために、本発明のある態様の画像生成装置は、仮想空間のオブジェクトをレンダリングしてコンピュータグラフィックス画像を生成するレンダリング部と、コンピュータグラフィックス画像にポストプロセスを施すポストプロセス部とを含む。前記ポストプロセス部は、前記レンダリング部が前記コンピュータグラフィックス画像を生成するフレームレートよりも高い頻度で前記コンピュータグラフィックス画像にポストプロセスを施す。
 本発明の別の態様もまた、画像生成装置である。この装置は、仮想空間のオブジェクトをレンダリングしてコンピュータグラフィックス画像を生成するレンダリング部と、現実空間の撮影画像に前記コンピュータグラフィックス画像を重畳して拡張現実画像を生成する重畳部と、前記拡張現実画像にポストプロセスを施すポストプロセス部とを含む。前記重畳部は、前記レンダリング部により生成されるコンピュータグラフィックス画像のフレームレートよりも高いフレームレートで提供される複数枚の前記撮影画像を同一の前記コンピュータグラフィックス画像に重畳して前記拡張現実画像を生成する。
 本発明のさらに別の態様は、画像生成方法である。この方法は、仮想空間のオブジェクトをレンダリングしてコンピュータグラフィックス画像を生成するレンダリングステップと、現実空間の撮影画像に前記コンピュータグラフィックス画像を重畳して拡張現実画像を生成する重畳ステップと、前記拡張現実画像にポストプロセスを施すポストプロセスステップとを含む。前記重畳ステップは、前記レンダリング部により生成されるコンピュータグラフィックス画像のフレームレートよりも高いフレームレートで提供される複数枚の前記撮影画像を同一の前記コンピュータグラフィックス画像に重畳して前記拡張現実画像を生成する。
 なお、以上の構成要素の任意の組合せ、本発明の表現を方法、装置、システム、コンピュータプログラム、データ構造、記録媒体などの間で変換したものもまた、本発明の態様として有効である。
 本発明によれば、コンピュータグラフィックスの見た目の品質を向上させることができる。
ヘッドマウントディスプレイの外観図である。 本実施の形態に係る画像生成システムの構成図である。 ヘッドマウントディスプレイの機能構成図である。 本実施の形態に係る画像生成装置の機能構成図である。 カメラ画像にCG画像を重畳して拡張現実画像を生成するための前提となる画像生成システムの構成を説明する図である。 図5の画像生成システムによる拡張現実画像の生成手順を説明する図である。 カメラ画像にCG画像を重畳して拡張現実画像を生成するための本実施の形態に係る画像生成システムの構成を説明する図である 図7の画像生成システムによる拡張現実画像の生成手順を説明する図である。
 図1は、ヘッドマウントディスプレイ100の外観図である。ヘッドマウントディスプレイ100は、ユーザの頭部に装着してディスプレイに表示される静止画や動画などを鑑賞し、ヘッドホンから出力される音声や音楽などを聴くための表示装置である。
 ヘッドマウントディスプレイ100に内蔵または外付けされたジャイロセンサや加速度センサなどによりヘッドマウントディスプレイ100を装着したユーザの頭部の位置情報と頭部の回転角や傾きなどの姿勢(orientation)情報を計測することができる。
 ヘッドマウントディスプレイ100にはカメラユニットが搭載されており、ユーザがヘッドマウントディスプレイ100を装着している間、外界を撮影することができる。
 ヘッドマウントディスプレイ100は、「ウェアラブルディスプレイ」の一例である。ここでは、ヘッドマウントディスプレイ100に表示される画像の生成方法を説明するが、本実施の形態の画像生成方法は、狭義のヘッドマウントディスプレイ100に限らず、めがね、めがね型ディスプレイ、めがね型カメラ、ヘッドフォン、ヘッドセット(マイクつきヘッドフォン)、イヤホン、イヤリング、耳かけカメラ、帽子、カメラつき帽子、ヘアバンドなどを装着した場合にも適用することができる。
 図2は、本実施の形態に係る画像生成システムの構成図である。ヘッドマウントディスプレイ100は、一例として、映像・音声をデジタル信号で伝送する通信インタフェースの標準規格であるHDMI(登録商標)(High-Definition Multimedia Interface)などのインタフェース300で画像生成装置200に接続される。
 画像生成装置200は、ヘッドマウントディスプレイ100の現在の位置・姿勢情報から、映像の生成から表示までの遅延を考慮してヘッドマウントディスプレイ100の位置・姿勢情報を予測し、ヘッドマウントディスプレイ100の予測位置・姿勢情報を前提としてヘッドマウントディスプレイ100に表示されるべき画像を描画し、ヘッドマウントディスプレイ100に伝送する。
 画像生成装置200の一例はゲーム機である。画像生成装置200は、さらにネットワークを介してサーバに接続されてもよい。その場合、サーバは、複数のユーザがネットワークを介して参加できるゲームなどのオンラインアプリケーションを画像生成装置200に提供してもよい。ヘッドマウントディスプレイ100は、画像生成装置200の代わりに、コンピュータや携帯端末に接続されてもよい。
 図3は、ヘッドマウントディスプレイ100の機能構成図である。
 制御部10は、画像信号、センサ信号などの信号や、命令やデータを処理して出力するメインプロセッサである。入力インタフェース20は、ユーザからの操作信号や設定信号を受け付け、制御部10に供給する。出力インタフェース30は、制御部10から画像信号を受け取り、ディスプレイパネル32に表示する。
 通信制御部40は、ネットワークアダプタ42またはアンテナ44を介して、有線または無線通信により、制御部10から入力されるデータを外部に送信する。通信制御部40は、また、ネットワークアダプタ42またはアンテナ44を介して、有線または無線通信により、外部からデータを受信し、制御部10に出力する。
 記憶部50は、制御部10が処理するデータやパラメータ、操作信号などを一時的に記憶する。
 姿勢センサ64は、ヘッドマウントディスプレイ100の位置情報と、ヘッドマウントディスプレイ100の回転角や傾きなどの姿勢情報を検出する。姿勢センサ64は、ジャイロセンサ、加速度センサ、角加速度センサなどを適宜組み合わせて実現される。3軸地磁気センサ、3軸加速度センサおよび3軸ジャイロ(角速度)センサの少なくとも1つ以上を組み合わせたモーションセンサを用いて、ユーザの頭部の前後、左右、上下の動きを検出してもよい。
 外部入出力端子インタフェース70は、USB(Universal Serial Bus)コントローラなどの周辺機器を接続するためのインタフェースである。外部メモリ72は、フラッシュメモリなどの外部メモリである。
 カメラユニット80は、レンズ、イメージセンサ、測距センサなど撮影に必要な構成を含み、撮影された外界の映像と奥行き情報を制御部10に供給する。制御部10は、カメラユニット80のフォーカスやズームなどを制御する。
 HDMI送受信部90は、HDMIにしたがって映像・音声のデジタル信号を画像生成装置200との間で送受信する。HDMI送受信部90は、カメラユニット80により撮影された外界の映像と奥行き情報を制御部10から受け取り、HDMI伝送路で画像生成装置200に送信する。HDMI送受信部90は、画像生成装置200により生成された画像をHDMI伝送路で画像生成装置200から受信し、制御部10に供給する。
 制御部10は、画像やテキストデータを出力インタフェース30に供給してディスプレイパネル32に表示させたり、通信制御部40に供給して外部に送信させることができる。
 姿勢センサ64が検出したヘッドマウントディスプレイ100の現在の位置・姿勢情報は、通信制御部40または外部入出力端子インタフェース70を介して画像生成装置200に通知される。あるいは、HDMI送受信部90がヘッドマウントディスプレイ100の現在の位置・姿勢情報を画像生成装置200に送信してもよい。
 図4は、本実施の形態に係る画像生成装置200の機能構成図である。同図は機能に着目したブロック図を描いており、これらの機能ブロックはハードウエアのみ、ソフトウエアのみ、またはそれらの組合せによっていろいろな形で実現することができる。
 画像生成装置200の少なくとも一部の機能をヘッドマウントディスプレイ100に実装してもよい。あるいは、画像生成装置200の少なくとも一部の機能を、ネットワークを介して画像生成装置200に接続されたサーバに実装してもよい。
 位置・姿勢取得部210は、ヘッドマウントディスプレイ100の現在の位置・姿勢情報をヘッドマウントディスプレイ100から取得する。
 視点・視線設定部220は、位置・姿勢取得部210により取得されたヘッドマウントディスプレイ100の位置・姿勢情報を用いて、ユーザの視点位置および視線方向を設定する。
 HDMI送受信部280は、ヘッドマウントディスプレイ100からカメラユニット80により撮影された現実空間の映像を受信し、画像信号処理部250に供給する。
 画像信号処理部250は、ヘッドマウントディスプレイ100のカメラユニット80により撮影されたRaw画像に対してRGB変換(デモザイク処理)、ホワイトバランス、色補正、ノイズリダクションなどの画像信号処理(ISP(Image Signal Processing))を施し、さらにカメラユニット80の光学系による歪みなどを取り除く歪み補正処理を施す。画像信号処理部250は画像信号処理および歪み補正処理が施されたRGB画像を画像生成部230に供給する。
 画像生成部230は、画像記憶部260からコンピュータグラフィックスの生成に必要なデータを読み出し、仮想空間のオブジェクトをレンダリングしてCG画像を生成し、画像信号処理部250から提供される現実空間のカメラ画像に重畳することで拡張現実画像を生成し、画像記憶部260に出力する。
 画像生成部230は、レンダリング部232と、AR重畳部234と、ポストプロセス部236と、逆リプロジェクション部238と、リプロジェクション部240と、歪み処理部242とを含む。
 レンダリング部232は、視点・視線設定部220によって設定されたユーザの視点位置および視線方向にしたがって、ヘッドマウントディスプレイ100を装着したユーザの視点位置から視線方向に見える仮想空間のオブジェクトをレンダリングし、AR重畳部234に与える。
 AR重畳部234は、画像信号処理部250から供給されるカメラ画像にレンダリング部232により生成されたCG画像を重畳することで拡張現実画像を生成し、ポストプロセス部236に与える。
 ポストプロセス部236は、拡張現実画像に対して、被写界深度調整、トーンマッピング、アンチエイリアシングなどのポストプロセスを施し、現実空間の画像に仮想オブジェクトが重畳された拡張現実画像が自然で滑らかに見えるように後処理する。
 リプロジェクション部240は、位置・姿勢取得部210からヘッドマウントディスプレイ100の最新の位置・姿勢情報を受け取り、ポストプロセスが施された拡張現実画像に対してリプロジェクション処理を施し、ヘッドマウントディスプレイ100の最新の視点位置・視線方向から見える画像に変換する。
 ここで、リプロジェクションについて説明する。ヘッドマウントディスプレイ100にヘッドトラッキング機能をもたせて、ユーザの頭部の動きと連動して視点や視線方向を変えて仮想現実の映像を生成した場合、仮想現実の映像の生成から表示までに遅延があるため、映像生成時に前提としたユーザの頭部の向きと、映像をヘッドマウントディスプレイ100に表示した時点でのユーザの頭部の向きとの間でずれが発生し、ユーザは酔ったような感覚(「VR酔い(Virtual Reality Sickness)」などと呼ばれる)に陥ることがある。
 このように、ヘッドマウントディスプレイ100の動きを検知し、CPUが描画コマンドを発行し、GPU(Graphics Processing Unit)がレンダリングを実行し、描画された画像がヘッドマウントディスプレイ100に出力されるまでには時間がかかる。描画がたとえば60fps(フレーム/秒)のフレームレートで行われており、ヘッドマウントディスプレイ100の動きを検知してから画像を出力するまでに1フレーム分の遅れが生じるとする。これはフレームレート60fpsのもとでは、16.67ミリ秒ほどであり、人間がずれを感知するには十分な時間である。
 そこで、「タイムワープ」または「リプロジェクション」と呼ばれる処理を行い、レンダリングした画像をヘッドマウントディスプレイ100の最新の位置と姿勢に合わせて補正することで人間がずれを感知しにくいようにする。
 歪み処理部242は、リプロジェクション処理が施された拡張現実画像に対してヘッドマウントディスプレイ100の光学系で生じる歪みに合わせて画像を変形(distortion)させて歪ませる処理を施し、画像記憶部260に記憶する。
 HDMI送受信部280は、画像記憶部260から画像生成部230により生成された拡張現実画像のフレームデータを読み出し、HDMIにしたがってヘッドマウントディスプレイ100に伝送する。
 過去の時点の視点位置・視線方向を前提としてレンダリングされたCG画像に対してより新しい時点の視点位置・視線方向で撮影されたカメラ画像を重畳する場合、視点位置・視線方向を過去のCG画像に合わせるためにカメラ画像に対して逆リプロジェクション処理を施す必要がある。
 逆リプロジェクション部238は、画像信号処理部250から供給されるカメラ画像を過去の視点位置・視線方向から見える画像に戻す逆リプロジェクション処理を施し、AR重畳部234に与える。AR重畳部234は、逆リプロジェクションされたカメラ画像にレンダリング部232により生成された過去の視点位置・視線方向のCG画像を重畳することで拡張現実画像を生成し、ポストプロセス部236に与える。
 図5および図6を参照して、本実施の形態の前提技術を説明し、その後、図7および図8を参照して本実施の形態の改良技術を説明する。
 図5は、カメラ画像にCG画像を重畳して拡張現実画像を生成するための前提となる画像生成システムの構成を説明する図である。ここでは、説明を簡単にするため、拡張現実画像を生成するためのヘッドマウントディスプレイ100と画像生成装置200の主な構成を図示して説明する。
 ヘッドマウントディスプレイ100のカメラユニット80により撮影された外界のカメラ画像は画像生成装置200に送信され、画像信号処理部250に供給される。画像信号処理部250は、カメラ画像に対して画像信号処理と歪み補正処理を施し、AR重畳部234に与える。
 画像生成装置200のレンダリング部232は、ヘッドマウントディスプレイ100を装着したユーザの視点位置・視線方向から見た仮想オブジェクトを生成し、AR重畳部234に与える。
 AR重畳部234は、カメラ画像にCG画像を重畳し、拡張現実画像を生成する。ポストプロセス部236は拡張現実画像にポストプロセスを施す。リプロジェクション部240はポストプロセスが施された拡張現実画像を最新の視点位置・視線方向に合うように変換する。歪み処理部242はリプロジェクション後の拡張現実画像に歪み処理を施す。歪み処理後の最終的なRGB画像はヘッドマウントディスプレイ100に送信され、ディスプレイパネル32に表示される。
 図6は、図5の画像生成システムによる拡張現実画像の生成手順を説明する図である。
 ヘッドマウントディスプレイ100のカメラユニット80が外界を撮影し、Raw画像を出力する(S10)。画像信号処理部250は、カメラユニット80により撮影されたRaw画像に画像信号処理および歪み補正処理を施し、SLAM(Simultaneous Localization and Mapping)に使用するためのカメラ画像を生成する(S12)。ヘッドマウントディスプレイ100の姿勢センサ64などの慣性計測ユニット(IMU(Inertial Measurement Unit))から、ヘッドマウントディスプレイ100の現在の姿勢情報を示すIMUデータを取得する(S14)。カメラ画像およびIMUデータを用いて、自己位置推定と環境地図作成を同時に行うSLAM処理が実行され、ヘッドマウントディスプレイ100を装着したユーザの姿勢が推定される(S16)。
 姿勢推定データにもとづいて視点計算、仮想オブジェクトの物理演算などコンピュータグラフィックスの更新に必要な処理が行われる(S18)。レンダリング部232は仮想空間のオブジェクトをレンダリングし、CG画像を生成する(S20)。
 ここで、レンダリングは、仮想空間に表示するオブジェクトの数に応じて処理量が増えるため、オブジェクトの数が多いと処理に相当な時間がかかることに留意する。
 画像信号処理部250は、カメラユニット80により撮影されたRaw画像に画像信号処理および歪み補正処理を施し、ヘッドマウントディスプレイ100にシースルー映像を提供するためのカメラ画像を生成する(S22)。
 AR重畳部234は、カメラ画像にCG画像を重畳することで拡張現実画像を生成する(S24)。ポストプロセス部236は拡張現実画像にポストプロセスを施す(S26)。
 ここで、ポストプロセスは、画像全体に対する処理であるため、仮想オブジェクトの数には関係なく、レンダリングに比べて短い時間で行うことができることに留意する。
 慣性計測ユニットから、ヘッドマウントディスプレイ100の最新の姿勢情報を示すIMUデータを取得する(S28)。リプロジェクション部240は、ヘッドマウントディスプレイ100の最新の姿勢情報に合わせて拡張現実画像を変換する(S30)。歪み処理部242は、リプロジェクション後の拡張現実画像にレンズ歪み処理を施し、レンズ歪み処理を施した拡張現実画像を出力する(S32)。
 図5および図6で説明した画像生成システムの構成と処理手順の場合、レンダリングのフレームレートに合わせてカメラ画像を重畳することになる。レンダリングは処理時間がかかるため、レンダリング部232による仮想空間のレンダリングのフレームレートは、カメラユニット80による現実空間の撮影のフレームレートに比べると遅い。たとえば、カメラユニット80により120fpsの撮影が行われても、レンダリングは60fpsでしか描画できないことがある。そのため、ヘッドマウントディスプレイ100のディスプレイパネルに表示されるシースルー映像のフレームレートはレンダリングのフレームレートに合わせて低下し、シースルー映像がとぎれとぎれになり、拡張現実の映像を見ても現実感が伴わない結果となる。
 そこで、本実施の形態では、1回のレンダリングされたCG画像にカメラ画像を複数回重畳して拡張現実映像のポストプロセスを複数回行うことで、カメラユニット80のフレームレートに合わせた滑らかな映像を生成する。
 図7は、カメラ画像にCG画像を重畳して拡張現実画像を生成するための本実施の形態に係る画像生成システムの構成を説明する図である。図5の前提術の説明と重複する説明は適宜省略し、前提技術から改善した構成について説明する。
 レンダリング部232による1回のレンダリング結果であるCG画像に対して、カメラユニット80によるカメラ画像を複数回重畳するために、逆リプロジェクション部238は、画像信号処理部250により画像信号処理および歪み補正処理されたカメラ画像に対して逆リプロジェクション処理を施し、過去のヘッドマウントディスプレイ100の視点位置・視線方向から見える画像に変換し、AR重畳部234に与える。
 AR重畳部234は、レンダリング部232による1回のレンダリング結果のCG画像に対して1回目は画像信号処理部250から供給されるカメラ画像を合成するが、2回目以降は同じCG画像に対して逆リプロジェクション部238により逆リプロジェクションされたカメラ画像を合成する。ポストプロセス部236は、いずれの場合でもAR重畳部234により合成された拡張現実画像にポストプロセスを施す。それ以降の処理は図5の前提技術と同じである。なお、1回目と2回目以降を区別せずに、1回目についてもレンダリング結果のCG画像に対して逆リプロジェクション部238により逆リプロジェクションされたカメラ画像を合成するように構成してもよい。
 図8は、図7の画像生成システムによる拡張現実画像の生成手順を説明する図である。
 ヘッドマウントディスプレイ100のカメラユニット80が外界を撮影し、(n-1)番目のRaw画像を出力する(S40)。
 n番目のVsyncのタイミングにおいて、以下のステップS42~S62の処理が実行される。
 画像信号処理部250は、カメラユニット80により撮影された(n-1)番目のRaw画像に画像信号処理および歪み補正処理を施し、SLAMに使用するためのカメラ画像を生成する(S42)。慣性計測ユニットから、ヘッドマウントディスプレイ100の現在の姿勢情報を示すIMUデータを取得する(S44)。カメラ画像およびIMUデータを用いて、SLAM処理が実行され、ヘッドマウントディスプレイ100を装着したユーザの姿勢が推定される(S46)。
 姿勢推定データにもとづいて視点計算、仮想オブジェクトの物理演算などコンピュータグラフィックスの更新に必要な処理が行われる(S48)。レンダリング部232は仮想空間のオブジェクトをレンダリングし、(n-1)番目のCG画像を生成する(S50)。
 画像信号処理部250は、カメラユニット80により撮影された(n-1)番目のRaw画像に画像信号処理および歪み補正処理を施し、ヘッドマウントディスプレイ100にシースルー映像を提供するための(n-1)番目のカメラ画像を生成する(S52)。
 AR重畳部234は、(n-1)番目のカメラ画像に(n-1)番目のCG画像を重畳することで(n-1)番目の拡張現実画像を生成する(S54)。ポストプロセス部236は(n-1)番目の拡張現実画像にポストプロセスを施す(S56)。
 慣性計測ユニットから、ヘッドマウントディスプレイ100の最新の姿勢情報を示すIMUデータを取得する(S58)。リプロジェクション部240は、ヘッドマウントディスプレイ100の最新の姿勢情報にもとづいて2フレーム先の視点位置・視線方向を予測し、(n-1)番目の拡張現実画像を(n+1)番目の拡張現実画像に変換する(S60)。レンダリングにより2フレーム分遅延するため、2フレーム先を予測してリプロジェクションを行う。
 歪み処理部242は、リプロジェクション後の(n+1)番目の拡張現実画像にレンズ歪み処理を施し、(n+1)番目のVsyncのタイミングでレンズ歪み処理を施した(n+1)番目の拡張現実画像を出力する(S62)。
 次にn番目のVsyncのタイミングにおいてヘッドマウントディスプレイ100のカメラユニット80が外界を撮影し、n番目のRaw画像を出力する(S70)。
 (n+1)番目のVsyncのタイミングにおいて、以下のステップS72~S86の処理が実行される。
 画像信号処理部250は、カメラユニット80により撮影されたn番目のRaw画像に画像信号処理および歪み補正処理を施し、ヘッドマウントディスプレイ100にシースルー映像を提供するためのn番目のカメラ画像を生成する(S72)。
 慣性計測ユニットから、ヘッドマウントディスプレイ100の最新の姿勢情報を示すIMUデータを取得する(S74)。逆リプロジェクション部238は、最新のIMUデータにもとづいてn番目のカメラ画像を1フレーム前の視点位置・視線方向から見た(n-1)番目のカメラ画像に変換する(S76)。
 AR重畳部234は、逆リプロジェクションされた(n-1)番目のカメラ画像に、ステップS50においてレンダリングされた(n-1)番目のCG画像を重畳することで(n-1)番目の拡張現実の画像を生成する(S78)。ポストプロセス部236は(n-1)番目の拡張現実画像にポストプロセスを施す(S80)。
 慣性計測ユニットから、ヘッドマウントディスプレイ100の最新の姿勢情報を示すIMUデータを取得する(S82)。リプロジェクション部240は、ヘッドマウントディスプレイ100の最新の姿勢情報にもとづいて3フレーム先の視点位置・視線方向を予測し、(n-1)番目の拡張現実画像を(n+2)番目の拡張現実画像に変換する(S84)。逆リプロジェクション処理でカメラ画像を1フレーム前に戻したため、ステップS84のリプロジェクション処理では3フレーム先に進めることに留意する。
 歪み処理部242は、リプロジェクション後の(n+2)番目の拡張現実画像にレンズ歪み処理を施し、(n+2)番目のVsyncのタイミングでレンズ歪み処理を施した(n+2)番目のカメラ画像を出力する(S86)。
 このようにレンダリングでは(n-1)番目のCG画像が生成され、(n-1)番目のCG画像が(n-1)番目のカメラ画像とn番目のカメラ画像に重畳され、ポストプロセスが施される。レンダリングに比べてポストプロセスは、カメラのフレームレートに等しい2倍の頻度で行われるため、滑らかな画像が生成される。
 なお、上記の説明では、1回のレンダリングによる同一のCG画像に対して2枚のカメラ画像が重畳されてポストプロセスが施されたが、レンダリングがさらに時間がかかる場合には、1回のレンダリングによるCG画像に対して複数枚のカメラ画像が重畳され、複数回のポストプロセスが施されてもよい。
 上記の説明では、レンダリング結果のCG画像が1枚目のカメラ画像に重畳されるときは、カメラ画像に逆リプロジェクションを適用せず、同一のCG画像が2枚目以降のカメラ画像に重畳されるときは、2枚目以降のカメラ画像に逆リプロジェクションを適用した。しかしながら、レンダリングには時間がかかるため、最新のカメラ画像はポストプロセスの直前に取得するのが好ましく、そのため、レンダリングの際に利用した三次元グラフィックスの視点のタイムスタンプと重畳するカメラ画像のタイムスタンプに差が生じる。そのような場合、CG画像が1枚目のカメラ画像に重畳されるときにも、2つのタイムスタンプの差を埋めるためにカメラ画像に逆リプロジェクションを適用してからCG画像を重畳してもよい。
 逆リプロジェクションは、三次元グラフィックスの視点のタイムスタンプとポストプロセス時に使用するカメラ画像のタイムスタンプを合わせるために行われるものであり、逆リプロジェクションで適用する姿勢の差分を計算するために、2つのタイムスタンプの間に取得されるIMUデータを利用する。
 なお、慣性計測ユニットからは常にIMUデータを取得しており、リプロジェクションに必要な区間のIMUデータをすべて利用して姿勢を予測することができる。IMUデータの取得周期は1ミリ秒以下であり、Vsyncの間隔よりも短い。IMUデータが不足している区間は予測時間分を線形補間すればよい。
 以上述べたように、本実施の形態の画像生成装置200によれば、1回のレンダリング結果のCG画像に対して複数枚のカメラ画像を重畳してポストプロセスを複数回施すので見かけ上フレームレートがカメラ画像のフレームレートまで上がり、滑らかで自然な拡張現実画像を生成することができる。
 上記の実施の形態では、カメラ画像にCG画像を重畳した拡張現実画像に対してレンダリングの頻度よりも高い頻度でポストプロセスを施して滑らかな拡張現実画像を生成したが、この方法は、ヘッドマウントディスプレイのトラッキングに限らず、一般的にレンダリングに使う仮想カメラのアングルが変化している場合にも適用しても効果を奏する。たとえば、背景に動画を再生しながら、手前に仮想オブジェクトをレンダリングして、エフェクトを表示しているような場合には、アンチエイリアシングやノイズリダクションにより、見かけ上の品質を向上させることができる。
 また、多層レンダリングに対してレンダリングの頻度よりも高い頻度でポストプロセスを施してもよい。たとえば、近距離の動きの激しいオブジェクトは高フレームレートでレンダリングし、遠距離で比較的動きの少ないオブジェクトは低フレームレートでレンダリングし、両者を合成してポストプロセスを施す。ポストプロセスの頻度を高めると見かけ上の品質を向上させることができる。
 以上、本発明を実施の形態をもとに説明した。実施の形態は例示であり、それらの各構成要素や各処理プロセスの組合せにいろいろな変形例が可能なこと、またそうした変形例も本発明の範囲にあることは当業者に理解されるところである。
 10 制御部、 20 入力インタフェース、 30 出力インタフェース、 32 ディスプレイパネル、 40 通信制御部、 42 ネットワークアダプタ、 44 アンテナ、 50 記憶部、 64 姿勢センサ、 70 外部入出力端子インタフェース、 72 外部メモリ、 80 カメラユニット、 100 ヘッドマウントディスプレイ、 200 画像生成装置、 210 位置・姿勢取得部、 220 視点・視線設定部、 230 画像生成部、 232 レンダリング部、 234 AR重畳部、 236 ポストプロセス部、 238 逆リプロジェクション部、 240 リプロジェクション部、 242 歪み処理部、 250 画像信号処理部、 260 画像記憶部、 280 HDMI送受信部、 300 インタフェース。
 本発明は、画像生成の分野に適用することができる。

Claims (7)

  1.  仮想空間のオブジェクトをレンダリングしてコンピュータグラフィックス画像を生成するレンダリング部と、
     コンピュータグラフィックス画像にポストプロセスを施すポストプロセス部とを含み、
     前記ポストプロセス部は、前記レンダリング部が前記コンピュータグラフィックス画像を生成するフレームレートよりも高い頻度で前記コンピュータグラフィックス画像にポストプロセスを施すことを特徴とする画像生成装置。
  2.  仮想空間のオブジェクトをレンダリングしてコンピュータグラフィックス画像を生成するレンダリング部と、
     現実空間の撮影画像に前記コンピュータグラフィックス画像を重畳して拡張現実画像を生成する重畳部と、
     前記拡張現実画像にポストプロセスを施すポストプロセス部とを含み、
     前記重畳部は、前記レンダリング部により生成されるコンピュータグラフィックス画像のフレームレートよりも高いフレームレートで提供される複数枚の前記撮影画像を同一の前記コンピュータグラフィックス画像に重畳して前記拡張現実画像を生成することを特徴とする画像生成装置。
  3.  ポストプロセスが施された前記拡張現実画像を新たな視点位置または視線方向に合うように変換するリプロジェクション部をさらに含むことを特徴とする請求項2に記載の画像生成装置。
  4.  前記レンダリング部が前記コンピュータグラフィックス画像を生成した時点の視点位置または視線方向に合うように前記撮影画像を逆変換する逆リプロジェクション部をさらに含み、
     前記重畳部は、複数枚の前記撮影画像の各々に前記逆リプロジェクション部によって逆変換を施した上で前記コンピュータグラフィックス画像を重畳して前記拡張現実画像を生成することを特徴とする請求項3に記載の画像生成装置。
  5.  前記レンダリング部が前記コンピュータグラフィックス画像を生成した時点の視点位置または視線方向に合うように前記撮影画像を逆変換する逆リプロジェクション部をさらに含み、
     前記重畳部は、1枚目の前記撮影画像には前記コンピュータグラフィックス画像を重畳して1枚目の前記拡張現実画像を生成し、2枚目以降の前記撮影画像には前記逆リプロジェクション部によって逆変換を施した上で前記コンピュータグラフィックス画像を重畳して2枚目以降の前記拡張現実画像を生成することを特徴とする請求項3に記載の画像生成装置。
  6.  仮想空間のオブジェクトをレンダリングしてコンピュータグラフィックス画像を生成するレンダリングステップと、
     現実空間の撮影画像に前記コンピュータグラフィックス画像を重畳して拡張現実画像を生成する重畳ステップと、
     前記拡張現実画像にポストプロセスを施すポストプロセスステップとを含み、
     前記重畳ステップは、前記レンダリングステップにより生成されるコンピュータグラフィックス画像のフレームレートよりも高いフレームレートで提供される複数枚の前記撮影画像を同一の前記コンピュータグラフィックス画像に重畳して前記拡張現実画像を生成することを特徴とする画像生成方法。
  7.  仮想空間のオブジェクトをレンダリングしてコンピュータグラフィックス画像を生成するレンダリング機能と、
     現実空間の撮影画像に前記コンピュータグラフィックス画像を重畳して拡張現実画像を生成する重畳機能と、
     前記拡張現実画像にポストプロセスを施すポストプロセス機能とをコンピュータに実現させ、
     前記重畳機能は、前記レンダリング機能により生成されるコンピュータグラフィックス画像のフレームレートよりも高いフレームレートで提供される複数枚の前記撮影画像を同一の前記コンピュータグラフィックス画像に重畳して前記拡張現実画像を生成することを特徴とするプログラム。
PCT/JP2018/037367 2017-10-13 2018-10-05 画像生成装置および画像生成方法 WO2019073925A1 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
US16/652,101 US11100716B2 (en) 2017-10-13 2018-10-05 Image generating apparatus and image generation method for augmented reality

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
JP2017199784A JP6711803B2 (ja) 2017-10-13 2017-10-13 画像生成装置および画像生成方法
JP2017-199784 2017-10-13

Publications (1)

Publication Number Publication Date
WO2019073925A1 true WO2019073925A1 (ja) 2019-04-18

Family

ID=66100885

Family Applications (1)

Application Number Title Priority Date Filing Date
PCT/JP2018/037367 WO2019073925A1 (ja) 2017-10-13 2018-10-05 画像生成装置および画像生成方法

Country Status (3)

Country Link
US (1) US11100716B2 (ja)
JP (1) JP6711803B2 (ja)
WO (1) WO2019073925A1 (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2022040953A1 (zh) * 2020-08-26 2022-03-03 南京智导智能科技有限公司 一种基于增强现实的机械零件加工精度检测引导***

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP7377014B2 (ja) * 2019-07-10 2023-11-09 株式会社ソニー・インタラクティブエンタテインメント 画像表示装置、画像表示システムおよび画像表示方法

Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20160364904A1 (en) * 2015-06-12 2016-12-15 Google Inc. Electronic display stabilization for head mounted display

Family Cites Families (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US9443355B2 (en) * 2013-06-28 2016-09-13 Microsoft Technology Licensing, Llc Reprojection OLED display for augmented reality experiences
US9514571B2 (en) * 2013-07-25 2016-12-06 Microsoft Technology Licensing, Llc Late stage reprojection
US10410349B2 (en) * 2017-03-27 2019-09-10 Microsoft Technology Licensing, Llc Selective application of reprojection processing on layer sub-regions for optimizing late stage reprojection power
US10514753B2 (en) * 2017-03-27 2019-12-24 Microsoft Technology Licensing, Llc Selectively applying reprojection processing to multi-layer scenes for optimizing late stage reprojection power

Patent Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20160364904A1 (en) * 2015-06-12 2016-12-15 Google Inc. Electronic display stabilization for head mounted display

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2022040953A1 (zh) * 2020-08-26 2022-03-03 南京智导智能科技有限公司 一种基于增强现实的机械零件加工精度检测引导***

Also Published As

Publication number Publication date
US20200312032A1 (en) 2020-10-01
US11100716B2 (en) 2021-08-24
JP6711803B2 (ja) 2020-06-17
JP2019074881A (ja) 2019-05-16

Similar Documents

Publication Publication Date Title
US11119319B2 (en) Rendering device, head-mounted display, image transmission method, and image correction method
JP6732716B2 (ja) 画像生成装置、画像生成システム、画像生成方法、およびプログラム
RU2638776C1 (ru) Устройство генерирования изображения и способ
WO2017086263A1 (ja) 情報処理装置および画像生成方法
US10969591B2 (en) Image correction apparatus, image correction method and program
US11003408B2 (en) Image generating apparatus and image generating method
WO2017208957A1 (ja) 画像生成装置、画像生成システム、および画像生成方法
US11373379B2 (en) Image generation apparatus and image generation method for generating augmented reality images based on user interaction
WO2019098198A1 (ja) 画像生成装置、ヘッドマウントディスプレイ、画像生成システム、画像生成方法、およびプログラム
US11120632B2 (en) Image generating apparatus, image generating system, image generating method, and program
WO2020129115A1 (ja) 情報処理システム、情報処理方法およびコンピュータプログラム
WO2019073925A1 (ja) 画像生成装置および画像生成方法
JP7047085B2 (ja) 画像生成装置、画像生成方法、およびプログラム
JP7377014B2 (ja) 画像表示装置、画像表示システムおよび画像表示方法
JP7429761B2 (ja) 画像表示装置、画像表示システムおよび画像表示方法
US20240137482A1 (en) Image generation device, program, image generation method, and image displaying system
WO2021106136A1 (ja) 表示端末装置
KR101919428B1 (ko) 가상 현실 브로드캐스트 영상을 생성하는 방법 및 장치

Legal Events

Date Code Title Description
121 Ep: the epo has been informed by wipo that ep was designated in this application

Ref document number: 18866336

Country of ref document: EP

Kind code of ref document: A1

NENP Non-entry into the national phase

Ref country code: DE

122 Ep: pct application non-entry in european phase

Ref document number: 18866336

Country of ref document: EP

Kind code of ref document: A1