KR20210029187A - 삼차원 데이터 부호화 방법, 삼차원 데이터 복호 방법, 삼차원 데이터 부호화 장치, 및 삼차원 데이터 복호 장치 - Google Patents

삼차원 데이터 부호화 방법, 삼차원 데이터 복호 방법, 삼차원 데이터 부호화 장치, 및 삼차원 데이터 복호 장치 Download PDF

Info

Publication number
KR20210029187A
KR20210029187A KR1020217000051A KR20217000051A KR20210029187A KR 20210029187 A KR20210029187 A KR 20210029187A KR 1020217000051 A KR1020217000051 A KR 1020217000051A KR 20217000051 A KR20217000051 A KR 20217000051A KR 20210029187 A KR20210029187 A KR 20210029187A
Authority
KR
South Korea
Prior art keywords
data
dimensional
information
encoding
sub
Prior art date
Application number
KR1020217000051A
Other languages
English (en)
Inventor
청 딘 한
퐁삭 라상
치 왕
노리타카 이구치
도시야스 스기오
Original Assignee
파나소닉 인텔렉츄얼 프로퍼티 코포레이션 오브 아메리카
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 파나소닉 인텔렉츄얼 프로퍼티 코포레이션 오브 아메리카 filed Critical 파나소닉 인텔렉츄얼 프로퍼티 코포레이션 오브 아메리카
Publication of KR20210029187A publication Critical patent/KR20210029187A/ko

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/50Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
    • H04N19/597Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding specially adapted for multi-view video sequence encoding
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T9/00Image coding
    • G06T9/40Tree coding, e.g. quadtree, octree
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T9/00Image coding
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T9/00Image coding
    • G06T9/001Model-based coding, e.g. wire frame
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/17Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object
    • H04N19/176Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object the region being a block, e.g. a macroblock
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/184Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being bits, e.g. of the compressed video stream
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/70Methods or arrangements for coding, decoding, compressing or decompressing digital video signals characterised by syntax aspects related to video coding, e.g. related to compression standards

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Compression Or Coding Systems Of Tv Signals (AREA)
  • Image Processing (AREA)
  • Testing, Inspecting, Measuring Of Stereoscopic Televisions And Televisions (AREA)

Abstract

삼차원 데이터 부호화 방법은, 복수의 삼차원점이 포함되는 대상 공간에 포함되는 복수의 서브 공간을 부호화함으로써 복수의 서브 공간에 대응하는 복수의 부호화 데이터를 포함하는 비트 스트림을 생성하고, 비트 스트림의 생성에서는, 비트 스트림에 포함되는, 복수의 부호화 데이터에 공통인 제1 제어 정보에, 복수의 서브 공간에 할당된 복수의 식별자에 대응지어진 복수의 서브 공간의 정보의 일람을 저장하고(S4531), 복수의 부호화 데이터의 각각의 헤더에, 당해 부호화 데이터에 대응하는 서브 공간에 할당된 식별자를 저장한다(S4532).

Description

삼차원 데이터 부호화 방법, 삼차원 데이터 복호 방법, 삼차원 데이터 부호화 장치, 및 삼차원 데이터 복호 장치
본 개시는, 삼차원 데이터 부호화 방법, 삼차원 데이터 복호 방법, 삼차원 데이터 부호화 장치, 및 삼차원 데이터 복호 장치에 관한 것이다.
자동차 혹은 로봇이 자율적으로 동작하기 위한 컴퓨터 비전, 맵 정보, 감시, 인프라 점검, 또는, 영상 전송 등, 폭넓은 분야에 있어서, 향후, 삼차원 데이터를 활용한 장치 또는 서비스의 보급이 전망된다. 삼차원 데이터는, 레인지 파인더 등의 거리 센서, 스테레오 카메라, 또는 복수의 단안(單眼) 카메라의 조합 등 다양한 방법으로 취득된다.
삼차원 데이터의 표현 방법 중 하나로서, 삼차원 공간 내의 점군에 의해 삼차원 구조의 형상을 나타내는 포인트 클라우드라 불리는 표현 방법이 있다. 포인트 클라우드에서는, 점군의 위치와 색이 저장된다. 포인트 클라우드는 삼차원 데이터의 표현 방법으로서 주류가 될 것으로 예상되지만, 점군은 데이터량이 매우 크다. 따라서, 삼차원 데이터의 축적 또는 전송에 있어서는 이차원의 동화상(일례로서, MPEG로 규격화된 MPEG-4 AVC 또는 HEVC 등이 있다)과 마찬가지로, 부호화에 의한 데이터량의 압축이 필수가 된다.
또한, 포인트 클라우드의 압축에 대해서는, 포인트 클라우드 관련의 처리를 행하는 공개된 라이브러리(Point Cloud Library) 등에 의해 일부 서포트되고 있다.
또한, 삼차원의 지도 데이터를 이용하여, 차량 주변에 위치하는 시설을 검색하고, 표시하는 기술이 알려져 있다(예를 들면, 특허문헌 1 참조).
국제 공개 제2014/020663호
삼차원 데이터의 부호화 및 복호에 있어서, 삼차원 데이터 복호 장치의 처리량을 저감할 수 있는 것이 요망되고 있다.
본 개시는, 삼차원 데이터 복호 장치의 처리량을 저감할 수 있는 삼차원 데이터 부호화 방법, 삼차원 데이터 복호 방법, 삼차원 데이터 부호화 장치 또는 삼차원 데이터 복호 장치를 제공하는 것을 목적으로 한다.
본 개시의 일 양태에 따른 삼차원 데이터 부호화 방법은, 복수의 삼차원점이 포함되는 대상 공간에 포함되는 복수의 서브 공간을 부호화함으로써 상기 복수의 서브 공간에 대응하는 복수의 부호화 데이터를 포함하는 비트 스트림을 생성하고, 상기 비트 스트림의 생성에서는, 상기 비트 스트림에 포함되는, 상기 복수의 부호화 데이터에 공통인 제1 제어 정보에, 상기 복수의 서브 공간에 할당된 복수의 식별자에 대응지어진 상기 복수의 서브 공간의 정보의 일람을 저장하고, 상기 복수의 부호화 데이터의 각각의 헤더에, 당해 부호화 데이터에 대응하는 상기 서브 공간에 할당된 식별자를 저장한다.
본 개시의 일 양태에 따른 삼차원 데이터 복호 방법은, 복수의 삼차원점이 포함되는 대상 공간에 포함되는 복수의 서브 공간을 부호화함으로써 얻어진, 상기 복수의 서브 공간에 대응하는 복수의 부호화 데이터를 포함하는 비트 스트림을 복호하고, 상기 비트 스트림의 복호에서는, 상기 복수의 서브 공간 중 복호 대상의 서브 공간을 결정하고, 상기 비트 스트림에 포함되는, 상기 복수의 부호화 데이터에 공통인 제1 제어 정보에 포함되는, 상기 복수의 서브 공간에 할당된 복수의 식별자에 대응지어진 상기 복수의 서브 공간의 정보의 일람과, 상기 복수의 부호화 데이터의 각각의 헤더에 포함되는 당해 부호화 데이터에 대응하는 상기 서브 공간에 할당된 식별자를 이용하여, 상기 복호 대상의 서브 공간의 부호화 데이터를 취득한다.
본 개시는, 삼차원 데이터 복호 장치의 처리량을 저감할 수 있는 삼차원 데이터 부호화 방법, 삼차원 데이터 복호 방법, 삼차원 데이터 부호화 장치 또는 삼차원 데이터 복호 장치를 제공할 수 있다.
도 1은, 실시 형태 1에 따른 부호화 삼차원 데이터의 구성을 나타내는 도면이다.
도 2는, 실시 형태 1에 따른 GOS의 최하층 레이어에 속하는 SPC간의 예측 구조의 일례를 나타내는 도면이다.
도 3은, 실시 형태 1에 따른 레이어간의 예측 구조의 일례를 나타내는 도면이다.
도 4는, 실시 형태 1에 따른 GOS의 부호화순의 일례를 나타내는 도면이다.
도 5는, 실시 형태 1에 따른 GOS의 부호화순의 일례를 나타내는 도면이다.
도 6은, 실시 형태 1에 따른 삼차원 데이터 부호화 장치의 블럭도이다.
도 7은, 실시 형태 1에 따른 부호화 처리의 플로차트이다.
도 8은, 실시 형태 1에 따른 삼차원 데이터 복호 장치의 블럭도이다.
도 9는, 실시 형태 1에 따른 복호 처리의 플로차트이다.
도 10은, 실시 형태 1에 따른 메타 정보의 일례를 나타내는 도면이다.
도 11은, 실시 형태 2에 따른 SWLD의 구성예를 나타내는 도면이다.
도 12는, 실시 형태 2에 따른 서버 및 클라이언트의 동작예를 나타내는 도면이다.
도 13은, 실시 형태 2에 따른 서버 및 클라이언트의 동작예를 나타내는 도면이다.
도 14는, 실시 형태 2에 따른 서버 및 클라이언트의 동작예를 나타내는 도면이다.
도 15는, 실시 형태 2에 따른 서버 및 클라이언트의 동작예를 나타내는 도면이다.
도 16은, 실시 형태 2에 따른 삼차원 데이터 부호화 장치의 블럭도이다.
도 17은, 실시 형태 2에 따른 부호화 처리의 플로차트이다.
도 18은, 실시 형태 2에 따른 삼차원 데이터 복호 장치의 블럭도이다.
도 19는, 실시 형태 2에 따른 복호 처리의 플로차트이다.
도 20은, 실시 형태 2에 따른 WLD의 구성예를 나타내는 도면이다.
도 21은, 실시 형태 2에 따른 WLD의 8진 트리 구조의 예를 나타내는 도면이다.
도 22는, 실시 형태 2에 따른 SWLD의 구성예를 나타내는 도면이다.
도 23은, 실시 형태 2에 따른 SWLD의 8진 트리 구조의 예를 나타내는 도면이다.
도 24는, 실시 형태 3에 따른 삼차원 데이터 작성 장치의 블럭도이다.
도 25는, 실시 형태 3에 따른 삼차원 데이터 송신 장치의 블럭도이다.
도 26은, 실시 형태 4에 따른 삼차원 정보 처리 장치의 블럭도이다.
도 27은, 실시 형태 5에 따른 삼차원 데이터 작성 장치의 블럭도이다.
도 28은, 실시 형태 6에 따른 시스템의 구성을 나타내는 도면이다.
도 29는, 실시 형태 6에 따른 클라이언트 장치의 블럭도이다.
도 30은, 실시 형태 6에 따른 서버의 블럭도이다.
도 31은, 실시 형태 6에 따른 클라이언트 장치에 의한 삼차원 데이터 작성 처리의 플로차트이다.
도 32는, 실시 형태 6에 따른 클라이언트 장치에 의한 센서 정보 송신 처리의 플로차트이다.
도 33은, 실시 형태 6에 따른 서버에 의한 삼차원 데이터 작성 처리의 플로차트이다.
도 34는, 실시 형태 6에 따른 서버에 의한 삼차원 맵 송신 처리의 플로차트이다.
도 35는, 실시 형태 6에 따른 시스템의 변형예의 구성을 나타내는 도면이다.
도 36은, 실시 형태 6에 따른 서버 및 클라이언트 장치의 구성을 나타내는 도면이다.
도 37은, 실시 형태 7에 따른 삼차원 데이터 부호화 장치의 블럭도이다.
도 38은, 실시 형태 7에 따른 예측 잔차의 예를 나타내는 도면이다.
도 39는, 실시 형태 7에 따른 볼륨의 예를 나타내는 도면이다.
도 40은, 실시 형태 7에 따른 볼륨의 8진 트리 표현의 예를 나타내는 도면이다.
도 41은, 실시 형태 7에 따른 볼륨의 비트열의 예를 나타내는 도면이다.
도 42는, 실시 형태 7에 따른 볼륨의 8진 트리 표현의 예를 나타내는 도면이다.
도 43은, 실시 형태 7에 따른 볼륨의 예를 나타내는 도면이다.
도 44는, 실시 형태 7에 따른 인트라 예측 처리를 설명하기 위한 도면이다.
도 45는, 실시형태 8에 따른 전송 시스템의 구성을 나타낸 도면이다.
도 46은, 실시형태 8에 따른 부호화 삼차원 맵의 비트 스트림의 구성예를 나타낸 도면이다.
도 47은, 실시형태 8에 따른 부호화 효율의 개선 효과를 설명하기 위한 도면이다.
도 48은, 실시형태 8에 따른 서버에 의한 처리의 플로차트이다.
도 49는, 실시형태 8에 따른 클라이언트에 의한 처리의 플로차트이다.
도 50은, 실시형태 8에 따른 서브 맵의 신택스예를 나타낸 도면이다.
도 51은, 실시형태 8에 따른 부호화 타입의 전환 처리를 모식적으로 나타낸 도면이다.
도 52는, 실시형태 8에 따른 서브 맵의 신택스예를 나타낸 도면이다.
도 53은, 실시형태 8에 따른 삼차원 데이터 부호화 처리의 플로차트이다.
도 54는, 실시형태 8에 따른 삼차원 데이터 복호 처리의 플로차트이다.
도 55는, 실시형태 8에 따른 부호화 타입의 전환 처리의 변형예의 동작을 모식적으로 나타낸 도면이다.
도 56은, 실시형태 8에 따른 부호화 타입의 전환 처리의 변형예의 동작을 모식적으로 나타낸 도면이다.
도 57은, 실시형태 8에 따른 부호화 타입의 전환 처리의 변형예의 동작을 모식적으로 나타낸 도면이다.
도 58은, 실시형태 8에 따른 차분치의 산출 처리의 변형예의 동작을 모식적으로 나타낸 도면이다.
도 59는, 실시형태 8에 따른 차분치의 산출 처리의 변형예의 동작을 모식적으로 나타낸 도면이다.
도 60은, 실시형태 8에 따른 차분치의 산출 처리의 변형예의 동작을 모식적으로 나타낸 도면이다.
도 61은, 실시형태 8에 따른 차분치의 산출 처리의 변형예의 동작을 모식적으로 나타낸 도면이다.
도 62는, 실시형태 8에 따른 볼륨의 신택스예를 나타낸 도면이다.
도 63은, 실시 형태 9에 따른 트리 구조의 일례를 나타내는 도면이다.
도 64는, 실시 형태 9에 따른 각 가지가 갖는 유효 리프의 수의 예를 나타내는 도면이다.
도 65는, 실시 형태 9에 따른 부호화 방식의 적용예를 나타내는 도면이다.
도 66은, 실시 형태 9에 따른 조밀한 가지 영역의 예를 나타내는 도면이다.
도 67은, 실시 형태 9에 따른 조밀한 삼차원점군의 예를 나타내는 도면이다.
도 68은, 실시 형태 9에 따른 성긴 삼차원점군의 예를 나타내는 도면이다.
도 69는, 실시 형태 9에 따른 부호화 처리의 플로차트이다.
도 70은, 실시 형태 9에 따른 복호 처리의 플로차트이다.
도 71은, 실시 형태 9에 따른 부호화 처리의 플로차트이다.
도 72는, 실시 형태 9에 따른 복호 처리의 플로차트이다.
도 73은, 실시 형태 9에 따른 부호화 처리의 플로차트이다.
도 74는, 실시 형태 9에 따른 복호 처리의 플로차트이다.
도 75는, 실시 형태 9에 따른 삼차원점의 분리 처리의 플로차트이다.
도 76은, 실시 형태 9에 따른 신택스예를 나타내는 도면이다.
도 77은, 실시 형태 9에 따른 조밀한 가지의 예를 나타내는 도면이다.
도 78은, 실시 형태 9에 따른 성긴 가지의 예를 나타내는 도면이다.
도 79는, 실시 형태 9의 변형예에 따른 부호화 처리의 플로차트이다.
도 80은, 실시 형태 9의 변형예에 따른 복호 처리의 플로차트이다.
도 81은, 실시 형태 9의 변형예에 따른 삼차원점의 분리 처리의 플로차트이다.
도 82는, 실시 형태 9의 변형예에 따른 신택스예를 나타내는 도면이다.
도 83은, 실시 형태 9에 따른 부호화 처리의 플로차트이다.
도 84는, 실시 형태 9에 따른 복호 처리의 플로차트이다.
도 85는, 실시 형태 10에 따른 8진 트리 구조에 있어서의 참조 관계를 나타내는 도면이다.
도 86은, 실시 형태 10에 따른 공간 영역에 있어서의 참조 관계를 나타내는 도면이다.
도 87은, 실시 형태 10의 변형예 1에 따른 공간 영역에 있어서의 참조 관계를 나타내는 도면이다.
도 88은, 실시 형태 10의 변형예 1에 따른 헤더 정보의 신택스예를 나타내는 도면이다.
도 89는, 실시 형태 10의 변형예 1에 따른 헤더 정보의 신택스예를 나타내는 도면이다.
도 90은, 실시 형태 10의 변형예 2에 따른 인접 참조 노드의 예를 나타내는 도면이다.
도 91은, 실시 형태 10의 변형예 2에 따른 대상 노드 및 인접 노드의 예를 나타내는 도면이다.
도 92는, 실시 형태 10의 변형예 3에 따른 8진 트리 구조에 있어서의 참조 관계를 나타내는 도면이다.
도 93은, 실시 형태 10의 변형예 3에 따른 공간 영역에 있어서의 참조 관계를 나타내는 도면이다.
도 94는, 실시 형태 11에 따른 트리 구조의 예를 나타내는 도면이다.
도 95는, 실시 형태 11에 따른 서브 삼차원점군의 예를 나타내는 도면이다.
도 96은, 실시 형태 11에 따른 서브 삼차원점군의 예를 나타내는 도면이다.
도 97은, 실시 형태 11에 따른 비트 스트림의 구성예를 나타내는 도면이다.
도 98은, 실시 형태 11에 따른 트리 구조의 예를 나타내는 도면이다.
도 99는, 실시 형태 11에 따른 전병렬 부호화를 설명하기 위한 도면이며, 트리 구조의 예를 나타내는 도면이다.
도 100은, 실시 형태 11에 따른 병렬 처리되는 서브 삼차원점군을 공간적으로 나타내는 도면이다.
도 101은, 실시 형태 11에 따른 비트 스트림의 구성예를 나타내는 도면이다.
도 102는, 실시 형태 11에 따른 병렬 복호 처리를 설명하기 위한 도면이다.
도 103은, 실시 형태 11에 따른 전병렬 부호화 처리의 흐름을 모식적으로 나타내는 도면이다.
도 104는, 실시 형태 11에 따른 전병렬 복호 처리의 흐름을 모식적으로 나타내는 도면이다.
도 105는, 실시 형태 11에 따른 점진 병렬 부호화를 설명하기 위한 도면이며, 트리 구조의 예를 나타내는 도면이다.
도 106은, 실시 형태 11에 따른 점진 병렬 부호화에 있어서의 코어의 동작을 나타내는 도면이다.
도 107은, 실시 형태 11에 따른 점진 병렬 부호화 처리의 흐름을 모식적으로 나타내는 도면이다.
도 108은, 실시 형태 11에 따른 삼차원 데이터 부호화 처리의 플로차트이다.
도 109는, 실시 형태 11에 따른 삼차원 데이터 복호 처리의 플로차트이다.
도 110은, 실시 형태 12에 따른 자동차가 비트 스트림에 액세스하는 동작을 모식적으로 나타내는 도면이다.
도 111은, 실시 형태 12에 따른 타일 분할의 일례를 나타내는 도면이다.
도 112는, 실시 형태 12에 따른 타일 분할의 일례를 나타내는 도면이다.
도 113은, 실시 형태 12에 따른 타일 분할의 일례를 나타내는 도면이다.
도 114는, 실시 형태 12에 따른 트리 구조에 있어서의 타일 분할의 예를 나타내는 도면이다.
도 115는, 실시 형태 12에 따른 삼차원의 타일 분할의 예를 나타내는 도면이다.
도 116은, 실시 형태 12에 따른 자동차의 이동시에 있어서 읽어들여지는 타일을 나타내는 도면이다.
도 117은, 실시 형태 12에 따른 시스템의 구성예를 나타내는 도면이다.
도 118은, 실시 형태 12에 따른 자동차에 취득되는 타일의 영역의 예를 나타내는 도면이다.
도 119는, 실시 형태 12에 따른 자동차에 취득되는 타일의 영역의 예를 나타내는 도면이다.
도 120은, 실시 형태 12에 따른 삼차원 데이터의 예를 나타내는 도면이다.
도 121은, 실시 형태 12에 따른 슬라이스의 데이터의 예를 나타내는 도면이다.
도 122는, 실시 형태 12에 따른 슬라이스의 데이터의 예를 나타내는 도면이다.
도 123은, 실시 형태 12에 따른 슬라이스의 데이터의 예를 나타내는 도면이다.
도 124는, 실시 형태 12에 따른 타일의 예를 나타내는 도면이다.
도 125는, 실시 형태 12에 따른 8진 트리에 있어서의 타일의 예를 나타내는 도면이다.
도 126은, 실시 형태 12에 따른 비트 스트림의 예를 나타내는 도면이다.
도 127은, 실시 형태 12에 따른 타일 테이블의 예를 나타내는 도면이다.
도 128은, 실시 형태 12에 따른 타일 테이블의 예를 나타내는 도면이다.
도 129는, 실시 형태 12에 따른 타일 테이블의 예를 나타내는 도면이다.
도 130은, 실시 형태 12에 따른 타일 테이블의 예를 나타내는 도면이다.
도 131은, 실시 형태 12에 따른 삼차원 데이터 부호화 처리의 플로차트이다.
도 132는, 실시 형태 12에 따른 삼차원 데이터 복호 처리의 플로차트이다.
도 133은, 실시 형태 12에 따른 삼차원 데이터 부호화 장치의 블럭도이다.
도 134는, 실시 형태 12에 따른 삼차원 데이터 복호 장치의 블럭도이다.
도 135는, 실시 형태 12에 따른 삼차원 데이터 부호화 처리의 플로차트이다.
도 136은, 실시 형태 12에 따른 삼차원 데이터 복호 처리의 플로차트이다.
도 137은, 실시 형태 13에 따른 슬라이스 또는 타일 분할을 행하지 않는 경우와 행하는 경우에 있어서의, 메모리, 요구 실시간, 현행의 복호 시간 및 거리를 나타내는 도면이다.
도 138은, 실시 형태 13에 따른 타일 또는 슬라이스 분할의 예를 나타내는 도면이다.
도 139는, 실시 형태 13에 따른 8진 트리 분할의 카운트수를 소트하는 수법의 예를 나타내는 도면이다.
도 140은, 실시 형태 13에 따른 타일 또는 슬라이스 분할의 예를 나타내는 도면이다.
도 141은, 실시 형태 13에 따른 비트 스트림의 구성예를 나타내는 도면이다.
도 142는, 실시 형태 13에 따른 SEI의 구성예를 나타내는 도면이다.
도 143은, 실시 형태 13에 따른 SEI의 신택스예를 나타내는 도면이다.
도 144는, 실시 형태 13에 따른 삼차원 데이터 복호 장치의 구성예를 나타내는 도면이다.
도 145는, 실시 형태 13에 따른 타일 또는 슬라이스의 데이터의 취득 동작을 설명하기 위한 도면이다.
도 146은, 실시 형태 13에 따른 타일 또는 슬라이스의 데이터의 취득 동작을 설명하기 위한 도면이다.
도 147은, 실시 형태 13에 따른 SEI의 테스트 동작을 나타내는 도면이다.
도 148은, 실시 형태 13에 따른 SEI의 테스트 동작을 나타내는 도면이다.
도 149는, 실시 형태 13에 따른 삼차원 데이터 부호화 처리의 플로차트이다.
도 150은, 실시 형태 13에 따른 삼차원 데이터 복호 처리의 플로차트이다.
도 151은, 실시 형태 13에 따른 삼차원 데이터 부호화 장치의 블럭도이다.
도 152는, 실시 형태 13에 따른 삼차원 데이터 복호 장치의 블럭도이다.
도 153은, 실시 형태 13에 따른 삼차원 데이터 부호화 처리의 플로차트이다.
도 154는, 실시 형태 13에 따른 삼차원 데이터 복호 처리의 플로차트이다.
본 개시의 일 양태에 따른 삼차원 데이터 부호화 방법은, 복수의 삼차원점이 포함되는 대상 공간에 포함되는 복수의 서브 공간을 부호화함으로써 상기 복수의 서브 공간에 대응하는 복수의 부호화 데이터를 포함하는 비트 스트림을 생성하고, 상기 비트 스트림의 생성에서는, 상기 비트 스트림에 포함되는, 상기 복수의 부호화 데이터에 공통인 제1 제어 정보에, 상기 복수의 서브 공간에 할당된 복수의 식별자에 대응지어진 상기 복수의 서브 공간의 정보의 일람을 저장하고, 상기 복수의 부호화 데이터의 각각의 헤더에, 당해 부호화 데이터에 대응하는 상기 서브 공간에 할당된 식별자를 저장한다.
이에 의하면, 삼차원 데이터 복호 장치는, 당해 삼차원 데이터 부호화 방법으로 생성된 비트 스트림을 복호할 때에, 제1 제어 정보에 저장된 복수의 식별자에 대응지어진 복수의 서브 공간의 정보의 일람과, 복수의 부호화 데이터의 각각의 헤더에 저장된 식별자를 참조하여, 원하는 부호화 데이터를 취득할 수 있다. 따라서, 삼차원 데이터 복호 장치의 처리량을 저감할 수 있다.
예를 들면, 상기 비트 스트림에 있어서, 상기 제1 제어 정보는, 상기 복수의 부호화 데이터의 앞에 배치되어도 된다.
예를 들면, 상기 일람은, 상기 복수의 서브 공간의 위치 정보를 포함해도 된다.
예를 들면, 상기 일람은, 상기 복수의 서브 공간의 사이즈 정보를 포함해도 된다.
예를 들면, 상기 삼차원 데이터 부호화 방법은, 상기 제1 제어 정보를, 상기 비트 스트림 송신처의 시스템의 프로토콜에 있어서의 제2 제어 정보로 변환해도 된다.
이에 의하면, 당해 삼차원 데이터 부호화 방법은, 비트 스트림 송신처의 시스템의 프로토콜에 따라, 제어 정보를 변환할 수 있다.
예를 들면, 상기 제2 제어 정보는, 상기 프로토콜에 있어서의 랜덤 액세스를 위한 테이블이어도 된다.
예를 들면, 상기 제2 제어 정보는, ISOBMFF에 있어서의 mdat box 또는 track box여도 된다.
본 개시의 일 양태에 따른 삼차원 데이터 복호 방법은, 복수의 삼차원점이 포함되는 대상 공간에 포함되는 복수의 서브 공간을 부호화함으로써 얻어진, 상기 복수의 서브 공간에 대응하는 복수의 부호화 데이터를 포함하는 비트 스트림을 복호하고, 상기 비트 스트림의 복호에서는, 상기 복수의 서브 공간 중 복호 대상의 서브 공간을 결정하고, 상기 비트 스트림에 포함되는, 상기 복수의 부호화 데이터에 공통인 제1 제어 정보에 포함되는, 상기 복수의 서브 공간에 할당된 복수의 식별자에 대응지어진 상기 복수의 서브 공간의 정보의 일람과, 상기 복수의 부호화 데이터의 각각의 헤더에 포함되는 당해 부호화 데이터에 대응하는 상기 서브 공간에 할당된 식별자를 이용하여, 상기 복호 대상의 서브 공간의 부호화 데이터를 취득한다.
이에 의하면, 당해 삼차원 데이터 복호 방법은, 제1 제어 정보에 저장된 복수의 식별자에 대응지어진 복수의 서브 공간의 정보의 일람과, 복수의 부호화 데이터의 각각의 헤더에 저장된 식별자를 참조하여, 원하는 부호화 데이터를 취득할 수 있다. 따라서, 삼차원 데이터 복호 장치의 처리량을 저감할 수 있다.
예를 들면, 상기 비트 스트림에 있어서, 상기 제1 제어 정보는, 상기 복수의 부호화 데이터의 앞에 배치되어도 된다.
예를 들면, 상기 일람은, 상기 복수의 서브 공간의 위치 정보를 포함해도 된다.
예를 들면, 상기 일람은, 상기 복수의 서브 공간의 사이즈 정보를 포함해도 된다.
또한, 본 개시의 일 양태에 따른 삼차원 데이터 부호화 장치는, 속성 정보를 갖는 복수의 삼차원점을 부호화하는 삼차원 데이터 부호화 장치로서, 프로세서와 메모리를 구비하고, 상기 프로세서는, 상기 메모리를 이용하여, 복수의 삼차원점이 포함되는 대상 공간에 포함되는 복수의 서브 공간을 부호화함으로써 상기 복수의 서브 공간에 대응하는 복수의 부호화 데이터를 포함하는 비트 스트림을 생성하고, 상기 비트 스트림의 생성에서는, 상기 비트 스트림에 포함되는, 상기 복수의 부호화 데이터에 공통인 제1 제어 정보에, 상기 복수의 서브 공간에 할당된 복수의 식별자에 대응지어진 상기 복수의 서브 공간의 정보의 일람을 저장하고, 상기 복수의 부호화 데이터의 각각의 헤더에, 당해 부호화 데이터에 대응하는 상기 서브 공간에 할당된 식별자를 저장한다.
이에 의하면, 삼차원 데이터 복호 장치는, 당해 삼차원 데이터 부호화 장치에서 생성된 비트 스트림을 복호할 때에, 제1 제어 정보에 저장된 복수의 식별자에 대응지어진 복수의 서브 공간의 정보의 일람과, 복수의 부호화 데이터의 각각의 헤더에 저장된 식별자를 참조하여, 원하는 부호화 데이터를 취득할 수 있다. 따라서, 삼차원 데이터 복호 장치의 처리량을 저감할 수 있다.
또한, 본 개시의 일 양태에 따른 삼차원 데이터 복호 장치는, 속성 정보를 갖는 복수의 삼차원점을 복호하는 삼차원 데이터 복호 장치로서, 프로세서와 메모리를 구비하고, 상기 프로세서는, 상기 메모리를 이용하여, 복수의 삼차원점이 포함되는 대상 공간에 포함되는 복수의 서브 공간을 부호화함으로써 얻어진, 상기 복수의 서브 공간에 대응하는 복수의 부호화 데이터를 포함하는 비트 스트림을 복호하고, 상기 비트 스트림의 복호에서는, 상기 복수의 서브 공간 중 복호 대상의 서브 공간을 결정하고, 상기 비트 스트림에 포함되는, 상기 복수의 부호화 데이터에 공통인 제1 제어 정보에 포함되는, 상기 복수의 서브 공간에 할당된 복수의 식별자에 대응지어진 상기 복수의 서브 공간의 정보의 일람과, 상기 복수의 부호화 데이터의 각각의 헤더에 포함되는 당해 부호화 데이터에 대응하는 상기 서브 공간에 할당된 식별자를 이용하여, 상기 복호 대상의 서브 공간의 부호화 데이터를 취득한다.
이에 의하면, 당해 삼차원 데이터 복호 장치는, 제1 제어 정보에 저장된 복수의 식별자에 대응지어진 복수의 서브 공간의 정보의 일람과, 복수의 부호화 데이터의 각각의 헤더에 저장된 식별자를 참조하여, 원하는 부호화 데이터를 취득할 수 있다. 따라서, 삼차원 데이터 복호 장치의 처리량을 저감할 수 있다.
또한, 이들 포괄적 또는 구체적인 양태는, 시스템, 방법, 집적회로, 컴퓨터 프로그램 또는 컴퓨터 판독 가능한 CD-ROM 등의 기록 매체로 실현되어도 되고, 시스템, 방법, 집적회로, 컴퓨터 프로그램 및 기록 매체의 임의인 조합으로 실현되어도 된다.
이하, 실시형태에 대해, 도면을 참조하면서 구체적으로 설명한다. 또한, 이하에서 설명하는 실시형태는, 모두 본 개시의 한 구체예를 나타내는 것이다. 이하의 실시형태에서 나타내어지는 수치, 형상, 재료, 구성 요소, 구성 요소의 배치 위치 및 접속 형태, 단계, 단계의 순서 등은 일례이며, 본 개시를 한정하는 주지는 아니다. 또, 이하의 실시형태에 있어서의 구성 요소 중, 최상위 개념을 나타내는 독립 청구항에 기재되어 있지 않은 구성 요소에 대해서는, 임의의 구성 요소로서 설명된다.
(실시형태 1)
우선, 본 실시형태에 따른 부호화 삼차원 데이터(이하, 부호화 데이터라고도 기재한다)의 데이터 구조에 대해 설명한다. 도 1은, 본 실시형태에 따른 부호화 삼차원 데이터의 구성을 나타낸 도면이다.
본 실시형태에서는, 삼차원 공간은, 동화상의 부호화에 있어서의 픽처에 상당하는 스페이스(SPC)로 분할되고, 스페이스를 단위로서 삼차원 데이터가 부호화된다. 스페이스는, 또한, 동화상 부호화에 있어서의 매크로 블록 등에 상당하는 볼륨(VLM)으로 분할되고, VLM을 단위로서 예측 및 변환이 행해진다. 볼륨은, 위치 좌표가 대응지어지는 최소 단위인 복수의 복셀(VXL)을 포함한다. 또한, 예측이란, 이차원 화상에서 행해지는 예측과 마찬가지로, 다른 처리 단위를 참조하여, 처리 대상의 처리 단위와 유사한 예측 삼차원 데이터를 생성하며, 당해 예측 삼차원 데이터와 처리 대상의 처리 단위의 차분을 부호화하는 것이다. 또, 이 예측은, 동일 시각의 다른 예측 단위를 참조하는 공간 예측뿐만 아니라, 상이한 시각의 예측 단위를 참조하는 시간 예측을 포함한다.
예를 들어, 삼차원 데이터 부호화 장치(이하, 부호화 장치라고 기재한다)는, 포인트 클라우드 등의 점군 데이터에 의해 표현되는 삼차원 공간을 부호화할 때에는, 복셀의 사이즈에 따라, 점군의 각 점, 또는, 복셀 내에 포함되는 복수점을 묶어서 부호화한다. 복셀을 세분화하면 점군의 삼차원 형상을 고정밀도로 표현할 수 있고, 복셀의 사이즈를 크게 하면 점군의 삼차원 형상을 대략적으로 표현할 수 있다.
또한, 이하에서는, 삼차원 데이터가 포인트 클라우드인 경우를 예로 설명을 행하는데, 삼차원 데이터는 포인트 클라우드에 한정되지 않으며, 임의 형식의 삼차원 데이터이면 된다.
또, 계층 구조의 복셀을 이용해도 된다. 이 경우, n차의 계층에서는, n-1차 이하의 계층(n차의 계층의 하층)에 샘플점이 존재하는지의 여부를 차례로 나타내도 된다. 예를 들어, n차의 계층만을 복호할 때에 있어서, n-1차 이하의 계층에 샘플점이 존재하는 경우는, n차 계층의 복셀의 중심에 샘플점이 존재한다고 간주하여 복호할 수 있다.
또, 부호화 장치는, 점군 데이터를, 거리 센서, 스테레오 카메라, 단안 카메라, 자이로, 또는 관성 센서 등을 이용하여 취득한다.
스페이스는, 동화상의 부호화와 마찬가지로, 단독으로 복호 가능한 인트라·스페이스(I-SPC), 단방향의 참조만 가능한 프리딕티브·스페이스(P-SPC), 및, 양방향의 참조가 가능한 바이디렉셔널·스페이스(B-SPC)를 포함하는 적어도 3개의 예측 구조 중 어느 하나로 분류된다. 또, 스페이스는 복호 시각과 표시 시각의 2종류의 시각 정보를 갖는다.
또, 도 1에 나타낸 바와 같이, 복수의 스페이스를 포함하는 처리 단위로서, 랜덤 액세스 단위인 GOS(Group Of Space)가 존재한다. 또한, 복수의 GOS를 포함하는 처리 단위로서 월드(WLD)가 존재한다.
월드가 차지하는 공간 영역은, GPS 또는 위도 및 경도 정보 등에 의해, 지구상의 절대 위치와 대응지어진다. 이 위치 정보는 메타 정보로서 저장된다. 또한, 메타 정보는, 부호화 데이터에 포함되어도 되고, 부호화 데이터와는 별도로 전송되어도 된다.
또, GOS 내에서는, 모든 SPC가 삼차원적으로 인접해도 되고, 다른 SPC와 삼차원적으로 인접하지 않는 SPC가 존재해도 된다.
또한, 이하에서는, GOS, SPC 또는 VLM 등의 처리 단위에 포함되는 삼차원 데이터에 대한, 부호화, 복호 또는 참조 등의 처리를, 단순히, 처리 단위를 부호화, 복호 또는 참조하는 등이라고 기재한다. 또, 처리 단위에 포함되는 삼차원 데이터는, 예를 들어, 삼차원 좌표 등의 공간 위치와, 색 정보 등의 특성값 중 적어도 하나의 세트를 포함한다.
다음으로, GOS에 있어서의 SPC의 예측 구조에 대해 설명한다. 동일 GOS 내의 복수의 SPC, 또는, 동일 SPC 내의 복수의 VLM은, 서로 상이한 공간을 차지하나, 동일한 시각 정보(복호 시각 및 표시 시각)를 갖는다.
또, GOS 내에서 복호순으로 선두가 되는 SPC는 I-SPC이다. 또, GOS에는 클로즈드 GOS와 오픈 GOS의 2종류가 존재한다. 클로즈드 GOS는, 선두 I-SPC로부터 복호 개시할 때에, GOS 내의 모든 SPC를 복호할 수 있는 GOS이다. 오픈 GOS에서는, GOS 내에서 선두 I-SPC보다 표시 시각이 앞이 되는 일부의 SPC는 상이한 GOS를 참조하고 있으며, 당해 GOS만으로 복호를 행할 수 없다.
또한, 지도 정보 등의 부호화 데이터에서는, WLD를 부호화순과는 역방향으로 복호하는 경우가 있으며, GOS 사이에 의존성이 있으면 역방향 재생이 어렵다. 따라서, 이러한 경우에는, 기본적으로는 클로즈드 GOS가 이용된다.
또, GOS는, 높이 방향으로 레이어 구조를 갖고, 아래의 레이어의 SPC로부터 차례로 부호화 또는 복호가 행해진다.
도 2는 GOS의 최하층 레이어에 속하는 SPC 사이의 예측 구조의 일례를 나타낸 도면이다. 도 3은 레이어 사이의 예측 구조의 일례를 나타낸 도면이다.
GOS 내에는 1개 이상의 I-SPC가 존재한다. 삼차원 공간 내에는, 사람, 동물, 차, 자전거, 신호, 또는 랜드마크가 되는 건물 등의 오브젝트가 존재하는데, 특히 사이즈가 작은 오브젝트는 I-SPC로서 부호화하면 유효하다. 예를 들어, 삼차원 데이터 복호 장치(이하, 복호 장치라고 기재한다)는, GOS를 저처리량 또는 고속으로 복호할 때에는, GOS 내의 I-SPC만을 복호한다.
또, 부호화 장치는, WLD 내의 오브젝트의 소밀함에 따라 I-SPC의 부호화 간격 또는 출현 빈도를 전환해도 된다.
또, 도 3에 나타낸 구성에 있어서, 부호화 장치 또는 복호 장치는, 복수의 레이어를 하층(레이어 1)으로부터 차례로 부호화 또는 복호한다. 이에 의해, 예를 들어 자동 주행차 등의 경우에는 보다 정보량이 많은 지면 부근의 데이터의 우선도를 올릴 수 있다.
또한, 드론 등에서 이용되는 부호화 데이터에서는, GOS 내에 있어서 높이 방향으로 위의 레이어의 SPC로부터 차례로 부호화 또는 복호해도 된다.
또, 부호화 장치 또는 복호 장치는, 복호 장치가 러프하게 GOS를 파악할 수 있고, 서서히 해상도를 올릴 수 있도록, 복수의 레이어를 부호화 또는 복호해도 된다. 예를 들어, 부호화 장치 또는 복호 장치는, 레이어 3, 8, 1, 9…의 순으로 부호화 또는 복호해도 된다.
다음으로, 정적 오브젝트 및 동적 오브젝트의 취급 방법에 대해 설명한다.
삼차원 공간에는, 건물 또는 도로 등 정적인 오브젝트 또는 씬(이후, 묶음 정적 오브젝트라고 부른다)과, 차 또는 사람 등의 동적인 오브젝트(이후, 동적 오브젝트라고 부른다)가 존재한다. 오브젝트의 검출은, 포인트 클라우드의 데이터, 또는, 스테레오 카메라 등의 카메라 영상 등으로부터 특징점을 추출하거나 하여, 별도 행해진다. 여기에서는, 동적 오브젝트의 부호화 방법의 예에 대해 설명한다.
제1 방법은, 정적 오브젝트와 동적 오브젝트를 구별하지 않고 부호화하는 방법이다. 제2 방법은, 정적 오브젝트와 동적 오브젝트를 식별 정보에 의해 구별하는 방법이다.
예를 들어, GOS가 식별 단위로서 이용된다. 이 경우, 정적 오브젝트를 구성하는 SPC만을 포함하는 GOS와, 동적 오브젝트를 구성하는 SPC를 포함하는 GOS가, 부호화 데이터 내, 또는 부호화 데이터와는 별도 저장되는 식별 정보에 의해 구별된다.
또는, SPC가 식별 단위로서 이용되어도 된다. 이 경우, 정적 오브젝트를 구성하는 VLM만을 포함하는 SPC와, 동적 오브젝트를 구성하는 VLM을 포함하는 SPC가, 상기 식별 정보에 의해 구별된다.
또는, VLM 혹은 VXL이 식별 단위로서 이용되어도 된다. 이 경우, 정적 오브젝트만을 포함하는 VLM 또는 VXL과, 동적 오브젝트를 포함하는 VLM 또는 VXL이 상기 식별 정보에 의해 구별된다.
또, 부호화 장치는, 동적 오브젝트를 1 이상의 VLM 또는 SPC로서 부호화하고, 정적 오브젝트를 포함하는 VLM 또는 SPC와, 동적 오브젝트를 포함하는 SPC를, 서로 상이한 GOS로서 부호화해도 된다. 또, 부호화 장치는, 동적 오브젝트의 사이즈에 따라 GOS의 사이즈가 가변이 되는 경우에는, GOS의 사이즈를 메타 정보로서 별도 저장한다.
또, 부호화 장치는, 정적 오브젝트와 동적 오브젝트를 서로 독립하여 부호화하고, 정적 오브젝트로부터 구성되는 월드에 대해, 동적 오브젝트를 중첩해도 된다. 이때, 동적 오브젝트는 1 이상의 SPC로부터 구성되고, 각 SPC는, 당해 SPC가 중첩되는 정적 오브젝트를 구성하는 1 이상의 SPC에 대응지어진다. 또한, 동적 오브젝트를 SPC가 아닌, 1 이상의 VLM 또는 VXL에 의해 표현해도 된다.
또, 부호화 장치는, 정적 오브젝트와 동적 오브젝트를 서로 상이한 스트림으로서 부호화해도 된다.
또, 부호화 장치는, 동적 오브젝트를 구성하는 1 이상의 SPC를 포함하는 GOS를 생성해도 된다. 또한, 부호화 장치는, 동적 오브젝트를 포함하는 GOS(GOS_M)와, GOS_M의 공간 영역에 대응하는 정적 오브젝트의 GOS를 동일 사이즈(동일한 공간 영역을 차지한다)로 설정해도 된다. 이에 의해, GOS 단위로 중첩 처리를 행할 수 있다.
동적 오브젝트를 구성하는 P-SPC 또는 B-SPC는, 부호화가 완료된 상이한 GOS에 포함되는 SPC를 참조해도 된다. 동적 오브젝트의 위치가 시간적으로 변화하고, 동일한 동적 오브젝트가 상이한 시각의 GOS로서 부호화되는 케이스에서는, GOS에 걸쳐 있는 참조가 압축율의 관점에서 유효해진다.
또, 부호화 데이터의 용도에 따라, 상기의 제1 방법과 제2 방법을 전환해도 된다. 예를 들어, 부호화 삼차원 데이터를 지도로서 이용하는 경우는, 동적 오브젝트를 분리할 수 있는 것이 바람직하기 때문에, 부호화 장치는, 제2 방법을 이용한다. 한편, 부호화 장치는, 콘서트 또는 스포츠 등의 이벤트의 삼차원 데이터를 부호화하는 경우에, 동적 오브젝트를 분리할 필요가 없으면, 제1 방법을 이용한다.
또, GOS 또는 SPC의 복호 시각과 표시 시각은 부호화 데이터 내, 또는 메타 정보로서 저장할 수 있다. 또, 정적 오브젝트의 시각 정보는 모두 동일해도 된다. 이때, 실제의 복호 시각과 표시 시각은, 복호 장치가 결정하는 것으로 해도 된다. 혹은, 복호 시각으로서, GOS, 혹은, SPC마다 상이한 값이 부여되고, 표시 시각으로서 모두 동일한 값이 부여되어도 된다. 또한, HEVC의 HRD(Hypothetical Reference Decoder) 등 동화상 부호화에 있어서의 디코더 모델과 같이, 디코더가 소정 사이즈의 버퍼를 갖고, 복호 시각에 따라 소정의 비트 레이트로 비트 스트림을 읽어들이면 파탄없이 복호할 수 있는 것을 보증하는 모델을 도입해도 된다.
다음으로, 월드 내에 있어서의 GOS의 배치에 대해 설명한다. 월드에 있어서의 삼차원 공간의 좌표는, 서로 직교하는 3개의 좌표축(x축, y축, z축)에 의해 표현된다. GOS의 부호화순으로 소정의 룰을 설정함으로써, 공간적으로 인접하는 GOS가 부호화 데이터 내에서 연속하도록 부호화를 행할 수 있다. 예를 들어, 도 4에 나타낸 예에서는, xz 평면 내의 GOS를 연속적으로 부호화한다. 어느 xz 평면 내의 모든 GOS의 부호화 종료 후에 y축의 값을 갱신한다. 즉, 부호화가 진행됨에 따라, 월드는 y축 방향으로 신장해 간다. 또, GOS의 인덱스 번호는 부호화순으로 설정된다.
여기서, 월드의 삼차원 공간은, GPS, 혹은 위도 및 경도 등의 지리적인 절대 좌표와 1대 1로 대응지어 둔다. 혹은, 미리 설정한 기준 위치로부터의 상대 위치에 의해 삼차원 공간이 표현되어도 된다. 삼차원 공간의 x축, y축, z축의 방향은, 위도 및 경도 등에 의거하여 결정되는 방향 벡터로서 표현되고, 당해 방향 벡터는 메타 정보로서 부호화 데이터와 함께 저장된다.
또, GOS의 사이즈는 고정으로 하고, 부호화 장치는, 당해 사이즈를 메타 정보로서 저장한다. 또, GOS의 사이즈는, 예를 들어, 도시부인지의 여부, 또는, 실내인지 바깥인지 등에 따라 전환되어도 된다. 즉, GOS의 사이즈는, 정보로서의 가치가 있는 오브젝트의 양 또는 성질에 따라 전환되어도 된다. 혹은, 부호화 장치는, 동일 월드 내에 있어서, 오브젝트의 밀도 등에 따라, GOS의 사이즈, 또는, GOS 내의 I-SPC의 간격을 적응적으로 전환해도 된다. 예를 들어, 부호화 장치는, 오브젝트의 밀도가 높을수록, GOS의 사이즈를 작게 하고, GOS 내의 I-SPC의 간격을 짧게 한다.
도 5의 예에서는, 3번째부터 10번째의 GOS의 영역에서는, 오브젝트의 밀도가 높기 때문에, 세세한 입도에서의 랜덤 액세스를 실현하기 위해, GOS가 세분화되어 있다. 또한, 7번째부터 10번째의 GOS는, 각각, 3번째부터 6번째의 GOS의 안쪽에 존재한다.
다음으로, 본 실시형태에 따른 삼차원 데이터 부호화 장치의 구성 및 동작의 흐름을 설명한다. 도 6은, 본 실시형태에 따른 삼차원 데이터 부호화 장치(100)의 블록도이다. 도 7은, 삼차원 데이터 부호화 장치(100)의 동작예를 나타낸 플로차트이다.
도 6에 나타낸 삼차원 데이터 부호화 장치(100)는, 삼차원 데이터(111)를 부호화함으로써 부호화 삼차원 데이터(112)를 생성한다. 이 삼차원 데이터 부호화 장치(100)는, 취득부(101)와, 부호화 영역 결정부(102)와, 분할부(103)와, 부호화부(104)를 구비한다.
도 7에 나타낸 바와 같이, 우선, 취득부(101)는, 점군 데이터인 삼차원 데이터(111)를 취득한다(S101).
다음으로, 부호화 영역 결정부(102)는, 취득한 점군 데이터에 대응하는 공간 영역 중, 부호화 대상의 영역을 결정한다(S102). 예를 들어, 부호화 영역 결정부(102)는, 유저 또는 차량의 위치에 따라, 당해 위치의 주변의 공간 영역을 부호화 대상의 영역으로 결정한다.
다음으로, 분할부(103)는, 부호화 대상의 영역에 포함되는 점군 데이터를, 각 처리 단위로 분할한다. 여기서 처리 단위란, 상술한 GOS 및 SPC 등이다. 또, 이 부호화 대상의 영역은, 예를 들어, 상술한 월드에 대응한다. 구체적으로는, 분할부(103)는, 미리 설정한 GOS의 사이즈, 또는, 동적 오브젝트의 유무 혹은 사이즈에 의거하여, 점군 데이터를 처리 단위로 분할한다(S103). 또, 분할부(103)는, 각 GOS에 있어서 부호화순으로 선두가 되는 SPC의 개시 위치를 결정한다.
다음으로, 부호화부(104)는, 각 GOS 내의 복수의 SPC를 순차적으로 부호화함으로써 부호화 삼차원 데이터(112)를 생성한다(S104).
또한, 여기서는, 부호화 대상의 영역을 GOS 및 SPC로 분할한 후에, 각 GOS를 부호화하는 예를 나타냈는데, 처리의 순서는 상기에 한정되지 않는다. 예를 들어, 하나의 GOS의 구성을 결정한 후에 그 GOS를 부호화하고, 그 후, 다음의 GOS의 구성을 결정하는 등의 순서를 이용해도 된다.
이와 같이, 삼차원 데이터 부호화 장치(100)는, 삼차원 데이터(111)를 부호화함으로써 부호화 삼차원 데이터(112)를 생성한다. 구체적으로는, 삼차원 데이터 부호화 장치(100)는, 삼차원 데이터를, 랜덤 액세스 단위이며, 각각이 삼차원 좌표에 대응지어져 있는 제1 처리 단위(GOS)로 분할하고, 제1 처리 단위(GOS)를 복수의 제2 처리 단위(SPC)로 분할하며, 제2 처리 단위(SPC)를 복수의 제3 처리 단위(VLM)로 분할한다. 또, 제3 처리 단위(VLM)는, 위치 정보가 대응지어지는 최소 단위인 1 이상의 복셀(VXL)을 포함한다.
다음으로, 삼차원 데이터 부호화 장치(100)는, 복수의 제1 처리 단위(GOS)의 각각을 부호화함으로써 부호화 삼차원 데이터(112)를 생성한다. 구체적으로는, 삼차원 데이터 부호화 장치(100)는, 각 제1 처리 단위(GOS)에 있어서, 복수의 제2 처리 단위(SPC)의 각각을 부호화한다. 또, 삼차원 데이터 부호화 장치(100)는, 각 제2 처리 단위(SPC)에 있어서, 복수의 제3 처리 단위(VLM)의 각각을 부호화한다.
예를 들어, 삼차원 데이터 부호화 장치(100)는, 처리 대상의 제1 처리 단위(GOS)가 클로즈드 GOS인 경우에는, 처리 대상의 제1 처리 단위(GOS)에 포함되는 처리 대상의 제2 처리 단위(SPC)를, 처리 대상의 제1 처리 단위(GOS)에 포함되는 다른 제2 처리 단위(SPC)를 참조하여 부호화한다. 즉, 삼차원 데이터 부호화 장치(100)는, 처리 대상의 제1 처리 단위(GOS)와는 상이한 제1 처리 단위(GOS)에 포함되는 제2 처리 단위(SPC)를 참조하지 않는다.
한편, 처리 대상의 제1 처리 단위(GOS)가 오픈 GOS인 경우에는, 처리 대상의 제1 처리 단위(GOS)에 포함되는 처리 대상의 제2 처리 단위(SPC)를, 처리 대상의 제1 처리 단위(GOS)에 포함되는 다른 제2 처리 단위(SPC), 또는, 처리 대상의 제1 처리 단위(GOS)와는 상이한 제1 처리 단위(GOS)에 포함되는 제2 처리 단위(SPC)를 참조하여 부호화한다.
또, 삼차원 데이터 부호화 장치(100)는, 처리 대상의 제2 처리 단위(SPC)의 타입으로서, 다른 제2 처리 단위(SPC)를 참조하지 않는 제1 타입(I-SPC), 다른 하나의 제2 처리 단위(SPC)를 참조하는 제2 타입(P-SPC), 및 다른 두 개의 제2 처리 단위(SPC)를 참조하는 제3 타입 중 어느 하나를 선택하고, 선택한 타입에 따라 처리 대상의 제2 처리 단위(SPC)를 부호화한다.
다음으로, 본 실시형태에 따른 삼차원 데이터 복호 장치의 구성 및 동작의 흐름을 설명한다. 도 8은, 본 실시형태에 따른 삼차원 데이터 복호 장치(200)의 블록의 블록도이다. 도 9는, 삼차원 데이터 복호 장치(200)의 동작예를 나타낸 플로차트이다.
도 8에 나타낸 삼차원 데이터 복호 장치(200)는, 부호화 삼차원 데이터(211)를 복호함으로써 복호 삼차원 데이터(212)를 생성한다. 여기서, 부호화 삼차원 데이터(211)는, 예를 들어, 삼차원 데이터 부호화 장치(100)에서 생성된 부호화 삼차원 데이터(112)이다. 이 삼차원 데이터 복호 장치(200)는, 취득부(201)와, 복호 개시 GOS 결정부(202)와, 복호 SPC 결정부(203)와, 복호부(204)를 구비한다.
우선, 취득부(201)는, 부호화 삼차원 데이터(211)를 취득한다(S201). 다음으로, 복호 개시 GOS 결정부(202)는, 복호 대상의 GOS로 결정한다(S202). 구체적으로는, 복호 개시 GOS 결정부(202)는, 부호화 삼차원 데이터(211) 내, 또는 부호화 삼차원 데이터와는 별도로 저장된 메타 정보를 참조하여, 복호를 개시하는 공간 위치, 오브젝트, 또는, 시각에 대응하는 SPC를 포함하는 GOS를 복호 대상의 GOS로 결정한다.
다음으로, 복호 SPC 결정부(203)는, GOS 내에서 복호하는 SPC의 타입(I, P, B)을 결정한다(S203). 예를 들어, 복호 SPC 결정부(203)는, (1) I-SPC만을 복호할지, (2) I-SPC 및 P-SPC를 복호할지, (3) 모든 타입을 복호할지를 결정한다. 또한, 모든 SPC를 복호하는 등, 미리 복호하는 SPC의 타입이 결정되어 있는 경우는, 본 단계는 행해지지 않아도 된다.
다음으로, 복호부(204)는, GOS 내에서 복호순(부호화순과 동일)으로 선두가 되는 SPC가 부호화 삼차원 데이터(211) 내에서 개시하는 어드레스 위치를 취득하고, 당해 어드레스 위치로부터 선두 SPC의 부호화 데이터를 취득하며, 당해 선두 SPC로부터 차례로 각 SPC를 순차적으로 복호한다(S204). 또한, 상기 어드레스 위치는, 메타 정보 등에 저장되어 있다.
이와 같이, 삼차원 데이터 복호 장치(200)는, 복호 삼차원 데이터(212)를 복호한다. 구체적으로는, 삼차원 데이터 복호 장치(200)는, 랜덤 액세스 단위이며, 각각이 삼차원 좌표에 대응지어져 있는 제1 처리 단위(GOS)의 부호화 삼차원 데이터(211)의 각각을 복호함으로써 제1 처리 단위(GOS)의 복호 삼차원 데이터(212)를 생성한다. 보다 구체적으로는, 삼차원 데이터 복호 장치(200)는, 각 제1 처리 단위(GOS)에 있어서, 복수의 제2 처리 단위(SPC)의 각각을 복호한다. 또, 삼차원 데이터 복호 장치(200)는, 각 제2 처리 단위(SPC)에 있어서, 복수의 제3 처리 단위(VLM)의 각각을 복호한다.
이하, 랜덤 액세스용의 메타 정보에 대해 설명한다. 이 메타 정보는, 삼차원 데이터 부호화 장치(100)에서 생성되고, 부호화 삼차원 데이터(112(211))에 포함된다.
종래의 이차원의 동화상에 있어서의 랜덤 액세스에서는, 지정한 시각의 근방이 되는 랜덤 액세스 단위의 선두 프레임으로부터 복호를 개시하고 있었다. 한편, 월드에 있어서는, 시각에 추가하여, 공간(좌표 또는 오브젝트 등)에 대한 랜덤 액세스가 상정된다.
그래서, 적어도 좌표, 오브젝트, 및 시각의 3개의 요소로의 랜덤 액세스를 실현하기 위해, 각 요소와 GOS의 인덱스 번호를 대응짓는 테이블을 준비한다. 또한, GOS의 인덱스 번호와 GOS의 선두가 되는 I-SPC의 어드레스를 대응짓는다. 도 10은, 메타 정보에 포함되는 테이블의 일례를 나타낸 도면이다. 또한, 도 10에 나타낸 모든 테이블이 이용될 필요는 없고, 적어도 하나의 테이블이 이용되면 된다.
이하, 일례로서, 좌표를 기점으로 하는 랜덤 액세스에 대해 설명한다. 좌표(x2, y2, z2)에 액세스할 때에는, 우선, 좌표-GOS 테이블을 참조하여, 좌표가 (x2, y2, z2)인 지점은 2번째의 GOS에 포함되는 것을 알 수 있다. 다음으로, GOS 어드레스 테이블을 참조하여, 2번째의 GOS에 있어서의 선두의 I-SPC의 어드레스가 addr(2)인 것을 알 수 있기 때문에, 복호부(204)는, 이 어드레스로부터 데이터를 취득하여 복호를 개시한다.
또한, 어드레스는, 논리 포맷에 있어서의 어드레스여도, HDD 또는 메모리의 물리 어드레스여도 된다. 또, 어드레스를 대신하여 파일 세그먼트를 특정하는 정보가 이용되어도 된다. 예를 들어, 파일 세그먼트는, 1개 이상의 GOS 등을 세그먼트화한 단위이다.
또, 오브젝트가 복수의 GOS에 걸쳐 있는 경우에는, 오브젝트-GOS 테이블에 있어서, 오브젝트가 속하는 GOS를 복수 나타내도 된다. 당해 복수의 GOS가 클로즈드 GOS이면, 부호화 장치 및 복호 장치는, 병렬로 부호화 또는 복호를 행할 수 있다. 한편, 당해 복수의 GOS가 오픈 GOS이면, 복수의 GOS가 서로 참조함으로써 보다 압축 효율을 높일 수 있다.
오브젝트의 예로는, 사람, 동물, 차, 자전거, 신호, 또는 랜드마크가 되는 건물 등이 있다. 예를 들어, 삼차원 데이터 부호화 장치(100)는, 월드의 부호화 시에 삼차원의 포인트 클라우드 등으로부터 오브젝트에 특유의 특징점을 추출하고, 당해 특징점에 의거하여 오브젝트를 검출하며, 검출한 오브젝트를 랜덤 액세스 포인트로서 설정할 수 있다.
이와 같이, 삼차원 데이터 부호화 장치(100)는, 복수의 제1 처리 단위(GOS)와, 복수의 제1 처리 단위(GOS)의 각각에 대응지어져 있는 삼차원 좌표를 나타내는 제1 정보를 생성한다. 또, 부호화 삼차원 데이터(112(211))는, 이 제1 정보를 포함한다. 또, 제1 정보는, 또한, 복수의 제1 처리 단위(GOS)의 각각에 대응지어져 있는, 오브젝트, 시각 및 데이터 저장처 중 적어도 하나를 나타낸다.
삼차원 데이터 복호 장치(200)는, 부호화 삼차원 데이터(211)로부터 제1 정보를 취득하고, 제1 정보를 이용하여, 지정된 삼차원 좌표, 오브젝트 또는 시각에 대응하는 제1 처리 단위의 부호화 삼차원 데이터(211)를 특정하며, 당해 부호화 삼차원 데이터(211)를 복호한다.
이하, 그 외의 메타 정보의 예에 대해 설명한다. 랜덤 액세스용의 메타 정보 외에, 삼차원 데이터 부호화 장치(100)는, 이하와 같은 메타 정보를 생성 및 저장해도 된다. 또, 삼차원 데이터 복호 장치(200)는, 이 메타 정보를 복호 시에 이용해도 된다.
삼차원 데이터를 지도 정보로서 이용하는 경우 등에는, 용도에 따라 프로파일이 규정되고, 당해 프로파일을 나타내는 정보가 메타 정보에 포함되어도 된다. 예를 들어, 시가지 혹은 교외용, 또는, 비행 물체용의 프로파일이 규정되고, 각각에 있어서 월드, SPC 또는 VLM의 최대 또는 최소 사이즈 등이 정의된다. 예를 들어, 시가지용에서는, 교외용보다 상세한 정보가 필요하기 때문에, VLM의 최소 사이즈가 작게 설정된다.
메타 정보는, 오브젝트의 종류를 나타내는 태그값을 포함해도 된다. 이 태그값은 오브젝트를 구성하는 VLM, SPC, 또는 GOS와 대응지어진다. 예를 들어, 태그값 「0」은 「사람」을 나타내고, 태그값 「1」은 「차」를 나타내며, 태그값 「2」는 「신호기」를 나타내는, 등 오브젝트의 종류마다 태그값이 설정되어도 된다. 또는, 오브젝트의 종류가 판정하기 어렵거나 또는 판정할 필요가 없는 경우는 사이즈, 또는, 동적 오브젝트나 정적 오브젝트 등의 성질을 나타낸 태그값이 이용되어도 된다.
또, 메타 정보는, 월드가 차지하는 공간 영역의 범위를 나타내는 정보를 포함해도 된다.
또, 메타 정보는, 부호화 데이터의 스트림 전체, 또는, GOS 내의 SPC 등, 복수의 SPC에 공통의 헤더 정보로서, SPC 또는 VXL의 사이즈를 저장해도 된다.
또, 메타 정보는, 포인트 클라우드의 생성에 이용한 거리 센서 혹은 카메라 등의 식별 정보, 또는, 포인트 클라우드 내의 점군의 위치 정밀도를 나타내는 정보를 포함해도 된다.
또, 메타 정보는, 월드가 정적 오브젝트만으로 구성되는지, 동적 오브젝트를 포함하는지를 나타내는 정보를 포함해도 된다.
이하, 본 실시 형태의 변형예에 대해 설명한다.
부호화 장치 또는 복호 장치는, 서로 상이한 2 이상의 SPC 또는 GOS를 병렬로 부호화 또는 복호해도 된다. 병렬로 부호화 또는 복호하는 GOS는, GOS의 공간 위치를 나타내는 메타 정보 등에 의거하여 결정할 수 있다.
삼차원 데이터를 차 또는 비행 물체 등이 이동할 때의 공간 지도로서 이용하거나, 또는 이러한 공간 지도를 생성하는 케이스 등에서는, 부호화 장치 또는 복호 장치는, GPS, 경로 정보, 또는 줌 배율 등에 의거하여 특정되는 공간에 포함되는 GOS 또는 SPC를 부호화 또는 복호해도 된다.
또, 복호 장치는, 자기 위치 또는 주행 경로에 가까운 공간으로부터 차례로 복호를 행해도 된다. 부호화 장치 또는 복호 장치는, 자기 위치 또는 주행 경로로부터 먼 공간을, 가까운 공간에 비해 우선도를 떨어뜨려 부호화 또는 복호해도 된다. 여기서, 우선도를 떨어뜨린다는 것은, 처리순을 내리거나, 해상도를 내리거나(솎아내어 처리하거나), 또는, 화질을 내리는(부호화 효율을 올린다. 예를 들어, 양자화 단계를 크게 한다.) 등이다.
또, 복호 장치는, 공간 내에서 계층적으로 부호화되어 있는 부호화 데이터를 복호할 때는, 저계층만을 복호해도 된다.
또, 복호 장치는, 지도의 줌 배율 또는 용도에 따라, 저계층으로부터 우선적으로 복호해도 된다.
또, 차 또는 로봇의 자율 주행 시에 행하는 자기 위치 추정 또는 물체 인식 등의 용도에서는, 부호화 장치 또는 복호 장치는, 노면으로부터 특정 높이 이내의 영역(인식을 행하는 영역) 이외는 해상도를 떨어뜨려 부호화 또는 복호를 행해도 된다.
또, 부호화 장치는, 실내와 실외의 공간 형상을 표현하는 포인트 클라우드를 각각 개별적으로 부호화해도 된다. 예를 들어, 실내를 표현하는 GOS(실내 GOS)와 실외를 표현하는 GOS(실외 GOS)를 나눔으로써, 복호 장치는, 부호화 데이터를 이용할 때에, 시점 위치에 따라 복호하는 GOS를 선택할 수 있다.
또, 부호화 장치는, 좌표가 가까운 실내 GOS와 실외 GOS를, 부호화 스트림 내에서 인접하도록 부호화해도 된다. 예를 들어, 부호화 장치는, 양자의 식별자를 대응짓고, 부호화 스트림 내, 또는 별도 저장되는 메타 정보 내에 대응지은 식별자를 나타내는 정보를 저장한다. 이에 의해, 복호 장치는, 메타 정보 내의 정보를 참조하여, 좌표가 가까운 실내 GOS와 실외 GOS를 식별할 수 있다.
또, 부호화 장치는, 실내 GOS와 실외 GOS에서, GOS 또는 SPC의 사이즈를 전환해도 된다. 예를 들어, 부호화 장치는, 실내에서는 실외에 비해 GOS의 사이즈를 작게 설정한다. 또, 부호화 장치는, 실내 GOS와 실외 GOS에서, 포인트 클라우드로부터 특징점을 추출할 때의 정밀도, 또는 오브젝트 검출의 정밀도 등을 변경해도 된다.
또, 부호화 장치는, 복호 장치가 동적 오브젝트를 정적 오브젝트와 구별하여 표시하기 위한 정보를 부호화 데이터에 부가해도 된다. 이에 의해, 복호 장치는, 동적 오브젝트와 적색 테두리 또는 설명용의 문자 등을 함께 표시할 수 있다. 또한, 복호 장치는, 동적 오브젝트를 대신하여 적색 테두리 또는 설명용의 문자만을 표시해도 된다. 또, 복호 장치는, 보다 세세한 오브젝트 종별을 표시해도 된다. 예를 들어, 차에는 적색 테두리가 이용되고, 사람에는 황색 테두리가 이용되어도 된다.
또, 부호화 장치 또는 복호 장치는, 동적 오브젝트의 출현 빈도, 또는, 정적 오브젝트와 동적 오브젝트의 비율 등에 따라, 동적 오브젝트와 정적 오브젝트를 상이한 SPC 또는 GOS로서 부호화 또는 복호할지의 여부를 결정해도 된다. 예를 들어, 동적 오브젝트의 출현 빈도 또는 비율이 역치를 초과하는 경우에는, 동적 오브젝트와 정적 오브젝트가 혼재하는 SPC 또는 GOS가 허용되고, 동적 오브젝트의 출현 빈도 또는 비율이 역치를 초과하지 않는 경우에는, 동적 오브젝트와 정적 오브젝트가 혼재하는 SPC 또는 GOS가 허용되지 않는다.
동적 오브젝트를 포인트 클라우드가 아닌, 카메라의 이차원 화상 정보로부터 검출할 때에는, 부호화 장치는, 검출 결과를 식별하기 위한 정보(테두리 또는 문자 등)와 오브젝트 위치를 별도 취득하고, 이들의 정보를 삼차원의 부호화 데이터의 일부로서 부호화해도 된다. 이 경우, 복호 장치는, 정적 오브젝트의 복호 결과에 대해, 동적 오브젝트를 나타내는 보조 정보(테두리 또는 문자)를 중첩하여 표시한다.
또, 부호화 장치는, 정적 오브젝트의 형상의 복잡함 등에 따라, SPC에 있어서의 VXL 또는 VLM의 소밀함을 변경해도 된다. 예를 들어, 부호화 장치는, 정적 오브젝트의 형상이 복잡할수록, VXL 또는 VLM을 조밀하게 설정한다. 또한, 부호화 장치는, 공간 위치 또는 색 정보를 양자화할 때의 양자화 단계 등을 VXL 또는 VLM의 소밀함에 따라 결정해도 된다. 예를 들어, 부호화 장치는, VXL 또는 VLM이 조밀할수록 양자화 단계를 작게 설정한다.
이상과 같이, 본 실시형태에 따른 부호화 장치 또는 복호 장치는, 좌표 정보를 갖는 스페이스 단위로 공간의 부호화 또는 복호를 행한다.
또, 부호화 장치 및 복호 장치는, 스페이스 내에 있어서, 볼륨 단위로 부호화 또는 복호를 행한다. 볼륨은, 위치 정보가 대응지어지는 최소 단위인 복셀을 포함한다.
또, 부호화 장치 및 복호 장치는, 좌표, 오브젝트, 및 시간 등을 포함하는 공간 정보의 각 요소와 GOP를 대응지은 테이블, 또는 각 요소 사이를 대응지은 테이블에 의해 임의의 요소 사이를 대응지어 부호화 또는 복호를 행한다. 또, 복호 장치는, 선택된 요소의 값을 이용하여 좌표를 판정하고, 좌표로부터 볼륨, 복셀 또는 스페이스를 특정하며, 당해 볼륨 또는 복셀을 포함하는 스페이스, 또는 특정된 스페이스를 복호한다.
또, 부호화 장치는, 특징점 추출 또는 오브젝트 인식에 의해, 요소에 의해 선택 가능한 볼륨, 복셀 또는 스페이스를 판정하고, 랜덤 액세스 가능한 볼륨, 복셀 또는 스페이스로서 부호화한다.
스페이스는, 당해 스페이스 단체로 부호화 또는 복호 가능한 I-SPC와, 임의의 한 개의 처리가 완료된 스페이스를 참조하여 부호화 또는 복호되는 P-SPC와, 임의의 두 개의 처리가 완료된 스페이스를 참조하여 부호화 또는 복호되는 B-SPC의 3종류의 타입으로 분류된다.
1 이상의 볼륨이, 정적 오브젝트 또는 동적인 오브젝트에 대응한다. 정적 오브젝트를 포함하는 스페이스와 동적 오브젝트를 포함하는 스페이스는 서로 상이한 GOS로서 부호화 또는 복호된다. 즉, 정적 오브젝트를 포함하는 SPC와, 동적 오브젝트를 포함하는 SPC가 상이한 GOS에 할당된다.
동적 오브젝트는 오브젝트마다 부호화 또는 복호되고, 정적 오브젝트를 포함하는 1 이상의 스페이스에 대응지어진다. 즉, 복수의 동적 오브젝트는 개별적으로 부호화되고, 얻어진 복수의 동적 오브젝트의 부호화 데이터는, 정적 오브젝트를 포함하는 SPC에 대응지어진다.
부호화 장치 및 복호 장치는, GOS 내의 I-SPC의 우선도를 올리고, 부호화 또는 복호를 행한다. 예를 들어, 부호화 장치는, I-SPC의 열화가 적어지도록(복호 후에 원래의 삼차원 데이터가 보다 충실히 재현되도록) 부호화를 행한다. 또, 복호 장치는, 예를 들어, I-SPC만을 복호한다.
부호화 장치는, 월드 내의 오브젝트의 소밀함 또는 수(양)에 따라 I-SPC를 이용하는 빈도를 바꾸어 부호화를 행해도 된다. 즉, 부호화 장치는, 삼차원 데이터에 포함되는 오브젝트의 수 또는 소밀함에 따라, I-SPC를 선택하는 빈도를 변경한다. 예를 들어, 부호화 장치는, 월드 내의 오브젝트가 조밀할수록 I스페이스를 이용하는 빈도를 올린다.
또, 부호화 장치는, 랜덤 액세스 포인트를 GOS 단위로 설정하고, GOS에 대응하는 공간 영역을 나타내는 정보를 헤더 정보에 저장한다.
부호화 장치는, GOS의 공간 사이즈로서, 예를 들어, 디폴트값을 사용한다. 또한, 부호화 장치는, 오브젝트 또는 동적 오브젝트의 수(양) 또는 소밀함에 따라 GOS의 사이즈를 변경해도 된다. 예를 들어, 부호화 장치는, 오브젝트 혹은 동적 오브젝트가 조밀할수록, 또는 수가 많을수록 GOS의 공간 사이즈를 작게 한다.
또, 스페이스 또는 볼륨은, 뎁스 센서, 자이로, 또는 카메라 등의 센서로 얻어진 정보를 이용하여 도출된 특징점군을 포함한다. 특징점의 좌표는 복셀의 중심 위치에 설정된다. 또, 복셀의 세분화에 의해 위치 정보의 고정밀도화를 실현할 수 있다.
특징점군은, 복수의 픽처를 이용하여 도출된다. 복수의 픽처는, 실제의 시각 정보와, 스페이스에 대응지어진 복수의 픽처와 동일한 시각 정보(예를 들어, 레이트 제어 등에 이용되는 부호화 시각)의 적어도 2종류의 시각 정보를 갖는다.
또, 1 이상의 스페이스를 포함하는 GOS 단위로 부호화 또는 복호가 행해진다.
부호화 장치 및 복호 장치는, 처리가 완료된 GOS 내의 스페이스를 참조하여, 처리 대상의 GOS 내의 P스페이스 또는 B스페이스의 예측을 행한다.
또는, 부호화 장치 및 복호 장치는, 상이한 GOS를 참조하지 않고, 처리 대상의 GOS 내의 처리가 완료된 스페이스를 이용하여 처리 대상의 GOS 내의 P스페이스 또는 B스페이스의 예측을 행한다.
또, 부호화 장치 및 복호 장치는, 1 이상의 GOS를 포함하는 월드 단위로 부호화 스트림을 송신 또는 수신한다.
또, GOS는 적어도 월드 내에서 1방향으로 레이어 구조를 갖고, 부호화 장치 및 복호 장치는, 하위 레이어로부터 부호화 또는 복호를 행한다. 예를 들어, 랜덤 액세스 가능한 GOS는 최하위 레이어에 속한다. 상위 레이어에 속하는 GOS는 동일 레이어 이하에 속하는 GOS를 참조한다. 즉, GOS는, 미리 정해진 방향으로 공간 분할되고, 각각이 1 이상의 SPC를 포함하는 복수의 레이어를 포함한다. 부호화 장치 및 복호 장치는, 각 SPC를, 당해 SPC와 동일 레이어 또는 당해 SPC보다 하층의 레이어에 포함되는 SPC를 참조하여 부호화 또는 복호한다.
또, 부호화 장치 및 복호 장치는, 복수의 GOS를 포함하는 월드 단위 내에서, 연속하여 GOS를 부호화 또는 복호한다. 부호화 장치 및 복호 장치는, 부호화 또는 복호의 순서(방향)를 나타내는 정보를 메타 데이터로서 기입하거나 또는 읽어낸다. 즉, 부호화 데이터는, 복수의 GOS의 부호화순을 나타내는 정보를 포함한다.
또, 부호화 장치 및 복호 장치는, 서로 상이한 2 이상의 스페이스 또는 GOS를 병렬로 부호화 또는 복호한다.
또, 부호화 장치 및 복호 장치는, 스페이스 또는 GOS의 공간 정보(좌표, 사이즈 등)를 부호화 또는 복호한다.
또, 부호화 장치 및 복호 장치는, GPS, 경로 정보, 또는 배율 등, 자기의 위치 또는/및 영역 사이즈에 관한 외부 정보에 의거하여 특정되는 특정 공간에 포함되는 스페이스 또는 GOS를 부호화 또는 복호한다.
부호화 장치 또는 복호 장치는, 자기의 위치로부터 먼 공간은, 가까운 공간에 비해 우선도를 떨어뜨려 부호화 또는 복호한다.
부호화 장치는, 배율 또는 용도에 따라, 월드의 어느 1방향을 설정하고, 당해 방향으로 레이어 구조를 갖는 GOS를 부호화한다. 또, 복호 장치는, 배율 또는 용도에 따라 설정된 월드의 어느 1방향으로 레이어 구조를 갖는 GOS를, 하위 레이어로부터 우선적으로 복호한다.
부호화 장치는, 실내와 실외에서 스페이스에 포함되는 특징점 추출, 오브젝트 인식의 정밀도, 또는 공간 영역 사이즈 등을 변화시킨다. 단, 부호화 장치 및 복호 장치는, 좌표가 가까운 실내 GOS와 실외 GOS를 월드 내에서 인접하여 부호화 또는 복호하고, 이들의 식별자도 대응지어 부호화 또는 복호한다.
(실시형태 2)
포인트 클라우드의 부호화 데이터를 실제의 장치 또는 서비스에 있어서 사용할 때에는, 네트워크 대역을 억제하기 위해 용도에 따라 필요한 정보를 송수신하는 것이 바람직하다. 그러나, 지금까지, 삼차원 데이터의 부호화 구조에는 그러한 기능이 존재하지 않으며, 그를 위한 부호화 방법도 존재하지 않았다.
본 실시형태에서는, 삼차원의 포인트 클라우드의 부호화 데이터에 있어서 용도에 따라 필요한 정보만을 송수신하는 기능을 제공하기 위한 삼차원 데이터 부호화 방법 및 삼차원 데이터 부호화 장치, 및, 당해 부호화 데이터를 복호하는 삼차원 데이터 복호 방법 및 삼차원 데이터 복호 장치에 대해 설명한다.
특징량을 일정 이상 갖는 복셀(VXL)을 특징 복셀(FVXL)이라고 정의하고, FVXL로 구성되는 월드(WLD)를 스파스 월드(SWLD)라고 정의한다. 도 11은, 스파스 월드 및 월드의 구성예를 나타낸 도면이다. SWLD에는, FVXL로 구성되는 GOS인 FGOS와, FVXL로 구성되는 SPC인 FSPC와, FVXL로 구성되는 VLM인 FVLM이 포함된다. FGOS, FSPC 및 FVLM의 데이터 구조 및 예측 구조는 GOS, SPC 및 VLM과 동일해도 상관없다.
특징량이란, VXL의 삼차원 위치 정보, 또는 VXL 위치의 가시광 정보를 표현하는 특징량이며, 특히 입체물의 코너 및 에지 등에서 많이 검출되는 특징량이다. 구체적으로는, 이 특징량은, 하기와 같은 삼차원 특징량 또는 가시광의 특징량이지만, 그 외, VXL의 위치, 휘도, 또는 색 정보 등을 나타내는 특징량이면, 어떠한 것이어도 상관없다.
삼차원 특징량으로서, SHOT 특징량(Signature of Histograms of OrienTations), PFH 특징량(Point Feature Histograms), 또는 PPF 특징량(Point Pair Feature)이 이용된다.
SHOT 특징량은, VXL 주변을 분할하여, 기준점과 분할된 영역의 법선 벡터의 내적을 계산하여 히스토그램화함으로써 얻어진다. 이 SHOT 특징량은, 차원수가 높고, 특징 표현력이 높다는 특징을 갖는다.
PFH 특징량은, VXL 근방의 다수의 2점 세트를 선택하고, 그 2점으로부터 법선 벡터 등을 산출하여 히스토그램화함으로써 얻어진다. 이 PFH 특징량은, 히스토그램 특징이므로, 다소의 외란에 대해 로버스트성을 가지며, 특징 표현력도 높다는 특징을 갖는다.
PPF 특징량은, 2점의 VXL마다 법선 벡터 등을 이용하여 산출되는 특징량이다. 이 PPF 특징량에는, 전 VXL이 이용되므로, 오클루전에 대해 로버스트성을 갖는다.
또, 가시광의 특징량으로서, 화상의 휘도 구배 정보 등의 정보를 이용한 SIFT(Scale-Invariant Feature Transform), SURF(Speeded Up Robust Features), 또는 HOG(Histogram of Oriented Gradients) 등을 이용할 수 있다.
SWLD는, WLD의 각 VXL로부터 상기 특징량을 산출하여, FVXL을 추출함으로써 생성된다. 여기서, SWLD는 WLD가 갱신될 때마다 갱신해도 상관없고, WLD의 갱신 타이밍에 상관없이, 일정 시간 경과 후에 정기적으로 갱신하도록 해도 상관없다.
SWLD는 특징량마다 생성해도 상관없다. 예를 들어, SHOT 특징량에 의거한 SWLD1과 SIFT 특징량에 의거한 SWLD2와 같이, 특징량마다 각기 다른 SWLD가 생성되고, 용도에 따라 SWLD를 구분하여 이용하도록 해도 상관없다. 또, 산출한 각 FVXL의 특징량을 특징량 정보로서 각 FVXL에 유지하도록 해도 상관없다.
다음으로, 스파스 월드(SWLD)의 이용 방법에 대해 설명한다. SWLD는 특징 복셀(FVXL)만을 포함하므로, 모든 VXL을 포함하는 WLD에 비해 일반적으로 데이터 사이즈가 작다.
특징량을 이용하여 어떠한 목적을 완수하는 애플리케이션에 있어서는, WLD를 대신하여 SWLD의 정보를 이용함으로써, 하드디스크로부터의 독출 시간, 및 네트워크 전송 시의 대역 및 전송 시간을 억제할 수 있다. 예를 들어, 지도 정보로서, WLD와 SWLD를 서버에 유지해 두고, 클라이언트로부터의 요망에 따라, 송신하는 지도 정보를 WLD 또는 SWLD로 전환함으로써, 네트워크 대역 및 전송 시간을 억제할 수 있다. 이하, 구체적인 예를 나타낸다.
도 12 및 도 13은, SWLD 및 WLD의 이용예를 나타낸 도면이다. 도 12에 나타낸 바와 같이, 차재 장치인 클라이언트(1)가 자기 위치 판정 용도로서 지도 정보를 필요한 경우는, 클라이언트(1)는 서버에 자기 위치 추정용의 지도 데이터의 취득 요망을 보낸다(S301). 서버는, 당해 취득 요망에 따라 SWLD를 클라이언트(1)에 송신한다(S302). 클라이언트(1)는, 수신한 SWLD를 이용하여 자기 위치 판정을 행한다(S303). 이때, 클라이언트(1)는 레인지 파인더 등의 거리 센서, 스테레오 카메라, 또는 복수의 단안 카메라의 조합 등의 여러 가지 방법으로 클라이언트(1) 주변의 VXL 정보를 취득하여, 얻어진 VXL 정보와 SWLD로부터 자기 위치 정보를 추정한다. 여기서 자기 위치 정보는, 클라이언트(1)의 삼차원 위치 정보 및 방향 등을 포함한다.
도 13에 나타낸 바와 같이, 차재 장치인 클라이언트(2)가 삼차원 지도 등의 지도 묘화의 용도로서 지도 정보가 필요한 경우는, 클라이언트(2)는 서버에 지도 묘화용의 지도 데이터의 취득 요망을 보낸다(S311). 서버는, 당해 취득 요망에 따라 WLD를 클라이언트(2)에 송신한다(S312). 클라이언트(2)는, 수신한 WLD를 이용하여 지도 묘화를 행한다(S313). 이때, 클라이언트(2)는, 예를 들어, 자기가 가시광 카메라 등으로 촬영한 화상과, 서버로부터 취득한 WLD를 이용하여 렌더링 화상을 작성하고, 작성한 화상을 카 내비게이션 등의 화면에 묘화한다.
상기와 같이, 서버는, 자기 위치 추정과 같은 각 VXL의 특징량을 주로 필요로 하는 용도에서는 SWLD를 클라이언트에 송신하고, 지도 묘화와 같이 상세한 VXL 정보가 필요한 경우는 WLD를 클라이언트에 송신한다. 이에 의해, 지도 데이터를 효율적으로 송수신하는 것이 가능해진다.
또한, 클라이언트는, 스스로 SWLD와 WLD 중 어느 쪽이 필요한지를 판단하여, 서버에 SWLD 또는 WLD의 송신을 요구해도 상관없다. 또, 서버는, 클라이언트 또는 네트워크의 상황에 맞추어, SWLD나 WLD 중 어느 쪽을 송신해야할지를 판단해도 상관없다.
다음으로, 스파스 월드(SWLD)와 월드(WLD)의 송수신을 전환하는 방법을 설명한다.
네트워크 대역에 따라 WLD 또는 SWLD를 수신할지를 전환하도록 해도 된다. 도 14는, 이 경우의 동작예를 나타낸 도면이다. 예를 들어, LTE(Long Term Evolution) 환경하 등의 사용할 수 있는 네트워크 대역이 한정되어 있는 저속 네트워크가 이용되고 있는 경우에는, 클라이언트는, 저속 네트워크 경유로 서버에 액세스하여(S321), 서버로부터 지도 정보로서 SWLD를 취득한다(S322). 한편, Wi-Fi(등록상표) 환경하 등의 네트워크 대역에 여유가 있는 고속 네트워크가 이용되고 있는 경우에는, 클라이언트는, 고속 네트워크 경유로 서버에 액세스하여(S323), 서버로부터 WLD를 취득한다(S324). 이에 의해, 클라이언트는, 당해 클라이언트의 네트워크 대역에 따라 적절한 지도 정보를 취득할 수 있다.
구체적으로는, 클라이언트는, 옥외에서는 LTE 경유로 SWLD를 수신하고, 시설 등의 옥내에 들어간 경우는 Wi-Fi(등록상표) 경유로 WLD를 취득한다. 이에 의해, 클라이언트는, 옥내의 보다 상세한 지도 정보를 취득하는 것이 가능해진다.
이와 같이, 클라이언트는, 자신이 이용하는 네트워크의 대역에 따라 서버에 WLD 또는 SWLD를 요구해도 된다. 또는, 클라이언트는, 자신이 이용하는 네트워크의 대역을 나타내는 정보를 서버에 송신하고, 서버는 당해 정보에 따라 당해 클라이언트에 적합한 데이터(WLD 또는 SWLD)를 송신해도 된다. 또는, 서버는, 클라이언트의 네트워크 대역을 판별하여, 당해 클라이언트에 적합한 데이터(WLD 또는 SWLD)를 송신해도 된다.
또, 이동 속도에 따라 WLD 또는 SWLD를 수신할지를 전환하도록 해도 된다. 도 15는, 이 경우의 동작예를 나타낸 도면이다. 예를 들어, 클라이언트가 고속 이동을 하고 있는 경우는(S331), 클라이언트는 SWLD를 서버로부터 수신한다(S332). 한편, 클라이언트가 저속 이동을 하고 있는 경우는(S333), 클라이언트는 WLD를 서버로부터 수신한다(S334). 이에 의해, 클라이언트는, 네트워크 대역을 억제하면서, 속도에 맞는 지도 정보를 취득할 수 있다. 구체적으로는, 클라이언트는, 고속 도로를 주행 중에는 데이터량이 적은 SWLD를 수신함으로써, 대략의 지도 정보를 적절한 속도로 갱신할 수 있다. 한편, 클라이언트는, 일반 도로를 주행 중에는 WLD를 수신함으로써, 보다 상세한 지도 정보를 취득하는 것이 가능해진다.
이와 같이, 클라이언트는, 자신의 이동 속도에 따라 서버에 WLD 또는 SWLD를 요구해도 된다. 또는, 클라이언트는, 자신의 이동 속도를 나타내는 정보를 서버에 송신하고, 서버는 당해 정보에 따라 당해 클라이언트에 적합한 데이터(WLD 또는 SWLD)를 송신해도 된다. 또는, 서버는, 클라이언트의 이동 속도를 판별하여, 당해 클라이언트에 적합한 데이터(WLD 또는 SWLD)를 송신해도 된다.
또, 클라이언트는, 처음에 SWLD를 서버로부터 취득하고, 그 중에서 중요한 영역의 WLD를 취득해도 상관없다. 예를 들어, 클라이언트는, 지도 데이터를 취득할 때에, 처음에 대략의 지도 정보를 SWLD로 취득하고, 거기에서부터 건물, 표지, 또는 인물 등의 특징이 많이 출현하는 영역을 좁혀, 좁힌 영역의 WLD를 나중에 취득한다. 이에 의해, 클라이언트는, 서버로부터의 수신 데이터량을 억제하면서, 필요한 영역의 상세한 정보를 취득하는 것이 가능해진다.
또, 서버는, WLD로부터 물체마다 각기 다른 SWLD를 작성하고, 클라이언트는, 용도에 맞춰, 각각을 수신해도 된다. 이에 의해, 네트워크 대역을 억제할 수 있다. 예를 들어, 서버는, WLD로부터 미리 사람 또는 차를 인식하여, 사람의 SWLD와 차의 SWLD를 작성한다. 클라이언트는, 주위 사람의 정보를 취득하고 싶은 경우에는 사람의 SWLD를, 차의 정보를 취득하고 싶은 경우에는 차의 SWLD를 수신한다. 또, 이러한 SWLD의 종류는 헤더 등에 부가된 정보(플래그 또는 타입 등)에 따라 구별하도록 해도 상관없다.
다음으로, 본 실시형태에 따른 삼차원 데이터 부호화 장치(예를 들어 서버)의 구성 및 동작의 흐름을 설명한다. 도 16은, 본 실시형태에 따른 삼차원 데이터 부호화 장치(400)의 블록도이다. 도 17은, 삼차원 데이터 부호화 장치(400)에 의한 삼차원 데이터 부호화 처리의 플로차트이다.
도 16에 나타낸 삼차원 데이터 부호화 장치(400)는, 입력 삼차원 데이터(411)를 부호화함으로써 부호화 스트림인 부호화 삼차원 데이터(413 및 414)를 생성한다. 여기서, 부호화 삼차원 데이터(413)는 WLD에 대응하는 부호화 삼차원 데이터이며, 부호화 삼차원 데이터(414)는 SWLD에 대응하는 부호화 삼차원 데이터이다. 이 삼차원 데이터 부호화 장치(400)는, 취득부(401)와, 부호화 영역 결정부(402)와, SWLD 추출부(403)와, WLD 부호화부(404)와, SWLD 부호화부(405)를 구비한다.
도 17에 나타낸 바와 같이, 우선, 취득부(401)는, 삼차원 공간 내의 점군 데이터인 입력 삼차원 데이터(411)를 취득한다(S401).
다음으로, 부호화 영역 결정부(402)는, 점군 데이터가 존재하는 공간 영역에 의거하여, 부호화 대상의 공간 영역을 결정한다(S402).
다음으로, SWLD 추출부(403)는, 부호화 대상의 공간 영역을 WLD라고 정의하고, WLD에 포함되는 각 VXL로부터 특징량을 산출한다. 그리고, SWLD 추출부(403)는, 특징량이 미리 정해진 역치 이상인 VXL를 추출하여, 추출한 VXL을 FVXL이라고 정의하고, 당해 FVXL을 SWLD에 추가함으로써, 추출 삼차원 데이터(412)를 생성한다(S403). 즉, 입력 삼차원 데이터(411)로부터 특징량이 역치 이상인 추출 삼차원 데이터(412)가 추출된다.
다음으로, WLD 부호화부(404)는, WLD에 대응하는 입력 삼차원 데이터(411)를 부호화함으로써 WLD에 대응하는 부호화 삼차원 데이터(413)를 생성한다(S404). 이때, WLD 부호화부(404)는, 부호화 삼차원 데이터(413)의 헤더에, 당해 부호화 삼차원 데이터(413)가 WLD를 포함하는 스트림인 것을 구별하기 위한 정보를 부가한다.
또, SWLD 부호화부(405)는, SWLD에 대응하는 추출 삼차원 데이터(412)를 부호화함으로써 SWLD에 대응하는 부호화 삼차원 데이터(414)를 생성한다(S405). 이때, SWLD 부호화부(405)는, 부호화 삼차원 데이터(414)의 헤더에, 당해 부호화 삼차원 데이터(414)가 SWLD를 포함하는 스트림인 것을 구별하기 위한 정보를 부가한다.
또한, 부호화 삼차원 데이터(413)를 생성하는 처리와, 부호화 삼차원 데이터(414)를 생성하는 처리의 처리순은 상기와 반대여도 된다. 또, 이들 처리의 일부 또는 전부가 병렬로 행해져도 된다.
부호화 삼차원 데이터(413 및 414)의 헤더에 부여되는 정보로서, 예를 들어, 「world_type」라는 파라미터가 정의된다. world_type=0인 경우는 스트림이 WLD를 포함하는 것을 나타내고, world_type=1인 경우는 스트림이 SWLD를 포함하는 것을 나타낸다. 또한 그 외의 다수의 종별을 정의하는 경우에는, world_type=2와 같이 할당하는 수치를 늘리도록 해도 상관없다. 또, 부호화 삼차원 데이터(413 및 414) 중 한쪽에 특정의 플래그가 포함되어도 된다. 예를 들어, 부호화 삼차원 데이터(414)에, 당해 스트림이 SWLD를 포함하는 것을 포함하는 플래그가 부여되어도 된다. 이 경우, 복호 장치는, 플래그의 유무에 따라 WLD를 포함하는 스트림인지, SWLD를 포함하는 스트림인지를 판별할 수 있다.
또, WLD 부호화부(404)가 WLD를 부호화할 때에 사용하는 부호화 방법과, SWLD 부호화부(405)가 SWLD를 부호화할 때에 사용하는 부호화 방법은 달라도 된다.
예를 들어, SWLD에서는 데이터가 솎아내어져 있으므로, WLD에 비해, 주변 데이터와의 상관이 낮아질 가능성이 있다. 따라서, SWLD에 이용되는 부호화 방법에서는, WLD에 이용되는 부호화 방법보다 인트라 예측 및 인터 예측 중 인터 예측이 우선되어도 된다.
또, SWLD에 이용되는 부호화 방법과 WLD에 이용되는 부호화 방법에서는, 삼차원 위치의 표현 수법이 달라도 된다. 예를 들어, SWLD에서는, 삼차원 좌표에 의해 FVXL의 삼차원 위치를 표현하고, WLD에서는, 후술하는 8진 트리에 의해 삼차원 위치가 표현되어도 되고, 그 반대여도 된다.
또, SWLD 부호화부(405)는, SWLD의 부호화 삼차원 데이터(414)의 데이터 사이즈가 WLD의 부호화 삼차원 데이터(413)의 데이터 사이즈보다 작아지도록 부호화를 행한다. 예를 들어, 상술한 바와 같이 SWLD는, WLD에 비해, 데이터간의 상관이 낮아질 가능성이 있다. 이에 의해, 부호화 효율이 내려가, 부호화 삼차원 데이터(414)의 데이터 사이즈가 WLD의 부호화 삼차원 데이터(413)의 데이터 사이즈보다 커질 가능성이 있다. 따라서, SWLD 부호화부(405)는, 얻어진 부호화 삼차원 데이터(414)의 데이터 사이즈가, WLD의 부호화 삼차원 데이터(413)의 데이터 사이즈보다 큰 경우에는, 재부호화를 행함으로써, 데이터 사이즈를 저감한 부호화 삼차원 데이터(414)를 재생성한다.
예를 들어, SWLD 추출부(403)는, 추출하는 특징점의 수를 줄인 추출 삼차원 데이터(412)를 재생성하고, SWLD 부호화부(405)는, 당해 추출 삼차원 데이터(412)를 부호화한다. 또는, SWLD 부호화부(405)에 있어서의 양자화의 정도를 보다 러프하게 해도 된다. 예를 들어, 후술하는 8진 트리 구조에 있어서, 최하층의 데이터를 라운딩함으로써, 양자화의 정도를 러프하게 할 수 있다.
또, SWLD 부호화부(405)는, SWLD의 부호화 삼차원 데이터(414)의 데이터 사이즈를 WLD의 부호화 삼차원 데이터(413)의 데이터 사이즈보다 작게 할 수 없는 경우는, SWLD의 부호화 삼차원 데이터(414)를 생성하지 않아도 된다. 또는, WLD의 부호화 삼차원 데이터(413)가 SWLD의 부호화 삼차원 데이터(414)에 카피되어도 된다. 즉, SWLD의 부호화 삼차원 데이터(414)로서 WLD의 부호화 삼차원 데이터(413)가 그대로 이용되어도 된다.
다음으로, 본 실시형태에 따른 삼차원 데이터 복호 장치(예를 들어 클라이언트)의 구성 및 동작의 흐름을 설명한다. 도 18은, 본 실시형태에 따른 삼차원 데이터 복호 장치(500)의 블록도이다. 도 19는, 삼차원 데이터 복호 장치(500)에 의한 삼차원 데이터 복호 처리의 플로차트이다.
도 18에 나타낸 삼차원 데이터 복호 장치(500)는, 부호화 삼차원 데이터(511)를 복호함으로써 복호 삼차원 데이터(512 또는 513)를 생성한다. 여기서, 부호화 삼차원 데이터(511)는, 예를 들어, 삼차원 데이터 부호화 장치(400)에서 생성된 부호화 삼차원 데이터(413 또는 414)이다.
이 삼차원 데이터 복호 장치(500)는, 취득부(501)와, 헤더 해석부(502)와, WLD 복호부(503)와, SWLD 복호부(504)를 구비한다.
도 19에 나타낸 바와 같이, 우선, 취득부(501)는, 부호화 삼차원 데이터(511)를 취득한다(S501). 다음으로, 헤더 해석부(502)는, 부호화 삼차원 데이터(511)의 헤더를 해석하여, 부호화 삼차원 데이터(511)가 WLD를 포함하는 스트림인지, SWLD를 포함하는 스트림인지를 판별한다(S502). 예를 들어, 상술한 world_type의 파라미터가 참조되어, 판별이 행해진다.
부호화 삼차원 데이터(511)가 WLD를 포함하는 스트림인 경우(S503에서 Yes), WLD 복호부(503)는, 부호화 삼차원 데이터(511)를 복호함으로써 WLD의 복호 삼차원 데이터(512)를 생성한다(S504). 한편, 부호화 삼차원 데이터(511)가 SWLD를 포함하는 스트림인 경우(S503에서 No), SWLD 복호부(504)는, 부호화 삼차원 데이터(511)를 복호함으로써 SWLD의 복호 삼차원 데이터(513)를 생성한다(S505).
또, 부호화 장치와 마찬가지로, WLD 복호부(503)가 WLD를 복호할 때에 사용하는 복호 방법과, SWLD 복호부(504)가 SWLD를 복호할 때에 사용하는 복호 방법은 달라도 된다. 예를 들어, SWLD에 이용되는 복호 방법에서는, WLD에 이용되는 복호 방법보다 인트라 예측 및 인터 예측 중 인터 예측이 우선되어도 된다.
또, SWLD에 이용되는 복호 방법과 WLD에 이용되는 복호 방법에서는, 삼차원 위치의 표현 수법이 달라도 된다. 예를 들어, SWLD에서는, 삼차원 좌표에 의해 FVXL의 삼차원 위치를 표현하고, WLD에서는, 후술하는 8진 트리에 의해 삼차원 위치가 표현되어도 되고, 그 반대여도 된다.
다음으로, 삼차원 위치의 표현 수법인 8진 트리 표현에 대해 설명한다. 삼차원 데이터에 포함되는 VXL 데이터는 8진 트리 구조로 변환된 후, 부호화된다. 도 20은, WLD의 VXL의 일례를 나타낸 도면이다. 도 21은, 도 20에 나타낸 WLD의 8진 트리 구조를 나타낸 도면이다. 도 20에 나타낸 예에서는, 점군을 포함하는 VXL(이하, 유효 VXL)인 3개 VXL1~3이 존재한다. 도 21에 나타낸 바와 같이, 8진 트리 구조는 노드와 리프로 구성된다. 각 노드는 최대로 8개의 노드 또는 리프를 갖는다. 각 리프는 VXL 정보를 갖는다. 여기서, 도 21에 나타낸 리프 중, 리프 1, 2, 3은 각각 도 20에 나타낸 VXL1, VXL2, VXL3을 나타낸다.
구체적으로는, 각 노드 및 리프는 삼차원 위치에 대응한다. 노드(1)는, 도 20에 나타낸 전체의 블록에 대응한다. 노드(1)에 대응하는 블록은 8개의 블록으로 분할되고, 8개의 블록 중, 유효 VXL을 포함하는 블록이 노드로 설정되고, 그 이외의 블록은 리프로 설정된다. 노드에 대응하는 블록은, 또한 8개의 노드 또는 리프로 분할되고, 이 처리가 트리 구조의 계층만큼 반복된다. 또, 최하층의 블록은, 모두 리프로 설정된다.
또, 도 22는, 도 20에 나타낸 WLD로부터 생성한 SWLD의 예를 나타낸 도면이다. 도 20에 나타낸 VXL1 및 VXL2는 특징량 추출의 결과, FVXL1 및 FVXL2로 판정되어, SWLD에 추가되어 있다. 한편, VXL3은 FVXL로 판정되지 않고, SWLD에 포함되어 있지 않다. 도 23은, 도 22에 나타낸 SWLD의 8진 트리 구조를 나타낸 도면이다. 도 23에 나타낸 8진 트리 구조에서는, 도 21에 나타낸, VXL3에 상당하는 리프(3)가 삭제되어 있다. 이에 의해, 도 21에 나타낸 노드(3)가 유효 VXL을 갖지 않게 되어, 리프로 변경되어 있다. 이와 같이 일반적으로 SWLD의 리프수는 WLD의 리프수보다 적어지고, SWLD의 부호화 삼차원 데이터도 WLD의 부호화 삼차원 데이터보다 작아진다.
이하, 본 실시형태의 변형예에 대해 설명한다.
예를 들어, 차재 장치 등의 클라이언트는, 자기 위치 추정을 행하는 경우에, SWLD를 서버로부터 수신하고, SWLD를 이용해 자기 위치 추정을 행하여, 장애물 검지를 행하는 경우는, 레인지 파인더 등의 거리 센서, 스테레오 카메라, 또는 복수의 단안 카메라의 조합 등의 여러 가지 방법을 이용하여 스스로 취득한 주변의 삼차원 정보에 의거하여 장애물 검지를 실시해도 된다.
또, 일반적으로 SWLD에는 평탄 영역의 VXL 데이터가 포함되기 어렵다. 그 때문에, 서버는, 정적인 장애물의 검지용으로, WLD를 서브 샘플한 서브 샘플 월드(subWLD)를 유지하고, SWLD와 subWLD를 클라이언트에 송신해도 된다. 이에 의해, 네트워크 대역을 억제하면서, 클라이언트측에서 자기 위치 추정 및 장애물 검지를 행할 수 있다.
또, 클라이언트가 삼차원 지도 데이터를 고속으로 묘화할 때에는, 지도 정보가 메시 구조인 쪽이 편리한 경우가 있다. 그래서, 서버는, WLD로부터 메시를 생성하여, 메시 월드(MWLD)로서 미리 유지해도 된다. 예를 들어 클라이언트는, 러프한 삼차원 묘화를 필요로 하고 있는 경우에는 MWLD를 수신하고, 상세한 삼차원 묘화를 필요로 하고 있는 경우에는 WLD를 수신한다. 이에 의해, 네트워크 대역을 억제할 수 있다.
또, 서버는, 각 VXL 중, 특징량이 역치 이상인 VXL을 FVXL로 설정하였지만, 다른 방법으로 FVXL을 산출해도 상관없다. 예를 들어, 서버는, 신호 또는 교차점 등을 구성하는 VXL, VLM, SPC, 또는 GOS를, 자기 위치 추정, 운전 어시스트, 또는 자동 운전 등에 필요한 것으로 판단하여, FVXL, FVLM, FSPC, FGOS로서 SWLD에 포함해도 상관없다. 또, 상기 판단은 수동으로 행해져도 된다. 또한, 특징량에 의거하여 설정된 FVXL 등에, 상기 방법으로 얻어진 FVXL 등을 추가해도 된다. 즉, SWLD 추출부(403)는, 또한, 입력 삼차원 데이터(411)로부터 미리 정해진 속성을 갖는 물체에 대응하는 데이터를 추출 삼차원 데이터(412)로서 추출해도 된다.
또, 그들 용도에 필요한 취지를 특징량과는 별도로 라벨링하도록 해도 상관없다. 또, 서버는, SWLD의 상위 레이어(예를 들어 레인 월드)로서, 신호 또는 교차점 등의 자기 위치 추정, 운전 어시스트, 또는 자동 운전 등에 필요한 FVXL을 별도로 유지해도 된다.
또, 서버는, WLD 내의 VXL에도 랜덤 액세스 단위 또는 소정의 단위마다 속성을 부가해도 된다. 속성은, 예를 들어, 자기 위치 추정에 필요 혹은 불필요한지를 나타내는 정보, 또는, 신호 혹은 교차점 등의 교통 정보로서 중요한지의 여부 등을 나타내는 정보를 포함한다. 또, 속성은, 레인 정보(GDF : Geographic Data Files 등)에 있어서의 Feature(교차점 또는 도로 등)와의 대응 관계를 포함해도 된다.
또, WLD 또는 SWLD의 갱신 방법으로서 하기와 같은 방법을 이용해도 상관없다.
사람, 공사, 또는 가로수(트랙용)의 변화 등을 나타내는 갱신 정보가 점군 또는 메타데이터로서 서버에 업로드된다. 서버는, 당해 업로드에 의거하여, WLD를 갱신하고, 그 후, 갱신한 WLD를 이용하여 SWLD를 갱신한다.
또, 클라이언트는, 자기 위치 추정 시에 자신이 생성한 삼차원 정보와 서버로부터 수신한 삼차원 정보의 부정합을 검지한 경우, 자신이 생성한 삼차원 정보를 갱신 통지와 함께 서버에 송신해도 된다. 이 경우, 서버는, WLD를 이용하여 SWLD를 갱신한다. SWLD가 갱신되지 않는 경우, 서버는, WLD 자체가 오래되었다고 판단한다.
또, 부호화 스트림의 헤더 정보로서, WLD인지 SWLD인지를 구별하는 정보가 부가되는 것으로 하였지만, 예를 들어, 메시 월드 또는 레인 월드 등, 다종류의 월드가 존재하는 경우에는, 그들을 구별하는 정보가 헤더 정보로 부가되어도 상관없다. 또, 특징량이 상이한 SWLD가 다수 존재하는 경우에는, 각각을 구별하는 정보가 헤더 정보로 부가되어도 상관없다.
또, SWLD는, FVXL로 구성되는 것으로 하였지만, FVXL로 판정되지 않은 VXL을 포함해도 된다. 예를 들어, SWLD는, FVXL의 특징량을 산출할 때에 사용하는 인접 VXL을 포함해도 된다. 이에 의해, SWLD의 각 FVXL에 특징량 정보가 부가되지 않은 경우여도, 클라이언트는, SWLD를 수신했을 때에 FVXL의 특징량을 산출할 수 있다. 또한, 그때에는, SWLD는 각 VXL이 FVXL인지 VXL인지를 구별하기 위한 정보를 포함해도 된다.
이상과 같이, 삼차원 데이터 부호화 장치(400)는, 입력 삼차원 데이터(411)( 제1 삼차원 데이터)로부터 특징량이 역치 이상인 추출 삼차원 데이터(412)(제2 삼차원 데이터)를 추출하고, 추출 삼차원 데이터(412)를 부호화함으로써 부호화 삼차원 데이터(414)(제1 부호화 삼차원 데이터)를 생성한다.
이에 의하면, 삼차원 데이터 부호화 장치(400)는, 특징량이 역치 이상인 데이터를 부호화한 부호화 삼차원 데이터(414)를 생성한다. 이에 의해, 입력 삼차원 데이터(411)를 그대로 부호화하는 경우에 비해 데이터량을 삭감할 수 있다. 따라서, 삼차원 데이터 부호화 장치(400)는, 전송하는 데이터량을 삭감할 수 있다.
또, 삼차원 데이터 부호화 장치(400)는, 또한, 입력 삼차원 데이터(411)를 부호화함으로써 부호화 삼차원 데이터(413)(제2 부호화 삼차원 데이터)를 생성한다.
이에 의하면, 삼차원 데이터 부호화 장치(400)는, 예를 들어, 사용 용도 등에 따라, 부호화 삼차원 데이터(413)와 부호화 삼차원 데이터(414)를 선택적으로 전송할 수 있다.
또, 추출 삼차원 데이터(412)는, 제1 부호화 방법에 의해 부호화되고, 입력 삼차원 데이터(411)는, 제1 부호화 방법과는 다른 제2 부호화 방법에 의해 부호화된다.
이에 의하면, 삼차원 데이터 부호화 장치(400)는, 입력 삼차원 데이터(411)와 추출 삼차원 데이터(412)에 각각 적합한 부호화 방법을 이용할 수 있다.
또, 제1 부호화 방법에서는, 제2 부호화 방법보다 인트라 예측 및 인터 예측 중 인터 예측이 우선된다.
이에 의하면, 삼차원 데이터 부호화 장치(400)는, 인접하는 데이터간의 상관이 낮아지기 쉬운 추출 삼차원 데이터(412)에 대해, 인터 예측의 우선도를 올릴 수 있다.
또, 제1 부호화 방법과 제2 부호화 방법에서는, 삼차원 위치의 표현 수법이 상이하다. 예를 들어, 제2 부호화 방법에서는, 8진 트리에 의해 삼차원 위치가 표현되고, 제1 부호화 방법에서는, 삼차원 좌표에 의해 삼차원 위치가 표현된다.
이에 의하면, 삼차원 데이터 부호화 장치(400)는, 데이터수(VXL 또는 FVXL의 수)가 상이한 삼차원 데이터에 대해, 보다 적합한 삼차원 위치의 표현 수법을 이용할 수 있다.
또, 부호화 삼차원 데이터(413 및 414) 중 적어도 한쪽은, 당해 부호화 삼차원 데이터가 입력 삼차원 데이터(411)를 부호화함으로써 얻어진 부호화 삼차원 데이터인지, 입력 삼차원 데이터(411) 중 일부를 부호화함으로써 얻어진 부호화 삼차원 데이터인지를 나타내는 식별자를 포함한다. 즉, 당해 식별자는, 부호화 삼차원 데이터가 WLD의 부호화 삼차원 데이터(413)인지 SWLD의 부호화 삼차원 데이터(414)인지를 나타낸다.
이에 의하면, 복호 장치는, 취득한 부호화 삼차원 데이터가 부호화 삼차원 데이터(413)인지 부호화 삼차원 데이터(414)인지를 용이하게 판정할 수 있다.
또, 삼차원 데이터 부호화 장치(400)는, 부호화 삼차원 데이터(414)의 데이터량이 부호화 삼차원 데이터(413)의 데이터량보다 작아지도록 추출 삼차원 데이터(412)를 부호화한다.
이에 의하면, 삼차원 데이터 부호화 장치(400)는, 부호화 삼차원 데이터(414)의 데이터량을 부호화 삼차원 데이터(413)의 데이터량보다 작게 할 수 있다.
또, 삼차원 데이터 부호화 장치(400)는, 또한, 입력 삼차원 데이터(411)로부터 미리 정해진 속성을 갖는 물체에 대응하는 데이터를 추출 삼차원 데이터(412)로서 추출한다. 예를 들어, 미리 정해진 속성을 갖는 물체란, 자기 위치 추정, 운전 어시스트, 또는 자동 운전 등에 필요한 물체이며, 신호 또는 교차점 등이다.
이에 의하면, 삼차원 데이터 부호화 장치(400)는, 복호 장치에서 필요한 데이터를 포함하는 부호화 삼차원 데이터(414)를 생성할 수 있다.
또, 삼차원 데이터 부호화 장치(400)(서버)는, 또한, 클라이언트의 상태에 따라, 부호화 삼차원 데이터(413 및 414) 중 한쪽을 클라이언트에 송신한다.
이에 의하면, 삼차원 데이터 부호화 장치(400)는, 클라이언트의 상태에 따라 적절한 데이터를 송신할 수 있다.
또, 클라이언트의 상태는, 클라이언트의 통신 상황(예를 들어 네트워크 대역), 또는 클라이언트의 이동 속도를 포함한다.
또, 삼차원 데이터 부호화 장치(400)는, 또한, 클라이언트의 요구에 따라, 부호화 삼차원 데이터(413 및 414) 중 한쪽을 클라이언트에 송신한다.
이에 의하면, 삼차원 데이터 부호화 장치(400)는, 클라이언트의 요구에 따라 적절한 데이터를 송신할 수 있다.
또, 본 실시형태에 따른 삼차원 데이터 복호 장치(500)는, 상기 삼차원 데이터 부호화 장치(400)에 의해 생성된 부호화 삼차원 데이터(413 또는 414)를 복호한다.
즉, 삼차원 데이터 복호 장치(500)는, 입력 삼차원 데이터(411)로부터 추출된 특징량이 역치 이상인 추출 삼차원 데이터(412)가 부호화됨으로써 얻어진 부호화 삼차원 데이터(414)를 제1 복호 방법에 의해 복호한다. 또, 삼차원 데이터 복호 장치(500)는, 입력 삼차원 데이터(411)가 부호화됨으로써 얻어진 부호화 삼차원 데이터(413)를, 제1 복호 방법과는 상이한 제2 복호 방법에 의해 복호한다.
이에 의하면, 삼차원 데이터 복호 장치(500)는, 특징량이 역치 이상인 데이터를 부호화한 부호화 삼차원 데이터(414)와, 부호화 삼차원 데이터(413)를, 예를 들어, 사용 용도 등에 따라 선택적으로 수신할 수 있다. 이에 의해, 삼차원 데이터 복호 장치(500)는, 전송하는 데이터량을 삭감할 수 있다. 또한, 삼차원 데이터 복호 장치(500)는, 입력 삼차원 데이터(411)와 추출 삼차원 데이터(412)에 각각 적합한 복호 방법을 이용할 수 있다.
또, 제1 복호 방법에서는, 제2 복호 방법보다 인트라 예측 및 인터 예측 중 인터 예측이 우선된다.
이에 의하면, 삼차원 데이터 복호 장치(500)는, 인접하는 데이터간의 상관이 낮아지기 쉬운 추출 삼차원 데이터에 대해, 인터 예측의 우선도를 올릴 수 있다.
또, 제1 복호 방법과 제2 복호 방법에서는, 삼차원 위치의 표현 수법이 상이하다. 예를 들어, 제2 복호 방법에서는, 8진 트리에 의해 삼차원 위치가 표현되고, 제1 복호 방법에서는, 삼차원 좌표에 의해 삼차원 위치가 표현된다.
이에 의하면, 삼차원 데이터 복호 장치(500)는, 데이터수(VXL 또는 FVXL의 수)가 상이한 삼차원 데이터에 대해, 보다 적합한 삼차원 위치의 표현 수법을 이용할 수 있다.
또, 부호화 삼차원 데이터(413 및 414) 중 적어도 한쪽은, 당해 부호화 삼차원 데이터가 입력 삼차원 데이터(411)를 부호화함으로써 얻어진 부호화 삼차원 데이터인지, 입력 삼차원 데이터(411) 중 일부를 부호화함으로써 얻어진 부호화 삼차원 데이터인지를 나타내는 식별자를 포함한다. 삼차원 데이터 복호 장치(500)는, 당해 식별자를 참조하여, 부호화 삼차원 데이터(413 및 414)를 식별한다.
이에 의하면, 삼차원 데이터 복호 장치(500)는, 취득한 부호화 삼차원 데이터가 부호화 삼차원 데이터(413)인지 부호화 삼차원 데이터(414)인지를 용이하게 판정할 수 있다.
또, 삼차원 데이터 복호 장치(500)는, 또한, 클라이언트(삼차원 데이터 복호 장치(500))의 상태를 서버에 통지한다. 삼차원 데이터 복호 장치(500)는, 클라이언트의 상태에 따라, 서버로부터 송신된 부호화 삼차원 데이터(413 및 414) 중 한쪽을 수신한다.
이에 의하면, 삼차원 데이터 복호 장치(500)는, 클라이언트의 상태에 따라 적절한 데이터를 수신할 수 있다.
또, 클라이언트의 상태는, 클라이언트의 통신 상황(예를 들어 네트워크 대역), 또는 클라이언트의 이동 속도를 포함한다.
또, 삼차원 데이터 복호 장치(500)는, 또한, 부호화 삼차원 데이터(413 및 414) 중 한쪽을 서버에 요구하고, 당해 요구에 따라, 서버로부터 송신된 부호화 삼차원 데이터(413 및 414) 중 한쪽을 수신한다.
이에 의하면, 삼차원 데이터 복호 장치(500)는, 용도에 따른 적절한 데이터를 수신할 수 있다.
(실시형태 3)
본 실시형태에서는, 차량 사이에서의 삼차원 데이터를 송수신하는 방법에 대해 설명한다. 예를 들어, 자차량과 주변 차량의 사이에서의 삼차원 데이터의 송수신이 행해진다.
도 24는, 본 실시형태에 따른 삼차원 데이터 작성 장치(620)의 블록도이다. 이 삼차원 데이터 작성 장치(620)는, 예를 들어, 자차량에 포함되고, 삼차원 데이터 작성 장치(620)가 작성한 제1 삼차원 데이터(632)에, 수신한 제2 삼차원 데이터(635)를 합성함으로써, 보다 조밀한 제3 삼차원 데이터(636)를 작성한다.
이 삼차원 데이터 작성 장치(620)는, 삼차원 데이터 작성부(621)와, 요구 범위 결정부(622)와, 탐색부(623)와, 수신부(624)와, 복호부(625)와, 합성부(626)를 구비한다.
우선, 삼차원 데이터 작성부(621)는, 자차량이 구비하는 센서로 검지한 센서 정보(631)를 이용하여 제1 삼차원 데이터(632)를 작성한다. 다음으로, 요구 범위 결정부(622)는, 작성한 제1 삼차원 데이터(632) 중에서 데이터가 부족한 삼차원 공간 범위인 요구 범위를 결정한다.
다음으로, 탐색부(623)는, 요구 범위의 삼차원 데이터를 소유하는 주변 차량을 탐색하고, 탐색에 의해 특정한 주변 차량에 요구 범위를 나타내는 요구 범위 정보(633)를 송신한다. 다음으로, 수신부(624)는, 주변 차량으로부터, 요구 범위의 부호화 스트림인 부호화 삼차원 데이터(634)를 수신한다(S624). 또한, 탐색부(623)는, 특정 범위에 존재하는 모든 차량에 대해, 무차별하게 리퀘스트를 보내고, 응답이 있었던 상대로부터 부호화 삼차원 데이터(634)를 수신해도 된다. 또, 탐색부(623)는, 차량에 한정되지 않으며, 신호기 또는 표지 등의 물체에 리퀘스트를 보내어, 당해 물체로부터 부호화 삼차원 데이터(634)를 수신해도 된다.
다음으로, 복호부(625)는, 수신한 부호화 삼차원 데이터(634)를 복호함으로써 제2 삼차원 데이터(635)를 취득한다. 다음으로, 합성부(626)는, 제1 삼차원 데이터(632)와 제2 삼차원 데이터(635)를 합성함으로써, 보다 조밀한 제3 삼차원 데이터(636)를 작성한다.
다음으로, 본 실시형태에 따른 삼차원 데이터 송신 장치(640)의 구성 및 동작을 설명한다. 도 25는, 삼차원 데이터 송신 장치(640)의 블록도이다.
삼차원 데이터 송신 장치(640)는, 예를 들어, 상술한 주변 차량에 포함되고, 주변 차량이 작성한 제5 삼차원 데이터(652)를 자차량이 요구하는 제6 삼차원 데이터(654)에 가공하여, 제6 삼차원 데이터(654)를 부호화함으로써 부호화 삼차원 데이터(634)를 생성하고, 부호화 삼차원 데이터(634)를 자차량에 송신한다.
삼차원 데이터 송신 장치(640)는, 삼차원 데이터 작성부(641)와, 수신부(642)와, 추출부(643)와, 부호화부(644)와, 송신부(645)를 구비한다.
우선, 삼차원 데이터 작성부(641)는, 주변 차량이 구비하는 센서로 검지한 센서 정보(651)를 이용하여 제5 삼차원 데이터(652)를 작성한다. 다음으로, 수신부(642)는, 자차량에서 송신된 요구 범위 정보(633)를 수신한다.
다음으로, 추출부(643)는, 제5 삼차원 데이터(652)로부터, 요구 범위 정보(633)로 나타내어지는 요구 범위의 삼차원 데이터를 추출함으로써, 제5 삼차원 데이터(652)를 제6 삼차원 데이터(654)로 가공한다. 다음으로, 부호화부(644)는, 제6 삼차원 데이터(654)를 부호화함으로써, 부호화 스트림인 부호화 삼차원 데이터(634)를 생성한다. 그리고, 송신부(645)는, 자차량에 부호화 삼차원 데이터(634)를 송신한다.
또한, 여기서는, 자차량이 삼차원 데이터 작성 장치(620)를 구비하고, 주변 차량이 삼차원 데이터 송신 장치(640)를 구비하는 예를 설명하지만, 각 차량이, 삼차원 데이터 작성 장치(620)와 삼차원 데이터 송신 장치(640)의 기능을 가져도 된다.
(실시형태 4)
본 실시형태에서는, 삼차원 맵에 의거한 자기 위치 추정에 있어서의 이상계의 동작에 대해 설명한다.
차의 자동 운전, 또는, 로봇, 혹은 드론 등의 비행체 등의 이동체를 자율적으로 이동시키는 등의 용도가 향후 확대할 것으로 예상된다. 이러한 자율적인 이동을 실현하는 수단의 일례로서, 이동체가 삼차원 맵 내에 있어서의 스스로의 위치를 추정(자기 위치 추정)하면서, 맵에 따라 주행하는 방법이 있다.
자기 위치 추정은, 삼차원 맵과, 자차에 탑재된 레인지 파인더(LiDAR 등) 또는 스테레오 카메라 등의 센서에 의해 취득한 자차 주변의 삼차원 정보(이후, 자차 검지 삼차원 데이터)를 매칭하여, 삼차원 맵 내의 자차 위치를 추정함으로써 실현할 수 있다.
삼차원 맵은, HERE사가 제창하는 HD 맵 등과 같이, 삼차원의 포인트 클라우드뿐만 아니라, 도로 및 교차점의 형상 정보 등 이차원의 지도 데이터, 또는, 정체 및 사고 등의 실시간으로 변화하는 정보를 포함해도 된다. 삼차원 데이터, 이차원 데이터, 실시간으로 변화하는 메타데이터 등 복수의 레이어로 삼차원 맵이 구성되고, 장치는, 필요한 데이터만을 취득, 또는, 참조하는 것도 가능하다.
포인트 클라우드의 데이터는, 상술한 SWLD여도 되고, 특징점이 아닌 점군 데이터를 포함해도 된다. 또, 포인트 클라우드의 데이터의 송수신은, 1개, 또는, 복수의 랜덤 액세스 단위를 기본으로서 행해진다.
삼차원 맵과 자차 검지 삼차원 데이터의 매칭 방법으로서 이하의 방법을 이용할 수 있다. 예를 들어, 장치는, 서로의 포인트 클라우드에 있어서의 점군의 형상을 비교하여, 특징점간의 유사도가 높은 부위가 동일 위치라고 결정한다. 또, 장치는, 삼차원 맵이 SWLD로 구성되는 경우, SWLD를 구성하는 특징점과, 자차 검지 삼차원 데이터로부터 추출한 삼차원 특징점을 비교하여 매칭을 행한다.
여기서, 고정밀도로 자기 위치 추정을 행하기 위해서는, (A) 삼차원 맵과 자차 검지 삼차원 데이터를 취득할 수 있으며, 또한, (B) 그들 정밀도가 미리 정해진 기준을 만족시키는 것이 필요해진다. 그러나, 이하와 같은 이상 케이스에서는, (A) 또는 (B)를 만족시킬 수 없다.
(1) 삼차원 맵을 통신 경유로 취득할 수 없다.
(2) 삼차원 맵이 존재하지 않거나, 또는, 삼차원 맵을 취득하였지만 파손되어 있다.
(3) 자차의 센서가 고장나 있거나, 또는, 악천후 때문에, 자차 검지 삼차원 데이터의 생성 정밀도가 충분하지 않다.
이들 이상 케이스에 대처하기 위한 동작을, 이하에서 설명한다. 이하에서는, 차를 예로 동작을 설명하지만, 이하의 수법은, 로봇 또는 드론 등, 자율적으로 이동하는 동물체 전반에 대해 적용할 수 있다.
이하, 삼차원 맵 또는 자차 검지 삼차원 데이터에 있어서의 이상 케이스에 대응하기 위한, 본 실시형태에 따른 삼차원 정보 처리 장치의 구성 및 동작을 설명한다. 도 26은, 본 실시형태에 따른 삼차원 정보 처리 장치(700)의 구성예를 나타낸 블록도이다.
삼차원 정보 처리 장치(700)는, 예를 들어, 자동차 등의 동물체에 탑재된다. 도 26에 나타낸 바와 같이, 삼차원 정보 처리 장치(700)는, 삼차원 맵 취득부(701)와, 자차 검지 데이터 취득부(702)와, 이상 케이스 판정부(703)와, 대처 동작 결정부(704)와, 동작 제어부(705)를 구비한다.
또한, 삼차원 정보 처리 장치(700)는, 이차원 화상을 취득하는 카메라, 또는, 초음파 혹은 레이저를 이용한 일차원 데이터의 센서 등, 자차 주변의 구조물 또는 동물체를 검지하기 위한 도시 생략의 이차원 또는 일차원의 센서를 구비해도 된다. 또, 삼차원 정보 처리 장치(700)는, 삼차원 맵을 4G 혹은 5G 등의 이동체 통신망, 또는, 차와 차간 통신 혹은 도로와 차간 통신에 의해 취득하기 위한 통신부(도시 생략)를 구비해도 된다.
삼차원 맵 취득부(701)는, 주행 경로 근방의 삼차원 맵(711)을 취득한다. 예를 들어, 삼차원 맵 취득부(701)는, 이동체 통신망, 또는, 차와 차간 통신 혹은 도로와 차간 통신에 의해 삼차원 맵(711)을 취득한다.
다음으로, 자차 검지 데이터 취득부(702)는, 센서 정보에 의거하여 자차 검지 삼차원 데이터(712)를 취득한다. 예를 들어, 자차 검지 데이터 취득부(702)는, 자차가 구비하는 센서에 의해 취득된 센서 정보에 의거하여, 자차 검지 삼차원 데이터(712)를 생성한다.
다음으로, 이상 케이스 판정부(703)는, 취득한 삼차원 맵(711) 및 자차 검지 삼차원 데이터(712) 중 적어도 한쪽에 대해 미리 정해진 체크를 실시함으로써 이상 케이스를 검출한다. 즉, 이상 케이스 판정부(703)는, 취득한 삼차원 맵(711) 및 자차 검지 삼차원 데이터(712) 중 적어도 한쪽이 비정상인지를 판정한다.
이상 케이스가 검출된 경우, 대처 동작 결정부(704)는, 이상 케이스에 대한 대처 동작을 결정한다. 다음으로, 동작 제어부(705)는, 삼차원 맵 취득부(701) 등, 대처 동작의 실시에 필요한 각 처리부의 동작을 제어한다.
한편, 이상 케이스가 검출되지 않은 경우, 삼차원 정보 처리 장치(700)는, 처리를 종료한다.
또, 삼차원 정보 처리 장치(700)는, 삼차원 맵(711)과 자차 검지 삼차원 데이터(712)를 이용하여, 삼차원 정보 처리 장치(700)를 갖는 차량의 자기 위치 추정을 행한다. 다음으로, 삼차원 정보 처리 장치(700)는, 자기 위치 추정의 결과를 이용하여, 당해 차량을 자동 운전한다.
이와 같이, 삼차원 정보 처리 장치(700)는, 제1 삼차원 위치 정보를 포함하는 맵 데이터(삼차원 맵(711))를 통신로를 통해 취득한다. 예를 들어, 제1 삼차원 위치 정보는, 삼차원의 좌표 정보를 갖는 부분 공간을 단위로서 부호화되고, 각각이 1 이상의 부분 공간의 집합체이며, 각각을 독립적으로 복호 가능한 복수의 랜덤 액세스 단위를 포함한다. 예를 들어, 제1 삼차원 위치 정보는, 삼차원의 특징량이 소정의 역치 이상이 되는 특징점이 부호화된 데이터(SWLD)이다.
또, 삼차원 정보 처리 장치(700)는, 센서로 검지한 정보로부터 제2 삼차원 위치 정보(자차 검지 삼차원 데이터(712))를 생성한다. 다음으로, 삼차원 정보 처리 장치(700)는, 제1 삼차원 위치 정보 또는 제2 삼차원 위치 정보에 대해 이상 판정 처리를 실시함으로써, 제1 삼차원 위치 정보 또는 상기 제2 삼차원 위치 정보가 비정상인지의 여부를 판정한다.
삼차원 정보 처리 장치(700)는, 제1 삼차원 위치 정보 또는 제2 삼차원 위치 정보가 비정상이라고 판정된 경우, 당해 이상에 대한 대처 동작을 결정한다. 다음으로, 삼차원 정보 처리 장치(700)는, 대처 동작의 실시에 필요한 제어를 실시한다.
이에 의해, 삼차원 정보 처리 장치(700)는, 제1 삼차원 위치 정보 또는 제2 삼차원 위치 정보의 이상을 검지하여, 대처 동작을 행할 수 있다.
(실시형태 5)
본 실시형태에서는, 후속 차량으로의 삼차원 데이터 송신 방법 등에 대해 설명한다.
도 27은, 본 실시형태에 따른 삼차원 데이터 작성 장치(810)의 구성예를 나타낸 블록도이다. 이 삼차원 데이터 작성 장치(810)는, 예를 들어, 차량에 탑재된다. 삼차원 데이터 작성 장치(810)는, 외부의 교통 감시 클라우드, 전주(前走) 차량 또는 후속 차량과 삼차원 데이터의 송수신을 행함과 더불어, 삼차원 데이터를 작성 및 축적한다.
삼차원 데이터 작성 장치(810)는, 데이터 수신부(811)와, 통신부(812)와, 수신 제어부(813)와, 포맷 변환부(814)와, 복수의 센서(815)와, 삼차원 데이터 작성부(816)와, 삼차원 데이터 합성부(817)와, 삼차원 데이터 축적부(818)와, 통신부(819)와, 송신 제어부(820)와, 포맷 변환부(821)와, 데이터 송신부(822)를 구비한다.
데이터 수신부(811)는, 교통 감시 클라우드 또는 전주 차량으로부터 삼차원 데이터(831)를 수신한다. 삼차원 데이터(831)는, 예를 들어, 자차량의 센서(815)로 검지 불가능한 영역을 포함하는, 포인트 클라우드, 가시광 영상, 깊이 정보, 센서 위치 정보, 또는 속도 정보 등의 정보를 포함한다.
통신부(812)는, 교통 감시 클라우드 또는 전주 차량과 통신하여, 데이터 송신 요구 등을 교통 감시 클라우드 또는 전주 차량에 송신한다.
수신 제어부(813)는, 통신부(812)를 통해, 대응 포맷 등의 정보를 통신처와 교환하여, 통신처와의 통신을 확립한다.
포맷 변환부(814)는, 데이터 수신부(811)가 수신한 삼차원 데이터(831)에 포맷 변환 등을 행함으로써 삼차원 데이터(832)를 생성한다. 또, 포맷 변환부(814)는, 삼차원 데이터(831)가 압축 또는 부호화되어 있는 경우에는, 신장 또는 복호 처리를 행한다.
복수의 센서(815)는, LiDAR, 가시광 카메라 또는 적외선 카메라 등의, 차량의 외부의 정보를 취득하는 센서군이며, 센서 정보(833)를 생성한다. 예를 들어, 센서 정보(833)는, 센서(815)가 LiDAR 등의 레이저 센서인 경우, 포인트 클라우드(점군 데이터) 등의 삼차원 데이터이다. 또한, 센서(815)는 복수가 아니어도 된다.
삼차원 데이터 작성부(816)는, 센서 정보(833)로부터 삼차원 데이터(834)를 생성한다. 삼차원 데이터(834)는, 예를 들어, 포인트 클라우드, 가시광 영상, 깊이 정보, 센서 위치 정보, 또는 속도 정보 등의 정보를 포함한다.
삼차원 데이터 합성부(817)는, 자차량의 센서 정보(833)에 의거하여 작성된 삼차원 데이터(834)에, 교통 감시 클라우드 또는 전주 차량 등이 작성한 삼차원 데이터(832)를 합성함으로써, 자차량의 센서(815)에서는 검지할 수 없는 전주 차량의 전방의 공간도 포함하는 삼차원 데이터(835)를 구축한다.
삼차원 데이터 축적부(818)는, 생성된 삼차원 데이터(835) 등을 축적한다.
통신부(819)는, 교통 감시 클라우드 또는 후속 차량과 통신하여, 데이터 송신 요구 등을 교통 감시 클라우드 또는 후속 차량에 송신한다.
송신 제어부(820)는, 통신부(819)를 통해, 대응 포맷 등의 정보를 통신처와 교환하여, 통신처와 통신을 확립한다. 또, 송신 제어부(820)는, 삼차원 데이터 합성부(817)에서 생성된 삼차원 데이터(832)의 삼차원 데이터 구축 정보와, 통신처로부터의 데이터 송신 요구에 의거하여, 송신 대상의 삼차원 데이터의 공간인 송신 영역을 결정한다.
구체적으로는, 송신 제어부(820)는, 교통 감시 클라우드 또는 후속 차량으로부터의 데이터 송신 요구에 따라, 후속 차량의 센서에서는 검지할 수 없는 자차량의 전방의 공간을 포함하는 송신 영역을 결정한다. 또, 송신 제어부(820)는, 삼차원 데이터 구축 정보에 의거하여 송신 가능한 공간 또는 송신이 완료된 공간의 갱신 유무 등을 판단함으로써 송신 영역을 결정한다. 예를 들어, 송신 제어부(820)는, 데이터 송신 요구로 지정된 영역이며, 또한, 대응하는 삼차원 데이터(835)가 존재하는 영역을 송신 영역으로 결정한다. 그리고, 송신 제어부(820)는, 통신처가 대응하는 포맷, 및 송신 영역을 포맷 변환부(821)에 통지한다.
포맷 변환부(821)는, 삼차원 데이터 축적부(818)에 축적되어 있는 삼차원 데이터(835) 중, 송신 영역의 삼차원 데이터(836)를, 수신측이 대응하고 있는 포맷으로 변환함으로써 삼차원 데이터(837)를 생성한다. 또한, 포맷 변환부(821)는, 삼차원 데이터(837)를 압축 또는 부호화함으로써 데이터량을 삭감해도 된다.
데이터 송신부(822)는, 삼차원 데이터(837)를 교통 감시 클라우드 또는 후속 차량에 송신한다. 이 삼차원 데이터(837)는, 예를 들어, 후속 차량의 사각이 되는 영역을 포함하는, 자차량의 전방의 포인트 클라우드, 가시광 영상, 깊이 정보, 또는 센서 위치 정보 등의 정보를 포함한다.
또한, 여기서는, 포맷 변환부(814 및 821)에서 포맷 변환 등이 행해지는 예를 서술하였지만, 포맷 변환은 행해지지 않아도 된다.
이러한 구성에 의해, 삼차원 데이터 작성 장치(810)는, 자차량의 센서(815)로는 검지할 수 없는 영역의 삼차원 데이터(831)를 외부로부터 취득하여, 삼차원 데이터(831)와 자차량의 센서(815)로 검지한 센서 정보(833)에 의거한 삼차원 데이터(834)를 합성함으로써 삼차원 데이터(835)를 생성한다. 이에 의해, 삼차원 데이터 작성 장치(810)는, 자차량의 센서(815)로 검지할 수 없는 범위의 삼차원 데이터를 생성할 수 있다.
또, 삼차원 데이터 작성 장치(810)는, 교통 감시 클라우드 또는 후속 차량으로부터의 데이터 송신 요구에 따라, 후속 차량의 센서로는 검지할 수 없는 자차량의 전방의 공간을 포함하는 삼차원 데이터를, 교통 감시 클라우드 또는 후속 차량 등으로 송신할 수 있다.
(실시형태 6)
실시형태 5에 있어서, 차량 등의 클라이언트 장치가, 다른 차량 또는 교통 감시 클라우드 등의 서버에 삼차원 데이터를 송신하는 예를 설명하였다. 본 실시형태에서는, 클라이언트 장치는, 서버 또는 다른 클라이언트 장치에 센서로 얻어진 센서 정보를 송신한다.
우선, 본 실시형태에 따른 시스템의 구성을 설명한다. 도 28은, 본 실시형태에 따른 삼차원 맵 및 센서 정보의 송수신 시스템의 구성을 나타낸 도면이다. 이 시스템은, 서버(901)와, 클라이언트 장치(902A 및 902B)를 포함한다. 또한, 클라이언트 장치(902A 및 902B)를 특별히 구별하지 않는 경우에는, 클라이언트 장치(902)라고도 기재한다.
클라이언트 장치(902)는, 예를 들어, 차량 등의 이동체에 탑재되는 차재 기기이다. 서버(901)는, 예를 들어, 교통 감시 클라우드 등이며, 복수의 클라이언트 장치(902)와 통신 가능하다.
서버(901)는, 클라이언트 장치(902)에, 포인트 클라우드로 구성되는 삼차원 맵을 송신한다. 또한, 삼차원 맵의 구성은 포인트 클라우드에 한정되지 않으며, 메시 구조 등, 다른 삼차원 데이터를 나타내는 것이어도 된다.
클라이언트 장치(902)는, 서버(901)에, 클라이언트 장치(902)가 취득한 센서 정보를 송신한다. 센서 정보는, 예를 들어, LiDAR 취득 정보, 가시광 화상, 적외 화상, 뎁스 화상, 센서 위치 정보 및 속도 정보 중 적어도 하나를 포함한다.
서버(901)와 클라이언트 장치(902)의 사이에서 송수신되는 데이터는, 데이터 삭감을 위해 압축되어도 되고, 데이터의 정밀도를 유지하기 위해 비압축인 상태여도 상관없다. 데이터를 압축하는 경우, 포인트 클라우드에는 예를 들어 8진 트리 구조에 의거한 삼차원 압축 방식을 이용할 수 있다. 또, 가시광 화상, 적외 화상, 및 뎁스 화상에는 이차원의 화상 압축 방식을 이용할 수 있다. 이차원의 화상 압축 방식이란, 예를 들어, MPEG로 규격화된 MPEG-4 AVC 또는 HEVC 등이다.
또, 서버(901)는, 클라이언트 장치(902)로부터의 삼차원 맵의 송신 요구에 따라 서버(901)에서 관리하는 삼차원 맵을 클라이언트 장치(902)에 송신한다. 또한, 서버(901)는 클라이언트 장치(902)로부터의 삼차원 맵의 송신 요구를 기다리지 않고 삼차원 맵을 송신해도 된다. 예를 들어, 서버(901)는, 미리 정해진 공간에 있는 1개 이상의 클라이언트 장치(902)에 삼차원 맵을 브로드캐스트해도 상관없다. 또, 서버(901)는, 한 번 송신 요구를 받은 클라이언트 장치(902)에, 일정 시간마다 클라이언트 장치(902)의 위치에 적합한 삼차원 맵을 송신해도 된다. 또, 서버(901)는, 서버(901)가 관리하는 삼차원 맵이 갱신될 때마다 클라이언트 장치(902)에 삼차원 맵을 송신해도 된다.
클라이언트 장치(902)는, 서버(901)에 삼차원 맵의 송신 요구를 보낸다. 예를 들어, 클라이언트 장치(902)가, 주행 시에 자기 위치 추정을 행하고 싶은 경우에, 클라이언트 장치(902)는, 삼차원 맵의 송신 요구를 서버(901)에 송신한다.
또한, 다음과 같은 경우에, 클라이언트 장치(902)는 서버(901)에 삼차원 맵의 송신 요구를 보내도 된다. 클라이언트 장치(902)가 유지하는 삼차원 맵이 오래된 경우에, 클라이언트 장치(902)는 서버(901)에 삼차원 맵의 송신 요구를 보내도 된다. 예를 들어, 클라이언트 장치(902)가 삼차원 맵을 취득하고 나서 일정 기간이 경과한 경우에, 클라이언트 장치(902)는 서버(901)에 삼차원 맵의 송신 요구를 보내도 된다.
클라이언트 장치(902)가 유지하는 삼차원 맵으로 나타내어지는 공간으로부터, 클라이언트 장치(902)가 바깥으로 나오는 일정 시각 전에, 클라이언트 장치(902)는 서버(901)에 삼차원 맵의 송신 요구를 보내도 된다. 예를 들어, 클라이언트 장치(902)가, 클라이언트 장치(902)가 유지하는 삼차원 맵으로 나타내어지는 공간의 경계로부터 미리 정해진 거리 이내에 존재하는 경우에, 클라이언트 장치(902)는 서버(901)에 삼차원 맵의 송신 요구를 보내도 된다. 또, 클라이언트 장치(902)의 이동 경로 및 이동 속도를 파악할 수 있는 경우에는, 이들에 의거하여, 클라이언트 장치(902)가 유지하는 삼차원 맵으로 나타내어지는 공간으로부터, 클라이언트 장치(902)가 바깥으로 나오는 시각을 예측해도 된다.
클라이언트 장치(902)가 센서 정보로부터 작성한 삼차원 데이터와 삼차원 맵의 위치 맞춤 시의 오차가 일정 이상인 경우에, 클라이언트 장치(902)는 서버(901)에 삼차원 맵의 송신 요구를 보내도 된다.
클라이언트 장치(902)는, 서버(901)로부터 송신된 센서 정보의 송신 요구에 따라, 서버(901)에 센서 정보를 송신한다. 또한, 클라이언트 장치(902)는 서버(901)로부터의 센서 정보의 송신 요구를 기다리지 않고 센서 정보를 서버(901)에 보내도 된다. 예를 들어, 클라이언트 장치(902)는, 한 번 서버(901)로부터 센서 정보의 송신 요구를 얻은 경우, 일정 기간 동안, 정기적으로 센서 정보를 서버(901)에 송신해도 된다. 또, 클라이언트 장치(902)는, 클라이언트 장치(902)가 센서 정보를 바탕으로 작성한 삼차원 데이터와, 서버(901)로부터 얻은 삼차원 맵의 위치 맞춤 시의 오차가 일정 이상인 경우, 클라이언트 장치(902) 주변의 삼차원 맵에 변화가 생긴 가능성이 있다고 판단하여, 그 취지와 센서 정보를 서버(901)에 송신해도 된다.
서버(901)는, 클라이언트 장치(902)에 센서 정보의 송신 요구를 보낸다. 예를 들어, 서버(901)는, 클라이언트 장치(902)로부터, GPS 등의 클라이언트 장치(902)의 위치 정보를 수신한다. 서버(901)는, 클라이언트 장치(902)의 위치 정보에 의거하여, 서버(901)가 관리하는 삼차원 맵에 있어서 정보가 적은 공간에 클라이언트 장치(902)가 가까워지고 있다고 판단한 경우, 새로운 삼차원 맵을 생성하기 위해 클라이언트 장치(902)에 센서 정보의 송신 요구를 보낸다. 또, 서버(901)는, 삼차원 맵을 갱신하고 싶은 경우, 적설 시 혹은 재해 시 등의 도로 상황을 확인하고 싶은 경우, 정체 상황, 혹은 사건 사고 상황 등을 확인하고 싶은 경우에, 센서 정보의 송신 요구를 보내도 된다.
또, 클라이언트 장치(902)는, 서버(901)로부터 수취하는 센서 정보의 송신 요구의 수신 시에 있어서의 통신 상태 또는 대역에 따라, 서버(901)에 송신하는 센서 정보의 데이터량을 설정해도 된다. 서버(901)에 송신하는 센서 정보의 데이터량을 설정한다는 것은, 예를 들어, 당해 데이터 그 자체를 증감시키는 것, 또는 압축 방식을 적절히 선택하는 것이다.
도 29는, 클라이언트 장치(902)의 구성예를 나타낸 블록도이다. 클라이언트 장치(902)는, 서버(901)로부터 포인트 클라우드 등으로 구성되는 삼차원 맵을 수신하고, 클라이언트 장치(902)의 센서 정보에 의거하여 작성한 삼차원 데이터로부터 클라이언트 장치(902)의 자기 위치를 추정한다. 또, 클라이언트 장치(902)는, 취득한 센서 정보를 서버(901)에 송신한다.
클라이언트 장치(902)는, 데이터 수신부(1011)와, 통신부(1012)와, 수신 제어부(1013)와, 포맷 변환부(1014)와, 복수의 센서(1015)와, 삼차원 데이터 작성부(1016)와, 삼차원 화상 처리부(1017)와, 삼차원 데이터 축적부(1018)와, 포맷 변환부(1019)와, 통신부(1020)와, 송신 제어부(1021)와, 데이터 송신부(1022)를 구비한다.
데이터 수신부(1011)는, 서버(901)로부터 삼차원 맵(1031)을 수신한다. 삼차원 맵(1031)은, WLD 또는 SWLD 등의 포인트 클라우드를 포함하는 데이터이다. 삼차원 맵(1031)에는, 압축 데이터, 및 비압축 데이터 중 어느 쪽이 포함되어 있어도 된다.
통신부(1012)는, 서버(901)와 통신하여, 데이터 송신 요구(예를 들어, 삼차원 맵의 송신 요구) 등을 서버(901)에 송신한다.
수신 제어부(1013)는, 통신부(1012)를 통해, 대응 포맷 등의 정보를 통신처와 교환하여, 통신처와의 통신을 확립한다.
포맷 변환부(1014)는, 데이터 수신부(1011)가 수신한 삼차원 맵(1031)에 포맷 변환 등을 행함으로써 삼차원 맵(1032)을 생성한다. 또, 포맷 변환부(1014)는, 삼차원 맵(1031)이 압축 또는 부호화되어 있는 경우에는, 신장 또는 복호 처리를 행한다. 또한, 포맷 변환부(1014)는, 삼차원 맵(1031)이 비압축 데이터이면, 신장 또는 복호 처리를 행하지 않는다.
복수의 센서(1015)는, LiDAR, 가시광 카메라, 적외선 카메라, 또는 뎁스 센서 등, 클라이언트 장치(902)가 탑재되어 있는 차량의 외부의 정보를 취득하는 센서군이며, 센서 정보(1033)를 생성한다. 예를 들어, 센서 정보(1033)는, 센서(1015)가 LiDAR 등의 레이저 센서인 경우, 포인트 클라우드(점군 데이터) 등의 삼차원 데이터이다. 또한, 센서(1015)는 복수가 아니어도 된다.
삼차원 데이터 작성부(1016)는, 센서 정보(1033)에 의거하여 자차량 주변의 삼차원 데이터(1034)를 작성한다. 예를 들어, 삼차원 데이터 작성부(1016)는, LiDAR로 취득한 정보와, 가시광 카메라로 얻어진 가시광 영상을 이용하여 자차량 주변의 색 정보를 갖는 포인트 클라우드 데이터를 작성한다.
삼차원 화상 처리부(1017)는, 수신한 포인트 클라우드 등의 삼차원 맵(1032)과, 센서 정보(1033)로부터 생성한 자차량 주변의 삼차원 데이터(1034)를 이용하여, 자차량의 자기 위치 추정 처리 등을 행한다. 또한, 삼차원 화상 처리부(1017)는, 삼차원 맵(1032)과 삼차원 데이터(1034)를 합성함으로써 자차량 주변의 삼차원 데이터(1035)를 작성하고, 작성한 삼차원 데이터(1035)를 이용하여 자기 위치 추정 처리를 행해도 된다.
삼차원 데이터 축적부(1018)는, 삼차원 맵(1032), 삼차원 데이터(1034) 및 삼차원 데이터(1035) 등을 축적한다.
포맷 변환부(1019)는, 센서 정보(1033)를, 수신측이 대응하고 있는 포맷으로 변환함으로써 센서 정보(1037)를 생성한다. 또한, 포맷 변환부(1019)는, 센서 정보(1037)를 압축 또는 부호화함으로써 데이터량을 삭감해도 된다. 또, 포맷 변환부(1019)는, 포맷 변환을 할 필요가 없는 경우는 처리를 생략해도 된다. 또, 포맷 변환부(1019)는, 송신 범위의 지정에 따라 송신하는 데이터량을 제어해도 된다.
통신부(1020)는, 서버(901)와 통신하여, 데이터 송신 요구(센서 정보의 송신 요구) 등을 서버(901)로부터 수신한다.
송신 제어부(1021)는, 통신부(1020)를 통해, 대응 포맷 등의 정보를 통신처와 교환하여, 통신을 확립한다.
데이터 송신부(1022)는, 센서 정보(1037)를 서버(901)에 송신한다. 센서 정보(1037)는, 예를 들어, LiDAR로 취득한 정보, 가시광 카메라로 취득한 휘도 화상, 적외선 카메라로 취득한 적외 화상, 뎁스 센서로 취득한 뎁스 화상, 센서 위치 정보, 및 속도 정보 등, 복수의 센서(1015)에 의해 취득한 정보를 포함한다.
다음으로, 서버(901)의 구성을 설명한다. 도 30은, 서버(901)의 구성예를 나타낸 블록도이다. 서버(901)는, 클라이언트 장치(902)로부터 송신된 센서 정보를 수신하고, 수신한 센서 정보에 의거하여 삼차원 데이터를 작성한다. 서버(901)는, 작성한 삼차원 데이터를 이용하여, 서버(901)가 관리하는 삼차원 맵을 갱신한다. 또, 서버(901)는, 클라이언트 장치(902)로부터의 삼차원 맵의 송신 요구에 따라, 갱신한 삼차원 맵을 클라이언트 장치(902)에 송신한다.
서버(901)는, 데이터 수신부(1111)와, 통신부(1112)와, 수신 제어부(1113)와, 포맷 변환부(1114)와, 삼차원 데이터 작성부(1116)와, 삼차원 데이터 합성부(1117)와, 삼차원 데이터 축적부(1118)와, 포맷 변환부(1119)와, 통신부(1120)와, 송신 제어부(1121)와, 데이터 송신부(1122)를 구비한다.
데이터 수신부(1111)는, 클라이언트 장치(902)로부터 센서 정보(1037)를 수신한다. 센서 정보(1037)는, 예를 들어, LiDAR로 취득한 정보, 가시광 카메라로 취득한 휘도 화상, 적외선 카메라로 취득한 적외 화상, 뎁스 센서로 취득한 뎁스 화상, 센서 위치 정보, 및 속도 정보 등을 포함한다.
통신부(1112)는, 클라이언트 장치(902)와 통신하여, 데이터 송신 요구(예를 들어, 센서 정보의 송신 요구) 등을 클라이언트 장치(902)에 송신한다.
수신 제어부(1113)는, 통신부(1112)를 통해, 대응 포맷 등의 정보를 통신처와 교환하여, 통신을 확립한다.
포맷 변환부(1114)는, 수신한 센서 정보(1037)가 압축 또는 부호화되어 있는 경우에는, 신장 또는 복호 처리를 행함으로써 센서 정보(1132)를 생성한다. 또한, 포맷 변환부(1114)는, 센서 정보(1037)가 비압축 데이터이면, 신장 또는 복호 처리를 행하지 않는다.
삼차원 데이터 작성부(1116)는, 센서 정보(1132)에 의거하여 클라이언트 장치(902) 주변의 삼차원 데이터(1134)를 작성한다. 예를 들어, 삼차원 데이터 작성부(1116)는, LiDAR로 취득한 정보와, 가시광 카메라로 얻어진 가시광 영상을 이용하여 클라이언트 장치(902) 주변의 색 정보를 갖는 포인트 클라우드 데이터를 작성한다.
삼차원 데이터 합성부(1117)는, 센서 정보(1132)를 바탕으로 작성한 삼차원 데이터(1134)를, 서버(901)가 관리하는 삼차원 맵(1135)에 합성함으로써 삼차원 맵(1135)을 갱신한다.
삼차원 데이터 축적부(1118)는, 삼차원 맵(1135) 등을 축적한다.
포맷 변환부(1119)는, 삼차원 맵(1135)을, 수신측이 대응하고 있는 포맷으로 변환함으로써 삼차원 맵(1031)을 생성한다. 또한, 포맷 변환부(1119)는, 삼차원 맵(1135)을 압축 또는 부호화함으로써 데이터량을 삭감해도 된다. 또, 포맷 변환부(1119)는, 포맷 변환을 할 필요가 없는 경우는 처리를 생략해도 된다. 또, 포맷 변환부(1119)는, 송신 범위의 지정에 따라 송신하는 데이터량을 제어해도 된다.
통신부(1120)는, 클라이언트 장치(902)와 통신하여, 데이터 송신 요구(삼차원 맵의 송신 요구) 등을 클라이언트 장치(902)로부터 수신한다.
송신 제어부(1121)는, 통신부(1120)를 통해, 대응 포맷 등의 정보를 통신처와 교환하여, 통신을 확립한다.
데이터 송신부(1122)는, 삼차원 맵(1031)을 클라이언트 장치(902)에 송신한다. 삼차원 맵(1031)은, WLD 또는 SWLD 등의 포인트 클라우드를 포함하는 데이터이다. 삼차원 맵(1031)에는, 압축 데이터, 및 비압축 데이터 중 어느 쪽이 포함되어 있어도 된다.
다음으로, 클라이언트 장치(902)의 동작 흐름에 대해 설명한다. 도 31은, 클라이언트 장치(902)에 의한 삼차원 맵 취득 시의 동작을 나타내는 플로차트이다.
우선, 클라이언트 장치(902)는, 서버(901)에 삼차원 맵(포인트 클라우드 등)의 송신을 요구한다(S1001). 이때, 클라이언트 장치(902)는, GPS 등으로 얻어진 클라이언트 장치(902)의 위치 정보를 함께 송신함으로써, 그 위치 정보에 관련된 삼차원 맵의 송신을 서버(901)에 요구해도 된다.
다음으로, 클라이언트 장치(902)는, 서버(901)로부터 삼차원 맵을 수신한다(S1002). 수신한 삼차원 맵이 압축 데이터이면, 클라이언트 장치(902)는, 수신한 삼차원 맵을 복호하여 비압축의 삼차원 맵을 생성한다(S1003).
다음으로, 클라이언트 장치(902)는, 복수의 센서(1015)로 얻어진 센서 정보(1033)로부터 클라이언트 장치(902) 주변의 삼차원 데이터(1034)를 작성한다(S1004). 다음으로, 클라이언트 장치(902)는, 서버(901)로부터 수신한 삼차원 맵(1032)과, 센서 정보(1033)로부터 작성한 삼차원 데이터(1034)를 이용하여 클라이언트 장치(902)의 자기 위치를 추정한다(S1005).
도 32는, 클라이언트 장치(902)에 의한 센서 정보의 송신 시의 동작을 나타낸 플로차트이다. 우선, 클라이언트 장치(902)는, 서버(901)로부터 센서 정보의 송신 요구를 수신한다(S1011). 송신 요구를 수신한 클라이언트 장치(902)는, 센서 정보(1037)를 서버(901)에 송신한다(S1012). 또한, 클라이언트 장치(902)는, 센서 정보(1033)가 복수의 센서(1015)로 얻어진 복수의 정보를 포함하는 경우, 각 정보를, 각 정보에 적합한 압축 방식으로 압축함으로써 센서 정보(1037)를 생성해도 된다.
다음으로, 서버(901)의 동작 흐름에 대해 설명한다. 도 33은, 서버(901)에 의한 센서 정보의 취득 시의 동작을 나타낸 플로차트이다. 우선, 서버(901)는, 클라이언트 장치(902)에 센서 정보의 송신을 요구한다(S1021). 다음으로, 서버(901)는, 당해 요구에 따라 클라이언트 장치(902)로부터 송신된 센서 정보(1037)를 수신한다(S1022). 다음으로, 서버(901)는, 수신한 센서 정보(1037)를 이용하여 삼차원 데이터(1134)를 작성한다(S1023). 다음으로, 서버(901)는, 작성한 삼차원 데이터(1134)를 삼차원 맵(1135)에 반영한다(S1024).
도 34는, 서버(901)에 의한 삼차원 맵의 송신 시의 동작을 나타낸 플로차트이다. 우선, 서버(901)는, 클라이언트 장치(902)로부터 삼차원 맵의 송신 요구를 수신한다(S1031). 삼차원 맵의 송신 요구를 수신한 서버(901)는, 클라이언트 장치(902)에 삼차원 맵(1031)을 송신한다(S1032). 이때, 서버(901)는, 클라이언트 장치(902)의 위치 정보에 맞추어 그 부근의 삼차원 맵을 추출하고, 추출한 삼차원 맵을 송신해도 된다. 또, 서버(901)는, 포인트 클라우드로 구성되는 삼차원 맵을, 예를 들어 8진 트리 구조에 의한 압축 방식 등을 이용하여 압축하고, 압축 후의 삼차원 맵을 송신해도 된다.
이하, 본 실시형태의 변형예에 대해 설명한다.
서버(901)는, 클라이언트 장치(902)로부터 수신한 센서 정보(1037)을 이용하여 클라이언트 장치(902)의 위치 부근의 삼차원 데이터(1134)를 작성한다. 다음으로, 서버(901)는, 작성한 삼차원 데이터(1134)와, 서버(901)가 관리하는 동 에리어의 삼차원 맵(1135)의 매칭을 행함으로써, 삼차원 데이터(1134)와 삼차원 맵(1135)의 차분을 산출한다. 서버(901)는, 차분이 미리 정해진 역치 이상인 경우는, 클라이언트 장치(902)의 주변에서 어떠한 이상이 발생한 것으로 판단한다. 예를 들어, 지진 등의 자연재해에 의해 지반침하 등이 발생했을 때 등에, 서버(901)가 관리하는 삼차원 맵(1135)과, 센서 정보(1037)를 기초로 작성한 삼차원 데이터(1134)의 사이에 큰 차가 발생하는 것을 생각할 수 있다.
센서 정보(1037)는, 센서의 종류, 센서의 성능, 및 센서의 제품번호 중 적어도 하나를 나타내는 정보를 포함해도 된다. 또, 센서 정보(1037)에, 센서의 성능에 따른 클래스 ID 등이 부가되어도 된다. 예를 들어, 센서 정보(1037)가 LiDAR로 취득된 정보인 경우, 수mm 단위의 정밀도로 정보를 취득할 수 있는 센서를 클래스 1, 수cm 단위의 정밀도로 정보를 취득할 수 있는 센서를 클래스 2, 수m 단위의 정밀도로 정보를 취득할 수 있는 센서를 클래스 3과 같이, 센서의 성능에 식별자를 할당하는 것을 생각할 수 있다. 또, 서버(901)는, 센서의 성능 정보 등을, 클라이언트 장치(902)의 제품번호로부터 추정해도 된다. 예를 들어, 클라이언트 장치(902)가 차량에 탑재되어 있는 경우, 서버(901)는, 당해 차량의 차종으로부터 센서의 스펙 정보를 판단해도 된다. 이 경우, 서버(901)는, 차량의 차종의 정보를 사전에 취득하고 있어도 되고, 센서 정보에 당해 정보가 포함되어도 된다. 또, 서버(901)는 취득한 센서 정보(1037)를 이용하여, 센서 정보(1037)를 이용하여 작성한 삼차원 데이터(1134)에 대한 보정의 정도를 전환해도 된다. 예를 들어, 센서 성능이 고정밀도(클래스 1)인 경우, 서버(901)는, 삼차원 데이터(1134)에 대한 보정을 행하지 않는다. 센서 성능이 저정밀도(클래스 3)인 경우, 서버(901)는, 삼차원 데이터(1134)에, 센서의 정밀도에 따른 보정을 적용한다. 예를 들어, 서버(901)는, 센서의 정밀도가 낮을수록 보정의 정도(강도)를 강하게 한다.
서버(901)는, 어느 공간에 있는 복수의 클라이언트 장치(902)에 동시에 센서 정보의 송신 요구를 보내도 된다. 서버(901)는, 복수의 클라이언트 장치(902)로부터 복수의 센서 정보를 수신한 경우에, 모든 센서 정보를 삼차원 데이터(1134)의 작성에 이용할 필요는 없으며, 예를 들어, 센서의 성능에 따라, 이용하는 센서 정보를 선택해도 된다. 예를 들어, 서버(901)는, 삼차원 맵(1135)을 갱신하는 경우, 수신한 복수의 센서 정보 중에서 고정밀한 센서 정보(클래스 1)를 선별하고, 선별한 센서 정보를 이용하여 삼차원 데이터(1134)를 작성해도 된다.
서버(901)는, 교통 감시 클라우드 등의 서버에만 한정되지 않고, 다른 클라이언트 장치(차재)여도 된다. 도 35는, 이 경우의 시스템 구성을 나타낸 도면이다.
예를 들어, 클라이언트 장치(902C)가 근처에 있는 클라이언트 장치(902A)에 센서 정보의 송신 요구를 보내어, 클라이언트 장치(902A)로부터 센서 정보를 취득한다. 그리고, 클라이언트 장치(902C)는, 취득한 클라이언트 장치(902A)의 센서 정보를 이용하여 삼차원 데이터를 작성하고, 클라이언트 장치(902C)의 삼차원 맵을 갱신한다. 이에 의해, 클라이언트 장치(902C)는, 클라이언트 장치(902A)로부터 취득 가능한 공간의 삼차원 맵을, 클라이언트 장치(902C)의 성능을 살려 생성할 수 있다. 예를 들어, 클라이언트 장치(902C)의 성능이 높은 경우에, 이러한 케이스가 발생한다고 생각할 수 있다.
또, 이 경우, 센서 정보를 제공한 클라이언트 장치(902A)는, 클라이언트 장치(902C)가 생성한 고정밀한 삼차원 맵을 취득할 권리가 부여된다. 클라이언트 장치(902A)는, 그 권리에 따라 클라이언트 장치(902C)로부터 고정밀한 삼차원 맵을 수신한다.
또, 클라이언트 장치(902C)는 근처에 있는 복수의 클라이언트 장치(902)(클라이언트 장치(902A) 및 클라이언트 장치(902B))에 센서 정보의 송신 요구를 보내도 된다. 클라이언트 장치(902A) 또는 클라이언트 장치(902B)의 센서가 고성능인 경우에는, 클라이언트 장치(902C)는, 이 고성능인 센서로 얻어진 센서 정보를 이용하여 삼차원 데이터를 작성할 수 있다.
도 36은, 서버(901) 및 클라이언트 장치(902)의 기능 구성을 나타낸 블록도이다. 서버(901)는, 예를 들어, 삼차원 맵을 압축 및 복호하는 삼차원 맵 압축/복호 처리부(1201)와, 센서 정보를 압축 및 복호하는 센서 정보 압축/복호 처리부(1202)를 구비한다.
클라이언트 장치(902)는, 삼차원 맵 복호 처리부(1211)와, 센서 정보 압축 처리부(1212)를 구비한다. 삼차원 맵 복호 처리부(1211)는, 압축된 삼차원 맵의 부호화 데이터를 수신하고, 부호화 데이터를 복호하여 삼차원 맵을 취득한다. 센서 정보 압축 처리부(1212)는, 취득한 센서 정보로부터 작성한 삼차원 데이터를 대신하여, 센서 정보 그 자체를 압축하고, 압축한 센서 정보의 부호화 데이터를 서버(901)에 송신한다. 이 구성에 의해, 클라이언트 장치(902)는, 삼차원 맵(포인트 클라우드 등)을 복호하는 처리를 행하는 처리부(장치 또는 LSI)를 내부에 유지하면 되고, 삼차원 맵(포인트 클라우드 등)의 삼차원 데이터를 압축하는 처리를 행하는 처리부를 내부에 유지할 필요가 없다. 이에 의해, 클라이언트 장치(902)의 비용 및 소비 전력 등을 억제할 수 있다.
이상과 같이, 본 실시형태에 따른 클라이언트 장치(902)는, 이동체에 탑재되고, 이동체에 탑재된 센서(1015)에 의해 얻어진, 이동체의 주변 상황을 나타내는 센서 정보(1033)로부터, 이동체 주변의 삼차원 데이터(1034)를 작성한다. 클라이언트 장치(902)는, 작성된 삼차원 데이터(1034)를 이용하여 이동체의 자기 위치를 추정한다. 클라이언트 장치(902)는, 취득한 센서 정보(1033)를 서버(901) 또는 다른 이동체(902)에 송신한다.
이에 의하면, 클라이언트 장치(902)는, 센서 정보(1033)를 서버(901) 등에 송신한다. 이에 의해, 삼차원 데이터를 송신하는 경우에 비해, 송신 데이터의 데이터량을 삭감할 수 있을 가능성이 있다. 또, 삼차원 데이터의 압축 또는 부호화 등의 처리를 클라이언트 장치(902)로 행할 필요가 없으므로, 클라이언트 장치(902)의 처리량을 삭감할 수 있다. 따라서, 클라이언트 장치(902)는, 전송되는 데이터량의 삭감, 또는, 장치의 구성의 간략화를 실현할 수 있다.
또, 클라이언트 장치(902)는, 또한, 서버(901)에 삼차원 맵의 송신 요구를 송신하고, 서버(901)로부터 삼차원 맵(1031)을 수신한다. 클라이언트 장치(902)는, 자기 위치의 추정에서는, 삼차원 데이터(1034)와 삼차원 맵(1032)을 이용하여, 자기 위치를 추정한다.
또, 센서 정보(1033)는, 레이저 센서로 얻어진 정보, 휘도 화상, 적외 화상, 뎁스 화상, 센서의 위치 정보, 및 센서의 속도 정보 중 적어도 하나를 포함한다.
또, 센서 정보(1033)는, 센서의 성능을 나타내는 정보를 포함한다.
또, 클라이언트 장치(902)는, 센서 정보(1033)를 부호화 또는 압축하고, 센서 정보의 송신에서는, 부호화 또는 압축 후의 센서 정보(1037)를, 서버(901) 또는 다른 이동체(902)에 송신한다. 이에 의하면, 클라이언트 장치(902)는, 전송되는 데이터량을 삭감할 수 있다.
예를 들어, 클라이언트 장치(902)는, 프로세서와, 메모리를 구비하고, 프로세서는, 메모리를 이용하여, 상기의 처리를 행한다.
또, 본 실시형태에 따른 서버(901)는, 이동체에 탑재되는 클라이언트 장치(902)와 통신 가능하고, 이동체에 탑재된 센서(1015)에 의해 얻어진, 이동체의 주변 상황을 나타내는 센서 정보(1037)를 클라이언트 장치(902)로부터 수신한다. 서버(901)는, 수신한 센서 정보(1037)로부터, 이동체 주변의 삼차원 데이터(1134)를 작성한다.
이에 의하면, 서버(901)는, 클라이언트 장치(902)로부터 송신된 센서 정보(1037)를 이용하여 삼차원 데이터(1134)를 작성한다. 이에 의해, 클라이언트 장치(902)가 삼차원 데이터를 송신하는 경우에 비해, 송신 데이터의 데이터량을 삭감할 수 있을 가능성이 있다. 또, 삼차원 데이터의 압축 또는 부호화 등의 처리를 클라이언트 장치(902)로 행할 필요가 없으므로, 클라이언트 장치(902)의 처리량을 삭감할 수 있다. 따라서, 서버(901)는, 전송되는 데이터량의 삭감, 또는, 장치의 구성의 간략화를 실현할 수 있다.
또, 서버(901)는, 또한, 클라이언트 장치(902)에 센서 정보의 송신 요구를 송신한다.
또, 서버(901)는, 또한, 작성된 삼차원 데이터(1134)를 이용하여 삼차원 맵(1135)을 갱신하고, 클라이언트 장치(902)로부터의 삼차원 맵(1135)의 송신 요구에 따라 삼차원 맵(1135)을 클라이언트 장치(902)에 송신한다.
또, 센서 정보(1037)는, 레이저 센서로 얻어진 정보, 휘도 화상, 적외 화상, 뎁스 화상, 센서의 위치 정보, 및 센서의 속도 정보 중 적어도 하나를 포함한다.
또, 센서 정보(1037)는, 센서의 성능을 나타내는 정보를 포함한다.
또, 서버(901)는, 또한, 센서의 성능에 따라, 삼차원 데이터를 보정한다. 이에 의하면, 당해 삼차원 데이터 작성 방법은, 삼차원 데이터의 품질을 향상시킬 수 있다.
또, 서버(901)는, 센서 정보의 수신에서는, 복수의 클라이언트 장치(902)로부터 복수의 센서 정보(1037)를 수신하고, 복수의 센서 정보(1037)에 포함되는 센서의 성능을 나타내는 복수의 정보에 의거하여, 삼차원 데이터(1134)의 작성에 이용하는 센서 정보(1037)를 선택한다. 이에 의하면, 서버(901)는, 삼차원 데이터(1134)의 품질을 향상시킬 수 있다.
또, 서버(901)는, 수신한 센서 정보(1037)를 복호 또는 신장하고, 복호 또는 신장 후의 센서 정보(1132)로부터, 삼차원 데이터(1134)를 작성한다. 이에 의하면, 서버(901)는, 전송되는 데이터량을 삭감할 수 있다.
예를 들어, 서버(901)는, 프로세서와, 메모리를 구비하고, 프로세서는, 메모리를 이용하여, 상기의 처리를 행한다.
(실시형태 7)
본 실시형태에서는, 인터 예측 처리를 이용한 삼차원 데이터의 부호화 방법 및 복호 방법에 대해 설명한다.
도 37은, 본 실시형태에 따른 삼차원 데이터 부호화 장치(1300)의 블록도이다. 이 삼차원 데이터 부호화 장치(1300)는, 삼차원 데이터를 부호화함으로써 부호화 신호인 부호화 비트 스트림(이하, 간단히 비트 스트림이라고도 기재한다)을 생성한다. 도 37에 나타낸 바와 같이, 삼차원 데이터 부호화 장치(1300)는, 분할부(1301)와, 감산부(1302)와, 변환부(1303)와, 양자화부(1304)와, 역양자화부(1305)와, 역변환부(1306)와, 가산부(1307)와, 참조 볼륨 메모리(1308)와, 인트라 예측부(1309)와, 참조 스페이스 메모리(1310)와, 인터 예측부(1311)와, 예측 제어부(1312)와, 엔트로피 부호화부(1313)를 구비한다.
분할부(1301)는, 삼차원 데이터에 포함되는 각 스페이스(SPC)를 부호화 단위인 복수의 볼륨(VLM)으로 분할한다. 또, 분할부(1301)는, 각 볼륨 내의 복셀을 8진 트리 표현화(Octree화)한다. 또한, 분할부(1301)는, 스페이스와 볼륨을 동일 사이즈로 하여, 스페이스를 8진 트리 표현화해도 된다. 또, 분할부(1301)는, 8진 트리화에 필요한 정보(심도 정보 등)를 비트 스트림의 헤더 등에 부가해도 된다.
감산부(1302)는, 분할부(1301)에서 출력된 볼륨(부호화 대상 볼륨)과, 후술 하는 인트라 예측 또는 인터 예측에 의해 생성되는 예측 볼륨의 차분을 산출하고, 산출된 차분을 예측 잔차로서 변환부(1303)에 출력한다. 도 38은, 예측 잔차의 산출예를 나타낸 도면이다. 또한, 여기서 나타내는 부호화 대상 볼륨 및 예측 볼륨의 비트열은, 예를 들어, 볼륨에 포함되는 삼차원점(예를 들어 포인트 클라우드)의 위치를 나타내는 위치 정보이다.
이하, 8진 트리 표현과 복셀의 스캔순에 대해 설명한다. 볼륨은 8진 트리 구조로 변환(8진 트리화)된 후, 부호화된다. 8진 트리 구조는 노드와 리프로 구성된다. 각 노드는 8개의 노드 또는 리프를 가지며, 각 리프는 복셀(VXL) 정보를 갖는다. 도 39는, 복수의 복셀을 포함하는 볼륨의 구조예를 나타낸 도면이다. 도 40은, 도 39에 나타낸 볼륨을 8진 트리 구조로 변환한 예를 나타낸 도면이다. 여기서, 도 40에 나타낸 리프 중, 리프 1, 2, 3은 각각 도 39에 나타낸 복셀 VXL1, VXL2, VXL3을 나타내며, 점군을 포함하는 VXL(이하, 유효 VXL)을 표현하고 있다.
8진 트리는, 예를 들어 0, 1의 2치열로 표현된다. 예를 들어, 노드 또는 유효 VXL을 값 1, 그 이외를 값 0으로 하면, 각 노드 및 리프에는 도 40에 나타낸 2치열이 할당된다. 그리고, 폭 우선 또는 깊이 우선의 스캔순에 따라, 이 2치열이 스캔된다. 예를 들어 폭 우선으로 스캔된 경우, 도 41의 A에 나타낸 2치열이 얻어진다. 깊이 우선으로 스캔한 경우는 도 41의 B에 나타낸 2치열이 얻어진다. 이 스캔에 의해 얻어진 2치열은 엔트로피 부호화에 의해 부호화되어 정보량이 삭감된다.
다음으로, 8진 트리 표현에 있어서의 심도 정보에 대해 설명한다. 8진 트리 표현에 있어서의 심도는, 볼륨 내에 포함되는 포인트 클라우드 정보를, 어느 입도까지 유지할지를 컨트롤하기 위해 사용된다. 심도를 크게 설정하면, 보다 세세한 레벨까지 포인트 클라우드 정보를 재현할 수 있지만, 노드 및 리프를 표현하기 위한 데이터량이 증가한다. 반대로 심도를 작게 설정하면, 데이터량이 감소하지만, 복수의 상이한 위치 및 색이 다른 포인트 클라우드 정보가 동일 위치 또한 동일 색인 것으로 간주되므로, 본래의 포인트 클라우드 정보가 갖는 정보를 잃게 된다.
예를 들어, 도 42는, 도 40에 나타낸 심도=2의 8진 트리를, 심도=1의 8진 트리로 표현한 예를 나타낸 도면이다. 도 42에 나타낸 8진 트리는 도 40에 나타낸 8진 트리보다 데이터량이 적어진다. 즉, 도 42에 나타낸 8진 트리는 도 42에 나타낸 8진 트리보다 2치열화 후의 비트수가 적다. 여기서, 도 40에 나타낸 리프 1과 리프 2가 도 41에 나타낸 리프 1로 표현되게 된다. 즉, 도 40에 나타낸 리프 1과 리프 2가 상이한 위치였다는 정보가 없어진다.
도 43은, 도 42에 나타낸 8진 트리에 대응하는 볼륨을 나타낸 도면이다. 도 39에 나타낸 VXL1과 VXL2가 도 43에 나타낸 VXL12에 대응한다. 이 경우, 삼차원 데이터 부호화 장치(1300)는, 도 43에 나타낸 VXL12의 색 정보를, 도 39에 나타낸 VXL1과 VXL2의 색 정보로부터 생성한다. 예를 들어, 삼차원 데이터 부호화 장치(1300)는, VXL1과 VXL2의 색 정보의 평균치, 중간치, 또는 가중 평균치 등을 VXL12의 색 정보로서 산출한다. 이와 같이, 삼차원 데이터 부호화 장치(1300)는, 8진 트리의 심도를 바꿈으로써, 데이터량의 삭감을 제어해도 된다.
삼차원 데이터 부호화 장치(1300)는, 8진 트리의 심도 정보를, 월드 단위, 스페이스 단위, 및 볼륨 단위 중 어느 단위로 설정해도 상관없다. 또 그때, 삼차원 데이터 부호화 장치(1300)는, 월드의 헤더 정보, 스페이스의 헤더 정보, 또는 볼륨의 헤더 정보에 심도 정보를 부가해도 된다. 또, 시간이 상이한 모든 월드, 스페이스, 및 볼륨으로 심도 정보로 하여 동일한 값을 사용해도 된다. 이 경우, 삼차원 데이터 부호화 장치(1300)는, 모든 시간의 월드를 관리하는 헤더 정보에 심도 정보를 부가해도 된다.
복셀에 색 정보가 포함되는 경우에는, 변환부(1303)는, 볼륨 내의 복셀의 색 정보의 예측 잔차에 대해, 직교 변환 등의 주파수 변환을 적용한다. 예를 들어, 변환부(1303)는, 어느 스캔순으로 예측 잔차를 스캔함으로써 일차원 배열을 작성한다. 그 후, 변환부(1303)는, 작성한 일차원 배열에 일차원의 직교 변환을 적용함으로써 일차원 배열을 주파수 영역으로 변환한다. 이에 의해, 볼륨 내의 예측 잔차의 값이 가까운 경우에는 저역의 주파수 성분의 값이 커지고, 고역의 주파수 성분의 값이 작아진다. 따라서, 양자화부(1304)에 있어서 보다 효율적으로 부호량을 삭감할 수 있다.
또, 변환부(1303)는, 일차원이 아니라, 이차원 이상의 직교 변환을 이용해도 된다. 예를 들어, 변환부(1303)는, 어느 스캔순으로 예측 잔차를 이차원 배열로 매핑하여, 얻어진 이차원 배열에 이차원 직교 변환을 적용한다. 또, 변환부(1303)는, 복수의 직교 변환 방식으로부터 사용하는 직교 변환 방식을 선택해도 된다. 이 경우, 삼차원 데이터 부호화 장치(1300)는, 어느 직교 변환 방식을 이용하였는지를 나타내는 정보를 비트 스트림에 부가한다. 또, 변환부(1303)는, 차원이 다른 복수의 직교 변환 방식으로부터 사용하는 직교 변환 방식을 선택해도 된다. 이 경우, 삼차원 데이터 부호화 장치(1300)는, 어느 차원의 직교 변환 방식을 이용하였는지를 비트 스트림에 부가한다.
예를 들어, 변환부(1303)는, 예측 잔차의 스캔순을, 볼륨 내의 8진 트리에 있어서의 스캔순(폭 우선 또는 깊이 우선 등)에 맞춘다. 이에 의해, 예측 잔차의 스캔순을 나타내는 정보를 비트 스트림에 부가할 필요가 없으므로, 오버헤드를 삭감할 수 있다. 또, 변환부(1303)는, 8진 트리의 스캔순과는 다른 스캔순을 적용해도 된다. 이 경우, 삼차원 데이터 부호화 장치(1300)는, 예측 잔차의 스캔순을 나타내는 정보를 비트 스트림에 부가한다. 이에 의해, 삼차원 데이터 부호화 장치(1300)는, 예측 잔차를 효율적으로 부호화할 수 있다. 또, 삼차원 데이터 부호화 장치(1300)는, 8진 트리의 스캔순을 적용할지의 여부를 나타내는 정보(플래그 등)를 비트 스트림에 부가하고, 8진 트리의 스캔순을 적용하지 않는 경우에, 예측 잔차의 스캔순을 나타내는 정보를 비트 스트림에 부가해도 된다.
변환부(1303)는, 색 정보의 예측 잔차뿐만 아니라, 복셀이 갖는 그 밖의 속성 정보를 변환해도 된다. 예를 들어, 변환부(1303)는, 포인트 클라우드를 LiDAR 등으로 취득했을 때에 얻어지는 반사도 등의 정보를 변환하여, 부호화해도 된다.
변환부(1303)는, 스페이스가 색 정보 등의 속성 정보를 갖지 않는 경우는, 처리를 스킵해도 된다. 또, 삼차원 데이터 부호화 장치(1300)는, 변환부(1303)의 처리를 스킵할지의 여부를 나타내는 정보(플래그)를 비트 스트림에 부가해도 된다.
양자화부(1304)는, 변환부(1303)에서 생성된 예측 잔차의 주파수 성분에 대해, 양자화 제어 파라미터를 이용하여 양자화를 행함으로써 양자화 계수를 생성한다. 이에 의해 정보량이 삭감된다. 생성된 양자화 계수는 엔트로피 부호화부(1313)에 출력된다. 양자화부(1304)는, 양자화 제어 파라미터를, 월드 단위, 스페이스 단위, 또는 볼륨 단위로 제어해도 된다. 그때에는, 삼차원 데이터 부호화 장치(1300)는, 양자화 제어 파라미터를 각각의 헤더 정보 등에 부가한다. 또, 양자화부(1304)는, 예측 잔차의 주파수 성분마다, 가중치를 바꾸어 양자화 제어를 행해도 된다. 예를 들어, 양자화부(1304)는, 저주파수 성분은 세세하게 양자화하고, 고주파 성분은 러프하게 양자화해도 된다. 이 경우, 삼차원 데이터 부호화 장치(1300)는, 각 주파수 성분의 가중치를 나타내는 파라미터를 헤더에 부가해도 된다.
양자화부(1304)는, 스페이스가 색 정보 등의 속성 정보를 갖지 않는 경우는, 처리를 스킵해도 된다. 또, 삼차원 데이터 부호화 장치(1300)는, 양자화부(1304)의 처리를 스킵할지의 여부를 나타내는 정보(플래그)를 비트 스트림에 부가해도 된다.
역양자화부(1305)는, 양자화 제어 파라미터를 이용하여, 양자화부(1304)에서 생성된 양자화 계수에 역양자화를 행함으로써 예측 잔차의 역양자화 계수를 생성하고, 생성한 역양자화 계수를 역변환부(1306)에 출력한다.
역변환부(1306)는, 역양자화부(1305)에서 생성된 역양자화 계수에 대해 역변환을 적용함으로써 역변환 적용 후 예측 잔차를 생성한다. 이 역변환 적용 후 예측 잔차는, 양자화 후에 생성된 예측 잔차이므로, 변환부(1303)가 출력한 예측 잔차와는 완전히는 일치하지 않아도 된다.
가산부(1307)는, 역변환부(1306)에서 생성된 역변환 적용 후 예측 잔차와, 양자화 전의 예측 잔차의 생성에 이용된, 후술하는 인트라 예측 또는 인터 예측에 의해 생성된 예측 볼륨을 가산하여 재구성 볼륨을 생성한다. 이 재구성 볼륨은, 참조 볼륨 메모리(1308), 또는, 참조 스페이스 메모리(1310)에 저장된다.
인트라 예측부(1309)는, 참조 볼륨 메모리(1308)에 저장된 인접 볼륨의 속성 정보를 이용하여, 부호화 대상 볼륨의 예측 볼륨을 생성한다. 속성 정보란, 복셀의 색 정보 또는 반사도를 포함한다. 인트라 예측부(1309)는, 부호화 대상 볼륨의 색 정보 또는 반사도의 예측치를 생성한다.
도 44는, 인트라 예측부(1309)의 동작을 설명하기 위한 도면이다. 예를 들어, 인트라 예측부(1309)는, 도 44에 나타낸, 부호화 대상 볼륨(볼륨 idx=3)의 예측 볼륨을, 인접 볼륨(볼륨 idx=0)으로부터 생성한다. 여기서, 볼륨 idx란 스페이스 내의 볼륨에 대해 부가되는 식별자 정보이며, 각 볼륨에 상이한 값이 할당된다. 볼륨 idx의 할당의 순서는 부호화순과 동일한 순서여도 되고, 부호화순과는 다른 순서여도 된다. 예를 들어, 인트라 예측부(1309)는, 도 44에 나타낸 부호화 대상 볼륨의 색 정보의 예측치로서, 인접 볼륨인 볼륨 idx=0 내에 포함되는 복셀의 색 정보의 평균치를 이용한다. 이 경우, 부호화 대상 볼륨 내에 포함되는 각 복셀의 색 정보로부터, 색 정보의 예측치가 차감됨으로써 예측 잔차가 생성된다. 이 예측 잔차에 대해 변환부(1303) 이후의 처리가 행해진다. 또, 이 경우, 삼차원 데이터 부호화 장치(1300)는, 인접 볼륨 정보와, 예측 모드 정보를 비트 스트림에 부가한다. 여기서 인접 볼륨 정보란, 예측에 이용한 인접 볼륨을 나타내는 정보이며, 예를 들어, 예측에 이용한 인접 볼륨의 볼륨 idx를 나타낸다. 또, 예측 모드 정보란, 예측 볼륨의 생성에 사용한 모드를 나타낸다. 모드란, 예를 들어, 인접 볼륨 내의 복셀의 평균치로부터 예측치를 생성하는 평균치 모드, 또는 인접 볼륨 내의 복셀의 중간치로부터 예측치를 생성하는 중간치 모드 등이다.
인트라 예측부(1309)는, 예측 볼륨을, 복수의 인접 볼륨으로부터 생성해도 된다. 예를 들어, 도 44에 나타낸 구성에 있어서, 인트라 예측부(1309)는, 볼륨 idx=0의 볼륨으로부터 예측 볼륨 0을 생성하고, 볼륨 idx=1의 볼륨으로부터 예측 볼륨 1을 생성한다. 그리고, 인트라 예측부(1309)는, 예측 볼륨 0과 예측 볼륨 1의 평균을 최종적인 예측 볼륨으로서 생성한다. 이 경우, 삼차원 데이터 부호화 장치(1300)는, 예측 볼륨의 생성에 사용한 복수의 볼륨의 복수의 볼륨 idx를 비트 스트림에 부가해도 된다.
(실시형태 8)
본 실시형태에서는, 삼차원 데이터의 부호화에 있어서의 삼차원점(포인트 클라우드)의 표현 수법에 대해 설명한다.
도 45는, 본 실시형태에 따른 삼차원 데이터의 전송 시스템의 구성을 나타낸 블록도이다. 도 45에 나타낸 전송 시스템은, 서버(1501)와, 복수의 클라이언트(1502)를 포함한다.
서버(1501)는, 기억부(1511)와, 제어부(1512)를 포함한다. 기억부(1511)는, 부호화된 삼차원 데이터인 부호화 삼차원 맵(1513)을 저장하고 있다.
도 46은, 부호화 삼차원 맵(1513)의 비트 스트림의 구성예를 나타낸 도면이다. 삼차원 맵은, 복수의 서브 맵(sub-map)으로 분할되고, 각 서브 맵이 부호화된다. 각 서브 맵에는, 서브 좌표 정보를 포함하는 랜덤 액세스 헤더(RA)가 부가된다. 서브 좌표 정보는, 서브 맵의 부호화 효율을 향상시키기 위해 이용된다. 이 서브 좌표 정보는, 서브 맵의 서브 좌표(sub-coordinate)를 나타낸다. 서브 좌표는, 기준 좌표(reference coordinate)를 기준으로 한 서브 맵의 좌표이다. 또한, 복수의 서브 맵이 포함되는 삼차원 맵을 전체 맵이라고 부른다. 또, 전체 맵에 있어서 기준이 되는 좌표(예를 들어 원점)를 기준 좌표라고 부른다. 즉, 서브 좌표는, 전체 맵의 좌표계에 있어서의 서브 맵의 좌표이다. 바꿔 말하면, 서브 좌표는, 전체 맵의 좌표계와 서브 맵의 좌표계의 오프셋을 나타낸다. 또, 기준 좌표를 기준으로 하는 전체 맵의 좌표계에 있어서의 좌표를 전체 좌표라고 부른다. 서브 좌표를 기준으로 하는 서브 맵의 좌표계에 있어서의 좌표를 차분 좌표라고 부른다.
클라이언트(1502)는, 서버(1501)에 메시지를 송신한다. 이 메시지는, 클라이언트(1502)의 위치 정보를 포함한다. 서버(1501)에 포함되는 제어부(1512)는, 수신한 메시지에 포함되는 위치 정보에 의거하여, 클라이언트(1502)의 위치에 가장 가까운 위치의 서브 맵의 비트 스트림을 취득한다. 서브 맵의 비트 스트림은, 서브 좌표 정보를 포함하고, 클라이언트(1502)에 송신된다. 클라이언트(1502)에 포함되는 디코더(1521)는, 이 서브 좌표 정보를 이용하여, 기준 좌표를 기준으로 한 서브 맵의 전체 좌표를 얻는다. 클라이언트(1502)에 포함되는 애플리케이션(1522)은, 얻어진 서브 맵의 전체 좌표를 이용하여, 자기 위치에 관련된 애플리케이션을 실행한다.
또, 서브 맵은 전체 맵의 일부 영역을 나타낸다. 서브 좌표는 전체 맵의 기준 좌표 공간에 있어서 서브 맵이 위치하는 좌표이다. 예를 들어 A의 전체 맵 중에, AA의 서브 맵 A, 및 AB의 서브 맵 B가 존재하는 것으로 한다. 차량은, AA의 지도를 참조하고 싶은 경우는, 서브 맵 A로부터 복호를 개시하고, AB의 지도를 참조하고 싶은 경우는, 서브 맵 B로부터 복호를 개시한다. 여기서 서브 맵은 랜덤 액세스 포인트이다. 구체적으로는, A는 오사카부, AA는 오사카시, AB는 타카츠키시 등이다.
각 서브 맵은 서브 좌표 정보와 함께 클라이언트에 송신된다. 서브 좌표 정보는 각 서브 맵의 헤더 정보, 또는 송신 패킷 등에 포함된다.
각 서브 맵의 서브 좌표 정보의 기준의 좌표가 되는 기준 좌표는, 전체 맵의 헤더 정보 등 서브 맵보다 상위 공간의 헤더 정보에 부가되어도 된다.
서브 맵은 1개의 스페이스(SPC)로 구성되어도 된다. 또, 서브 맵은 복수의 SPC로 구성되어도 된다.
또, 서브 맵은, GOS(Group of Space)를 포함해도 된다. 또 서브 맵은, 월드로 구성되어도 된다. 예를 들어, 서브 맵 중에 복수의 오브젝트가 있는 경우, 복수의 오브젝트를 각기 다른 SPC에 할당하면 서브 맵은 복수의 SPC로 구성된다. 또 복수의 오브젝트를 1개의 SPC에 할당하면 서브 맵은 1개의 SPC로 구성된다.
다음으로, 서브 좌표 정보를 이용한 경우의 부호화 효율의 개선 효과에 대해 설명한다. 도 47은, 이 효과를 설명하기 위한 도면이다. 예를 들어, 도 47에 나타낸, 기준 좌표로부터 먼 위치의 삼차원점 A를 부호화하기 위해서는, 많은 비트수가 필요해진다. 여기서, 서브 좌표와 삼차원점 A의 거리는, 기준 좌표와 삼차원점 A의 거리보다 짧다. 따라서, 기준 좌표를 기준으로 한 삼차원점 A의 좌표를 부호화하는 경우보다, 서브 좌표를 기준으로 한 삼차원점 A의 좌표를 부호화함으로써, 부호화 효율을 개선할 수 있다. 또, 서브 맵의 비트 스트림은, 서브 좌표 정보를 포함한다. 서브 맵의 비트 스트림과 기준 좌표를 복호측(클라이언트)으로 보냄으로써, 복호측에 있어서 서브 맵의 전체 좌표를 복원할 수 있다.
도 48은, 서브 맵의 송신측인 서버(1501)에 의한 처리의 플로차트이다.
우선, 서버(1501)는, 클라이언트(1502)로부터, 클라이언트(1502)의 위치 정보를 포함하는 메시지를 수신한다(S1501). 제어부(1512)는, 기억부(1511)로부터, 클라이언트의 위치 정보에 의거한 서브 맵의 부호화 비트 스트림을 취득한다(S1502). 그리고, 서버(1501)는, 서브 맵의 부호화 비트 스트림과 기준 좌표를 클라이언트(1502)에 송신한다(S1503).
도 49는, 서브 맵의 수신측인 클라이언트(1502)에 의한 처리의 플로차트이다.
우선, 클라이언트(1502)는, 서버(1501)로부터 송신된 서브 맵의 부호화 비트 스트림과 기준 좌표를 수신한다(S1511). 다음으로, 클라이언트(1502)는, 부호화 비트 스트림을 복호함으로써 서브 맵과 서브 좌표 정보를 취득한다(S1512). 다음으로, 클라이언트(1502)는, 기준 좌표와 서브 좌표를 이용하여 서브 맵 내의 차분 좌표를 전체 좌표에 복원한다(S1513).
다음으로, 서브 맵에 관한 정보의 신택스예를 설명한다. 서브 맵의 부호화에 있어서, 삼차원 데이터 부호화 장치는, 각 포인트 클라우드(삼차원점)의 좌표로부터 서브 좌표를 감산함으로써 차분 좌표를 산출한다. 그리고, 삼차원 데이터 부호화 장치는, 각 포인트 클라우드의 값으로서, 차분 좌표를 비트 스트림으로 부호화한다. 또, 부호화 장치는, 서브 좌표를 나타내는 서브 좌표 정보를 비트 스트림의 헤더 정보로서 부호화한다. 이에 의해, 삼차원 데이터 복호 장치는, 각 포인트 클라우드의 전체 좌표를 얻을 수 있다. 예를 들어, 삼차원 데이터 부호화 장치는 서버(1501)에 포함되고, 삼차원 데이터 복호 장치는 클라이언트(1502)에 포함된다.
도 50은, 서브 맵의 신택스예를 나타낸 도면이다. 도 50에 나타낸 NumOfPoint는, 서브 맵에 포함되는 포인트 클라우드수를 나타낸다. sub_coordinate_x, sub_coordinate_y, 및 sub_coordinate_z는, 서브 좌표 정보이다. sub_coordinate_x는, 서브 좌표의 x좌표를 나타낸다. sub_coordinate_y는, 서브 좌표의 y좌표를 나타낸다. sub_coordinate_z는, 서브 좌표의 z좌표를 나타낸다.
또, diff_x[i], diff_y[i], 및 diff_z[i]는, 서브 맵 내의 i번째 포인트 클라우드의 차분 좌표이다. diff_x[i]는, 서브 맵 내의 i번째 포인트 클라우드의 x좌표와 서브 좌표의 x좌표의 차분치를 나타낸다. diff_y[i]는, 서브 맵 내의 i번째 포인트 클라우드의 y좌표와 서브 좌표의 y좌표의 차분치를 나타낸다. diff_z[i]는, 서브 맵 내의 i번째 포인트 클라우드의 z좌표와 서브 좌표의 z좌표의 차분치를 나타낸다.
삼차원 데이터 복호 장치는, i번째의 포인트 클라우드의 전체 좌표인 point_cloud[i]_x, point_cloud[i]_y, 및 point_cloud[i]_z를 하기 식을 이용하여 복호한다. point_cloud[i]_x는, i번째의 포인트 클라우드의 전체 좌표의 x좌표이다. point_cloud[i]_y는, i번째의 포인트 클라우드의 전체 좌표의 y좌표이다. point_cloud[i]_z는, i번째의 포인트 클라우드의 전체 좌표의 z좌표이다.
point_cloud[i]_x=sub_coordinate_x+diff_x[i]
point_cloud[i]_y=sub_coordinate_y+diff_y[i]
point_cloud[i]_z=sub_coordinate_z+diff_z[i]
다음으로, 8진 트리 부호화의 적용의 전환 처리에 대해 설명한다. 삼차원 데이터 부호화 장치는, 서브 맵 부호화 시에, 각 포인트 클라우드를 8진 트리 표현으로 부호화하는(이하, 8진 트리 부호화(octree 부호화)라고 부른다) 것을 이용할지, 서브 좌표로부터의 차분치를 부호화하는(이하, 비8진 트리 부호화(non-octree 부호화)라고 부른다) 것을 이용할지를 선택한다. 도 51은, 이 동작을 모식적으로 나타낸 도면이다. 예를 들어, 삼차원 데이터 부호화 장치는, 서브 맵 내의 포인트 클라우드수가 미리 정해진 역치 이상인 경우에는, 서브 맵에 8진 트리 부호화를 적용한다. 삼차원 데이터 부호화 장치는, 서브 맵 내의 포인트 클라우드수가 상기 역치보다 작은 경우는, 서브 맵에 비8진 트리 부호화를 적용한다. 이에 의해, 삼차원 데이터 부호화 장치는, 서브 맵 내에 포함되는 오브젝트의 형상 및 밀도에 따라 적절히 8진 트리 부호화를 이용할지, 비8진 트리 부호화를 이용할지를 선택할 수 있으므로, 부호화 효율을 향상시킬 수 있다.
또, 삼차원 데이터 부호화 장치는, 서브 맵에 8진 트리 부호화와 비8진 트리 부호화 중 어느 쪽을 적용했는지를 나타내는 정보(이하, 8진 트리 부호화 적용 정보라고 부른다)를, 서브 맵의 헤더 등에 부가한다. 이에 의해, 삼차원 데이터 복호 장치는, 비트 스트림이, 서브 맵이 8진 트리 부호화됨으로써 얻어진 비트 스트림인지, 서브 맵이 비8진 트리 부호화됨으로써 얻어진 비트 스트림인지를 판별할 수 있다.
또, 삼차원 데이터 부호화 장치는, 8진 트리 부호화와 비8진 트리 부호화의 각각을 동일한 포인트 클라우드에 적용했을 때의 부호화 효율을 산출하여, 부호화 효율이 좋은 부호화 방식을 서브 맵에 적용해도 된다.
도 52는, 이 전환을 행하는 경우의 서브 맵의 신택스예를 나타낸 도면이다. 도 52에 나타낸 coding_type는, 부호화 타입을 나타내는 정보이며, 상기 8진 트리 부호화 적용 정보이다. coding_type=00은, 8진 트리 부호화가 적용된 것을 나타낸다. coding_type=01은, 비8진 트리 부호화가 적용된 것을 나타낸다. coding_type=10 또는 11은, 상기 외의 다른 부호화 방식 등이 적용된 것을 나타낸다.
부호화 타입이 비8진 트리 부호화(non_octree)인 경우, 서브 맵은, NumOfPoint와, 서브 좌표 정보(sub_coordinate_x, sub_coordinate_y, 및 sub_coordinate_z)를 포함한다.
부호화 타입이 8진 트리 부호화(octree)인 경우, 서브 맵은, octree_info를 포함한다. octree_info는, 8진 트리 부호화에 필요한 정보이며, 예를 들어 depth 정보 등을 포함한다.
부호화 타입이 비8진 트리 부호화(non_octree)인 경우, 서브 맵은, 차분 좌표(diff_x[i], diff_y[i], 및 diff_z[i])를 포함한다.
부호화 타입이 8진 트리 부호화(octree)인 경우, 서브 맵은, 8진 트리 부호화에 관한 부호화 데이터인 octree_data를 포함한다.
또한, 여기서는, 포인트 클라우드의 좌표계로서 xyz 좌표계가 이용되는 예를 나타내었지만, 극좌표계가 이용되어도 된다.
도 53은, 삼차원 데이터 부호화 장치에 의한 삼차원 데이터 부호화 처리의 플로차트이다. 우선, 삼차원 데이터 부호화 장치는, 처리 대상의 서브 맵인 대상 서브 맵 내의 포인트 클라우드수를 산출한다(S1521). 다음으로, 삼차원 데이터 부호화 장치는, 산출된 포인트 클라우드수가 미리 정해진 역치 이상인지의 여부를 판정한다(S1522).
포인트 클라우드수가 역치 이상인 경우(S1522에서 Yes), 삼차원 데이터 부호화 장치는, 대상 서브 맵에 8진 트리 부호화를 적용한다(S1523). 또, 삼차원점 데이터 부호화 장치는, 대상 서브 맵에 8진 트리 부호화를 적용한 것을 나타내는 8진 트리 부호화 적용 정보를 비트 스트림의 헤더에 부가한다(S1525).
한편, 포인트 클라우드수가 역치 미만인 경우(S1522에서 No), 삼차원 데이터 부호화 장치는, 대상 서브 맵에 비8진 트리 부호화를 적용한다(S1524). 또, 삼차원점 데이터 부호화 장치는, 대상 서브 맵에 비8진 트리 부호화를 적용한 것을 나타내 는 8진 트리 부호화 적용 정보를 비트 스트림의 헤더에 부가한다(S1525).
도 54는, 삼차원 데이터 복호 장치에 의한 삼차원 데이터 복호 처리의 플로차트이다. 우선, 삼차원 데이터 복호 장치는, 비트 스트림의 헤더로부터 8진 트리 부호화 적용 정보를 복호한다(S1531). 다음으로, 삼차원 데이터 복호 장치는, 복호한 8진 트리 부호화 적용 정보에 의거하여, 대상 서브 맵에 적용된 부호화 타입이 8진 트리 부호화인지의 여부를 판정한다(S1532).
8진 트리 부호화 적용 정보에 의해 나타내어지는 부호화 타입이 8진 트리 부호화인 경우(S1532에서 Yes), 삼차원 데이터 복호 장치는, 8진 트리 복호에 의해 대상 서브 맵을 복호한다(S1533). 한편, 8진 트리 부호화 적용 정보에 의해 나타내어지는 부호화 타입이 비8진 트리 부호화인 경우(S1532에서 No), 삼차원 데이터 복호 장치는, 비8진 트리 복호에 의해 대상 서브 맵을 복호한다(S1534).
이하, 본 실시형태의 변형예에 대해 설명한다. 도 55~도 57은, 부호화 타입의 전환 처리의 변형예의 동작을 모식적으로 나타낸 도면이다.
도 55에 나타낸 바와 같이, 삼차원 데이터 부호화 장치는, 8진 트리 부호화를 적용할지 비8진 트리 부호화를 적용할지를 스페이스마다 선택해도 된다. 이 경우는, 삼차원 데이터 부호화 장치는, 8진 트리 부호화 적용 정보를 스페이스의 헤더에 부가한다. 이에 의해, 삼차원 데이터 복호 장치는, 8진 트리 부호화가 적용되었는지의 여부를 스페이스마다 판단할 수 있다. 또, 이 경우, 삼차원 데이터 부호화 장치는, 스페이스마다 서브 좌표를 설정하고, 스페이스 내의 각 포인트 클라우드의 좌표로부터 서브 좌표의 값을 뺀 차분치를 부호화한다.
이에 의해, 삼차원 데이터 부호화 장치는, 스페이스 내의 오브젝트의 형상 또는 포인트 클라우드수에 따라 8진 트리 부호화를 적용할지의 여부를 적절히 전환할 수 있으므로, 부호화 효율을 향상시킬 수 있다.
또, 도 56에 나타낸 바와 같이, 삼차원 데이터 부호화 장치는, 8진 트리 부호화를 적용할지 비8진 트리 부호화를 적용할지를 볼륨마다 선택해도 된다. 이 경우는, 삼차원 데이터 부호화 장치는, 8진 트리 부호화 적용 정보를 볼륨의 헤더에 부가한다. 이에 의해, 삼차원 데이터 복호 장치는, 8진 트리 부호화가 적용되었는지의 여부를 볼륨마다 판단할 수 있다. 또, 이 경우, 삼차원 데이터 부호화 장치는, 볼륨마다 서브 좌표를 설정하고, 볼륨 내의 각 포인트 클라우드의 좌표로부터 서브 좌표의 값을 뺀 차분치를 부호화한다.
이에 의해, 삼차원 데이터 부호화 장치는, 볼륨 내의 오브젝트의 형상 또는 포인트 클라우드수에 따라 8진 트리 부호화를 적용할지의 여부를 적절히 전환할 수 있으므로, 부호화 효율을 향상시킬 수 있다.
또, 상기 설명에서는, 비8진 트리 부호화로서, 각 포인트 클라우드의 좌표로부터 서브 좌표를 뺀 차분을 부호화하는 예를 나타내었지만, 반드시 이것에 한정되지 않으며, 8진 트리 부호화 이외의 어떠한 부호화 방법으로 부호화해도 된다. 예를 들어, 도 57에 나타낸 바와 같이, 삼차원 데이터 부호화 장치는, 비8진 트리 부호화로서, 서브 좌표로부터의 차분이 아니라, 서브 맵, 스페이스, 또는 볼륨 내의 포인트 클라우드의 값 그 자체를 부호화하는 방식(이하, 원좌표 부호화라고 부른다)을 이용해도 된다.
그 경우는, 삼차원 데이터 부호화 장치는, 대상 공간(서브 맵, 스페이스, 또는 볼륨)에 원좌표 부호화가 적용된 것을 나타내는 정보를 헤더에 저장한다. 이에 의해, 삼차원 데이터 복호 장치는, 대상 공간에 원좌표 부호화가 적용되었는지의 여부를 판단할 수 있다.
또, 원좌표 부호화를 적용하는 경우에는, 삼차원 데이터 부호화 장치는, 원좌표에 양자화 및 산술 부호화를 적용하지 않고 부호화를 행해도 된다. 또, 삼차원 데이터 부호화 장치는, 원좌표를 미리 정해진 고정의 비트 길이로 부호화해도 된다. 이에 의해, 삼차원 데이터 부호화 장치는, 어느 타이밍에 일정한 비트 길이의 스트림을 생성할 수 있다.
또, 상기 설명에서는, 비8진 트리 부호화로서, 각 포인트 클라우드의 좌표로부터 서브 좌표를 뺀 차분을 부호화하는 예를 나타내었지만, 반드시 이것에 한정되지 않는다.
예를 들어, 삼차원 데이터 부호화 장치는, 각 포인트 클라우드의 좌표간의 차분치를 차례로 부호화해도 된다. 도 58은, 이 경우의 동작을 설명하기 위한 도면이다. 예를 들어, 도 58에 나타낸 예에서는, 삼차원 데이터 부호화 장치는, 포인트 클라우드 PA를 부호화할 때에, 서브 좌표를 예측 좌표로서 이용하여, 포인트 클라우드 PA의 좌표와 예측 좌표의 차분치를 부호화한다. 또, 삼차원 데이터 부호화 장치는, 포인트 클라우드 PB를 부호화할 때에는, 포인트 클라우드 PA의 좌표를 예측 좌표로서 이용하여, 포인트 클라우드 PB와 예측 좌표의 차분치를 부호화한다. 또, 삼차원 데이터 부호화 장치는, 포인트 클라우드 PC를 부호화할 때에는, 포인트 클라우드 PB를 예측 좌표로서 이용하여, 포인트 클라우드 PB와 예측 좌표의 차분치를 부호화한다. 이와 같이, 삼차원 데이터 부호화 장치는, 복수의 포인트 클라우드에 스캔순을 설정하고, 처리 대상의 대상 포인트 클라우드의 좌표와, 대상 포인트 클라우드에 대해 스캔순으로 직전의 포인트 클라우드의 좌표의 차분치를 부호화해도 된다.
또, 상기 설명에서는, 서브 좌표는, 서브 맵의 좌측 하단 앞쪽의 모서리의 좌표였지만, 서브 좌표의 위치는 이것에 한정되지 않는다. 도 59~도 61은, 서브 좌표의 위치의 다른 예를 나타낸 도면이다. 서브 좌표는, 서브 좌표의 설정 위치는, 대상 공간(서브 맵, 스페이스, 또는 볼륨) 내의 어느 좌표에 설정되어도 된다. 즉, 서브 좌표는, 상술한 바와 같이, 대상 공간의 좌측 하단 앞쪽의 모서리의 좌표여도 된다. 도 59에 나타낸 바와 같이, 서브 좌표는, 대상 공간의 중심의 좌표여도 된다. 도 60에 나타낸 바와 같이, 서브 좌표는, 대상 공간의 우측 상단 안쪽의 모서리의 좌표여도 된다. 또, 서브 좌표는, 대상 공간의 좌측 하단 앞쪽 또는 우측 상단 안쪽의 모서리의 좌표에 한정되지 않으며, 대상 공간의 어떠한 모서리의 좌표여도 된다.
또, 서브 좌표의 설정 위치는, 대상 공간(서브 맵, 스페이스, 또는 볼륨) 내의 어느 포인트 클라우드의 좌표와 동일해도 된다. 예를 들어, 도 61에 나타낸 예에서는, 서브 좌표의 좌표는, 포인트 클라우드 PD의 좌표와 일치한다.
또, 본 실시형태에서는, 8진 트리 부호화를 적용할지, 비8진 트리 부호화를 적용할지를 전환하는 예를 나타내었지만, 반드시 이것에 한정되지는 않는다. 예를 들어, 삼차원 데이터 부호화 장치는, 8진 트리 이외의 다른 트리 구조를 적용할지, 당해 트리 구조 이외의 비트리 구조를 적용할지를 전환해도 된다. 예를 들어, 다른 트리 구조란, 좌표축의 하나에 수직인 평면을 이용하여 분할을 행하는 kd 트리 등이다. 또한, 다른 트리 구조로서, 어떠한 방식을 이용해도 된다.
또, 본 실시형태에서는, 포인트 클라우드가 갖는 좌표 정보를 부호화하는 예를 나타내었지만, 반드시 이것에 한정되지는 않는다. 삼차원 데이터 부호화 장치는, 예를 들어, 색 정보, 삼차원 특징량 또는, 가시광의 특징량 등도 좌표 정보와 동일한 방법으로 부호화해도 된다. 예를 들어, 삼차원 데이터 부호화 장치는, 서브 맵 내의 각 포인트 클라우드가 갖는 색 정보의 평균치를 서브 색 정보(sub-color)로 설정하고, 각 포인트 클라우드의 색 정보와 서브 색 정보의 차분을 부호화해도 된다.
또, 본 실시형태에서는, 포인트 클라우드의 수 등에 따라 부호화 효율이 좋은 부호화 방식(8진 트리 부호화 또는 비8진 트리 부호화)을 선택하는 예를 나타내었지만, 반드시 이것에 한정되지는 않는다. 예를 들어, 서버측인 삼차원 데이터 부호화 장치는, 8진 트리 부호화에 의해 부호화한 포인트 클라우드의 비트 스트림, 비8진 트리 부호화에 의해 부호화한 포인트 클라우드의 비트 스트림, 및 그 양쪽 모두에 의해 부호화한 포인트 클라우드의 비트 스트림을 유지해 두고, 통신 환경 또는 삼차원 데이터 복호 장치의 처리 능력에 따라, 삼차원 데이터 복호 장치에 송신하는 비트 스트림을 전환해도 된다.
도 62는, 8진 트리 부호화의 적용을 전환하는 경우의 볼륨의 신택스예를 나타낸 도면이다. 도 62에 나타낸 신택스는, 도 52에 나타낸 신택스와 기본적으로는 동일하지만, 각 정보가 볼륨 단위의 정보인 점이 다르다. 구체적으로는, NumOfPoint는, 볼륨에 포함되는 포인트 클라우드수를 나타낸다. sub_coordinate_x, sub_coordinate_y, 및 sub_coordinate_z는, 볼륨의 서브 좌표 정보이다.
또, diff_x[i], diff_y[i], 및 diff_z[i]는, 볼륨 내의 i번째 포인트 클라우드의 차분 좌표이다. diff_x[i]는, 볼륨 내의 i번째 포인트 클라우드의 x좌표와 서브 좌표의 x좌표의 차분치를 나타낸다. diff_y[i]는, 볼륨 내의 i번째 포인트 클라우드의 y좌표와 서브 좌표의 y좌표의 차분치를 나타낸다. diff_z[i]는, 볼륨 내의 i번째 포인트 클라우드의 z좌표와 서브 좌표의 z좌표의 차분치를 나타낸다.
또한, 스페이스에 있어서의 볼륨의 상대 위치를 계산할 수 있는 경우는, 삼차원 데이터 부호화 장치는, 서브 좌표 정보를 볼륨의 헤더에 포함시키지 않아도 된다. 즉, 삼차원 데이터 부호화 장치는, 서브 좌표 정보를 헤더에 포함시키지 않고, 스페이스에 있어서의 볼륨의 상대 위치를 계산하여, 계산한 위치를 각 볼륨의 서브 좌표로서 이용해도 된다.
이상과 같이, 본 실시형태에 따른 삼차원 데이터 부호화 장치는, 삼차원 데이터에 포함되는 복수의 공간 단위(예를 들어, 서브 맵, 스페이스 또는 볼륨) 중 대상 공간 단위를 8진 트리 구조로 부호화할지의 여부를 판정한다(예를 들어, 도 53의 S1522). 예를 들어, 삼차원 데이터 부호화 장치는, 대상 공간 단위에 포함되는 삼차원점의 수가 미리 정해진 역치보다 많은 경우, 대상 공간 단위를 8진 트리 구조로 부호화한다고 판정한다. 또, 삼차원 데이터 부호화 장치는, 대상 공간 단위에 포함되는 삼차원점의 수가 상기 역치 이하인 경우, 대상 공간 단위를 8진 트리 구조로 부호화하지 않는다고 판정한다.
대상 공간 단위를 8진 트리 구조로 부호화한다고 판정된 경우(S1522에서 Yes), 삼차원 데이터 부호화 장치는, 대상 공간 단위를 8진 트리 구조를 이용하여 부호화한다(S1523). 또, 대상 공간 단위를 8진 트리 구조로 부호화하지 않는다고 판정된 경우(S1522에서 No), 삼차원 데이터 부호화 장치는, 대상 공간 단위를 8진 트리 구조와는 다른 방식으로 부호화한다(S1524). 예를 들어, 삼차원 데이터 부호화 장치는, 다른 방식에서는, 대상 공간 단위에 포함되는 삼차원점의 좌표를 부호화한다. 구체적으로는, 삼차원 데이터 부호화 장치는, 다른 방식에서는, 대상 공간 단위의 기준 좌표와, 대상 공간 단위에 포함되는 삼차원점의 좌표의 차분을 부호화한다.
다음으로, 삼차원 데이터 부호화 장치는, 대상 공간 단위를 8진 트리 구조로 부호화할지의 여부를 나타내는 정보를 비트 스트림에 부가한다(S1525).
이에 의하면, 당해 삼차원 데이터 부호화 장치는, 부호화 신호의 데이터량을 삭감할 수 있으므로 부호화 효율을 향상시킬 수 있다.
예를 들어, 삼차원 데이터 부호화 장치는, 프로세서와, 메모리를 구비하고, 프로세서는, 메모리를 이용하여, 상기의 처리를 행한다.
또, 본 실시형태에 따른 삼차원 데이터 복호 장치는, 삼차원 데이터에 포함되는 복수의 대상 공간 단위(예를 들어, 서브 맵, 스페이스 또는 볼륨) 중 대상 공간 단위를 8진 트리 구조로 복호할지의 여부를 나타내는 정보를 비트 스트림으로부터 복호한다(예를 들어, 도 54의 S1531). 상기 정보에 의해 대상 공간 단위를 8진 트리 구조로 복호한다고 나타내어지는 경우(S1532에서 Yes), 삼차원 데이터 복호 장치는, 대상 공간 단위를 8진 트리 구조를 이용하여 복호한다(S1533).
상기 정보에 의해 상기 대상 공간 단위를 8진 트리 구조로 복호하지 않는다고 나타내어지는 경우(S1532에서 No), 삼차원 데이터 복호 장치는, 대상 공간 단위를 8진 트리 구조와는 다른 방식으로 복호한다(S1534). 예를 들어, 삼차원 데이터 복호 장치는, 다른 방식에서는, 대상 공간 단위에 포함되는 삼차원점의 좌표를 복호한다. 구체적으로는, 삼차원 데이터 복호 장치는, 다른 방식에서는, 대상 공간 단위의 기준 좌표와, 대상 공간 단위에 포함되는 삼차원점의 좌표의 차분을 복호한다.
이에 의하면, 당해 삼차원 데이터 복호 장치는, 부호화 신호의 데이터량을 삭감할 수 있으므로 부호화 효율을 향상시킬 수 있다.
예를 들어, 삼차원 데이터 복호 장치는, 프로세서와, 메모리를 구비하고, 프로세서는, 메모리를 이용하여, 상기의 처리를 행한다.
(실시 형태 9)
본 실시 형태에서는, 8진 트리 구조 등의 트리 구조의 부호화 방법의 다른 예에 대해서 설명한다. 도 63은, 본 실시 형태에 따른 트리 구조의 일례를 나타내는 도면이다. 또한, 도 63은 4진 트리 구조의 예를 나타낸다.
삼차원점이 포함되는 리프를 유효 리프라고 부르고, 삼차원점이 포함되지 않는 리프를 무효 리프라고 부른다. 유효 리프의 수가 역치 이상인 가지(branch)를 조밀한 가지(dense branch)라고 부른다. 유효 리프의 수가 역치보다 작은 가지를 성긴 가지(sparse branch)라고 부른다.
삼차원 데이터 부호화 장치는, 트리 구조의 어느 층(레이어)에 있어서, 각 가지에 포함되는 삼차원점의 수(즉 유효 리프의 수)를 산출한다. 도 63은, 역치가 5인 경우의 예를 나타낸다. 이 예에서는, 층 1에 2개의 가지가 존재한다. 좌측의 가지에는 7개의 삼차원점이 포함되기 때문에, 좌측의 가지는 조밀한 가지로 판정된다. 우측의 가지에는 2개의 삼차원점이 포함되기 때문에, 우측의 가지는 성긴 가지로 판정된다.
도 64는, 예를 들면, 층 5의 각 가지가 갖는 유효 리프의 수(3D points)의 예를 나타내는 도면이다. 도 64의 횡축은, 층 5의 가지의 식별 번호인 인덱스를 나타낸다. 도 64에 나타내는 바와 같이, 특정의 가지에, 다른 가지에 비해 명백히 많은 삼차원점이 포함된다. 이러한 조밀한 가지에는, 성긴 가지에 비해, 어큐펀시 부호화가 보다 유효하다.
이하, 어큐펀시 부호화와 로케이션 부호화의 적용 방법에 대해서 설명한다. 도 65는, 층 5에 있어서의 각 가지에 포함되는 삼차원점의 수(유효 리프의 수)와 적용하는 부호화 방식의 관계를 나타내는 도면이다. 도 65에 나타내는 바와 같이, 삼차원 데이터 부호화 장치는, 조밀한 가지에 대해서는 어큐펀시 부호화를 적용하고, 성긴 가지에 대해서는 로케이션 부호화를 적용한다. 이에 의해, 부호화 효율을 향상시킬 수 있다.
도 66은, LiDAR 데이터에 있어서의 조밀한 가지 영역의 예를 나타내는 도면이다. 도 66에 나타내는 바와 같이, 영역에 따라서, 각 가지에 포함되는 삼차원점의 수로부터 산출되는 삼차원점의 밀도가 상이하다.
또한, 조밀한 삼차원점(가지)과 성긴 삼차원점(가지)을 분리함으로써 이하의 이점이 있다. LiDAR 센서에 가까울수록 삼차원점의 밀도는 높아진다. 따라서, 소밀에 따라 가지를 분리함으로써, 거리 방향의 구획이 가능해진다. 이러한 구획은, 특정의 애플리케이션에서는 유효하다. 또한, 성긴 가지에 대해서는, 어큐펀시 부호화 이외의 수법을 이용하는 것이 유효하다.
본 실시 형태에서는, 삼차원 데이터 부호화 장치는, 입력된 삼차원점군을 2개 이상의 서브 삼차원점군으로 분리하고, 각 서브 삼차원점군에 상이한 부호화 방법을 적용한다.
예를 들면, 삼차원 데이터 부호화 장치는, 입력된 삼차원점군을 조밀한 가지를 포함하는 서브 삼차원점군 A(조밀한 삼차원점군: dense cloud)와, 성긴 가지를 포함하는 서브 삼차원점군 B(성긴 삼차원점군: sparse cloud)로 분리한다. 도 67은는, 도 63에 나타내는 트리 구조로부터 분리된, 조밀한 가지를 포함하는 서브 삼차원점군 A(조밀한 삼차원점군)의 예를 나타내는 도면이다. 도 68은, 도 63에 나타내는 트리 구조로부터 분리된, 성긴 가지를 포함하는 서브 삼차원점군 B(성긴 삼차원점군)의 예를 나타내는 도면이다.
다음에, 삼차원 데이터 부호화 장치는, 서브 삼차원점군 A를 어큐펀시 부호화로 부호화하고, 서브 삼차원점군 B를 로케이션 부호화로 부호화한다.
또한, 여기에서는, 상이한 부호화 방법으로서, 상이한 부호화 방식(어큐펀시 부호화와 로케이션 부호화)을 적용하는 예를 나타내었지만, 예를 들면, 삼차원 데이터 부호화 장치는, 서브 삼차원점군 A와 서브 삼차원점군 B에 동일한 부호화 방식을 이용하고, 또한, 서브 삼차원점군 A와 서브 삼차원점군 B에서 부호화에 이용하는 파라미터를 상이하게 해도 된다.
이하, 삼차원 데이터 부호화 장치에 의한 삼차원 데이터 부호화 처리의 흐름에 대해서 설명한다. 도 69는, 본 실시 형태에 따른 삼차원 데이터 부호화 장치에 의한 삼차원 데이터 부호화 처리의 플로차트이다.
우선, 삼차원 데이터 부호화 장치는, 입력된 삼차원점군을 서브 삼차원점군으로 분리한다(S1701). 삼차원 데이터 부호화 장치는, 이 분리를 자동적으로 행해도 되고, 유저에 의해 입력된 정보에 의거하여 행해도 된다. 예를 들면, 유저에 의해 서브 삼차원점군의 범위 등이 지정되어도 된다. 또한, 자동적으로 행하는 예로서는, 예를 들면, 입력 데이터가 LiDAR 데이터인 경우에는, 삼차원 데이터 부호화 장치는, 각 점군까지의 거리 정보를 이용하여 분리를 행한다. 구체적으로는, 삼차원 데이터 부호화 장치는, 계측 지점으로부터 일정한 범위 내에 있는 점군과 범위 외에 있는 점군을 분리한다. 또한, 삼차원 데이터 부호화 장치는, 중요한 에어리어와 그렇지 않은 에어리어와 같은 정보를 이용하여 분리를 행해도 된다.
다음에, 삼차원 데이터 부호화 장치는, 서브 삼차원점군 A를 수법 A로 부호화함으로써 부호화 데이터(부호화 비트 스트림)를 생성한다(S1702). 또한, 삼차원 데이터 부호화 장치는, 서브 삼차원점군 B를 수법 B로 부호화함으로써 부호화 데이터를 생성한다(S1703). 또한, 삼차원 데이터 부호화 장치는, 서브 삼차원점군 B를 수법 A로 부호화해도 된다. 이 경우, 삼차원 데이터 부호화 장치는, 서브 삼차원점군 A의 부호화에 이용한 부호화 파라미터와는 상이한 파라미터를 이용하여 서브 삼차원점군 B를 부호화한다. 예를 들면, 이 파라미터는 양자화 파라미터여도 된다. 예를 들면, 삼차원 데이터 부호화 장치는, 서브 삼차원점군 A의 부호화에 이용한 양자화 파라미터보다 큰 양자화 파라미터를 이용하여, 서브 삼차원점군 B를 부호화한다. 이 경우, 삼차원 데이터 부호화 장치는, 각 서브 삼차원점군의 부호화 데이터의 헤더에 당해 서브 삼차원점군의 부호화에 이용한 양자화 파라미터를 나타내는 정보를 부가해도 된다.
다음에, 삼차원 데이터 부호화 장치는, 단계 S1702에서 얻어진 부호화 데이터와, 단계 S1703에서 얻어진 부호화 데이터를 결합함으로써 비트 스트림을 생성한다(S1704).
또한, 삼차원 데이터 부호화 장치는, 비트 스트림의 헤더 정보로서, 각 서브 삼차원점군을 복호하기 위한 정보를 부호화해도 된다. 예를 들면, 삼차원 데이터 부호화 장치는, 하기와 같은 정보를 부호화해도 된다.
헤더 정보는, 부호화된 서브 삼차원점의 수를 나타내는 정보를 포함해도 된다. 이 예에서는, 이 정보는 2를 나타낸다.
헤더 정보는, 각 서브 삼차원점군에 포함되는 삼차원점의 수와 부호화 방법을 나타내는 정보를 포함해도 된다. 이 예에서는, 이 정보는, 서브 삼차원점군 A에 포함되는 삼차원점의 수와, 서브 삼차원점군 A에 적용한 부호화 방법(수법 A)과, 서브 삼차원점군 B에 포함되는 삼차원점의 수와, 서브 삼차원점군 B에 적용한 부호화 방법(수법 B)을 나타낸다.
헤더 정보는, 각 서브 삼차원점군의 부호화 데이터의 개시 위치, 또는 종단 위치를 식별하기 위한 정보를 포함해도 된다.
또한, 삼차원 데이터 부호화 장치는, 서브 삼차원점군 A와 서브 삼차원점군 B를 병렬로 부호화해도 된다. 또는, 삼차원 데이터 부호화 장치는, 서브 삼차원점군 A와 서브 삼차원점군 B로 차례로 부호화해도 된다.
또한, 서브 삼차원점군으로의 분리 방법은, 상기에 한정되지 않는다. 예를 들면, 삼차원 데이터 부호화 장치는, 분리 방법을 변화시켜, 복수의 분리 방법의 각각을 이용하여 부호화를 행하고, 각 분리 방법을 이용하여 얻어진 부호화 데이터의 부호화 효율을 산출한다. 그리고, 삼차원 데이터 부호화 장치는, 가장 부호화 효율이 높은 분리 방법을 선택한다. 예를 들면, 삼차원 데이터 부호화 장치는, 복수의 층의 각각에서 삼차원점군을 분리하고, 각각의 경우에 있어서의 부호화 효율을 산출하여, 가장 부호화 효율이 높아지는 분리 방법(즉 분리를 행하는 층)을 선택하고, 선택한 분리 방법으로 서브 삼차원점군을 생성하여 부호화를 행해도 된다.
또한, 삼차원 데이터 부호화 장치는, 부호화 데이터를 결합할 때에, 중요한 서브 삼차원점군의 부호화 정보일수록, 비트 스트림의 선두에 가까운 위치에 배치해도 된다. 이에 의해, 삼차원 데이터 복호 장치는, 선두의 비트 스트림을 복호하는 것만으로 중요한 정보를 취득할 수 있으므로, 중요한 정보를 빨리 취득할 수 있는 것이 가능해진다.
다음에, 삼차원 데이터 복호 장치에 의한 삼차원 데이터 복호 처리의 흐름에 대해서 설명한다. 도 70은, 본 실시 형태에 따른 삼차원 데이터 복호 장치에 의한 삼차원 데이터 복호 처리의 플로차트이다.
우선, 삼차원 데이터 복호 장치는, 예를 들면, 상기 삼차원 데이터 부호화 장치에서 생성된 비트 스트림을 취득한다. 다음에, 삼차원 데이터 복호 장치는, 취득한 비트 스트림으로부터 서브 삼차원점군 A의 부호화 데이터와 서브 삼차원점군 B의 부호화 데이터를 분리한다(S1711). 구체적으로는, 삼차원 데이터 복호 장치는, 비트 스트림의 헤더 정보로부터 각 서브 삼차원점군을 복호하기 위한 정보를 복호하고, 당해 정보를 이용하여 각 서브 삼차원점군의 부호화 데이터를 분리한다.
다음에, 삼차원 데이터 복호 장치는, 서브 삼차원점군 A의 부호화 데이터를 수법 A로 복호함으로써 서브 삼차원점군 A를 얻는다(S1712). 또한, 삼차원 데이터 복호 장치는, 서브 삼차원점군 B의 부호화 데이터를 수법 B로 복호함으로써 서브 삼차원점군 B를 얻는다(S1713). 다음에, 삼차원 데이터 복호 장치는, 서브 삼차원점군 A와 서브 삼차원점군 B를 결합한다(S1714).
또한, 삼차원 데이터 복호 장치는, 서브 삼차원점군 A와 서브 삼차원점군 B를 병렬로 복호해도 된다. 또는, 삼차원 데이터 복호 장치는, 서브 삼차원점군 A와 서브 삼차원점군 B를 차례로 복호해도 된다.
또한, 삼차원 데이터 복호 장치는, 필요한 서브 삼차원점군을 복호해도 된다. 예를 들면, 삼차원 데이터 복호 장치는, 서브 삼차원점군 A를 복호하고, 서브 삼차원점군 B를 복호하지 않아도 되다. 예를 들면, 서브 삼차원점군 A가 LiDAR 데이터의 중요 에어리어에 포함되는 삼차원점군인 경우, 삼차원 데이터 복호 장치는, 그 중요 에어리어의 삼차원점군을 복호한다. 이 중요 에어리어의 삼차원점군을 이용하여 차 등에 있어서의 자기 위치 추정 등이 행해진다.
다음에, 본 실시 형태에 따른 부호화 처리의 구체적인 예를 설명한다. 도 71은, 본 실시 형태에 따른 삼차원 데이터 부호화 장치에 의한 삼차원 데이터 부호화 처리의 플로차트이다.
우선, 삼차원 데이터 부호화 장치는, 입력된 삼차원점을 성긴 삼차원점군과 조밀한 삼차원점군으로 분리한다(S1721). 구체적으로는, 삼차원 데이터 부호화 장치는, 8진 트리 구조의 어느 층의 가지가 갖는 유효 리프의 수를 카운트한다. 삼차원 데이터 부호화 장치는, 각 가지의 유효 리프 수에 따라, 각 가지를 조밀한 가지 또는 성긴 가지로 설정한다. 그리고, 삼차원 데이터 부호화 장치는, 조밀한 가지를 모은 서브 삼차원점군(조밀한 삼차원점군)과, 성긴 가지를 모은 서브 삼차원점군(성긴 삼차원점군)을 생성한다.
다음에, 삼차원 데이터 부호화 장치는, 성긴 삼차원점군을 부호화함으로써 부호화 데이터를 생성한다(S1722). 예를 들면, 삼차원 데이터 부호화 장치는, 로케이션 부호화를 이용하여 성긴 삼차원점군을 부호화한다.
또한, 삼차원 데이터 부호화 장치는, 조밀한 삼차원점군을 부호화함으로써 부호화 데이터를 생성한다(S1723). 예를 들면, 삼차원 데이터 부호화 장치는, 어큐펀시 부호화를 이용하여 조밀한 삼차원점군을 부호화한다.
다음에, 삼차원 데이터 부호화 장치는, 단계 S1722에서 얻어진 성긴 삼차원점군의 부호화 데이터와, 단계 S1723에서 얻어진 조밀한 삼차원점군의 부호화 데이터를 결합함으로써 비트 스트림을 생성한다(S1724).
또한, 삼차원 데이터 부호화 장치는, 비트 스트림의 헤더 정보로서, 성긴 삼차원점군과 조밀한 삼차원점군을 복호하기 위한 정보를 부호화해도 된다. 예를 들면, 삼차원 데이터 부호화 장치는, 하기와 같은 정보를 부호화해도 된다.
헤더 정보는, 부호화된 서브 삼차원점군의 수를 나타내는 정보를 포함해도 된다. 이 예에서는, 이 정보는 2를 나타낸다.
헤더 정보는, 각 서브 삼차원점군에 포함되는 삼차원점의 수와 부호화 방법을 나타내는 정보를 포함해도 된다. 이 예에서는, 이 정보는, 성긴 삼차원점군에 포함되는 삼차원점의 수와, 성긴 삼차원점군에 적용한 부호화 방법(로케이션 부호화)과, 조밀한 삼차원점군에 포함되는 삼차원점의 수와, 조밀한 삼차원점군에 적용한 부호화 방법(어큐펀시 부호화)을 나타낸다.
헤더 정보는, 각 서브 삼차원점군의 부호화 데이터의 개시 위치, 또는 종단 위치를 식별하기 위한 정보를 포함해도 된다. 이 예에서는, 이 정보는, 성긴 삼차원점군의 부호화 데이터의 개시 위치 및 종단 위치, 및, 조밀한 삼차원점군의 부호화 데이터의 개시 위치 및 종단 위치 중 적어도 하나를 나타낸다.
또한, 삼차원 데이터 부호화 장치는, 성긴 삼차원점군과 조밀한 삼차원점군을 병렬로 부호화해도 된다. 또는, 삼차원 데이터 부호화 장치는, 성긴 삼차원점군과 조밀한 삼차원점군을 차례로 부호화해도 된다.
다음에, 삼차원 데이터 복호 처리의 구체적인 예에 대해서 설명한다. 도 72는, 본 실시 형태에 따른 삼차원 데이터 복호 장치에 의한 삼차원 데이터 복호 처리의 플로차트이다.
우선, 삼차원 데이터 복호 장치는, 예를 들면, 상기 삼차원 데이터 부호화 장치에서 생성된 비트 스트림을 취득한다. 다음에, 삼차원 데이터 복호 장치는, 취득한 비트 스트림으로부터 성긴 삼차원점군의 부호화 데이터와 조밀한 삼차원점군의 부호화 데이터로 분리한다(S1731). 구체적으로는, 삼차원 데이터 복호 장치는, 비트 스트림의 헤더 정보로부터 각 서브 삼차원점군을 복호하기 위한 정보를 복호하고, 당해 정보를 이용하여 각 서브 삼차원점군의 부호화 데이터를 분리한다. 이 예에서는, 삼차원 데이터 복호 장치는, 비트 스트림으로부터 성긴 삼차원점군과 조밀한 삼차원점군의 부호화 데이터를 헤더 정보를 이용하여 분리한다.
다음에, 삼차원 데이터 복호 장치는, 성긴 삼차원점군의 부호화 데이터를 복호함으로써 성긴 삼차원점군을 얻는다(S1732). 예를 들면, 삼차원 데이터 복호 장치는, 로케이션 부호화된 부호화 데이터를 복호하기 위한 로케이션 복호를 이용하여 성긴 삼차원점군을 복호한다.
또한, 삼차원 데이터 복호 장치는, 조밀한 삼차원점군의 부호화 데이터를 복호함으로써 조밀한 삼차원점군을 얻는다(S1733). 예를 들면, 삼차원 데이터 복호 장치는, 어큐펀시 부호화된 부호화 데이터를 복호하기 위한 어큐펀시 복호를 이용하여 조밀한 삼차원점군을 복호한다.
다음에, 삼차원 데이터 복호 장치는, 단계 S1732에서 얻어진 성긴 삼차원점군과, 단계 S1733에서 얻어진 조밀한 삼차원점군을 결합한다(S1734).
또한, 삼차원 데이터 복호 장치는, 성긴 삼차원점군과 조밀한 삼차원점군을 병렬로 복호해도 된다. 또는, 삼차원 데이터 복호 장치는, 성긴 삼차원점군과 조밀한 삼차원점군을 차례로 복호해도 된다.
또한, 삼차원 데이터 복호 장치는, 일부의 필요한 서브 삼차원점군을 복호해도 된다. 예를 들면, 삼차원 데이터 복호 장치는, 조밀한 삼차원점군을 복호하고, 성긴 삼차원 데이터를 복호하지 않아도 되다. 예를 들면, 조밀한 삼차원점군이 LiDAR 데이터의 중요 에어리어에 포함되는 삼차원점군인 경우, 삼차원 데이터 복호 장치는, 그 중요 에어리어의 삼차원점군을 복호한다. 이 중요 에어리어의 삼차원점군을 이용하여 차 등에 있어서의 자기 위치 추정 등이 행해진다.
도 73은, 본 실시 형태에 따른 부호화 처리의 플로차트이다. 우선, 삼차원 데이터 부호화 장치는, 입력된 삼차원점군을 성긴 삼차원점군과 조밀한 삼차원점군으로 분리함으로써, 성긴 삼차원점군과 조밀한 삼차원점군을 생성한다(S1741).
다음에, 삼차원 데이터 부호화 장치는, 조밀한 삼차원점군을 부호화함으로써 부호화 데이터를 생성한다(S1742). 또한, 삼차원 데이터 부호화 장치는, 성긴 삼차원점군을 부호화함으로써 부호화 데이터를 생성한다(S1743). 마지막으로, 삼차원 데이터 부호화 장치는, 단계 S1742에서 얻어진 성긴 삼차원점군의 부호화 데이터와, 단계 S1743에서 얻어진 조밀한 삼차원점군의 부호화 데이터를 결합함으로써 비트 스트림을 생성한다(S1744).
도 74는, 본 실시 형태에 따른 복호 처리의 플로차트이다. 우선, 삼차원 데이터 복호 장치는, 비트 스트림으로부터, 조밀한 삼차원점군의 부호화 데이터와 성긴 삼차원점군의 부호화 데이터를 추출한다(S1751). 다음에, 삼차원 데이터 복호 장치는, 조밀한 삼차원점군의 부호화 데이터를 복호함으로써 조밀한 삼차원점군의 복호 데이터를 얻는다(S1752). 또한, 삼차원 데이터 복호 장치는, 성긴 삼차원점군의 부호화 데이터를 복호함으로써 성긴 삼차원점군의 복호 데이터를 얻는다(S1753). 다음에, 삼차원 데이터 복호 장치는, 단계 S1752에서 얻어진 조밀한 삼차원점군의 복호 데이터와, 단계 S1753에서 얻어진 성긴 삼차원점군의 복호 데이터를 결합함으로써 삼차원점군을 생성한다(S1754).
또한, 삼차원 데이터 부호화 장치 및 삼차원 데이터 복호 장치는, 조밀한 삼차원점군과 성긴 삼차원점군 중 어느 쪽을 먼저 부호화 또는 복호해도 된다. 또한, 복수의 프로세서 등에 의해, 병렬로 부호화 처리 또는 복호 처리가 행해져도 된다.
또한, 삼차원 데이터 부호화 장치는, 조밀한 삼차원점군과 성긴 삼차원점군 중 한쪽을 부호화해도 된다. 예를 들면, 조밀한 삼차원점군에 중요한 정보가 포함되는 경우, 삼차원 데이터 부호화 장치는, 입력된 삼차원점군으로부터 조밀한 삼차원점군과 성긴 삼차원점군을 추출하여, 조밀한 삼차원점군을 부호화하고, 성긴 삼차원점군을 부호화하지 않는다. 이에 의해, 삼차원 데이터 부호화 장치는, 비트량을 억제하면서, 중요한 정보를 스트림에 부가할 수 있다. 예를 들면, 서버와 클라이언트의 사이에서, 서버에 클라이언트로부터 클라이언트 주위의 삼차원점군 정보의 송신 요구가 있었던 경우, 서버는, 클라이언트 주위의 중요한 정보를 조밀한 삼차원점군으로서 부호화하여 클라이언트에 송신한다. 이에 의해, 서버는, 네트워크 대역을 억제하면서, 클라이언트가 요구하는 정보를 송신할 수 있다.
또한, 삼차원 데이터 복호 장치는, 조밀한 삼차원점군과 성긴 삼차원점군 중 한쪽을 복호해도 된다. 예를 들면, 조밀한 삼차원점군에 중요한 정보가 포함되는 경우, 삼차원 데이터 복호 장치는, 조밀한 삼차원점군을 복호하고, 성긴 삼차원점군을 복호하지 않는다. 이에 의해, 삼차원 데이터 복호 장치는, 복호 처리의 처리 부하를 억제하면서, 필요한 정보를 취득할 수 있다.
도 75는, 도 73에 나타내는 삼차원점의 분리 처리(S1741)의 플로차트이다. 우선, 삼차원 데이터 부호화 장치는, 층(L)과 역치(TH)를 설정한다(S1761). 또한, 삼차원 데이터 부호화 장치는, 설정한 층(L)과 역치(TH)를 나타내는 정보를 비트 스트림에 부가해도 된다. 즉, 삼차원 데이터 부호화 장치는, 설정한 층(L)과 역치(TH)를 나타내는 정보를 포함하는 비트 스트림을 생성해도 된다.
다음에, 삼차원 데이터 부호화 장치는, 처리 대상의 위치를, 8진 트리의 루트로부터 층(L)의 선두의 가지로 이동한다. 즉, 삼차원 데이터 부호화 장치는, 처리 대상의 가지로서, 층(L)의 선두의 가지를 선택한다(S1762).
다음에, 삼차원 데이터 부호화 장치는, 층(L)의 처리 대상의 가지의 유효 리프 수를 카운트한다(S1763). 처리 대상의 가지의 유효 리프 수가 역치(TH)보다 많은 경우(S1764에서 Yes), 삼차원 데이터 부호화 장치는, 처리 대상의 가지를 조밀한 가지로서 조밀한 삼차원점군에 등록한다(S1765). 한편, 처리 대상의 가지의 유효 리프 수가 역치(TH) 이하인 경우(S1764에서 No), 삼차원 데이터 부호화 장치는, 처리 대상의 가지를 성긴 가지로서 성긴 삼차원점군에 등록한다(S1766).
층(L)의 모든 가지의 처리를 완료하지 않은 경우(S1767에서 No), 삼차원 데이터 부호화 장치는, 처리 대상의 위치를, 층(L)의 다음 가지로 이동한다. 즉, 삼차원 데이터 부호화 장치는, 처리 대상의 가지로서, 층(L)의 다음 가지를 선택한다(S1768). 그리고, 삼차원 데이터 부호화 장치는, 선택한 다음 처리 대상의 가지에 대하여 단계 S1763 이후의 처리를 행한다.
상기의 처리가, 층(L)의 모든 가지의 처리를 완료할 때까지(S1767에서 Yes), 반복된다.
또한, 상기 설명에서는 층(L)과 역치(TH)는 미리 설정되어 있지만, 반드시 이에 한정하지 않는다. 예를 들면, 삼차원 데이터 부호화 장치는, 층(L)과 역치(TH)의 세트를 복수 패턴 설정하고, 각 세트를 이용하여 조밀한 삼차원점군과 성긴 삼차원점군을 생성하고, 각각을 부호화한다. 삼차원 데이터 부호화 장치는, 복수의 세트 중, 생성된 부호화 데이터의 부호화 효율이 가장 높은 층(L)과 역치(TH)의 세트로 최종적으로 조밀한 삼차원점군과 성긴 삼차원점군을 부호화한다. 이에 의해 부호화 효율을 높일 수 있다. 또한, 삼차원 데이터 부호화 장치는, 예를 들면, 층(L) 및 역치(TH)를 산출해도 된다. 예를 들면, 삼차원 데이터 부호화 장치는, 트리 구조에 포함되는 층의 최대치의 절반의 값을 층(L)으로 설정해도 된다. 또한, 삼차원 데이터 부호화 장치는, 트리 구조에 포함되는 복수의 삼차원점의 총수의 절반의 값을 역치(TH)로 설정해도 된다.
또한, 상기 설명에서는, 입력 삼차원점군을 조밀한 삼차원점군과 성긴 삼차원점군의 2종류로 분류하는 예를 기술했지만, 삼차원 데이터 부호화 장치는, 입력 삼차원점군을 3종류 이상의 삼차원점군으로 분류해도 된다. 예를 들면, 삼차원 데이터 부호화 장치는, 처리 대상의 가지의 유효 리프 수가 역치(TH1) 이상인 경우, 처리 대상의 가지를 제1 조밀한 삼차원점군으로 분류하고, 처리 대상의 가지의 유효 리프 수가 제1 역치(TH1) 미만 또한 제2 역치(TH2) 이상인 경우, 처리 대상의 가지를 제2 조밀한 삼차원점군으로 분류한다. 삼차원 데이터 부호화 장치는, 처리 대상의 가지의 유효 리프 수가 제2 역치(TH2) 미만 또한 제3 역치(TH3) 이상인 경우, 처리 대상의 가지를 제1 성긴 삼차원점군으로 분류하고, 처리 대상의 가지의 유효 리프 수가 역치(TH3) 미만인 경우, 처리 대상의 가지를 제2 성긴 삼차원점군으로 분류한다.
이하, 본 실시 형태에 따른 삼차원점군의 부호화 데이터의 신택스예에 대해서 설명한다. 도 76은, 이 신택스예를 나타내는 도면이다. pc_header()는, 예를 들면, 입력된 복수의 삼차원점의 헤더 정보이다.
도 76에 나타내는 num_sub_pc는, 서브 삼차원점군의 수를 나타낸다. numPoint[i]는, i번째의 서브 삼차원점군 중에 포함되는 삼차원점의 수를 나타낸다. coding_type[i]는, i번째의 서브 삼차원점군에 적용되는 부호화 타입(부호화 방식)을 나타내는 부호화 타입 정보이다. 예를 들면, coding_type=00은 로케이션 부호화가 적용되어 있는 것을 나타낸다. coding_type=01은 어큐펀시 부호화가 적용되어 있는 것을 나타낸다. coding_type=10 또는 11은, 다른 부호화 방식이 적용되어 있는 것을 나타낸다.
data_sub_cloud()는, i번째의 서브 삼차원점군의 부호화 데이터이다. coding_type_00_data는, coding_type이 00인 부호화 타입이 적용된 부호화 데이터이고, 예를 들면 로케이션 부호화가 적용된 부호화 데이터이다. coding_type_01_data는, coding_type이 01인 부호화 타입이 적용된 부호화 데이터이고, 예를 들면 어큐펀시 부호화가 적용된 부호화 데이터이다.
end_of_data는, 부호화 데이터의 종단을 나타내는 종단 정보이다. 예를 들면, 이 end_of_data에는, 부호화 데이터에 사용하지 않는 고정 비트열이 할당된다. 이에 의해, 삼차원 데이터 복호 장치는, 예를 들면, end_of_data의 비트열을 비트 스트림으로부터 탐색함으로써, 복호할 필요가 없는 부호화 데이터의 복호 처리를 스킵할 수 있다.
또한, 삼차원 데이터 부호화 장치는, 상기 방법으로 생성된 부호화 데이터를 엔트로피 부호화해도 된다. 예를 들면, 삼차원 데이터 부호화 장치는, 각 값을 2치화한 다음 산출 부호화한다.
또한, 본 실시 형태에서는, 4진 트리 구조 또는 8진 트리 구조의 예를 나타내었지만, 반드시 이에 한정하지 않으며, 2진 트리, 16진 트리 등의 N진 트리(N은 2 이상의 정수), 또는, 그 외의 트리 구조에 대하여, 상기 수법을 적용해도 된다.
[변형예]
상기 설명에서는, 도 68 및 도 69에 나타내는 바와 같이, 조밀한 가지와 그 상층(전체 트리 구조의 루트로부터 조밀한 가지의 루트에 이르는 트리 구조)을 포함하는 트리 구조가 부호화되고, 성긴 가지와 그 상층(전체 트리 구조의 루트로부터 성긴 가지의 루트에 이르는 트리 구조)을 포함하는 트리 구조가 부호화된다. 본 변형예에서는, 삼차원 데이터 부호화 장치는, 조밀한 가지와 성긴 가지를 분리하고, 조밀한 가지와 성긴 가지를 부호화한다. 즉, 부호화하는 트리 구조에는, 상층의 트리 구조는 포함되지 않는다. 예를 들면, 삼차원 데이터 부호화 장치는, 조밀한 가지에 어큐펀시 부호화를 적용하고, 성긴 가지에 로케이션 부호화를 적용한다.
도 77은, 도 63에 나타내는 트리 구조로부터 분리된, 조밀한 가지의 예를 나타내는 도면이다. 도 78은, 도 63에 나타내는 트리 구조로부터 분리된, 성긴 가지의 예를 나타내는 도면이다. 본 변형예는, 도 77 및 도 78에 나타내는 트리 구조가 각각 부호화된다.
또한, 삼차원 데이터 부호화 장치는, 상층의 트리 구조를 부호화하지 않는 대신에, 가지의 위치를 나타내는 정보를 부호화한다. 예를 들면, 이 정보는, 가지의 루트의 위치를 나타낸다.
예를 들면, 삼차원 데이터 부호화 장치는, 조밀한 가지를 생성한 층을 나타내는 레이어 정보와, 조밀한 가지가 당해 층의 몇 번째 가지인지를 나타내는 가지 정보를, 당해 조밀한 가지의 부호화 데이터로서 부호화한다. 이에 의해, 삼차원 데이터 복호 장치는, 비트 스트림으로부터 레이어 정보 및 가지 정보를 복호하고, 이들 레이어 정보 및 가지 정보를 이용하여, 복호한 조밀한 가지가 어느 층의 몇 번째 가지의 삼차원점군인지를 파악할 수 있다. 또한 마찬가지로, 삼차원 데이터 부호화 장치는, 성긴 가지를 생성한 층을 나타내는 레이어 정보와, 성긴 가지가 당해 층의 몇 번째 가지인지를 나타내는 가지 정보를, 성긴 가지의 부호화 데이터로서 부호화한다.
이에 의해, 삼차원 데이터 복호 장치는, 비트 스트림으로부터 레이어 정보 및 가지 정보를 복호하고, 이들 레이어 정보 및 가지 정보를 이용하여, 복호한 성긴 가지가 어느 층의 몇 번째 가지의 삼차원점군인지를 파악할 수 있다. 이에 의해, 조밀한 가지 및 성긴 가지보다 상위의 층의 정보를 부호화하는 것에 의한 오버헤드를 삭감할 수 있으므로, 부호화 효율을 향상시킬 수 있다.
또한, 가지 정보는, 레이어 정보로 나타내어지는 층 내의 각 가지에 할당된 값을 나타내도 된다. 또한, 가지 정보는, 8진 트리의 루트를 기점으로 하여 각 노드에 할당된 값을 나타내도 된다. 이 경우, 레이어 정보는 부호화되지 않아도 된다. 또한, 삼차원 데이터 부호화 장치는, 조밀한 가지와 성긴 가지를 각각 복수 생성해도 된다.
도 79는, 본 변형예에 있어서의 부호화 처리의 플로차트이다. 우선, 삼차원 데이터 부호화 장치는, 입력된 삼차원점군으로부터 1 이상의 성긴 가지와 1 이상의 조밀한 가지를 생성한다(S1771).
다음에, 삼차원 데이터 부호화 장치는, 조밀한 가지를 부호화함으로써 부호화 데이터를 생성한다(S1772). 다음에, 삼차원 데이터 부호화 장치는, 단계 S1771에서 생성한 모든 조밀한 가지의 부호화가 완료되었는지의 여부를 판정한다(S1773).
모든 조밀한 가지의 부호화가 완료되지 않은 경우(S1773에서 No), 삼차원 데이터 부호화 장치는, 다음 조밀한 가지를 선택하고(S1774), 선택한 조밀한 가지를 부호화함으로써 부호화 데이터를 생성한다(S1772).
한편, 모든 조밀한 가지의 부호화가 완료된 경우(S1773에서 Yes), 삼차원 데이터 부호화 장치는, 성긴 가지를 부호화함으로써 부호화 데이터를 생성한다(S1775). 다음에, 삼차원 데이터 부호화 장치는, 단계 S1771에서 생성한 모든 성긴 가지의 부호화가 완료되었는지의 여부를 판정한다(S1776).
모든 성긴 가지의 부호화가 완료되지 않은 경우(S1776에서 No), 삼차원 데이터 부호화 장치는, 다음 성긴 가지를 선택하고(S1777), 선택한 성긴 가지를 부호화함으로써 부호화 데이터를 생성한다(S1775).
한편, 모든 성긴 가지의 부호화가 완료된 경우(S1776에서 Yes), 삼차원 데이터 부호화 장치는, 단계 S1772 및 S1775에서 생성된 부호화 데이터를 결합하여 비트 스트림을 생성한다(S1778).
도 79는, 본 변형예에 있어서의 복호 처리의 플로차트이다. 우선, 삼차원 데이터 복호 장치는, 비트 스트림으로부터, 조밀한 가지의 1 이상의 부호화 데이터와 성긴 가지의 1 이상의 부호화 데이터를 추출한다(S1781). 다음에, 삼차원 데이터 복호 장치는, 조밀한 가지의 부호화 데이터를 복호함으로써 조밀한 가지의 복호 데이터를 얻는다(S1782).
다음에, 삼차원 데이터 복호 장치는, 단계 S1781에서 추출한 모든 조밀한 가지의 부호화 데이터의 복호가 완료되었는지의 여부를 판정한다(S1783). 모든 조밀한 가지의 부호화 데이터의 복호가 완료되지 않은 경우(S1783에서 No), 삼차원 데이터 복호 장치는, 다음 조밀한 가지의 부호화 데이터를 선택하고(S1784), 선택한 조밀한 가지의 부호화 데이터를 복호함으로써 조밀한 가지의 복호 데이터를 얻는다(S1782).
한편, 모든 조밀한 가지의 부호화 데이터의 복호가 완료된 경우(S1783에서 Yes), 삼차원 데이터 복호 장치는, 성긴 가지의 부호화 데이터를 복호함으로써 성긴 가지의 복호 데이터를 얻는다(S1785).
다음에, 삼차원 데이터 복호 장치는, 단계 S1781에서 추출한 모든 성긴 가지의 부호화 데이터의 복호가 완료되었는지의 여부를 판정한다(S1786). 모든 성긴 가지의 부호화 데이터의 복호가 완료되지 않은 경우(S1786에서 No), 삼차원 데이터 복호 장치는, 다음 성긴 가지의 부호화 데이터를 선택하고(S1787), 선택한 성긴 가지의 부호화 데이터를 복호함으로써 성긴 가지의 복호 데이터를 얻는다(S1785).
한편, 모든 성긴 가지의 부호화 데이터의 복호가 완료된 경우(S1786에서 Yes), 삼차원 데이터 복호 장치는, 단계 S1782 및 S1785에서 얻어진 복호 데이터를 결합함으로써 삼차원점군을 생성한다(S1788).
또한, 삼차원 데이터 부호화 장치 및 삼차원 데이터 복호 장치는, 조밀한 가지와 성긴 가지 중 어느 쪽을 먼저 부호화 또는 복호해도 된다. 또한, 복수의 프로세서 등에 의해, 병렬로 부호화 처리, 또는 복호 처리가 행해져도 된다.
또한, 삼차원 데이터 부호화 장치는, 조밀한 가지와 성긴 가지 중 한쪽을 부호화해도 된다. 또한, 삼차원 데이터 부호화 장치는, 복수의 조밀한 가지의 일부를 부호화해도 된다. 예를 들면, 특정의 조밀한 가지에 중요한 정보가 포함되는 경우, 삼차원 데이터 부호화 장치는, 입력된 삼차원점군으로부터 조밀한 가지와 성긴 가지를 추출하고, 중요한 정보가 포함되는 조밀한 가지를 부호화하고, 다른 조밀한 가지 및 성긴 가지를 부호화하지 않는다. 이에 의해, 삼차원 데이터 부호화 장치는, 비트량을 억제하면서, 중요한 정보를 스트림에 부가할 수 있다. 예를 들면, 서버와 클라이언트의 사이에서, 서버에 클라이언트로부터 클라이언트 주위의 삼차원점군 정보의 송신 요구가 있었던 경우, 서버는, 클라이언트 주위의 중요한 정보를 조밀한 가지로서 부호화하여 클라이언트에 송신한다. 이에 의해, 서버는, 네트워크 대역을 억제하면서, 클라이언트가 요구하는 정보를 송신할 수 있다.
또한, 삼차원 데이터 복호 장치는, 조밀한 가지와 성긴 가지 중 한쪽을 복호해도 된다. 또한, 삼차원 데이터 복호 장치는, 복수의 조밀한 가지의 일부를 복호해도 된다. 예를 들면, 특정의 조밀한 가지에 중요한 정보가 포함되는 경우, 삼차원 데이터 복호 장치는, 그 특정의 조밀한 가지를 복호하고, 다른 조밀한 가지 및 성긴 가지를 복호하지 않는다. 이에 의해, 삼차원 데이터 복호 장치는, 복호 처리의 처리 부하를 억제하면서, 필요한 정보를 취득할 수 있다.
도 81은, 도 79에 나타내는 삼차원점의 분리 처리(S1771)의 플로차트이다. 우선, 삼차원 데이터 부호화 장치는, 층(L)과 역치(TH)를 설정한다(S1761). 또한, 삼차원 데이터 부호화 장치는, 설정한 층(L)과 역치(TH)를 나타내는 정보를 비트 스트림에 부가해도 된다.
다음에, 삼차원 데이터 부호화 장치는, 처리 대상의 가지로서, 층(L)의 선두의 가지를 선택한다(S1762). 다음에, 삼차원 데이터 부호화 장치는, 층(L)의 처리 대상의 가지의 유효 리프 수를 카운트한다(S1763). 처리 대상의 가지의 유효 리프 수가 역치(TH)보다 많은 경우(S1764에서 Yes), 삼차원 데이터 부호화 장치는, 처리 대상의 가지를 조밀한 가지로 설정하고, 비트 스트림에 레이어 정보와 가지 정보를 부가한다(S1765A). 한편, 처리 대상의 가지의 유효 리프 수가 역치(TH) 이하인 경우(S1764에서 No), 삼차원 데이터 부호화 장치는, 처리 대상의 가지를 성긴 가지로 설정하고, 비트 스트림에 레이어 정보와 가지 정보를 부가한다(S1766A).
층(L)의 모든 가지의 처리를 완료하지 않은 경우(S1767에서 No), 삼차원 데이터 부호화 장치는, 처리 대상의 가지로서, 층(L)의 다음 가지를 선택한다(S1768). 그리고, 삼차원 데이터 부호화 장치는, 선택한 다음 처리 대상의 가지에 대하여 단계 S1763 이후의 처리를 행한다. 상기의 처리가, 층(L)의 모든 가지의 처리를 완료할 때까지(S1767에서 Yes) 반복된다.
또한, 상기 설명에서는 층(L)과 역치(TH)는 미리 설정되어 있지만, 반드시 이에 한정하지 않는다. 예를 들면, 삼차원 데이터 부호화 장치는, 층(L)과 역치(TH)의 세트를 복수 패턴 설정하고, 각 세트를 이용하여 조밀한 가지와 성긴 가지를 생성하고, 각각을 부호화한다. 삼차원 데이터 부호화 장치는, 복수의 세트 중, 생성된 부호화 데이터의 부호화 효율이 가장 높은 층(L)과 역치(TH)의 세트로 최종적으로 조밀한 가지와 성긴 가지를 부호화한다. 이에 의해 부호화 효율을 높일 수 있다. 또한, 삼차원 데이터 부호화 장치는, 예를 들면, 층(L) 및 역치(TH)를 산출해도 된다. 예를 들면, 삼차원 데이터 부호화 장치는, 트리 구조에 포함되는 층의 최대치의 절반의 값을 층(L)으로 설정해도 된다. 또한, 삼차원 데이터 부호화 장치는, 트리 구조에 포함되는 복수의 삼차원점의 총수의 절반의 값을 역치(TH)로 설정해도 된다.
이하, 본 변형예에 따른 삼차원점군의 부호화 데이터의 신택스예에 대해서 설명한다. 도 82는, 이 신택스예를 나타내는 도면이다. 도 82에 나타내는 신택스예에서는, 도 76에 나타내는 신택스예에 대하여, 레이어 정보인 layer_id[i]와 가지 정보인 branch_id[i]가 추가되어 있다.
layer_id[i]는, i번째의 서브 삼차원점군이 속하는 레이어 번호를 나타낸다. branch_id[i]는, i번째의 서브 삼차원점군의 layer_id[i] 내에 있어서의 가지 번호를 나타낸다.
layer_id[i] 및 branch_id[i]는, 예를 들면 8진 트리에 있어서의 가지의 장소를 나타내는 레이어 정보 및 가지 정보이다. 예를 들면, layer_id[i]=2, branch_id[i]=5는, i번째의 가지가 층 2의 5번째 가지인 것을 나타낸다.
또한, 삼차원 데이터 부호화 장치는, 상기 방법으로 생성된 부호화 데이터를 엔트로피 부호화해도 된다. 예를 들면, 삼차원 데이터 부호화 장치는, 각 값을 2치화한 다음 산출 부호화한다.
또한, 본 변형예에서는, 4진 트리 구조 또는 8진 트리 구조의 예를 나타내었지만, 반드시 이에 한정하지 않으며, 2진 트리, 16진 트리 등의 N진 트리(N은 2 이상의 정수), 또는, 그 외의 트리 구조에 대하여, 상기 수법을 적용해도 된다.
이상과 같이, 본 실시 형태에 따른 삼차원 데이터 부호화 장치는, 도 83에 나타내는 처리를 행한다.
우선, 삼차원 데이터 부호화 장치는, 삼차원 데이터에 포함되는 복수의 삼차원점의 N(N은 2 이상의 정수)진 트리 구조를 생성한다(S1801).
다음에, 삼차원 데이터 부호화 장치는, N진 트리 구조에 포함되는 복수의 층 중 어느 하나인 제1 층에 포함되는 제1 노드를 루트로 하는 제1 가지를 제1 부호화 처리로 부호화함으로써 제1 부호화 데이터를 생성한다(S1802).
또한, 삼차원 데이터 부호화 장치는, 제1 층에 포함되는, 제1 노드와 상이한 제2 노드를 루트로 하는 제2 가지를 제1 부호화 처리와 상이한 제2 부호화 처리로 부호화함으로써 제2 부호화 데이터를 생성한다(S1803).
다음에, 삼차원 데이터 부호화 장치는, 제1 부호화 데이터와 제2 부호화 데이터를 포함하는 비트 스트림을 생성한다(S1804).
이에 의하면, 삼차원 데이터 부호화 장치는, N진 트리 구조에 포함되는 각각의 가지에 적합한 부호화 처리를 적용할 수 있으므로 부호화 효율을 향상시킬 수 있다.
예를 들면, 제1 가지에 포함되는 삼차원점의 수는, 미리 정해진 역치보다 적고, 제2 가지에 포함되는 삼차원점의 수는, 역치보다 많다. 즉, 삼차원 데이터 부호화 장치는, 처리 대상의 가지에 포함되는 삼차원점의 수가 역치보다 적은 경우, 처리 대상의 가지를 제1 가지로 설정하고, 처리 대상의 가지에 포함되는 삼차원점의 수가 역치보다 많은 경우, 처리 대상의 가지를 제2 가지로 설정한다.
예를 들면, 제1 부호화 데이터는, 제1 가지에 포함되는 복수의 제1 삼차원점의 제1 N진 트리 구조를 제1 방식으로 나타내는 제1 정보를 포함한다. 제2 부호화 데이터는, 제2 가지에 포함되는 복수의 제2 삼차원점의 제2 N진 트리 구조를 제2 방식으로 나타내는 제2 정보를 포함한다. 즉, 제1 부호화 처리와 제2 부호화 처리는, 부호화 방식이 상이하다.
예를 들면, 제1 부호화 처리에서는 로케이션 부호화가 이용되고, 제2 부호화 처리에서는 어큐펀시 부호화가 이용된다. 즉, 제1 정보는, 복수의 제1 삼차원점의 각각에 대응하는 삼차원점 정보를 포함한다. 각 삼차원점 정보는, 제1 N진 트리 구조에 있어서의 복수의 층의 각각에 대응하는 인덱스를 포함한다. 각 인덱스는, 대응하는 층에 속하는 N개의 서브 블록 중, 대응하는 제1 삼차원점이 속하는 서브 블록을 나타낸다. 제2 정보는, 제2 N진 트리 구조에 있어서의 복수의 층에 속하는 복수의 서브 블록의 각각에 대응하고, 대응하는 서브 블록에 삼차원점이 존재하는지의 여부를 나타내는 1비트의 정보를 복수 포함한다.
예를 들면, 제2 부호화 처리에서 사용되는 양자화 파라미터는, 제1 부호화 처리에서 사용되는 양자화 파라미터와 상이하다. 즉, 제1 부호화 처리와 제2 부호화 처리는, 부호화 방식은 동일하고, 사용되는 파라미터가 상이하다.
예를 들면, 도 67 및 도 68에 나타내는 바와 같이, 삼차원 데이터 부호화 장치는, 제1 가지의 부호화에서는, N진 트리 구조의 루트로부터 제1 노드에 이르는 트리 구조와, 제1 가지를 포함하는 트리 구조를 제1 부호화 처리로 부호화하고, 제2 가지의 부호화에서는, N진 트리 구조의 루트로부터 제2 노드에 이르는 트리 구조와, 제2 가지를 포함하는 트리 구조를 제2 부호화 처리로 부호화한다.
예를 들면, 제1 부호화 데이터는, 제1 가지의 부호화 데이터와, N진 트리 구조에 있어서의 제1 노드의 위치를 나타내는 제3 정보를 포함한다. 제2 부호화 데이터는, 제2 가지의 부호화 데이터와, N진 트리 구조에 있어서의 제2 노드의 위치를 나타내는 제4 정보를 포함한다.
예를 들면, 제3 정보는, 제1 층을 나타내는 정보(레이어 정보)와, 제1 노드가 제1 층에 포함되는 노드 중 어느 노드인지를 나타내는 정보(가지 정보)를 포함한다. 제4 정보는, 제1 층을 나타내는 정보(레이어 정보)와, 제2 노드가 제1 층에 포함되는 노드 중 어느 노드인지를 나타내는 정보(가지 정보)를 포함한다.
예를 들면, 제1 부호화 데이터는, 제1 가지에 포함되는 삼차원점의 수를 나타내는 정보(numPoint)를 포함하고, 제2 부호화 데이터는, 제2 가지에 포함되는 삼차원점의 수를 나타내는 정보(numPoint)를 포함한다.
예를 들면, 삼차원 데이터 부호화 장치는, 프로세서와 메모리를 구비하고, 프로세서는, 메모리를 이용하여, 상기의 처리를 행한다.
또한, 실시 형태에 따른 삼차원 데이터 복호 장치는, 도 84에 나타내는 처리를 행한다.
우선, 삼차원 데이터 복호 장치는, 비트 스트림으로부터, 복수의 삼차원점의 N(N은 2 이상의 정수)진 트리 구조에 포함되는 복수의 층 중 어느 하나인 제1 층에 포함되는 제1 노드를 루트로 하는 제1 가지가 부호화됨으로써 얻어진 제1 부호화 데이터와, 제1 층에 포함되는, 제1 노드와 상이한 제2 노드를 루트로 하는 제2 가지가 부호화됨으로써 얻어진 제2 부호화 데이터를 취득한다(S1811).
다음에, 삼차원 데이터 복호 장치는, 제1 부호화 데이터를 제1 복호 처리로 복호함으로써 제1 가지의 제1 복호 데이터를 생성한다(S1812).
또한, 삼차원 데이터 복호 장치는, 제2 부호화 데이터를, 제1 복호 처리와 상이한 제2 복호 처리로 복호함으로써 제2 가지의 제2 복호 데이터를 생성한다(S1813).
다음에, 삼차원 데이터 복호 장치는, 제1 복호 데이터와 제2 복호 데이터를 이용하여 복수의 삼차원점을 복원한다(S1814). 예를 들면, 이 삼차원점은, 제1 복호 데이터로 나타내어지는 복수의 삼차원점과, 제2 복호 데이터로 나타내어지는 복수의 삼차원점을 포함한다.
이에 의하면, 삼차원 데이터 복호 장치는, 부호화 효율을 향상시킨 비트 스트림을 복호할 수 있다.
예를 들면, 제1 가지에 포함되는 삼차원점의 수는, 미리 정해진 역치보다 적고, 제2 가지에 포함되는 삼차원점의 수는, 역치보다 많다.
예를 들면, 제1 부호화 데이터는, 제1 가지에 포함되는 복수의 제1 삼차원점의 제1 N진 트리 구조를 제1 방식으로 나타내는 제1 정보를 포함한다. 제2 부호화 데이터는, 제2 가지에 포함되는 복수의 제2 삼차원점의 제2 N진 트리 구조를 제2 방식으로 나타내는 제2 정보를 포함한다. 즉, 제1 복호 처리와 제2 복호 처리는, 부호화 방식(복호 방식)이 상이하다.
예를 들면, 제1 부호화 데이터에는 로케이션 부호화가 이용되어 있고, 제2 부호화 데이터에는 어큐펀시 부호화가 이용되어 있다. 즉, 제1 정보는, 복수의 제1 삼차원점의 각각에 대응하는 삼차원점 정보를 포함한다. 각 삼차원점 정보는, 제1 N진 트리 구조에 있어서의 복수의 층의 각각에 대응하는 인덱스를 포함한다. 각 인덱스는, 대응하는 층에 속하는 N개의 서브 블록 중, 대응하는 제1 삼차원점이 속하는 서브 블록을 나타낸다. 제2 정보는, 제2 N진 트리 구조에 있어서의 복수의 층에 속하는 복수의 서브 블록의 각각에 대응하고, 대응하는 서브 블록에 삼차원점이 존재하는지의 여부를 나타내는 1비트의 정보를 복수 포함한다.
예를 들면, 제2 복호 처리에서 사용되는 양자화 파라미터는, 제1 복호 처리에서 사용되는 양자화 파라미터와 상이하다. 즉, 제1 복호 처리와 제2 복호 처리는, 부호화 방식(복호 방식)은 동일하고, 사용되는 파라미터가 상이하다.
예를 들면, 도 67 및 도 68에 나타내는 바와 같이, 삼차원 데이터 복호 장치는, 제1 가지의 복호에서는, N진 트리 구조의 루트로부터 제1 노드에 이르는 트리 구조와, 제1 가지를 포함하는 트리 구조를 제1 복호 처리로 복호하고, 제2 가지의 복호에서는, N진 트리 구조의 루트로부터 제2 노드에 이르는 트리 구조와, 제2 가지를 포함하는 트리 구조를 제2 복호 처리로 복호한다.
예를 들면, 제1 부호화 데이터는, 제1 가지의 부호화 데이터와, N진 트리 구조에 있어서의 제1 노드의 위치를 나타내는 제3 정보를 포함한다. 제2 부호화 데이터는, 제2 가지의 부호화 데이터와, N진 트리 구조에 있어서의 제2 노드의 위치를 나타내는 제4 정보를 포함한다.
예를 들면, 제3 정보는, 제1 층을 나타내는 정보(레이어 정보)와, 제1 노드가 제1 층에 포함되는 노드 중 어느 노드인지를 나타내는 정보(가지 정보)를 포함한다. 제4 정보는, 제1 층을 나타내는 정보(레이어 정보)와, 제2 노드가 제1 층에 포함되는 노드 중 어느 노드인지를 나타내는 정보(가지 정보)를 포함한다.
예를 들면, 제1 부호화 데이터는, 제1 가지에 포함되는 삼차원점의 수를 나타내는 정보(numPoint)를 포함하고, 제2 부호화 데이터는, 제2 가지에 포함되는 삼차원점의 수를 나타내는 정보(numPoint)를 포함한다.
예를 들면, 삼차원 데이터 복호 장치는, 프로세서와 메모리를 구비하고, 프로세서는, 메모리를 이용하여, 상기의 처리를 행한다.
(실시 형태 10)
본 실시 형태에서는, 어큐펀시 부호의 부호화 시에 있어서의 참조의 제어 방법에 대해서 설명한다. 또한, 이하에서는, 주로 삼차원 데이터 부호화 장치의 동작을 설명하지만, 삼차원 데이터 복호 장치에 있어서도 동일한 처리가 행해져도 된다.
도 85 및 도 86은, 본 실시 형태에 따른 참조 관계를 나타내는 도면이다. 도 85는, 참조 관계를 8진 트리 구조 상에서 나타내는 도면이고, 도 86은, 참조 관계를 공간 영역 상에서 나타내는 도면이다.
본 실시 형태에서는, 삼차원 데이터 부호화 장치는, 부호화 대상의 노드(이하, 대상 노드라고 부른다)의 부호화 정보를 부호화할 때에, 대상 노드가 속하는 부모 노드(parent node) 내의 각 노드의 부호화 정보를 참조한다. 단, 부모 노드와 동일층의 다른 노드(이하, 부모 인접 노드) 내의 각 노드의 부호화 정보는 참조하지 않는다. 즉, 삼차원 데이터 부호화 장치는, 부모 인접 노드의 참조를 불가로 설정하거나, 또는 참조를 금지로 한다.
또한, 삼차원 데이터 부호화 장치는, 부모 노드가 속하는 부모 노드(이하, 조부 노드(grandparent node)라고 부른다) 내의 부호화 정보의 참조를 허가해도 된다. 즉, 삼차원 데이터 부호화 장치는, 대상 노드가 속하는 부모 노드 및 조부 노드의 부호화 정보를 참조하여 대상 노드의 부호화 정보를 부호화해도 된다.
여기서 부호화 정보란, 예를 들면 어큐펀시 부호이다. 삼차원 데이터 부호화 장치는, 대상 노드의 어큐펀시 부호를 부호화할 때에, 대상 노드가 속하는 부모 노드 내의 각 노드에 점군이 포함되는지의 여부를 나타내는 정보(이하, 점유 정보)를 참조한다. 바꾸어 말하면, 삼차원 데이터 부호화 장치는, 대상 노드의 어큐펀시 부호를 부호화할 때에, 부모 노드의 어큐펀시 부호를 참조한다. 한편, 삼차원 데이터 부호화 장치는, 부모 인접 노드 내의 각 노드의 점유 정보는 참조하지 않는다. 즉, 삼차원 데이터 부호화 장치는, 부모 인접 노드의 어큐펀시 부호를 참조하지 않는다. 또한, 삼차원 데이터 부호화 장치는, 조부 노드 내의 각 노드의 점유 정보를 참조해도 된다. 즉, 삼차원 데이터 부호화 장치는, 부모 노드 및 부모 인접 노드의 점유 정보를 참조해도 된다.
예를 들면, 삼차원 데이터 부호화 장치는, 대상 노드의 어큐펀시 부호를 부호화할 때에, 대상 노드가 속하는 부모 노드 또는 조부 노드의 어큐펀시 부호를 이용하여 대상 노드의 어큐펀시 부호를 엔트로피 부호화할 때에 이용하는 부호화 테이블을 전환한다. 또한, 이 상세는 후술한다. 이때, 삼차원 데이터 부호화 장치는, 부모 인접 노드의 어큐펀시 부호를 참조하지 않아도 된다. 이에 의해, 삼차원 데이터 부호화 장치는, 대상 노드의 어큐펀시 부호를 부호화할 때에, 부모 노드 또는 조부 노드의 어큐펀시 부호의 정보에 따라 적절히 부호화 테이블을 전환할 수 있으므로, 부호화 효율을 향상시킬 수 있다. 또한, 삼차원 데이터 부호화 장치는, 부모 인접 노드를 참조하지 않음으로써, 부모 인접 노드의 정보의 확인 처리, 및 그들을 기억하기 위한 메모리 용량을 억제할 수 있다. 또한, 8진 트리의 각 노드의 어큐펀시 부호를 깊이 우선순으로 스캔하여 부호화하는 것이 용이해진다.
이하, 본 실시 형태의 변형예 1에 대해서 설명한다. 도 87은, 본 변형예에서의 참조 관계를 나타내는 도면이다. 상기 실시 형태에서는, 삼차원 데이터 부호화 장치는, 부모 인접 노드의 어큐펀시 부호를 참조하지 않는다고 했지만, 부모 인접 노드의 어큐펀시 부호화를 참조할지의 여부를, 특정 조건에 따라 전환해도 된다.
예를 들면, 삼차원 데이터 부호화 장치는, 8진 트리를 폭 우선으로 스캔하면서 부호화를 행할 때는, 부모 인접 노드 내의 노드의 점유 정보를 참조하여, 대상 노드의 어큐펀시 부호를 부호화한다. 한편, 삼차원 데이터 부호화 장치는, 8진 트리를 깊이 우선으로 스캔하면서 부호화할 때는, 부모 인접 노드 내의 노드의 점유 정보의 참조를 금지한다. 이와 같이 8진 트리의 노드의 스캔 순서(부호화 순서)에 따라, 적절히 참조 가능한 노드를 전환함으로써, 부호화 효율의 향상과 처리 부하의 억제를 실현할 수 있다.
또한, 삼차원 데이터 부호화 장치는, 8진 트리를 폭 우선으로 부호화했는지, 깊이 우선으로 부호화했는지 등의 정보를 비트 스트림의 헤더에 부가해도 된다. 도 88은, 이 경우의 헤더 정보의 신택스예를 나타내는 도면이다. 도 88에 나타내는 octree_scan_order는, 8진 트리의 부호화 순서를 나타내는 부호화 순서 정보(부호화 순서 플래그)이다. 예를 들면, octree_scan_order가 0인 경우, 폭 우선을 나타내고, 1인 경우는 깊이 우선을 나타낸다. 이에 의해, 삼차원 데이터 복호 장치는, octree_scan_order를 참조함으로써, 비트 스트림이 폭 우선 및 깊이 우선 중 어느 것으로 부호화되었는지를 알 수 있으므로, 비트 스트림을 적절히 복호할 수 있다.
또한, 삼차원 데이터 부호화 장치는, 부모 인접 노드의 참조를 금지하는지의 여부를 나타내는 정보를 비트 스트림의 헤더 정보에 부가해도 된다. 도 89는, 이 경우의 헤더 정보의 신택스예를 나타내는 도면이다. limit_refer_flag는, 부모 인접 노드의 참조를 금지하는지의 여부를 나타내는 금지 전환 정보(금지 전환 플래그)이다. 예를 들면, limit_refer_flag가 1인 경우는 부모 인접 노드의 참조를 금지하는 것을 나타내고, 0인 경우는 참조 제한 없음(부모 인접 노드의 참조를 허가함)을 나타낸다.
즉, 삼차원 데이터 부호화 장치는, 부모 인접 노드의 참조를 금지할지의 여부를 결정하고, 상기 결정의 결과에 의거하여, 부모 인접 노드의 참조를 금지할지, 허가할지를 전환한다. 또한, 삼차원 데이터 부호화 장치는, 상기 결정의 결과로서, 부모 인접 노드의 참조를 금지하는지의 여부를 나타내는 금지 전환 정보를 포함하는 비트 스트림을 생성한다.
또한, 삼차원 데이터 복호 장치는, 부모 인접 노드의 참조를 금지하는지의 여부를 나타내는 금지 전환 정보를 비트 스트림으로부터 취득하고, 금지 전환 정보에 의거하여, 부모 인접 노드의 참조를 금지할지, 허가할지를 전환한다.
이에 의해 삼차원 데이터 부호화 장치는, 부모 인접 노드의 참조를 제어하여 비트 스트림을 생성할 수 있다. 또한, 삼차원 데이터 복호 장치는, 부모 인접 노드의 참조가 금지되어 있는지의 여부를 나타내는 정보를 비트 스트림의 헤더로부터 취득할 수 있다.
또한, 본 실시 형태에서는, 부모 인접 노드의 참조를 금지하는 부호화 처리의 예로서 어큐펀시 부호의 부호화 처리를 예로서 기재했지만, 반드시 이에 한정하지 않는다. 예를 들면, 8진 트리의 노드의 다른 정보를 부호화할 때에도 동일한 수법을 적용 가능하다. 예를 들면, 노드에 부가된 색, 법선 벡터, 또는 반사율 등의 그 외의 속성 정보를 부호화할 때에, 본 실시 형태의 수법을 적용해도 된다. 또한, 부호화 테이블 또는 예측치를 부호화할 때에도 동일한 수법을 적용할 수 있다.
다음에, 본 실시 형태의 변형예 2에 대해서 설명한다. 상기 설명에서는, 3개의 참조 인접 노드가 이용되는 예를 나타냈지만 4개 이상의 참조 인접 노드가 이용되어도 된다. 도 90은, 대상 노드 및 참조 인접 노드의 예를 나타내는 도면이다.
예를 들면, 삼차원 데이터 부호화 장치는, 도 90에 나타내는 대상 노드의 어큐펀시 부호를 엔트로피 부호화할 때의 부호화 테이블을, 예를 들면 하기의 식에 의해 산출한다.
CodingTable=(FlagX0<<3)+(FlagX1<<2)+(FlagY<<1)+(FlagZ)
여기서, CodingTable은, 대상 노드의 어큐펀시 부호용 부호화 테이블을 나타내고, 값 0~15 중 어느 하나를 나타낸다. FlagXN은, 인접 노드 XN(N=0..1)의 점유 정보이며, 인접 노드 XN이 점군을 포함(점유)한다면 1을 나타내고, 그렇지 않다면 0을 나타낸다. FlagY는, 인접 노드 Y의 점유 정보이며, 인접 노드 Y가 점군을 포함(점유)한다면 1을 나타내고, 그렇지 않다면 0을 나타낸다. FlagZ는, 인접 노드 Z의 점유 정보이며, 인접 노드 Z가 점군을 포함(점유)한다면 1을 나타내고, 그렇지 않다면 0을 나타낸다.
이때, 만일 인접 노드, 예를 들면 도 90의 인접 노드 X0이 참조 불가(참조 금지)인 경우는, 삼차원 데이터 부호화 장치는, 대체값으로서 1(점유), 또는, 0(비점유)과 같은 고정값을 이용하여도 된다.
도 91은, 대상 노드 및 인접 노드의 예를 나타내는 도면이다. 도 91에 나타내는 바와 같이, 인접 노드가 참조 불가(참조 금지)인 경우는, 대상 노드의 조부 노드의 어큐펀시 부호를 참조하여, 인접 노드의 점유 정보를 산출해도 된다. 예를 들면, 삼차원 데이터 부호화 장치는, 도 91에 나타내는 인접 노드 X0 대신에, 인접 노드 G0의 점유 정보를 이용하여 상기 식의 FlagX0을 산출하고, 산출한 FlagX0을 이용하여 부호화 테이블의 값을 결정해도 된다. 또한, 도 91에 나타내는 인접 노드 G0은, 조부 노드의 어큐펀시 부호로 점유인지 아닌지를 판별할 수 있는 인접 노드이다. 인접 노드 X1은, 부모 노드의 어큐펀시 부호로 점유인지 아닌지를 판별할 수 있는 인접 노드이다.
이하, 본 실시 형태의 변형예 3에 대해서 설명한다. 도 92 및 도 93은, 본 변형예에 따른 참조 관계를 나타내는 도면이다. 도 92는, 참조 관계를 8진 트리 구조 상에서 나타내는 도면이고, 도 93은, 참조 관계를 공간 영역 상에서 나타내는 도면이다.
본 변형예에서는, 삼차원 데이터 부호화 장치는, 부호화 대상의 노드(이하, 대상 노드 2라고 부른다)의 부호화 정보를 부호화할 때에, 대상 노드 2가 속하는 부모 노드 내의 각 노드의 부호화 정보를 참조한다. 즉, 삼차원 데이터 부호화 장치는, 복수의 인접 노드 중, 대상 노드와 부모 노드가 동일한 제1 노드의 자식 노드의 정보(예를 들면 점유 정보)의 참조를 허가한다. 예를 들면, 삼차원 데이터 부호화 장치는, 도 92에 나타내는 대상 노드 2의 어큐펀시 부호를 부호화할 때에, 대상 노드 2가 속하는 부모 노드 내에 존재하는 노드, 예를 들면, 도 92에 나타내는 대상 노드의 어큐펀시 부호를 참조한다. 도 92에 나타내는 대상 노드의 어큐펀시 부호는, 도 93에 나타내는 바와 같이, 예를 들면, 대상 노드 2에 인접하는 대상 노드 내의 각 노드가 점유인지의 여부를 나타내고 있다. 따라서, 삼차원 데이터 부호화 장치는, 대상 노드의 보다 세세한 형상에 따라 대상 노드 2의 어큐펀시 부호의 부호화 테이블을 전환할 수 있으므로 부호화 효율을 향상시킬 수 있다.
삼차원 데이터 부호화 장치는, 대상 노드 2의 어큐펀시 부호를 엔트로피 부호화할 때의 부호화 테이블을, 예를 들면 하기 식에 의해 산출해도 된다.
CodingTable=(FlagX1<<5)+(FlagX2<<4)+(FlagX3<<3)+(FlagX4<<2)+(FlagY<<1)+(FlagZ)
여기서, CodingTable은, 대상 노드 2의 어큐펀시 부호용 부호화 테이블을 나타내고, 값 0~63 중 어느 하나를 나타낸다. FlagXN은, 인접 노드 XN(N=1..4)의 점유 정보이며, 인접 노드 XN이 점군을 포함(점유)한다면 1을 나타내고, 그렇지 않다면 0을 나타낸다. FlagY는, 인접 노드 Y의 점유 정보이며, 인접 노드 Y가 점군을 포함(점유)한다면 1을 나타내고, 그렇지 않다면 0을 나타낸다. FlagZ는, 인접 노드 Y의 점유 정보이며, 인접 노드 Z가 점군을 포함(점유)한다면 1을 나타내고, 그렇지 않다면 0을 나타낸다.
또한, 삼차원 데이터 부호화 장치는, 부호화 테이블의 산출 방법을 부모 노드 내에서의 대상 노드 2의 노드 위치에 따라 변경해도 된다.
또한, 삼차원 데이터 부호화 장치는, 부모 인접 노드의 참조가 금지되지 않은 경우, 부모 인접 노드 내의 각 노드의 부호화 정보를 참조해도 된다. 예를 들면, 부모 인접 노드의 참조가 금지되지 않은 경우, 대상 노드와 부모 노드가 상이한 제3 노드의 자식 노드의 정보(예를 들면 점유 정보)의 참조가 허가된다. 예를 들면, 도 91에 나타내는 예에서는, 삼차원 데이터 부호화 장치는, 대상 노드와 부모 노드가 상이한 인접 노드 X0의 어큐펀시 부호를 참조하여, 인접 노드 X0의 자식 노드의 점유 정보를 취득한다. 삼차원 데이터 부호화 장치는, 취득한 인접 노드 X0의 자식 노드의 점유 정보에 의거하여, 대상 노드의 어큐펀시 부호의 엔트로피 부호화에 이용하는 부호화 테이블을 전환한다.
이상과 같이, 본 실시 형태에 따른 삼차원 데이터 부호화 장치는, 삼차원 데이터에 포함되는 복수의 삼차원점의 N(N은 2 이상의 정수)진 트리 구조에 포함되는 대상 노드의 정보(예를 들면 어큐펀시 부호)를 부호화한다. 도 85 및 도 86에 나타내는 바와 같이, 삼차원 데이터 부호화 장치는, 상기 부호화에서는, 대상 노드와 공간적으로 인접하는 복수의 인접 노드 중, 대상 노드와 부모 노드가 동일한 제1 노드의 정보(예를 들면 점유 정보)의 참조를 허가하고, 대상 노드와 부모 노드가 상이한 제2 노드의 정보(예를 들면 점유 정보)의 참조를 금지한다. 바꾸어 말하면, 삼차원 데이터 부호화 장치는, 상기 부호화에서는, 부모 노드의 정보(예를 들면 어큐펀시 부호)의 참조를 허가하고, 부모 노드와 동일층의 다른 노드(부모 인접 노드)의 정보(예를 들면 어큐펀시 부호)의 참조를 금지한다.
이에 의하면, 당해 삼차원 데이터 부호화 장치는, 대상 노드와 공간적으로 인접하는 복수의 인접 노드 중, 대상 노드와 부모 노드가 동일한 제1 노드의 정보를 참조함으로써 부호화 효율을 향상시킬 수 있다. 또한, 당해 삼차원 데이터 부호화 장치는, 복수의 인접 노드 중, 대상 노드와 부모 노드가 상이한 제2 노드의 정보의 참조를 하지 않음으로써, 처리량을 저감할 수 있다. 이와 같이, 당해 삼차원 데이터 부호화 장치는, 부호화 효율을 향상시킬 수 있음과 더불어, 처리량을 저감할 수 있다.
예를 들면, 삼차원 데이터 부호화 장치는, 또한, 제2 노드의 정보의 참조를 금지할지의 여부를 결정하고, 상기 부호화에서는, 상기 결정의 결과에 의거하여, 제2 노드의 정보의 참조를 금지할지, 허가할지를 전환한다. 삼차원 데이터 부호화 장치는, 또한, 상기 결정의 결과로서, 제2 노드의 정보의 참조를 금지하는지의 여부를 나타내는 금지 전환 정보(예를 들면, 도 89에 나타내는 limit_refer_flag)를 포함하는 비트 스트림을 생성한다.
이에 의하면, 당해 삼차원 데이터 부호화 장치는, 제2 노드의 정보의 참조를 금지할지의 여부를 전환할 수 있다. 또한, 삼차원 데이터 복호 장치는, 금지 전환 정보를 이용하여 적절히 복호 처리를 행할 수 있다.
예를 들면, 대상 노드의 정보는, 대상 노드에 속하는 자식 노드의 각각에 삼차원점이 존재하는지의 여부를 나타내는 정보(예를 들면 어큐펀시 부호)이고, 제1 노드의 정보는, 제1 노드에 삼차원점이 존재하는지의 여부를 나타내는 정보(제1 노드의 점유 정보)이고, 제2 노드의 정보는, 제2 노드에 삼차원점이 존재하는지의 여부를 나타내는 정보(제2 노드의 점유 정보)이다.
예를 들면, 삼차원 데이터 부호화 장치는, 상기 부호화에서는, 제1 노드에 삼차원점이 존재하는지의 여부에 의거하여, 부호화 테이블을 선택하고, 선택된 부호화 테이블을 이용하여, 대상 노드의 정보(예를 들면 어큐펀시 부호)를 엔트로피 부호화한다.
예를 들면, 삼차원 데이터 부호화 장치는, 상기 부호화에서는, 도 92 및 도 93에 나타내는 바와 같이, 복수의 인접 노드 중, 제1 노드의 자식 노드의 정보(예를 들면 점유 정보)의 참조를 허가한다.
이에 의하면, 당해 삼차원 데이터 부호화 장치는, 인접 노드의 보다 상세한 정보를 참조할 수 있으므로 부호화 효율을 향상시킬 수 있다.
예를 들면, 삼차원 데이터 부호화 장치는, 상기 부호화에서는, 대상 노드의 부모 노드 내의 공간 위치에 따라, 복수의 인접 노드 중, 참조하는 인접 노드를 전환한다.
이에 의하면, 당해 삼차원 데이터 부호화 장치는, 대상 노드의 부모 노드 내의 공간 위치에 따라, 적절한 인접 노드를 참조할 수 있다.
예를 들면, 삼차원 데이터 부호화 장치는, 프로세서와 메모리를 구비하고, 프로세서는, 메모리를 이용하여, 상기의 처리를 행한다.
또한, 본 실시 형태에 따른 삼차원 데이터 복호 장치는, 삼차원 데이터에 포함되는 복수의 삼차원점의 N(N은 2 이상의 정수)진 트리 구조에 포함되는 대상 노드의 정보(예를 들면 어큐펀시 부호)를 복호한다. 도 85 및 도 86에 나타내는 바와 같이, 삼차원 데이터 복호 장치는, 상기 복호에서는, 대상 노드와 공간적으로 인접하는 복수의 인접 노드 중, 대상 노드와 부모 노드가 동일한 제1 노드의 정보(예를 들면 점유 정보)의 참조를 허가하고, 대상 노드와 부모 노드가 상이한 제2 노드의 정보(예를 들면 점유 정보)의 참조를 금지한다. 바꾸어 말하면, 삼차원 데이터 복호 장치는, 상기 복호에서는, 부모 노드의 정보(예를 들면 어큐펀시 부호)의 참조를 허가하고, 부모 노드와 동일층의 다른 노드(부모 인접 노드)의 정보(예를 들면 어큐펀시 부호)의 참조를 금지한다.
이에 의하면, 당해 삼차원 데이터 복호 장치는, 대상 노드와 공간적으로 인접하는 복수의 인접 노드 중, 대상 노드와 부모 노드가 동일한 제1 노드의 정보를 참조함으로써 부호화 효율을 향상시킬 수 있다. 또한, 당해 삼차원 데이터 복호 장치는, 복수의 인접 노드 중, 대상 노드와 부모 노드가 상이한 제2 노드의 정보의 참조를 하지 않음으로써, 처리량을 저감할 수 있다. 이와 같이, 당해 삼차원 데이터 복호 장치는, 부호화 효율을 향상시킬 수 있음과 더불어, 처리량을 저감할 수 있다.
예를 들면, 삼차원 데이터 복호 장치는, 또한, 제2 노드의 정보의 참조를 금지하는지의 여부를 나타내는 금지 전환 정보(예를 들면, 도 89에 나타내는 limit_refer_flag)를 비트 스트림으로부터 취득하고, 상기 복호에서는, 금지 전환 정보에 의거하여, 제2 노드의 정보의 참조를 금지할지, 허가할지를 전환한다.
이에 의하면, 당해 삼차원 데이터 복호 장치는, 금지 전환 정보를 이용하여 적절히 복호 처리를 행할 수 있다.
예를 들면, 대상 노드의 정보는, 대상 노드에 속하는 자식 노드의 각각에 삼차원점이 존재하는지의 여부를 나타내는 정보(예를 들면 어큐펀시 부호)이고, 제1 노드의 정보는, 제1 노드에 삼차원점이 존재하는지의 여부를 나타내는 정보(제1 노드의 점유 정보)이고, 제2 노드의 정보는, 제2 노드에 삼차원점이 존재하는지의 여부를 나타내는 정보(제2 노드의 점유 정보)이다.
예를 들면, 삼차원 데이터 복호 장치는, 상기 복호에서는, 제1 노드에 삼차원점이 존재하는지의 여부에 의거하여, 부호화 테이블을 선택하고, 선택된 부호화 테이블을 이용하여, 대상 노드의 정보(예를 들면 어큐펀시 부호)를 엔트로피 복호한다.
예를 들면, 삼차원 데이터 복호 장치는, 상기 복호에서는, 도 92 및 도 93에 나타내는 바와 같이, 복수의 인접 노드 중, 제1 노드의 자식 노드의 정보(예를 들면 점유 정보)의 참조를 허가한다.
이에 의하면, 당해 삼차원 데이터 복호 장치는, 인접 노드의 보다 상세한 정보를 참조할 수 있으므로 부호화 효율을 향상시킬 수 있다.
예를 들면, 삼차원 데이터 복호 장치는, 상기 복호에서는, 대상 노드의 부모 노드 내의 공간 위치에 따라, 복수의 인접 노드 중, 참조하는 인접 노드를 전환한다.
이에 의하면, 당해 삼차원 데이터 복호 장치는, 대상 노드의 부모 노드 내의 공간 위치에 따라, 적절한 인접 노드를 참조할 수 있다.
예를 들면, 삼차원 데이터 복호 장치는, 프로세서와 메모리를 구비하고, 프로세서는, 메모리를 이용하여, 상기의 처리를 행한다.
(실시 형태 11)
본 실시 형태에서는, 삼차원 데이터 부호화 장치는, 입력된 삼차원점군을 2개 이상의 서브 삼차원점군으로 분리하고, 복수의 서브 삼차원점군에 의존 관계가 발생하지 않도록 각 서브 삼차원점군을 부호화한다. 이에 의해, 삼차원 데이터 부호화 장치는, 복수의 서브 삼차원점군을 병렬로 부호화할 수 있다. 예를 들면, 삼차원 데이터 부호화 장치는, 입력된 삼차원점군을 서브 삼차원점군 A와 서브 삼차원점군 B로 분리하고, 서브 삼차원점군 A와 서브 삼차원점군 B를 병렬로 부호화한다.
또한, 분리의 방법으로서는, 삼차원 데이터 부호화 장치는, 예를 들면, 8진 트리 구조를 이용하여 부호화를 행하는 경우, 8진 트리로 분할한 8개의 자식 노드를 병렬로 부호화한다. 예를 들면, 삼차원 데이터 부호화 장치는, 각 자식 노드를 루트로 하는 복수의 트리 구조를 병렬로 부호화한다.
또한, 삼차원 데이터 부호화 장치는, 복수의 서브 삼차원점군을 반드시 병렬로 부호화할 필요는 없으며, 의존 관계가 발생하지 않도록, 복수의 서브 삼차원점군을 순차적으로 부호화해도 된다. 또한, 8진 트리에 한정되지 않으며, 4진 트리 또는 16진 트리 등의 N진 트리(N은 2 이상의 정수)에 본 실시 형태의 수법을 적용해도 된다. 또한, 삼차원 데이터 부호화 장치는, 점군의 색, 반사율 또는 법선 벡터 등의 속성 정보를 이용하여 분할을 행해도 된다. 또한, 삼차원 데이터 부호화 장치는, 실시 형태 9의 도 67~도 68 등을 이용하여 설명한 바와 같이, 점군의 밀도의 차이에 의해 분할을 행해도 된다.
또한, 삼차원 데이터 부호화 장치는, 부호화한 복수의 서브 삼차원점군의 복수의 부호화 데이터를 1개의 비트 스트림에 결합해도 된다. 이때, 삼차원 데이터 부호화 장치는, 각 서브 삼차원점군의 각 부호화 데이터의 개시 위치를 비트 스트림의 헤더 등에 포함시켜도 된다. 예를 들면, 삼차원 데이터 부호화 장치는, 비트 스트림의 선두로부터의 어드레스(비트 위치 또는 바이트 수 등)를 헤더 등에 포함시켜도 된다. 이에 의해, 삼차원 데이터 복호 장치는, 각 서브 삼차원점군의 부호화 데이터의 개시 위치를 비트 스트림의 선두를 복호함으로써 알 수 있다. 또한, 삼차원 데이터 복호 장치는, 복수의 서브 삼차원점군의 부호화 데이터를 병렬로 복호할 수 있으므로, 처리 시간을 삭감할 수 있다.
또한, 삼차원 데이터 부호화 장치는, 복수의 서브 삼차원점군에 의존 관계가 발생하지 않도록 복수의 서브 삼차원점군을 부호화한 것을 나타내는, 또는, 복수의 서브 삼차원점군을 병렬로 부호화한 것을 나타내는 플래그를 비트 스트림의 헤더에 부가해도 된다. 이에 의해, 삼차원 데이터 복호 장치는, 헤더를 복호함으로써, 복수의 삼차원점군의 복수의 부호화 데이터를 병렬로 복호 가능한지의 여부를 판단할 수 있다.
여기서, 복수의 서브 삼차원점군에 의존 관계가 발생하지 않는다는 것은, 예를 들면, 복수의 서브 삼차원점군의 복수의 노드의 어큐펀시 부호 또는 리프 정보 등을 부호화하기 위한 부호화 테이블(엔트로피 부호화에 이용되는 확률 테이블 등)을, 각 서브 삼차원점군에 대하여 독립적으로 갖는 것을 의미한다. 예를 들면, 삼차원 데이터 부호화 장치는, 서브 삼차원점군 A와 서브 삼차원점군 B를 의존 관계가 발생하지 않도록 부호화하기 위해서, 서브 삼차원점군 A와 서브 삼차원점군 B에 대하여 상이한 부호화 테이블을 이용한다. 또는, 삼차원 데이터 부호화 장치는, 서브 삼차원점군 A와 서브 삼차원점군 B를 순차적으로 처리하는 경우, 서브 삼차원점군 A와 서브 삼차원점군 B에 의존 관계가 발생하지 않도록, 서브 삼차원점군 A를 부호화한 후, 또한 서브 삼차원점군 B를 부호화하기 전에 부호화 테이블을 초기화한다. 이와 같이, 삼차원 데이터 부호화 장치는, 각 서브 삼차원점군의 부호화 테이블을 독립적으로 갖거나, 또는, 부호화 전에 부호화 테이블을 초기화함으로써, 복수의 서브 삼차원점군에 의존 관계가 발생하지 않도록 복수의 서브 삼차원점군을 부호화할 수 있다. 또한, 삼차원 데이터 복호 장치도 마찬가지로, 각 서브 삼차원점군의 부호화 테이블(복호 테이블)을 독립적으로 갖거나, 또는, 각 서브 삼차원점군의 복호 전에 부호화 테이블을 초기화함으로써, 각 서브 삼차원점군을 적절히 복호할 수 있다.
또한, 복수의 서브 삼차원점군에 의존 관계가 발생하지 않는다는 것은, 예를 들면, 복수의 서브 삼차원점군의 복수의 노드의 어큐펀시 부호 또는 리프 정보 등을 부호화할 때에, 서브 삼차원점군 사이에서 참조를 금지하는 것을 의미해도 된다. 예를 들면, 삼차원 데이터 부호화 장치는, 부호화 대상의 대상 노드의 어큐펀시 부호를 부호화할 때에, 8진 트리에 있어서의 인접 노드의 정보를 이용하여 부호화를 행한다. 이 경우에 있어서, 삼차원 데이터 부호화 장치는, 인접 노드가 다른 서브 삼차원점군에 포함되는 경우, 그 인접 노드를 참조하지 않고 대상 노드를 부호화한다. 이 경우, 삼차원 데이터 부호화 장치는, 인접 노드는 존재하지 않는 것으로 하여 부호화를 행해도 되고, 인접 노드는 존재하지만, 당해 인접 노드가 다른 서브 삼차원점군에 포함된다고 하는 조건하에서 대상 노드를 부호화해도 된다.
마찬가지로, 삼차원 데이터 복호 장치는, 예를 들면, 복수의 서브 삼차원점군의 복수의 노드의 어큐펀시 부호 또는 리프 정보 등을 복호할 때에, 서브 삼차원점군 사이에서 참조를 금지한다. 예를 들면, 삼차원 데이터 복호 장치는, 복호 대상의 대상 노드의 어큐펀시 부호를 복호할 때에, 8진 트리에 있어서의 인접 노드의 정보를 이용하여 복호를 행한다. 이 경우에 있어서, 삼차원 데이터 복호 장치는, 인접 노드가 다른 서브 삼차원점군에 포함되는 경우, 그 인접 노드를 참조하지 않고 대상 노드를 복호한다. 이 경우, 삼차원 데이터 복호 장치는, 인접 노드는 존재하지 않는 것으로 하여 복호를 행해도 되고, 인접 노드는 존재하지만 당해 인접 노드가 다른 서브 삼차원점군에 포함된다고 하는 조건하에서 대상 노드를 복호해도 된다.
또한, 삼차원 데이터 부호화 장치는, 복수의 서브 삼차원점군의 삼차원 위치 정보와 속성 정보(색, 반사율 또는 법선 벡터 등)를 각각 부호화할 때에, 한쪽에 대해서는 의존 관계가 발생하지 않도록 부호화를 행하고, 다른쪽에 대해서는 의존 관계가 있도록 부호화를 행해도 된다. 예를 들면, 삼차원 데이터 부호화 장치는, 의존 관계가 발생하지 않도록 삼차원 위치 정보를 부호화하고, 의존 관계가 있도록 속성 정보를 부호화해도 된다. 이에 의해, 삼차원 데이터 부호화 장치는, 삼차원 위치 정보를 병렬로 부호화함으로써 처리 시간을 삭감할 수 있고, 속성 정보를 순차적으로 부호화함으로써 부호화량을 삭감할 수 있다. 또한, 삼차원 데이터 부호화 장치는, 삼차원 위치 정보를 의존 관계가 없도록 부호화했는지의 여부를 나타내는 정보와, 속성 정보를 의존 관계가 없도록 부호화했는지의 여부를 나타내는 정보의 양쪽 모두를 헤더에 부가해도 된다. 이에 의해, 삼차원 데이터 복호 장치는 헤더를 복호함으로써, 삼차원 위치 정보를 의존 관계가 없도록 복호할 수 있는지, 속성 정보를 의존 관계가 없도록 복호할 수 있는지를 각각 판단할 수 있다. 이에 의해, 삼차원 데이터 복호 장치는, 의존 관계가 없는 경우는 병렬로 복호를 행할 수 있다. 예를 들면, 삼차원 데이터 복호 장치는, 삼차원 위치 정보가 의존 관계가 발생하지 않도록 부호화되어 있고, 속성 정보가 의존 관계가 있도록 부호화되어 있는 경우, 삼차원 위치 정보를 병렬로 복호함으로써 처리 시간을 삭감하고, 속성 정보를 순차적으로 복호한다.
도 94는, 트리 구조의 예를 나타내는 도면이다. 또한, 도 94에서는, 4진 트리의 예를 나타내었지만, 8진 트리 등의 다른 트리 구조가 이용되어도 된다. 삼차원 데이터 부호화 장치는, 도 94에 나타내는 트리 구조를, 예를 들면, 도 95에 나타내는 서브 삼차원점군 A와, 도 96에 나타내는 서브 삼차원군 B로 분할한다. 또한, 이 예에서는, 층 1의 유효 노드에서 분할이 행해진다. 즉, 4진 트리의 경우에는, 최대 4개의 서브 삼차원점군이 생성되고, 8진 트리의 경우에는, 최대 8개의 서브 삼차원점군이 생성된다. 또한, 삼차원 데이터 부호화 장치는, 속성 정보, 또는 점군 밀도 등의 정보를 이용하여 분할을 행해도 된다.
삼차원 데이터 부호화 장치는, 서브 삼차원점군 A와 서브 삼차원점군 B에 의존 관계가 발생하지 않도록 부호화를 행한다. 예를 들면, 삼차원 데이터 부호화 장치는, 서브 삼차원점군마다 어큐펀시 부호의 엔트로피 부호화에 이용하는 부호화 테이블을 전환한다. 또는, 삼차원 데이터 부호화 장치는, 각 서브 삼차원점군의 부호화 전에 부호화 테이블을 초기화한다. 또는, 삼차원 데이터 부호화 장치는, 노드의 인접 정보를 산출할 때에, 인접 노드가 상이한 서브 삼차원점군에 포함되는 경우는 당해 인접 노드의 참조를 금지한다.
도 97은, 본 실시 형태에 따른 비트 스트림의 구성예를 나타내는 도면이다. 도 97에 나타내는 바와 같이 비트 스트림은, 헤더와, 서브 삼차원점군 A의 부호화 데이터와, 서브 삼차원점군 B의 부호화 데이터를 포함한다. 헤더는, 점군 수 정보와, 의존 관계 정보와, 선두 어드레스 정보 A 및 선두 어드레스 정보 B를 포함한다.
점군 수 정보는, 비트 스트림에 포함되는 서브 삼차원점군의 개수를 나타낸다. 또한, 점군 수 정보로서, 어큐펀시 부호에 의해 개수가 나타내어져도 된다. 예를 들면, 도 94에 나타내는 예에서는, 층 0의 어큐펀시 부호 「1010」이 이용되고, 어큐펀시 부호에 포함되는 「1」의 수에 의해 서브 삼차원점군의 개수가 나타내어진다.
의존 관계 정보는, 서브 삼차원점군을 의존 관계 없이 부호화했는지의 여부를 나타낸다. 예를 들면, 삼차원 데이터 복호 장치는, 이 의존 관계 정보에 의거하여, 서브 삼차원점군을 병렬로 복호할지의 여부를 판정한다.
선두 어드레스 정보 A는, 서브 삼차원점군 A의 부호화 데이터의 선두 어드레스를 나타낸다. 선두 어드레스 정보 B는, 서브 삼차원점군 B의 부호화 데이터의 선두 어드레스를 나타낸다.
이하, 병렬 부호화의 효과에 대해서 설명한다. 삼차원점군(포인트 클라우드)의 8진 트리 데이터에 있어서, 기하 정보(삼차원 위치 정보) 또는 속성 정보를 분할하고, 병렬 부호화함으로써, 처리 시간을 저감할 수 있다. 부모 노드의 계층에 있어서 노드가 다른 노드로부터 독립되어 있는 경우에 병렬 부호화를 실현할 수 있다. 즉, 인접 부모 노드를 참조하지 않을 필요가 있다. 이 조건은, 자식 노드 및 손자 노드의 모두에 있어서도 만족될 필요가 있다.
도 98은, 트리 구조의 예를 나타내는 도면이다. 도 98에 나타내는 예에 있어서, 깊이 우선의 부호화가 이용되는 경우, 노드 A는, 층 1부터 노드 C와 독립되어 있다. 또한, 노드 C는, 층 2부터 노드 D와 독립되어 있다. 노드 A는, 층 3부터 노드 B와 독립되어 있다.
삼차원 데이터 부호화 장치는, 각 노드의 이 독립된 정보를 이용하여, 하드웨어의 종별, 유저 설정, 알고리즘, 또는 데이터의 적응성 등에 의거하여, 2가지 방식의 병렬 부호화 방법으로부터 사용할 병렬 부호화 방법을 선택한다.
이 2가지 방식이란, 전병렬 부호화(full parallel encoding)와 점진 병렬 부호화(incremental parallel encoding)이다.
우선, 전병렬 부호화에 대해서 설명한다. 병렬 처리 또는 병렬 프로그래밍에서는, 동시에 많은 데이터를 처리할 필요가 있기 때문에, 매우 처리가 무겁다.
GPU(Graphics Processing Unit)에 포함되는 프로세싱 유닛(PU)의 수, CPU에 포함되는 코어의 수, 또는, 소프트웨어 실장에 있어서의 스레드의 수를 이용하여, 병렬 처리 가능한 노드의 수가 결정된다.
여기서, 일반적으로 8진 트리에 포함되는 노드의 수는, 이용 가능한 PU의 수보다 많다. 삼차원 데이터 부호화 장치는, 층에 포함되는 부호화가 완료된 노드의 수를 나타내는 정보를 이용하여, 층에 포함되는 노드의 수가, 이용 가능한 PU의 수에 대응하는 최적 수인지를 판정하고, 층에 포함되는 노드의 수가, 최적 수에 달한 것을 트리거로, 전병렬 부호화를 개시한다. 또한, 병렬 처리에 있어서, 폭 우선 또는 깊이 우선의 처리를 이용할 수 있다.
삼차원 데이터 부호화 장치는, 병렬 부호화 처리를 개시한 노드(층)를 나타내는 정보를 비트 스트림의 헤더에 저장해도 된다. 이에 의해, 삼차원 데이터 복호 장치는, 이 정보를 이용하여, 필요하다면 병렬 복호 처리를 행할 수 있다. 또한, 병렬 부호화 처리를 개시한 노드를 나타내는 정보의 형식은 임의이면 되지만, 예를 들면, 로케이션 부호가 이용되어도 된다.
또한, 삼차원 데이터 부호화 장치는, 병렬 부호화를 행하는 각 노드(서브 삼차원점군)에 대하여 부호화 테이블(확률 테이블)을 준비한다. 이 부호화 테이블은, 초기값 또는 노드마다 상이한 값으로 초기화된다. 예를 들면, 노드마다 상이한 값이란, 부모 노드의 어큐펀시 부호에 의거한 값이다. 이 전병렬 부호화에서는, GPU의 초기화가 한 번이면 된다고 하는 이점이 있다.
도 99는, 전병렬 부호화를 설명하기 위한 도면이며, 트리 구조의 예를 나타내는 도면이다. 도 100은, 병렬 처리되는 서브 삼차원점군을 공간적으로 나타내는 도면이다. 삼차원 데이터 부호화 장치는, PU 또는 스레드의 수에 상관되는 노드의 수가 최적점에 달한 것을 트리거로 병렬 처리를 개시한다.
도 99에 나타내는 예에서는, 층 3에 있어서, 당해 층에 포함되는 점유 노드의 수가 9가 되어, 최적 수를 초과한다. 따라서, 삼차원 데이터 부호화 장치는, 층 3 이하의 삼차원점(노드)을, 층 3의 각 점유 노드를 루트로 하는 복수의 서브 삼차원점군으로 분할하고, 각 서브 삼차원점군을 병렬 처리한다. 예를 들면, 도 99에 나타내는 예에서는, 9개의 서브 삼차원점군이 생성된다.
삼차원 데이터 부호화 장치는, 병렬 처리를 시작한 층을 나타내는 레이어 정보를 부호화해도 된다. 또한, 삼차원 데이터 부호화 장치는, 병렬 처리를 시작한 때의 점유 노드의 수(도 99의 예에서는 9)를 나타내는 정보를 부호화해도 된다.
또한, 삼차원 데이터 부호화 장치는, 예를 들면, 복수의 서브 삼차원군을 서로의 참조를 금지하면서 부호화한다. 또한, 삼차원 데이터 부호화 장치는, 예를 들면, 각 서브 삼차원점군의 부호 전에 엔트로피 부호화에 이용할 부호화 테이블(확률 테이블 등)을 초기화한다.
도 101은, 본 실시 형태에 따른 비트 스트림의 구성예를 나타내는 도면이다. 도 101에 나타내는 바와 같이, 비트 스트림은, 헤더, 상층 부호화 데이터, 서브 헤더, 서브 삼차원점군 A의 부호화 데이터, 서브 삼차원점군 B의 부호화 데이터를 포함한다.
헤더는, 공간 최대 사이즈 정보와, 병렬 개시 레이어 정보를 포함한다. 공간 사이즈 정보는, 삼차원점군을 8진 트리로 분할하는 최초의 삼차원 공간을 나타낸다. 예를 들면, 공간 사이즈 정보는, 최초의 삼차원 공간의 최대 좌표(x, y, z)를 나타낸다.
병렬 개시 레이어 정보는, 병렬 처리를 개시 가능한 층인 병렬 개시 레이어를 나타낸다. 여기서는, 병렬 개시 레이어 정보는, 예를 들면 층 N을 나타낸다.
상층 부호화 데이터는, 병렬 처리를 개시하기 전의 층 N까지의 부호화 데이터이며, 층 N까지의 노드 정보이다. 예를 들면, 상층 부호화 데이터는, 층 N까지의 노드의 어큐펀시 부호 등을 포함한다.
서브 헤더는, 층 N 이후를 복호하기 위해 필요한 정보를 포함한다. 예를 들면, 서브 헤더는, 각 서브 삼차원점군의 부호화 데이터의 선두 어드레스 등을 나타낸다. 도 101에 나타내는 예에서는, 서브 헤더는, 선두 어드레스 정보 A와 선두 어드레스 정보 B를 포함한다. 선두 어드레스 정보 A는, 서브 삼차원점군 A의 부호화 데이터의 선두 어드레스를 나타낸다. 선두 어드레스 정보 B는, 서브 삼차원점군 B의 부호화 데이터의 선두 어드레스를 나타낸다.
또한, 삼차원 데이터 부호화 장치는, 헤더에, 선두 어드레스 정보 A 및 선두 어드레스 정보 B를 저장해도 된다. 이에 의해, 삼차원 데이터 복호 장치는, 상층 부호화 데이터보다 먼저, 서브 삼차원점군의 부호화 데이터를 병렬로 복호할 수 있다. 이 경우, 서브 헤더는, 각 서브 삼차원점군의 공간을 나타내는 정보를 포함해도 된다. 이 정보는, 각 서브 삼차원점군의 공간의 최대 좌표(x, y, z)를 나타낸다.
도 102는, 병렬 복호 처리를 설명하기 위한 도면이다. 도 102에 나타내는 바와 같이, 삼차원 데이터 복호 장치는, 서브 삼차원점군 A의 부호화 데이터와 서브 삼차원점군 B의 부호화 데이터를 병렬로 복호하고, 서브 삼차원점 A의 복호 데이터와 서브 삼차원점군 B의 복호 데이터를 생성한다. 다음에, 삼차원 데이터 복호 장치는, 생성한 서브 삼차원점 A의 복호 데이터와 서브 삼차원점군 B의 복호 데이터를 통합하여, 삼차원점군의 복호 데이터를 생성한다. 이와 같이, 삼차원 데이터 복호 장치는, 복수의 서브 삼차원점군의 복호 데이터에 포함되는 삼차원 위치 정보 및 속성 정보(색 정보 및 반사율 등)를 통합한다. 또한, 삼차원 데이터 복호 장치는, 통합한 데이터를 1개의 파일로서 출력해도 된다.
또한, 삼차원 데이터 복호 장치는, 반드시 서브 삼차원점군의 모두를 복호할 필요는 없으며, 삼차원 데이터 복호 장치가 필요한 서브 삼차원점군을 선택적으로 복호해도 된다. 예를 들면, 삼차원 데이터 복호 장치가 차재 등의 모빌리티인 경우, 삼차원 데이터 복호 장치는, 복수의 서브 삼차원점군 중, GPS 등으로 취득한 현재의 위치에 가까운 에어리어의 서브 삼차원점군을 복호한다.
또한, 삼차원 데이터 부호화 장치는, 서브 헤더에, 각 서브 삼차원점군의 우선 순위를 나타내는 정보를 저장해도 된다. 이 경우, 삼차원 데이터 복호 장치는, 서브 헤더에 포함되는 정보로 나타내어지는 우선 순위에 따라, 우선 순위가 높은 서브 삼차원점군에 대하여 CPU 등의 연산 자원을 우선적으로 부여하면서 병렬 복호를 실행한다. 이에 의해, 삼차원 데이터 복호 장치는, 삼차원 데이터 복호 장치에게 있어 중요한 에어리어를 포함하는 서브 삼차원점군을 효율적으로 복호할 수 있다.
도 103은, 전병렬 부호화 처리의 흐름을 모식적으로 나타내는 도면이다. 우선, 삼차원 데이터 부호화 장치는, 이용 가능한 PU의 수를 결정한다(S2601). 다음에, 삼차원 데이터 부호화 장치는, 8진 트리를 처리하고, 노드의 위치를 저장한다(S2602). 다음에, 삼차원 데이터 부호화 장치는, 점유 노드의 수가 PU의 수보다 많은지의 여부를 판정한다(S2603).
점유 노드 수가 PU의 수 이하인 경우(S2603에서 No), 삼차원 데이터 부호화 장치는, 다음 노드에 대하여 단계 S2602의 처리를 행한다. 점유 노드의 수가 PU의 수보다 많은 경우(S2603에서 Yes), 삼차원 데이터 부호화 장치는, 현재의 층을 병렬 처리를 개시하는 층인 병렬 개시 레이어로 설정한다(S2604).
다음에, 삼차원 데이터 부호화 장치는, 복수의 부호화 테이블을 초기화하고, 병렬 부호화를 개시한다(S2605). 병렬 부호화가 완료된 후, 삼차원 데이터 부호화 장치는, 단계 S2602에서 저장한 위치에 의거하여, 8진 트리를 재구성한다(S2606).
또한, 삼차원 데이터 부호화 장치는, 병렬 부호화를 개시한 병렬 개시 레이어를 나타내는 병렬 개시 레이어 정보를 비트 스트림의 헤더에 부가해도 된다. 이에 의해, 삼차원 데이터 복호 장치는 헤더를 복호함으로써, 어느 층부터 병렬 복호가 가능한지를 판정할 수 있다.
또한, 어느 층부터 병렬 처리를 시작할지가, 미리 결정되어 있어도 된다. 또한, 병렬화를 개시하는 레이어를 나타내는 병렬 개시 레이어 정보가 비트 스트림에 부가되지 않고, 병렬화를 개시하는 레이어가 규격 등으로 규정되어도 된다. 예를 들면, 삼차원 데이터 부호화 장치는, 병렬화하는지의 여부를 나타내는 플래그를 비트 스트림에 부가한다. 삼차원 데이터 복호 장치는, 그 플래그가 온인 경우는, 최초의 레이어부터 병렬 처리를 개시하고, 플래그가 오프인 경우는 순차 처리를 적용해도 된다.
도 104는, 전병렬 복호 처리의 흐름을 모식적으로 나타내는 도면이다. 우선, 삼차원 데이터 복호 장치는, 헤더를 복호함으로써 병렬 처리 가능한 레이어 N을 나타내는 병렬 개시 레이어 정보를 취득한다(S2611). 다음에, 삼차원 데이터 복호 장치는, 어큐펀시 부호를 복호하여 현 노드를 8분할하고, 점유 상태의 서브 노드의 처리로 이행한다(S2612).
다음에, 삼차원 데이터 복호 장치는, 처리 대상의 층이 병렬 개시 레이어 N에 도달했는지의 여부를 판정한다(S2613). 처리 대상의 층이 병렬 개시 레이어 N에 도달하지 않은 경우(S2613에서 No), 삼차원 데이터 복호 장치는, 다음 노드에 대하여 단계 S2612의 처리를 행한다. 처리 대상의 층이 병렬 개시 레이어 N에 도달한 경우(S2613에서 Yes), 삼차원 데이터 복호 장치는, 서브 헤더를 복호하고, 복수의 서브 삼차원점군의 개시 어드레스를 취득한다(S2614).
다음에, 삼차원 데이터 복호 장치는, 복수의 부호화 테이블을 초기화하고, 복수의 서브 삼차원점군의 병렬 복호를 개시한다(S2615). 병렬 복호가 완료된 후, 삼차원 데이터 복호 장치는, 복호한 복수의 서브 삼차원점군의 삼차원 위치 정보와 속성 정보를 통합한다(S2616).
예를 들면, 삼차원 데이터 복호 장치는, 병렬 개시 레이어 정보를 비트 스트림의 헤더로부터 복호한다. 이에 의해 삼차원 데이터 복호 장치는, 어느 층부터 병렬로 복호 가능한지의 여부를 판정할 수 있다.
또한, 병렬화를 개시하는 레이어를 나타내는 병렬 개시 레이어 정보는 비트 스트림에 부가되지 않고, 병렬화를 개시하는 레이어가 규격 등으로 규정되어도 된다. 예를 들면, 삼차원 데이터 부호화 장치는, 병렬화하는지의 여부를 나타내는 플래그를 비트 스트림에 부가한다. 삼차원 데이터 복호 장치는, 그 플래그가 온인 경우, 최초의 레이어부터 병렬 처리를 개시하고, 플래그가 오프인 경우는 순차 처리를 적용해도 된다.
다음에, 점진 병렬 부호화에 대해서 설명한다. 도 105 및 도 106은, 이 점진 병렬 부호화를 설명하기 위한 도면이다. 도 105는, 트리 구조에 있어서의 병렬 처리를 나타내는 도면이고, 도 106은, 병렬 처리에 있어서의 시계열의 변화를 나타내는 도면이다.
점진 병렬 부호화에서는, 부모 노드가 1 이상의 자식 노드로 분할된 경우에 있어서, 이용 가능한 PU가 존재하는 경우에는, 병렬 수를 순차적으로 증가시켜 가는 처리이다. 또한, 추가의 PU를 필요로 하는 새로운 노드가 발견될 때마다 부호화 테이블이 미리 정해진 테이블로 설정된다.
도 105에 나타내는 예에서는, 톱(루트)에서 코어 1에 의한 처리가 개시한다. 층 1에 있어서, 우측의 노드의 처리에 코어 2가 이용되고, 코어 1은 좌측의 노드를 처리한다. 층 2에 있어서 코어 1은 좌측의 노드의 처리를 계속한다. 층 3에서는, 코어 1은 노드 A를 처리하고, 새롭게 발견된 노드 B를 코어 4가 처리한다. 또한, 층 1의 우측의 노드에 대해서는, 층 2에서 코어 2는 왼쪽의 노드의 처리를 계속하고, 층 3에서 노드 C를 처리한다. 또한, 층 2에 있어서, 코어 3이 추가되고, 코어 3은 오른쪽의 노드를 처리하고, 층 3에서 노드 D를 처리한다.
또한, 삼차원 데이터 부호화 장치는, 각 노드에 있어서 엔트로피 부호화의 부호화 테이블의 초기화가 필요한지의 여부를 나타내는 플래그를 추가해도 된다. 이에 의해, 삼차원 데이터 복호 장치는, 당해 플래그에 의해 초기화가 온이 된 노드의 다음의 자식 노드를 병렬 처리가 가능한 것으로 판정할 수 있다.
도 107은, 점진 병렬 부호화 처리의 흐름을 모식적으로 나타내는 도면이다. 우선, 삼차원 데이터 부호화 장치는, 8진 트리를 처리하고, 노드의 위치를 저장한다(S2621). 다음에, 삼차원 데이터 부호화 장치는, 대상 노드가 점유 상태의 자식 노드인 점유 자식 노드를 복수 갖는지의 여부를 판정한다(S2622). 대상 노드가 복수의 점유 자식 노드를 갖는 경우(S2613에서 Yes), 삼차원 데이터 부호화 장치는, 병렬 부호화에 이용 가능한 PU가 존재하는지의 여부를 판정한다(S2623).
대상 노드가 복수의 점유 자식 노드를 갖지 않는 경우(S2613에서 No), 또는, 병렬 부호화에 이용 가능한 PU가 존재하지 않는 경우(S2623에서 No), 삼차원 데이터 부호화 장치는, 현재 사용중인 PU를 이용하여 8진 트리의 처리를 계속한다(S2624). 예를 들면, 초기 상태에서는, 삼차원 데이터 부호화 장치는 초기 상태의 하나의 PU를 이용하여 처리를 계속한다. 또한, 대상 노드가 복수의 점유 자식 노드를 갖지 않는 경우란, 대상 노드가 점유 자식 노드를 갖지 않는 경우, 및, 대상 노드가 1개의 점유 자식 노드를 갖는 경우를 포함한다.
한편, 병렬 부호화에 이용 가능한 PU가 존재하는 경우(S2623에서 Yes), 삼차원 데이터 부호화 장치는, 사용하는 PU에 새로운 PU를 추가하고, 복수의 부호화 테이블을 초기화하고, 병렬 부호화를 개시한다(S2625).
모든 노드의 처리가 완료되지 않은 경우(S2626에서 No), 삼차원 데이터 부호화 장치는, 다음 노드에 대하여 단계 S2621의 처리를 행한다. 모든 노드의 처리가 완료된 경우(S2626에서 Yes), 삼차원 데이터 부호화 장치는, 단계 S2602에서 저장한 위치에 의거하여, 8진 트리를 재구성한다(S2627).
이러한 점진 병렬 부호화에서는, 대상 노드가 복수의 점유 노드를 갖고, 비어 있는 PU가 존재하는 경우에는, 즉시 병렬 처리가 개시된다. 이에 의해, PU의 처리가 짧은 시간에 완료된 경우에는, 다음 처리에 PU를 할당할 수 있으므로, 이상적인 처리 불가의 밸런스를 실현할 수 있다.
한편, 병렬 처리가 요구될 때마다 초기화 처리가 필요하게 된다. 또한, 상하 또는 좌우의 처리 순서에 있어서의 다음의 처리까지, 복수의 PU에 있어서의 처리가 종료된다고는 할 수 없기 때문에, 데이터의 재기입을 위해서, 각 층의 노드 및 자식 노드의 모두를 동기시키는 메커니즘이 필요하게 된다. 바꾸어 말하면, 상술한 전병렬 부호화에서는, 이러한 처리가 필요하지 않기 때문에 처리량을 저감할 수 있다고 하는 효과를 실현할 수 있다.
이상과 같이, 본 실시 형태에서는, 원래의 삼차원점은, 병렬 처리 가능한 가지로 분할된다. 8진 트리에서는, 예를 들면, 노드에 대하여 병렬 처리 가능한 8개의 가지가 생성된다. 또한, 8진 트리의 어느 층부터 병렬 처리 가능한 가지가 개시되는지를 나타내는 새로운 파라미터가 정의된다.
다음의 병렬 처리 가능한 가지로 처리가 이행할 때에, 엔트로피 부호화를 위한 부호화 테이블이 리셋된다. 또는, 복수의 병렬 처리 가능한 가지에 대하여 상이한 부호화 테이블이 이용된다.
예를 들면, 인접 노드의 정보 등, 상이한 병렬 처리 가능한 가지에 포함되는 노드의 참조가 금지된다.
병렬 처리에 관한 복수의 모드가 정의된다. 예를 들면, 모드 0은, 병렬 처리를 행하지 않는 모드이다. 모드 1은, 위치 정보(구조 정보)를 병렬 처리하는 모드이다. 이 모드에서는, 속성 정보에 대해서는, 다른 병렬 처리 가능한 가지를 참조하는 것이 허가된다. 제2 모드는, 위치 정보 및 속성 정보를 병렬 처리하는 모드이다. 즉, 위치 정보 및 속성 정보의 양쪽 모두에 대하여, 다른 병렬 처리 가능한 가지를 참조하는 것이 금지된다.
각 병렬 처리 가능한 가지의 데이터의 개시 어드레스는, 예를 들면 슬라이스 헤더 등의 헤더 내에 부호화된다.
삼차원 데이터 복호 장치는, 모든 병렬 처리 가능한 가지를 병렬 처리해도 되고, 복수의 병렬 처리 가능한 가지의 일부를 병렬 처리해도 된다.
이상과 같이, 본 실시 형태에 따른 삼차원 데이터 부호화 장치는, 도 108에 나타내는 처리를 행한다. 우선, 삼차원 데이터 부호화 장치는, 삼차원 데이터에 포함되는 복수의 삼차원점의 N(N은 2 이상의 정수)진 트리 구조를 제1 가지(제1 서브 삼차원점군)와 제2 가지(제2 서브 삼차원점군)로 분리한다(S2631). 다음에, 삼차원 데이터 부호화 장치는, 제1 가지와 제2 가지의 각각을 독립적으로 복호 가능하도록 부호화한다(S2632). 바꾸어 말하면, 삼차원 데이터 부호화 장치는, 제1 가지와 제2 가지를 의존 관계가 없도록 부호화한다. 예를 들면, 삼차원 데이터 부호화 장치는, 제1 가지와 제2 가지를 병렬 부호화한다.
예를 들면, 상기 제1 가지의 루트는, 상기 N진 트리 구조에 있어서의 제1 층에 포함되는 제1 노드이고, 상기 제2 가지의 루트는, 상기 제1 층에 포함되는 상기 제1 노드와는 상이한 제2 노드이다. 즉, 제1 가지의 루트와 제2 가지의 루트는 동일한 층에 속한다.
예를 들면, 삼차원 데이터 부호화 장치는, 상기 제1 층을 나타내는 정보(병렬 개시 레이어 정보)를 부호화한다. 즉, 삼차원 데이터 부호화 장치는, 상기 제1 층을 나타내는 정보(병렬 개시 레이어 정보)를 포함하는 비트 스트림을 생성한다.
예를 들면, 삼차원 데이터 부호화 장치는, 상기 제1 가지와 상기 제2 가지를 상이한 부호화 테이블을 이용하여 엔트로피 부호화한다.
예를 들면, 삼차원 데이터 부호화 장치는, 상기 제1 가지를 엔트로피 부호화한 후, 상기 제2 가지를 엔트로피 부호화하기 전에 부호화 테이블을 초기화한다.
예를 들면, 삼차원 데이터 부호화 장치는, 상기 제1 가지의 부호화에 있어서, 상기 제2 가지의 참조를 금지하고, 상기 제2 가지의 부호화에 있어서, 상기 제1 가지의 참조를 금지한다.
예를 들면, 삼차원 데이터 부호화 장치는, 상기 제1 가지에 포함되는 복수의 제1 삼차원점의 위치 정보와, 상기 제2 가지에 포함되는 복수의 제2 삼차원점의 위치 정보의 각각을 독립적으로 복호 가능하도록 부호화하고, 상기 복수의 제1 삼차원점의 속성 정보와, 상기 복수의 제2 삼차원점의 속성 정보의 각각을 독립적으로 복호 가능하도록 부호화한다. 즉, 삼차원 데이터 부호화 장치는, 위치 정보와 속성 정보의 양쪽 모두에 대하여 의존 관계가 없도록 부호화를 행한다.
예를 들면, 삼차원 데이터 부호화 장치는, (1) 상기 제1 가지에 포함되는 복수의 제1 삼차원점의 위치 정보와, 상기 제2 가지에 포함되는 복수의 제2 삼차원점의 위치 정보의 각각, 및, (2) 상기 복수의 제1 삼차원점의 속성 정보와, 상기 복수의 제2 삼차원점의 속성 정보의 각각 중 한쪽을 독립적으로 복호 가능하도록 부호화하고, (1) 상기 복수의 제1 삼차원점의 위치 정보와, 상기 복수의 제2 삼차원점의 위치 정보의 각각, 및, (2) 상기 복수의 제1 삼차원점의 속성 정보와, 상기 복수의 제2 삼차원점의 속성 정보의 각각 중 다른쪽을 의존 관계가 있도록 부호화한다. 즉, 삼차원 데이터 부호화 장치는, 위치 정보와 속성 정보 중 한쪽에 대하여 의존 관계가 없도록 부호화를 행하고, 위치 정보와 속성 정보 중 다른쪽에 대하여 의존 관계가 있도록 부호화를 행한다. 또한, 의존 관계가 있다는 것은, 예를 들면, 상기 제1 가지와 상기 제2 가지를 동일한 부호화 테이블을 이용하여 엔트로피 부호화하거나, 또는, 상기 제1 가지를 엔트로피 부호화한 후, 상기 제2 가지를 엔트로피 부호화하기 전에 부호화 테이블을 초기화하지 않거나, 또는, 상기 제1 가지의 부호화에 있어서, 상기 제2 가지의 참조를 허가하거나, 또는, 상기 제2 가지의 부호화에 있어서, 상기 제1 가지의 참조를 허가하는 것이다.
예를 들면, 삼차원 데이터 부호화 장치는, 상기 제1 가지와 상기 제2 가지의 각각을 독립적으로 복호 가능하도록 부호화했는지의 여부를 나타내는 플래그를 부호화한다. 즉, 삼차원 데이터 부호화 장치는, 상기 제1 가지와 상기 제2 가지의 각각을 독립적으로 복호 가능하도록 부호화했는지의 여부를 나타내는 플래그를 포함하는 비트 스트림을 생성한다.
예를 들면, 삼차원 데이터 부호화 장치는, 프로세서와 메모리를 구비하고, 프로세서는, 메모리를 이용하여, 상기의 처리를 행한다.
또한, 본 실시 형태에 따른 삼차원 데이터 복호 장치는, 도 109에 나타내는 처리를 행한다. 우선, 삼차원 데이터 복호 장치는, 삼차원 데이터에 포함되는 복수의 삼차원점의 N(N은 2 이상의 정수)진 트리 구조에 포함되는 제1 가지와 제2 가지의 각각이 독립적으로 복호 가능하도록 부호화됨으로써 생성된 제1 부호화 데이터와 제2 부호화 데이터를 취득한다(S2641). 예를 들면, 삼차원 데이터 복호 장치는, 제1 부호화 데이터와 제2 부호화 데이터를 비트 스트림으로부터 취득한다. 다음에, 삼차원 데이터 복호 장치는, 상기 제1 부호화 데이터와 상기 제2 부호화 데이터의 각각을 복호함으로써 상기 제1 가지와 상기 제2 가지를 복원한다(S2642). 예를 들면, 삼차원 데이터 복호 장치는, 제1 부호화 데이터와 제2 부호화 데이터를 병렬 복호한다.
예를 들면, 상기 제1 가지의 루트는, 상기 N진 트리 구조에 있어서의 제1 층에 포함되는 제1 노드이고, 상기 제2 가지의 루트는, 상기 제1 층에 포함되는 상기 제1 노드와는 상이한 제2 노드이다. 즉, 제1 가지의 루트와 제2 가지의 루트는 동일한 층에 속한다.
예를 들면, 삼차원 데이터 복호 장치는, 상기 제1 층을 나타내는 정보(병렬 개시 레이어 정보)를 복호한다. 즉, 삼차원 데이터 복호 장치는, 상기 제1 층을 나타내는 정보(병렬 개시 레이어 정보)를 비트 스트림으로부터 취득한다.
예를 들면, 삼차원 데이터 복호 장치는, 상기 제1 가지와 상기 제2 가지를 상이한 부호 테이블을 이용하여 엔트로피 복호한다.
예를 들면, 삼차원 데이터 복호 장치는, 상기 제1 가지를 엔트로피 복호한 후, 상기 제2 가지를 엔트로피 복호하기 전에 부호화 테이블을 초기화한다.
예를 들면, 삼차원 데이터 복호 장치는, 상기 제1 가지의 복호에 있어서, 상기 제2 가지를 참조하지 않고, 상기 제2 가지의 복호에 있어서, 상기 제1 가지를 참조하지 않는다.
예를 들면, 상기 제1 부호화 데이터는, 상기 제1 가지에 포함되는 복수의 제1 삼차원점의 위치 정보가 부호화됨으로써 생성된 제1 부호화 위치 데이터와, 상기 복수의 제1 삼차원점의 속성 정보가 부호화됨으로써 생성된 제1 부호화 속성 데이터를 포함한다. 상기 제2 부호화 데이터는, 상기 제2 가지에 포함되는 복수의 제2 삼차원점의 위치 정보가 부호화됨으로써 생성된 제2 부호화 위치 데이터와, 상기 복수의 제2 삼차원점의 속성 정보가 부호화됨으로써 생성된 제2 부호화 속성 데이터를 포함한다. 상기 제1 부호화 위치 데이터와 상기 제2 부호화 위치 데이터는, 독립적으로 복호 가능하도록 생성되어 있고, 상기 제1 부호화 속성 데이터와 상기 제2 부호화 속성 데이터는, 독립적으로 복호 가능하도록 생성되어 있다. 즉, 삼차원 데이터 부호화 장치는, 위치 정보와 속성 정보의 양쪽 모두에 대하여 의존 관계가 없도록 부호화를 행함으로써, 제1 부호화 데이터와 제2 부호화 데이터를 생성한다.
예를 들면, 상기 제1 부호화 데이터 및 상기 제2 부호화 데이터는, 상기 제1 가지에 포함되는 복수의 제1 삼차원점 및 상기 제2 가지에 포함되는 복수의 제2 삼차원점의 위치 정보 및 속성 정보 중 한쪽의 각각이 독립적으로 복호 가능하도록 부호화됨으로써 생성된다. 삼차원 데이터 복호 장치는, 상기 제1 부호화 데이터와 상기 제2 부호화 데이터의 각각을 복호함으로써 상기 복수의 제1 삼차원점 및 상기 복수의 제2 삼차원점의 상기 위치 정보 및 상기 속성 정보 중 상기 한쪽의 각각을 복원한다. 삼차원 데이터 복호 장치는, 또한, 상기 복수의 제1 삼차원점 및 상기 복수의 제2 삼차원점의 상기 위치 정보 및 상기 속성 정보 중 다른쪽의 각각이 의존 관계가 있도록 부호화됨으로써 생성된 제3 부호화 데이터 및 제4 부호화 데이터를 취득한다. 삼차원 데이터 복호 장치는, 상기 제3 부호화 데이터와 상기 제 4 부호화 데이터의 각각을 복호함으로써 상기 복수의 제1 삼차원점 및 상기 복수의 제2 삼차원점의 상기 위치 정보 및 상기 속성 정보 중 상기 다른쪽의 각각을 복원한다. 즉, 삼차원 데이터 부호화 장치는, 위치 정보와 속성 정보 중 한쪽에 대하여 의존 관계가 없도록 부호화를 행하고, 위치 정보와 속성 정보 중 다른쪽에 대하여 의존 관계가 있도록 부호화를 행한다. 예를 들면, 삼차원 데이터 복호 장치는, 2개의 부호화 데이터에 의존 관계가 있는 경우에는, 2개의 부호화 데이터를 동일한 부호화 테이블을 이용하여 엔트로피 복호하거나, 또는, 한쪽의 부호화 데이터를 엔트로피 복호한 후, 다른쪽의 부호화 데이터를 엔트로피 복호하기 전에 부호화 테이블을 초기화하지 않거나, 또는, 한쪽의 부호화 데이터의 복호에 있어서, 다른쪽의 부호화 데이터를 참조한다.
예를 들면, 삼차원 데이터 복호 장치는, 상기 제1 가지와 상기 제2 가지의 각각이 독립적으로 복호 가능하도록 부호화되어 있는지의 여부를 나타내는 플래그를 복호한다. 즉, 삼차원 데이터 복호 장치는, 상기 제1 가지와 상기 제2 가지의 각각이 독립적으로 복호 가능하도록 부호화되어 있는지의 여부를 나타내는 플래그를 비트 스트림으로부터 취득한다. 예를 들면, 삼차원 데이터 복호 장치는, 상기 플래그에 의해 상기 제1 가지와 상기 제2 가지의 각각이 독립적으로 복호 가능하도록 부호화되어 있는 것이 나타내어지는 경우, 상기 제1 부호화 데이터와 상기 제2 부호화 데이터를 병렬 복호하고, 상기 플래그에 의해 상기 제1 가지와 상기 제2 가지의 각각이 독립적으로 복호 가능하도록 부호화되어 있는 것이 나타내어지지 않는 경우, 상기 제1 부호화 데이터와 상기 제2 부호화 데이터를 순차 복호한다.
예를 들면, 삼차원 데이터 복호 장치는, 프로세서와 메모리를 구비하고, 프로세서는, 메모리를 이용하여, 상기의 처리를 행한다.
(실시 형태 12)
부호화된 삼차원점(포인트 클라우드)의 비트 스트림은, 데이터 사이즈가 커지기 때문에, 대용량의 스토리지 또는 캐시가 필요해진다. 또한, 당해 비트 스트림은 복잡해지고, 고성능의 하드웨어가 필요해진다. 또한, 비트 스트림이 분산됨으로써, 복수의 PCC(Point Cloud Compression) 비트 스트림이 필요해진다.
한편 이용자는, 삼차원점의 비트 스트림의 모든 정보가 항상 필요하다고는 할 수 없고, 몇 개의 PCC 비트 스트림, 또는 비트 스트림의 복수의 성분을 포함하는 결합 비트 스트림이 필요한 경우도 있다. 따라서, 삼차원점의 정보를, 효과적으로, 또한, 병렬로 취득하는 수법이 요망된다.
도 110은, GPS 좌표를 갖는 자동차가, 상면에서 본 지도 정보를 취득하기 위해서, 삼차원점의 비트 스트림에 액세스하는 경우의 동작을 모식적으로 나타내는 도면이다. 예를 들면, 도 110에 나타내는 바와 같이, 비트 스트림 A는, 차량 주변 영역의 삼차원점의 PCC 비트 스트림이고, 비트 스트림 B 및 비트 스트림 C는, 인접 영역의 삼차원점의 PCC 비트 스트림이다. 또한, 각 비트 스트림은, 블록 형식으로 상면에서 본 상태를 나타낸다.
본 실시 형태에서는, 삼차원점의 비트 스트림을 소영역으로 분할하는 수법으로서 타일 분할을 이용한다. 타일은, 삼차원점의 비트 스트림을, 이용자 기술(記述)에 의거하여, 상이한 블록 영역으로 분할한 분할 영역이다.
타일은, 루트 노드로부터의 복수의 레벨을 갖는다. 또한, 상이한 레벨을 갖는 타일은, 각각 가변의 상이한 사이즈를 가져도 된다. 또한, 복수의 타일은, 서로 독립되어 있어도 된다.
삼차원 데이터 부호화 장치는, 하나 또는 복수의 타일 레벨을 부호화하고, 삼차원 데이터 복호 장치는, 하나 또는 복수의 타일 레벨 중, 애플리케이션에 필요한 1 이상의 타일 레벨을 복호해도 된다.
도 111은, 단일의 PCC 비트 스트림을 작은 타일로 분할한 상태를 상면에서 보아 나타내는 도면이다. 도 112는, 단일의 PCC 비트 스트림을 큰 타일로 분할한 상태를 상면에서 보아 나타내는 도면이다. 도 123은, 단일의 PCC 비트 스트림을 복수 사이즈의 타일로 분할한 상태를 상면에서 보아 나타내는 도면이다.
이와 같이, 삼차원 데이터 부호화 장치는, 동일 영역을 작은 타일 분할(도 111)을 이용하여 부호화함과 더불어, 큰 타일 분할(도 112)을 이용하여 부호화해도 된다. 예를 들면, 삼차원 데이터 부호화 장치는, 삼차원 데이터 복호 장치로부터의 요망에 따라 영역마다, 작은 타일 분할의 결과를 송신할지, 큰 타일 분할의 결과를 송신할지를 전환한다. 또는, 삼차원 데이터 부호화 장치는, 양쪽의 결과를 삼차원 데이터 복호 장치에 송신하고, 삼차원 데이터 복호 장치는, 작은 타일 분할의 결과와, 큰 타일 분할의 결과 중 어느 쪽을 사용할지를 자동차 상태(예를 들면, 속도 또는 장소 등) 등에 따라 전환해도 된다.
이하, 복수의 타일 사이즈를 이용하는 복합 타일 분할에 대해서 설명한다. 삼차원 데이터 부호화 장치는, 복수 종류의 사이즈의 타일을 비트 스트림에 부호화해도 된다. 예를 들면, 도 113에 나타내는 예에 있어서, 자동차가 이동하고 있는 경우, 주변 상황은 상이한 속도로 변화한다. 예를 들면, 자동차로부터 먼 영역, 또는 전방 혹은 후방 영역의 변화는, 자동차의 측방 영역의 변화보다 느리다. 이와 같이, 변화가 느린 영역에 대하여 큰 타일 사이즈를 적용함으로써 부호화 효율을 향상시킬 수 있다.
도 114는, 4진 트리에 있어서의 타일 분할의 예를 나타내는 도면이다. 도 114에 나타내는 예에서는, 일부의 타일은 층 2의 레벨이고, 다른 일부의 타일은 층 3의 레벨이다.
또한, 상기에서는, 이차원(상면에서 본)의 타일 분할에 대해서 설명했으나, 삼차원의 타일 분할에도 동일한 수법을 적용할 수 있다. 도 115는, 삼차원의 타일 분할의 예를 나타내는 도면이다. 또한, 도 115에서는, 설명의 간략화를 위해 일부의 타일만을 도시하고 있다.
자동차의 진행 방향인, 자동차의 전방 먼 곳의 타일은, 읽어들임이 필요해질 가능성이 높기 때문에, 큰 사이즈로 설정되어 있다. 자동차의 측방의 타일은, 자동차가 당해 방향으로 진행할 가능성이 낮기 때문에 작은 사이즈로 설정되어 있다.
또한, 도 111 및 도 112에 나타낸 예와 마찬가지로, 삼차원의 경우에도 고정 사이즈의 타일이 이용되어도 된다.
또한, 지도 상의 같은 영역에 대하여, 큰 사이즈의 타일을 이용하여 생성된 부호화 데이터와, 작은 사이즈의 타일을 이용하여 생성된 부호화 데이터가, 서버 또는 외부 기억 장치에 저장되어도 된다. 자동차가 그 영역으로 이동한 경우, 어쨌든 그 영역의 데이터가 필요해지기 때문에, 큰 타일의 데이터가 자동차에 송신된다. 또한, 자동차의 진행 방향이 아닌 방향의 영역에서는, 자동차는 그 영역의 일부의 데이터만을 필요로 하므로, 작은 타일의 데이터가 자동차에 송신된다.
또한, 타일을 이용함으로써 공간적인 랜덤 액세스성을 향상시킬 수 있다. 삼차원 데이터 복호 장치(예를 들면 자동차에 탑재됨)는, 읽어들인(로드한) 타일을, 그 부호화 방식에 따라 병렬로 복호할 수 있다. 또한, 삼차원 데이터 복호 장치는, 이동 중에 필요해지는 메모리의 사이즈(예를 들면 3×3 타일)를 일정하게 제어할 수 있다.
도 116은, 자동차의 이동시에 있어서 읽어들여지는 타일의 예를 나타내는 도면이다. 도 116에 나타내는 바와 같이, 자동차가 x방향으로 이동하고 있는 경우에는, 자동차는, 진행 방향(x방향)의 3개의 타일의 데이터를 새롭게 메모리에 읽어들이고(로드하고), 진행 방향과는 반대 방향(-x방향)의 3개의 타일의 데이터를 메모리로부터 삭제한다.
또한, 삼차원 데이터 복호 장치는, 읽어들인 타일을 병렬로 복호해도 된다. 또한, 삼차원 데이터 복호 장치는, 읽어들인 타일에 우선 순위를 결정하고, 우선 순위의 순서대로 타일을 복호해도 된다. 예를 들면, 삼차원 데이터 복호 장치는, 자동차의 진행 방향에 가까운 영역의 타일(예를 들면 도 116에 나타내는 타일 A)을 우선적으로 복호해도 된다.
마찬가지로, 자동차가 -y방향으로 이동하고 있는 경우에는, 자동차는, 진행 방향(-y방향)의 3개의 타일의 데이터를 새롭게 메모리에 읽어들이고(로드하고), 진행 방향과는 반대 방향(y방향)의 3개의 타일의 데이터를 메모리로부터 삭제한다.
또한, 자동차가 대각선 방향(동 도면의 우측 상부 방향)으로 이동하고 있는 경우에는, 자동차는, 진행 방향의 5개의 타일의 데이터를 새롭게 메모리에 읽어들이고(로드하고), 진행 방향과는 반대 방향의 5개의 타일의 데이터를 메모리로부터 삭제한다.
이와 같이, 메모리에는 항상 3×3 타일의 데이터가 보존되므로, 메모리 사이즈를 3×3 타일의 데이터를 제한할 수 있다.
도 117은, 본 실시 형태에 따른 시스템의 구성예를 나타내는 도면이다. 당해 시스템은, 서버 또는 외부 기억 장치(삼차원 데이터 부호화 장치)와, 자동차 등에 탑재되는 차재 컴퓨터(삼차원 데이터 복호 장치)를 포함한다.
서버 또는 외부 기억 장치는, 모든 삼차원 맵을 저장하고 있다. 차재 컴퓨터로부터의 요구에 의해, 원하는 타일이, 차재 컴퓨터가 구비하는 메모리에 읽혀지고, 복호된다. 예를 들면, 차재 컴퓨터는, 자동차의 현재 위치에 따른 영역의 타일을 서버 또는 외부 기억 장치에 요구한다.
다음에, 타일의 사용예에 대해서 설명한다. 도 118 및 도 119는, 자동차에 취득되는 타일의 영역의 예를 나타내는 도면이다. 예를 들면, 자동차가 고속 도로를 주행하고 있는 경우, 이동 속도가 빠르므로, 전방의 정보를 재빠르게 복호할 필요가 있다. 따라서, 보다 적은 데이터량으로, 필요한 정보를 취득하는 것이 요망된다. 이 때문에, 예를 들면, 자동차는, 영역 A의 타일을 취득한다.
한편, 자동차가 시가지를 주행하고 있는 경우, 운전자가 주변 상황을 보다 더 취득할 수 있도록, 자동차는 영역 A 및 영역 B의 양쪽 모두의 정보를 취득한다. 또한, 자동차가 오프로드 또는 운전자가 익숙하지 않은 길을 주행하고 있는 경우, 자동차는, 보다 많은 데이터를 취득하기 위해서, 예를 들면 8×8 타일 등의 보다 넓은 범위의 데이터를 취득해도 된다.
또한, 다른 예로서, 복호 처리의 처리 부하가 너무 많아지지 않도록, 자동차의 이동 속도에 따라 복호하는 타일이 선택되어도 된다. 예를 들면, 자동차가 고속 도로를 고속으로 주행하고 있는 경우, 전방의 정보를 재빠르게 갱신할 필요가 있다. 한편, 자동차의 측방 영역의 중요성은 낮다. 따라서, 자동차는, 전방의 직사각형 영역의 타일을 선택하고, 복호한다. 한편, 자동차가 저속으로 주행하고 있는 경우, 전방의 필요한 타일은 적어진다. 따라서, 전방의 타일이 취득되는 영역은 고속 주행시보다 좁아진다. 또한, 자동차가 교차로 등에서 정지해 있는 경우, 주변의 모든 방향의 타일이 동일하게 중요하다. 따라서, 자동차는, 모든 방향의 타일을 취득한다.
또한, 도 115를 이용하여 설명한 바와 같이, 영역 A 및 영역 B의 타일의 크기를, 자동차의 진행 방향 및 속도에 따라 변경해도 된다.
다음에, 슬라이스에 대해서 설명한다. 복수의 타일은, 삼차원 공간 내의 의미 정보로서 이용하기 위해 슬라이스로 분류된다. 슬라이스는, 삼차원 공간 내의 의미 정보(속성 정보)에 따라 타일이 분류된 그룹이다. 즉, 각 타일은, 복수의 슬라이스 중 어느 하나에 속한다. 타일이 속하는 슬라이스의 정보는, 삼차원점의 부호화 비트 스트림의 헤더 또는 서브 헤더에 부호화된다.
예를 들면, 주행중의 자동차에서는, 목적지까지의 경로는 거의 정해져 있기 때문에, 지도 상의 몇 개의 도로는 사용되지 않는다. 따라서, 이들 도로를 무시할 수 있다. 또한, 나무들의 외관은 나날이 변화한다. 따라서, 건축물 및 도로와 비교하여, 나무들의 중요성은 낮다.
도 120은, 삼차원 데이터(삼차원점)의 일례를 나타내는 도면이다. 도 121~도 123은, 도 120에 나타내는 삼차원 데이터를 분할한 3개의 슬라이스의 데이터의 예를 나타내는 도면이다. 도 121에 나타내는 슬라이스는, 고속 도로의 삼차원 데이터를 포함한다. 도 122에 나타내는 슬라이스는, 나무들의 삼차원 데이터를 포함한다. 도 123에 나타내는 슬라이스는 샛길의 삼차원 데이터를 포함한다.
또한, 슬라이스의 분할 방법으로서, 타일 또는 타일 내에 포함되는 점군의 특성(색, 반사율, 법선 벡터, 또는 관련된 오브젝트) 등을 이용하는 것을 생각할 수 있다. 또한, 차재의 자기 위치 추정에 사용하는 점군을 포함하는 타일을 슬라이스 A로 분류하고, 내비게이션 화면에 표시하는 점군을 포함하는 타일을 슬라이스 B로 분류하는 등, 타겟으로 하는 애플리케이션마다 슬라이스를 설정해도 된다. 또한, 삼차원 지도에 있어서의 용도로 슬라이스를 설정하는 경우는, 점군 또는 타일이 속하는 지역 정보(일본에서는 도도부현(都道府縣) 또는 시정촌(市町村) 등)를 기초로 슬라이스를 설정해도 된다.
다음에, 8진 트리에 있어서의 타일의 예에 대해서 설명한다. 도 124는, 타일의 예를 나타내는 도면이다. 도 125는, 8진 트리에 있어서의 타일의 예를 나타내는 도면이다.
예를 들면, 각 타일 및 각 슬라이스는, 독립적으로 부호화되고, 독립적으로 복호 가능하다. 부호화 및 복호에 있어서, 각 타일 및 각 슬라이스는, 전체의 8진 트리에 관련된 서브 8진 트리를 포함한다. 예를 들면, 삼차원 데이터 부호화 장치 및 삼차원 데이터 복호 장치는, 타일마다, 부호화 테이블을 초기화한다.
또한, 복호된 타일 또는 슬라이스는, 다른 타일 또는 슬라이스의 복호를 기다리지 않고 즉시 애플리케이션에 사용되어도 된다.
또한, 타일 또는 슬라이스의 데이터는, 비트 스트림 내에 있어서, 소정의 순서로 배치된다. 예를 들면, 이 순서에 의해, 애플리케이션에 있어서의 데이터의 우선도가 나타내어진다.
예를 들면, 도 125에 나타내는 바와 같이, 타일 A와 타일 B가 각각 엔트로피 부호화되고, 생성된 타일 A의 비트 스트림과 타일 B의 비트 스트림이, 전체 비트 스트림에 포함된다.
이하, 본 실시 형태에 따른 비트 스트림의 구성예를 설명한다. 도 126은, 복수의 타일이 엔트로피 부호화됨으로써 얻어지는 비트 스트림의 예를 나타내는 도면이다. 도 126에 나타내는 바와 같이, 비트 스트림은, 복수의 타일의 공통의 헤더 정보(제1 헤더)인 공통 헤더(2801)와, 타일 테이블(2802)과, 부호화 데이터(2803)를 포함한다.
공통 헤더(2801)는, 전체 헤더(2804)와, 고정 사이즈 플래그(2805)와, 타일 수 정보(2806)를 포함한다. 전체 헤더(2804)는, 트리 구조 전체의 헤더이며, 전체 트리 구조의 위치를 나타내는 위치 정보(2807)를 포함한다. 즉, 위치 정보(2807)는, 전체 트리 구조의 위치, 또는, 당해 트리 구조에 대응하는 삼차원 공간(바운딩 박스)의 위치를 특정하는 정보이다. 예를 들면, 위치 정보(2807)는, 전체 트리 구조 내의 임의의 노드, 또는, 당해 트리 구조에 대응하는 삼차원 공간에 포함되는 임의의 점의 위치(예를 들면 좌표)를 나타낸다. 예를 들면, 위치 정보(2807)는, 트리 구조의 루트의 위치를 나타낸다. 예를 들면, 위치 정보(2807)는, 세계 좌표(world coordinate)를 기점으로 한 트리 구조의 루트의 좌표를 나타내도 된다. 또한, 전체 헤더는, 전체 트리 구조에 포함되는 삼차원점의 수를 나타내는 정보 등을 포함해도 된다.
고정 사이즈 플래그(2805)는, 타일의 사이즈를 고정할지의 여부를 나타내는 플래그이다. 즉, 고정 사이즈 플래그(2805)는, 복수의 타일의 사이즈를 동일하게 할지의 여부를 나타낸다. 예를 들면, 고정 사이즈 플래그=0은, 타일의 사이즈를 고정하지 않는 것을 나타내고, 고정 사이즈 플래그=1은, 타일의 사이즈를 고정하는 것을 나타낸다.
타일 수 정보(2806)는, 타일의 수를 나타내는 정보이며, 타일 테이블(2802)을 해석하기 위해 이용된다. 또한, 타일 수 정보(2806)는, 타일 테이블(2802)에 포함되어도 된다. 타일 테이블(2802)은, 복수의 타일의 정보를 포함한다.
부호화 데이터(2803)는, 각 타일의 부호화 데이터를 포함한다. 각 타일의 부호화 데이터는, 예를 들면, 독립되어 있다.
도 127은, 고정 사이즈 플래그=0(고정하지 않음)의 경우의, 타일 테이블(2802)의 구성예를 나타내는 도면이다. 타일 테이블(2802)은, 타일 단위의 헤더 정보(제2 헤더)인 타일 정보(2811)를 포함한다. 즉, 복수의 타일 정보(2811)는, 복수의 타일에 일대일로 대응한다.
타일 정보(2811)는, 타일 위치 정보(2812)와, 타일 사이즈 정보(2813)와, 부호량 정보(2814)를 포함한다. 타일 위치 정보(2812)는, 타일의 위치를 나타낸다. 예를 들면, 타일 위치 정보(2812)는, 타일의 루트의 위치를 나타낸다. 예를 들면, 타일 위치 정보(2812)는, 세계 좌표(world coordinate)를 기점으로 한 좌표를 나타내도 된다. 또한, 이 경우, 삼차원 데이터 복호 장치는, 복호한 삼차원점의 좌표를 그대로 사용할 수 있으므로, 처리량을 저감할 수 있다. 또는, 타일 위치 정보(2812)는, 위치 정보(2807)로 나타내어지는 전체 트리 구조의 위치(좌표)와, 타일의 위치(좌표)의 차분을 나타내도 된다.
타일 사이즈 정보(2813)는, 타일의 사이즈를 나타낸다. 또한, 타일의 사이즈는, 예를 들면, x, y, z의 각각의 방향의 사이즈에 의해 나타내어져도 되고, x, y, z의 사이즈는 동일하다는 전제하에, 한 변의 사이즈가 나타내어져도 된다. 또한, 타일의 사이즈는 상술한 바와 같이 트리 구조에 있어서의 계층(레벨)에 대응한다. 따라서, 타일의 사이즈는 계층(레벨)으로 나타내어져도 된다.
부호량 정보(2814)는, 대응하는 타일의 부호화 데이터의 부호량(비트 사이즈)을 나타낸다.
또한, 삼차원 데이터 복호 장치는, 비트 스트림 내의 각 타일의 부호화 데이터의 개시 위치(start bit)를, 타일 테이블(2802) 내에 포함되는 각 타일의 부호량 정보(2814)를 참조함으로써 산출해도 된다. 예를 들면, 삼차원 데이터 복호 장치는, 도 126에 나타내는 타일 C의 개시 위치를, 타일 A의 부호량과 타일 B의 부호량을 가산함으로써 산출한다. 또한, 각 타일의 부호화 데이터의 비트 스트림 내에 있어서의 개시 위치가, 타일 테이블(2802)에 저장되어도 된다. 이에 의해, 삼차원 데이터 복호 장치는, 타일 테이블(2802)을 참조함으로써 비트 스트림 내의 각 타일의 부호화 데이터의 개시 위치를 알 수 있으므로, 필요한 타일의 부호화 데이터를 취득하여, 복호를 빨리 개시할 수 있다. 또한, 부호량 정보(2814)는, 비트 스트림 내에 있어서의 당해 부호화 데이터의 종료 위치를 나타내도 된다.
도 128은, 고정 사이즈 플래그=0(고정하지 않음)의 경우의, 타일 테이블(2802)의 다른 구성예를 나타내는 도면이다. 도 128에 나타내는 타일 정보(2811)는, 도 127에 나타내는 타일 정보(2811)에 더하여, 슬라이스 정보(2815)를 포함한다. 슬라이스 정보(2815)는, 당해 타일에 관련된 슬라이스의 정보(의미 정보)를 나타낸다. 즉, 슬라이스 정보(2815)는, 당해 타일이 속하는 슬라이스를 나타낸다. 이 정보는, 사용하는 애플리케이션에 의존하는데, 예를 들면, 색, 대상물의 속성, 차량까지의 거리, 삼차원점의 밀도 등을 나타낸다.
도 129는, 고정 사이즈 플래그=1(고정함)의 경우의, 타일 테이블(2802)의 구성예를 나타내는 도면이다. 이 경우, 타일 사이즈 정보(2813)는, 각 타일의 타일 정보(2811) 내가 아니라, 복수의 타일에 공통인 정보로서 타일 테이블(2802)에 포함된다. 즉, 타일 사이즈 정보(2813)는, 복수의 타일에 공통인 제1 헤더에 포함된다.
또한, 도 130은, 고정 사이즈 플래그=1(고정함)의 경우의, 타일 테이블(2802)의 다른 구성예를 나타내는 도면이다. 도 128에 나타내는 예와 동일하게, 타일 정보(2811)는, 슬라이스 정보(2815)를 포함해도 된다.
이하, 삼차원 데이터 복호 장치에서의 동작을 설명한다. 삼차원 데이터 복호 장치를 포함하는 자동차가 지도 서버와 접속되었을 때, 이하의 동작이 행해진다. 삼차원 데이터 복호 장치를 포함하는 자동차는, 현재의 자동차의 대략적인 위치 및 애플리케이션의 요구에 따라, 지도 서버에 타일의 송신 요구를 송신한다. 지도 서버는, 타일 테이블을 참조하여, 요구에 맞는 타일을 선택하고, 선택한 타일의 부호화 데이터를 포함하는 새로운 비트 스트림을 생성하고, 당해 비트 스트림을 자동차에 송신한다. 자동차는, 수신한 비트 스트림에 포함되는 타일 테이블을 참조하여, 각 타일의 정보를 취득한다. 자동차는, 당해 정보로 나타내어지는 각 타일의 루트의 삼차원 위치를 이용하여, 복수의 타일의 비트 스트림을 복호함으로써 삼차원점을 복원한다.
또한, 자동차는 오프 라인이고, 지도 서버 대신에 외부 기억 장치가 이용되어도 된다. 이 경우, 이하의 동작이 행해진다. 자동차는, 현재 자동차의 대략적인 위치 및 애플리케이션의 요구에 따라, 로컬의 타일 테이블로부터 최적의 타일을 판정한다. 자동차는, 비트 스트림에 포함되는 타일 테이블을 참조하여, 각 타일의 정보를 취득한다. 자동차는, 당해 정보로 나타내어지는 각 타일의 루트의 삼차원 위치를 이용하여, 복수의 타일의 비트 스트림을 복호함으로써 삼차원점을 복원한다.
또한, 삼차원 데이터 부호화 장치는, 슬라이스 정보(2815)에, 슬라이스의 식별 번호(slice_id)를 저장해도 된다. 이에 의해, 삼차원 데이터 복호 장치는, 필요한 slice_id를 갖는 타일의 정보를 타일 테이블(2802)로부터 취득할 수 있으므로, 필요한 slice_id를 갖는 타일을 복호하는 등의 처리를 행할 수 있다.
삼차원 데이터 부호화 장치는, 공통 헤더(2801)(또는 전체 헤더(2804))와, 타일 테이블(2802)과, 각 타일의 부호화 데이터(2803)를, 별개의 NAL(Network Abstraction Layer) Unit으로서 부호화해도 된다. 즉, 삼차원 데이터 부호화 장치는, 복수의 타일의 복수의 제2 헤더를 포함하는 스트림을, 복수의 타일의 부호화 데이터와는 독립된 스트림으로서 생성해도 된다. 이에 의해, 예를 들면, 서버(삼차원 데이터 부호화 장치)는, 먼저 타일 테이블(2802)의 NAL unit을 클라이언트(삼차원 데이터 복호 장치)에 송신한다. 클라이언트는 타일 테이블(2802)을 복호하여 필요한 타일을 결정하고, 서버에 필요한 타일의 송신 요구를 행한다. 서버는, 클라이언트의 요구에 따라, 요구된 타일의 NAL unit을 클라이언트에 송신한다.
타일 위치 정보(2812)는, 어느 세계 좌표(world coordinate)를 기점으로 한 좌표를 나타내도 된다. 이에 의해, 삼차원 데이터 부호화 장치는, 각 타일에 포함되는 점군이 세계 좌표를 기점으로 한, 어느 위치의 삼차원 정보인지를 빨리 알 수 있다. 또한, 타일 위치 정보(2812)는, 전체 헤더(2804)에 포함되는 위치 정보(2807)로 나타내어지는 좌표로부터의 상대 좌표를 나타내도 된다. 이 경우, 삼차원 데이터 복호 장치는, 각 타일의 세계 좌표를 기점으로 한 좌표를, 위치 정보(2807)로 나타내어지는 좌표에, 타일 위치 정보(2812)로 나타내어지는 상대 좌표를 가산함으로써 산출해도 된다. 이에 의해, 타일 위치 정보(2812)의 값의 크기를 억제할 수 있으므로, 타일 테이블(2802)의 사이즈를 삭감할 수 있다.
이하, 삼차원 데이터 부호화 장치의 동작 및 삼차원 데이터 복호 장치의 동작을 설명한다. 도 131은, 본 실시 형태에 따른 삼차원 데이터 부호화 장치에 의한 삼차원 데이터 부호화 처리의 플로차트이다.
우선, 삼차원 데이터 부호화 장치는, 입력된 삼차원점을 포함하는 바운딩 박스를 설정한다(S2801). 다음에, 삼차원 데이터 부호화 장치는, 당해 바운딩 박스를 8개의 자식 노드로 분할한다(S2802).
다음에, 삼차원 데이터 부호화 장치는, 8개의 자식 노드 중 삼차원점이 포함되는 자식 노드의 각각의 어큐펀시 부호를 생성한다(S2803). 다음에, 삼차원 데이터 부호화 장치는, 처리 대상의 노드의 레벨(트리 구조의 계층)이, 대상 타일 레벨에 도달했는지의 여부를 판정한다(S2804). 여기서 대상 타일 레벨이란, 타일 분할을 행하는 레벨(트리 구조의 계층)이다.
처리 대상의 노드의 레벨이 대상 타일 레벨에 도달하지 않은 경우(S2804에서 No), 삼차원 데이터 부호화 장치는, 각 자식 노드를 8개의 손자 노드로 분할하고(S2805), 손자 노드의 각각에 대하여 단계 S2803 이후의 처리를 행한다.
처리 대상의 노드의 레벨이 대상 타일 레벨에 도달한 경우(S2804에서 Yes), 삼차원 데이터 부호화 장치는, 타일 테이블에 현재의 노드 위치 및 타일 레벨(타일 사이즈)을 보존한다(S2806).
다음에, 삼차원 데이터 부호화 장치는, 각 자식 노드를 8개의 손자 노드로 분할한다(S2807). 다음에, 삼차원 데이터 부호화 장치는, 어큐펀시 부호를 생성하는 처리를, 노드가 분할할 수 없게 될 때까지 반복한다(S2808). 다음에, 삼차원 데이터 부호화 장치는, 각 타일의 어큐펀시 부호를 부호화한다(S2809).
마지막으로, 삼차원 데이터 부호화 장치는, 생성한 복수의 타일의 부호화 비트 스트림(부호화 데이터)을 결합한다(S2810). 또한, 삼차원 데이터 부호화 장치는, 타일 테이블 등을 비트 스트림의 헤더 정보에 부가한다.
여기서, 타일 테이블(2802)에, 타일 사이즈(타일 레벨)가 저장된다. 따라서, 삼차원 데이터 복호 장치는, 이 타일 사이즈를 이용하여, 각 타일의 서브 트리의 바운딩 박스의 사이즈를 취득할 수 있다. 또한, 삼차원 데이터 복호 장치는, 서브 트리의 바운딩 박스의 사이즈를 이용하여, 전체 트리 구조의 바운딩 박스의 사이즈를 산출할 수 있다.
또한, 삼차원 데이터 부호화 장치는, 각 타일의 바운딩 박스의 사이즈를 타일 테이블(2802)에 저장해도 된다. 이에 의해, 삼차원 데이터 복호 장치는, 타일 테이블(2802)을 참조함으로써 각 타일의 바운딩 박스의 사이즈를 취득할 수 있다.
도 132는, 본 실시 형태에 따른 삼차원 데이터 복호 장치에 의한 삼차원 데이터 복호 처리의 플로차트이다.
우선, 삼차원 데이터 복호 장치는, 비트 스트림에 포함되는 헤더 정보를 이용하여, 출력하는 삼차원점을 포함하는 바운딩 박스를 설정한다(S2821). 다음에, 삼차원 데이터 복호 장치는, 비트 스트림에 포함되는 헤더 정보를 이용하여 각 타일(서브 트리)의 루트 위치를 설정한다(S2822).
다음에, 삼차원 데이터 복호 장치는, 당해 바운딩 박스를 8개의 자식 노드로 분할한다(S2823). 다음에, 삼차원 데이터 복호 장치는, 각 노드의 어큐펀시 부호를 복호하고, 복호한 어큐펀시 부호에 의거하여 노드를 8개의 자식 노드로 분할한다. 또한, 삼차원 데이터 복호 장치는, 이 처리를, 각 타일(서브 트리)의 노드가 분할할 수 없게 될 때까지 반복한다(S2824).
마지막으로, 삼차원 데이터 복호 장치는, 복호한 복수의 타일의 삼차원점을 결합한다(S2825).
도 133은, 본 실시 형태에 따른 삼차원 데이터 부호화 장치(2820)의 구성을 나타내는 블럭도이다. 삼차원 데이터 부호화 장치(2820)는, 8진 트리 생성부(2821), 타일 분할부(2822), 복수의 엔트로피 부호화부(2823), 비트 스트림 생성부(2824)를 구비한다.
대상 타일 레벨이 삼차원 데이터 부호화 장치(2820)에 입력된다. 삼차원 데이터 부호화 장치(2820)는, 당해 대상 타일 레벨에 처리가 도달한 후, 각 타일의 어큐펀시 부호화를 저장하고, 복수의 타일의 어큐펀시 부호를 개별적으로 부호화함으로써 각 타일의 부호 데이터를 생성한다.
8진 트리 생성부(2821)는, 바운딩 박스를 설정하고, 바운딩 박스를 8개의 자식 노드로 분할한다. 또한, 8진 트리 생성부(2821)는, 이 분할 처리를, 처리가 대상 타일 레벨에 도달할 때까지 반복한다.
타일 분할부(2822)는, 타일을 설정한다. 구체적으로는, 상기 처리가 대상 타일 레벨에 도달한 경우에, 당해 레벨을 루트로 하는 복수의 타일을 설정한다.
복수의 엔트로피 부호화부(2823)는, 복수의 타일을 개별적으로 부호화한다. 비트 스트림 생성부(2824)는, 복수의 타일이 부호화된 부호화 데이터를 결합함으로써 비트 스트림을 생성한다.
도 134는, 본 실시 형태에 따른 삼차원 데이터 복호 장치(2830)의 구성을 나타내는 블럭도이다. 삼차원 데이터 복호 장치(2830)는, 8진 트리 생성부(2831), 비트 스트림 분할부(2832), 복수의 엔트로피 복호부(2833), 삼차원점 결합부(2834)를 구비한다.
8진 트리 생성부(2831)는, 바운딩 박스를 설정하고, 바운딩 박스를 8개의 자식 노드로 분할한다. 또한, 8진 트리 생성부(2831)는, 이 분할 처리를, 처리가 대상 타일 레벨에 도달할 때까지 반복한다.
비트 스트림 분할부(2832)는, 비트 스트림에 포함되는 헤더 정보를 이용하여, 비트 스트림을 각 타일의 부호화 데이터로 분할한다.
복수의 엔트로피 복호부(2833)는, 복수의 타일을 개별적으로 복호한다. 삼차원점 결합부(2834)는, 복호된 복수의 타일의 삼차원점을 결합한다. 또한, 복호된 삼차원점이 애플리케이션에서 직접 사용되는 경우도 있다. 이러한 경우에는, 이 결합 처리는 스킵된다.
이상과 같이, 본 실시 형태에 따른 삼차원 데이터 부호화 장치는, 도 135에 나타내는 처리를 행한다. 삼차원 데이터 부호화 장치는, 복수의 삼차원점이 포함되는 대상 공간(예를 들면 바운딩 박스)에 포함되는 복수의 서브 공간(예를 들면 타일)을 부호화함으로써 비트 스트림을 생성한다. 상기 비트 스트림의 생성에서는, 삼차원 데이터 부호화 장치는, 비트 스트림에 포함되는, 복수의 서브 공간에 공통인 제1 헤더(예를 들면, 공통 헤더(2801) 또는 전체 헤더(2804))에, 대상 공간의 좌표인 제1 좌표를 나타내는 제1 정보(예를 들면 위치 정보(2807))를 저장하고(S2831), 비트 스트림에 포함되는, 서브 공간 단위의 제2 헤더(예를 들면 타일 정보(2811))에, 대응하는 서브 공간의 좌표인 제2 좌표와 제1 좌표의 차분을 나타내는 제2 정보(예를 들면 타일 위치 정보(2812))를 저장한다(S2832).
이에 의하면, 제2 정보로서 제1 좌표와 제2 좌표의 차분을 나타내는 정보가 저장되므로, 비트 스트림의 부호량을 저감할 수 있다.
또한, 제1 헤더의 적어도 일부와 복수의 제2 헤더가 단일의 헤더(신택스)에 포함되어도 된다. 예를 들면, 도 129에 나타내는 바와 같이, 타일 테이블(2802)에, 복수의 서브 공간에 공통의 정보인 타일 사이즈 정보(2913)(제1 헤더)와, 서브 공간 단위의 정보인 타일 정보(2811)(제2 헤더)가 포함되어도 된다. 또한, 제1 헤더는, 공통 헤더(2801)의 적어도 일부와, 타일 테이블(2802)의 일부를 포함해도 된다.
예를 들면, 복수의 서브 공간에 포함되는 제1 서브 공간과 제2 서브 공간의 일부는 중복된다. 예를 들면, 도 111, 도 112 및 도 113에 나타내는 바와 같이, 동일한 영역이 상이한 타일 분할이 이용되어도 된다.
예를 들면, 삼차원 데이터 부호화 장치는, 상기 비트 스트림의 생성에서는, 제2 헤더(예를 들면 도 127의 타일 정보(2811))에, 대응하는 서브 공간의 크기를 나타내는 제3 정보(예를 들면 도 127의 타일 사이즈 정보(2813))를 저장한다.
예를 들면, 삼차원 데이터 부호화 장치는, 상기 비트 스트림의 생성에서는, 제1 헤더에, 복수의 서브 공간의 크기를 나타내는 제3 정보(도 129의 타일 사이즈 정보(2813))를 저장한다.
예를 들면, 삼차원 데이터 부호화 장치는, 상기 비트 스트림의 생성에서는, 상기 제1 헤더(예를 들면 공통 헤더(2801) 또는 타일 테이블(2802))에, 복수의 서브 공간의 수를 나타내는 제4 정보(타일 수 정보(2806))를 저장한다.
예를 들면, 삼차원 데이터 부호화 장치는, 상기 비트 스트림의 생성에서는, 복수의 서브 공간의 복수의 제2 헤더를 포함하는 스트림을, 복수의 서브 공간의 부호화 데이터와는 독립된 스트림으로서 생성한다. 예를 들면, 복수의 서브 공간의 복수의 제2 헤더와, 복수의 서브 공간의 부호화 데이터는 별개의 NAL Unit으로서 부호화된다.
이에 의하면, 예를 들면, 삼차원 데이터 복호 장치는, 제2 헤더를 포함하는 스트림을 참조함으로써, 필요한 서브 공간을 판정하고, 필요한 서브 공간의 부호화 데이터를 선택적으로 취득할 수 있다.
예를 들면, 삼차원 데이터 부호화 장치는, 프로세서와 메모리를 구비하고, 프로세서는, 메모리를 이용하여, 상기의 처리를 행한다.
또한, 본 실시 형태에 따른 삼차원 데이터 복호 장치는, 도 136에 나타내는 처리를 행한다. 삼차원 데이터 복호 장치는, 복수의 삼차원점이 포함되는 대상 공간에 포함되는 복수의 서브 공간이 부호화됨으로써 얻어진 비트 스트림을 복호한다. 삼차원 데이터 복호 장치는, 상기 비트 스트림의 복호에서는, 비트 스트림에 포함되는, 복수의 서브 공간에 공통인 제1 헤더(예를 들면, 공통 헤더(2801) 또는 전체 헤더(2804))로부터, 상기 대상 공간의 좌표인 제1 좌표를 나타내는 제1 정보(예를 들면 위치 정보(2807))를 복호하고(S2841), 비트 스트림에 포함되는, 서브 공간 단위의 제2 헤더(예를 들면 타일 정보(2811))로부터, 대응하는 서브 공간의 좌표인 제2 좌표와 제1 좌표의 차분을 나타내는 제2 정보(예를 들면 타일 위치 정보(2812))를 복호한다(S2842). 예를 들면, 삼차원 데이터 복호 장치는, 제1 정보로 나타내어지는 제1 좌표에, 제2 정보로 나타내어지는 차분을 가산함으로써 제2 좌표를 산출한다.
이에 의하면, 제2 정보로서 제1 좌표와 제2 좌표의 차분을 나타내는 정보가 저장되므로, 비트 스트림의 부호량을 저감할 수 있다.
예를 들면, 복수의 서브 공간에 포함되는 제1 서브 공간과 제2 서브 공간의 일부는 중복된다. 예를 들면, 도 111, 도 112 및 도 113에 나타내는 바와 같이, 동일한 영역이 상이한 타일 분할이 이용되어도 된다.
예를 들면, 삼차원 데이터 복호 장치는, 상기 비트 스트림의 복호에서는, 제2 헤더(예를 들면 도 127의 타일 정보(2811))로부터, 대응하는 서브 공간의 크기를 나타내는 제3 정보(예를 들면 도 127의 타일 사이즈 정보(2813))를 복호한다.
예를 들면, 삼차원 데이터 복호 장치는, 상기 비트 스트림의 복호에서는, 제1 헤더로부터, 복수의 서브 공간의 크기를 나타내는 제3 정보(도 129의 타일 사이즈 정보(2813))를 복호한다.
예를 들면, 삼차원 데이터 복호 장치는, 상기 비트 스트림의 복호에서는, 제1 헤더(예를 들면 공통 헤더(2801))로부터, 복수의 서브 공간의 수를 나타내는 제4 정보(타일 수 정보(2806))를 복호한다.
예를 들면, 복수의 서브 공간의 복수의 제2 헤더를 포함하는 스트림은, 복수의 서브 공간의 복호 데이터와는 독립된 스트림으로서 생성되어 있다. 예를 들면, 복수의 서브 공간의 복수의 제2 헤더와, 복수의 서브 공간의 부호화 데이터는 별개의 NAL Unit으로서 부호화된다. 예를 들면, 삼차원 데이터 복호 장치는, 제2 헤더를 포함하는 스트림을 참조함으로써, 필요한 서브 공간을 판정하고, 필요한 서브 공간의 부호화 데이터를 선택적으로 취득한다.
예를 들면, 삼차원 데이터 복호 장치는, 프로세서와 메모리를 구비하고, 프로세서는, 메모리를 이용하여, 상기의 처리를 행한다.
(실시 형태 13)
전송 속도, 입출력 성능, 메모리 사용률, 및 CPU 성능 등의 하드웨어의 제한에 의해, 대규모의 삼차원 맵(포인트 클라우드 맵) 전부를 복호하고, 복호한 데이터를 시스템에 로드하는 것은 어렵다. 이에 대하여, 본 실시 형태에서는, 대규모의 삼차원 맵을 복수의 슬라이스 또는 타일로서 비트 스트림에 부호화하는 수법을 이용한다. 이에 의해, 삼차원 데이터 복호 장치에 있어서의 하드웨어로의 요구를 낮출 수 있어, 임베디드 시스템 또는 휴대 단말에 있어서 실시간으로의 복호 처리를 실현할 수 있다.
슬라이스 및 타일의 부호화 처리 및 복호 처리에 대해서는 상술하였다. 그러나, 상기의 수법을 실현하기 위해서, PCC(Point Cloud Compression) 부호화의 포맷 및 복호의 포맷의 양쪽 모두를 불가역적으로 변경할 필요가 있다.
본 실시 형태에서는, 슬라이스 및 타일의 부호화를 위한 SEI(Supplemental Enhancement Information)를 이용한다. 이에 의해, 포맷의 변경을 행하지 않고, 슬라이스 및 타일의 부호화 처리 및 복호 처리를 실현할 수 있다.
본 실시 형태에서는, 삼차원 데이터 부호화 장치는, PCC 부호화에 있어서, 타일 또는 슬라이스의 데이터를 생성함과 더불어, 타일 또는 슬라이스의 속성 정보(메타데이터) 및 데이터 액세스 정보를 포함하는 SEI를 생성하고, 생성한 SEI를 데이터와 함께 부호화한다.
또한, 삼차원 데이터 복호 장치는, PCC 복호에 있어서, 타일 또는 슬라이스의 속성 정보 및 데이터 액세스 정보를 포함하는 SEI에 의거하여, 복호에 필요한 타일 또는 슬라이스와, 그 데이터 액세스 위치를 특정한다. 이에 의해, 삼차원 데이터 복호 장치는, 타일 또는 슬라이스를 이용한 고속의 병렬 복호를 실현할 수 있다.
또한, 타일 및 슬라이스 중 한쪽이 이용되어도 되고, 양쪽 모두가 이용되어도 된다.
이하, 슬라이스 또는 타일의 분할예를 설명한다. 예를 들면, 60km/hr로 주행하는 자동차에 있어서의 삼차원 데이터 복호 장치에서는, 하드웨어에 16.67m/s의 처리 능력이 요구된다. 또한, 길이가 약 2.2km인 도시부의 터널의 데이터를 테스트 스트림으로서 이용한다. 이 테스트 스트림을 실시간 복호하려면, 이 테스트 스트림을 132초에 복호를 행할 필요가 있다. 또한, 복호한 점군 정보를 저장하기 위해서 2GB의 메모리가 필요하다.
한편, 비트 스트림이 20개의 슬라이스 또는 타일로서 부호화된 경우, 삼차원 데이터 복호 장치는, 이 중 1개를 복호할 수 있다. 이 경우, 요구 실시간을 6.5초로 단축할 수 있고, 요구되는 메모리를 100MB로 삭감할 수 있다. 도 137은, 슬라이스 또는 타일 분할을 행하지 않는 경우(전체)와, 20개의 슬라이스 또는 타일 분할을 행하는 경우에 있어서의, 메모리, 요구 실시간, 현행의 복호 시간 및 거리의 예를 나타내는 도면이다.
도 138은, 타일 또는 슬라이스 분할의 예를 나타내는 도면이다. 예를 들면, 고정수의 점군 데이터에 의한 클러스터링을 이용하여 분할이 행해진다. 이 수법에서는, 모든 타일은 고정수의 점군 데이터를 갖고, 빈 타일은 존재하지 않는다. 이 수법에서는, 타일 및 처리 부하를 균등하게 할 수 있다는 이점이 있다. 한편, 이 수법은, 데이터의 클러스터링 및 각 타일의 세계 좌표를 결정하기 위해서, 추가적인 연산 및 정보가 필요해진다.
또한, 슬라이스 또는 타일마다의 점군 데이터의 수 또는 비트수에 의거한 슬라이스 또는 타일 분할 대신에, 점군 데이터를 효과적으로 분할하는 다른 수법을 이용해도 된다. 이 수법을 비균일 분할(non uniform division)이라고도 부른다. 이 수법에서는, 공간의 중복을 피하거나 또는 최소한으로 하고, 동시에 클러스터간의 좌표 관계를 제공할 수 있도록, 위치적으로 가까운 점군 데이터를 클러스터링한다.
점군 데이터를 클러스터링하는 수법으로서, 예를 들면, 8진 트리 분할의 카운트수를 소트하는 수법, 계층 클러스터링, 중심(重心)에 의거한 클러스터링(k 평균법(k means clustering)), 분포에 의거한 클러스터링, 밀도에 의거한 클러스터링 등의 복수의 수법이 존재한다.
8진 트리 분할의 카운트수를 소트하는 수법은, 실장이 용이한 수법 중 하나이다. 이 수법에서는, 점군 데이터는 소트되고, 카운트된다. 그리고, 점군 데이터의 수가 고정값에 달한 경우에, 그때까지의 그룹이 하나의 클러스터로 분류된다. 도 139는, 이 수법의 예를 나타내는 도면이다. 예를 들면, 도 139에 나타내는 예에서는, 각 점군 데이터의 영역의 번호가 입력된다. 여기서, 영역의 번호란, 예를 들면, 8진 트리에 있어서의 8개의 노드의 번호이다. 또한, 소트에 의해 동일한 번호를 갖는 점군 데이터가 추출되고, 예를 들면, 동일한 번호를 갖는 점군 데이터가 하나의 슬라이스 또는 타일에 할당된다.
다음에, 슬라이스 또는 타일 분할의 다른 예를 설명한다. 슬라이스 또는 타일 분할의 수법으로서, 상면에서 본 이차원 맵을 이용하는 수법을 이용한다. 삼차원 데이터 부호화 장치는, 이용자가 입력한 타일의 수에 의거하여, 바운딩 박스의 최소값 및 최대값에 따라 구획 나눔을 행한다.
이 수법은, 삼차원 데이터 부호화 장치에 있어서, 추가 연산을 행하지 않고, 점군 데이터의 공간을 균등하게 배치할 수 있다는 이점이 있다. 단, 점군의 밀도에 따라 많은 영역에 점군이 포함되지 않을 가능성이 있다.
도 140은, 이 수법의 예를 나타내는 도면이다. 도 140에 나타내는 바와 같이, 점군 데이터의 공간이 같은 사이즈의 복수의 바운딩 박스로 분할된다.
다음에, SEI의 구성에 대해서 설명한다. 삼차원 데이터 복호 장치에 있어서 슬라이스 또는 타일 정보를 복호할 수 있도록 하기 위해서, 삼차원 데이터 부호화 장치는, 추가 정보를 도입한다. 예를 들면, 삼차원 데이터 부호화 장치는, PCC를 위한 SEI를 도입해도 된다. SEI는, 삼차원 데이터 부호화 장치 및 삼차원 데이터 복호 장치의 양쪽 모두에서 이용할 수도 있다.
또한, SEI의 복호 처리에 대응하고 있지 않은 삼차원 데이터 복호 장치는, SEI 메시지를 포함하는 비트 스트림을 복호 가능하다. 한편, SEI의 복호 처리에 대응하고 있는 삼차원 데이터 복호 장치는, SEI 메시지를 포함하지 않는 비트 스트림을 복호 가능하다.
도 141은, PCC를 위한 SEI를 포함하는 비트 스트림의 구성예를 나타내는 도면이다. 도 142는, 타일 또는 슬라이스를 위한 SEI에 포함되는 정보의 예를 나타내는 도면이다. 도 143은, 이 SEI(Tile_Slice_information_SEI)의 신택스예를 나타내는 도면이다.
이 SEI는, 예를 들면, 비트 스트림의 헤더에 포함된다. 즉, 이 SEI는, 복수의 타일 또는 슬라이스의 부호화 데이터에 공통인 제어 정보에 포함된다. 또한, 도 142 및 도 143에 나타내는 바와 같이, 이 SEI는, 타일 인덱스(Tile idx) 또는 슬라이스 인덱스(Slice idx)와, 영역 정보(Area information)와, 메모리 오프셋(포인터)(Memory offset pointer)와, 글로벌 위치 정보(Global position information)를 포함한다. 또한, 이 SEI는, 타일 또는 슬라이스의 부호화 또는 복호에 관련된 그 외의 정보를 포함해도 된다. 또한, SEI에는, 타일 인덱스 또는 슬라이스 인덱스마다 상기 정보가 포함된다. 또한, SEI는 상기 정보 중 적어도 일부를 포함해도 된다.
타일 인덱스는, 복수의 타일을 식별하기 위한 식별자이며, 복수의 타일의 각각에 상이한 타일 인덱스의 값이 할당된다. 슬라이스 인덱스는, 복수의 슬라이스를 식별하기 위한 식별자이며, 복수의 슬라이스의 각각에 상이한 슬라이스 인덱스의 값이 할당된다. 또한, 각 타일 또는 각 슬라이스의 부호화 데이터의 헤더에, 당해 부호화 데이터에 대응하는 타일 또는 슬라이스의 타일 인덱스 또는 슬라이스 인덱스가 부가된다.
영역 정보는, 타일 또는 슬라이스의 공간 범위(영역)를 나타내는 정보이다. 예를 들면, 영역 정보는, 타일 또는 슬라이스의 사이즈를 나타내는 사이즈 정보를 포함한다. 메모리 오프셋은, 타일 또는 슬라이스의 부호화 데이터가 저장되어 있는 메모리의 위치(어드레스)를 나타내는 정보이며, 비트 스트림 내의 타일 또는 슬라이스의 부호화 데이터의 위치(어드레스)를 나타내는 정보이다. 글로벌 위치 정보는, 타일 또는 슬라이스의 글로벌 위치(예를 들면 세계 좌표(위도 경도 등))를 나타내는 정보이다.
또한, 삼차원 데이터 부호화 장치는, 각 타일 또는 슬라이스의 바이트 얼라인먼트 처리 등을 행한다.
또한, SEI의 용도는, 슬라이스 또는 타일의 부호화에 한정하지 않으며, 옵션으로서 비트 스트림에 부호화되는 다른 정보에 사용되어도 된다.
또한, 삼차원 데이터 부호화 장치는, 하나의 타일 또는 하나의 슬라이스에 대하여, 하나의 속성 정보(상술한 영역 정보, 어드레스 정보(메모리 오프셋) 및 위치 정보(글로벌 위치 정보) 등)를 대응시켜도 되고, 하나의 타일 또는 하나의 슬라이스에 대하여 복수의 속성 정보를 대응시켜도 된다. 또한, 삼차원 데이터 부호화 장치는, 복수의 타일 또는 복수의 슬라이스에 대하여, 하나의 속성 정보를 대응시켜도 된다. 또한, 삼차원 데이터 부호화 장치는, 타일과 슬라이스를 병용하는 경우이면, 각각에 대한 속성 정보를 비트 스트림에 부가해도 된다. 또한, 예를 들면, 삼차원 데이터 부호화 장치는, 영역 정보인 제1 속성 정보와, 제1 영역 정보와 제2 영역 정보의 관련성을 나타내는 제2 속성 정보를 생성하고, 제1 속성 정보와 제2 속성 정보를 SEI에 저장해도 된다.
또한, 도 143에 나타내는 바와 같이, SEI는, 타일 또는 슬라이스에 대한 속성 정보(영역 정보, 어드레스 정보 및 위치 정보)를 포함해도 된다. 예를 들면, 속성 정보의 번호가 규정되고, SEI는, 속성 정보의 번호에 대응하는 타일 인덱스 또는 슬라이스 인덱스를 포함해도 된다.
다음에, 삼차원 데이터 복호 장치의 하드웨어 구성의 예를 설명한다. 도 144는, 삼차원 데이터 복호 장치의 하드웨어 구성예를 나타내는 도면이다. 도 144에 나타내는 바와 같이, 삼차원 데이터 복호 장치는, 입력부(4501), 로컬라이즈부(4502), 메모리 관리부(4503), 복호부(4504), 메모리(4505), 표시부(4506)를 구비한다.
입력부(4501)는, 무선 통신 등의 네트워크를 통해 외부와의 데이터의 입출력을 행한다. 또한, 입력부(4501)는, SSD(Solid State Drive), HDD(hard disk drive) 및 메모리 모듈 등의 스토리지와의 데이터의 입출력을 행한다.
로컬라이즈부(4502)는, 예를 들면, GPS(Global Positioning System), 휠 방향 검지기, 또는 자이로 센서 등이며, 삼차원 데이터 부호화 장치가 탑재되어 있는 이동체 등의 위치 및 속도 등을 검지하는 모듈이다.
메모리 관리부(4503)는, 메모리(4505)를 관리한다. 메모리 관리부(4503)는, 로컬라이즈부(4502)로부터 정보를 취득하고, 취득한 정보를 이용하며, SEI를 참조하여, 관련되는 슬라이스 또는 타일의 스트림을 읽어들이고, 읽어들인 스트림을 복호부(4504)에 로드한다.
복호부(4504)는, 슬라이스 또는 타일의 스트림을 복호하고, 얻어진 삼차원 데이터를 메모리(4505)에 저장한다. 메모리(4505)는, 슬라이스 또는 타일의 스트림 및 삼차원 데이터를 저장한다.
표시부(4506)는, 메모리(4505)에 저장되는 삼차원 데이터에 의거한 화상 또는 영상을 표시한다.
다음에, 슬라이스 또는 타일로의 액세스 동작에 대해서 설명한다. PCC 스트림은 분할되고, SEI에 그 정보가 저장된다. 이에 의해, 삼차원 데이터 복호 장치는, 영역 단위에서의 액세스를 용이하게 실현할 수 있다. 메모리 관리부(4503)는, 로컬라이즈부(4502)(예를 들면 GPS)로부터의 정보와, 삼차원 데이터 복호 장치가 탑재되어 있는 이동체의 이동 방향 등에 의거하여, 필요한 영역을 판정하고, 필요한 영역(부호화된 슬라이스 또는 타일)의 데이터를 메모리(4505)로부터 취득한다.
SEI에는, 영역 정보로서, 관련되는 글로벌 위치 또는 지도에 관련되는 상대 위치가 부호화된다. 도 145 및 도 146은, 슬라이스 또는 타일로의 액세스 동작의 예를 나타내는 도면이다. 이 예에서는, 삼차원 데이터 복호 장치가 탑재되어 있는 대상물의 현재 위치는 영역 M으로 식별된다. 또한, 도 145 및 도 146에 나타내는 바와 같이 대상물은, 좌측 방향으로 이동한다. 이 경우, 영역 F, K 및 P는 이용 가능하지 않기(로드되어 있지 않기) 때문에, 이들 영역의 데이터를 복호하기 위해서, 이들 영역의 데이터가 메모리 관리부(4503)에 의해 메모리(4505)로부터 읽어내어진다. 또한, 다른 영역은, 이동 방향에 관련되지 않기 때문에, 복호를 행할 필요는 없다.
상기의 수법에 의해, 복호 시간을 단축할 수 있음과 더불어, 하드웨어에 있어서 필요한 메모리 용량을 삭감할 수 있다.
다음에, 슬라이스 또는 타일의 복호 처리의 테스트 예를 설명한다. 이하, 점군 데이터 비트 스트림의 복호에 있어서의 SEI의 테스트에 대해서 설명한다. 도 147 및 도 148은, SEI의 테스트 동작을 나타내는 도면이다.
테스트용 점군 데이터 비트 스트림은, 원래의 PLY 포맷의 점군 데이터를 분할하고, 분할된 점군 데이터를 개별적으로 부호화함으로써 생성된다. 얻어진 복수의 비트 스트림이 연결됨으로써 하나의 파일(연결한 스트림)이 생성된다. 또한, 이 하나의 파일은, 각 비트 스트림의 파일 사이즈를 나타내는 텍스트 포맷의 SEI와 함께 송신된다.
복호부(4504)는, SEI와, 메모리 관리부(4503)로부터의 정보를 이용하여, 스트림의 일부를 로드하고, 복호할 수 있도록 변경되어 있다. 복수회의 관측에 의해, 복호 시간의 상한이, 약간의 오버헤드로 관측된다.
이하, 삼차원 데이터 부호화 장치의 동작 및 삼차원 데이터 복호 장치의 동작을 설명한다. 도 149는, 본 실시 형태에 따른 삼차원 데이터 부호화 장치에 의한 삼차원 데이터 부호화 처리의 플로차트이다.
우선, 삼차원 데이터 부호화 장치는, 타일 또는 슬라이스의 요구에 대한 이용자 설정에 의거하여, 입력된 삼차원점을 포함하는 바운딩 박스를 설정한다(S4501). 다음에, 삼차원 데이터 부호화 장치는, 당해 바운딩 박스를 8개의 자식 노드로 분할한다(S4502).
다음에, 삼차원 데이터 부호화 장치는, 8개의 자식 노드 중 삼차원점이 포함되는 자식 노드의 각각의 어큐펀시 부호를 생성한다(S4503). 다음에, 삼차원 데이터 부호화 장치는, 처리 대상의 노드의 레벨(트리 구조의 계층)이, 대상 타일 레벨에 도달했는지의 여부를 판정한다(S4504). 여기서 대상 타일 레벨이란, 타일 분할을 행하는 레벨(트리 구조의 계층)이다.
처리 대상의 노드의 레벨이 대상 타일 레벨에 도달하지 않은 경우(S4504에서 No), 삼차원 데이터 부호화 장치는, 각 자식 노드를 8개의 손자 노드로 분할하고(S4505), 손자 노드의 각각에 대하여 단계 S4503 이후의 처리를 행한다.
처리 대상의 노드의 레벨이 대상 타일 레벨에 도달한 경우(S4504에서 Yes), 삼차원 데이터 부호화 장치는, 타일 테이블에 현재의 노드 위치 및 타일 레벨(타일 사이즈)을 보존한다(S4506).
다음에, 삼차원 데이터 부호화 장치는, 각 자식 노드를 8개의 손자 노드로 분할한다(S4507). 다음에, 삼차원 데이터 부호화 장치는, 어큐펀시 부호를 생성하는 처리를, 노드가 분할할 수 없게 될 때까지 반복한다(S4508). 다음에, 삼차원 데이터 부호화 장치는, 각 타일의 어큐펀시 부호를 부호화한다(S4509).
다음에, 삼차원 데이터 부호화 장치는, 생성한 복수의 타일의 부호화 비트 스트림(부호화 데이터)을 결합한다(S4510). 또한, 삼차원 데이터 부호화 장치는, 각 부호화 비트 스트림(부호화 데이터)의 사이즈를 나타내는 정보 및 타일 테이블 등을 비트 스트림의 헤더 정보에 부가한다. 또한, 삼차원 데이터 부호화 장치는, 각 부호화 비트 스트림(부호화 데이터)이 대응하는 타일 또는 슬라이스의 식별자(타일 인덱스 또는 슬라이스 인덱스)를 각 부호화 비트 스트림의 헤더 정보에 부가한다.
여기서, 타일 테이블에, 타일 사이즈(타일 레벨)가 저장된다. 따라서, 삼차원 데이터 복호 장치는, 이 타일 사이즈를 이용하여, 각 타일의 서브 트리의 바운딩 박스의 사이즈를 취득할 수 있다. 또한, 삼차원 데이터 복호 장치는, 서브 트리의 바운딩 박스의 사이즈를 이용하여, 전체 트리 구조의 바운딩 박스의 사이즈를 산출할 수 있다.
또한, 삼차원 데이터 부호화 장치는, 각 타일의 바운딩 박스의 사이즈를 타일 테이블에 저장해도 된다. 이에 의해, 삼차원 데이터 복호 장치는, 타일 테이블을 참조함으로써 각 타일의 바운딩 박스의 사이즈를 취득할 수 있다.
마지막으로, 삼차원 데이터 부호화 장치는, 비트 스트림에 SEI를 부가한다(S4511). 상술한 바와 같이 SEI는, 각 타일 또는 각 슬라이스의 속성 정보(영역 정보, 어드레스 정보 및 위치 정보 등)와, 식별자(타일 인덱스 또는 슬라이스 인덱스)의 대응 관계를 나타내는 일람을 포함한다. 또한, 상기 타일 테이블이 SEI에 포함되어도 된다.
도 150은, 본 실시 형태에 따른 삼차원 데이터 복호 장치에 의한 삼차원 데이터 복호 처리의 플로차트이다.
우선, 메모리 관리부(4503)는, SEI(SEI 헤더)로부터 취득하는 타일 또는 슬라이스의 정보를 설정한다(S4521). 다음에, 삼차원 데이터 복호 장치는, SEI(SEI 헤더)를 참조하여, 관련되는 타일 또는 슬라이스에 액세스한다(S4522).
예를 들면, 메모리 관리부(4503)는, 도 145 및 도 146에 나타낸 바와 같이, 삼차원 데이터 복호 장치의 현재 위치 및 이동 방향에 의거하여, 취득할 타일 또는 슬라이스의 위치를 결정한다. 또는, 메모리 관리부(4503)는, 이용자로부터의 설정에 의거하여, 취득할 타일 또는 슬라이스의 위치를 결정한다. 다음에, 메모리 관리부(4503)는, SEI에 포함되는 속성 정보와 식별자(타일 인덱스 또는 슬라이스 인덱스)의 일람을 참조하여, 결정한 위치의 타일 또는 슬라이스의 식별자를 판정한다. 다음에, 메모리 관리부(4503)는, 각 부호화 비트 스트림의 헤더 정보를 참조하여, 판정한 식별자가 부가되어 있는 부호화 비트 스트림을 복호 대상의 부호화 비트 스트림으로서 취득한다.
다음에, 삼차원 데이터 복호 장치는, 비트 스트림에 포함되는 헤더 정보를 이용하여, 출력하는 삼차원점을 포함하는 바운딩 박스를 설정한다(S4523). 다음에, 삼차원 데이터 복호 장치는, 비트 스트림에 포함되는 헤더 정보를 이용하여 각 타일(서브 트리)의 루트 위치를 설정한다(S4524).
다음에, 삼차원 데이터 복호 장치는, 당해 바운딩 박스를 8개의 자식 노드로 분할한다(S4525). 다음에, 삼차원 데이터 복호 장치는, 각 노드의 어큐펀시 부호를 복호하고, 복호한 어큐펀시 부호에 의거하여 노드를 8개의 자식 노드로 분할한다. 또한, 삼차원 데이터 복호 장치는, 이 처리를, 각 타일(서브 트리)의 노드가 분할할 수 없게 될 때까지 반복한다(S4526).
마지막으로, 삼차원 데이터 복호 장치는, 복호한 복수의 타일의 삼차원점을 결합한다(S4527).
도 151은, 본 실시 형태에 따른 삼차원 데이터 부호화 장치(4510)의 구성을 나타내는 블럭도이다. 삼차원 데이터 부호화 장치(4510)는, 8진 트리 생성부(4511), 타일 분할부(4512), 복수의 엔트로피 부호화부(4513), 비트 스트림 생성부(4514), SEI 처리부(4515)를 구비한다.
대상 타일 레벨이 삼차원 데이터 부호화 장치(4510)에 입력된다. 삼차원 데이터 부호화 장치(4510)는, 당해 대상 타일 레벨에 처리가 도달한 후, 각 타일의 어큐펀시 부호화를 저장하고, 복수의 타일의 어큐펀시 부호를 개별적으로 부호화함으로써 각 타일의 부호 데이터를 생성한다.
8진 트리 생성부(4511)는, 바운딩 박스를 설정하고, 바운딩 박스를 8개의 자식 노드로 분할한다. 또한, 8진 트리 생성부(4511)는, 이 분할 처리를, 처리가 대상 타일 레벨에 도달할 때까지 반복한다. 또한, 얻어진 정보는 해석되고, SEI 처리부(4515)에 보내진다.
타일 분할부(4512)는, 타일을 설정한다. 구체적으로는, 상기 처리가 대상 타일 레벨에 도달한 경우에, 당해 레벨을 루트로 하는 복수의 타일을 설정한다.
복수의 엔트로피 부호화부(4513)는, 복수의 타일을 개별적으로 부호화한다. 비트 스트림 생성부(4514)는, 복수의 타일이 부호화된 부호화 데이터를 결합함으로써 비트 스트림을 생성한다.
SEI 처리부(4515)는, SEI를 생성하고, 생성한 SEI를 비트 스트림에 기입한다.
도 152는, 본 실시 형태에 따른 삼차원 데이터 복호 장치(4520)의 구성을 나타내는 블럭도이다. 삼차원 데이터 복호 장치(4520)는, SEI 처리부(4521), 8진 트리 생성부(4522), 비트 스트림 분할부(4523), 복수의 엔트로피 복호부(4524), 삼차원점 결합부(4525)를 구비한다.
SEI 처리부(4521)는, SEI를 참조하여, 어느 데이터를 읽어내고, 처리할지를 결정한다. 또한, 결정 결과가 비트 스트림 분할부(4523)에 보내진다.
8진 트리 생성부(4522)는, 바운딩 박스를 설정하고, 바운딩 박스를 8개의 자식 노드로 분할한다. 또한, 8진 트리 생성부(4522)는, 이 분할 처리를, 처리가 대상 타일 레벨에 도달할 때까지 반복한다.
비트 스트림 분할부(4523)는, 비트 스트림에 포함되는 헤더 정보를 이용하여, 비트 스트림을 각 타일의 부호화 데이터로 분할한다. 또한, SEI 처리부(4521)로부터의 정보에 의거하여, 복호 처리를 행하는 타일의 부호화 데이터를 엔트로피 복호부(4524)에 보낸다.
복수의 엔트로피 복호부(4524)는, 복수의 타일을 개별적으로 복호한다. 삼차원점 결합부(4525)는, 복호된 복수의 타일의 삼차원점을 결합한다. 또한, 복호된 삼차원점이 애플리케이션에서 직접 사용되는 경우도 있다. 이러한 경우에는, 이 결합 처리는 스킵된다.
또한, 타일 또는 슬라이스의 속성 정보(식별자, 영역 정보, 어드레스 정보 및 위치 정보 등)는, SEI에 한정하지 않고, 그 외의 제어 정보에 저장되어도 된다. 예를 들면, 속성 정보는, PCC 데이터 전체의 구성을 나타내는 제어 정보에 저장되어도 되고, 타일 또는 슬라이스마다의 제어 정보에 저장되어도 된다.
또한, 삼차원 데이터 부호화 장치(삼차원 데이터 송신 장치)는, PCC 데이터를 다른 디바이스에 전송할 때에는, SEI 등의 제어 정보를, 그 시스템의 프로토콜 특유의 제어 정보로 변환하여 나타내도 된다.
예를 들면, 삼차원 데이터 부호화 장치는, 속성 정보를 포함하는 PCC 데이터를, ISOBMFF(ISO Base Media File Format)로 변환할 때에, SEI를 PCC 데이터와 함께 「mdat box」에 저장해도 되고, 스트림에 관한 제어 정보를 기재하는 「track box」에 저장해도 된다. 즉, 삼차원 데이터 부호화 장치는, 제어 정보를, 랜덤 액세스를 위한 테이블에 저장해도 된다. 또한, 삼차원 데이터 부호화 장치는, PCC 데이터를 패킷화하여 전송하는 경우에는, SEI를 패킷 헤더에 저장해도 된다. 이와 같이, 속성 정보를 시스템의 레이어에서 취득 가능하게 함으로써, 속성 정보, 및 타일 데이터 또는 슬라이스 데이터로의 액세스가 용이해져, 액세스의 속도를 향상시킬 수 있다.
또한, 도 144에 나타내는 삼차원 데이터 복호 장치의 구성에 있어서, 메모리 관리부(4503)는, 복호 처리에 필요한 정보가 메모리(4505)에 있는지의 여부를 미리 판정하고, 복호 처리에 필요한 정보가 없으면, 당해 정보를 스토리지 또는 네트워크로부터 취득해도 된다.
삼차원 데이터 복호 장치가, 스토리지 또는 네트워크로부터 PCC 데이터를 MPEG-DASH 등의 프로토콜에서의 Pull을 이용하여 취득하는 경우는, 메모리 관리부(4503)는, 로컬라이즈부(4502) 등으로부터의 정보에 의거하여, 복호 처리에 필요한 데이터의 속성 정보를 특정하고, 특정한 속성 정보를 포함하는 타일 또는 슬라이스를 요구하여, 필요한 데이터(PCC 스트림)를 취득해도 된다. 속성 정보를 포함하는 타일 또는 슬라이스의 특정은, 스토리지 또는 네트워크측에서 행해져도 되고, 메모리 관리부(4503)가 행해도 된다. 예를 들면, 메모리 관리부(4503)는, 미리 모든 PCC 데이터의 SEI를 취득해 두고, 그 정보에 의거하여, 타일 또는 슬라이스를 특정해도 된다.
스토리지 또는 네트워크로부터 모든 PCC 데이터가 UDP 프로토콜 등에 있어서 Push를 이용하여 송신되고 있는 경우는, 메모리 관리부(4503)는, 로컬라이즈부(4502) 등으로부터의 정보에 의거하여, 복호 처리에 필요한 데이터의 속성 정보, 및 타일 또는 슬라이스를 특정하고, 송출되는 PCC 데이터로부터 원하는 타일 또는 슬라이스를 필터링함으로써, 원하는 데이터를 취득해도 된다.
또한, 삼차원 데이터 부호화 장치는, 데이터의 취득 시에, 원하는 데이터가 있는지의 여부, 또는 데이터 사이즈 등에 의거하여 실시간으로의 처리가 가능한지의 여부, 또는 통신 상태 등을 판정해도 된다. 삼차원 데이터 부호화 장치는, 이 판정 결과에 의거하여, 데이터 취득이 곤란하다고 판단한 경우는, 우선도 또는 데이터량이 상이한 다른 슬라이스 또는 타일을 선택하여 취득해도 된다.
또한, 삼차원 데이터 복호 장치는, 로컬라이즈부(4502) 등으로부터의 정보를 클라우드 서버에 송신하고, 클라우드 서버가, 그 정보에 의거하여 필요한 정보를 판정해도 된다.
이상과 같이, 본 실시 형태에 따른 삼차원 데이터 부호화 장치는, 도 153에 나타내는 처리를 행한다. 삼차원 데이터 부호화 장치는, 복수의 삼차원점이 포함되는 대상 공간에 포함되는 복수의 서브 공간(예를 들면 타일 또는 슬라이스)을 부호화함으로써 복수의 서브 공간에 대응하는 복수의 부호화 데이터를 포함하는 비트 스트림을 생성한다.
삼차원 데이터 부호화 장치는, 비트 스트림의 생성에서는, 비트 스트림에 포함되는, 복수의 부호화 데이터에 공통인 제1 제어 정보(예를 들면 SEI)에, 복수의 서브 공간에 할당된 복수의 식별자(예를 들면 타일 인덱스 또는 슬라이스 인덱스)에 대응지어진 복수의 서브 공간의 정보(예를 들면 위치 정보 또는 사이즈 정보)의 일람을 저장한다(S4531). 삼차원 데이터 부호화 장치는, 복수의 부호화 데이터의 각각의 헤더(예를 들면 타일 헤더 또는 슬라이스 헤더)에, 당해 부호화 데이터에 대응하는 서브 공간에 할당된 식별자를 저장한다(S4532).
이에 의하면, 삼차원 데이터 복호 장치는, 당해 삼차원 데이터 부호화 장치에서 생성된 비트 스트림을 복호할 때에, 제1 제어 정보에 저장된 복수의 식별자에 대응지어진 상기 복수의 서브 공간의 정보의 일람과, 복수의 부호화 데이터의 각각의 헤더에 저장된 식별자를 참조하여, 원하는 부호화 데이터를 취득할 수 있다. 따라서, 삼차원 데이터 복호 장치의 처리량을 저감할 수 있다.
예를 들면, 비트 스트림에 있어서, 제1 제어 정보는, 복수의 부호화 데이터의 앞에 배치된다.
예를 들면, 상기 일람은, 복수의 서브 공간의 위치 정보(예를 들면 글로벌 위치 또는 상대 위치)를 포함한다. 예를 들면, 상기 일람은, 복수의 서브 공간의 사이즈 정보를 포함한다.
예를 들면, 삼차원 데이터 부호화 장치는, 제1 제어 정보를, 비트 스트림의 송신처의 시스템의 프로토콜에 있어서의 제2 제어 정보로 변환한다.
이에 의하면, 당해 삼차원 데이터 부호화 장치는, 비트 스트림의 송신처의 시스템의 프로토콜에 따라, 제어 정보를 변환할 수 있다.
예를 들면, 제2 제어 정보는, 상기 프로토콜에 있어서의 랜덤 액세스를 위한 테이블이다. 예를 들면, 제2 제어 정보는, ISOBMFF에 있어서의 mdat box 또는 track box이다.
예를 들면, 삼차원 데이터 부호화 장치는, 프로세서와 메모리를 구비하고, 프로세서는, 메모리를 이용하여, 상기의 처리를 행한다.
또한, 본 실시 형태에 따른 삼차원 데이터 복호 장치는, 도 154에 나타내는 처리를 행한다. 우선, 삼차원 데이터 복호 장치는, 복수의 삼차원점이 포함되는 대상 공간에 포함되는 복수의 서브 공간(예를 들면 타일 또는 슬라이스)을 부호화함으로써 얻어진, 복수의 서브 공간에 대응하는 복수의 부호화 데이터를 포함하는 비트 스트림을 복호한다.
삼차원 데이터 복호 장치는, 비트 스트림의 복호에서는, 복수의 서브 공간 중 복호 대상의 서브 공간을 결정한다(S4541). 삼차원 데이터 복호 장치는, 비트 스트림에 포함되는, 복수의 부호화 데이터에 공통인 제1 제어 정보(예를 들면 SEI)에 포함되는, 복수의 서브 공간에 할당된 복수의 식별자(예를 들면 타일 인덱스 또는 슬라이스 인덱스)에 대응지어진 복수의 서브 공간의 정보(예를 들면 위치 정보 또는 사이즈 정보)의 일람과, 복수의 부호화 데이터의 각각의 헤더(예를 들면 타일 헤더 또는 슬라이스 헤더)에 포함되는 당해 부호화 데이터에 대응하는 서브 공간에 할당된 식별자를 이용하여, 복호 대상의 서브 공간의 부호화 데이터를 취득한다(S4542).
이에 의하면, 당해 삼차원 데이터 복호 장치는, 제1 제어 정보에 저장된 복수의 식별자에 대응지어진 복수의 서브 공간의 정보의 일람과, 복수의 부호화 데이터의 각각의 헤더에 저장된 식별자를 참조하여, 원하는 부호화 데이터를 취득할 수 있다. 따라서, 삼차원 데이터 복호 장치의 처리량을 저감할 수 있다.
예를 들면, 비트 스트림에 있어서, 제1 제어 정보는, 복수의 부호화 데이터의 앞에 배치된다.
예를 들면, 상기 일람은, 복수의 서브 공간의 위치 정보(예를 들면 글로벌 위치 또는 상대 위치)를 포함한다. 예를 들면, 상기 일람은, 복수의 서브 공간의 사이즈 정보를 포함한다.
예를 들면, 삼차원 데이터 복호 장치는, 프로세서와 메모리를 구비하고, 프로세서는, 메모리를 이용하여, 상기의 처리를 행한다.
이상, 본 개시의 실시 형태에 따른 삼차원 데이터 부호화 장치 및 삼차원 데이터 복호 장치 등에 대해서 설명했으나, 본 개시는, 이 실시 형태에 한정되는 것은 아니다.
또한, 상기 실시 형태에 따른 삼차원 데이터 부호화 장치 및 삼차원 데이터 복호 장치 등에 포함되는 각 처리부는 전형적으로는 집적회로인 LSI로서 실현된다. 이들은 개별적으로 1칩화되어도 되고, 일부 또는 전부를 포함하도록 1칩화되어도 된다.
또한, 집적회로화는 LSI에 한정하는 것은 아니며, 전용 회로 또는 범용 프로세서로 실현해도 된다. LSI 제조 후에 프로그램하는 것이 가능한 FPGA(Field Programmable Gate Array), 또는 LSI 내부의 회로 셀의 접속이나 설정을 재구성 가능한 리컨피규러블·프로세서를 이용해도 된다.
또한, 상기 각 실시 형태에 있어서, 각 구성 요소는, 전용 하드웨어로 구성되거나, 각 구성 요소에 적합한 소프트웨어 프로그램을 실행함으로써 실현되어도 된다. 각 구성 요소는, CPU 또는 프로세서 등의 프로그램 실행부가, 하드 디스크 또는 반도체 메모리 등의 기록 매체에 기록된 소프트웨어 프로그램을 읽어내어 실행함으로써 실현되어도 된다.
또한, 본 개시는, 삼차원 데이터 부호화 장치 및 삼차원 데이터 복호 장치 등에 의해 실행되는 삼차원 데이터 부호화 방법 또는 삼차원 데이터 복호 방법 등으로서 실현되어도 된다.
또한, 블럭도에 있어서의 기능 블록의 분할은 일례이며, 복수의 기능 블록을 하나의 기능 블록으로서 실현하거나, 하나의 기능 블록을 복수로 분할하거나, 일부의 기능을 다른 기능 블록으로 옮겨도 된다. 또한, 유사한 기능을 갖는 복수의 기능 블록의 기능을 단일의 하드웨어 또는 소프트웨어가 병렬 또는 시분할로 처리해도 된다.
또한, 플로차트에 있어서의 각 단계가 실행되는 순서는, 본 개시를 구체적으로 설명하기 위해 예시하기 위한 것이며, 상기 이외의 순서여도 된다. 또한, 상기 단계의 일부가, 다른 단계와 동시(병렬)에 실행되어도 된다.
이상, 하나 또는 복수의 양태에 따른 삼차원 데이터 부호화 장치 및 삼차원 데이터 복호 장치 등에 대해서, 실시 형태에 의거하여 설명하였는데, 본 개시는, 이 실시 형태에 한정되는 것은 아니다. 본 개시의 취지를 일탈하지 않는 한, 당업자가 생각해낸 각종 변형을 본 실시 형태에 실시한 것이나, 상이한 실시 형태에 있어서의 구성 요소를 조합하여 구축되는 형태도, 하나 또는 복수의 양태의 범위 내에 포함되어도 된다.
본 개시는, 삼차원 데이터 부호화 장치 및 삼차원 데이터 복호 장치에 적용할 수 있다.
100, 400: 삼차원 데이터 부호화 장치 101, 201, 401, 501: 취득부
102, 402: 부호화 영역 결정부 103: 분할부
104, 644: 부호화부 111: 삼차원 데이터
112, 211, 413, 414, 511, 634: 부호화 삼차원 데이터
200, 500: 삼차원 데이터 복호 장치 202: 복호 개시 GOS 결정부
203: 복호 SPC 결정부 204, 625: 복호부
212, 512, 513: 복호 삼차원 데이터 403: SWLD 추출부
404: WLD 부호화부 405: SWLD 부호화부
411: 입력 삼차원 데이터 412: 추출 삼차원 데이터
502: 헤더 해석부 503: WLD 복호부
504: SWLD 복호부
620, 620A: 삼차원 데이터 작성 장치
621, 641: 삼차원 데이터 작성부
622: 요구 범위 결정부 623: 탐색부
624, 642: 수신부 626: 합성부
631, 651: 센서 정보 632: 제1 삼차원 데이터
633: 요구 범위 정보 635: 제2 삼차원 데이터
636: 제3 삼차원 데이터 640: 삼차원 데이터 송신 장치
643: 추출부 645: 송신부
652: 제5 삼차원 데이터 654: 제6 삼차원 데이터
700: 삼차원 정보 처리 장치 701: 삼차원 맵 취득부
702: 자차 검지 데이터 취득부 703: 이상 케이스 판정부
704: 대처 동작 결정부 705: 동작 제어부
711: 삼차원 맵 712: 자차 검지 삼차원 데이터
810: 삼차원 데이터 작성 장치 811: 데이터 수신부
812, 819: 통신부 813: 수신 제어부
814, 821: 포맷 변환부 815: 센서
816: 삼차원 데이터 작성부 817: 삼차원 데이터 합성부
818: 삼차원 데이터 축적부 820: 송신 제어부
822: 데이터 송신부
831, 832, 834, 835, 836, 837: 삼차원 데이터
833: 센서 정보 901: 서버
902, 902A, 902B, 902C: 클라이언트 장치
1011, 1111: 데이터 수신부
1012, 1020, 1112, 1120: 통신부
1013, 1113: 수신 제어부
1014, 1019, 1114, 1119: 포맷 변환부
1015: 센서
1016, 1116: 삼차원 데이터 작성부
1017: 삼차원 화상 처리부
1018, 1118: 삼차원 데이터 축적부
1021, 1121: 송신 제어부 1022, 1122: 데이터 송신부
1031, 1032, 1135: 삼차원 맵 1033, 1037, 1132: 센서 정보
1034, 1035, 1134: 삼차원 데이터 1117: 삼차원 데이터 합성부
1201: 삼차원 맵 압축/복호 처리부
1202: 센서 정보 압축/복호 처리부
1211: 삼차원 맵 복호 처리부 1212: 센서 정보 압축 처리부
1300: 삼차원 데이터 부호화 장치 1301: 분할부
1302: 감산부 1303: 변환부
1304: 양자화부 1305, 1402: 역양자화부
1306, 1403: 역변환부 1307, 1404: 가산부
1308, 1405: 참조 볼륨 메모리 1309, 1406: 인트라 예측부
1310, 1407: 참조 스페이스 메모리 1311, 1408: 인터 예측부
1312, 1409: 예측 제어부 1313: 엔트로피 부호화부
1400: 삼차원 데이터 복호 장 1401: 엔트로피 복호부
1501: 서버 1502: 클라이언트
1511: 기억부 1512: 제어부
1513: 부호화 삼차원 맵 1521: 디코더
1522: 애플리케이션
2100: 삼차원 데이터 부호화 장치
2101, 2111: 8진 트리 생성부
2102, 2112: 기하 정보 산출부
2103, 2113: 부호화 테이블 선택부 2104: 엔트로피 부호화부
2110: 삼차원 데이터 복호 장치 2114: 엔트로피 복호부
2801: 공통 헤더 2802: 타일 테이블
2803: 부호화 데이터 2804: 전체 헤더
2805: 고정 사이즈 플래그 2806: 타일 수 정보
2807: 위치 정보 2811: 타일 정보
2812: 타일 위치 정보 2813: 타일 사이즈 정보
2814: 부호량 정보 2815: 슬라이스 정보
2820: 삼차원 데이터 부호화 장치
2821, 2831: 8진 트리 생성부 2822: 타일 분할부
2823: 엔트로피 부호화부 2824: 비트 스트림 생성부
2830: 삼차원 데이터 복호 장치 2832: 비트 스트림 분할부
2833: 엔트로피 복호부 2834: 삼차원점 결합부
4501: 입력부 4502: 로컬라이즈부
4503: 메모리 관리부 4504: 복호부
4505: 메모리 4506: 표시부
4510: 삼차원 데이터 부호화 장치
4511, 4522: 8진 트리 생성부 4512: 타일 분할부
4513: 엔트로피 부호화부 4514: 비트 스트림 생성부
4515, 4521: SEI 처리부 4520: 삼차원 데이터 복호 장치
4523: 비트 스트림 분할부 4524: 엔트로피 복호부
4525: 삼차원점 결합부

Claims (13)

  1. 복수의 삼차원점이 포함되는 대상 공간에 포함되는 복수의 서브 공간을 부호화함으로써 상기 복수의 서브 공간에 대응하는 복수의 부호화 데이터를 포함하는 비트 스트림을 생성하고,
    상기 비트 스트림의 생성에서는,
    상기 비트 스트림에 포함되는, 상기 복수의 부호화 데이터에 공통인 제1 제어 정보에, 상기 복수의 서브 공간에 할당된 복수의 식별자에 대응지어진 상기 복수의 서브 공간의 정보의 일람을 저장하고,
    상기 복수의 부호화 데이터의 각각의 헤더에, 당해 부호화 데이터에 대응하는 상기 서브 공간에 할당된 식별자를 저장하는,
    삼차원 데이터 부호화 방법.
  2. 청구항 1에 있어서,
    상기 비트 스트림에 있어서, 상기 제1 제어 정보는, 상기 복수의 부호화 데이터의 앞에 배치되는, 삼차원 데이터 부호화 방법.
  3. 청구항 1 또는 청구항 2에 있어서,
    상기 일람은, 상기 복수의 서브 공간의 위치 정보를 포함하는, 삼차원 데이터 부호화 방법.
  4. 청구항 1 내지 청구항 3 중 어느 한 항에 있어서,
    상기 일람은, 상기 복수의 서브 공간의 사이즈 정보를 포함하는, 삼차원 데이터 부호화 방법.
  5. 청구항 1 내지 청구항 4 중 어느 한 항에 있어서,
    상기 삼차원 데이터 부호화 방법은, 상기 제1 제어 정보를, 상기 비트 스트림 송신처의 시스템의 프로토콜에 있어서의 제2 제어 정보로 변환하는, 삼차원 데이터 부호화 방법.
  6. 청구항 5에 있어서,
    상기 제2 제어 정보는, 상기 프로토콜에 있어서의 랜덤 액세스를 위한 테이블인, 삼차원 데이터 부호화 방법.
  7. 청구항 6에 있어서,
    상기 제2 제어 정보는, ISOBMFF에 있어서의 mdat box 또는 track box인, 삼차원 데이터 부호화 방법.
  8. 복수의 삼차원점이 포함되는 대상 공간에 포함되는 복수의 서브 공간을 부호화함으로써 얻어진, 상기 복수의 서브 공간에 대응하는 복수의 부호화 데이터를 포함하는 비트 스트림을 복호하고,
    상기 비트 스트림의 복호에서는,
    상기 복수의 서브 공간 중 복호 대상의 서브 공간을 결정하고,
    상기 비트 스트림에 포함되는, 상기 복수의 부호화 데이터에 공통인 제1 제어 정보에 포함되는, 상기 복수의 서브 공간에 할당된 복수의 식별자에 대응지어진 상기 복수의 서브 공간의 정보의 일람과, 상기 복수의 부호화 데이터의 각각의 헤더에 포함되는 당해 부호화 데이터에 대응하는 상기 서브 공간에 할당된 식별자를 이용하여, 상기 복호 대상의 서브 공간의 부호화 데이터를 취득하는,
    삼차원 데이터 복호 방법.
  9. 청구항 8에 있어서,
    상기 비트 스트림에 있어서, 상기 제1 제어 정보는, 상기 복수의 부호화 데이터의 앞에 배치되는, 삼차원 데이터 복호 방법.
  10. 청구항 8 또는 청구항 9에 있어서,
    상기 일람은, 상기 복수의 서브 공간의 위치 정보를 포함하는, 삼차원 데이터 복호 방법.
  11. 청구항 8 내지 청구항 10 중 어느 한 항에 있어서,
    상기 일람은, 상기 복수의 서브 공간의 사이즈 정보를 포함하는, 삼차원 데이터 복호 방법.
  12. 속성 정보를 갖는 복수의 삼차원점을 부호화하는 삼차원 데이터 부호화 장치로서,
    프로세서와,
    메모리를 구비하고,
    상기 프로세서는, 상기 메모리를 이용하여,
    복수의 삼차원점이 포함되는 대상 공간에 포함되는 복수의 서브 공간을 부호화함으로써 상기 복수의 서브 공간에 대응하는 복수의 부호화 데이터를 포함하는 비트 스트림을 생성하고,
    상기 비트 스트림의 생성에서는,
    상기 비트 스트림에 포함되는, 상기 복수의 부호화 데이터에 공통인 제1 제어 정보에, 상기 복수의 서브 공간에 할당된 복수의 식별자에 대응지어진 상기 복수의 서브 공간의 정보의 일람을 저장하고,
    상기 복수의 부호화 데이터의 각각의 헤더에, 당해 부호화 데이터에 대응하는 상기 서브 공간에 할당된 식별자를 저장하는,
    삼차원 데이터 부호화 장치.
  13. 속성 정보를 갖는 복수의 삼차원점을 복호하는 삼차원 데이터 복호 장치로서,
    프로세서와,
    메모리를 구비하고,
    상기 프로세서는, 상기 메모리를 이용하여,
    복수의 삼차원점이 포함되는 대상 공간에 포함되는 복수의 서브 공간을 부호화함으로써 얻어진, 상기 복수의 서브 공간에 대응하는 복수의 부호화 데이터를 포함하는 비트 스트림을 복호하고,
    상기 비트 스트림의 복호에서는,
    상기 복수의 서브 공간 중 복호 대상의 서브 공간을 결정하고,
    상기 비트 스트림에 포함되는, 상기 복수의 부호화 데이터에 공통인 제1 제어 정보에 포함되는, 상기 복수의 서브 공간에 할당된 복수의 식별자에 대응지어진 상기 복수의 서브 공간의 정보의 일람과, 상기 복수의 부호화 데이터의 각각의 헤더에 포함되는 당해 부호화 데이터에 대응하는 상기 서브 공간에 할당된 식별자를 이용하여, 상기 복호 대상의 서브 공간의 부호화 데이터를 취득하는,
    삼차원 데이터 복호 장치.
KR1020217000051A 2018-07-13 2019-07-10 삼차원 데이터 부호화 방법, 삼차원 데이터 복호 방법, 삼차원 데이터 부호화 장치, 및 삼차원 데이터 복호 장치 KR20210029187A (ko)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
US201862697598P 2018-07-13 2018-07-13
US62/697,598 2018-07-13
PCT/JP2019/027401 WO2020013249A1 (ja) 2018-07-13 2019-07-10 三次元データ符号化方法、三次元データ復号方法、三次元データ符号化装置、及び三次元データ復号装置

Publications (1)

Publication Number Publication Date
KR20210029187A true KR20210029187A (ko) 2021-03-15

Family

ID=69142437

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020217000051A KR20210029187A (ko) 2018-07-13 2019-07-10 삼차원 데이터 부호화 방법, 삼차원 데이터 복호 방법, 삼차원 데이터 부호화 장치, 및 삼차원 데이터 복호 장치

Country Status (9)

Country Link
US (3) US11197027B2 (ko)
EP (1) EP3822915A4 (ko)
JP (2) JP7374089B2 (ko)
KR (1) KR20210029187A (ko)
CN (1) CN112424833A (ko)
BR (1) BR112020027050A2 (ko)
CA (1) CA3105948A1 (ko)
MX (1) MX2021000430A (ko)
WO (1) WO2020013249A1 (ko)

Families Citing this family (20)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20210304354A1 (en) * 2018-07-13 2021-09-30 Electronics And Telecommunications Research Institute Method and device for encoding/decoding scalable point cloud
BR112021005557A2 (pt) * 2018-10-02 2021-06-29 Panasonic Intellectual Property Corporation Of America método de codificação de dados tridimensionais, método de decodificação de dados tridimensionais, dispositivo de codificação de dados tridimensionais e dispositivo de decodificação de dados tridimensionais
WO2020075861A1 (ja) * 2018-10-12 2020-04-16 パナソニック インテレクチュアル プロパティ コーポレーション オブ アメリカ 三次元データ符号化方法、三次元データ復号方法、三次元データ符号化装置、及び三次元データ復号装置
US11412200B2 (en) * 2019-01-08 2022-08-09 Samsung Electronics Co., Ltd. Method of processing and transmitting three-dimensional content
US20220245863A1 (en) * 2019-07-02 2022-08-04 Sony Group Corporation Information processing device and method
US11218698B2 (en) * 2019-09-27 2022-01-04 Nokia Technologies Oy Fractional/arbitrary tile grouping
CN114450941A (zh) * 2019-10-04 2022-05-06 松下电器(美国)知识产权公司 三维数据编码方法、三维数据解码方法、三维数据编码装置及三维数据解码装置
KR102551149B1 (ko) * 2020-02-27 2023-07-03 애플 인크. 포인트 클라우드 클러스터들의 공간적 관계들
CN115335868A (zh) * 2020-03-27 2022-11-11 松下电器(美国)知识产权公司 三维数据编码方法、三维数据解码方法、三维数据编码装置及三维数据解码装置
US11310528B2 (en) * 2020-03-30 2022-04-19 Tencent America LLC Methods of coding duplicate and isolated points for point cloud coding
CN115485730A (zh) * 2020-04-14 2022-12-16 松下电器(美国)知识产权公司 三维数据编码方法、三维数据解码方法、三维数据编码装置及三维数据解码装置
BR112022024646A2 (pt) * 2020-06-09 2022-12-27 Sony Group Corp Aparelho e método de processamento de informações
WO2021256559A1 (ja) * 2020-06-19 2021-12-23 パナソニック インテレクチュアル プロパティ コーポレーション オブ アメリカ 三次元データ符号化方法、三次元データ復号方法、三次元データ符号化装置、及び三次元データ復号装置
JP2022002382A (ja) * 2020-06-22 2022-01-06 Kddi株式会社 点群復号装置、点群復号方法及びプログラム
WO2022004682A1 (ja) * 2020-06-29 2022-01-06 パナソニック インテレクチュアル プロパティ コーポレーション オブ アメリカ 三次元データ符号化方法及び三次元データ符号化装置
US11941856B2 (en) * 2020-08-18 2024-03-26 Tencent America LLC Predictive tree-based geometry coding for a point cloud
KR20230109732A (ko) * 2020-12-25 2023-07-20 니폰 덴신 덴와 가부시끼가이샤 복호 방법, 복호 장치 및 프로그램
JPWO2022149589A1 (ko) * 2021-01-07 2022-07-14
JPWO2023013037A1 (ko) * 2021-08-06 2023-02-09
CN116309896A (zh) * 2021-12-20 2023-06-23 华为技术有限公司 数据编解码方法、装置和设备

Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2014020663A1 (ja) 2012-07-30 2014-02-06 三菱電機株式会社 地図表示装置

Family Cites Families (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5959672A (en) * 1995-09-29 1999-09-28 Nippondenso Co., Ltd. Picture signal encoding system, picture signal decoding system and picture recognition system
US6668091B1 (en) * 1998-10-02 2003-12-23 Samsung Electronics Co., Ltd. 3D mesh coding/decoding method
US6577310B1 (en) * 1998-12-01 2003-06-10 Samsung Electronics Co., Ltd. 3D mesh coding/decoding method and apparatus for error resilience and incremental rendering
KR101712351B1 (ko) * 2009-06-26 2017-03-06 에스케이 텔레콤주식회사 다차원 정수 변환을 이용한 영상 부호화/복호화 장치 및 방법
WO2013010317A1 (en) * 2011-07-18 2013-01-24 Technicolor (China) Technology Co., Ltd. Method for adaptive entropy coding of tree structures
KR101924249B1 (ko) * 2011-08-25 2018-11-30 톰슨 라이센싱 계위적 엔트로피 인코딩 및 디코딩
US10592490B2 (en) * 2011-11-25 2020-03-17 Interdigital Vc Holdings, Inc. Position coding based on spatial tree with duplicate points
JP6817961B2 (ja) * 2015-12-14 2021-01-20 パナソニック インテレクチュアル プロパティ コーポレーション オブ アメリカPanasonic Intellectual Property Corporation of America 三次元データ符号化方法、三次元データ復号方法、三次元データ符号化装置及び三次元データ復号装置
CN113008263B (zh) * 2016-11-01 2024-04-30 松下电器(美国)知识产权公司 数据生成方法及数据生成装置
US10679408B2 (en) * 2017-02-02 2020-06-09 Adobe Inc. Generating a three-dimensional model from a scanned object
EP3515066A1 (en) * 2018-01-19 2019-07-24 Thomson Licensing A method and apparatus for encoding and decoding three-dimensional scenes in and from a data stream
CN112119429A (zh) * 2018-05-11 2020-12-22 松下电器(美国)知识产权公司 三维数据编码方法、三维数据解码方法、三维数据编码装置、以及三维数据解码装置

Patent Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2014020663A1 (ja) 2012-07-30 2014-02-06 三菱電機株式会社 地図表示装置

Also Published As

Publication number Publication date
US20220030272A1 (en) 2022-01-27
BR112020027050A2 (pt) 2021-04-20
MX2021000430A (es) 2021-03-25
US11677981B2 (en) 2023-06-13
US20230300375A1 (en) 2023-09-21
JP7374089B2 (ja) 2023-11-06
CN112424833A (zh) 2021-02-26
US11197027B2 (en) 2021-12-07
CA3105948A1 (en) 2020-01-16
JPWO2020013249A1 (ja) 2021-07-15
JP2023181308A (ja) 2023-12-21
EP3822915A4 (en) 2021-08-18
WO2020013249A1 (ja) 2020-01-16
US20210127136A1 (en) 2021-04-29
EP3822915A1 (en) 2021-05-19

Similar Documents

Publication Publication Date Title
JP7374089B2 (ja) 三次元データ符号化方法、三次元データ復号方法、三次元データ符号化装置、及び三次元データ復号装置
JP7414713B2 (ja) 三次元データ符号化方法、三次元データ復号方法、三次元データ符号化装置、及び三次元データ復号装置
JP7248582B2 (ja) 三次元データ符号化方法、三次元データ復号方法、三次元データ符号化装置、及び三次元データ復号装置
JP7418531B2 (ja) 三次元データ符号化方法、三次元データ復号方法、三次元データ符号化装置、及び三次元データ復号装置
WO2019156141A1 (ja) 三次元データ符号化方法、三次元データ復号方法、三次元データ符号化装置、及び三次元データ復号装置
WO2019203297A1 (ja) 三次元データ符号化方法、三次元データ復号方法、三次元データ符号化装置、及び三次元データ復号装置
WO2019103009A1 (ja) 三次元データ符号化方法、三次元データ復号方法、三次元データ符号化装置、及び三次元データ復号装置
JP7237007B2 (ja) 三次元データ符号化方法、三次元データ復号方法、三次元データ符号化装置、及び三次元データ復号装置
JP7285789B2 (ja) 三次元データ符号化方法、三次元データ復号方法、三次元データ符号化装置、及び三次元データ復号装置
KR20210020924A (ko) 삼차원 데이터 부호화 방법, 삼차원 데이터 복호 방법, 삼차원 데이터 부호화 장치, 및 삼차원 데이터 복호 장치
WO2019230920A1 (ja) 三次元データ符号化方法、三次元データ復号方法、三次元データ符号化装置、及び三次元データ復号装置
JP2024103490A (ja) 三次元データ符号化方法、三次元データ復号方法、三次元データ符号化装置、及び三次元データ復号装置