KR102495551B1 - Http를 통한 동적 적응 스트리밍을 위한 세션 기반 정보 - Google Patents

Http를 통한 동적 적응 스트리밍을 위한 세션 기반 정보 Download PDF

Info

Publication number
KR102495551B1
KR102495551B1 KR1020217021428A KR20217021428A KR102495551B1 KR 102495551 B1 KR102495551 B1 KR 102495551B1 KR 1020217021428 A KR1020217021428 A KR 1020217021428A KR 20217021428 A KR20217021428 A KR 20217021428A KR 102495551 B1 KR102495551 B1 KR 102495551B1
Authority
KR
South Korea
Prior art keywords
session
sbd
request
key
client
Prior art date
Application number
KR1020217021428A
Other languages
English (en)
Other versions
KR20210100166A (ko
Inventor
이라즈 소다가르
Original Assignee
텐센트 아메리카 엘엘씨
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 텐센트 아메리카 엘엘씨 filed Critical 텐센트 아메리카 엘엘씨
Publication of KR20210100166A publication Critical patent/KR20210100166A/ko
Application granted granted Critical
Publication of KR102495551B1 publication Critical patent/KR102495551B1/ko

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L65/00Network arrangements, protocols or services for supporting real-time applications in data packet communication
    • H04L65/80Responding to QoS
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L67/00Network arrangements or protocols for supporting network services or applications
    • H04L67/01Protocols
    • H04L67/02Protocols based on web technology, e.g. hypertext transfer protocol [HTTP]
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L65/00Network arrangements, protocols or services for supporting real-time applications in data packet communication
    • H04L65/1066Session management
    • H04L65/1101Session protocols
    • H04L65/1108Web based protocols, e.g. webRTC
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L65/00Network arrangements, protocols or services for supporting real-time applications in data packet communication
    • H04L65/60Network streaming of media packets
    • H04L65/61Network streaming of media packets for supporting one-way streaming services, e.g. Internet radio
    • H04L65/612Network streaming of media packets for supporting one-way streaming services, e.g. Internet radio for unicast
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L65/00Network arrangements, protocols or services for supporting real-time applications in data packet communication
    • H04L65/60Network streaming of media packets
    • H04L65/65Network streaming protocols, e.g. real-time transport protocol [RTP] or real-time control protocol [RTCP]
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/80Generation or processing of content or additional data by content creator independently of the distribution process; Content per se
    • H04N21/83Generation or processing of protective or descriptive data associated with content; Content structuring
    • H04N21/84Generation or processing of descriptive data, e.g. content descriptors

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Business, Economics & Management (AREA)
  • General Business, Economics & Management (AREA)
  • Information Transfer Between Computers (AREA)
  • Two-Way Televisions, Distribution Of Moving Picture Or The Like (AREA)

Abstract

본 개시내용의 양태들은 세션의 미디어 데이터를 수신하기 위한 방법들, 장치들 및 비-일시적 컴퓨터 판독가능한 매체를 제공한다. 하나의 장치는 세션 기반 디스크립션(SBD) 클라이언트에 의해 복수의 키-값 쌍을 포함하는 SBD 파일을 수신하는 프로세싱 회로를 포함한다. 프로세싱 회로는 SBD 클라이언트에 의해, 하이퍼텍스트 전송 프로토콜을 통한 동적 적응 스트리밍(DASH) 액세스 클라이언트로부터 복수의 키-값 쌍 중 하나에 연관된 값에 대한 제1 요청을 수신한다. 프로세싱 회로는 제1 요청에 응답하여 복수의 키-값 쌍 중 하나에 연관된 값을 SBD 클라이언트로부터 상기 DASH 액세스 클라이언트로 송신한다. 값은 DASH 액세스 클라이언트에 의해, 콘텐츠 서버에 송신되는 제2 요청에 포함된다.

Description

HTTP를 통한 동적 적응 스트리밍을 위한 세션 기반 정보
참조에 의한 포함
본 출원은 2019년 9월 30일자로 출원된 미국 가출원 제62/908,260호 "세션 기반 DASH 동작들의 세션 기반 디스크립션을 위한 일반화된 타이밍 모델, 데이터 모델, 및 계층(A GENERALIZED TIMING MODEL, DATA MODEL, AND HIERARCHY FOR SESSION-BASED DESCRIPTION OF SESSION-BASED DASH OPERATIONS)"의 우선권의 이익을 주장하는, 2020년 9월 22일자로 출원된 미국 특허 출원 제17/028,286호 "HTTP를 통한 동적 적응 스트리밍을 위한 세션 기반 정보(SESSION-BASED INFORMATION FOR DYNAMIC ADAPTIVE STREAMING OVER HTTP)"의 우선권의 이익을 주장한다. 선행 출원의 전체 개시내용은 그 전체가 여기에 참조로 포함된다.
기술분야
본 개시내용은 일반적으로 하이퍼텍스트 전송 프로토콜을 통한 동적 적응 스트리밍(dynamic adaptive streaming over hypertext transfer protocol)(DASH)을 위한 세션 기반 정보에 관련된 실시예들을 설명한다.
여기에 제공된 배경 기술 설명은 일반적으로 본 개시내용의 맥락을 제시하기 위한 것이다. 출원 시 선행 기술로의 자격을 갖지 않을 수 있는 설명의 양태들뿐만 아니라, 현재 이름이 기재된 발명자의 작업은, 그 작업이 이러한 배경기술 섹션에 설명되는 한도 내에서, 명시적으로도 암시적으로도 본 개시내용에 대한 선행 기술로 인정되지 않는다.
MPEG(Moving Picture Experts Group)은 세션 기반 DASH 동작들을 위해, 하이퍼텍스트 전송 프로토콜을 통한 동적 적응 스트리밍(DASH) 표준화의 새로운 부분을 시작했다. 미디어 프레젠테이션 디스크립션(media presentation description)(MPD) 파일은 모든 클라이언트에 대해 일반적이지만, 클라이언트는 클라이언트가 MPD를 세션에 특정하게 만들기 위한 명령어들을 제공하는 세션 기반 디스크립션(session-based description)(SBD) 파일과 같은 부가 파일을 취득할 수 있다. 그러나, 현재 설계에서는, 소정의 SBD 특정 정보가 여전히 MPD 파일 내에 운반된다. 추가로, SBD는 (예를 들어, 포렌식 워터마킹(forensic watermarking)을 사용하여) 애플리케이션별로 특정하게 설계되며 다른 애플리케이션들을 처리하기에 충분히 일반적이지 않다.
본 개시내용의 양태들은 세션의 미디어 데이터를 수신하기 위한 장치들을 제공한다. 하나의 장치는 세션 기반 디스크립션(SBD) 클라이언트에 의해 복수의 키-값 쌍을 포함하는 SBD 파일을 수신하는 프로세싱 회로를 포함한다. 프로세싱 회로는 SBD 클라이언트에 의해, 하이퍼텍스트 전송 프로토콜을 통한 동적 적응 스트리밍(DASH) 액세스 클라이언트로부터 복수의 키-값 쌍 중 하나에 연관된 값에 대한 제1 요청을 수신한다. 프로세싱 회로는 제1 요청에 응답하여 복수의 키-값 쌍 중 하나에 연관된 값을 SBD 클라이언트로부터 DASH 액세스 클라이언트로 송신한다. 값은 DASH 액세스 클라이언트에 의해, 콘텐츠 서버에 송신되는 제2 요청에 포함된다.
실시예에서, 세션은 SBD 파일에 따라 세션 타임라인에서 하나 이상의 서브-세션으로 분할된다. 하나 이상의 서브-세션 각각은 세션 타임라인 내의 상이한 주기에 연관된다.
실시예에서, SBD 파일은 세션의 시작 시간을 나타내는 제1 타이밍 속성, 및 하나 이상의 서브-세션 중 하나에 대해 세션의 시작 시간으로부터의 시작 시간 오프셋을 나타내는 제2 타이밍 속성을 포함한다.
실시예에서, SBD 파일은 루프 속성을 포함하고, 루프 속성은 루프 속성이 인에이블될 때 세션이 반복됨을 나타낸다.
실시예에서, SBD 파일은 하나 이상의 서브-세션 중 하나에 대한 식별 속성을 포함한다.
실시예에서, 제2 요청은 세그먼트 요청, 미디어 프레젠테이션 디스크립션 업데이트 요청(media presentation description update request), 및 확장가능한 마크업 언어(extensible markup language)(XML) 링킹 언어(linking language)(XLINK) 요청 중 하나이다.
실시예에서, 제2 요청이 세그먼트 요청일 때, 복수의 키-값 쌍 중 하나에 연관된 값은 미디어 타입 및 적응 세트 중 하나를 나타낸다.
실시예에서, 프로세싱 회로는 제1 요청의 타이밍 및 제1 요청의 순서 중 하나에 따라 복수의 키-값 쌍 중 하나에 연관된 값을 송신한다.
실시예에서, 복수의 키-값 쌍 중 하나에 연관된 값은 제2 요청의 유니폼 리소스 로케이터(uniform resource locator)(URL)의 쿼리, 및 제2 요청의 하이퍼텍스트 전송 프로토콜(hypertext transfer protocol)(HTTP) 헤더 중 하나에 포함된다.
실시예에서, SBD 파일은 SBD 파일의 타입이 정적 타입 및 동적 타입 중 하나임을 나타내는 타입 속성을 포함한다.
본 개시내용의 양태들은 또한 세션의 미디어 데이터를 수신하기 위한 방법들을 제공한다. 하나의 방법에서, 복수의 키-값 쌍을 포함하는 SBD 파일이 SBD 클라이언트에 의해 수신된다. DASH 액세스 클라이언트로부터 송신된 제1 요청은 SBD 클라이언트에 의해 수신된다. 제1 요청은 복수의 키-값 쌍 중 하나에 연관된 값을 요청하기 위한 것이다. 복수의 키-값 쌍 중 하나에 연관된 값은 제1 요청에 응답하여 SBD 클라이언트로부터 DASH 액세스 클라이언트로 송신된다. 값은 DASH 액세스 클라이언트에 의해, 콘텐츠 서버에 송신되는 제2 요청에 포함된다.
본 개시내용의 양태들은 또한 세션에 대한 미디어 데이터를 수신하기 위해 컴퓨터에 의해 실행될 때 컴퓨터로 하여금 세션에 대한 미디어 데이터를 수신하기 위한 방법들 중 어느 하나 또는 그것들의 조합을 수행하게 하는 명령어들을 저장하는 비-일시적 컴퓨터 판독가능한 매체를 제공한다.
개시된 주제의 추가의 특징들, 본질 및 다양한 이점들은 이하의 상세한 설명 및 첨부 도면들로부터 더욱 명백해질 것이다.
도 1은 본 개시내용의 실시예에 따른 예시적인 세션 기반의 하이퍼텍스트 전송 프로토콜을 통한 동적 적응 스트리밍(DASH) 시스템을 도시한다.
도 2는 본 개시내용의 실시예에 따른 다른 예시적인 세션 기반 DASH 시스템을 도시한다.
도 3은 본 개시내용의 실시예에 따른 예시적인 계층적 세션 기반 디스크립션(SBD) 데이터 모델을 도시한다.
도 4a 및 도 4b는 본 개시내용의 실시예에 따른 정적 SBD 및 동적 SBD의 예시적인 타이밍 모델들을 도시한다.
도 5a 및 도 5b는 본 개시내용의 실시예에 따른 SBD의 예시적인 타임라인 및 오더라인 요소들을 도시한다.
도 6은 일부 실시예들에 따른 프로세스 예를 개략적으로 설명하는 흐름도를 도시한다.
도 7은 실시예에 따른 컴퓨터 시스템의 개략도이다.
I. 하이퍼텍스트 전송 프로토콜을 통한 동적 적응 스트리밍( DASH ) 및 미디어 프레젠테이션 디스크립션 ( MPD )
하이퍼텍스트 전송 프로토콜을 통한 동적 적응 스트리밍(DASH)은 웹 서버들, 콘텐츠 배송 네트워크들(content delivery networks)(CDN들), 다양한 프록시들 및 캐시들, 및 그와 유사한 것과 같은 하이퍼텍스트 전송 프로토콜(HTTP) 인프라스트럭쳐를 사용하여 미디어 콘텐츠를 스트리밍할 수 있는 적응형 비트레이트 스트리밍 기술이다. DASH는 DASH 서버로부터 DASH 클라이언트로의 온-디맨드 및 라이브 스트리밍 둘 다를 지원하고, DASH 클라이언트가 스트리밍 세션을 제어하는 것을 허용하며, 그에 의해 DASH 서버는 대규모 배포에서의 스트림 적응 관리의 추가적 부하에 대처할 필요가 없게 된다. DASH는 또한 DASH 클라이언트가 다양한 DASH 서버들로부터의 스트리밍을 선택하는 것을 허용하고, 따라서 DASH 클라이언트의 이익을 위해 네트워크의 추가 로드 밸런싱을 달성한다. DASH는 예를 들어 네트워크 조건들에 적응되도록 비트레이트들을 변경함으로써 상이한 미디어 트랙들 간의 동적 전환을 제공한다.
DASH에서, 미디어 프레젠테이션 디스크립션(MPD) 파일은 DASH 클라이언트가 DASH 서버로부터 미디어 세그먼트들을 다운로드함으로써 미디어 콘텐츠를 적응적으로 스트리밍하기 위한 정보를 제공한다. 세션 스타트업 지연을 줄이기 위해, MPD 파일은 조각화되어 부분들로 배송될 수 있다. MPD 파일은 또한 스트리밍 세션 동안 업데이트될 수 있다. 일부 예들에서, MPD 파일은 콘텐츠 액세스가능성 특징들, 등급들, 및 카메라 뷰들의 표현을 지원한다. DASH는 또한 멀티-뷰 및 스케일가능한 코딩된 콘텐츠의 배송을 지원한다.
MPD 파일은 하나 이상의 주기의 시퀀스를 포함할 수 있다. 하나 이상의 주기 각각은 MPD 파일 내의 주기 요소에 의해 정의될 수 있다. MPD 파일은 MPD에 대한 availableStartTime 속성, 및 하나 이상의 주기에 대한 시작 속성을 포함할 수 있다. (예를 들어, 라이브 서비스들을 위해 사용되는) 동적 타입을 갖는 미디어 프레젠테이션들에 대해, 미디어 세그먼트의 기간(duration) 및 MPD 속성 availableStartTime 및 주기의 시작 속성의 합계는 조정된 표준시(UTC) 포맷의 주기의 가용성 시간, 특히 대응하는 주기 내의 각각의 표현의 제1 미디어 세그먼트를 나타낼 수 있다. (예를 들어, 온-디맨드 서비스들을 위해 사용되는) 정적 타입의 미디어 프레젠테이션들에 대해, 제1 주기의 시작 속성은 0일 수 있다. 임의의 다른 주기에 대해, 시작 속성은 제1 주기의 시작 시간에 대한 대응하는 주기의 시작 시간의 시간 오프셋을 지정할 수 있다. 각각의 주기는 다음 주기의 시작까지, 또는 마지막 주기의 경우에는 미디어 프레젠테이션의 끝까지 연장될 수 있다. 주기 시작 시간들은 정확할 수 있으며, 모든 이전 주기들의 미디어 재생으로 인한 실제 타이밍을 반영할 수 있다.
각각의 주기는 하나 이상의 적응 세트를 포함할 수 있고, 적응 세트들 각각은 동일한 미디어 콘텐츠에 대한 하나 이상의 표현(representation)을 포함할 수 있다. 표현은 오디오 또는 비디오 데이터의 다수의 대안적인 인코딩된 버전 중 하나일 수 있다. 표현들은 인코딩 타입들, 예를 들어 비트레이트, 해상도, 및/또는 비디오 데이터를 위한 코덱 및 비트레이트, 및/또는 오디오 데이터의 코덱에 따라 다를 수 있다. 표현이라는 용어는 멀티미디어 콘텐츠의 특정 주기에 대응하고 특정 방식으로 인코딩된, 인코딩된 오디오 또는 비디오 데이터의 섹션을 지칭하기 위해 사용될 수 있다.
MPD 파일에서 그룹 속성에 의해 표시되는 그룹에 대해, 특정 주기의 적응 세트들이 할당될 수 있다. 동일한 그룹 내의 적응 세트들은 일반적으로 서로에 대한 대안으로 고려된다. 예를 들어, 특정 주기에 대한 비디오 데이터의 각각의 적응 세트가 동일한 그룹에 할당될 수 있으며, 그에 의해, 대응하는 주기 동안 멀티미디어 콘텐츠의 비디오 데이터를 디스플레이하기 위한 디코딩을 위해, 적응 세트 중 임의의 것이 선택될 수 있다. 일부 예들에서, 하나의 주기 내의 미디어 콘텐츠는, 그룹 0으로부터의 하나의 적응 세트가 존재한다면 그것에 의해, 또는 각각의 비-제로 그룹으로부터의 최대 하나의 적응 세트의 조합에 의해 표현될 수 있다. 주기의 각각의 표현에 대한 타이밍 데이터는 주기의 시작 시간에 대해 표시될 수 있다.
표현은 하나 이상의 세그먼트를 포함할 수 있다. 각각의 표현은 초기화 세그먼트를 포함할 수 있고, 또는 표현의 각각의 세그먼트가 자체 초기화될 수 있다. 존재하는 경우, 초기화 세그먼트는 표현에 액세스하기 위한 초기화 정보를 포함할 수 있다. 일부 경우들에서, 초기화 세그먼트는 미디어 데이터를 포함하지 않는다. 세그먼트는 유니폼 리소스 로케이터(URL), 유니폼 리소스 네임(uniform resource name)(URN), 또는 유니폼 리소스 식별자(uniform resource identifier)(URI)와 같은 식별자에 의해 고유하게 참조될 수 있다. MPD 파일은 각각의 세그먼트에 대한 식별자들을 제공할 수 있다. 일부 예들에서, MPD 파일은 또한 URL, URN 또는 URI에 의해 액세스가능한 파일 내의 세그먼트에 대한 데이터에 대응할 수 있는 범위 속성(range attribute)의 형태로 바이트 범위들(byte ranges)을 제공할 수 있다.
각각의 표현은 또한 하나 이상의 미디어 컴포넌트를 포함할 수 있고, 여기서 각각의 미디어 컴포넌트는 오디오, 비디오 또는 시간이 지정된 텍스트(timed text)(예를 들어, 폐쇄 자막용)와 같은 하나의 개별 미디어 타입의 인코딩된 버전에 대응할 수 있다. 미디어 컴포넌트들은 하나의 표현 내에서 연속적인 미디어 세그먼트들의 경계들에 걸쳐 시간-연속적일 수 있다.
일부 실시예들에서, DASH 클라이언트는 DASH 서버로부터의 MPD 파일에 액세스하고 그것을 다운로드할 수 있다. 즉, DASH 클라이언트는 라이브 세션을 시작하는 데 사용할 MPD 파일을 검색할 수 있다. MPD 파일에 기초하여, 그리고 각각의 선택된 표현에 대해, DASH 클라이언트는 서버에서 이용가능한 최신 세그먼트가 무엇인지를 결정하는 것, 다음 세그먼트 및 가능하게는 장래 세그먼트의 세그먼트 가용성 시작 시간을 결정하는 것, 세그먼트의 재생을 언제, 그리고 세그먼트 내의 어느 타임라인으로부터 시작할지를 결정하는 것, 새로운 MPD 파일을 언제 가져오거나/페치할지를 결정하는 것을 포함하여, 몇몇 결정을 할 수 있다. 서비스가 실행되고 나면, 클라이언트는 검출되고 보상될 필요가 있는, 라이브 서비스와 자체 재생 사이의 드리프트를 추적할 수 있다.
Ⅱ. 세션 기반 DASH 동작 및 세션 기반 디스크립션 ( SBD )
MPD 파일은 모든 DASH 클라이언트에 대해 일반적일 수 있음에 유의해야 한다. MPD 파일을 DASH 클라이언트의 세션에 특정하게 만들기 위해, MPEG(moving picture expert group)는 세션 기반 DASH 동작들을 제공한다. 세션 기반 DASH 동작들에서, DASH 클라이언트는 세션 기반 디스크립션(SBD) 파일과 같은 부가 파일을 수신할 수 있고, 이것은 DASH 클라이언트가 세션 별로, 그리고 가능하게는 클라이언트 별로 MPD 파일을 맞춤화하기 위한 명령어들을 제공한다. 그러나, 일부 관련 예들에서, 세션 기반 DASH 동작은 애플리케이션 특정적이다. 즉, 각각의 새로운 애플리케이션에 대해, 새로운 SBD 포맷이 요구된다.
본 개시내용은 모든 세션 기반 애플리케이션을 위한 단일 솔루션을 제공할 수 있는 일반화된 SBD 포맷을 제시한다.
도 1은 본 개시내용의 실시예에 따른 세션 기반 DASH 동작들(100)의 예시적인 아키텍처를 도시한다. 세션 기반 DASH 동작 아키텍처(100)에서, MPD 파일은 DASH 서버(101)(예를 들어, 콘텐츠 서버)로부터 DASH 클라이언트(102)로 송신된다. DASH 클라이언트(102)는 MPD 파일에 기초하여 DASH 서버(101)로부터 미디어 세그먼트들을 수신할 수 있다. 추가로, DASH 클라이언트(102)는 DASH 서버(101) 또는 제3자(예를 들어, 세션 컨트롤러)로부터 SBD 파일을 수신할 수 있다.
본 개시내용의 양태들에 따르면, SBD 파일은 추가 메타데이터와 함께, 복수의 시간 범위 및 대응하는 키-값 쌍(또는 이름-값 쌍)을 포함할 수 있다. SBD 파일은 예를 들어 URL에 의해 MPD 파일에서 참조될 수 있다. SBD 파일은 DASH 클라이언트(102)에 의해 수신된 MPD 파일을 DASH 클라이언트(102)의 세션에 대해 특정하도록 맞춤화하기 위해 사용될 수 있다. 예를 들어, SBD 파일은 고유한 세션 별 MPD들을 생성하지 않고도 세그먼트 URL들에 세션 별 요소들을 추가하는 것을 허용할 수 있다.
도 2는 본 개시내용의 실시예에 따른 다른 예시적인 세션 기반 DASH 동작 아키텍처(200)를 도시한다. 세션 기반 DASH 동작 아키텍처(200)에서, 멀티미디어 콘텐츠는 오디오 소스(예를 들어, 마이크로폰) 및 비디오 소스(예를 들어, 비디오 카메라)를 포함할 수 있는 콘텐츠 생성 디바이스(201)(예를 들어, 스마트폰)에 의해 준비되고 생성된다. 멀티미디어 콘텐츠는 콘텐츠 생성 디바이스(201)에 의해 저장되거나, 다양한 멀티미디어 콘텐츠를 저장할 수 있는 콘텐츠 서버(202)에 송신될 수 있다. 콘텐츠 서버(202)는 멀티미디어 콘텐츠의 하나 이상의 미디어 세그먼트에 대해, DASH 액세스 클라이언트(203)와 같은 클라이언트 디바이스로부터의 요청을 수신할 수 있다. 멀티미디어 콘텐츠는 콘텐츠 서버(202)에 의해 저장 및 업데이트될 수 있고 미디어 세그먼트들을 검색하기 위해 DASH 액세스 클라이언트(203)를 포함하는 클라이언트 디바이스들에 의해 액세스될 수 있는 MPD 파일에 의해 설명된다.
세션 특정 미디어 세그먼트를 검색하기 위해, DASH 액세스 클라이언트(203)는 SBD 클라이언트(204)에 의해 수신되고 현재 세션에 대한 복수의 시간 범위 및 대응하는 키-값 쌍들을 포함하는 SBD 파일에 액세스하기 위한 요청을 SBD 클라이언트(204)(예를 들어, 세션 클라이언트)에 송신할 수 있다. 예를 들어, DASH 액세스 클라이언트(203)는 키 이름 및 시간 범위를 SBD 클라이언트(204)에 송신할 수 있으며, 그러면 SBD 클라이언트는 키 이름 및 시간 범위를 구문분석하고, 키 이름 및 시간 범위에 대응하는 값을 DASH 액세스 클라이언트(203)에 반환한다. DASH 액세스 클라이언트(203)는 세그먼트 요청이 HTTP GET 또는 부분 GET 요청일 때 세션 특정 미디어 세그먼트를 요청하기 위해 콘텐츠 서버(202)에 송신될 수 있는 세그먼트 URL의 쿼리에 그 값을 포함시킬 수 있다.
SBD 클라이언트(204)는 세션 컨트롤러(205) 및 세션 컨트롤러(206)와 같은 상이한 세션 컨트롤러들로부터 다수의 SBD 파일을 수신할 수 있다는 점에 유의한다.
본 개시내용의 양태들에 따르면, 콘텐츠 서버(202)(예를 들어, DASH 서버)의 임의의 또는 모든 특징은 라우터들, 브리지들, 프록시 디바이스들, 스위치들, 또는 다른 디바이스들과 같은 콘텐츠 배송 네트워크(CDN)의 하나 이상의 디바이스에서 구현된다. 콘텐츠 서버(202)는 클라이언트 디바이스들(예를 들어, DASH 액세스 클라이언트(203))로부터 네트워크 요청들을 수신하도록 구성된 요청 프로세싱 유닛을 포함할 수 있다. 예를 들어, 요청 프로세싱 유닛은 HTTP GET 또는 부분 GET 요청을 수신하고, 요청들에 응답하여 멀티미디어 콘텐츠의 데이터를 제공하도록 구성될 수 있다. 요청들은 세그먼트의 URL을 사용하여 세그먼트를 지정할 수 있다. 일부 예들에서, 요청들은 또한 세그먼트의 하나 이상의 바이트 범위를 지정할 수 있고, 따라서 부분 GET 요청들을 포함한다. 요청 프로세싱 유닛은 세그먼트의 헤더 데이터를 제공하기 위해 HTTP HEAD 요청들을 서비스하도록 더 구성될 수 있다.
일부 실시예들에서, 콘텐츠 생성 디바이스(201) 및 콘텐츠 서버(202)는 무선 네트워크 또는 유선 네트워크에 의해 결합될 수 있거나, 직접적으로 통신 결합될 수 있다.
일부 실시예들에서, 콘텐츠 생성 디바이스(201) 및 콘텐츠 서버(202)는 동일한 디바이스에 포함될 수 있다.
일부 실시예들에서, 콘텐츠 서버(202) 및 세션 컨트롤러들(205)-(206)은 동일한 디바이스에 포함될 수 있다.
일부 실시예들에서, 콘텐츠 서버(202) 및 DASH 액세스 클라이언트(203)는 무선 네트워크 또는 유선 네트워크에 의해 결합될 수 있다.
일부 실시예들에서, SBD 클라이언트(204) 및 세션 컨트롤러들(205)-(206)은 무선 네트워크 또는 유선 네트워크에 의해 결합될 수 있거나, 직접적으로 통신 결합될 수 있다.
일부 실시예들에서, DASH 액세스 클라이언트(203) 및 SBD 클라이언트(204)는 동일한 디바이스에 포함될 수 있다.
도 3은 본 개시내용의 실시예에 따른 예시적인 계층적 SBD 데이터 모델(300)을 도시한다. 자바스크립트 객체 표기법(JavaScript object notation)(JSON)으로 구현될 수 있는 계층적 SBD 데이터 모델(300)에서, SBD 파일은 하나 이상의 주기를 포함할 수 있다. 각각의 주기는 하나 이상의 요청 타입 요소를 갖는다. 요청들의 타입들은 세그먼트 요청, MPD 업데이트 요청, 및 확장가능한 마크업 언어(XML) 링킹 언어(XLINK) 요청을 포함할 수 있다. 각각의 요청 타입은 미디어 타입 또는 적응 세트로서 정의되거나 둘 다일 수 있는 스코프(scope)를 가질 수 있다. 각각의 스코프 내에서, 복수의 키-값 쌍 각각은 타임라인 및/또는 오더라인에 연관될 수 있다. 마지막으로, 쿼리/헤더 확장자들은 이러한 키-값 쌍들이 추가될 위치를 정의할 수 있다.
특히, SBD 파일은 SBD@availabilityStartTime과 같은 가용성 시작 시간 속성을 포함할 수 있다. SBD 가용성 시작 시간 속성은 임의적으로(optionally) 세션의 시작을 위해 벽시계 시간(wall-clock time)에 대한 앵커를 제공한다. SBD 가용성 시작 시간 속성 SBD@availabilityStartTime은 MPD 가용성 시작 시간 속성 MPD@availabilityStartTime과 유사할 수 있지만, 세션에 대한 앵커이다. SBD@availabilityStartTime은 동적 MPD들에 대한 앵커를 제공할 수 있다.
추가로, 세션은 하나 이상의 주기를 포함할 수 있다. MPD들과 마찬가지로, 세션 주기는 세션 타임라인에서의 기간을 정의할 수 있다. SBD 파일에서, 각각의 주기는 SBD@availabilityStartTime으로부터의 시작 시간 오프셋을 나타내는 @start와 같은 시작 속성을 가질 수 있다. 세션은 랩 어라운드의 가능성을 가질 수 있는데, 이는 마지막 주기의 끝에서 SBD@wrap과 같은 랩 어라운드 요소가 설정되면 세션이 랩 어라운드하고 제1 주기로 계속됨을 의미한다. 세션 내의 각각의 주기는 개별 주기의 식별을 위해 period@id와 같은 주기 식별자를 가질 수 있다. 각각의 period@id는 주어진 SBD 파일에 대해 고유한 값을 가질 수 있다.
각각의 주기는 MPD 파일 내에 이하의 요청들: 예컨대 세그먼트 요청들, MPD 업데이트 요청들, 및/또는 XLINK 요청들 중 하나 이상에 대한 맞춤화된 정보를 가질 수 있다. 세그먼트 요청은 하나 이상의 미디어 타입 및/또는 하나 이상의 적응 세트에 대해 더 지정될 수 있다.
개별 요청들에 대한 맞춤화들은 요청의 타이밍에 기초하는 시간 기반 할당, 및 요청의 순서에 기초하는 순서 기반 할당 중 하나에 따라 발생할 수 있다. 각각의 요청의 맞춤화는 URL 요청의 쿼리 및/또는 하나 이상의 HTTP 헤더 확장자에 하나 이상의 키-값 쌍과 같은 보충 정보를 추가하는 것을 포함할 수 있다.
추가로, SBD는 정적 또는 동적일 수 있으며, SBD가 동적이면 업데이트될 수 있다.
도 4a 및 도 4b는 본 개시내용의 실시예에 따른 정적 SBD 및 동적 SBD의 예시적인 타이밍 모델들을 도시한다. 도 4a에서, SBD의 타입은 정적이고(예를 들어, SBD@type = static), SBD의 타이밍 모델은 MPD@type = static일 때의 MPD의 타이밍 모델과 유사하지만 SBD가 랩 어라운드할 수 있다는 점에서 차이를 갖는데, 즉 주기 2(P2)를 마친 후 SBD가 주기 0(P0)으로 돌아가서 다시 시작할 수 있음을 의미한다. 도 4b에서, SBD의 타입은 동적이고(예를 들어, SBD@type = dynamic), SBD의 타이밍 모델은 MPD@type = dynamic일 때의 MPD의 모델과 유사하다. 그러나, 다시 SBD는 랩 어라운드될 수 있고, 이는 P2의 끝에서 P0이 계속되는 식일 것임을 의미한다.
SBD 내의 주기들은 MPD 주기들과 시간 정렬될 수도 있고 그렇지 않을 수도 있음에 유의해야 한다. SBD 내에 주기들을 갖는 이유는 SBD 내에 주기를 삽입하거나 교체할 수 있게 하고, 따라서 MPD 세션의 상이한 기간들 동안 상이한 세션 기반 조작을 가능하게 하기 위한 것이다.
도 5a 및 도 5b는 본 개시내용의 실시예에 따른 SBD의 예시적인 타임라인 및 오더라인 요소들을 도시한다. 도 5a에서, 타임라인 요소는 타임라인을 다양한 기간들로 분할하고, 그러한 기간들 각각에서, 하나 이상의 할당이 URL의 쿼리에 추가되거나 헤더 확장자로서 추가된다. 각각의 타임라인은 MPD 파일 내의 SegmentTimeline과 유사한 방식으로 구축될 수 있다. 예를 들어, S 요소는 기간의 시간을 표시하고, S@t는 S 요소의 (임의적) 시작 시간이고, @d는 요소의 기간이고, @v는 대응하는 기간 내에서 발생하는 요청에 대해 추가될 하나 이상의 키-값 쌍을 포함하며, @r은 이 S 요소에 대한 반복 횟수를 표시한다. 도 5b에서, 오더라인 요소는 각각의 요청에 추가될 키-값 쌍들의 순서를 정의한다. 예를 들어, O 요소는 순서를 표시하고, O@t는 O 요소의 (임의적) 시작 시간이고, @v는 대응하는 순서로 발생하는 요청에 대해 추가될 하나 이상의 키-값 쌍을 포함하며, @r은 O 요소에 대한 반복 횟수를 표시한다.
본 개시내용의 양태들에 따르면, DASH 클라이언트(102)는 MPD 파일에서 URL에 의해 표시된 위치로부터 SBD 파일을 다운로드하고 SBD 파일 JSON 객체를 구문분석하고 타임라인/오더라인 테이블을 구축할 수 있다. 다음으로, DASH 클라이언트(102)는 (서브)세그먼트를 요청하기 위한 타임라인/오더라인 테이블 내의 일치하는 행, 및 그 일치하는 행 내의 SBD 디스크립터에 나열된 각각의 키에 대한 대응하는 값을 찾을 수 있고, SBD 디스크립터 내에 정의된 키들의 순서로 쿼리를 구축하고 세그먼트 요청에 쿼리를 추가할 수 있다.
SBD 파일은 XML 및/또는 JSON을 사용하여 구현될 수 있다. XML 구현에 대해, MPD 및 주기들의 것과 유사하거나 동일한 XML 구조가 사용될 수 있다. UrlQueryInfoType 및 ExtendedUrlInfoType과 같은 MPD 및 주기들의 XML 구조 내의 일부 요소들 및 속성들이 SBD의 XML 구조에서 사용될 수 있다. JSON 구현에 대해, 도 3에 보여진 계층 데이터 모델이 사용될 수 있다.
실시예에서, DASH 액세스 클라이언트(203)는 MPD 파일을 수신하고 MPD 파일의 URL 주소를 SBD 클라이언트(204)에 전달할 수 있다. SBD 클라이언트(204)는 URL 주소로부터 키-값 객체를 다운로드하고 타임라인/오더라인 테이블을 구축할 수 있다. DASH 클라이언트(203)는 SBD 클라이언트(204)에 (서브)세그먼트의 키 및 타이밍 또는 순서를 송신할 수 있으며, SBD 클라이언트는 요청된 (서브)세그먼트의 타이밍 또는 순서를 계산하고, 타임라인/오더라인 테이블에서 요청된 (서브)세그먼트의 타이밍 또는 순서와 일치하는 행을 찾는다. 다음으로, SBD 클라이언트는 일치하는 행의 키-값 쌍에서 DASH 클라이언트(203)에 의해 송신된 키와 일치하는, 일치하는 키 이름을 찾고, 일치된 키 이름에 대응하는 값을 DASH 클라이언트(203)에 반환한다. DASH 클라이언트(203)는 (서브)세그먼트 요청에서 사용되는 세그먼트 URL의 쿼리 끝에 또는 HTTP 헤더 확장자로서 값(또는 key = value)을 추가할 수 있다.
본 개시내용의 양태들에 따르면, 세션 기반 DASH 동작을 설명하기 위한 일반화된 애플리케이션 독립적인 방법이 존재한다. 방법은 세션 기반 정보를 다양한 애플리케이션에 적용하는 것을 허용한다. 세션 기반 동작의 모든 정보는 SBD 파일에 포함되며 MPD 파일에는 정보가 포함되지 않는다. 세션 기반 동작은 정적 또는 동적 타임라인들에서 설명될 수 있다. 동적 타임라인들은 업데이트될 수 있다. 세그먼트 요청, MPD 업데이트 요청, 및 XLINK 요청 중 하나 이상 및/또는 그들의 임의의 조합에 대한 다양한 동작들이 규정될 수 있다. 동작들은 하나 이상의 미디어 타입 및/또는 적응 세트들 또는 조합에 적용될 수 있다. 동작들은 SBD가 반복 패턴들을 계속하는 것을 허용하는 랩 어라운드 기능과 함께, 요청들의 타임라인 또는 오더라인에 따라 규정될 수 있다. 방법은 MPD XML 포맷과 유사한 XML 포맷, 또는 계층 데이터 모델이 구현될 수 있는 JSON 포맷으로 구현될 수 있다.
Ⅲ. 흐름도
도 6은 본 개시내용의 실시예에 따른 프로세스(600)를 개략적으로 설명하는 흐름도를 도시한다. 다양한 실시예들에서, 프로세스(600)는 DASH 클라이언트(102) 내의 프로세싱 회로, DASH 액세스 클라이언트(203) 내의 프로세싱 회로, SBD 클라이언트(204) 내의 프로세싱 회로, 및 그와 유사한 것과 같은 프로세싱 회로에 의해 실행된다. 일부 실시예들에서, 프로세스(600)는 소프트웨어 명령어들로 구현되므로, 프로세싱 회로가 소프트웨어 명령어들을 실행할 때, 프로세싱 회로는 프로세스를 수행한다(600). 프로세스(600)는 SBD 클라이언트에 의해 복수의 키-값 쌍을 포함하는 SBD 파일을 수신하는 (S610)에서 프로세스(600)가 시작한다. 다음으로, 프로세스(600)는 단계(S620)로 진행한다.
단계(S620)에서, 프로세스(600)는 SBD 클라이언트에 의해 DASH 액세스 클라이언트로부터 복수의 키-값 쌍 중 하나에 연관된 값에 대한 제1 요청을 수신한다. 다음으로, 프로세스(600)는 단계(S630)로 진행한다.
단계(S630)에서, 프로세스(600)는 제1 요청에 응답하여 복수의 키-값 쌍 중 하나에 연관된 값을 SBD 클라이언트로부터 DASH 액세스 클라이언트로 송신한다. 이 값은 DASH 액세스 클라이언트에 의해, 콘텐츠 서버에 송신되는 제2 요청에 포함된다. 다음으로, 프로세스(600)가 종료된다.
실시예에서, 세션은 SBD 파일에 따라 세션 타임라인에서 하나 이상의 서브-세션으로 분할된다. 하나 이상의 서브-세션 각각은 세션 타임라인 내의 상이한 주기에 연관된다.
실시예에서, SBD 파일은 세션의 시작 시간을 나타내는 제1 타이밍 속성, 및 하나 이상의 서브-세션 중 하나에 대해 세션의 시작 시간으로부터의 시작 시간 오프셋을 나타내는 제2 타이밍 속성을 포함한다.
실시예에서, SBD 파일은 루프 속성을 포함하고, 루프 속성은 루프 속성이 인에이블될 때 세션이 반복됨을 나타낸다.
실시예에서, SBD 파일은 하나 이상의 서브-세션 중 하나에 대한 식별 속성을 포함한다.
실시예에서, 제2 요청은 세그먼트 요청, MPD 업데이트 요청, 및 XLINK 요청 중 하나이다.
실시예에서, 제2 요청이 세그먼트 요청일 때, 복수의 키-값 쌍 중 하나에 연관된 값은 미디어 타입 및 적응 세트 중 하나를 나타낸다.
실시예에서, 프로세싱 회로는 제1 요청의 타이밍 및 제1 요청의 순서 중 하나에 따라 복수의 키-값 쌍 중 하나에 연관된 값을 송신한다.
실시예에서, 복수의 키-값 쌍 중 하나에 연관된 값은 제2 요청의 URL의 쿼리 및 제2 요청의 HTTP 헤더 중 하나에 포함된다.
실시예에서, SBD 파일은 SBD 파일의 타입이 정적 타입 및 동적 타입 중 하나임을 나타내는 타입 속성을 포함한다.
Ⅳ. 컴퓨터 시스템
위에서 설명된 기술은 컴퓨터 판독가능한 명령어들을 사용하며 하나 이상의 컴퓨터 판독가능한 매체에 물리적으로 저장되는 컴퓨터 소프트웨어로서 구현될 수 있다. 예를 들어, 도 7은 개시된 주제의 특정 실시예들을 구현하기에 적합한 컴퓨터 시스템(700)을 도시한다.
컴퓨터 소프트웨어는 하나 이상의 컴퓨터 중앙 처리 장치(CPU), 그래픽 처리 장치(GPU) 및 그와 유사한 것에 의해 직접적으로, 또는 해석, 마이크로코드 실행 및 그와 유사한 것을 통해 실행될 수 있는 명령어들을 포함하는 코드를 생성하기 위해, 어셈블리, 컴파일, 링크 또는 유사한 메커니즘들에 종속될 수 있는, 임의의 적합한 기계 코드 또는 컴퓨터 언어를 사용하여 코딩될 수 있다.
명령어들은 예를 들어 개인용 컴퓨터, 태블릿 컴퓨터, 서버, 스마트폰, 게임 디바이스, 사물 인터넷 디바이스, 및 그와 유사한 것을 포함하는 다양한 타입의 컴퓨터들 또는 그것의 컴포넌트들에서 실행될 수 있다.
컴퓨터 시스템(700)에 대해 도 7에 도시된 컴포넌트들은 본질적으로 예시적이며, 본 개시내용의 실시예들을 구현하는 컴퓨터 소프트웨어의 사용 또는 기능의 범위에 대한 어떠한 제한도 시사하도록 의도된 것이 아니다. 또한, 컴포넌트들의 구성은 컴퓨터 시스템(700)의 예시적인 실시예에 예시된 컴포넌트들 중 어느 하나 또는 그것들의 조합에 관련된 임의의 종속성 또는 요건을 갖는 것으로 해석되어서는 안 된다.
컴퓨터 시스템(700)은 특정의 인간 인터페이스 입력 디바이스들을 포함할 수 있다. 이러한 인간 인터페이스 입력 디바이스는 예를 들어 촉각 입력(예를 들어, 키스트로크, 스와이프, 데이터 글러브 움직임), 오디오 입력(예를 들어, 음성, 박수), 시각적 입력(예를 들어, 제스처), 후각 입력(도시되지 않음)을 통한 한 명 이상의 인간 사용자에 의한 입력에 응답할 수 있다. 인간 인터페이스 디바이스들은 또한 오디오(예를 들어, 음성, 음악, 주변 음향), 이미지(예를 들어, 스캐닝된 이미지, 스틸 이미지 카메라로부터 획득된 사진 이미지), 비디오(예를 들어, 2차원 비디오, 입체 비디오를 포함한 3차원 비디오)와 같이, 반드시 인간의 의식적 입력에 직접 관련이 있는 것은 아닌 특정 미디어를 캡처하기 위해 사용될 수 있다.
입력 인간 인터페이스 디바이스들은 키보드(701), 마우스(702), 트랙패드(703), 터치-스크린(710), 데이터 글러브(도시되지 않음), 조이스틱(705), 마이크로폰(706), 스캐너(707), 및 카메라(708) 중 하나 이상을 포함할 수 있다(각각의 것은 단 하나만이 도시됨).
컴퓨터 시스템(700)은 또한 특정한 인간 인터페이스 출력 디바이스들을 포함할 수 있다. 이러한 인간 인터페이스 출력 디바이스들은 예를 들어 촉각 출력, 소리, 빛 및 냄새/맛을 통해 한 명 이상의 인간 사용자의 감각을 자극할 수 있다. 이러한 인간 인터페이스 출력 디바이스들은 촉각 출력 디바이스들(예를 들면, 터치-스크린(710), 데이터 글러브(도시되지 않음) 또는 조이스틱(705)에 의한 촉각 피드백이지만, 입력 디바이스의 역할을 하지 않는 촉각 피드백 디바이스들도 존재할 수 있음), 오디오 출력 디바이스들(예를 들어, 스피커(709), 헤드폰(도시되지 않음)), 시각적 출력 디바이스들(예를 들어, CRT 화면, LCD 화면, 플라즈마 화면, OLED 화면을 포함하는 화면(710) - 각각은 터치-스크린 입력 능력을 갖거나 갖지 않고, 각각은 촉각 피드백 능력을 갖거나 갖지 않고, 그들 중 일부는 2차원 시각적 출력 또는 스테레오그래픽 출력과 같은 수단을 통한 3차원 이상의 출력을 출력 가능할 수 있음 - ; 가상 현실 안경(도시되지 않음), 홀로그래픽 디스플레이 및 스모크 탱크(도시되지 않음)), 및 프린터(도시되지 않음)를 포함할 수 있다. 이러한 시각적 출력 디바이스들(예를 들어, 스크린(710))은 그래픽 어댑터(750)를 통해 시스템 버스(748)에 연결될 수 있다.
컴퓨터 시스템(700)은 또한 CD/DVD 또는 유사 매체(721)를 갖는 CD/DVD ROM/RW(720)를 포함하는 광학 매체, 썸-드라이브(722), 이동식 하드 드라이브 또는 고체 상태 드라이브(723), 테이프 및 플로피 디스크와 같은 레거시 자기 매체(도시되지 않음), 보안 동글과 같은 특수화된 ROM/ASIC/PLD 기반 디바이스(도시되지 않음), 및 그와 유사한 것과 같은, 인간이 액세스할 수 있는 저장 디바이스들 및 그들의 연관된 매체를 포함할 수 있다.
본 기술분야의 통상의 기술자는 또한 현재 개시된 주제와 관련하여 사용되는 "컴퓨터 판독가능한 매체"라는 용어가 전송 매체, 반송파 또는 다른 일시적인 신호를 포괄하지 않는다는 것을 이해해야 한다.
컴퓨터 시스템(700)은 또한 하나 이상의 통신 네트워크(755)에 대한 네트워크 인터페이스(754)를 포함할 수 있다. 하나 이상의 통신 네트워크(755)는 예를 들어 무선, 유선, 광학적일 수 있다. 하나 이상의 통신 네트워크(755)는 또한 로컬, 광역, 대도시, 차량 및 산업, 실시간, 지연 허용 등일 수 있다. 하나 이상의 통신 네트워크(755)의 예들은 이더넷, 무선 LAN과 같은 근거리 통신망, GSM, 3G, 4G, 5G, LTE 및 그와 유사한 것을 포함하는 셀룰러 네트워크, 케이블 TV, 위성 TV 및 지상파 방송 TV를 포함하는 TV 유선 또는 무선 광역 디지털 네트워크, CANBus를 포함하는 차량 및 산업용 등을 포함한다. 특정 네트워크들은 일반적으로 특정 범용 데이터 포트들 또는 주변장치 버스들(749)(예컨대, 예를 들어 컴퓨터 시스템(700)의 USB 포트들)에 부착된 외부 네트워크 인터페이스 어댑터들을 필요로 하는 한편, 다른 것들은 일반적으로 아래에 설명되는 것과 같은 시스템 버스에의 부착에 의해 컴퓨터 시스템(700)의 코어에 통합된다(예를 들어, PC 컴퓨터 시스템에 대한 이더넷 인터페이스, 또는 스마트폰 컴퓨터 시스템에 대한 셀룰러 네트워크 인터페이스). 컴퓨터 시스템(700)은 이러한 네트워크들 중 임의의 것을 사용하여 다른 엔티티들과 통신할 수 있다. 이러한 통신은 단방향, 수신 전용(예를 들어, 방송 TV), 단방향 송신 전용(예를 들어, CANbus로부터 특정 CANbus 디바이스들로), 또는 예를 들어 근거리 또는 광역 디지털 네트워크를 사용하여 다른 컴퓨터 시스템들에 대해 양방향일 수 있다. 위에서 설명된 바와 같이, 이러한 네트워크들 및 네트워크 인터페이스들 각각에서 특정 프로토콜들 및 프로토콜 스택들이 사용될 수 있다.
앞에서 언급된 인간 인터페이스 디바이스들, 인간 액세스가능한 저장 디바이스들, 및 네트워크 인터페이스들은 컴퓨터 시스템(700)의 코어(740)에 부착될 수 있다.
코어(740)는 하나 이상의 중앙 처리 장치(CPU)(741), 그래픽 처리 장치(GPU)(742), 필드 프로그래밍가능한 게이트 영역들(Field Programmable Gate Area)(FPGA) 형태의 특수화된 프로그래밍가능한 프로세싱 유닛들(743), 특정 작업들을 위한 하드웨어 가속기들(744) 등을 포함할 수 있다. 이러한 디바이스들은 판독 전용 메모리(ROM)(745), 랜덤 액세스 메모리(746), 내부 비-사용자 액세스가능한 하드 드라이브, SSD 및 그와 유사한 것과 같은 내부 대용량 저장소(747)와 함께, 시스템 버스(748)를 통해 연결될 수 있다. 일부 컴퓨터 시스템들에서, 시스템 버스(748)는 추가의 CPU들, GPU 및 그와 유사한 것에 의한 확장들을 가능하게 하기 위해 하나 이상의 물리적 플러그의 형태로 액세스가능할 수 있다. 주변 디바이스들은 코어의 시스템 버스(748)에 직접, 또는 주변장치 버스(749)를 통해 부착될 수 있다. 주변장치 버스를 위한 아키텍처들은 PCI, USB, 및 그와 유사한 것을 포함한다.
CPU들(741), GPU들(742), FPGA들(743) 및 가속기들(744)은, 조합하여 앞에서 언급된 컴퓨터 코드를 구성할 수 있는 특정 명령어들을 실행할 수 있다. 그 컴퓨터 코드는 ROM(745) 또는 RAM(746)에 저장될 수 있다. 과도적 데이터가 또한 RAM(746)에 저장될 수 있는 반면, 영구적 데이터는 예를 들어 내부 대용량 저장소(747)에 저장될 수 있다. 메모리 디바이스들 중 임의의 것에 대한 빠른 저장 및 검색은 하나 이상의 CPU(741), GPU(742), 대용량 저장소(747), ROM(745), RAM(746) 및 그와 유사한 것에 밀접하게 연관될 수 있는 캐시 메모리의 사용을 통해 가능해질 수 있다.
컴퓨터 판독가능한 매체는 다양한 컴퓨터 구현 동작들을 수행하기 위한 컴퓨터 코드를 가질 수 있다. 매체 및 컴퓨터 코드는 본 개시내용의 목적을 위해 특별히 설계되고 구성된 것들일 수 있거나, 컴퓨터 소프트웨어 분야의 기술자들에게 널리 공지되어 있고 그들이 이용할 수 있는 종류의 것들일 수 있다.
제한이 아닌 예로서, 아키텍처(700) 및 특히 코어(740)를 갖는 컴퓨터 시스템은 프로세서(들)(CPU, GPU, FPGA, 가속기, 및 그와 유사한 것을 포함함)가 하나 이상의 유형의(tangible) 컴퓨터 판독가능한 매체에 구현된 소프트웨어를 실행한 것의 결과로서 기능을 제공할 수 있다. 이러한 컴퓨터 판독가능한 매체는 위에서 소개된 사용자 액세스가능한 대용량 저장소에 연관된 매체는 물론, 코어 내부 대용량 저장소(747) 또는 ROM(745)과 같은 비-일시적 특성을 갖는 코어(740)의 특정 저장소일 수 있다. 본 개시내용의 다양한 실시예들을 구현하는 소프트웨어는 이러한 디바이스들에 저장되고 코어(740)에 의해 실행될 수 있다. 컴퓨터 판독가능한 매체는 특정 요구들에 따라 하나 이상의 메모리 디바이스 또는 칩을 포함할 수 있다. 소프트웨어는, 코어(740) 및 특히 그 안의 프로세서들(CPU, GPU, FPGA, 및 그와 유사한 것을 포함함)로 하여금, RAM(746)에 저장되는 데이터 구조들을 정의하고 소프트웨어에 의해 정의된 프로세스들에 따라 이러한 데이터 구조들을 수정하는 것을 포함하여, 여기에 설명된 특정 프로세스들 또는 특정 프로세스들의 특정 부분들을 실행하게 할 수 있다. 추가적으로 또는 대안적으로, 컴퓨터 시스템은 여기에 설명된 특정 프로세스들 또는 특정 프로세스들의 특정 부분들을 실행하기 위해, 소프트웨어를 대신하여 또는 소프트웨어와 함께 동작할 수 있는, 회로(예를 들어, 가속기(744)) 내에 고정배선되거나 다르게 구현된 로직의 결과로서 기능을 제공할 수 있다. 소프트웨어에 대한 참조는 로직을 포괄할 수 있으며, 적절한 경우 그 반대도 마찬가지이다. 컴퓨터 판독가능한 매체에 대한 참조는 실행을 위한 소프트웨어를 저장하는 회로(예를 들어, 집적 회로(IC)), 실행을 위한 로직을 구현하는 회로, 또는 적절한 경우 둘 다를 포괄할 수 있다. 본 개시내용은 하드웨어 및 소프트웨어의 임의의 적절한 조합을 포괄한다.
본 개시내용은 수 개의 예시적인 실시예를 설명했지만, 본 개시내용의 범위 내에 속하는 변경, 순열, 및 다양한 대체 등가물이 존재한다. 따라서, 본 기술분야의 통상의 기술자들은 본 명세서에 명시적으로 도시되거나 설명되지는 않았지만, 본 개시내용의 원리를 구현하고 따라서 그 사상 및 범위 내에 있는 수많은 시스템들 및 방법들을 생각해낼 수 있다는 것을 이해할 것이다.

Claims (20)

  1. 세션의 미디어 데이터를 수신하기 위한 방법으로서,
    세션 기반 디스크립션(session-based description)(SBD) 클라이언트에 의해, 상기 세션을 위한 복수의 키-값 쌍을 포함하는 SBD 파일을 수신하는 단계 - 상기 복수의 키-값 쌍의 각각은 상기 세션 내의 복수의 시간 범위 중 하나 또는 상기 세션 내의 복수의 순서(order) 번호 중 하나에 대응됨 -;
    상기 SBD 클라이언트에 의해, 하이퍼텍스트 전송 프로토콜을 통한 동적 적응 스트리밍(dynamic adaptive streaming over hypertext transfer protocol)(DASH) 액세스 클라이언트로부터 수신된 상기 SBD 파일 내의 상기 복수의 키-값 쌍 중 하나에 연관된 값에 대한 제1 요청을 수신하는 단계 - 상기 제1 요청은 (i) 상기 복수의 시간 범위 중 하나의 시간 범위 또는 상기 복수의 순서 번호 중 하나의 순서 번호 및 (ii) 상기 값과 연관된 키 이름을 포함함 -; 및
    상기 제1 요청에 응답하여 수신된 상기 SBD 파일 내의 상기 복수의 키-값 쌍 중 하나에 연관된 값을 상기 SBD 클라이언트로부터 상기 DASH 액세스 클라이언트로 송신하는 단계 - 상기 값은 상기 DASH 액세스 클라이언트에 의해, 콘텐츠 서버에 송신되는 제2 요청에 포함됨 -
    를 포함하는 방법.
  2. 제1항에 있어서, 상기 세션은 상기 SBD 파일에 따라 세션 타임라인에서 하나 이상의 서브-세션으로 분할되고, 상기 하나 이상의 서브-세션 각각은 상기 세션 타임라인 내의 상이한 주기에 연관되는, 방법.
  3. 제2항에 있어서, 상기 SBD 파일은 상기 세션의 시작 시간을 나타내는 제1 타이밍 속성, 및 상기 하나 이상의 서브-세션 중 하나에 대해 상기 세션의 상기 시작 시간으로부터의 시작 시간 오프셋을 나타내는 제2 타이밍 속성을 포함하는, 방법.
  4. 제1항에 있어서, 상기 SBD 파일은 루프 속성을 포함하고, 상기 루프 속성은 상기 루프 속성이 인에이블될 때 상기 세션이 반복됨을 나타내는, 방법.
  5. 제2항에 있어서, 상기 SBD 파일은 상기 하나 이상의 서브-세션 중 하나에 대한 식별 속성을 포함하는, 방법.
  6. 제1항에 있어서, 상기 제2 요청은 세그먼트 요청, 미디어 프레젠테이션 디스크립션 업데이트 요청(media presentation description update request), 및 확장가능한 마크업 언어(extensible markup language)(XML) 링킹 언어(linking language)(XLINK) 요청 중 하나인, 방법.
  7. 제6항에 있어서, 상기 제2 요청이 상기 세그먼트 요청일 때, 상기 복수의 키-값 쌍 중 하나에 연관된 값은 미디어 타입 및 적응 세트(adaptation set) 중 적어도 하나를 나타내는, 방법.
  8. 제1항에 있어서, 상기 복수의 키-값 쌍들은 (i) 세션 타임라인에 기초하여 배열(arrange)되는 상기 복수의 키-값 쌍들에 대응하는 상기 복수의 시간 범위 중 하나 또는 (ii) 세션 오더라인에 기초하여 배열되는 상기 복수의 키-값 쌍들에 대응하는 상기 복수의 순서 번호 중 하나에 대응되는, 방법.
  9. 제1항에 있어서, 상기 복수의 키-값 쌍 중 하나에 연관된 값은 상기 제2 요청의 유니폼 리소스 로케이터(uniform resource locator)(URL)의 쿼리, 및 상기 제2 요청의 하이퍼텍스트 전송 프로토콜(hypertext transfer protocol)(HTTP) 헤더 중 하나에 포함되는, 방법.
  10. 제1항에 있어서, 상기 SBD 파일은 상기 SBD 파일의 타입이 정적 타입 및 동적 타입 중 하나임을 나타내는 타입 속성을 포함하는, 방법.
  11. 세션의 미디어 데이터를 수신하기 위한 장치로서,
    제1항 내지 제10항 중 어느 한 항의 방법을 수행하도록 구성된 프로세싱 회로를 포함하는, 장치.
  12. 삭제
  13. 삭제
  14. 삭제
  15. 삭제
  16. 삭제
  17. 삭제
  18. 삭제
  19. 삭제
  20. 명령어들을 저장하는 비-일시적 컴퓨터 판독가능한 저장 매체로서,
    상기 명령어들은, 세션의 미디어 데이터를 수신하기 위해 컴퓨터에 의해 실행될 때, 상기 컴퓨터로 하여금 제1항 내지 제10항 중 어느 한 항의 방법을 수행하게 하는, 비-일시적 컴퓨터 판독가능한 저장 매체.
KR1020217021428A 2019-09-30 2020-09-28 Http를 통한 동적 적응 스트리밍을 위한 세션 기반 정보 KR102495551B1 (ko)

Applications Claiming Priority (5)

Application Number Priority Date Filing Date Title
US201962908260P 2019-09-30 2019-09-30
US62/908,260 2019-09-30
US17/028,286 US11425187B2 (en) 2019-09-30 2020-09-22 Session-based information for dynamic adaptive streaming over HTTP
US17/028,286 2020-09-22
PCT/US2020/053034 WO2021067174A1 (en) 2019-09-30 2020-09-28 Session-based information for dynamic adaptive streaming over http

Publications (2)

Publication Number Publication Date
KR20210100166A KR20210100166A (ko) 2021-08-13
KR102495551B1 true KR102495551B1 (ko) 2023-02-06

Family

ID=75162289

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020217021428A KR102495551B1 (ko) 2019-09-30 2020-09-28 Http를 통한 동적 적응 스트리밍을 위한 세션 기반 정보

Country Status (6)

Country Link
US (1) US11425187B2 (ko)
EP (1) EP4038861A4 (ko)
JP (1) JP7297086B2 (ko)
KR (1) KR102495551B1 (ko)
CN (1) CN113767608B (ko)
WO (1) WO2021067174A1 (ko)

Families Citing this family (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US11228796B2 (en) * 2020-01-07 2022-01-18 Tencent America LLC Pattern addressing for session-based dash operations
US11470136B2 (en) * 2020-10-07 2022-10-11 Tencent America LLC URL customization using the session-based dash operations
US11895172B2 (en) * 2021-04-21 2024-02-06 Tencent America LLC Session-based description URL customization using the session-based DASH operations
US11588870B2 (en) * 2021-04-21 2023-02-21 Tencent America LLC W3C media extensions for processing DASH and CMAF inband events along with media using process@append and process@play mode
US11943305B2 (en) * 2022-07-20 2024-03-26 Bentley Systems, Incorporated Workspace databases

Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20160205158A1 (en) * 2015-01-08 2016-07-14 Qualcomm Incorporated Session description information for over-the-air broadcast media data

Family Cites Families (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20090136218A1 (en) * 2006-08-14 2009-05-28 Vmedia Research, Inc. Multimedia presentation format
US8924582B2 (en) * 2012-07-09 2014-12-30 Futurewei Technologies, Inc. Dynamic adaptive streaming over hypertext transfer protocol client behavior framework and implementation of session management
US10476930B2 (en) * 2014-01-06 2019-11-12 Intel IP Corporation Client/server signaling commands for dash
KR101757306B1 (ko) 2014-07-31 2017-07-12 엘지전자 주식회사 방송 신호 송/수신 처리 방법 및 장치
GB2534849A (en) 2015-01-28 2016-08-10 Canon Kk Client-driven push of resources by a server device
KR101991192B1 (ko) 2015-02-11 2019-06-19 브이아이디 스케일, 인크. Http를 통한 동적 적응형 스트리밍(dash)에서의 일반화된 http 헤더를 위한 시스템 및 방법
US10454985B2 (en) * 2015-03-04 2019-10-22 Qualcomm Incorporated File format based streaming with dash formats based on LCT
US20190215729A1 (en) 2018-03-15 2019-07-11 Intel Corporation Session description protocol mechanisms for signaling radio access network capabilities in multimedia telephony sessions

Patent Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20160205158A1 (en) * 2015-01-08 2016-07-14 Qualcomm Incorporated Session description information for over-the-air broadcast media data

Also Published As

Publication number Publication date
KR20210100166A (ko) 2021-08-13
US11425187B2 (en) 2022-08-23
EP4038861A1 (en) 2022-08-10
WO2021067174A1 (en) 2021-04-08
EP4038861A4 (en) 2023-11-01
CN113767608A (zh) 2021-12-07
JP2022525740A (ja) 2022-05-19
JP7297086B2 (ja) 2023-06-23
US20210099510A1 (en) 2021-04-01
CN113767608B (zh) 2023-06-30

Similar Documents

Publication Publication Date Title
KR102495551B1 (ko) Http를 통한 동적 적응 스트리밍을 위한 세션 기반 정보
KR102632387B1 (ko) Http를 통한 동적 적응 스트리밍을 위한 세션 기반 정보
US11930064B2 (en) Query signaling in media presentation description
KR20210141598A (ko) Http를 통한 동적 적응 스트리밍을 위한 세션 기반 정보
KR102636993B1 (ko) Http를 통한 동적 적응적 스트리밍을 위한 방법 및 장치
US11638056B2 (en) Pattern addressing for session-based DASH operations
KR20220129622A (ko) Http를 통한 동적 적응 스트리밍을 위한 방법들 및 장치들
KR20220131976A (ko) Http를 통한 동적 적응 스트리밍을 위한 방법들 및 장치들
EP4062586A1 (en) Methods and apparatuses for dynamic adaptive streaming over http

Legal Events

Date Code Title Description
A201 Request for examination
E902 Notification of reason for refusal
E701 Decision to grant or registration of patent right
GRNT Written decision to grant