CN109195020B - 一种ar增强的游戏直播方法和*** - Google Patents
一种ar增强的游戏直播方法和*** Download PDFInfo
- Publication number
- CN109195020B CN109195020B CN201811181572.9A CN201811181572A CN109195020B CN 109195020 B CN109195020 B CN 109195020B CN 201811181572 A CN201811181572 A CN 201811181572A CN 109195020 B CN109195020 B CN 109195020B
- Authority
- CN
- China
- Prior art keywords
- data
- audio
- module
- model data
- dynamic model
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000000034 method Methods 0.000 title claims abstract description 32
- 230000003068 static effect Effects 0.000 claims abstract description 47
- 238000005516 engineering process Methods 0.000 claims abstract description 38
- 238000009877 rendering Methods 0.000 claims abstract description 25
- 230000005540 biological transmission Effects 0.000 claims description 25
- 230000003993 interaction Effects 0.000 claims description 13
- 238000012552 review Methods 0.000 claims description 10
- 238000004806 packaging method and process Methods 0.000 claims description 8
- 238000013144 data compression Methods 0.000 claims description 6
- 238000013500 data storage Methods 0.000 claims description 6
- 238000009432 framing Methods 0.000 claims description 3
- 238000011161 development Methods 0.000 abstract description 6
- 230000008859 change Effects 0.000 description 5
- 230000000694 effects Effects 0.000 description 5
- 230000003190 augmentative effect Effects 0.000 description 4
- 238000005286 illumination Methods 0.000 description 4
- 230000000007 visual effect Effects 0.000 description 4
- 238000010586 diagram Methods 0.000 description 3
- 230000006872 improvement Effects 0.000 description 3
- 238000010899 nucleation Methods 0.000 description 3
- 230000008901 benefit Effects 0.000 description 2
- 238000007654 immersion Methods 0.000 description 2
- 230000008569 process Effects 0.000 description 2
- 238000012545 processing Methods 0.000 description 2
- 208000015041 syndromic microphthalmia 10 Diseases 0.000 description 2
- 241000251468 Actinopterygii Species 0.000 description 1
- 244000046052 Phaseolus vulgaris Species 0.000 description 1
- 235000010627 Phaseolus vulgaris Nutrition 0.000 description 1
- 244000061456 Solanum tuberosum Species 0.000 description 1
- 235000002595 Solanum tuberosum Nutrition 0.000 description 1
- 230000009471 action Effects 0.000 description 1
- 230000015572 biosynthetic process Effects 0.000 description 1
- 238000006243 chemical reaction Methods 0.000 description 1
- 238000010276 construction Methods 0.000 description 1
- 230000007547 defect Effects 0.000 description 1
- 230000007812 deficiency Effects 0.000 description 1
- 230000004069 differentiation Effects 0.000 description 1
- 230000009365 direct transmission Effects 0.000 description 1
- 230000002708 enhancing effect Effects 0.000 description 1
- 230000010354 integration Effects 0.000 description 1
- 238000012423 maintenance Methods 0.000 description 1
- 239000011159 matrix material Substances 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000035515 penetration Effects 0.000 description 1
- 235000012015 potatoes Nutrition 0.000 description 1
- 230000008521 reorganization Effects 0.000 description 1
- 230000001953 sensory effect Effects 0.000 description 1
- 230000007480 spreading Effects 0.000 description 1
- 238000003786 synthesis reaction Methods 0.000 description 1
Images
Classifications
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N21/00—Selective content distribution, e.g. interactive television or video on demand [VOD]
- H04N21/40—Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
- H04N21/47—End-user applications
- H04N21/478—Supplemental services, e.g. displaying phone caller identification, shopping application
- H04N21/4781—Games
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N21/00—Selective content distribution, e.g. interactive television or video on demand [VOD]
- H04N21/20—Servers specifically adapted for the distribution of content, e.g. VOD servers; Operations thereof
- H04N21/21—Server components or server architectures
- H04N21/218—Source of audio or video content, e.g. local disk arrays
- H04N21/2187—Live feed
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N21/00—Selective content distribution, e.g. interactive television or video on demand [VOD]
- H04N21/20—Servers specifically adapted for the distribution of content, e.g. VOD servers; Operations thereof
- H04N21/23—Processing of content or additional data; Elementary server operations; Server middleware
- H04N21/234—Processing of video elementary streams, e.g. splicing of video streams or manipulating encoded video stream scene graphs
- H04N21/2343—Processing of video elementary streams, e.g. splicing of video streams or manipulating encoded video stream scene graphs involving reformatting operations of video signals for distribution or compliance with end-user requests or end-user device requirements
- H04N21/234309—Processing of video elementary streams, e.g. splicing of video streams or manipulating encoded video stream scene graphs involving reformatting operations of video signals for distribution or compliance with end-user requests or end-user device requirements by transcoding between formats or standards, e.g. from MPEG-2 to MPEG-4 or from Quicktime to Realvideo
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N21/00—Selective content distribution, e.g. interactive television or video on demand [VOD]
- H04N21/20—Servers specifically adapted for the distribution of content, e.g. VOD servers; Operations thereof
- H04N21/25—Management operations performed by the server for facilitating the content distribution or administrating data related to end-users or client devices, e.g. end-user or client device authentication, learning user preferences for recommending movies
- H04N21/262—Content or additional data distribution scheduling, e.g. sending additional data at off-peak times, updating software modules, calculating the carousel transmission frequency, delaying a video stream transmission, generating play-lists
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N21/00—Selective content distribution, e.g. interactive television or video on demand [VOD]
- H04N21/20—Servers specifically adapted for the distribution of content, e.g. VOD servers; Operations thereof
- H04N21/27—Server based end-user applications
- H04N21/274—Storing end-user multimedia data in response to end-user request, e.g. network recorder
- H04N21/2743—Video hosting of uploaded data from client
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N21/00—Selective content distribution, e.g. interactive television or video on demand [VOD]
- H04N21/80—Generation or processing of content or additional data by content creator independently of the distribution process; Content per se
- H04N21/81—Monomedia components thereof
- H04N21/816—Monomedia components thereof involving special video data, e.g 3D video
Landscapes
- Engineering & Computer Science (AREA)
- Multimedia (AREA)
- Signal Processing (AREA)
- Databases & Information Systems (AREA)
- Information Transfer Between Computers (AREA)
- Two-Way Televisions, Distribution Of Moving Picture Or The Like (AREA)
Abstract
本申请公开了一种AR增强的游戏直播方法,包括:在直播前,客户端预先接收并存储游戏的静态模型数据;采集模块收集游戏直播中的音视频数据,并进行编码,同时采集游戏直播中的动态模型数据;采集模块将动态模型数据和音视频数据打包压缩后,通过网络传输给客户端;客户端加载预先存储的静态模型数据,并结合接收到的动态模型数据进行AR渲染,实时显示游戏视频,并播放相应的音频。本申请还公开了一种对应的AR增强的游戏直播***。应用本申请公开的技术方案,能够改进现有的直播技术,尤其是3D游戏直播方面,通过引入前沿的AR技术,使得观众在观看直播时获得更新的体验和更好的感受,同时为AR应用的发展提供了新的思路和途径。
Description
技术领域
本申请涉及智能终端应用技术领域,特别涉及一种AR增强的游戏直播方法和***。
背景技术
当今的网络直播技术随着自媒体的广泛深入日趋成熟,网络直播平台也成为了一种崭新的社交媒体。网络直播技术主要分为实时直播游戏、电影或电视剧等。在中国,网络直播平台不下百余家,其中最有名气的也有数十家,可谓是百花齐放。直播平台也催生出了网红经济,依托网红庞大的粉丝群,创造了一个又一个的营销奇迹。网络直播主要涉及流媒体技术,主要分为三大部分:音视频采集处理、视频网络传输协议和客户端播放器。本申请主要关注点在3D游戏直播,因为游戏直播是网络直播中最重要的一块,且占比超过50%。
增强现实(Augmented Reality,简称AR),是一种实时地计算摄影机影像的位置及角度并加上相应图像的技术,这种技术的目标是在屏幕上把虚拟世界套在现实世界并进行互动。增强现实技术不仅展现了真实世界的信息,而且将虚拟的信息同时显示出来,两种信息相互补充、叠加。把真实世界与电脑图形多重合成在一起,便可以看到真实的世界围绕着它。AR技术主要包含计算机视觉、三维配准、识别跟踪等技术。本申请主要涉及到3D游戏模型重组、三维配准以及识别跟踪。
网络直播的发展经历了大概十多年的时期,从最早的视频网站(土豆,优酷)的兴起,到各大网络媒体争相自制内容(网剧),再到自媒体的发展壮大(斗鱼,YY等平台诞生),最终形成一套完整的从内容到传播再到盈利的良好生态链。直播平台的诞生催生了网红经济,网红经济又将直播带上了新的台阶。
直播需要对应的设备和技术,内容方设备通常是网络摄像头以及麦克风,对应的技术涉及到视频数据的采集和编码。网络传输方主要是通过互联网进行传播,涉及到的技术有传输协议:RTP与RTCP控制指令、SIP和SDP等。播放方为不同平台的网络终端,主要涉及视频解码和播放技术。这些技术相对成熟稳定。
AR(增强现实)技术最早于1990年提出。随着随身电子产品运算能力的提升,增强现实的用途越来越广。AR技术是一种将真实世界信息和虚拟世界信息“无缝”集成的新技术,是把原本在现实世界的一定时间空间范围内很难体验到的实体信息(视觉信息、声音、味道、触觉等)通过电脑等科学技术,模拟仿真后再叠加,将虚拟的信息应用到真实世界,被人类感官所感知,从而达到超越现实的感官体验。真实的环境和虚拟的物体实时地叠加到同一个画面或空间同时存在。
AR***具有三个突出的特点:①真实世界和虚拟世界的信息集成;②具有实时交互性;③是在三维尺度空间中增添定位虚拟物体。AR技术可广泛应用到军事、医疗、建筑、教育、工程、影视、娱乐等领域。
一个好的直播首先要有好的内容。现有的直播中,尤其是游戏直播,内容画面的采集无非是摄像头采集或者直接传输游戏画面,已经不能满足观看者需求。
摄像头采集的画面经过视频压缩编码后往往视频质量下降,而直接传播游戏画面带入感和丰富度又不够,必须配以足够的解说才能引起观看者兴趣。所以当前的直播在内容采集方面还存在着不足之处。
同时,对于AR技术来说,该技术最大的限制是应用场景,虽然AR已经慢慢走近大众视线,但其实用性产品其实很匮乏,AR对于大众来讲最大的应用是游戏类。然而要完成一个可以匹配不同场景的AR游戏也是充满挑战性的。AR技术的另一个局限是,实时性差,因为在渲染时需要大量的运算,所以在做大型实时游戏时,AR就显得不尽如人意。
发明内容
本申请提供了一种AR增强的游戏直播方法和***,旨在改进现有的直播技术,尤其是3D游戏直播方面,引入前沿AR技术,使得观众在观看直播时获得更新的体验和更好的感受,同时为AR应用的发展提供新的思路和途径。
本申请公开了一种AR增强的游戏直播方法,包括:
在直播前,客户端预先接收并存储游戏的静态模型数据;
采集模块收集游戏直播中的音视频数据,并进行编码,同时采集游戏直播中的动态模型数据;
采集模块将动态模型数据和音视频数据打包压缩后,通过网络传输给客户端;
客户端加载预先存储的静态模型数据,并结合接收到的动态模型数据进行AR渲染,实时显示游戏视频,并播放相应的音频。
较佳的,该方法还包括:
预先对直播的3D游戏场景进行模型重构,转变为适宜通过AR显示的模型,所述静态模型数据和动态模型数据构成AR模型数据。
较佳的,所述动态模型数据包括:模型动态行为数据、坐标数据、状态数据;
所述静态模型数据包括:3D场景数据、人物模型数据。
较佳的,所述采集模块将动态模型数据和音视频数据打包压缩后,通过网络传输给客户端包括:
采集模块将动态模型数据和音视频数据打包压缩后,向服务器推送信息;
服务器收到采集模块的信息推送后,推送给CDN节点,并继续推送到各个客户端,或者,服务器对接收到的信息进行动态编码以适应不同的客户端需要,同时将数据存储在云端数据库中,供客户端请求回看时调用播放。
较佳的,客户端进行AR渲染包括:
客户端对接收自服务器的信息进行解码,同时利用客户端的摄像头获得现实场景,对现实场景进行分析,确定AR显示区域方向,建立三维坐标系,将解码后的3D场景信息在指定AR显示区域显示,同时播放直播视频和音频。
较佳的,信息的解码分为音视频信息的解码和3D场景信息的解码,其中,3D场景信息的解码分为静态模型数据和动态模型数据的解码;在进行AR显示时,先渲染静态模型数据,再将动态模型数据叠加在静态模型数据上进行渲染显示。
较佳的,该方法还包括:
进行用户交互操作,具体包括:调整客户端摄像头的拍摄位置,以调整AR模型的显示位置、角度,调整摄像头焦距,以调整AR模型的大小,利用客户端向服务器发出回看请求,调取存放在云端数据库中的数据进行回看。
本申请还公开了一种AR增强的游戏直播***,包括:采集模块、传输模块和客户端模块,其中:
采集模块用于收集游戏直播中的音视频数据,并进行编码,同时采集游戏直播中的动态模型数据,将动态模型数据和音视频数据打包压缩后,推送给传输模块;
传输模块用于通过网络将采集模块所采集的数据传输给客户端;
客户端在直播前预先接收并存储游戏的静态模型数据,在接收到传输模块的数据后,加载预先存储的静态模型数据,并结合接收到的动态模型数据进行AR渲染,实时显示游戏视频,并播放相应的音频。
较佳的,所述采集模块包括:音视频采集模块、AR场景建模模块和数据压缩编码模块,其中:
所述音视频采集模块通过麦克风和摄像头采集直播者的音视频信息;
所述AR场景建模模块将直播的3D游戏场景进行模型重构,转变为适宜通过AR显示的模型,模型重构包括:将静态模型和动态模型剥离,将静态模型的模型范围框选在一个合适的大小内,并分别渲染静态模型和动态模型;
所述数据压缩编码模块用于将音视频数据压缩编码成可通过网络传输的流媒体形式,并将AR的静态模型数据和动态模型数据分别压缩编码,最终将所有数据打包发送到传输模块。
较佳的,所述传输模块包括:直播服务器推流模块、实时转码服务模块、数据存储服务模块和视频分发服务模块,其中:
所述直播服务器推流模块的服务包括:将采集模块所采集的数据推送到服务器端,以及将服务器中的数据推送到各个视频分发服务模块;
所述实时转码服务模块用于满足不同平台的客户端需求,将数据转换成对应不同平台可解析的编码;
所述数据存储服务模块用于提供可回看的功能,将直播数据同步存储在数据库中,用户可根据自身需要调取相应的直播数据进行回看;
所述视频分发服务模块用于将缓存服务器分布到用户访问相对集中的地区或网络中,在用户访问网站时,利用全局负载技术将用户的访问指向距离最近的工作正常的缓存服务器上,由缓存服务器直接响应用户请求。
较佳的,所述客户端模块包括数据解码模块、场景标定模块、显示模块和AR交互模块,其中:
所述数据解码模块对接收自传输模块的数据进行解码,得到音视频数据和AR模型数据,其中,AR模型数据分为动态模型数据和静态模型数据,音视频数据可直接在显示模块显示,AR模型数据发送给场景标定模块进行重构;
所述场景标定模块通过客户端模块的摄像头得到现实场景,再运用环境理解技术,对现实场景进行平面标定,如果显示场景中无平面,则标定在场景的中间位置或者由用户指定显示位置,所标定的区域用于显示AR模型,将模型叠加在现实场景中,最终交由显示模块进行显示;
所述AR交互模块用于接收用户操作,包括移动摄像头观看不同方位,调整摄像头远近用于放大缩小AR模型,当用户进行操作时,需要实时进行渲染,达到AR显示的稳定性。
由上述技术方案可见,本发明通过AR技术改进现有的直播方式,主要用在3D游戏的直播。将直播中的游戏地图和人物渲染为实时的三维模型,该三维模型通过网络传输到观众的智能终端上,并通过AR方式显示出来。观众通过移动、旋转、缩放等方式控制终端来观看游戏实况的局部或全局的任意角度,再配合以语音解说和玩家视频内容,观众可以更好更全面地体验游戏直播,并且仿佛置身于游戏战场一般,沉浸感十足。
本发明是一种用于增强现有直播技术的技术方案,是现有直播方法的改进和增强,并且拓宽了AR的使用范围,为未来的直播和AR行业提供了一种崭新的思路。
附图说明
图1为本发明AR增强的游戏直播***的结构图;
图2为本发明AR增强的游戏直播方法的流程图;
图3为本发明直播服务器推流服务的示意图;
图4为本发明客户端的具体流程示意图;
图5为进行显示器标定的示意图;
图6为本发明普通玩家游戏直播实施例的显示画面;
图7为本发明普通玩家游戏直播实施例的流程图;
图8为本发明职业游戏竞赛直播实施例的显示画面;
图9为本发明职业游戏竞赛直播的实施例流程图;
具体实施方式
为使本申请的目的、技术方案及优点更加清楚明白,以下参照附图并举实施例,对本申请作进一步详细说明。
针对现有技术的不足,本申请提供两个解决方案:
1、针对当前直播内容采集的弊端,尤其是游戏直播中,无法让观众更好地体验直播内容这一点,本申请进行了改进。具体的:本申请提供一种通过AR方式展示游戏直播画面的方法,包括:内容采集端采用AR渲染游戏画面,将数据打包并通过网络传输到终端(也可称为客户端),终端通过AR方式实时显示游戏画面,并播放音频。该方法能够让观众沉浸式地体验游戏直播,直播效果更好。
2、针对当前AR应用情景的局限性,本申请将当今流行的直播与前沿技术AR相结合,不仅让直播有了新的方式,也让AR拓宽了应用场景,同时也解决了AR的时效性问题。内容采集端将模型分为静态模型数据和动态模型数据,其中,静态模型(数据量较大)数据可以在直播前预先传输到客户端,客户端可以本地存储这些数据。动态数据大都是游戏游玩中产生的用户数据,如人物的移动,动作等数据,这些数据的数据量小,可以利用网络实时传输,延迟很低。在客户端进行AR渲染时,加载预先存储的静态模型数据,并且配合网络传输的动态模型数据,在数据渲染上可以做到实时性,技术难度也相较很低。这样就可以改进AR实时渲染慢的问题。
为解决以上问题,本发明提出一种AR增强的游戏直播***,如图1所示,主要由以下模块构成:
1.采集模块:采集模块的主要功能模块包括音视频采集、AR场景建模、数据压缩打包编码等;
2.传输模块:传输模块的主要功能模块包括直播服务器推流、实时转码服务、数据存储服务、以及视频分发服务等;
3.客户端模块:客户端模块的主要功能模块包括数据解码、场景标定、AR交互、显示等。
基于图1所示结构,本发明的流程如图2所示,具体的:
一、采集模块:
采集模块主要用于直播方采集音视频,并对3D游戏进行AR建模,对数据进行预处理,最终压缩编码后发出。其中:
1)音视频采集模块通过麦克风和摄像头采集直播者的音视频信息,此时为原始数据。
2)AR场景建模模块将直播的3D游戏场景进行模型重构,转变为适宜通过AR显示的模型。模型重构的主要工作有:将静态模型和动态模型剥离,将静态模型的模型范围框选在一个合适的大小内,并分别渲染静态模型和动态模型。
3)数据压缩编码模块用于将音视频数据压缩编码成可以通过网络传输的流媒体形式,并将AR的静态模型数据和动态模型数据分别压缩编码,最终将所有数据打包发送到直播服务器端。
二、传输模块
传输模块主要用于直播数据的传输,对采集模块所采集的数据进行分发、转码、存储等工作,确保数据传输的准确性和实效性。其中:
1)直播服务器推流模块的服务分为两部分:第一部分是将采集终端所采集的数据推送到服务器端,第二部分是将服务器中的数据推送到各个CDN节点(内容分发网络节点)。
其中涉及的主要协议有RTMP(Routing Table Maintenance Protocol路由选择表维护协议)和RTSP(Real Time Streaming Protocol实时流传输协议)等。特别需要指出的是:本申请中的数据分为两种,一种是传统的音视频数据,另一种是AR模型数据,模型数据中静态模型数据往往较大,但变化频率低,可以在其变化的时候进行传输;动态模型数据量小,变化频率高,可以实时传输。动态模型数据可以包括:模型动态行为数据、坐标数据、状态数据等;静态模型数据可以包括:3D场景数据、人物模型数据等。
2)实时转码服务模块是为了适配不同的客户端而设置的,用于满足不同平台的客户端需求,将数据转换成对应不同平台可解析的编码。
具体请见附图3所示直播服务器推流服务。
3)数据存储服务模块用于提供可回看的功能,将直播数据同步存储在数据库中,用户可根据自身需要调取相应的直播数据进行回看。
4)视频分发服务模块即为CDN节点,使用CDN节点尽可能避开互联网上有可能影响数据传输速度和稳定性的瓶颈和环节,使内容传输得更快、更稳定。其基本原理是广泛采用各种缓存服务器,将这些缓存服务器分布到用户访问相对集中的地区或网络中,在用户访问网站时,利用全局负载技术将用户的访问指向距离最近的工作正常的缓存服务器上,由缓存服务器直接响应用户请求。
三、客户端模块
客户端模块主要用于直播数据的解析以及AR呈现,用户也可以通过命令改变观看角度、大小等,最终达到AR直播的效果。其中:
1)数据解码模块将服务器端传来的数据进行解码,解析成两部分数据,一部分是音视频数据,另一部分为AR模型数据,其中AR模型数据又分为动态模型数据和静态模型数据。音视频数据可以直接在显示端显示,AR模型数据需要交给场景标定模块进行重构。
2)场景标定模块通过用户终端的摄像头得到现实场景,再运用环境理解技术,对现实场景进行平面标定,如果显示场景中无平面,则标定在场景的中间位置或者由用户指定显示位置。所标定的区域用于显示AR模型,将模型叠加在现实场景中,最终交由显示模块进行显示。
3)AR交互模块用于接收用户操作,如移动摄像头观看不同方位,调整摄像头远近用于放大缩小AR模型等。当用户进行操作时,需要实时进行渲染,达到AR显示的稳定性。AR交互模块进行的用户交互操作,具体可以包括:调整客户端摄像头的拍摄位置,以调整AR模型的显示位置、角度,调整摄像头焦距,以调整AR模型的大小,利用客户端向服务器发出回看请求,调取存放在云端数据库中的数据进行回看。
客户端具体的流程参见图4,具体包括:通过用户终端的摄像头拍摄得到现实场景,由场景标定模块运用环境理解技术对现实场景进行平面标定或者用户指定显示位置,进行三维重建,最后根据数据解码模块解析得到的AR数据/视频数据、平面标定的结果、三维重建得到的模型,将模型叠加在现实场景中进行渲染合成,并最终交由显示模块进行显示。
下面对具体涉及的AR技术做一些补充阐述:
1、相机参数标定,客户端的摄像头是基于视觉的AR***的重要组件,因此,在使用中必须先标定摄像头的内参数。对于普通的摄像头,可以采用matlab自带的摄像头标定工具箱来标定。不仅可以标定出摄像头的内参数,还能标定出镜头畸变。该工具箱采用的是棋盘格标定法。标定工作需要事先完成,否则无法进行三维重建。
2、显示器标定,是将显示器上的物***置和实际物***置进行的一种换算方式,同时也是三维重建中重要的组成部分。最常用的一种方法是单点主动对准法(SPAAM),将屏幕上的一些十字光标与真实世界中的物体进行多次对齐,多次对齐需要通过手转动完成。数据获取后,通过DLT方法构建方程组求解投影矩阵,下图5所示。
3、视觉一致性,包含几何一致性和光照一致性,几何一致性包括虚拟物体放置在正确位置后,无论摄像头如何移动,也不会改变该无心物体的位置,此外,遮挡也要保持一致,空间位置的不同,会导致遮挡发生变化。光照一致性是指渲染的虚拟物体怎样保持与真实环境一致的光照效果,解决这个问题的途径是通过获得真实环境中的光源分布,然后在虚拟世界中模拟该光照效果。
本发明的最终目的为在现有的直播技术中增加AR呈现,让直播更加生动形象。接下来通过两个较佳实施例对本发明每个部分进行详细的实施分析。
本实施分析均以“王者荣耀”这类MOBA类3D游戏直播为例,MOBA类3D游戏之所以可运用本申请所提技术,是因为这类游戏都有一个固定大小的场景,所有的人物均在此场景中活动。这样就可以很方便地区分静态模型和动态模型。同理,有固定大小场景的3D游戏(如星际争霸,CS等)均可以套用。
实施例一、普通玩家游戏直播
本实施例以普通玩家游戏直播为例进行说明,包括以下步骤:
步骤1.摄像头采集玩家当前视频,麦克风采集玩家音频,此部分为音视频原始数据。
步骤2.3D游戏AR模型采集分为两部分,以“王者荣耀”为例:
一部分采集游戏整体地图,因为每局游戏地图是一样的,所以地图数据可以本地保存,不需要重复采集,这类数据属于静态数据;
另一部分为玩家控制的人物、小兵、野怪等,这类属于动态数据,但这些人物模型大多都是确定的,唯一不确定的是人物姿态以及坐标朝向等。
在收集数据时为了减少数据量,以收集这些不确定的数据为主,而可以确定的数据大多静态保存。其中静态数据如游戏地图、人物模型等均为游戏厂商提供,动态数据从玩家的游戏中收集。
步骤3.对采集到的音视频原始数据进行编码处理,常用的编码方式包括:CBR、VBR等,常用的视频编码格式包括:H.265、H.264、MPEG-4等,封装容器有TS、MKV、AVI、MP4等,音频包括:G.711μ、AAC、Opus等,封装有MP3、OGG、AAC等。
步骤4.将编码处理后的音视频数据和AR模型数据整合打包,向服务器发送请求推送。服务器接收到请求命令后,允许推流,直播方推送相应数据到服务器端,可采用RTMP/RTSP等协议进行推送。RTMP协议是被Flash用于对象、视频、音频的传输。该协议建立在TCP协议或者轮询HTTP协议之上。RTMP协议就像一个用来装数据包的容器,这些数据既可以是AMF格式的数据,也可以是FLV中的视音频数据。一个单一的连接可以通过不同的通道传输多路网络流,这些通道中的包都是按照固定大小的包传输的。
步骤5.为了适配不同的观看直播终端,对音视频数据进行实时转码,将转码后的数据可分发给各个CDN节点。
步骤6.每个CDN节点根据观众用户选择的直播内容,推送相应的数据给用户。用户收到数据后进行解码,解码分为两个步骤:第一步是区分出音视频数据和AR模型数据;第二步是对这两部分数据分别进行解析,其中,音视频数据可以使用相关硬件或软件对接收到的数据进行解码,得到可以直接显示的图像/声音,一般对应的编码器均带有相应的解码器,也有一些第三方解码插件等。AR模型数据需要区分静态和动态两部分数据。
步骤7.客户端同时利用终端上的摄像头,获得当前的现实场景,通过计算机视觉等技术,对当前环境进行理解,选择合适的渲染位置(如桌面,地面等)建立对应的三维坐标。如果显示场景中无平面,则在场景的中间位置或者由用户指定位置建立对应的三维坐标。
步骤8.在指定渲染位置开始渲染AR模型,先构建静态模型,再将动态模型叠加在静态模型上,最终形成完整的AR场景。
步骤9.将渲染好的图像交由显示终端显示,同时在显示终端中开辟一部分区域显示视频数据,并用终端上的音频播放器播放音频数据。最终呈现如图6所示。
步骤10.用户可以调节终端姿态以调整AR显示效果,如放大、缩小AR模型等。举例说明:如果想观察游戏中某个局部,用户可以将终端对准该位置,并向前移动,这样局部位置就会随着终端前移而放大,同理,想观察全局时,则向后移动终端。如果想调整视角可以通过左移或者右移终端来调节。
附图7是本实施例的流程图,该流程对应上述步骤1-10。
实施例二、职业游戏竞赛直播
本实施例以职业游戏竞赛直播为例进行说明,职业游戏竞赛直播不同于普通玩家的直播,竞赛直播需要提供更多的游戏数据如记分牌、玩家表现等,并且需要支持回放功能,因此,需要用到云端存储。与上述实施例一类似的步骤不再赘述,具体步骤如下:
步骤1、摄像头采集玩家视频信息,麦克风采集解说音频信息,并且还需记录当前游戏数据(记分、玩家表现等)。
步骤2、与实施例一步骤2相同。
步骤3、与实施例一步骤3相同。
步骤4、与实施例一步骤4相同,同时打包游戏数据。
步骤5、与实施例一步骤5相同,同时将所有数据在云端数据库存储备份。
步骤6、与上实施例一步骤6相同,同时解压游戏数据。
步骤7-9、与实施例一7-9相同,在渲染时加入游戏数据的展示,具体呈现如图8所示。
步骤10、与实施例一步骤10相同,并且用户可以选择自己想看的直播内容,从云端数据库调取对应的数据在本地进行观看。
图9是本实施例的流程图,该流程对应上述步骤1-10。
与现有技术相比,本发明为现有的直播***提供了一个全新的直播方式,引入了AR技术,其优点是观众可以更好更全面地体验游戏直播,并且仿佛置身于游戏战场一般,沉浸感十足。
同时也为AR应用场景提供了新的模式,为AR的未来发展提出了新的思路。借助各大直播平台,有助于AR技术的推广,能让大家更加广泛接纳该技术。
以上所述仅为本申请的较佳实施例而已,并不用以限制本申请,凡在本申请的精神和原则之内,所做的任何修改、等同替换、改进等,均应包含在本申请保护的范围之内。
Claims (11)
1.一种AR增强的游戏直播方法,其特征在于,包括:
在直播前,客户端预先接收并存储游戏的静态模型数据;
采集模块收集游戏直播中的音视频数据,并进行编码,同时采集游戏直播中的动态模型数据;
采集模块将动态模型数据和音视频数据打包压缩后,通过网络传输给客户端;
客户端加载预先存储的静态模型数据,并结合接收到的动态模型数据进行AR渲染,实时显示游戏视频,并播放相应的音频。
2.根据权利要求1所述的方法,其特征在于,该方法还包括:
预先对直播的3D游戏场景进行模型重构,转变为适宜通过AR显示的AR模型,所述静态模型数据和动态模型数据构成AR模型数据。
3.根据权利要求2所述的方法,其特征在于:
所述动态模型数据包括:模型动态行为数据、坐标数据、状态数据;
所述静态模型数据包括:3D场景数据、人物模型数据。
4.根据权利要求1至3任一项所述的方法,其特征在于,所述采集模块将动态模型数据和音视频数据打包压缩后,通过网络传输给客户端包括:
采集模块将动态模型数据和音视频数据打包压缩后,向服务器推送打包压缩后的动态模型数据和音视频数据;
服务器收到采集模块推送的所述打包压缩后的动态模型数据和音视频数据后,推送给CDN节点,并由所述CDN节点继续推送到各个客户端,或者,服务器对接收到的所述打包压缩后的动态模型数据和音视频数据进行动态编码以适应不同的客户端需要,同时将所述打包压缩后的动态模型数据和音视频数据存储在云端数据库中,供客户端请求回看时调用播放。
5.根据权利要求3所述的方法,其特征在于,客户端进行AR渲染包括:
客户端对接收到的静态模型数据、动态模型数据和音视频数据进行解码,同时利用客户端的摄像头获得现实场景,对现实场景进行分析,确定AR显示区域方向,建立三维坐标系,将解码后的AR模型在指定AR显示区域显示,同时播放直播视频和音频。
6.根据权利要求5所述的方法,其特征在于:
解码分为音视频数据的解码和AR模型数据的解码,其中,AR模型数据的解码分为静态模型数据和动态模型数据的解码;在进行AR显示时,先渲染静态模型数据,再将动态模型数据叠加在静态模型数据上进行渲染显示。
7.根据权利要求4所述的方法,其特征在于,该方法还包括:
进行用户交互操作,具体包括:调整客户端摄像头的拍摄位置,以调整AR模型的显示位置、角度,调整摄像头焦距,以调整AR模型的大小,利用客户端向服务器发出回看请求,调取存放在云端数据库中的所述打包压缩后的动态模型数据和音视频数据进行回看。
8.一种AR增强的游戏直播***,其特征在于,包括:采集模块、传输模块和客户端模块,其中:
采集模块用于收集游戏直播中的音视频数据,并进行编码,同时采集游戏直播中的动态模型数据,将动态模型数据和音视频数据打包压缩后,推送给传输模块;
传输模块用于通过网络将采集模块所采集的打包压缩后的动态模型数据和音视频数据传输给客户端;
客户端在直播前预先接收并存储游戏的静态模型数据,在接收到传输模块的所述打包压缩后的动态模型数据和音视频数据后,加载预先存储的静态模型数据,并结合接收到的动态模型数据进行AR渲染,实时显示游戏视频,并播放相应的音频。
9.根据权利要求8所述的***,其特征在于:
所述采集模块包括:音视频采集模块、AR场景建模模块和数据压缩编码模块,其中:
所述音视频采集模块通过麦克风和摄像头采集直播者的音视频数据;
所述AR场景建模模块将直播的3D游戏场景进行模型重构,转变为适宜通过AR显示的AR模型,模型重构包括:将静态模型和动态模型剥离,将静态模型的模型范围框选在一个合适的大小内,并分别渲染静态模型和动态模型;
所述数据压缩编码模块用于将音视频数据压缩编码成可通过网络传输的流媒体形式,并将AR模型的静态模型数据和动态模型数据分别压缩编码,最终将所述动态模型数据和音视频数据打包发送到传输模块。
10.根据权利要求8所述的***,其特征在于:
所述传输模块包括:直播服务器推流模块、实时转码服务模块、数据存储服务模块和视频分发服务模块,其中:
所述直播服务器推流模块的服务包括:将采集模块所采集的动态模型数据和音视频数据推送到服务器端,以及将服务器中的动态模型数据和音视频数据推送到各个视频分发服务模块;
所述实时转码服务模块用于满足不同平台的客户端需求,将数据转换成对应不同平台可解析的编码;
所述数据存储服务模块用于提供可回看的功能,将直播中采集的所述动态模型数据和音视频数据同步存储在数据库中,用户可根据自身需要调取相应的动态模型数据和音视频数据进行回看;
所述视频分发服务模块用于将缓存服务器分布到用户访问相对集中的地区或网络中,在用户访问网站时,利用全局负载技术将用户的访问指向距离最近的工作正常的缓存服务器上,由缓存服务器直接响应用户请求。
11.根据权利要求8所述的***,其特征在于:
所述客户端模块包括数据解码模块、场景标定模块、显示模块和AR交互模块,其中:
所述数据解码模块对接收自传输模块的所述打包压缩后的动态模型数据和音视频数据进行解码,得到音视频数据和动态模型数据,动态模型数据发送给场景标定模块进行重构;
所述场景标定模块通过客户端模块的摄像头得到现实场景,再运用环境理解技术,对现实场景进行平面标定,如果现实场景中无平面,则标定在场景的中间位置或者由用户指定显示位置,所标定的区域用于显示AR模型,将模型叠加在现实场景中,最终交由显示模块进行显示;
所述AR交互模块用于接收用户操作,包括移动摄像头观看不同方位,调整摄像头远近用于放大缩小AR模型,当用户进行操作时,需要实时进行渲染,达到AR显示的稳定性。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201811181572.9A CN109195020B (zh) | 2018-10-11 | 2018-10-11 | 一种ar增强的游戏直播方法和*** |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201811181572.9A CN109195020B (zh) | 2018-10-11 | 2018-10-11 | 一种ar增强的游戏直播方法和*** |
Publications (2)
Publication Number | Publication Date |
---|---|
CN109195020A CN109195020A (zh) | 2019-01-11 |
CN109195020B true CN109195020B (zh) | 2021-07-02 |
Family
ID=64948102
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201811181572.9A Active CN109195020B (zh) | 2018-10-11 | 2018-10-11 | 一种ar增强的游戏直播方法和*** |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN109195020B (zh) |
Families Citing this family (19)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN109842811B (zh) * | 2019-04-03 | 2021-01-19 | 腾讯科技(深圳)有限公司 | 一种在视频中植入推送信息的方法、装置及电子设备 |
CN110288658A (zh) * | 2019-05-24 | 2019-09-27 | 联想(上海)信息技术有限公司 | 一种信息处理方法、装置及计算机存储介质 |
CN112118213B (zh) * | 2019-06-21 | 2021-10-22 | 广州虎牙科技有限公司 | 一种线上的视频数据输出方法、***及云平台 |
CN112118212B (zh) * | 2019-06-21 | 2021-09-24 | 广州虎牙科技有限公司 | 一种基于云平台的视频数据输出方法、***及云平台 |
CN110536146B (zh) * | 2019-08-19 | 2021-12-31 | 广州点云科技有限公司 | 一种基于云游戏的直播开播方法、装置以及存储介质 |
CN110533780B (zh) | 2019-08-28 | 2023-02-24 | 深圳市商汤科技有限公司 | 一种图像处理方法及其装置、设备和存储介质 |
CN110689570B (zh) * | 2019-09-29 | 2020-11-27 | 北京达佳互联信息技术有限公司 | 虚拟形象直播方法、装置、电子设备及存储介质 |
CN112702611A (zh) * | 2019-10-22 | 2021-04-23 | 上海华为技术有限公司 | 一种播放方法以及播放*** |
WO2021088973A1 (zh) * | 2019-11-07 | 2021-05-14 | 广州虎牙科技有限公司 | 直播流显示方法、装置、电子设备及可读存储介质 |
CN111447485A (zh) * | 2020-03-31 | 2020-07-24 | 广州微算互联信息技术有限公司 | 一种实时的云游戏录制视频方法、***、装置及存储介质 |
CN111447458A (zh) * | 2020-04-01 | 2020-07-24 | 广州市百果园信息技术有限公司 | 基于内容解说的直播***、方法、装置和直播服务器 |
CN111242704B (zh) * | 2020-04-26 | 2020-12-08 | 北京外号信息技术有限公司 | 用于在现实场景中叠加直播人物影像的方法和电子设备 |
CN111970522A (zh) * | 2020-07-31 | 2020-11-20 | 北京琳云信息科技有限责任公司 | 虚拟直播数据的处理方法、装置及存储介质 |
CN111935495A (zh) * | 2020-08-13 | 2020-11-13 | 上海识装信息科技有限公司 | 一种基于ar技术的视频直播商品展示方法及*** |
CN113382305B (zh) * | 2021-05-27 | 2023-05-23 | 北京工业大学 | 基于三维场景的在线视频直播*** |
CN113490048B (zh) * | 2021-07-28 | 2023-06-27 | 广东金马游乐股份有限公司 | 一种动感影视*** |
CN114390048A (zh) * | 2021-12-31 | 2022-04-22 | 凌宇科技(北京)有限公司 | 一种云vr投屏***和方法 |
CN114629812A (zh) * | 2022-03-28 | 2022-06-14 | 中国电子科技集团公司第三十八研究所 | 一种基于自主可控平台的集群可视化***及方法 |
CN118059469A (zh) * | 2022-11-22 | 2024-05-24 | 华为技术有限公司 | 游戏数据传输及处理方法、服务器和终端设备 |
Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US8012023B2 (en) * | 2006-09-28 | 2011-09-06 | Microsoft Corporation | Virtual entertainment |
CN106101735A (zh) * | 2016-06-23 | 2016-11-09 | 赵涛 | 一种基于虚拟现实技术的台球直播方法 |
CN107174825A (zh) * | 2017-04-28 | 2017-09-19 | 苏州蜗牛数字科技股份有限公司 | 一种基于模型的远程图像重建方法及*** |
CN107376360A (zh) * | 2017-06-19 | 2017-11-24 | 深圳市铂岩科技有限公司 | 游戏直播方法及游戏直播*** |
CN107454434A (zh) * | 2017-08-14 | 2017-12-08 | 姜汉龙 | 虚拟现实视频直播方法及视频播放终端 |
CN108364353A (zh) * | 2017-12-27 | 2018-08-03 | 广东鸿威国际会展集团有限公司 | 引导观看者观看场景的三维直播流的***和方法 |
-
2018
- 2018-10-11 CN CN201811181572.9A patent/CN109195020B/zh active Active
Patent Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US8012023B2 (en) * | 2006-09-28 | 2011-09-06 | Microsoft Corporation | Virtual entertainment |
CN106101735A (zh) * | 2016-06-23 | 2016-11-09 | 赵涛 | 一种基于虚拟现实技术的台球直播方法 |
CN107174825A (zh) * | 2017-04-28 | 2017-09-19 | 苏州蜗牛数字科技股份有限公司 | 一种基于模型的远程图像重建方法及*** |
CN107376360A (zh) * | 2017-06-19 | 2017-11-24 | 深圳市铂岩科技有限公司 | 游戏直播方法及游戏直播*** |
CN107454434A (zh) * | 2017-08-14 | 2017-12-08 | 姜汉龙 | 虚拟现实视频直播方法及视频播放终端 |
CN108364353A (zh) * | 2017-12-27 | 2018-08-03 | 广东鸿威国际会展集团有限公司 | 引导观看者观看场景的三维直播流的***和方法 |
Also Published As
Publication number | Publication date |
---|---|
CN109195020A (zh) | 2019-01-11 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN109195020B (zh) | 一种ar增强的游戏直播方法和*** | |
US10229651B2 (en) | Variable refresh rate video capture and playback | |
CN106792228B (zh) | 一种直播互动方法和*** | |
US20190158933A1 (en) | Method, device, and computer program for improving streaming of virtual reality media content | |
CN108282449B (zh) | 一种应用于虚拟现实技术的流媒体的传输方法和客户端 | |
WO2019202207A1 (en) | Processing video patches for three-dimensional content | |
US11943421B2 (en) | Method, an apparatus and a computer program product for virtual reality | |
CN107801083A (zh) | 一种基于三维虚拟技术的网络实时互动直播方法及装置 | |
US20160330408A1 (en) | Method for progressive generation, storage and delivery of synthesized view transitions in multiple viewpoints interactive fruition environments | |
US10582232B1 (en) | Transcoding frame-synchronous metadata for segmented video delivery | |
CN102340690A (zh) | 一种互动电视节目***及实现方法 | |
US11451858B2 (en) | Method and system of processing information flow and method of displaying comment information | |
WO2017185761A1 (zh) | 2d视频播放方法及装置 | |
US10638029B2 (en) | Shared experiences in panoramic video | |
WO2023051138A1 (zh) | 沉浸媒体的数据处理方法、装置、设备、存储介质及程序产品 | |
KR20210084248A (ko) | Vr 컨텐츠 중계 플랫폼 제공 방법 및 그 장치 | |
Zerman et al. | User behaviour analysis of volumetric video in augmented reality | |
US20210144283A1 (en) | An apparatus, method, and system for capturing 360/virtual reality video using a mobile phone add-on | |
US20170221174A1 (en) | Gpu data sniffing and 3d streaming system and method | |
CN112153401B (zh) | 视频处理方法、通信设备及可读存储介质 | |
CN114666565B (zh) | 多视角视频播放方法、装置及存储介质 | |
CN113194326A (zh) | 全景直播方法、装置、计算机设备及计算机可读存储介质 | |
Junior et al. | Photorealism in low-cost virtual reality devices | |
EP3776484A1 (en) | Associating file format objects and dynamic adaptive streaming over hypertext transfer protocol (dash) objects | |
Gao et al. | Omniviewer: Multi-modal monoscopic 3D DASH |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |