CN114513682A - 多媒体资源展示方法、发送方法、装置、设备及介质 - Google Patents

多媒体资源展示方法、发送方法、装置、设备及介质 Download PDF

Info

Publication number
CN114513682A
CN114513682A CN202210145376.6A CN202210145376A CN114513682A CN 114513682 A CN114513682 A CN 114513682A CN 202210145376 A CN202210145376 A CN 202210145376A CN 114513682 A CN114513682 A CN 114513682A
Authority
CN
China
Prior art keywords
multimedia resource
multimedia
resource
presentation
element information
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202210145376.6A
Other languages
English (en)
Inventor
任超
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing Dajia Internet Information Technology Co Ltd
Original Assignee
Beijing Dajia Internet Information Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing Dajia Internet Information Technology Co Ltd filed Critical Beijing Dajia Internet Information Technology Co Ltd
Priority to CN202210145376.6A priority Critical patent/CN114513682A/zh
Publication of CN114513682A publication Critical patent/CN114513682A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/20Servers specifically adapted for the distribution of content, e.g. VOD servers; Operations thereof
    • H04N21/23Processing of content or additional data; Elementary server operations; Server middleware
    • H04N21/233Processing of audio elementary streams
    • AHUMAN NECESSITIES
    • A63SPORTS; GAMES; AMUSEMENTS
    • A63FCARD, BOARD, OR ROULETTE GAMES; INDOOR GAMES USING SMALL MOVING PLAYING BODIES; VIDEO GAMES; GAMES NOT OTHERWISE PROVIDED FOR
    • A63F13/00Video games, i.e. games using an electronically generated display having two or more dimensions
    • A63F13/50Controlling the output signals based on the game progress
    • A63F13/53Controlling the output signals based on the game progress involving additional visual information provided to the game scene, e.g. by overlay to simulate a head-up display [HUD] or displaying a laser sight in a shooting game
    • A63F13/537Controlling the output signals based on the game progress involving additional visual information provided to the game scene, e.g. by overlay to simulate a head-up display [HUD] or displaying a laser sight in a shooting game using indicators, e.g. showing the condition of a game character on screen
    • AHUMAN NECESSITIES
    • A63SPORTS; GAMES; AMUSEMENTS
    • A63FCARD, BOARD, OR ROULETTE GAMES; INDOOR GAMES USING SMALL MOVING PLAYING BODIES; VIDEO GAMES; GAMES NOT OTHERWISE PROVIDED FOR
    • A63F13/00Video games, i.e. games using an electronically generated display having two or more dimensions
    • A63F13/85Providing additional services to players
    • A63F13/86Watching games played by other players
    • AHUMAN NECESSITIES
    • A63SPORTS; GAMES; AMUSEMENTS
    • A63FCARD, BOARD, OR ROULETTE GAMES; INDOOR GAMES USING SMALL MOVING PLAYING BODIES; VIDEO GAMES; GAMES NOT OTHERWISE PROVIDED FOR
    • A63F13/00Video games, i.e. games using an electronically generated display having two or more dimensions
    • A63F13/85Providing additional services to players
    • A63F13/87Communicating with other players during game play, e.g. by e-mail or chat
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/40Information retrieval; Database structures therefor; File system structures therefor of multimedia data, e.g. slideshows comprising image and additional audio data
    • G06F16/43Querying
    • G06F16/432Query formulation
    • G06F16/433Query formulation using audio data
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/40Information retrieval; Database structures therefor; File system structures therefor of multimedia data, e.g. slideshows comprising image and additional audio data
    • G06F16/43Querying
    • G06F16/435Filtering based on additional data, e.g. user or group profiles
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/40Information retrieval; Database structures therefor; File system structures therefor of multimedia data, e.g. slideshows comprising image and additional audio data
    • G06F16/43Querying
    • G06F16/438Presentation of query results
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L13/00Speech synthesis; Text to speech systems
    • G10L13/02Methods for producing synthetic speech; Speech synthesisers
    • G10L13/04Details of speech synthesis systems, e.g. synthesiser structure or memory management
    • G10L13/047Architecture of speech synthesisers
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/003Changing voice quality, e.g. pitch or formants
    • G10L21/007Changing voice quality, e.g. pitch or formants characterised by the process used
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/003Changing voice quality, e.g. pitch or formants
    • G10L21/007Changing voice quality, e.g. pitch or formants characterised by the process used
    • G10L21/013Adapting to target pitch
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/20Servers specifically adapted for the distribution of content, e.g. VOD servers; Operations thereof
    • H04N21/21Server components or server architectures
    • H04N21/218Source of audio or video content, e.g. local disk arrays
    • H04N21/2187Live feed
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/20Servers specifically adapted for the distribution of content, e.g. VOD servers; Operations thereof
    • H04N21/23Processing of content or additional data; Elementary server operations; Server middleware
    • H04N21/235Processing of additional data, e.g. scrambling of additional data or processing content descriptors
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/40Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
    • H04N21/43Processing of content or additional data, e.g. demultiplexing additional data from a digital video stream; Elementary client operations, e.g. monitoring of home network or synchronising decoder's clock; Client middleware
    • H04N21/431Generation of visual interfaces for content selection or interaction; Content or additional data rendering
    • H04N21/4312Generation of visual interfaces for content selection or interaction; Content or additional data rendering involving specific graphical features, e.g. screen layout, special fonts or colors, blinking icons, highlights or animations
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/40Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
    • H04N21/47End-user applications
    • H04N21/478Supplemental services, e.g. displaying phone caller identification, shopping application
    • H04N21/4781Games
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/40Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
    • H04N21/47End-user applications
    • H04N21/478Supplemental services, e.g. displaying phone caller identification, shopping application
    • H04N21/4788Supplemental services, e.g. displaying phone caller identification, shopping application communicating with other users, e.g. chatting
    • AHUMAN NECESSITIES
    • A63SPORTS; GAMES; AMUSEMENTS
    • A63FCARD, BOARD, OR ROULETTE GAMES; INDOOR GAMES USING SMALL MOVING PLAYING BODIES; VIDEO GAMES; GAMES NOT OTHERWISE PROVIDED FOR
    • A63F2300/00Features of games using an electronically generated display having two or more dimensions, e.g. on a television screen, showing representations related to the game
    • A63F2300/30Features of games using an electronically generated display having two or more dimensions, e.g. on a television screen, showing representations related to the game characterized by output arrangements for receiving control signals generated by the game device
    • A63F2300/308Details of the user interface
    • AHUMAN NECESSITIES
    • A63SPORTS; GAMES; AMUSEMENTS
    • A63FCARD, BOARD, OR ROULETTE GAMES; INDOOR GAMES USING SMALL MOVING PLAYING BODIES; VIDEO GAMES; GAMES NOT OTHERWISE PROVIDED FOR
    • A63F2300/00Features of games using an electronically generated display having two or more dimensions, e.g. on a television screen, showing representations related to the game
    • A63F2300/50Features of games using an electronically generated display having two or more dimensions, e.g. on a television screen, showing representations related to the game characterized by details of game servers
    • A63F2300/57Features of games using an electronically generated display having two or more dimensions, e.g. on a television screen, showing representations related to the game characterized by details of game servers details of game services offered to the player
    • A63F2300/572Communication between players during game play of non game information, e.g. e-mail, chat, file transfer, streaming of audio and streaming of video
    • AHUMAN NECESSITIES
    • A63SPORTS; GAMES; AMUSEMENTS
    • A63FCARD, BOARD, OR ROULETTE GAMES; INDOOR GAMES USING SMALL MOVING PLAYING BODIES; VIDEO GAMES; GAMES NOT OTHERWISE PROVIDED FOR
    • A63F2300/00Features of games using an electronically generated display having two or more dimensions, e.g. on a television screen, showing representations related to the game
    • A63F2300/50Features of games using an electronically generated display having two or more dimensions, e.g. on a television screen, showing representations related to the game characterized by details of game servers
    • A63F2300/57Features of games using an electronically generated display having two or more dimensions, e.g. on a television screen, showing representations related to the game characterized by details of game servers details of game services offered to the player
    • A63F2300/577Features of games using an electronically generated display having two or more dimensions, e.g. on a television screen, showing representations related to the game characterized by details of game servers details of game services offered to the player for watching a game played by other players
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/003Changing voice quality, e.g. pitch or formants
    • G10L21/007Changing voice quality, e.g. pitch or formants characterised by the process used
    • G10L21/013Adapting to target pitch
    • G10L2021/0135Voice conversion or morphing

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Quality & Reliability (AREA)
  • General Engineering & Computer Science (AREA)
  • Databases & Information Systems (AREA)
  • Health & Medical Sciences (AREA)
  • Acoustics & Sound (AREA)
  • Data Mining & Analysis (AREA)
  • Human Computer Interaction (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • General Physics & Mathematics (AREA)
  • Computational Linguistics (AREA)
  • Mathematical Physics (AREA)
  • Optics & Photonics (AREA)
  • Information Transfer Between Computers (AREA)

Abstract

本公开关于一种多媒体资源展示方法、发送方法、装置、设备及介质,所述多媒体资源展示方法包括:向服务器发送获取多媒体资源展示空间的数据的请求;从所述服务器接收多媒体资源和展示空间的元素信息,其中,所述展示空间的元素信息包括与所述多媒体资源的内容信息相关的元素信息;基于所述展示空间的元素信息渲染展示空间;在经过渲染的所述展示空间中展示所述多媒体资源。根据本公开的多媒体资源展示方法、发送方法、装置、设备及介质,可使用户沉浸式体验展示出的多媒体资源,改善了用户体验,从而可吸引更多的用户,提高了多媒体资源的展示效益。

Description

多媒体资源展示方法、发送方法、装置、设备及介质
技术领域
本公开涉及互联网技术领域,更具体地说,涉及一种多媒体资源展示方法、发送方法、装置、设备及介质。
背景技术
随着互联网技术的快速发展,涉及到在设备中展示多媒体资源(例如,游戏、音频、视频等)的场景也越来越丰富,其中,在某些多媒体资源展示场景中,由于展示空间的布局等原因,导致多媒体资源展示的效果不甚理想,例如,存在一种多媒体资源展示场景——游戏直播,当前的游戏直播间的布局比较单一,针对展示不同类型游戏的直播间,其区别仅在于游戏直播画面不同,导致游戏直播的直播效果不够理想,进而还导致观看游戏直播的用户体验欠佳。
发明内容
本公开提供一种多媒体资源展示方法、发送方法、装置、设备及介质,以至少解决上述相关技术中的问题。
根据本公开实施例的第一方面,提供一种多媒体资源展示方法,包括:向服务器发送获取多媒体资源展示空间的数据的请求;从所述服务器接收多媒体资源和展示空间的元素信息,其中,所述展示空间的元素信息包括与所述多媒体资源的内容信息相关的元素信息;基于所述展示空间的元素信息渲染展示空间;在经过渲染的所述展示空间中展示所述多媒体资源。
可选地,所述多媒体资源包括与所述多媒体资源的内容信息相关的用户语音资源。
可选地,所述用户语音资源对应的用户语音音色被处理为模拟所述多媒体资源的内容信息中的虚拟角色的音色。
可选地,所述与所述多媒体资源的内容信息相关的元素信息包括与所述多媒体资源的内容信息相关的画面信息和与所述多媒体资源的内容信息相关的音效信息;所述基于所述展示空间的元素信息渲染展示空间,包括:基于所述画面信息和所述音效信息对所述展示空间分别进行画面渲染和音效渲染。
可选地,所述展示空间包括用于展示多媒体资源的第一区域和用于展示空间元素的第二区域;所述基于所述展示空间的元素信息渲染所述展示空间,包括:基于所述展示空间的元素信息渲染所述第二区域。
根据本公开实施例的第二方面,提供一种多媒体资源发送方法,包括:接收多媒体资源;识别所述多媒体资源的内容信息;获取与所述内容信息相关的元素信息,其中,所述元素信息用于渲染用于展示所述多媒体资源的展示空间;接收从客户端发送的获取所述展示空间的数据的请求;响应于所述请求,向所述客户端发送所述多媒体资源以及展示空间的元素信息,其中,所述展示空间的元素信息包括所述与所述内容信息相关的元素信息。
可选地,所述获取与所述内容信息相关的元素信息,包括:从数据库中查找并获取与所述内容信息相关的元素信息,其中,所述数据库预先存储与多种内容信息相关的多种元素信息,所述多种内容信息包括所述内容信息。
可选地,所述多媒体资源包括第一用户语音资源;所述多媒体资源发送方法还包括:在所述识别所述多媒体资源的内容信息后,将所述第一用户语音资源与所述多媒体资源的内容信息相关联,得到第二用户语音资源;所述向所述客户端发送所述多媒体资源,包括:向所述客户端发送包括所述第二用户语音资源的所述多媒体资源。
可选地,所述将所述第一用户语音资源与所述多媒体资源的内容信息相关联,包括:获取所述多媒体资源的内容信息中的虚拟角色的音色信息和所述第一用户语音资源的用户语音数据;基于所述音色信息和所述用户语音数据执行语音合成,得到所述第二用户语音资源,使得所述第二用户语音资源对应的用户语音音色模拟所述多媒体资源的内容信息中的虚拟角色的音色。
可选地,所述获取与所述内容信息相关的元素信息,包括:获取与所述内容信息相关的画面信息和与所述内容信息相关的音效信息,其中,所述画面信息和所述音效信息分别用于对所述展示空间进行画面渲染和音效渲染。
可选地,所述展示空间包括用于展示多媒体资源的第一区域和用于展示空间元素的第二区域,其中,所述展示空间的元素信息用于渲染所述第二区域。
根据本公开实施例的第三方面,提供一种多媒体资源展示装置,包括:请求发送单元,被配置为:向服务器发送获取多媒体资源展示空间的数据的请求;数据接收单元,被配置为:从所述服务器接收多媒体资源和展示空间的元素信息,其中,所述展示空间的元素信息包括与所述多媒体资源的内容信息相关的元素信息;展示空间渲染单元,被配置为:基于所述展示空间的元素信息渲染展示空间;资源展示单元,被配置为:在经过渲染的所述展示空间中展示所述多媒体资源。
可选地,所述多媒体资源包括与所述多媒体资源的内容信息相关的用户语音资源。
可选地,所述用户语音资源对应的用户语音音色被处理为模拟所述多媒体资源的内容信息中的虚拟角色的音色。
可选地,所述与所述多媒体资源的内容信息相关的元素信息包括与所述多媒体资源的内容信息相关的画面信息和与所述多媒体资源的内容信息相关的音效信息;所述展示空间渲染单元被配置为:基于所述画面信息和所述音效信息对所述展示空间分别进行画面渲染和音效渲染。
可选地,所述展示空间包括用于展示多媒体资源的第一区域和用于展示空间元素的第二区域;所述展示空间渲染单元被配置为:基于所述展示空间的元素信息渲染所述第二区域。
根据本公开实施例的第四方面,提供一种多媒体资源展示装置,包括:资源接收单元,被配置为:接收多媒体资源;内容信息识别单元,被配置为:识别所述多媒体资源的内容信息;元素信息获取单元,被配置为:获取与所述内容信息相关的元素信息,其中,所述元素信息用于渲染用于展示所述多媒体资源的展示空间;请求接收单元,被配置为:接收从客户端发送的获取所述展示空间的数据的请求;数据发送单元,被配置为:响应于所述请求,向所述客户端发送所述多媒体资源以及展示空间的元素信息,其中,所述展示空间的元素信息包括所述与所述内容信息相关的元素信息。
可选地,所述元素信息获取单元被配置为:从数据库中查找并获取与所述内容信息相关的元素信息,其中,所述数据库预先存储与多种内容信息相关的多种元素信息,所述多种内容信息包括所述内容信息。
可选地,所述多媒体资源包括第一用户语音资源;所述多媒体资源发送装置还包括第二用户语音获取单元,被配置为:在所述识别所述多媒体资源的内容信息后,将所述第一用户语音资源与所述多媒体资源的内容信息相关联,得到第二用户语音资源;所述数据发送单元被配置为:向所述客户端发送包括所述第二用户语音资源的所述多媒体资源。
可选地,所述第二用户语音获取单元被配置为:获取所述多媒体资源的内容信息中的虚拟角色的音色信息和所述第一用户语音资源的用户语音数据;基于所述音色信息和所述用户语音数据执行语音合成,得到所述第二用户语音资源,使得所述第二用户语音资源对应的用户语音音色模拟所述多媒体资源的内容信息中的虚拟角色的音色。
可选地,所述元素信息获取单元被配置为:获取与所述内容信息相关的画面信息和与所述内容信息相关的音效信息,其中,所述画面信息和所述音效信息分别用于对所述展示空间进行画面渲染和音效渲染。
可选地,所述展示空间包括用于展示多媒体资源的第一区域和用于展示空间元素的第二区域,其中,所述展示空间的元素信息用于渲染所述第二区域。
根据本公开实施例的第五方面,提供一种电子设备,包括:至少一个处理器;至少一个存储计算机可执行指令的存储器,其中,所述计算机可执行指令在被所述至少一个处理器运行时,促使所述至少一个处理器执行根据本公开的第一方面的多媒体资源展示方法或第二方面的多媒体资源发送方法。
根据本公开实施例的第六方面,提供一种存储指令的计算机可读存储介质,当所述指令被至少一个处理器运行时,促使所述至少一个处理器执行根据本公开的第一方面的多媒体资源展示方法或第二方面的多媒体资源发送方法。
根据本公开实施例的第七方面,提供一种计算机程序产品,该计算机程序产品中的指令可由计算机设备的处理器执行以完成根据本公开的第一方面的多媒体资源展示方法或第二方面的多媒体资源发送方法。
本公开的实施例提供的技术方案至少带来以下有益效果:
根据本公开的多媒体资源展示方法、装置、设备及介质,通过与多媒体资源的内容信息相关的元素信息渲染展示空间,可丰富展示空间的元素的展示样式,使展示空间的风格与多媒体资源相匹配,因此,在经过渲染后的展示空间中展示多媒体资源,可使用户沉浸式体验展示出的多媒体资源,改善了用户体验,从而可吸引更多的用户,提高了多媒体资源的展示效益。
另外,由于展示出的多媒体资源中的用户语音资源对应的用户语音音色与多媒体资源的内容信息中的虚拟角色的音色相匹配,因此可进一步丰富展示空间的展示样式,使展示空间的风格与多媒体资源相适应,进一步使用户沉浸式体验展示出的多媒体资源,从而进一步提高多媒体资源的展示效益。
此外,根据本公开的多媒体资源发送方法、装置、设备及介质,在接收到多媒体资源后,根据多媒体资源的内容信息获取与该内容信息相关的元素信息,在接收到客户端的获取展示空间的数据的请求之后,将多媒体资源以及包括与该内容信息相关的元素信息的展示空间的元素信息发送给客户端,从而可在客户端通过与多媒体资源的内容信息相关的元素信息渲染展示空间,使展示空间的风格与多媒体资源相匹配,以及使用户沉浸式体验展示出的多媒体资源,提高了多媒体资源的展示效益。
另外,还基于多媒体资源中的第一用户语音资源的用户语音数据和多媒体资源的内容信息中的虚拟角色的音色信息执行语音合成,得到第二用户语音资源,由于该第二用户语音资源对应的用户语音音色与虚拟角色的音色相匹配,因此,将第二用户语音资源发送至客户端后,可使客户端的展示空间的风格与多媒体资源更匹配,从而进一步使用户沉浸式体验展示出的多媒体资源,提高多媒体资源的展示效益。
应当理解的是,以上的一般描述和后文的细节描述仅是示例性和解释性的,并不能限制本公开。
附图说明
此处的附图被并入说明书中并构成本说明书的一部分,示出了符合本公开的实施例,并与说明书一起用于解释本公开的原理,并不构成对本公开的不当限定。
图1是示出本公开的示例性实施例可以应用于其中的示例性***架构100。
图2是示出根据本公开的示例性实施例的多媒体资源展示方法的流程图。
图3(a)是示出根据本公开的示例性实施例的相关技术中的游戏直播间的示意图。
图3(b)是示出根据本公开的示例性实施例的游戏直播间的示意图。
图4是示出根据本公开的示例性实施例的多媒体资源发送方法的流程图。
图5是示出根据本公开的示例性实施例的游戏直播间的实现过程的示意图。
图6是示出根据本公开的示例性实施例的多媒体资源展示装置的框图。
图7是示出根据本公开的示例性实施例的多媒体资源发送装置的框图。
图8是根据本公开的示例性实施例的电子设备800的框图。
具体实施方式
为了使本领域普通人员更好地理解本公开的技术方案,下面将结合附图,对本公开实施例中的技术方案进行清楚、完整地描述。
需要说明的是,本公开的说明书和权利要求书及上述附图中的术语“第一”、“第二”等是用于区别类似的对象,而不必用于描述特定的顺序或先后次序。应该理解这样使用的数据在适当情况下可以互换,以便这里描述的本公开的实施例能够以除了在这里图示或描述的那些以外的顺序实施。以下实施例中所描述的实施方式并不代表与本公开相一致的所有实施方式。相反,它们仅是与如所附权利要求书中所详述的、本公开的一些方面相一致的装置和方法的例子。
在此需要说明的是,在本公开中出现的“若干项之中的至少一项”均表示包含“该若干项中的任意一项”、“该若干项中的任意多项的组合”、“该若干项的全体”这三类并列的情况。例如“包括A和B之中的至少一个”即包括如下三种并列的情况:(1)包括A;(2)包括B;(3)包括A和B。又例如“执行步骤一和步骤二之中的至少一个”,即表示如下三种并列的情况:(1)执行步骤一;(2)执行步骤二;(3)执行步骤一和步骤二。
为了解决相关的技术问题,本公开提出了一种多媒体资源展示方法、发送方法、装置、设备及介质,具体地说,通过与多媒体资源的内容信息相关的元素信息渲染展示空间,可丰富展示空间的元素的展示样式,使展示空间的风格与多媒体资源相匹配,因此,在经过渲染后的展示空间中展示多媒体资源,可使用户沉浸式体验展示出的多媒体资源,改善了用户体验,从而可吸引更多的用户,提高了多媒体资源的展示效益。另外,由于展示出的多媒体资源中的用户语音资源对应的用户语音音色与多媒体资源的内容信息中的虚拟角色的音色相匹配,因此可进一步丰富展示空间的展示样式,使展示空间的风格与多媒体资源相适应,进一步使用户沉浸式体验展示出的多媒体资源,从而进一步提高多媒体资源的展示效益。下面,将参照图1至图8具体描述根据本公开的示例性实施例的多媒体资源展示方法、发送方法、装置、设备及介质。
图1是示出本公开的示例性实施例可以应用于其中的示例性***架构100。
如图1所示,***架构100可以包括终端设备101、102、103,网络104和服务器105。网络104用以在终端设备101、102、103和服务器105之间提供通信链路的介质。网络104可以包括各种连接类型,例如有线、无线通信链路或者光纤电缆等等。用户可以使用终端设备101、102、103通过网络104与服务器105交互,以接收或发送消息(例如,用于发送获取多媒体资源展示空间的数据的请求或者接收多媒体资源和展示空间的元素信息等)等。终端设备101、102、103上可以安装有各种涉及展示多媒体资源的应用,例如,视频播放应用、音频播放应用或者直播应用等。终端设备101、102、103可以是硬件,也可以是软件。当终端设备101、102、103为硬件时,可以是具有显示屏并且能够进行资源处理的各种电子设备,包括但不限于智能手机、平板电脑、膝上型便携计算机和台式计算机等等。当终端设备101、102、103为软件时,可以安装在上述所列举的电子设备中,其可以实现成多个软件或软件模块(例如,用来提供分布式服务),也可以实现成单个软件或软件模块。在此不做具体限定。
服务器105可以是提供各种服务的服务器,例如对终端设备101、102、103上所安装的多媒体应用提供支持的后台服务器。后台服务器例如可响应于接收到多媒体资源,对该多媒体资源的内容信息进行解析、存储等处理,也可响应于接收到获取展示空间的数据的请求,向终端设备101、102、103发送多媒体资源以及展示空间的元素信息等。
需要说明的是,服务器可以是硬件,也可以是软件。当服务器为硬件时,可以实现成多个服务器组成的分布式服务器集群,也可以实现成单个服务器。当服务器为软件时,可以实现成多个软件或软件模块(例如,用来提供分布式服务),也可以实现成单个软件或软件模块。在此不做具体限定。
图2是示出根据本公开的示例性实施例的多媒体资源展示方法的流程图。
参照图2,在步骤201,可向服务器发送获取多媒体资源展示空间的数据的请求。这里,多媒体资源展示空间为展示多媒体资源的展示空间,例如游戏直播间等,对此不作限制。相对应地,多媒体资源展示空间的数据为与展示空间相关的数据,例如在游戏直播间中,该数据为正在直播的游戏画面数据和游戏声音数据、主播的声音数据、评论区的用户相关数据和图标数据等。
在步骤202,可从服务器接收多媒体资源和展示空间的元素信息,其中,展示空间的元素信息包括与接收到的多媒体资源的内容信息相关的元素信息。这里,多媒体资源为数据资源,例如为正在直播的游戏画面数据、游戏声音数据和主播声音数据等。多媒体资源的内容信息指向该多媒体资源的内容,针对不同的多媒体资源,其内容不同。展示空间的元素信息指向展示空间中除需展示的多媒体资源之外的所有元素(例如,图标、背景、用户名称、用户评论等)。例如,当该多媒体资源是关于正在直播的游戏时,内容信息指向的是正在直播的游戏的类型以及该类型游戏的游戏内容(游戏画面、角色或者音效),而展示空间的元素信息指向的则是主播及直播间的用户的用户名、头像、直播间的背景、评论区的评论以及送礼动效等,此时,与多媒体资源的内容信息相关的元素信息指向的是直播间中各种元素的与正在直播的游戏内容相关的展示样式,例如,头像的展示样式模拟正在直播的游戏中的头像展示样式(例如,头像加带有该直播游戏风格的边框等)、字体和字体颜色与游戏中的字体和字体颜色一致或者相似等,而直播间的背景可为与正在直播的游戏的内容相匹配的静态图或者动态图(例如,背景可以是该直播游戏的主题封面图等)。在一些实施例中,由于多媒体资源展示空间的数据具有不同的特点,因此向服务器发送的请求可包括第一请求和第二请求,其中,第一请求用于获取多媒体资源,第二请求用于获取展示空间的元素信息。
在步骤203,可基于展示空间的元素信息渲染展示空间。
根据本公开的示例性实施例,与多媒体资源的内容信息相关的元素信息包括与多媒体资源的内容信息相关的画面信息和与多媒体资源的内容信息相关的音效信息,可基于画面信息和音效信息对展示空间分别进行画面渲染和音效渲染,从而使渲染出的展示空间的样式风格与需展示的多媒体资源的内容信息更加匹配。具体来讲,展示空间中的元素既包括图像(例如,图标、背景以及文字等),又包括声音(例如,用户在展示空间中点击图标发出的点击声等),为了使展示空间的样式风格与多媒体资源的内容信息更加匹配,可通过与多媒体资源的内容信息相关的画面信息对展示空间进行画面渲染,使展示空间的元素的画面样式与多媒体资源的内容相适应,并通过与多媒体资源的内容信息相关的音效信息对展示空间进行音效渲染,使展示空间的音效风格与多媒体资源的内容相适应。
根据本公开的示例性实施例,展示空间包括用于展示多媒体资源的第一区域和用于展示空间元素的第二区域,可基于展示空间的元素信息渲染第二区域。也就是说,对展示空间中除用于展示多媒体资源之外的全部区域进行渲染,从而在极大程度上使展示空间的样式风格与需展示的多媒体资源的内容信息相匹配,以得到更好的展示效果,使用户能够沉浸式体验展示出的多媒体资源。
根据本公开的示例性实施例,多媒体资源还包括与多媒体资源的内容信息相关的用户语音资源。这里,用户语音资源为真人对多媒体资源的内容进行解说而产生的语音资源,由于真人原声与多媒体资源的内容(例如,声音内容)存在违和感,可能导致在展示空间中展示多媒体资源时的展示效果欠佳,影响用户体验。因此,可将用户语音资源处理为与多媒体资源的内容信息相关,从而在展示空间中展示多媒体资源时,可在极大程度上改善用户在听感上的体验,进而吸引更多用户,提高展示效益。在一些实施例中,用户语音资源对应的用户语音音色被处理为模拟多媒体资源的内容信息中的虚拟角色的音色,从而改善听感上的违和感。
在步骤204,可在经过渲染的展示空间中展示多媒体资源。这里,展示空间经过渲染后,其空间元素的展示样式在极大程度上与正在展示的多媒体资源的内容相匹配,因此,在经过渲染后的展示空间中展示多媒体资源,可使用户沉浸式体验展示出的多媒体资源,改善了用户体验,从而可吸引更多的用户,提高了多媒体资源的展示效益。
为使本公开示出的方案得到清晰的展示,下面结合具体的实施场景示例性描述本公开示出的方案。
图3(a)是示出根据本公开的示例性实施例的相关技术中的游戏直播间的示意图。
图3(b)是示出根据本公开的示例性实施例的游戏直播间的示意图。
参照图3(a)和图3(b),在游戏直播间300(即,展示空间)中包括第一区域310和第二区域320,其中,第一区域310用于展示直播的游戏内容,第二区域320用于展示与直播的游戏内容相关的元素,例如,主播头像321、评论区322、礼物标识323以及互动栏324等。在相关技术中,第二区域320中各元素的展示样式是固定的,也就是说,当在第一区域310中直播的游戏A变更为另一种游戏B时,第二区域320中各元素的展示样式,例如,主播头像321、评论区322、礼物标识323以及互动栏324等的展示样式不会随之发生变化,可能导致观看直播的用户无法全身心地投入到直播的游戏之中,可观赏性和观看时长都偏低。而根据本公开示出的方案,通过将第二区域320中的各元素的展示样式与直播的游戏内容相关联,可在极大程度上模拟出正在直播的游戏中的环境,使观众能够沉浸式地感受正在直播的游戏,提高了可观赏性,并可延长观看时长。具体来讲,参照图3(b),第二区域320的背景(以阴影示出)可以为正在直播的游戏中的地貌图(例如,峡谷风格的图片),评论区322中的用户不再只是单纯的用户名,而是模拟游戏中头像样式的头像加用户名,并且评论的展示样式也模拟游戏中的评论展示样式(例如,以对话框的样式进行展示),主播头像321的展示样式也模拟游戏中的头像样式,因此视觉上可在直播间300中模拟出游戏的环境,从而增强用户的观看体验。另外,点击直播间300中的任意一个按钮所产生的点击声,其音效也模拟第一区域310中直播的游戏内的真实音效,从而可在听觉上在直播间300中模拟出游戏的声音环境,增强用户的观看体验。更进一步,主播的音色也被处理为直播游戏中主播正在操作的角色的音色,从而在听觉上进一步模拟出游戏的声音环境,进一步增强了用户的观看体验,从而可吸引更多用户进入直播间300观看游戏直播,并可延长观看时长,提高了游戏直播的效益。
图4是示出根据本公开的示例性实施例的多媒体资源发送方法的流程图。
参照图4,在步骤401,可接收多媒体资源。这里,多媒体资源为数据资源,例如为正在直播的游戏画面数据、游戏声音数据和主播声音数据等,主播端通过输入输出设备(例如麦克风、显示器等)录入游戏内容(游戏画面和声音)和主播声音,通过直播实时推流将录入的数据发送至服务器,服务器可接收输入输出设备录入的数据(即,多媒体资源),包括游戏相关数据(游戏画面和声音)以及主播的声音数据。
在步骤402,可识别接收到的多媒体资源的内容信息。这里,内容信息指向该多媒体资源的内容,针对不同的多媒体资源,其内容不同。例如,当该多媒体资源是关于正在直播的游戏时,内容信息指向的是正在直播的游戏的类型以及该类型游戏的游戏内容(游戏画面、角色或者音效)。在执行内容信息识别之后,可得到多媒体资源的内容标识(例如,内容id)或者内容缩略图等能反映多媒体资源的内容的信息。
在步骤403,可获取与该内容信息相关的元素信息,其中,元素信息用于渲染用于展示多媒体资源的展示空间。
根据本公开的示例性实施例,可从数据库中查找并获取与多媒体内容信息相关的元素信息,这里,数据库预先存储与多种内容信息相关的多种元素信息,该多种内容信息包括识别到的内容信息。具体来讲,多媒体资源存在多种类型,每种类型的多媒体资源的内容信息不同,因此多种内容信息对应有多种与其相关的元素信息,可在数据库中预先存储与多种内容信息相关的多种元素信息。可根据多媒体资源的内容标识或者内容缩略图等从数据库中匹配与内容信息相关的素材信息。根据本公开的示例性实施例,元素信息包括画面信息和音效信息,可获取与内容信息相关的画面信息和与内容信息相关的音效信息,这里,画面信息和音效信息分别用于对展示空间进行画面渲染和音效渲染,从而使渲染出的展示空间的样式风格与需展示的多媒体资源的内容信息更加匹配。例如,针对正在直播的游戏,可识别游戏直播画面得到游戏的game id以及内容缩略图等信息,根据得到的信息从数据库中匹配该游戏场景中的按钮颜色、字体及字体颜色、头像边框、观众头衔、点击音效等元素的元素信息。
根据本公开的示例性实施例,多媒体资源包括第一用户语音资源,在识别到多媒体资源的内容信息后,还可将该第一用户语音资源与多媒体资源的内容信息相关联,得到第二用户语音资源。这里,第一用户语音资源为真人对多媒体资源的内容进行解说而产生的语音资源,由于真人原声与多媒体资源的内容(例如,声音内容)存在违和感,可能导致在展示空间中展示多媒体资源时的展示效果欠佳,影响用户体验。因此,可将第一用户语音资源与多媒体资源的内容信息相关联,得到第二用户语音资源。具体来讲,首先,可获取多媒体资源的内容信息中的虚拟角色的音色信息和该第一用户语音资源的用户语音数据,然后,基于得到的虚拟角色的音色信息和用户语音数据执行语音合成,得到第二用户语音资源,从而使得第二用户语音资源对应的用户语音音色模拟多媒体资源的内容信息中的虚拟角色的音色。
在步骤404,可接收从客户端发送的获取展示空间的数据的请求。
在步骤405,可响应于该请求,向客户端发送接收到的多媒体资源以及展示空间的元素信息,其中,展示空间的元素信息包括获取到的与内容信息相关的元素信息。这里,由于第二用户语音资源的用户语音音色模拟多媒体资源的虚拟角色的语音音色,因此,为了在展示空间获得更好的听感上的展示效果,可向客户端发送包括第二用户语音资源的多媒体资源。在一些实施例中,展示空间包括用于展示多媒体资源的第一区域和用于展示空间元素的第二区域,向客户端发送的展示空间的元素信息可用于渲染该第二区域,也就是说,对展示空间中除用于展示多媒体资源之外的全部区域进行渲染,从而在极大程度上使展示空间的样式风格与需展示的多媒体资源的内容信息相匹配,以得到更好的展示效果,使用户能够沉浸式体验展示出的多媒体资源。
为使本公开示出的方案得到清晰的展示,下面描述一种具体实施场景中的展示空间的实现过程。
图5是示出根据本公开的示例性实施例的游戏直播间的实现过程的示意图。
参照图5,在主播端通过输入输出设备录入游戏(包括画面和声音)和主播声音,并将录入的游戏相关数据和主播声音数据实时推流到服务端。服务端在接收到游戏相关数据和主播声音数据之后,首先识别正在直播的游戏画面,然后根据识别结果(例如,游戏id、游戏缩略图等)从数据库中查找与该游戏内容相关的素材资源,例如,但不限于,直播间背景图、按钮颜色、字体颜色、点击音效等,同时从游戏画面中识别主播正在操作的游戏角色,根据该游戏角色的音色和主播声音数据,通过相关技术中的任意一种语音合成技术,将主播声音转换为该游戏角色的声音。在观众端,当观众进入直播间后,通过拉取直播流,获取正在直播的游戏画面以及经过语音合成过的主播声音进行播放,同时通过网络请求,获取到服务端匹配好的与该游戏内容相关的素材资源对直播间元素进行渲染填充,得到最终的游戏直播间样式(例如,可参照图3(b))。
图6是示出根据本公开的示例性实施例的多媒体资源展示装置的框图。
参照图6,根据本公开的示例性实施例的多媒体资源展示装置600可包括请求发送单元601、数据接收单元602、展示空间渲染单元603和资源展示单元604。
请求发送单元601可向服务器发送获取多媒体资源展示空间的数据的请求。这里,多媒体资源展示空间为展示多媒体资源的展示空间,例如游戏直播间等,对此不作限制。相对应地,多媒体资源展示空间的数据为与展示空间相关的数据,例如在游戏直播间中,该数据为正在直播的游戏画面数据和游戏声音数据、主播的声音数据、评论区的用户相关数据和图标数据等。
数据接收单元602可从服务器接收多媒体资源和展示空间的元素信息,其中,展示空间的元素信息包括与多媒体资源的内容信息相关的元素信息。这里,多媒体资源为数据资源,例如为正在直播的游戏画面数据、游戏声音数据和主播声音数据等。多媒体资源的内容信息指向该多媒体资源的内容,针对不同的多媒体资源,其内容不同。展示空间的元素信息指向展示空间中除需展示的多媒体资源之外的所有元素(例如,图标、背景、用户名称、用户评论等)。例如,当该多媒体资源是关于正在直播的游戏时,内容信息指向的是正在直播的游戏的类型以及该类型游戏的游戏内容(游戏画面、角色或者音效等),而展示空间的元素信息指向的则是主播及直播间的用户的用户名、头像、直播间的背景、评论区的评论以及送礼动效等,此时,与多媒体资源的内容信息相关的元素信息指向的是直播间中各种元素的与正在直播的游戏内容相关的展示样式,例如,头像的展示样式模拟正在直播的游戏中的头像展示样式(例如,头像加带有该直播游戏风格的边框等)、字体和字体颜色与游戏中的字体和字体颜色一致或者相似等,而直播间的背景可为与正在直播的游戏的内容相匹配的静态图或者动态图(例如,背景可以是该直播游戏的主题封面图等)。在一些实施例中,由于多媒体资源展示空间的数据具有不同的特点,因此请求发送单元601向服务器发送的请求可包括第一请求和第二请求,其中,第一请求用于获取多媒体资源,第二请求用于获取展示空间的元素信息。
展示空间渲染单元603可基于接收到的展示空间的元素信息渲染展示空间。
根据本公开的示例性实施例,与多媒体资源的内容信息相关的元素信息包括与多媒体资源的内容信息相关的画面信息和与多媒体资源的内容信息相关的音效信息,展示空间渲染单元603可基于画面信息和音效信息对展示空间分别进行画面渲染和音效渲染,从而使渲染出的展示空间的样式风格与需展示的多媒体资源的内容信息更加匹配。具体来讲,展示空间中的元素既包括图像(例如,图标、背景以及文字等),又包括声音(例如,用户在展示空间中点击图标发出的点击声等),为了使展示空间的样式风格与多媒体资源的内容信息更加匹配,展示空间渲染单元603可通过与多媒体资源的内容信息相关的画面信息对展示空间进行画面渲染,使展示空间的元素的画面样式与多媒体资源的内容相适应,并通过与多媒体资源的内容信息相关的音效信息对展示空间进行音效渲染,使展示空间的音效风格与多媒体资源的内容相适应。
根据本公开的示例性实施例,展示空间包括用于展示多媒体资源的第一区域和用于展示空间元素的第二区域,展示空间渲染单元603可基于展示空间的元素信息渲染第二区域。也就是说,对展示空间中除用于展示多媒体资源之外的全部区域进行渲染,从而在极大程度上使展示空间的样式风格与需展示的多媒体资源的内容信息相匹配,以得到更好的展示效果,使用户能够沉浸式体验展示出的多媒体资源。
根据本公开的示例性实施例,多媒体资源还包括与多媒体资源的内容信息相关的用户语音资源。这里,用户语音资源为真人对多媒体资源的内容进行解说而产生的语音资源,由于真人原声与多媒体资源的内容(例如,声音内容)存在违和感,可能导致在展示空间中展示多媒体资源时的展示效果欠佳,影响用户体验。因此,可将用户语音资源处理为与多媒体资源的内容信息相关,从而在展示空间中展示多媒体资源时,可在极大程度上改善用户在听感上的体验,进而吸引更多用户,提高展示效益。在一些实施例中,用户语音资源对应的用户语音音色被处理为模拟多媒体资源的内容信息中的虚拟角色的音色,从而改善听感上的违和感。
资源展示单元604可在经过渲染的展示空间中展示接收到的多媒体资源。这里,展示空间经过渲染后,其空间元素的展示样式在极大程度上与正在展示的多媒体资源的内容相匹配,因此,在经过渲染后的展示空间中展示多媒体资源,可使用户沉浸式体验展示出的多媒体资源,改善了用户体验,从而可吸引更多的用户,提高了多媒体资源的展示效益。
图7是示出根据本公开的示例性实施例的多媒体资源发送装置的框图。
参照图7,根据本公开的示例性实施例的多媒体资源发送装置700可包括资源接收单元701、内容信息识别单元702、元素信息获取单元703、请求接收单元704和数据发送单元705。
资源接收单元701可接收多媒体资源。这里,多媒体资源为数据资源,例如为正在直播的游戏画面数据、游戏声音数据和主播声音数据等,主播端通过输入输出设备(例如麦克风、显示器等)录入游戏内容(游戏画面和声音)和主播声音,通过直播实时推流将录入的数据发送至服务器,服务器可接收输入输出设备录入的数据(即,多媒体资源),包括游戏相关数据(游戏画面和声音)以及主播的声音数据。
内容信息识别单元702可识别接收到的多媒体资源的内容信息。这里,内容信息指向该多媒体资源的内容,针对不同的多媒体资源,其内容不同,例如,当该多媒体资源是关于正在直播的游戏时,内容信息指向的是正在直播的游戏的类型以及该类型游戏的游戏内容(游戏画面、角色或者音效)。在执行内容信息识别之后,可得到多媒体资源的内容标识(例如,内容id)或者内容缩略图等能反映多媒体资源的内容的信息。
元素信息获取单元703可获取与识别到的内容信息相关的元素信息,其中,该元素信息用于渲染用于展示接收到的多媒体资源的展示空间。
根据本公开的示例性实施例,元素信息获取单元703可从数据库中查找并获取与多媒体内容信息相关的元素信息,这里,数据库预先存储与多种内容信息相关的多种元素信息,该多种内容信息包括识别到的内容信息。具体来讲,多媒体资源存在多种类型,每种类型的多媒体资源的内容信息不同,因此多种内容信息对应有多种与其相关的元素信息,可在数据库中预先存储与多种内容信息相关的多种元素信息。可根据多媒体资源的内容标识或者内容缩略图等从数据库中匹配与内容信息相关的素材信息。根据本公开的示例性实施例,元素信息包括画面信息和音效信息,元素信息获取单元703可获取与内容信息相关的画面信息和与内容信息相关的音效信息,这里,画面信息和音效信息分别用于对展示空间进行画面渲染和音效渲染,从而使渲染出的展示空间的样式风格与需展示的多媒体资源的内容信息更加匹配。例如,针对正在直播的游戏,可识别游戏直播画面得到游戏的game id以及内容缩略图等信息,根据得到的信息从数据库中匹配该游戏场景中的按钮颜色、字体及字体颜色、头像边框、观众头衔、点击音效等元素的元素信息。
根据本公开的示例性实施例,多媒体资源发送装置700还可包括第二用户语音获取单元706(图7中未示出),多媒体资源包括第一用户语音资源,第二用户语音获取单元706可在识别到多媒体资源的内容信息后,将第一用户语音资源与多媒体资源的内容信息相关联,得到第二用户语音资源。这里,第一用户语音资源为真人对多媒体资源的内容进行解说而产生的语音资源,由于真人原声与多媒体资源的内容(例如,声音内容)存在违和感,可能导致在展示空间中展示多媒体资源时的展示效果欠佳,影响用户体验。因此,可将第一用户语音资源与多媒体资源的内容信息相关联,得到第二用户语音资源。具体来讲,第二用户语音获取单元706可首先获取多媒体资源的内容信息中的虚拟角色的音色信息和该第一用户语音资源的用户语音数据,然后,基于得到的虚拟角色的音色信息和用户语音数据执行语音合成,得到第二用户语音资源,从而使得第二用户语音资源对应的用户语音音色模拟多媒体资源的内容信息中的虚拟角色的音色。
请求接收单元704可接收从客户端发送的获取所述展示空间的数据的请求。
数据发送单元705可响应于该请求,向客户端发送接收到的多媒体资源以及展示空间的元素信息,其中,该展示空间的元素信息包括获取到的内容信息相关的元素信息。这里,由于第二用户语音资源的用户语音音色模拟多媒体资源的虚拟角色的语音音色,因此,为了在展示空间获得更好的听感上的展示效果,可向客户端发送包括第二用户语音资源的多媒体资源。在一些实施例中,展示空间包括用于展示多媒体资源的第一区域和用于展示空间元素的第二区域,向客户端发送的展示空间的元素信息可用于渲染该第二区域,也就是说,对展示空间中除用于展示多媒体资源之外的全部区域进行渲染,从而在极大程度上使展示空间的样式风格与需展示的多媒体资源的内容信息相匹配,以得到更好的展示效果,使用户能够沉浸式体验展示出的多媒体资源。
图8是根据本公开的示例性实施例的电子设备800的框图。
参照图8,电子设备800包括至少一个存储器801和至少一个处理器802,所述至少一个存储器801中存储有计算机可执行指令集合,当计算机可执行指令集合被至少一个处理器802执行时,执行根据本公开的示例性实施例的多媒体资源展示方法或多媒体资源发送方法。
作为示例,电子设备800可以是PC计算机、平板装置、个人数字助理、智能手机、或其他能够执行上述指令集合的装置。这里,电子设备800并非必须是单个的电子设备,还可以是任何能够单独或联合执行上述指令(或指令集)的装置或电路的集合体。电子设备800还可以是集成控制***或***管理器的一部分,或者可被配置为与本地或远程(例如,经由无线传输)以接口互联的便携式电子设备。
在电子设备800中,处理器802可包括中央处理器(CPU)、图形处理器(GPU)、可编程逻辑装置、专用处理器***、微控制器或微处理器。作为示例而非限制,处理器还可包括模拟处理器、数字处理器、微处理器、多核处理器、处理器阵列、网络处理器等。
处理器802可运行存储在存储器801中的指令或代码,其中,存储器801还可以存储数据。指令和数据还可经由网络接口装置而通过网络被发送和接收,其中,网络接口装置可采用任何已知的传输协议。
存储器801可与处理器802集成为一体,例如,将RAM或闪存布置在集成电路微处理器等之内。此外,存储器801可包括独立的装置,诸如,外部盘驱动、存储阵列或任何数据库***可使用的其他存储装置。存储器801和处理器802可在操作上进行耦合,或者可例如通过I/O端口、网络连接等互相通信,使得处理器802能够读取存储在存储器中的文件。
此外,电子设备800还可包括视频显示器(诸如,液晶显示器)和用户交互接口(诸如,键盘、鼠标、触摸输入装置等)。电子设备800的所有组件可经由总线和/或网络而彼此连接。
根据本公开的示例性实施例,还可提供一种存储指令的计算机可读存储介质,其中,当指令被至少一个处理器运行时,促使至少一个处理器执行根据本公开的多媒体资源展示方法或多媒体资源发送方法。这里的计算机可读存储介质的示例包括:只读存储器(ROM)、随机存取可编程只读存储器(PROM)、电可擦除可编程只读存储器(EEPROM)、随机存取存储器(RAM)、动态随机存取存储器(DRAM)、静态随机存取存储器(SRAM)、闪存、非易失性存储器、CD-ROM、CD-R、CD+R、CD-RW、CD+RW、DVD-ROM、DVD-R、DVD+R、DVD-RW、DVD+RW、DVD-RAM、BD-ROM、BD-R、BD-R LTH、BD-RE、蓝光或光盘存储器、硬盘驱动器(HDD)、固态硬盘(SSD)、卡式存储器(诸如,多媒体卡、安全数字(SD)卡或极速数字(XD)卡)、磁带、软盘、磁光数据存储装置、光学数据存储装置、硬盘、固态盘以及任何其他装置,所述任何其他装置被配置为以非暂时性方式存储计算机程序以及任何相关联的数据、数据文件和数据结构并将所述计算机程序以及任何相关联的数据、数据文件和数据结构提供给处理器或计算机使得处理器或计算机能执行所述计算机程序。上述计算机可读存储介质中的计算机程序可在诸如客户端、主机、代理装置、服务器等计算机设备中部署的环境中运行,此外,在一个示例中,计算机程序以及任何相关联的数据、数据文件和数据结构分布在联网的计算机***上,使得计算机程序以及任何相关联的数据、数据文件和数据结构通过一个或多个处理器或计算机以分布式方式存储、访问和执行。
根据本公开的示例性实施例,还可提供一种计算机程序产品,该计算机程序产品中的指令可由计算机设备的处理器执行以完成根据本公开的示例性实施例的多媒体资源展示方法或多媒体资源发送方法。
根据本公开的多媒体资源展示方法、装置、设备及介质,通过与多媒体资源的内容信息相关的元素信息渲染展示空间,可丰富展示空间的元素的展示样式,使展示空间的风格与多媒体资源相匹配,因此,在经过渲染后的展示空间中展示多媒体资源,可使用户沉浸式体验展示出的多媒体资源,改善了用户体验,从而可吸引更多的用户,提高了多媒体资源的展示效益。
另外,由于展示出的多媒体资源中的用户语音资源对应的用户语音音色与多媒体资源的内容信息中的虚拟角色的音色相匹配,因此可进一步丰富展示空间的展示样式,使展示空间的风格与多媒体资源相适应,进一步使用户沉浸式体验展示出的多媒体资源,从而进一步提高多媒体资源的展示效益。
此外,根据本公开的多媒体资源发送方法、装置、设备及介质,在接收到多媒体资源后,根据多媒体资源的内容信息获取与该内容信息相关的元素信息,在接收到客户端的获取展示空间的数据的请求之后,将多媒体资源以及包括与该内容信息相关的元素信息的展示空间的元素信息发送给客户端,从而可在客户端通过与多媒体资源的内容信息相关的元素信息渲染展示空间,使展示空间的风格与多媒体资源相匹配,以及使用户沉浸式体验展示出的多媒体资源,提高了多媒体资源的展示效益。
另外,还基于多媒体资源中的第一用户语音资源的用户语音数据和多媒体资源的内容信息中的虚拟角色的音色信息执行语音合成,得到第二用户语音资源,由于该第二用户语音资源对应的用户语音音色与虚拟角色的音色相匹配,因此,将第二用户语音资源发送至客户端后,可使客户端的展示空间的风格与多媒体资源更匹配,从而进一步使用户沉浸式体验展示出的多媒体资源,提高多媒体资源的展示效益。
本领域技术人员在考虑说明书及实践这里公开的发明后,将容易想到本公开的其它实施方案。本申请旨在涵盖本公开的任何变型、用途或者适应性变化,这些变型、用途或者适应性变化遵循本公开的一般性原理并包括本公开未公开的本技术领域中的公知常识或惯用技术手段。说明书和实施例仅被视为示例性的,本公开的真正范围和精神由下面的权利要求指出。
应当理解的是,本公开并不局限于上面已经描述并在附图中示出的精确结构,并且可以在不脱离其范围进行各种修改和改变。本公开的范围仅由所附的权利要求来限制。

Claims (10)

1.一种多媒体资源展示方法,其特征在于,包括:
向服务器发送获取多媒体资源展示空间的数据的请求;
从所述服务器接收多媒体资源和展示空间的元素信息,其中,所述展示空间的元素信息包括与所述多媒体资源的内容信息相关的元素信息;
基于所述展示空间的元素信息渲染展示空间;
在经过渲染的所述展示空间中展示所述多媒体资源。
2.如权利要求1所述的多媒体资源展示方法,其特征在于,所述多媒体资源包括与所述多媒体资源的内容信息相关的用户语音资源。
3.如权利要求2所述的多媒体资源展示方法,其特征在于,所述用户语音资源对应的用户语音音色被处理为模拟所述多媒体资源的内容信息中的虚拟角色的音色。
4.如权利要求1所述的多媒体资源展示方法,其特征在于,
所述与所述多媒体资源的内容信息相关的元素信息包括与所述多媒体资源的内容信息相关的画面信息和与所述多媒体资源的内容信息相关的音效信息;
所述基于所述展示空间的元素信息渲染展示空间,包括:
基于所述画面信息和所述音效信息对所述展示空间分别进行画面渲染和音效渲染。
5.一种多媒体资源发送方法,其特征在于,包括:
接收多媒体资源;
识别所述多媒体资源的内容信息;
获取与所述内容信息相关的元素信息,其中,所述元素信息用于渲染用于展示所述多媒体资源的展示空间;
接收从客户端发送的获取所述展示空间的数据的请求;
响应于所述请求,向所述客户端发送所述多媒体资源以及展示空间的元素信息,其中,所述展示空间的元素信息包括所述与所述内容信息相关的元素信息。
6.一种多媒体资源展示装置,其特征在于,包括:
请求发送单元,被配置为:向服务器发送获取多媒体资源展示空间的数据的请求;
数据接收单元,被配置为:从所述服务器接收多媒体资源和展示空间的元素信息,其中,所述展示空间的元素信息包括与所述多媒体资源的内容信息相关的元素信息;
展示空间渲染单元,被配置为:基于所述展示空间的元素信息渲染展示空间;
资源展示单元,被配置为:在经过渲染的所述展示空间中展示所述多媒体资源。
7.一种多媒体资源发送装置,其特征在于,包括:
资源接收单元,被配置为:接收多媒体资源;
内容信息识别单元,被配置为:识别所述多媒体资源的内容信息;
元素信息获取单元,被配置为:获取与所述内容信息相关的元素信息,其中,所述元素信息用于渲染用于展示所述多媒体资源的展示空间;
请求接收单元,被配置为:接收从客户端发送的获取所述展示空间的数据的请求;
数据发送单元,被配置为:响应于所述请求,向所述客户端发送所述多媒体资源以及展示空间的元素信息,其中,所述展示空间的元素信息包括所述与所述内容信息相关的元素信息。
8.一种电子设备,其特征在于,包括:
至少一个处理器;
至少一个存储计算机可执行指令的存储器,
其中,所述计算机可执行指令在被所述至少一个处理器运行时,促使所述至少一个处理器执行如权利要求1至4中的任一权利要求所述的多媒体资源展示方法或如权利要求5所述的多媒体资源发送方法。
9.一种存储指令的计算机可读存储介质,其特征在于,当所述指令被至少一个处理器运行时,促使所述至少一个处理器执行如权利要求1至4中的任一权利要求所述的多媒体资源展示方法或如权利要求5所述的多媒体资源发送方法。
10.一种计算机程序产品,包括计算机指令,其特征在于,所述计算机指令被至少一个处理器执行时实现如权利要求1至4中的任一权利要求所述的多媒体资源展示方法或如权利要求5所述的多媒体资源发送方法。
CN202210145376.6A 2022-02-17 2022-02-17 多媒体资源展示方法、发送方法、装置、设备及介质 Pending CN114513682A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202210145376.6A CN114513682A (zh) 2022-02-17 2022-02-17 多媒体资源展示方法、发送方法、装置、设备及介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202210145376.6A CN114513682A (zh) 2022-02-17 2022-02-17 多媒体资源展示方法、发送方法、装置、设备及介质

Publications (1)

Publication Number Publication Date
CN114513682A true CN114513682A (zh) 2022-05-17

Family

ID=81552369

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202210145376.6A Pending CN114513682A (zh) 2022-02-17 2022-02-17 多媒体资源展示方法、发送方法、装置、设备及介质

Country Status (1)

Country Link
CN (1) CN114513682A (zh)

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111084983A (zh) * 2019-11-25 2020-05-01 腾讯科技(深圳)有限公司 一种云游戏服务方法、装置、设备及存储介质
CN111882632A (zh) * 2020-07-24 2020-11-03 上海米哈游天命科技有限公司 一种地表细节的渲染方法、装置、设备及存储介质
CN112235585A (zh) * 2020-08-31 2021-01-15 江苏视博云信息技术有限公司 一种虚拟场景的直播方法、装置及***
CN112272302A (zh) * 2020-09-17 2021-01-26 北京达佳互联信息技术有限公司 多媒体资源的展示方法、装置、***及存储介质
CN113395538A (zh) * 2020-03-13 2021-09-14 北京字节跳动网络技术有限公司 音效渲染方法、装置、计算机可读介质和电子设备

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111084983A (zh) * 2019-11-25 2020-05-01 腾讯科技(深圳)有限公司 一种云游戏服务方法、装置、设备及存储介质
CN113395538A (zh) * 2020-03-13 2021-09-14 北京字节跳动网络技术有限公司 音效渲染方法、装置、计算机可读介质和电子设备
CN111882632A (zh) * 2020-07-24 2020-11-03 上海米哈游天命科技有限公司 一种地表细节的渲染方法、装置、设备及存储介质
CN112235585A (zh) * 2020-08-31 2021-01-15 江苏视博云信息技术有限公司 一种虚拟场景的直播方法、装置及***
CN112272302A (zh) * 2020-09-17 2021-01-26 北京达佳互联信息技术有限公司 多媒体资源的展示方法、装置、***及存储介质

Similar Documents

Publication Publication Date Title
CN109547819B (zh) 直播列表展示方法、装置以及电子设备
CN110570698B (zh) 一种在线教学控制方法、装置、存储介质以及终端
US11218739B2 (en) Live video broadcast method, live broadcast device and storage medium
WO2021244205A1 (zh) 一种交互场景启动方法、装置、存储介质、客户端及服务器
CN112087655B (zh) 赠送虚拟礼物的方法、装置及电子设备
KR101454950B1 (ko) 스트리밍 미디어에 연관된 딥 태그 클라우드
JP6293269B2 (ja) コンテンツ視聴確認装置及びその方法
CN102662919B (zh) 对内容片段设置书签
US11025967B2 (en) Method for inserting information push into live video streaming, server, and terminal
CN105635764B (zh) 视频直播中播放推送信息的方法和装置
CN112929678B (zh) 直播方法、装置、服务端及计算机可读存储介质
CN111629253A (zh) 视频处理方法及装置、计算机可读存储介质、电子设备
CN111800668B (zh) 弹幕的处理方法、装置、设备及存储介质
WO2019227429A1 (zh) 多媒体内容生成方法、装置和设备/终端/服务器
CN112596694B (zh) 一种房源信息的处理方法和装置
CN114025188B (zh) 直播广告展示方法、***、装置、终端及可读存储介质
CN112287168A (zh) 用于生成视频的方法和装置
CN115190366B (zh) 一种信息展示方法、装置、电子设备、计算机可读介质
JP6379107B2 (ja) 情報処理装置並びにその制御方法、及びプログラム
CN114501103B (zh) 基于直播视频的互动方法、装置、设备及存储介质
CN112073740A (zh) 信息显示方法、装置、服务器及存储介质
CN113271486B (zh) 交互视频处理方法、装置、计算机设备及存储介质
WO2023174073A1 (zh) 视频生成方法、装置、设备、存储介质和程序产品
CN115209211A (zh) 字幕显示方法、装置、电子设备、存储介质及程序产品
CN114513682A (zh) 多媒体资源展示方法、发送方法、装置、设备及介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination