CN112752058B - 调整视频流的属性的方法和装置 - Google Patents

调整视频流的属性的方法和装置 Download PDF

Info

Publication number
CN112752058B
CN112752058B CN201911054917.9A CN201911054917A CN112752058B CN 112752058 B CN112752058 B CN 112752058B CN 201911054917 A CN201911054917 A CN 201911054917A CN 112752058 B CN112752058 B CN 112752058B
Authority
CN
China
Prior art keywords
video stream
scene
target
frame rate
resolution
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201911054917.9A
Other languages
English (en)
Other versions
CN112752058A (zh
Inventor
庄松海
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Huawei Technologies Co Ltd
Original Assignee
Huawei Technologies Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Huawei Technologies Co Ltd filed Critical Huawei Technologies Co Ltd
Priority to CN201911054917.9A priority Critical patent/CN112752058B/zh
Priority to EP20883609.8A priority patent/EP4044615A4/en
Priority to PCT/CN2020/097754 priority patent/WO2021082479A1/zh
Publication of CN112752058A publication Critical patent/CN112752058A/zh
Priority to US17/732,590 priority patent/US20220255981A1/en
Application granted granted Critical
Publication of CN112752058B publication Critical patent/CN112752058B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L65/00Network arrangements, protocols or services for supporting real-time applications in data packet communication
    • H04L65/60Network streaming of media packets
    • H04L65/75Media network packet handling
    • H04L65/752Media network packet handling adapting media to network capabilities
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N7/00Television systems
    • H04N7/14Systems for two-way working
    • H04N7/15Conference systems
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L65/00Network arrangements, protocols or services for supporting real-time applications in data packet communication
    • H04L65/40Support for services or applications
    • H04L65/403Arrangements for multi-party communication, e.g. for conferences
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L65/00Network arrangements, protocols or services for supporting real-time applications in data packet communication
    • H04L65/60Network streaming of media packets
    • H04L65/75Media network packet handling
    • H04L65/765Media network packet handling intermediate
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L65/00Network arrangements, protocols or services for supporting real-time applications in data packet communication
    • H04L65/80Responding to QoS
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/40Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
    • H04N21/43Processing of content or additional data, e.g. demultiplexing additional data from a digital video stream; Elementary client operations, e.g. monitoring of home network or synchronising decoder's clock; Client middleware
    • H04N21/44Processing of video elementary streams, e.g. splicing a video clip retrieved from local storage with an incoming video stream or rendering scenes according to encoded video stream scene graphs
    • H04N21/4402Processing of video elementary streams, e.g. splicing a video clip retrieved from local storage with an incoming video stream or rendering scenes according to encoded video stream scene graphs involving reformatting operations of video signals for household redistribution, storage or real-time display
    • H04N21/440263Processing of video elementary streams, e.g. splicing a video clip retrieved from local storage with an incoming video stream or rendering scenes according to encoded video stream scene graphs involving reformatting operations of video signals for household redistribution, storage or real-time display by altering the spatial resolution, e.g. for displaying on a connected PDA
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N7/00Television systems
    • H04N7/14Systems for two-way working
    • H04N7/15Conference systems
    • H04N7/152Multipoint control units therefor

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Two-Way Televisions, Distribution Of Moving Picture Or The Like (AREA)
  • Telephonic Communication Services (AREA)

Abstract

本申请公开了调整视频流的属性的方法和装置,涉及通信技术领域,有助于实现视频流适应网路带宽的变化,从而减小网络丢包。该方法包括:属性调整装置根据第一会场的第一视频流中的图像内容,确定第一会场的场景;属性调整装置根据第一视频流的丢包率和第一会场的场景,确定第一视频流的目标属性信息;目标属性信息包括目标分辨率和目标帧率中的至少一种;属性调整装置将第一视频流的属性信息调整为目标属性信息。

Description

调整视频流的属性的方法和装置
技术领域
本申请涉及通信技术领域,尤其涉及调整视频流的属性的方法和装置。
背景技术
视讯会议使用户在进行异地交流时既可以听到对方的声音,又可以看到对方的图像,增强交流的真实感、亲切感和临场感。视讯会议可用于军事、政治、经济、教育、卫生等领域。
在视讯会议中,参与视讯会议的终端采集到会场的信息(如语音、图像和数据等),并将该信息转换为视频流进行传输。视频流是基于网络互连协议(internet protocol,IP)进行传输的,由于IP线路上可以同时传输多个视频流,多个视频流挤占网络带宽,可能导致当前视频流存在网络丢包的情况。因此,如何调整视频流的属性,以适应网路带宽的变化,从而减小网络丢包,成为亟待解决的技术问题。
发明内容
本申请实施例提供了调整视频流的属性的方法和装置,有助于实现视频流适应网路带宽的变化,从而减小网络丢包。
为了达到上述目的,具体提供了以下技术方案:
第一方面,提供调整视频流的属性的方法,包括:属性调整装置根据第一会场的第一视频流中的图像内容,确定第一会场的场景。然后,属性调整装置根据第一视频流的丢包率和第一会场的场景,确定第一视频流的目标属性信息;目标属性信息包括目标分辨率和目标帧率中的至少一种。接着,属性调整装置将第一视频流的属性信息调整为目标属性信息。本技术方案中,根据会场的场景和该会场的视频流的目标分辨率和/或目标帧率。由于视频流的分辨率和/或帧率会影响视频流的带宽,因此,该技术方案通过有助于实现视频流适应网路带宽的变化,从而减小网络丢包。
在一种可能的设计中,属性调整装置包括:第一会场的终端,或第一会场之外的其他会场的终端,或MCU,或除参与视讯会议的终端和这些终端之间进行通信的MCU之外的其他装置。
在一种可能的设计中,第一视频流可以是第一会场的主流或辅流等。
在一种可能的设计中,属性调整装置将第一视频流的属性信息调整为目标属性信息,可以包括:当属性调整装置是第一会场的终端时,属性调整装置将第一视频流的属性信息调整为目标属性信息。
在一种可能的设计中,属性调整装置将第一视频流的属性信息调整为目标属性信息,可以包括:当属性调整装置是第一会场的终端之外的设备(如其他会场的终端或MCU等)时,所述属性调整装置向第一会场的终端发送所述目标属性信息,目标属性信息用于指示终端按照目标属性信息发送第一视频流。
在一种可能的设计中,属性调整装置根据第一会场的第一视频流中的图像内容,确定第一会场的场景,包括:属性调整装置根据第一视频流的图像内容和场景模型,确定第一会场的场景;场景模型用于表征视频流的图像内容与该视频流所属的场景之间的对应关系。这样,使用场景模型确定第一会场的场景,实现简单。当然具体实现时,还可以通过其他方法确定第一会场的场景。
在一种可能的设计中,该方法还包括:属性调整装置获取至少一种候选场景下的视频流的图像;属性调整装置对该至少一种候选场景下的视频流的图像进行训练,得到场景模型;其中,该至少一种候选场景包括第一会场的场景。该可能的设计给出了获得场景模型的示例。
在一种可能的设计中,属性调整装置根据第一视频流的丢包率和第一会场的场景,确定第一视频流的目标属性信息,包括:当第一视频流的丢包率大于或等于(如大于,或者大于等于)第一预设阈值时,属性调整装置基于第一会场的场景,确定第一视频流的目标属性信息。示例的,当第一视频流的丢包率大于或等于(如大于,或者等于,或者大于等于)第一预设阈值时,属性调整装置确定减小第一视频流的带宽。
在一种可能的设计中,上述属性调整装置基于第一会场的场景,确定第一视频流的目标属性信息,包括:
当第一会场的场景是固定会议室场景时,属性调整装置减小第一视频流的当前分辨率,得到目标分辨率,且减小第一视频流的当前帧率,得到目标帧率。这是在考虑到“固定会议室场景下,视频流的图像内容中的对象一般是小运动量的对象,因此,减小视频流的流畅性和视频流的图像内容的清晰度通常不会对用户体验造成影响,或影响非常小”而提出的技术方案。
或者,当第一会场的场景是户外场景时,属性调整装置减小第一视频流的当前分辨率,得到目标分辨率,且将第一视频流的当前帧率作为目标帧率。这是在考虑到“户外场景下,视频流的图像内容中的对象一般是大运动量的对象,相比视频流的图像内容的清晰度,优先保障视频流的流畅性,可以提升用户体验”而提出的技术方案。
或者,当第一会场的场景是PC桌面场景时,属性调整装置减小第一视频流的当前帧率,得到目标帧率,且将第一视频流的当前分辨率作为目标分辨率。这是考虑到“PC桌面场景下,相比视频流的流畅性,优先保障视频流的图像内容的清晰度,可以提升用户体验”而提出的技术方案。
或者,当第一会场的场景是移动场景时,属性调整装置将第一视频流的当前分辨率作为目标分辨率,且将第一视频流的当前帧率作为目标帧率。这是在考虑到“移动场景下,优先保障视频流的流畅性和视频流的图像内容的清晰度”而提出的技术方案。
作为示例,第一视频流的当前分辨率是执行确定第一视频流的目标属性时,第一视频流的分辨率;第一视频流的当前帧率是执行确定第一视频流的目标属性时,第一视频流的帧率。
在一种可能的设计中,属性调整装置根据第一视频流的丢包率和第一会场的场景,确定第一视频流的目标属性信息,包括:当第一视频流的丢包率小于或等于(如小于,或者等于,或者小于等于)第二预设阈值时,属性调整装置基于第一会场的场景,确定第一视频流的目标属性信息。示例的,当第一视频流的丢包率小于或等于(如小于,或者等于,或者小于等于)第二预设阈值时,属性调整装置确定增大第一视频流的带宽。
在一种可能的设计中,上述属性调整装置基于第一会场的场景,确定第一视频流的目标属性信息,包括:当第一会场的场景是固定会议室场景时,属性调整装置增大第一视频流的当前分辨率,得到目标分辨率,且增大第一视频流的当前帧率,得到目标帧率。或者,当第一会场的场景是户外场景时,属性调整装置增大第一视频流的当前分辨率,得到目标分辨率,且将第一视频流的当前帧率作为目标帧率。或者,当第一会场的场景是PC桌面场景时,属性调整装置增大第一视频流的当前帧率,得到目标帧率,且将第一视频流的当前分辨率作为目标分辨率。或者,当第一会场的场景是移动场景时,属性调整装置将第一视频流的当前分辨率作为目标分辨率,且将第一视频流的当前帧率作为目标帧率。
第二方面,提供一种属性调整装置,用于执行第一方面或第一方面的任一种可能的设计提供的方法。该装置具体可以是MCU或终端或芯片等。
在一种可能的设计中,该装置包括用于执行第一方面或第一方面任一种可能的设计提供的方法的各个模块。
在另一种可能的设计中,该装置包括存储器和处理器,存储器用于用于存储计算机指令,该装置运行时,该处理器执行存储器中的计算机指令以利用该装置中的硬件资源执行第一方面或第一方面任一种可能的设计所提供的方法的操作步骤。
第三方面,提供了一种计算机可读存储介质,其上储存有计算机指令,当该计算机指令在计算机上运行时,使得计算机执行第一方面或其任一种可能的设计提供的方法的操作步骤。
第四方面,提供了一种计算机程序产品,当其在计算机上运行时,使得第一方面或其任一种可能的设计提供的方法的操作步骤。
可以理解的是,上述提供的任一种装置、计算机可读存储介质或计算机程序产品均用于执行上文所提供的对应的方法,因此,其所能达到的有益效果可参考对应的方法中的有益效果,此处不再赘述。
附图说明
图1为本申请实施例可适用的一种会议电视***的架构示意图;
图2为本申请实施例提供的某一时刻图1所示的会议电视***的示意图;
图3为本申请实施例可适用的另一种会议电视***的架构示意图;
图4为本申请实施例可适用的另一种会议电视***的架构示意图;
图5为本申请实施例提供的一种通信设备的结构示意图;
图6为本申请实施例提供的一种获得场景模型的方法的流程示意图;
图7为本申请实施例提供的一种视频流的属性调整方法的流程示意图;
图8A为本申请实施例提供的一种调整视频流的属性的方法的交互示意图;
图8B为本申请实施例提供的另一种调整视频流的属性的方法的交互示意图;
图9A为本申请实施例提供的另一种调整视频流的属性的方法的交互示意图;
图9B为本申请实施例提供的另一种调整视频流的属性的方法的交互示意图;
图9C为本申请实施例提供的另一种调整视频流的属性的方法的交互示意图;
图9D为本申请实施例提供的另一种调整视频流的属性的方法的交互示意图;
图10A为本申请实施例提供的另一种调整视频流的属性的方法的交互示意图;
图10B为本申请实施例提供的另一种调整视频流的属性的方法的交互示意图;
图11为本申请实施例提供的一种属性调整装置的结构示意图。
具体实施方式
目前,通常通过智能调速(intelligent speed regulation,IRC)技术对视频流的实际带宽进行调节。具体的:在当前会场的视频流的可占用带宽减小(如其他会场的视频流挤占网络带宽导致当前会场的视频流的可占用带宽减小)时,减小当前会场的视频流的实际带宽,以降低当前会场的视频流的丢包率。在当前会场的视频流的可占用带宽增大(如其他会场的视频流所占的带宽减小而导致当前会场的视频流的可占用带宽增大)时,增大当前会场的视频流的实际带宽,以较大限度利用网络资源,从而使得当前会场的视频流的质量达到较好的效果。
上述IRC技术中,仅给出了在当前会场的视频流的可占用带宽变化时,调节当前会场的视频流的实际带宽,而并没有给出具体调节方案,因此当前会场的视频流的质量不能达到较好的效果。基于此,本申请实施例提供了一种调整视频流的属性的方法和装置,详见下文。
如图1所示,为本申请实施例可适用的一种会议电视***的架构示意图。该会议电视***支持视讯会议。图1所示的会议电视***包括多点控制单元(multipoint controlunit,MCU)10和接入会议的至少两个终端20。每个终端20均通过传输信道与MCU10连接。
MCU10,可以被称作视讯交换平台,是会议电视***的控制中心。终端20可以通过标准接口连接到MCU10,MCU10可以按照国际标准H.221、H.242、H.243或T.120等协议,实现图像和语音的交换与混合,以及实现对终端20的控制等功能。从逻辑功能上来讲,作为一个示例,MCU10可以包括主机和操作台。主机用于完成上述协议规定的相关功能。操作台用于提供主机运行的操作控制和人机界面。通过操作台可以对主机进行各种操作和发布命令。可选的,MCU10还可以包括营业台,用于完成对外的会议登记、预约、收费等功能。
终端20,可以被称作会议电视终端,一般可以直接由用户操作,用于提供图像、语音、数据等信号的输入/输出。具体的,终端20可以用于:采集会场的实况信息如图像信号、语音信号及相关的数据信号,并将采集到的信号转换成视频流,再对视频流进行压缩编码、多路复用后发送给MCU10;将接收到的视频流进行分类、解码、还原成图像、语音及数据信号中的一种或多种;向MCU10发送控制信号(如用于申请发言或申请主控权的控制信号等);以及,执行MCU10对该终端20的控制指令(如用于指示静音的控制指令等)。终端20可以是手机、笔记本、个人数字处理(personal digital assistant,PDA)、具有通信功能的手持设备、计算设备或连接到无线调制解调器的处理设备、车载设备、可穿戴设备,摄像头、监控器等。
参与视讯会议的每个终端20既可以作为发送端设备20A,也可以作为接收端设备20B。发送端设备20A用于采集会场的实况信息,并将采集到的信号转换成视频流,再对视频流进行压缩编码、多路复用后经MCU10发送给参与视讯会议的一个或多个(如所有)接收端设备20B。接收端设备20B用于接收视频流,并对该视频流进行分类、解码、还原等。基于此,在一种实现方式中,某一时刻,图1所示的会议电视***可以如图2所示。视频流可以包括主流、辅流或数据中的一种或多种。
上述图1和图2所示所示的会议电视***仅为示例,其不对本申请实施例提供的技术方案可适用的会议电视***构成限定。例如,如图3所示,为本申请实施例提供的技术方案可适用另一种会议电视***的架构示意图。在图3中,一个MCU10可以与一个或多个MCU10连接,每个MCU10可以与一个或多个终端20连接。
可以理解的是,当接入会议的终端20的个数多于2个时,通常需要通过MCU10对每个终端20进行控制。当接入会议的终端20的个数等于2个时,会议电视***可以通过MCU10对这两个终端20进行控制,也可以不通过MCU10对这两个终端20进行控制,而是由这两个终端20直接进行信息交互。如图4所示,为本申请实施例提供的技术方案可适用另一种会议电视***的架构示意图。该会议电视***中包括两个终端20,而不包括MCU10。
从硬件上来讲,作为一个示例,上述任一种实施例中的MCU10和终端20均可以通过如图5所示的通信设备40实现。该通信设备40可以包括:至少一个处理器401,通信线路402,存储器403以及至少一个通信接口404。
处理器401可以是一个通用中央处理器(central processing unit,CPU),微处理器,特定应用集成电路(application-specific integrated circuit,ASIC),或一个或多个用于控制本申请方案程序执行的集成电路。
通信线路402可包括一通路,在上述组件之间传送信息。
存储器403可以是只读存储器(read-only memory,ROM)或可存储静态信息和指令的其他类型的静态存储设备,随机存取存储器(random access memory,RAM)或者可存储信息和指令的其他类型的动态存储设备,也可以是电可擦可编程只读存储器(electricallyerasable programmable read-only memory,EEPROM)、只读光盘(compact disc read-only memory,CD-ROM)或其他光盘存储、光碟存储(包括压缩光碟、激光碟、光碟、数字通用光碟、蓝光光碟等)、磁盘存储介质或者其他磁存储设备、或者能够用于携带或存储具有指令或数据结构形式的期望的程序代码并能够由计算机存取的任何其他介质,但不限于此。存储器可以是独立存在,通过通信线路402与处理器相连接。存储器也可以和处理器集成在一起。本申请实施例提供的存储器通常可以具有非易失性。其中,存储器403用于存储执行本申请方案的计算机执行指令,并由处理器401来控制执行。处理器401用于执行存储器403中存储的计算机执行指令,从而实现本申请下述实施例提供的方法。
通信接口404,使用任何收发器一类的装置,用于与其他设备或通信网络通信,如以太网,RAN,无线局域网(wireless local area networks,WLAN)等。
可选的,本申请实施例中的计算机执行指令也可以称之为应用程序代码,本申请实施例对此不作具体限定。
在具体实现中,当通信设备40用于实现上述MCU10时,作为一种实施例,上述主机、操作台和营业台均可以通过处理器401执行存储器403中存储的程序代码实现。
在具体实现中,作为一种实施例,处理器401可以包括一个或多个CPU,例如图5中的CPU0和CPU1。
在具体实现中,作为一种实施例,通信设备40可以包括多个处理器,例如图5中的处理器401和处理器407。这些处理器中的每一个可以是一个单核(single-CPU)处理器,也可以是一个多核(multi-CPU)处理器。这里的处理器可以指一个或多个设备、电路、和/或用于处理数据(例如计算机程序指令)的处理核。
在具体实现中,作为一种实施例,通信设备40还可以包括输出设备405和输入设备406。输出设备405和处理器401通信,可以以多种方式来显示信息。例如,输出设备405可以是液晶显示器(liquid crystal display,LCD),发光二级管(light emitting diode,LED)显示设备,阴极射线管(cathode ray tube,CRT)显示设备,或投影仪(projector)等。输入设备406和处理器401通信,可以以多种方式接收用户的输入。例如,输入设备406可以是鼠标、键盘、触摸屏设备或传感设备等。
在具体实现中,当通信设备40用于实现上述终端20时,作为一种实施例,上述输出设备405可以包括音频输出设备、视频输出设备等;上述输入设备406可以包括音频输入设备、视频输入设备等。根据不同用户的业务需要还可以选择为终端20配备调音台、功放、大屏幕、电子白板等外设。
上述的通信设备40可以是一个通用设备或者是一个专用设备。在具体实现中,通信设备40可以是台式机、便携式电脑、网络服务器、掌上电脑(personal digitalassistant,PDA)、移动手机、平板电脑、无线终端设备、嵌入式设备或有图5中类似结构的设备。本申请实施例不限定通信设备40的类型。
以下,对本申请实施例中所涉及的部分术语进行解释,以方便读者理解:
1)、带宽、帧率,分辨率
带宽,也可以称作码率,是单位时间内所传输的信息量。例如带宽的单位可以是比特/秒。
帧率,是每秒传输的帧数(frame per second,FPS)。帧率会影响画面流畅度。一般地,帧率越大,画面越流畅;帧率越小,画面越有跳动感。
分辨率,即视频图像分辨率(video graphics array,VGA),是单位英寸所包含的像素点数。分辨率会影响图像大小。一般地,分辨率越高,图像越大;分辨率越低,图像越小。
视频流的帧率、分辨率和视频编码时的压缩率等均对视频流的带宽造成影响。
2)、会场,会场的视频流
会场,是参与视讯会议的终端所处的环境。参与视讯会议的每个终端对应一个会场。
会场的视频流,是指该会场下的终端采集到的会场信息经转换得到的视频流。
3)、场景
场景,即会场场景,可以基于该会场的视频流的图像内容进行区分。具有同一类特征的图像内容对应同一类场景。场景的划分结果可以是预定义的,预定义之后是可以进行更新的。
在一个示例中,场景可以分为:个人计算机(personal computer,PC)桌面场景和非PC桌面场景。具体的:
PC桌面场景下,会场的视频流的图像内容是PC桌面信息,比如PC桌面上显示的文档、快捷方式、文件夹、图片等。
非PC桌面场景下,终端通常通过摄像头采集会场信息,且会场的视频流的图像内容可以包括摄像头视野范围内的人、物(如桌子、椅子、树木等)。
在另一个示例中,非PC桌面场景可以进一步细分,例如,非PC桌面场景可以进一步细分为:固定会议室场景(即室内场景)、户外场景和移动场景。具体的:
固定会议室场景下,会场的视频流的图像内容是会议室中的对象(如人、桌子、椅子等)的图像信息。示例的,固定会议室场景下,会场的视频流的图像内容通常是运动量较小的对象的图像信息,例如变换坐姿的人的图像信息等。
户外场景下,会场的视频流的图像内容是户外的对象(如人、树木、建筑物、车辆等)的图像信息。示例的,户外场景下,会场的视频流可以是运动量较大的对象的图像信息,例如运动比赛视频或者行驶中的人、车等。
移动场景下,会场的视频流的一部分图像的图像内容是会议室中的对象的图像信息,另一部分图像的图像内容是户外的对象的图像信息。
需要说明的是,上述对场景的分类仅为示例,实际实现时,还可以将场景分为其他的类型。本申请实施例对此不进行限定。
4)、其他术语
在本申请实施例中,“示例性的”或者“例如”等词用于表示作例子、例证或说明。本申请实施例中被描述为“示例性的”或者“例如”的任何实施例或设计方案不应被解释为比其它实施例或设计方案更优选或更具优势。确切而言,使用“示例性的”或者“例如”等词旨在以具体方式呈现相关概念。
在本申请实施例中,“至少一个”是指一个或多个。“多个”是指两个或两个以上。
在本申请实施例中,“和/或”,仅仅是一种描述关联对象的关联关系,表示可以存在三种关系,例如,A和/或B,可以表示:单独存在A,同时存在A和B,单独存在B这三种情况。另外,本文中字符“/”,一般表示前后关联对象是一种“或”的关系。
以下,结合附图,通过训练阶段和应用阶段对本申请实施例提供的技术方案进行说明:
训练阶段
如图6所示,为本申请实施例提供的一种获得场景模型的方法的流程示意图。图6所示的方法包括以下步骤:
S101:计算机设备获取至少一种候选场景下的视频流的图像,以及每帧图像所属的候选场景。其中,对于一个候选场景下的视频流来说,该视频流中的每个图像均所属该候选场景。
训练阶段中的计算机设备可以是终端或MCU或其他设备。候选场景可以是预定义的,例如可以包括上文中所列举的PC桌面场景、固定会议室场景、户外场景和移动场景中的一种或多种。当然还可以包括其他场景。
S102:计算机设备对S101中所获取到的信息进行训练,得到场景模型。
训练过程的输入信息包括:每种候选场景下的多帧图像和该候选场景的标识。
训练过程所采用的算法包括:机器学习算法,如神经网络算法等。
训练过程的目标是:通过对同一候选场景下的多帧图像中的对象进行识别,确定该候选场景下所采集的图像的特征信息(即该候选场景下采集的图像通常包括哪些对象)。示例的,所获取的图像的特征信息可以包括以下至少一种:图像中的背景的特征信息,图像中的前景的特征信息,图像中的人物的特征信息、图像中的人或物所在的地点的特征信息等。基于此,计算机设备可以得到每种候选场景下的图像的特征信息,以得到场景模型。
场景模型用于表征视频流的图像内容与该视频流所属的场景的对应关系。场景模型的输入信息可以是视频流的图像内容(如图像本身或图像中包括的对象的名称等)。场景模型的输出信息是该视频流所属的场景的标识信息。作为示例,计算机设备可以使用二进制数00、01、10、11分别表示PC桌面场景、固定会议室场景、户外场景和移动场景的标识信息。
训练过程可以是离线或在线执行的,本申请实施例对此不进行限定。并且,场景模型是可以更新的。
应用阶段
如图7所示,为本申请实施例提供的一种视频流的属性调整方法的流程示意图。图7所示的方法包括以下步骤:
S201:属性调整装置根据第一会场的第一视频流的图像内容和场景模型,得到第一会场的场景。具体的,属性调整装置将第一会场的第一视频流的图像内容输入场景模型,得到场景模型的输出信息,该输出信息即为第一会场的场景的标识信息。
第一会场,可以是视讯会议对应的其中一个会场。
应用阶段中的属性调整装置可以是终端,或MCU,或除终端和MCU之外的一个设备。应用阶段中的属性调整装置与训练阶段中的计算机设备可以是同一设备或不同设备。如果是不同设备,则属性调整装置可以预先存储有计算机设备训练得到的场景模型。
S202:属性调整装置根据第一视频流的丢包率(loss tolerance或packet lossrate)和第一会场的场景,确定第一视频流的目标属性信息。其中,目标属性信息包括目标分辨率和目标帧率中的至少一种。
在一种实现方式中,如果第一视频流的丢包率大于(或者,大于等于)第一预设阈值,则基于第一会场的场景,确定第一视频流的目标属性信息。其中,丢包率是指所丢失数据包数量占所发送数据包数量的比率。第一预设阈值是***能够接受的最大丢包率。具体的:
当第一会场的场景是固定会议室场景时,属性调整装置减小第一视频流的当前分辨率得到目标分辨率,且减小第一视频流的当前帧率得到目标帧率。这是在考虑到“固定会议室场景下,视频流的图像内容中的对象一般是小运动量的对象(如变换坐姿的人等),因此,减小视频流的流畅性和视频流的图像内容的清晰度通常不会对用户体验造成影响,或影响非常小”而提出的技术方案。
当第一会场的场景是户外场景时,属性调整装置减小第一视频流的当前分辨率,得到目标分辨率。可选的,属性调整装置可以保持目标帧率与第一视频流的当前帧率相同。这是在考虑到“户外场景下,视频流的图像内容中的对象一般是大运动量的对象(如行驶的车辆、行走的人等),相比视频流的图像内容的清晰度,优先保障视频流的流畅性,可以提升用户体验”而提出的技术方案。
当目标场景是PC桌面场景时,属性调整装置减小第一视频流的当前帧率,得到目标帧率。可选的,属性调整装置可以保持目标分辨率与第一视频流的当前分辨率相同。这是考虑到“PC桌面场景下,相比视频流的流畅性,优先保障视频流的图像内容(即桌面内容)的清晰度,可以提升用户体验”而提出的技术方案。
当目标场景是移动场景时,属性调整装置保持目标帧率与第一视频流的当前帧率相同,且保持目标分辨率与第一视频流的当前分辨率相同。这是在考虑到“移动场景下,优先保障视频流的流畅性和视频流的图像内容的清晰度”而提出的技术方案。该情况下,可以通过调节第一视频流的其他属性信息,如增大编码压缩率等,来减小第一视频流的带宽。
可选的,如果第一视频流的丢包率大于(或者,大于等于)第一预设阈值,则减小第一视频流的带宽。上述“基于第一会场的场景,确定第一视频流的目标属性信息”确定目标分辨率的方法可以认为是减小第一视频流的带宽的具体实现方式。
在另一种实现方式中,如果第一视频流的丢包率小于(或者,小于等于)第二预设阈值,则增大第一视频流的带宽。第一预设阈值大于或等于第二预设阈值。本申请实施例对第一预设阈值和第二预设阈值的具体取值及其取值方式均不进行限定。具体的:
当目标场景是会议室场景时,属性调整装置增大第一视频流的当前分辨率得到目标分辨率,且增大第一视频流的当前帧率得到目标帧率。
当第一会场的场景是户外场景时,属性调整装置增大第一视频流的当前分辨率,得到目标分辨率。可选的,属性调整装置可以保持目标帧率与第一视频流的当前帧率相同。
当第一会场的场景是PC桌面场景时,属性调整装置增大第一视频流的当前帧率,得到目标帧率。可选的,属性调整装置可以保持目标分辨率与第一视频流的当前分辨率相同。
当第一会场的场景是移动场景时,属性调整装置保持目标帧率与第一视频流的当前帧率相同,且保持目标分辨率与第一视频流的当前分辨率相同。
可选的,如果第一视频流的丢包率小于(或者,小于等于)第二预设阈值,则增大第一视频流的带宽。这几种“基于第一会场的场景,确定第一视频流的目标属性信息”确定目标分辨率的方法可以认为是增大第一视频流的带宽的具体实现方式。
需要说明的是,上文中描述了不同目标场景下,对第一视频流中的图像的分辨率和帧率进行调节的方式(或调节方向,即增大或减小或保持)。
可选的,属性调整装置可以结合丢包率的大小,确定目标分辨率的取值和/或目标帧率的取值。例如,在第一视频流的属性信息一定的情况下,丢包率越大,目标帧率越小和/或目标分辨率越小,以达到减少丢包率的目的。
可选的,属性调整装置可以结合场景,确定目标分辨率的取值和/或目标帧率的取值。例如,在PC桌面场景下,目标分辨率>1080P(即单位英寸所包含的像素点数是1080),目标帧率<5帧(即每秒传输的帧数是5帧)。例如,会议室场景下,目标分辨率>720P,15帧<帧率<30帧。例如,户外场景下如运动比赛场景下,目标分辨率>4000P,目标帧率>60帧。例如,移动场景下,目标分辨率<360P,15帧<帧率<20帧。当然具体实现时不限于此。
可选的,属性调整装置可以在上述所区分的部分或全部场景下继续细分不同的场景,例如,将户外场景细分为运动比赛场景、道路交通场景等等。然后,预定义每种细分的场景中的允许的分辨率的取值范围和/或帧率的取值范围,并以此为依据,确定在每种细分的场景中,目标分辨率的取值和目标帧率的取值。
上述各方式中,给出了本申请实施例中对第一视频流中的图像的处理方式,关于第一视频流中的语音和数据信号的处理方式,本申请实施例不进行限定,如可以参考现有技术。
S203:属性调整装置将第一视频流的属性信息调整为目标属性信息。具体实现方式可以参考实施例一至实施例八中的相关描述。
本申请实施例提供的技术方案,结合第一会场的场景,确定第一视频流的目标属性信息,这样,可以达到调节第一视频流的带宽的目的,与现有的IRC技术相比,对不同场景进行了更细粒度的带宽调节,这有助于提升用户的体验。
以下,从信息交互流程的角度,对本申请实施例提供的技术方案进行具体说明:
本申请实施例提供的技术方案可以应用于点对点会议或者多点会议。其中,点对点会议,是指参与视讯会议的终端的个数等于2的会议。多点会议,是指参与视讯会议的终端的个数大于2的会议。另外,对于点对点会议或者多点会议来说,均可以是单流会议或多流会议(如双流会议)。其中,单流会议,是指同一时刻仅支持传输一路数据流的会议。多流会议,是指同一时刻支持传输两路或两路以上数据流的会议。双流会议,是指同一时刻传输两路数据流的会议。
需要说明的是,如果应用于多流会议,则针对多流会议中的每一路数据流作为上文中所描述的第一视频流,从而执行本申请实施例多提供的以下技术方案。
以下,结合附图,对本申请实施例提供的调整视频流的属性的方法进行说明。
实施例一至实施例六,可以应用于终端之间通过MCU进行通信的会议电视***如图1至图3所示的会议电视***。实施例一和实施例二描述了上行丢包情况下调整视频流的属性的方法。这里的上行丢包情况是指由MCU确定所接收到的发送端设备发送的视频流的丢包情况。实施例三至实施例六描述了下行丢包情况下调整视频流的属性的方法。这里的下行丢包情况是指由接收端设备确定所接收到的MCU发送的视频流的丢包情况。作为示例,可以使用丢包率来表征丢包情况。
实施例七和实施例八可以应用于终端之间不通过MCU进行通信的会议电视***如图4所示的会议电视***。
实施例一
本实施例中,是以上行丢包场景下由MCU确定目标属性信息为例进行说明的。
如图8A所示,为本申请实施例提供的一种调整视频流的属性的方法的交互示意图。图8A所示的方法可以包括以下步骤:
S301:发送端设备向MCU发送第一会场的具有源属性信息的第一视频流。发送端设备是第一会场的终端。其中,源属性信息可以是执行该步骤时所发送的第一视频流的属性信息,并不限定是特定的属性信息,在此统一说明,下文其他实施例中的源属性信息的解释与此类似,下文不再赘述。
S302:MCU确定接收到的具有源属性信息的第一视频流的丢包率。本申请任一实施例中确定丢包率的方法均可以参考现有技术。此处统一说明,下文不再赘述。
S303:MCU根据具有源属性信息的第一视频流的图像内容,确定第一会场的场景。
本申请实施例对S302和S303的执行顺序不进行限定,例如,先执行S302再执行S303,或先执行S303再执行S302,或同时执行S302和S303等。
本申请任一实施例中根据视频流的图像内容,确定第一会场的场景的方法均可以参考上述S201。此处统一说明,下文不再赘述。
S304:MCU根据具有源属性信息的第一视频流的丢包率和第一会场的场景,确定目标属性信息。目标属性信息可以理解为:MCU期望该发送端设备发送的视频流所具有的属性信息。
本申请任一实施例中根据视频流的丢包率和第一会场的场景,确定目标属性信息的方法均可以参考上述S202。此处统一说明,下文不再赘述。
S305:MCU向发送端设备发送目标属性信息。
S306:发送端设备生成具有目标属性信息的第一视频流。
S307:发送端设备向MCU发送具有目标属性信息的第一视频流。
本实施例中,由MCU确定目标属性信息,这样,有助于减少发送端设备的运算量。
实施例二
本实施例中,是以上行丢包场景下由发送端设备确定目标属性信息为例进行说明的。
如图8B所示,为本申请实施例提供的一种调整视频流的属性的方法的交互示意图。图8B所示的方法可以包括以下步骤:
S401~S402:可以参考上述S301~S302。
S403:MCU向发送端设备发送具有源属性信息的第一视频流的丢包率。
S404:发送端设备根据具有源属性信息的第一视频流的图像内容,确定第一会场的场景。
本申请实施例对S401~S403与S404的执行顺序不进行限定。例如,先执行S401~S403再执行S404,或先执行S404再执行S401~S403,或在执行S401~S403的过程中执行S404等。
S405:发送端设备根据具有源属性信息的第一视频流的丢包率和的第一会场的场景,确定目标属性信息。
S406~S407:可以参考上述S306~S307。
本实施例中,由发送端设备确定目标属性信息,这样,有助于减少MCU的运算量。
实施例三
本实施例中,是以下行丢包场景下由MCU确定目标属性信息为例进行说明的。并且,MCU具有转发功能,以及对视频流进行编解码(即转换)的功能。转换前后视频流的内容相同或实质相同,但是属性信息(如分辨率和/或帧率)不同。
如图9A所示,为本申请实施例提供的一种调整视频流的属性的方法的交互示意图。图9A所示的方法可以包括以下步骤:
S501:可以参考上述S301。
S502:MCU对具有源属性信息的第一视频流进行转换。转换前后第一视频流的属性信息可以不同。
S503:MCU向接收端设备发送转换后的第一视频流。
S504:接收端设备确定接收到的转换后的第一视频流的丢包率。
S505:接收端设备向MCU发送转换后的第一视频流的丢包率。
S506:MCU根据转换后的第一视频流的图像内容或转换前的第一视频流的图像内容,确定第一会场的场景。
S507:MCU根据转换后的第一视频流的丢包率和第一会场的场景,确定目标属性信息。
S508:发送端设备向MCU发送具有源属性信息的第一视频流。
S509:MCU将具有源属性信息的第一视频流转换为具有目标属性信息的第一视频流。
S510:MCU向接收端设备发送具有目标属性信息的第一视频流。
实施例四
本实施例中,是以下行丢包场景下由MCU确定目标属性信息为例进行说明的。并且,MCU具有转发功能,但是不具有对视频流进行编解码(即转换)的功能。
如图9B所示,为本申请实施例提供的一种调整视频流的属性的方法的交互示意图。图9B所示的方法可以包括以下步骤:
S601:可以参考上述S301。
S602:MCU向接收端设备发送具有源属性信息的第一视频流。
S603:接收端设备确定接收到的具有源属性信息的第一视频流的丢包率。
S604:接收端设备向MCU发送具有源属性信息的第一视频流的丢包率。
S605:MCU根据具有源属性信息的第一视频流的图像内容,确定第一会场的场景。
S606:MCU根据具有源属性信息的第一视频流的丢包率和第一会场的场景,确定目标属性信息。
S607:MCU向发送端设备发送目标属性信息。
S608:发送端设备向MCU发送具有目标属性信息的第一视频流。
S609:发送端设备向MCU发送具有目标属性信息的第一视频流。
S610:MCU向接收端设备发送具有目标属性信息的第一视频流。
实施例五
本实施例中,是以下行丢包场景下由接收端设备确定目标属性信息为例进行说明的。并且,MCU具有转发功能,以及对视频流进行编解码(即转换)的功能。
如图9C所示,为本申请实施例提供的一种调整视频流的属性的方法的交互示意图。图9C所示的方法可以包括以下步骤:
S701~S704:可以参考上述S501~S504。
S705:接收端设备根据转换后的第一视频流的图像内容或转换前的第一视频流的图像内容,确定第一会场的场景。
S706:接收端设备根据转换后的第一视频流的丢包率和第一会场的场景,确定目标属性信息。
S707:接收端设备向MCU发送目标属性信息。
S708~S710:可以参考上述S508~S510。
实施例六
本实施例中,是以下行丢包场景下由接收端设备确定目标属性信息为例进行说明的。并且,MCU具有转发功能,但不具有对视频流进行编解码(即转换)的功能。
如图9D所示,为本申请实施例提供的一种调整视频流的属性的方法的交互示意图。图9C所示的方法可以包括以下步骤:
S801~S803:可以参考上述S601~S603。
S804:接收端设备根据具有源属性信息的第一视频流的图像内容,确定第一会场的场景。
S805:接收端设备根据具有源属性信息的第一视频流的丢包率和第一会场的场景,确定目标属性信息。
S806:接收端设备向MCU发送目标属性信息。
S807~S810:可以参考上述S607~S610。
上述实施例一和实施六均可以应用于终端接入MCU的会议电视***如图1至图3所示的会议电视***。以下说明应用于终端不接入MCU的会议电视***中调整视频流的属性的方法。
将实施例一和实施例二中的MCU替换为接收端设备得到的新的实施例,可以应用于终端不接入MCU的会议电视***如图4所示的会议电视***。另外,本申请还提供了以下实施例七和实施例八。
实施例七
如图10A所示,为本申请实施例提供的一种调整视频流的属性的方法的交互示意图。图10A所示的方法可以包括以下步骤:
S901:发送端设备向接收端设备发送第一会场的具有源属性信息的第一视频流。
S902:接收端设备确定接收到的具有源属性信息的第一视频流的丢包率。
S903:接收端设备向发送端设备发送具有源属性信息的第一视频流的丢包率。
S904:发送端设备根据具有源属性信息的第一视频流的图像内容,确定第一会场的场景。
S905:发送端设备根据具有源属性信息的第一视频流的丢包率和第一会场的场景,确定目标属性信息。
S906:发送端设备向接收端设备发送具有目标属性信息的第一视频流。
实施例八
如图10B所示,为本申请实施例提供的一种调整视频流的属性的方法的交互示意图。图10B所示的方法可以包括以下步骤:
S1001:发送端设备向接收端设备发送具有源属性信息的第一视频流。
S1002:接收端设备确定接收到的具有源属性信息的第一视频流的丢包率。
S1003:接收端设备根据具有源属性信息的第一视频流的图像内容,确定第一会场的场景。
S1004:接收端设备根据具有源属性信息的第一视频流的丢包率和第一会场的场景,确定目标属性信息。
S1005:接收端设备向发送端设备发送目标属性信息。
S1006:发送端设备向接收端设备发送具有目标属性信息的第一视频流。
另外,上述实施例是针对属性调整装置是终端或MCU为例进行说明的。在一些实施例中,属性调节装置可以是与发送端设备和MCU均连接的一个装置,该装置用于将发送端设备发送的第一视频流的属性信息调整为目标属性信息,并将具有目标属性信息的第一视频流发送给MCU。该实施例中,可以不对发送端设备确定视频流的属性信息的方法进行更改。
基于上文中所描述的任意一个实施例,以下对目标属性信息的具体实现进行说明:
在一种实现方式中,当目标分辨率与当前视频流(如实施例一、二、四、六、七、八中的具有源属性信息的第一视频流,或实施例三、五中的转换后的第一视频流)的分辨率不同时,目标属性信息包括目标分辨率。当目标帧率与当前视讯会议的帧率不同时,目标属性信息包括目标帧率。
在另一种实现方式中,无论目标分辨率与当前视频流(具体示例同上)的分辨率是否相同,且无论目标帧率与当前视频流的帧率是否相同,目标属性信息均包括目标分辨率和目标帧率。
进一步地,基于这两种实现方式中的任一种,目标属性信息均可以包括调整后的带宽。
本申请实施例对将目标属性信息携带在何种信令中进行传输不进行限定,例如,原有H323协议中采用H245 command(flowcontrol command 4)发送调整后的带宽。具体的,原有会话初始协议(session initiation protocol,SIP)采用标准协议定义的临时最大码率请求/临时最大码率通知(temporary maximum media bit-rate request/temporarymaximum media bit-rate notification,TMMBR/TMMBN)信令发送调整后的带宽。在本申请的一个实施例中,可以沿用TMMBR/TMMBN)信令来携带目标属性信息。
以下通过一个示例说明本申请实施例对TMMBR/TMMBN信令的改进:
在原有TMMBR/TMMBN信令中,包括带宽字段,SSRC(synchronization source)字段。例如:TMMBR={带宽、SSRC},TMMBN={带宽、SSRC}。
在本申请的例中,可以在TMMBR/TMMBN信令中增加分辨率和帧率字段。例如:TMMBR={带宽、SSRC、分辨率、帧率},TMMBN={带宽、SSRC、分辨率、帧率}。
上述主要从方法的角度对本申请实施例提供的方案进行了介绍。为了实现上述功能,其包含了执行各个功能相应的硬件结构和/或软件模块。本领域技术人员应该很容易意识到,结合本文中所公开的实施例描述的各示例的单元及算法步骤,本申请能够以硬件或硬件和计算机软件的结合形式来实现。某个功能究竟以硬件还是计算机软件驱动硬件的方式来执行,取决于技术方案的特定应用和设计约束条件。专业技术人员可以对每个特定的应用来使用不同方法来实现所描述的功能,但是这种实现不应认为超出本申请的范围。
本申请实施例可以根据上述方法示例对属性调整装置进行功能模块的划分,例如可以对应各个功能划分各个功能模块,也可以将两个或两个以上的功能集成在一个处理模块中。上述集成的模块既可以采用硬件的形式实现,也可以采用软件功能模块的形式实现。需要说明的是,本申请实施例中对模块的划分是示意性的,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式。
如图11所示,为本申请实施例提供的一种属性调整装置110的结构示意图。该属性调整装置110可以用于执行上文中的属性调整装置或计算机设备所执行的步骤。该属性调整装置110包括:第一确定单元1100、第二确定单元1101和调整单元1102。其中,第一确定单元1100,用于根据第一会场的第一视频流中的图像内容,确定第一会场的场景。第二确定单元1101,用于根据第一视频流的丢包率和第一会场的场景,确定第一视频流的目标属性信息;目标属性信息包括目标分辨率和目标帧率中的至少一种。调整单元1102,用于将第一视频流的属性信息调整为目标属性信息。例如,结合图7,第一确定单元1100可以用于执行S201,第二确定单元1101可以用于执行S202,调整单元1103可以用于执行S203。
可选的,第一确定单元1100具体用于:根据第一视频流的图像内容和场景模型,确定第一会场的场景;场景模型用于表征视频流的图像内容与该视频流所属的场景之间的对应关系。例如,结合图7,第一确定单元1100可以用于执行S201。
可选的,如图11所示,该属性调整装置110还包括:获取单元1103,用于获取至少一种候选场景下的视频流的图像。训练单元1104,用于对该至少一种候选场景下的视频流的图像进行训练,得到场景模型;其中,该至少一种候选场景包括第一会场的场景。例如,结合图6,获取单元1103可以用于执行S101中计算机设备所执行的步骤,训练单元1104可以用于执行S102中计算机设备所执行的步骤。
可选的,第二确定单元1101具体用于:当第一视频流的丢包率大于或等于第一预设阈值时,基于第一会场的场景,确定第一视频流的目标属性信息。
可选的,第二确定单元1101具体用于:当第一会场的场景是固定会议室场景时,减小第一视频流的当前分辨率,得到目标分辨率,且减小第一视频流的当前帧率,得到目标帧率。或者,当第一会场的场景是户外场景时,减小第一视频流的当前分辨率,得到目标分辨率,且将第一视频流的当前帧率作为目标帧率。或者,当第一会场的场景是PC桌面场景时,减小第一视频流的当前帧率,得到目标帧率,且将第一视频流的当前分辨率作为目标分辨率。或者,当第一会场的场景是移动场景时,将第一视频流的当前分辨率作为目标分辨率,且将第一视频流的当前帧率作为目标帧率。
可选的,第二确定单元1101具体用于:当第一视频流的丢包率小于或等于第二预设阈值时,基于第一会场的场景,确定第一视频流的目标属性信息。
可选的,第二确定单元1101具体用于:当第一会场的场景是固定会议室场景时,增大第一视频流的当前分辨率,得到目标分辨率,且减小第一视频流的当前帧率,得到目标帧率。或者,当第一会场的场景是户外场景时,增大第一视频流的当前分辨率,得到目标分辨率,且将第一视频流的当前帧率作为目标帧率。或者,当第一会场的场景是PC桌面场景时,增大第一视频流的当前帧率,得到目标帧率,且将第一视频流的当前分辨率作为目标分辨率。或者当第一会场的场景是移动场景时,将第一视频流的当前分辨率作为目标分辨率,且将第一视频流的当前帧率作为目标帧率。
可选的,如图11所示,该属性调整装置110还包括:发送单元1105,用于向第一会场的终端发送目标属性信息,目标属性信息用于指示该终端按照目标属性信息发送第一视频流。
在一个示例中,结合图5,上述第一确定单元1100、第二确定单元1101、调整单元1102、获取单元1103和训练单元1104的功能,均可以通过图5中的处理器401运行存储器403中的计算机指令实现。上述发送单元1105可以通过图5中的通信接口404实现。
上述提供的任一种属性调整装置110中相关内容的解释以及有益效果的描述等均可参考上述对应的方法实施例,此处不再赘述。
在上述实施例中,可以全部或部分地通过软件、硬件、固件或者其任意组合来实现。当使用软件程序实现时,可以全部或部分地以计算机程序产品的形式来实现。该计算机程序产品包括一个或多个计算机指令。在计算机上加载和执行计算机执行指令时,全部或部分地产生按照本申请实施例的流程或功能。计算机可以是通用计算机、专用计算机、计算机网络、或者其他可编程装置。计算机指令可以存储在计算机可读存储介质中,或者从一个计算机可读存储介质向另一个计算机可读存储介质传输,例如,计算机指令可以从一个网站站点、计算机、服务器或者数据中心通过有线(例如同轴电缆、光纤、数字用户线(digitalsubscriber line,DSL))或无线(例如红外、无线、微波等)方式向另一个网站站点、计算机、服务器或数据中心进行传输。计算机可读存储介质可以是计算机能够存取的任何可用介质或者是包含一个或多个可以用介质集成的服务器、数据中心等数据存储设备。可用介质可以是磁性介质(例如,软盘、硬盘、磁带),光介质(例如,DVD)、或者半导体介质(例如固态硬盘(solid state disk,SSD))等。
尽管在此结合各实施例对本申请进行了描述,然而,在实施所要求保护的本申请过程中,本领域技术人员通过查看附图、公开内容、以及所附权利要求书,可理解并实现公开实施例的其他变化。在权利要求中,“包括”(comprising)一词不排除其他组成部分或步骤,“一”或“一个”不排除多个的情况。单个处理器或其他单元可以实现权利要求中列举的若干项功能。相互不同的从属权利要求中记载了某些措施,但这并不表示这些措施不能组合起来产生良好的效果。
尽管结合具体特征及其实施例对本申请进行了描述,显而易见的,在不脱离本申请的精神和范围的情况下,可对其进行各种修改和组合。相应地,本说明书和附图仅仅是所附权利要求所界定的本申请的示例性说明,且视为已覆盖本申请范围内的任意和所有修改、变化、组合或等同物。显然,本领域的技术人员可以对本申请进行各种改动和变型而不脱离本申请的精神和范围。这样,倘若本申请的这些修改和变型属于本申请权利要求及其等同技术的范围之内,则本申请也意图包含这些改动和变型在内。

Claims (10)

1.一种调整视频流的属性的方法,其特征在于,所述方法包括:
属性调整装置根据第一会场的第一视频流中的图像内容,确定所述第一会场的场景;
在所述第一视频流的丢包率大于或等于第一预设阈值的情况下,
当所述第一会场的场景是固定会议室场景时,所述属性调整装置减小所述第一视频流的当前分辨率,得到目标分辨率,且减小所述第一视频流的当前帧率,得到目标帧率;或者,当所述第一会场的场景是户外场景时,所述属性调整装置减小所述第一视频流的当前分辨率,得到所述目标分辨率,且将所述第一视频流的当前帧率作为所述目标帧率;或者,当所述第一会场的场景是个人计算机PC桌面场景时,所述属性调整装置减小所述第一视频流的当前帧率,得到所述目标帧率,且将所述第一视频流的当前分辨率作为所述目标分辨率;或者,当所述第一会场的场景是移动场景时,所述属性调整装置将所述第一视频流的当前分辨率作为所述目标分辨率,且将所述第一视频流的当前帧率作为所述目标帧率;
在所述第一视频流的丢包率小于或等于第二预设阈值的情况下,
当所述第一会场的场景是固定会议室场景时,所述属性调整装置增大所述第一视频流的当前分辨率,得到所述目标分辨率,且增大所述第一视频流的当前帧率,得到所述目标帧率;或者,当所述第一会场的场景是户外场景时,所述属性调整装置增大所述第一视频流的当前分辨率,得到目标分辨率,且将所述第一视频流的当前帧率作为所述目标帧率;或者,当所述第一会场的场景是PC桌面场景时,所述属性调整装置增大所述第一视频流的当前帧率,得到所述目标帧率,且将所述第一视频流的当前分辨率作为所述目标分辨率;或者,当所述第一会场的场景是移动场景时,所述属性调整装置将所述第一视频流的当前分辨率作为所述目标分辨率,且将所述第一视频流的当前帧率作为所述目标帧率;
其中,所述第一预设阈值大于或等于所述第二预设阈值;
所述属性调整装置将所述第一视频流的属性信息调整为目标属性信息,所述目标属性信息包括所述目标分辨率和所述目标帧率中的至少一种。
2.根据权利要求1所述的方法,其特征在于,所述属性调整装置根据第一会场的第一视频流中的图像内容,确定所述第一会场的场景,包括:
所述属性调整装置根据所述第一视频流的图像内容和场景模型,确定所述第一会场的场景;所述场景模型用于表征视频流的图像内容与视频流所属的场景之间的对应关系。
3.根据权利要求2所述的方法,其特征在于,所述方法还包括:
所述属性调整装置获取至少一种候选场景下的视频流的图像;
所述属性调整装置对所述至少一种候选场景下的视频流的图像进行训练,得到所述场景模型;其中,所述至少一种候选场景包括所述第一会场的场景。
4.根据权利要求1至3任一项所述的方法,其特征在于,所述属性调整装置将所述第一视频流的属性信息调整为所述目标属性信息,包括:
当所述属性调整装置是所述第一会场的终端之外的设备时,所述属性调整装置向所述第一会场的终端发送所述目标属性信息,所述目标属性信息用于指示所述终端按照所述目标属性信息发送所述第一视频流。
5.一种属性调整装置,其特征在于,所述装置包括:
第一确定单元,用于根据第一会场的第一视频流中的图像内容,确定所述第一会场的场景;
第二确定单元用于,
在所述第一视频流的丢包率大于或等于第一预设阈值的情况下,
当所述第一会场的场景是固定会议室场景时,减小所述第一视频流的当前分辨率,得到目标分辨率,且减小所述第一视频流的当前帧率,得到目标帧率;或者,当所述第一会场的场景是户外场景时,减小所述第一视频流的当前分辨率,得到所述目标分辨率,且将所述第一视频流的当前帧率作为所述目标帧率;或者,当所述第一会场的场景是个人计算机PC桌面场景时,减小所述第一视频流的当前帧率,得到所述目标帧率,且将所述第一视频流的当前分辨率作为所述目标分辨率;或者,当所述第一会场的场景是移动场景时,将所述第一视频流的当前分辨率作为所述目标分辨率,且将所述第一视频流的当前帧率作为所述目标帧率;
以及,在所述第一视频流的丢包率小于或等于第二预设阈值情况下,
当所述第一会场的场景是固定会议室场景时,增大所述第一视频流的当前分辨率,得到所述目标分辨率,且增大所述第一视频流的当前帧率,得到所述目标帧率;或者,当所述第一会场的场景是户外场景时,增大所述第一视频流的当前分辨率,得到目标分辨率,且将所述第一视频流的当前帧率作为所述目标帧率;或者,当所述第一会场的场景是PC桌面场景时,增大所述第一视频流的当前帧率,得到所述目标帧率,且将所述第一视频流的当前分辨率作为所述目标分辨率;或者,当所述第一会场的场景是移动场景时,将所述第一视频流的当前分辨率作为所述目标分辨率,且将所述第一视频流的当前帧率作为所述目标帧率;
其中,所述第一预设阈值大于或等于所述第二预设阈值;
调整单元,用于将所述第一视频流的属性信息调整为目标属性信息,所述目标属性信息包括所述目标分辨率和所述目标帧率中的至少一种。
6.根据权利要求5所述的装置,其特征在于,
所述第一确定单元具体用于:根据所述第一视频流的图像内容和场景模型,确定所述第一会场的场景;所述场景模型用于表征视频流的图像内容与视频流所属的场景之间的对应关系。
7.根据权利要求6所述的装置,其特征在于,所述装置还包括:
获取单元,用于获取至少一种候选场景下的视频流的图像;
训练单元,用于对所述至少一种候选场景下的视频流的图像进行训练,得到所述场景模型;其中,所述至少一种候选场景包括所述第一会场的场景。
8.根据权利要求5至7任一项所述的装置,其特征在于,所述装置还包括:
发送单元,用于当所述属性调整装置是所述第一会场的终端之外的设备时,向所述第一会场的终端发送所述目标属性信息,所述目标属性信息用于指示所述终端按照所述目标属性信息发送所述第一视频流。
9.一种属性调整装置,其特征在于,包括:存储器和处理器,所述存储器用于存储计算机指令,所述处理器用于调用所述计算机指令,以执行权利要求1至4任一项所述的方法。
10.一种计算机可读存储介质,其特征在于,包括计算机指令,所述计算机指令在计算机上运行时,使得权利要求1至4任一项所述的方法被执行。
CN201911054917.9A 2019-10-31 2019-10-31 调整视频流的属性的方法和装置 Active CN112752058B (zh)

Priority Applications (4)

Application Number Priority Date Filing Date Title
CN201911054917.9A CN112752058B (zh) 2019-10-31 2019-10-31 调整视频流的属性的方法和装置
EP20883609.8A EP4044615A4 (en) 2019-10-31 2020-06-23 METHOD AND APPARATUS FOR ADJUSTING A PROPERTY OF A VIDEO STREAM
PCT/CN2020/097754 WO2021082479A1 (zh) 2019-10-31 2020-06-23 调整视频流的属性的方法和装置
US17/732,590 US20220255981A1 (en) 2019-10-31 2022-04-29 Method and Apparatus for Adjusting Attribute of Video Stream

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201911054917.9A CN112752058B (zh) 2019-10-31 2019-10-31 调整视频流的属性的方法和装置

Publications (2)

Publication Number Publication Date
CN112752058A CN112752058A (zh) 2021-05-04
CN112752058B true CN112752058B (zh) 2022-10-04

Family

ID=75644623

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201911054917.9A Active CN112752058B (zh) 2019-10-31 2019-10-31 调整视频流的属性的方法和装置

Country Status (4)

Country Link
US (1) US20220255981A1 (zh)
EP (1) EP4044615A4 (zh)
CN (1) CN112752058B (zh)
WO (1) WO2021082479A1 (zh)

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN117441155A (zh) * 2021-07-07 2024-01-23 海信视像科技股份有限公司 显示设备以及投屏方法
CN115361569B (zh) * 2022-08-10 2023-10-20 深圳乐播科技有限公司 一种云会议中的动态帧投屏方法及相关产品

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20050093438A (ko) * 2004-03-19 2005-09-23 엘지전자 주식회사 패킷 손실률에 따른 프레임 전송률 조절 방법
CN1845596A (zh) * 2005-04-06 2006-10-11 上海迪比特实业有限公司 视频传输***及其自适应调节视频图像的方法
CN102075769A (zh) * 2011-01-10 2011-05-25 苏州博联科技有限公司 视频无线传输监控***的视频QoS优化方法
CN102833219A (zh) * 2011-06-16 2012-12-19 华为技术有限公司 向客户端传输数据文件的方法和装置
CN105100675A (zh) * 2015-09-11 2015-11-25 Tcl集团股份有限公司 一种终端视频通信的质量调节方法及***
CN105635734A (zh) * 2014-11-03 2016-06-01 掌赢信息科技(上海)有限公司 基于视频通话场景的自适应视频编码方法及装置

Family Cites Families (21)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6002802A (en) * 1995-10-27 1999-12-14 Kabushiki Kaisha Toshiba Video encoding and decoding apparatus
US6212232B1 (en) * 1998-06-18 2001-04-03 Compaq Computer Corporation Rate control and bit allocation for low bit rate video communication applications
US20050099492A1 (en) * 2003-10-30 2005-05-12 Ati Technologies Inc. Activity controlled multimedia conferencing
WO2007070056A1 (en) * 2005-12-15 2007-06-21 Thomson Licensing An adaptive joint source and channel coding scheme for h.264 video multicasting over wireless networks
US8305914B2 (en) * 2007-04-30 2012-11-06 Hewlett-Packard Development Company, L.P. Method for signal adjustment through latency control
US8867622B2 (en) * 2008-08-14 2014-10-21 Broadcom Corporation Method and system for priority-based digital multi-stream decoding
WO2012057733A1 (en) * 2010-10-25 2012-05-03 Hewlett-Packard Development Company, L.P. Systems, methods, and devices for adjusting video conference parameters to maintain system performance
CN102572370B (zh) * 2011-01-04 2014-06-11 华为终端有限公司 视频会议的控制方法和会议终端
TW201242338A (en) * 2011-02-22 2012-10-16 Compal Electronics Inc Method and system for adjusting video and audio quality of video stream
CN102413307B (zh) * 2011-11-30 2013-11-27 晶门科技(深圳)有限公司 电视视频聊天的自适应码率调整方法及调整装置
CN105025249B (zh) * 2014-04-22 2018-12-07 ***通信集团江苏有限公司 视频监控数据传输控制方法、装置及视频监控***
WO2016003344A1 (en) * 2014-07-04 2016-01-07 Telefonaktiebolaget L M Ericsson (Publ) Priority of uplink streams in video switching
CN104410918B (zh) * 2014-12-09 2019-01-15 广州华多网络科技有限公司 一种直播视频参数调整方法和装置
US9232189B2 (en) * 2015-03-18 2016-01-05 Avatar Merger Sub Ii, Llc. Background modification in video conferencing
CN105471865A (zh) * 2015-11-23 2016-04-06 苏州工业园区云视信息技术有限公司 视频流动态适应网络状态的方法
CN105915904A (zh) * 2016-05-23 2016-08-31 北京中兴高达通信技术有限公司 一种宽带集群呼叫业务的视频流Qos控制方法
CN107666366B (zh) * 2016-07-28 2020-02-14 华为技术有限公司 一种调整编码速率的方法、装置及***
CN108206925B (zh) * 2016-12-16 2020-04-14 展讯通信(上海)有限公司 多路视频通话的实现方法、装置及多通终端
US10855996B2 (en) * 2018-02-20 2020-12-01 Arlo Technologies, Inc. Encoder selection based on camera system deployment characteristics
CN111093069A (zh) * 2018-10-23 2020-05-01 大唐移动通信设备有限公司 一种全景视频流的质量评估方法及装置
CN112422879B (zh) * 2019-08-20 2022-10-28 华为技术有限公司 媒体能力动态调整方法及装置

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20050093438A (ko) * 2004-03-19 2005-09-23 엘지전자 주식회사 패킷 손실률에 따른 프레임 전송률 조절 방법
CN1845596A (zh) * 2005-04-06 2006-10-11 上海迪比特实业有限公司 视频传输***及其自适应调节视频图像的方法
CN102075769A (zh) * 2011-01-10 2011-05-25 苏州博联科技有限公司 视频无线传输监控***的视频QoS优化方法
CN102833219A (zh) * 2011-06-16 2012-12-19 华为技术有限公司 向客户端传输数据文件的方法和装置
CN105635734A (zh) * 2014-11-03 2016-06-01 掌赢信息科技(上海)有限公司 基于视频通话场景的自适应视频编码方法及装置
CN105100675A (zh) * 2015-09-11 2015-11-25 Tcl集团股份有限公司 一种终端视频通信的质量调节方法及***

Also Published As

Publication number Publication date
EP4044615A4 (en) 2022-11-16
WO2021082479A1 (zh) 2021-05-06
CN112752058A (zh) 2021-05-04
US20220255981A1 (en) 2022-08-11
EP4044615A1 (en) 2022-08-17

Similar Documents

Publication Publication Date Title
US9525847B2 (en) Media negotiation method, device, and system for multi-stream conference
CN102883135B (zh) 屏幕共享及控制方法
US6453336B1 (en) Video conferencing with adaptive client-controlled resource utilization
US10609390B1 (en) Adaptive screen encoding control
US9172979B2 (en) Experience or “sentio” codecs, and methods and systems for improving QoE and encoding based on QoE experiences
WO2018120946A1 (zh) 视频画面异常判断、装置及终端设备
CN108881972B (zh) 一种码率分配方法、装置、设备和存储介质
EP3329670B1 (en) Virtual video driver bridge system for multi-source collaboration within a web conferencing system
CN101640784A (zh) 一种在视频会议***中控制多画面复合的控制装置及方法
US20220255981A1 (en) Method and Apparatus for Adjusting Attribute of Video Stream
CN103518370A (zh) 视频会议***的视频结构调节方法及其***
JP7334470B2 (ja) 映像処理装置、ビデオ会議システム、映像処理方法、およびプログラム
CN113542660A (zh) 一种实现会议多画面高清显示的方法、***及存储介质
US20170310932A1 (en) Method and system for sharing content in videoconferencing
US20210227005A1 (en) Multi-user instant messaging method, system, apparatus, and electronic device
WO2021093882A1 (zh) 一种视频会议方法、会议终端、服务器及存储介质
CN115209189B (zh) 一种视频流传输方法、***、服务器及存储介质
CN116347145B (zh) 多设备屏幕共享方法、投屏装置、显示装置及共享***
JPH099230A (ja) 解像度制御装置
Raja et al. Evaluation of a scalable and distributed mobile device video recording approach for accessible presentations
KR20230126062A (ko) 비대면 온라인 교육을 위한 네트워크 트래픽 감소 시스템 및 네트워크 트래픽 감소 방법
CN117641062A (zh) 一种在视频通话中处理视频背景环境的***
CN116017091A (zh) 视频传输方法、装置、电子设备及计算机可读存储介质
CN113160342A (zh) 基于反馈的编码方法及装置、存储介质、电子设备
CN116636201A (zh) 使用rtcp反馈发信号通知用于远程终端的远程会议和远程呈现的多个音频混合增益的技术

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant