CN112954372B - 流媒体故障监测方法及装置 - Google Patents
流媒体故障监测方法及装置 Download PDFInfo
- Publication number
- CN112954372B CN112954372B CN202110103914.0A CN202110103914A CN112954372B CN 112954372 B CN112954372 B CN 112954372B CN 202110103914 A CN202110103914 A CN 202110103914A CN 112954372 B CN112954372 B CN 112954372B
- Authority
- CN
- China
- Prior art keywords
- dimension
- streaming media
- preset
- upstream
- data
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Images
Classifications
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N21/00—Selective content distribution, e.g. interactive television or video on demand [VOD]
- H04N21/20—Servers specifically adapted for the distribution of content, e.g. VOD servers; Operations thereof
- H04N21/21—Server components or server architectures
- H04N21/218—Source of audio or video content, e.g. local disk arrays
- H04N21/2187—Live feed
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04L—TRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
- H04L41/00—Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks
- H04L41/06—Management of faults, events, alarms or notifications
- H04L41/0677—Localisation of faults
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04L—TRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
- H04L65/00—Network arrangements, protocols or services for supporting real-time applications in data packet communication
- H04L65/80—Responding to QoS
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N21/00—Selective content distribution, e.g. interactive television or video on demand [VOD]
- H04N21/20—Servers specifically adapted for the distribution of content, e.g. VOD servers; Operations thereof
- H04N21/23—Processing of content or additional data; Elementary server operations; Server middleware
- H04N21/24—Monitoring of processes or resources, e.g. monitoring of server load, available bandwidth, upstream requests
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N21/00—Selective content distribution, e.g. interactive television or video on demand [VOD]
- H04N21/40—Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
- H04N21/43—Processing of content or additional data, e.g. demultiplexing additional data from a digital video stream; Elementary client operations, e.g. monitoring of home network or synchronising decoder's clock; Client middleware
- H04N21/442—Monitoring of processes or resources, e.g. detecting the failure of a recording device, monitoring the downstream bandwidth, the number of times a movie has been viewed, the storage space available from the internal hard disk
Landscapes
- Engineering & Computer Science (AREA)
- Signal Processing (AREA)
- Multimedia (AREA)
- Computer Networks & Wireless Communication (AREA)
- Databases & Information Systems (AREA)
- Data Exchanges In Wide-Area Networks (AREA)
Abstract
提供一种流媒体故障监测方法及装置。该流媒体故障监测方法包括:获取流媒体传输链路中的多个维度中的当前维度的预设监控指标,其中,所述多个维度是按照所述流媒体传输链路中的最小业务实体和/或最小***维度划分的;基于预设监控指标检测流媒体传输链路中的异常;响应于检测到异常,获取传输出现异常的流媒体的流标识;基于所述流标识,对所述异常的根源的维度进行定位。根据本公开的流媒体故障监测方法及装置,可实现异常的根源的定位,提高了检测故障的准确性,进而便于快速排除故障。
Description
技术领域
本公开涉及互联网技术领域。更具体地,本公开涉及一种流媒体故障监测方法及装置。
背景技术
目前,直播服务过程中,直播端到端链路纵深较长。当上游某个环节出现异常后,往往会串行影响到下游各个环节。传统的消费侧告警,往往不具备直接暴露出问题模块和问题点的能力。如何在复杂网络场景下,为大规模用户提供低延迟、高流畅的直播服务质量,保障用户观看体验,成为了视频服务提供商重点考虑的问题。
发明内容
本公开的示例性实施例在于提供一种流媒体故障监测方法及装置,以至少解决相关技术中的流媒体故障监测的问题,也可不解决任何上述问题。
根据本公开的示例性实施例,提供一种流媒体故障监测方法,包括:获取流媒体传输链路中的多个维度中的当前维度的预设监控指标,其中,所述多个维度是按照所述流媒体传输链路中的最小业务实体和/或最小***维度划分的;基于预设监控指标检测流媒体传输链路中的异常;响应于检测到异常,获取传输出现异常的流媒体的流标识;基于所述流标识,对所述异常的根源的维度进行定位。
可选地,所述多个维度可基于业务发生的先后顺序进行排序,其中,排序在前的维度是排序在后的维度的上游维度。
可选地,对所述异常的根源的维度进行定位的步骤可包括:针对所述流标识,获取当前维度的至少一个上游维度的预设监控指标;基于所述至少一个上游维度的预设监控指标确定所述异常的根源的维度。
可选地,基于所述至少一个上游维度的预设监控指标确定所述异常的根源的维度的步骤可包括:基于所述至少一个上游维度的预设监控指标确定所述至少一个上游维度是否存在异常;将所述至少一个上游维度中的按照维度排序先后第一个存在异常的维度确定为所述异常的根源的维度。
可选地,对所述异常的根源的维度进行定位的步骤可包括:针对所述流标识,获取当前维度的预设上游维度的预设监控指标;基于预设游维度的预设监控指标确定所述异常的根源的维度。
可选地,基于预设游维度的预设监控指标确定所述异常的根源的维度的步骤可包括:基于预设上游维度的预设监控指标确定预设上游维度是否存在异常;响应于预设上游维度存在异常,将存在异常的预设上游维度确定为所述异常的根源的维度。
可选地,所述流媒体传输链路的所述多个维度可包括推流端、源站收流端、源站SRS、源站TSCODER和内容分发网络端中的至少一个。
可选地,基于预设监控指标检测流媒体传输链路中的异常的步骤可包括:将预设监控指标与预先确定的告警阈值进行比较;根据比较结果确定流媒体传输链路中是否存在异常。
可选地,所述流媒体故障监测方法还可包括:获取所述流媒体传输链路的各个维度的历史传输数据;基于历史传输数据计算所述流媒体传输链路的预设监控指标的历史数据;基于预设监控指标的历史数据确定预设监控指标的告警阈值。
可选地,预设监控指标可包括规模数据、异常状态码数据、异常事件数据中的至少一个。
可选地,异常可包括规模数据、异常状态码数据、异常事件数据中的至少一个的异常。
可选地,规模数据可包括推流房间数、源站接流集群房间数、源站接流集群房间人数、SRS推流数以及SRS拉流断开连接数中的至少一个,异常状态码数据可包括推流客户端错误率、源站接流集群错误率以及SRS错误率中的至少一个,异常事件数据可包括推流降级率、推流卡顿率、源站接流集群丢包率、缓存堆积情况以及回源卡顿率中的至少一个。
根据本公开的示例性实施例,提供一种流媒体故障监测装置,包括:数据获取单元,被配置为获取流媒体传输链路中的多个维度中的当前维度的预设监控指标,其中,所述多个维度是按照所述流媒体传输链路中的最小业务实体划分的;异常检测单元,被配置为基于预设监控指标检测流媒体传输链路中的异常;流标识获取单元,被配置为响应于检测到异常,获取传输出现异常的流媒体的流标识;和根源定位单元,被配置为基于所述流标识,对所述异常的根源的维度进行定位。
可选地,所述多个维度可基于业务发生的先后顺序进行排序,其中,排序在前的维度是排序在后的维度的上游维度。
可选地,根源定位单元可被配置为:针对所述流标识,获取当前维度的至少一个上游维度的预设监控指标;基于所述至少一个上游维度的预设监控指标确定所述异常的根源的维度。
可选地,根源定位单元可被配置为:基于所述至少一个上游维度的预设监控指标确定所述至少一个上游维度是否存在异常;将所述至少一个上游维度中的按照维度排序先后第一个存在异常的维度确定为所述异常的根源的维度。
可选地,根源定位单元可被配置为:针对所述流标识,获取当前维度的预设上游维度的预设监控指标;基于预设游维度的预设监控指标确定所述异常的根源的维度。
可选地,根源定位单元可被配置为:基于预设上游维度的预设监控指标确定预设上游维度是否存在异常;响应于预设上游维度存在异常,将存在异常的预设上游维度确定为所述异常的根源的维度。
可选地,所述流媒体传输链路的所述多个维度可包括推流端、源站收流端、源站SRS、源站TSCODER和内容分发网络端中的至少一个。
可选地,异常检测单元可被配置为:将预设监控指标与预先确定的告警阈值进行比较;根据比较结果确定流媒体传输链路中是否存在异常。
可选地,所述流媒体故障监测装置还可包括阈值确定单元,被配置为:获取所述流媒体传输链路的各个维度的历史传输数据;基于历史传输数据计算所述流媒体传输链路的预设监控指标的历史数据;基于预设监控指标的历史数据确定预设监控指标的告警阈值。
可选地,预设监控指标可包括规模数据、异常状态码数据、异常事件数据中的至少一个。
可选地,异常可包括规模数据、异常状态码数据、异常事件数据中的至少一个的异常。
可选地,规模数据可包括推流房间数、源站接流集群房间数、源站接流集群房间人数、SRS推流数以及SRS拉流断开连接数中的至少一个,异常状态码数据包括推流客户端错误率、源站接流集群错误率以及SRS错误率中的至少一个,异常事件数据包括推流降级率、推流卡顿率、源站接流集群丢包率、缓存堆积情况以及回源卡顿率中的至少一个。
根据本公开的示例性实施例,提供一种电子设备,包括:处理器;用于存储所述处理器可执行指令的存储器,所述处理器被配置为执行所述指令,以实现根据本公开的示例性实施例的流媒体故障监测方法。
根据本公开的示例性实施例,提供一种计算机可读存储介质,其上存储有计算机程序,当所述计算机程序被处理器执行时,实现根据本公开的示例性实施例的流媒体故障监测方法。
根据本公开的示例性实施例,提供一种计算机程序产品,该计算机程序产品中的指令可由计算机设备的处理器执行以完成根据本公开的示例性实施例的流媒体故障监测方法。
本公开的实施例提供的技术方案至少带来以下有益效果:
针对直播端到端全服务链路上,快速感知异常,并直接针对异常模块和问题点发出告警,从而直接省去问题定位时间,可针对告警信息,直接进行干预止损。
应当理解的是,以上的一般描述和后文的细节描述仅是示例性和解释性的,并不能限制本公开。
附图说明
此处的附图被并入说明书中并构成本说明书的一部分,示出了符合本公开的实施例,并与说明书一起用于解释本公开的原理,并不构成对本公开的不当限定。
图1示出根据本公开的示例性实施例的一种实施环境的示意图。
图2示出根据本公开的示例性实施例的流媒体故障监测方法的流程图。
图3示出示出根据本公开的示例性实施例的预设监控指标的历史状态曲线。
图4示出根据本公开的示例性实施例的流媒体故障监测装置的框图。
图5是根据本公开的示例性实施例的电子设备500的框图。
具体实施方式
为了使本领域普通人员更好地理解本公开的技术方案,下面将结合附图,对本公开实施例中的技术方案进行清楚、完整地描述。
需要说明的是,本公开的说明书和权利要求书及上述附图中的术语“第一”、“第二”等是用于区别类似的对象,而不必用于描述特定的顺序或先后次序。应该理解这样使用的数据在适当情况下可以互换,以便这里描述的本公开的实施例能够以除了在这里图示或描述的那些以外的顺序实施。以下实施例中所描述的实施方式并不代表与本公开相一致的所有实施方式。相反,它们仅是与如所附权利要求书中所详述的、本公开的一些方面相一致的装置和方法的例子。
在此需要说明的是,在本公开中出现的“若干项之中的至少一项”均表示包含“该若干项中的任意一项”、“该若干项中的任意多项的组合”、“该若干项的全体”这三类并列的情况。例如“包括A和B之中的至少一个”即包括如下三种并列的情况:(1)包括A;(2)包括B;(3)包括A和B。又例如“执行步骤一和步骤二之中的至少一个”,即表示如下三种并列的情况:(1)执行步骤一;(2)执行步骤二;(3)执行步骤一和步骤二。
由于直播链路纵深较长,因此当内容分发网络(Content Delivery Network,简称CDN)上游某个环节出现异常后,原有的简单归因能力,往往第一时间无法感知到问题点。问题排查需要逐级追溯,再到做出规避动作,需要消耗大量时间。
下面,将参照图1至图5具体描述根据本公开的示例性实施例的流媒体故障监测方法及装置。
图1示出根据本公开的示例性实施例的一种实施环境的示意图。参见图1,该实施环境中包括第一终端101、第二终端102、流媒体服务器103和电子设备104。
第一终端101和第二终端102分别与流媒体服务器103之间通过无线或者有线网络连接。并且,第一终端101和第二终端102上可以安装有流媒体服务器103提供服务的客户端。第一终端101和第二终端102对应的用户可以通过该客户端实现例如数据传输、消息交互等功能。客户端可以短视频客户端或者直播客户端等。
其中,第一终端101可以为发送流媒体的终端;第二终端102为接收流媒体的终端。例如,当客户端为直播客户端时,第一终端101为主播使用的终端;第二终端102为观众使用的终端。
需要说明的一点是,第一终端101和/或第二终端102上也可以不安装客户端,而是通过web(网络)端访问流媒体服务器103,从而实现例如数据传输、消息交互等功能。
在本公开的示例性实施例中,通过增加一个电子设备104,电子设备104分别与第一终端101、第二终端102和流媒体服务器103之间通过有线或者无线网络连接,从而通过电子设备104实现对第一终端101、第二终端102和流媒体服务器103的流媒体进行故障监测。
第一终端101和第二终端102均可以为电脑、手机、平板电脑或者其他电子设备。流媒体服务器103和可以为一台服务器,或者由若干服务器组成的服务器集群,或者是一个云计算服务中心。电子设备104可以为终端,也可以为服务器;在本公开的示例性实施例中,对电子设备104不作具体限定。
图2示出根据本公开的示例性实施例的流媒体故障监测方法的流程图。本公开中的流媒体故障监测方法可由电子设备执行。
参照图2,在步骤S201,获取流媒体传输链路中的多个维度中的当前维度的预设监控指标。这里,多个维度是按照流媒体传输链路(例如,直播端到端服务架构)中的最小业务实体和/或最小***维度划分的,以保障最小颗粒度模块的服务状态感知。表1示出根据本公开的示例性实施例的多个维度的示例。
表1
在本公开的示例性实施例中,流媒体传输链路的多个维度可包括推流端、源站收流端、源站SRS、源站TSCODER和内容分发网络(Content Delivery Network,简称CDN)端中的至少一个。
在本公开的示例性实施例中,所述多个维度基于业务发生的先后顺序进行排序,排序在前的维度是排序在后的维度的上游维度。
在本公开的示例性实施例中,预设监控指标包括规模数据、异常状态码数据、异常事件数据中的至少一个。规模数据是指各维度的实时服务规模,例如,但不限于,并发连接数,并发房间数等。状态码是程序的请求和响应中最基本且直观的特征,异常状态码用于直观指示状态的异常。异常事件数据是指对于不符合预期的异常事件和策略进行统计得到的时间,例如,但不限于,推流端的降级策略、重试策略、各环节或维度的卡顿等。在一个示例中,预设监控指标包括规模数据、异常状态码数据和异常事件数据。
在本公开的示例性实施例中,规模数据包括推流房间数、源站接流集群(MCU)房间数、源站接流集群房间人数、SRS推流数以及SRS拉流断开连接数中的至少一个。异常状态码数据包括推流客户端错误率、源站接流集群错误率以及SRS错误率中的至少一个。
异常事件数据包括推流降级率、推流卡顿率、源站接流集群丢包率、缓存堆积情况以及回源卡顿率中的至少一个。
具体来说,可针对流媒体传输链路中的各维度进行核心信息的实时数据上报、收集、运算,并且从中获取预设监控指标。例如,推流端的核心信息可包括推流端所在省份,还可以包括推流端所在的城市,还可以包括推流端所在的县区。在本申请实施例中,以推流端所在位置信息包括推流端所在省份为例进行说明。推流端的核心信息还可包括例如推流端的卡顿率、卡顿时长、网络延时、开播失败率、重试次数等中的一个或者多个质量参数。CDN端的核心信息可包括CDN厂商、域名、互联网服务提供商(Internet Service Provider,简称ISP)、省份、平台、版本等。
可通过获取推流端的第一流媒体日志(主播日志)、收流端的第二流媒体日志(观众日志)和源站SRS的第三流媒体日志(流媒体日志),分别从第一流媒体日志、第二流媒体日志和第三流媒体日志中获取核心信息的实时数据。
在本申请实施例中,电子设备通过获取到第一流媒体日志、第二流媒体日志和第三流媒体日志,这样能够获取多端数据,进而能够提高后续监测的准确性。
第一流媒体日志、第二流媒体日志和第三流媒体日志可分别包括实时日志和汇总日志。
在获取核心信息的实时数据后,可进行数据的收集,上报和汇总计算得到规模数据、异常状态码数据、异常事件数据等预设监控指标。在汇总计算时,可首先对数据进行清洗。
表2示出根据本公开的示例性实施例的各维度的预设监控指标的示例。
表2
在步骤S202,基于预设监控指标检测流媒体传输链路中的异常。
在本公开的示例性实施例中,在基于预设监控指标检测流媒体传输链路中的异常时,可首先将预设监控指标与预先确定的告警阈值进行比较,然后根据比较结果确定流媒体传输链路中是否存在异常。
在本公开的示例性实施例中,还可首先获取流媒体传输链路的各个维度的历史传输数据,然后基于历史传输数据计算流媒体传输链路的预设监控指标的历史数据,并且基于预设监控指标的历史数据确定预设监控指标的告警阈值。
图3示出示出根据本公开的示例性实施例的预设监控指标的历史状态曲线。作为示例,在确定预设监控指标的告警阈值时,可首先根据预设监控指标的历史数据,绘制各预设监控指标的如图3所示历史状态曲线;然后通过机器学习方式、人工标注方式等确定告警阈值。
在本公开的示例性实施例中,异常包括规模数据、异常状态码数据、异常事件数据中的至少一个的异常。
在步骤S203,响应于检测到异常,获取传输出现异常的流媒体的流标识。
在本公开的示例性实施例中,各维度的预设监控指标可以以流标识为基础进行串联。
在步骤S204,基于传输出现异常的流媒体的流标识,对异常的根源的维度进行定位。
在本公开的示例性实施例中,在对异常的根源的维度进行定位时,可首先针对输出现异常的流媒体的流标识,获取当前维度的至少一个上游维度的预设监控指标,然后基于所述至少一个上游维度的预设监控指标确定异常的根源的维度。
在本公开的示例性实施例中,在基于所述至少一个上游维度的预设监控指标确定异常的根源的维度时,可首先基于所述至少一个上游维度的预设监控指标确定所述至少一个上游维度是否存在异常,然后将所述至少一个上游维度中的按照维度排序先后第一个存在异常的维度确定为异常的根源的维度。
作为示例,当当前维度上游的第一维度不存在异常、第二维度存在异常、第三维度存在异常或者不存在异常时,将第二维度确定为异常的根源的维度。
在本公开的示例性实施例中,在对异常的根源的维度进行定位时,可首先针对输出现异常的流媒体的流标识,获取当前维度的预设上游维度的预设监控指标,然后基于预设上游维度的预设监控指标确定异常的根源的维度。
在本公开的示例性实施例中,在基于预设游维度的预设监控指标确定所述异常的根源的维度时,可首先基于预设上游维度的预设监控指标确定预设上游维度是否存在异常,然后响应于预设上游维度存在异常,将存在异常的预设上游维度确定为所述异常的根源的维度。
作为示例,如果基于预设监控指标检测流媒体传输链路中的SRS卡顿率突增,则获取贡献卡顿的流标识,根据流标识来统计源站收流端维度和推流端维度的各预设监控指标。如果推流端维度的预设监控指标异常,则确定出异常的根源(例如,推流卡顿率异常),并且最终给出关于“异常的根源”的告警信息。如果源站收流端维度和推流端维度的预设监控指标无异常,则输出关于“SRS卡顿率突增”的告警信息。
作为示例,如果SRS有3路流检测到卡顿异常,则首先记录卡顿异常的3路流的名称:A路流、B路流、C路流。然后,根据推流架构向上游检测:先检测A路流、B路流、C路流在源站接流集群模块是否上报了卡顿或异常,若没有上报卡顿和异常则发送SRS卡顿告警,若上报了卡顿或异常,则继续向上游检测推流客户端是否上报卡顿或异常;若推流客户端上报了卡顿或异常则,发出推流客户端卡顿异常告警,若推流客户端没有上报卡顿和异常则发出源站接流集群异常告警。
以上已经结合图1至图3对根据本公开的示例性实施例的流媒体故障监测方法进行了描述。在下文中,将参照图4对根据本公开的示例性实施例的流媒体故障监测装置及其单元进行描述。
图4示出根据本公开的示例性实施例的流媒体故障监测装置的框图。
参照图4,流媒体故障监测装置包括数据获取单元41、异常检测单元42、流标识获取单元43和根源定位单元44。
数据获取单元41被配置为获取流媒体传输链路中的多个维度中的当前维度的预设监控指标,其中,所述多个维度是按照流媒体传输链路中的最小业务实体划分的。
在本公开的示例性实施例中,流媒体传输链路的所述多个维度可包括推流端、源站收流端、源站SRS、源站TSCODER和CDN端中的至少一个。
在本公开的示例性实施例中,所述多个维度可基于业务发生的先后顺序进行排序,其中,排序在前的维度是排序在后的维度的上游维度。
在本公开的示例性实施例中,预设监控指标可包括规模数据、异常状态码数据和异常事件数据中的至少一个。在一个示例中,预设监控指标包括规模数据、异常状态码数据和异常事件数据。
异常检测单元42被配置为基于预设监控指标检测流媒体传输链路中的异常。
在本公开的示例性实施例中,异常检测单元42可被配置为:将预设监控指标与预先确定的告警阈值进行比较;根据比较结果确定流媒体传输链路中是否存在异常。
在本公开的示例性实施例中,流媒体故障监测装置还可包括阈值确定单元(未示出),被配置为:获取流媒体传输链路的各个维度的历史传输数据;基于历史传输数据计算流媒体传输链路的预设监控指标的历史数据;基于预设监控指标的历史数据确定预设监控指标的告警阈值。
在本公开的示例性实施例中,异常可包括规模数据、异常状态码数据、异常事件数据中的至少一个的异常。
在本公开的示例性实施例中,规模数据包括推流房间数、源站接流集群房间数、源站接流集群房间人数、SRS推流数以及SRS拉流断开连接数中的至少一个。异常状态码数据包括推流客户端错误率、源站接流集群错误率以及SRS错误率中的至少一个。异常事件数据包括推流降级率、推流卡顿率、源站接流集群丢包率、缓存堆积情况以及回源卡顿率中的至少一个。
流标识获取单元43被配置为响应于检测到异常,获取传输出现异常的流媒体的流标识。
根源定位单元44被配置为基于传输出现异常的流媒体的流标识,对异常的根源的维度进行定位。
在本公开的示例性实施例中,根源定位单元44可被配置为:针对传输出现异常的流媒体的流标识,获取当前维度的至少一个上游维度的预设监控指标;基于所述至少一个上游维度的预设监控指标确定异常的根源的维度。
在本公开的示例性实施例中,根源定位单元44可被配置为:基于所述至少一个上游维度的预设监控指标确定所述至少一个上游维度是否存在异常;将所述至少一个上游维度中的按照维度排序先后第一个存在异常的维度确定为所述异常的根源的维度。
在本公开的示例性实施例中,根源定位单元44可被配置为:针对所述流标识,获取当前维度的预设上游维度的预设监控指标;基于预设游维度的预设监控指标确定所述异常的根源的维度。
在本公开的示例性实施例中,根源定位单元44可被配置为:基于预设上游维度的预设监控指标确定预设上游维度是否存在异常;响应于预设上游维度存在异常,将存在异常的预设上游维度确定为所述异常的根源的维度。
以上已经结合图4对根据本公开的示例性实施例的流媒体故障监测装置进行了描述。接下来,结合图5对根据本公开的示例性实施例的电子设备进行描述。
图5是根据本公开的示例性实施例的电子设备500的框图。
参照图5,电子设备500包括至少一个存储器501和至少一个处理器502,所述至少一个存储器501中存储有计算机可执行指令集合,当计算机可执行指令集合被至少一个处理器502执行时,执行根据本公开的示例性实施例的流媒体故障监测的方法。
作为示例,电子设备500可以是PC计算机、平板装置、个人数字助理、智能手机、或其他能够执行上述指令集合的装置。这里,电子设备500并非必须是单个的电子设备,还可以是任何能够单独或联合执行上述指令(或指令集)的装置或电路的集合体。电子设备500还可以是集成控制***或***管理器的一部分,或者可被配置为与本地或远程(例如,经由无线传输)以接口互联的便携式电子设备。
在电子设备500中,处理器502可包括中央处理器(CPU)、图形处理器(GPU)、可编程逻辑装置、专用处理器***、微控制器或微处理器。作为示例而非限制,处理器还可包括模拟处理器、数字处理器、微处理器、多核处理器、处理器阵列、网络处理器等。
处理器502可运行存储在存储器501中的指令或代码,其中,存储器901还可以存储数据。指令和数据还可经由网络接口装置而通过网络被发送和接收,其中,网络接口装置可采用任何已知的传输协议。
存储器501可与处理器502集成为一体,例如,将RAM或闪存布置在集成电路微处理器等之内。此外,存储器501可包括独立的装置,诸如,外部盘驱动、存储阵列或任何数据库***可使用的其他存储装置。存储器501和处理器502可在操作上进行耦合,或者可例如通过I/O端口、网络连接等互相通信,使得处理器502能够读取存储在存储器中的文件。
此外,电子设备500还可包括视频显示器(诸如,液晶显示器)和用户交互接口(诸如,键盘、鼠标、触摸输入装置等)。电子设备500的所有组件可经由总线和/或网络而彼此连接。
根据本公开的示例性实施例,还可提供一种存储指令的计算机可读存储介质,其中,当指令被至少一个处理器运行时,促使至少一个处理器执行根据本公开的流媒体故障监测的方法。这里的计算机可读存储介质的示例包括:只读存储器(ROM)、随机存取可编程只读存储器(PROM)、电可擦除可编程只读存储器(EEPROM)、随机存取存储器(RAM)、动态随机存取存储器(DRAM)、静态随机存取存储器(SRAM)、闪存、非易失性存储器、CD-ROM、CD-R、CD+R、CD-RW、CD+RW、DVD-ROM、DVD-R、DVD+R、DVD-RW、DVD+RW、DVD-RAM、BD-ROM、BD-R、BD-RLTH、BD-RE、蓝光或光盘存储器、硬盘驱动器(HDD)、固态硬盘(SSD)、卡式存储器(诸如,多媒体卡、安全数字(SD)卡或极速数字(XD)卡)、磁带、软盘、磁光数据存储装置、光学数据存储装置、硬盘、固态盘以及任何其他装置,所述任何其他装置被配置为以非暂时性方式存储计算机程序以及任何相关联的数据、数据文件和数据结构并将所述计算机程序以及任何相关联的数据、数据文件和数据结构提供给处理器或计算机使得处理器或计算机能执行所述计算机程序。上述计算机可读存储介质中的计算机程序可在诸如客户端、主机、代理装置、服务器等计算机设备中部署的环境中运行,此外,在一个示例中,计算机程序以及任何相关联的数据、数据文件和数据结构分布在联网的计算机***上,使得计算机程序以及任何相关联的数据、数据文件和数据结构通过一个或多个处理器或计算机以分布式方式存储、访问和执行。
根据本公开的示例性实施例,还可提供一种计算机程序产品,该计算机程序产品中的指令可由计算机设备的处理器执行以完成根据本公开的示例性实施例的流媒体故障监测的方法。
以上已参照图1至图5描述了根据本公开的示例性实施例的流媒体故障监测方法及装置。然而,应该理解的是:图4中所示的流媒体故障监测装置及其单元可分别被配置为执行特定功能的软件、硬件、固件或上述项的任意组合,图5中所示的电子设备并不限于包括以上示出的组件,而是可根据需要增加或删除一些组件,并且以上组件也可被组合。
根据本公开的流媒体故障监测方法及装置,通过获取流媒体传输链路中的多个维度中的当前维度的预设监控指标,其中,所述多个维度是按照所述流媒体传输链路中的最小业务实体和/或最小***维度划分的,基于预设监控指标检测流媒体传输链路中的异常,响应于检测到异常,获取传输出现异常的流媒体的流标识,基于所述流标识,对所述异常的根源的维度进行定位,从而实现异常的根源的定位,提高了检测故障的准确性,进而便于快速排除故障。
本领域技术人员在考虑说明书及实践这里公开的发明后,将容易想到本公开的其它实施方案。本申请旨在涵盖本公开的任何变型、用途或者适应性变化,这些变型、用途或者适应性变化遵循本公开的一般性原理并包括本公开未公开的本技术领域中的公知常识或惯用技术手段。说明书和实施例仅被视为示例性的,本公开的真正范围和精神由下面的权利要求指出。
应当理解的是,本公开并不局限于上面已经描述并在附图中示出的精确结构,并且可以在不脱离其范围进行各种修改和改变。本公开的范围仅由所附的权利要求来限制。
Claims (24)
1.一种流媒体故障监测方法,其特征在于,包括:
获取流媒体传输链路中的多个维度中的当前维度的预设监控指标,其中,所述多个维度是按照所述流媒体传输链路中的最小业务实体和/或最小***维度划分的;
基于获取的预设监控指标检测流媒体传输链路中的异常;
响应于检测到异常,获取传输出现异常的流媒体的流标识;
基于所述流标识,对所述异常的根源的维度进行定位,
其中,对所述异常的根源的维度进行定位的步骤包括:
针对所述流标识,获取当前维度的至少一个上游维度的预设监控指标;
基于所述至少一个上游维度的预设监控指标确定所述异常的根源的维度。
2.根据权利要求1所述的流媒体故障监测方法,其特征在于,所述多个维度基于业务发生的先后顺序进行排序,其中,排序在前的维度是排序在后的维度的上游维度。
3.根据权利要求1所述的流媒体故障监测方法,其特征在于,基于所述至少一个上游维度的预设监控指标确定所述异常的根源的维度的步骤包括:
基于所述至少一个上游维度的预设监控指标确定所述至少一个上游维度是否存在异常;
将所述至少一个上游维度中的按照维度排序先后第一个存在异常的维度确定为所述异常的根源的维度。
4.根据权利要求1所述的流媒体故障监测方法,其特征在于,对所述异常的根源的维度进行定位的步骤包括:
针对所述流标识,获取当前维度的预设上游维度的预设监控指标;
基于预设上游维度的预设监控指标确定所述异常的根源的维度。
5.根据权利要求4所述的流媒体故障监测方法,其特征在于,基于预设游维度的预设监控指标确定所述异常的根源的维度的步骤包括:
基于预设上游维度的预设监控指标确定预设上游维度是否存在异常;
响应于预设上游维度存在异常,将存在异常的预设上游维度确定为所述异常的根源的维度。
6.根据权利要求1所述的流媒体故障监测方法,其特征在于,所述流媒体传输链路的所述多个维度包括推流端、源站收流端、源站SRS、源站TSCODER和内容分发网络CDN端中的至少一个。
7.根据权利要求1所述的流媒体故障监测方法,其特征在于,基于预设监控指标检测流媒体传输链路中的异常的步骤包括:
将预设监控指标与预先确定的告警阈值进行比较;
根据比较结果确定流媒体传输链路中是否存在异常。
8.根据权利要求7所述的流媒体故障监测方法,其特征在于,还包括:
获取所述流媒体传输链路的各个维度的历史传输数据;
基于历史传输数据计算所述流媒体传输链路的预设监控指标的历史数据;
基于预设监控指标的历史数据确定预设监控指标的告警阈值。
9.根据权利要求1所述的流媒体故障监测方法,其特征在于,预设监控指标包括规模数据、异常状态码数据、异常事件数据中的至少一个。
10.根据权利要求9所述的流媒体故障监测方法,其特征在于,异常包括规模数据、异常状态码数据、异常事件数据中的至少一个的异常。
11.根据权利要求9所述的流媒体故障监测方法,其特征在于,
规模数据包括推流房间数、源站接流集群房间数、源站接流集群房间人数、SRS推流数以及SRS拉流断开连接数中的至少一个,
异常状态码数据包括推流客户端错误率、源站接流集群错误率以及SRS错误率中的至少一个,
异常事件数据包括推流降级率、推流卡顿率、源站接流集群丢包率、缓存堆积情况以及回源卡顿率中的至少一个。
12.一种流媒体故障监测装置,其特征在于,包括:
数据获取单元,被配置为获取流媒体传输链路中的多个维度中的当前维度的预设监控指标,其中,所述多个维度是按照所述流媒体传输链路中的最小业务实体划分的;
异常检测单元,被配置为基于获取的预设监控指标检测流媒体传输链路中的异常;
流标识获取单元,被配置为响应于检测到异常,获取传输出现异常的流媒体的流标识;和
根源定位单元,被配置为基于所述流标识,对所述异常的根源的维度进行定位,
其中,根源定位单元被配置为:
针对所述流标识,获取当前维度的至少一个上游维度的预设监控指标;
基于所述至少一个上游维度的预设监控指标确定所述异常的根源的维度。
13.根据权利要求12所述的流媒体故障监测装置,其特征在于,所述多个维度基于业务发生的先后顺序进行排序,其中,排序在前的维度是排序在后的维度的上游维度。
14.根据权利要求12所述的流媒体故障监测装置,其特征在于,根源定位单元被配置为:
基于所述至少一个上游维度的预设监控指标确定所述至少一个上游维度是否存在异常;
将所述至少一个上游维度中的按照维度排序先后第一个存在异常的维度确定为所述异常的根源的维度。
15.根据权利要求12所述的流媒体故障监测装置,其特征在于,根源定位单元被配置为:
针对所述流标识,获取当前维度的预设上游维度的预设监控指标;
基于预设游维度的预设监控指标确定所述异常的根源的维度。
16.根据权利要求15所述的流媒体故障监测装置,其特征在于,根源定位单元被配置为:
基于预设上游维度的预设监控指标确定预设上游维度是否存在异常;
响应于预设上游维度存在异常,将存在异常的预设上游维度确定为所述异常的根源的维度。
17.根据权利要求12所述的流媒体故障监测装置,其特征在于,所述流媒体传输链路的所述多个维度包括推流端、源站收流端、源站SRS、源站TSCODER和CDN端中的至少一个。
18.根据权利要求12所述的流媒体故障监测装置,其特征在于,异常检测单元被配置为:
将预设监控指标与预先确定的告警阈值进行比较;
根据比较结果确定流媒体传输链路中是否存在异常。
19.根据权利要求18所述的流媒体故障监测装置,其特征在于,还包括阈值确定单元,被配置为:
获取所述流媒体传输链路的各个维度的历史传输数据;
基于历史传输数据计算所述流媒体传输链路的预设监控指标的历史数据;
基于预设监控指标的历史数据确定预设监控指标的告警阈值。
20.根据权利要求12所述的流媒体故障监测装置,其特征在于,预设监控指标包括规模数据、异常状态码数据、异常事件数据中的至少一个。
21.根据权利要求20所述的流媒体故障监测装置,其特征在于,异常包括规模数据、异常状态码数据、异常事件数据中的至少一个的异常。
22.根据权利要求20所述的流媒体故障监测装置,其特征在于,规模数据包括推流房间数、源站接流集群房间数、源站接流集群房间人数、SRS推流数以及SRS拉流断开连接数中的至少一个,
异常状态码数据包括推流客户端错误率、源站接流集群错误率以及SRS错误率中的至少一个,
异常事件数据包括推流降级率、推流卡顿率、源站接流集群丢包率、缓存堆积情况以及回源卡顿率中的至少一个。
23.一种电子设备,其特征在于,包括:
处理器;
用于存储所述处理器可执行指令的存储器;
其中,所述处理器被配置为执行所述指令,以实现如权利要求1至11中任一项所述的流媒体故障监测方法。
24.一种计算机可读存储介质,存储有计算机程序,其特征在于,当所述计算机程序被电子设备的处理器执行时,使得电子设备执行如权利要求1至11中任一项所述的流媒体故障监测方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110103914.0A CN112954372B (zh) | 2021-01-26 | 2021-01-26 | 流媒体故障监测方法及装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110103914.0A CN112954372B (zh) | 2021-01-26 | 2021-01-26 | 流媒体故障监测方法及装置 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN112954372A CN112954372A (zh) | 2021-06-11 |
CN112954372B true CN112954372B (zh) | 2022-08-26 |
Family
ID=76237038
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202110103914.0A Active CN112954372B (zh) | 2021-01-26 | 2021-01-26 | 流媒体故障监测方法及装置 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN112954372B (zh) |
Families Citing this family (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN113840153A (zh) * | 2021-08-27 | 2021-12-24 | 云智联网络科技(北京)有限公司 | 一种手机开播兼容多种obs推流的方法和*** |
CN113747188A (zh) * | 2021-09-03 | 2021-12-03 | 百果园技术(新加坡)有限公司 | 一种视频直播质量的链路监控***及方法 |
Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN107241595A (zh) * | 2017-07-14 | 2017-10-10 | 北京奇艺世纪科技有限公司 | 一种视频故障监控方法、装置、***及电子设备 |
CN110784355A (zh) * | 2019-10-30 | 2020-02-11 | 网宿科技股份有限公司 | 一种故障识别方法及装置 |
CN111106962A (zh) * | 2019-12-24 | 2020-05-05 | 北京达佳互联信息技术有限公司 | 流媒体故障监测方法、装置、电子设备及存储介质 |
CN111918055A (zh) * | 2020-06-30 | 2020-11-10 | 上海艾策通讯科技股份有限公司 | 视频质量异常定位方法、装置、存储介质及电子设备 |
WO2021017364A1 (zh) * | 2019-07-26 | 2021-02-04 | 京信通信***(中国)有限公司 | 一种网络故障诊断方法、装置、网络设备及存储介质 |
-
2021
- 2021-01-26 CN CN202110103914.0A patent/CN112954372B/zh active Active
Patent Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN107241595A (zh) * | 2017-07-14 | 2017-10-10 | 北京奇艺世纪科技有限公司 | 一种视频故障监控方法、装置、***及电子设备 |
WO2021017364A1 (zh) * | 2019-07-26 | 2021-02-04 | 京信通信***(中国)有限公司 | 一种网络故障诊断方法、装置、网络设备及存储介质 |
CN110784355A (zh) * | 2019-10-30 | 2020-02-11 | 网宿科技股份有限公司 | 一种故障识别方法及装置 |
CN111106962A (zh) * | 2019-12-24 | 2020-05-05 | 北京达佳互联信息技术有限公司 | 流媒体故障监测方法、装置、电子设备及存储介质 |
CN111918055A (zh) * | 2020-06-30 | 2020-11-10 | 上海艾策通讯科技股份有限公司 | 视频质量异常定位方法、装置、存储介质及电子设备 |
Also Published As
Publication number | Publication date |
---|---|
CN112954372A (zh) | 2021-06-11 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US8850263B1 (en) | Streaming and sampling in real-time log analysis | |
US9049105B1 (en) | Systems and methods for tracking and managing event records associated with network incidents | |
US10048995B1 (en) | Methods and apparatus for improved fault analysis | |
US8671193B2 (en) | Third party verification using override IP addresses | |
CN113242443B (zh) | 数据流传输的异常检测方法及其装置 | |
CN112954372B (zh) | 流媒体故障监测方法及装置 | |
US9887951B2 (en) | Graphing relative health of virtualization servers | |
JP6160064B2 (ja) | 適用判定プログラム、障害検出装置および適用判定方法 | |
US9658908B2 (en) | Failure symptom report device and method for detecting failure symptom | |
US20200341868A1 (en) | System and Method for Reactive Log Spooling | |
CN112702198B (zh) | 异常根因定位方法、装置、电子设备及存储介质 | |
US10645103B2 (en) | Monitoring for hybrid applications | |
US20170351560A1 (en) | Software failure impact and selection system | |
CN112152823A (zh) | 网站运行错误监控方法、装置及计算机存储介质 | |
US10599505B1 (en) | Event handling system with escalation suppression | |
CN106844114A (zh) | 接口测试稳定性的监控方法及装置 | |
CN113495820B (zh) | 异常信息收集、处理方法和装置以及异常监控*** | |
TWI757169B (zh) | 用於實時分析虛擬伺服器記錄的電腦實施系統以及方法 | |
CN113656247A (zh) | 一种服务监控方法、装置、电子设备及可读存储介质 | |
CN102546205A (zh) | 一种故障关系生成及故障确定方法及装置 | |
US20130179569A1 (en) | Systems and methods for gateway status information handling | |
CN107066373B (zh) | 控制处理方法及装置 | |
CN112135199B (zh) | 基于多类型视频源的视频播放方法及相关设备 | |
CN111106962B (zh) | 流媒体故障监测方法、装置、电子设备及存储介质 | |
CN113254313A (zh) | 一种监控指标异常检测方法、装置、电子设备及存储介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |