CN113542203B

CN113542203B - 一种视频业务dpi识别方法及服务器

Info

Publication number: CN113542203B
Application number: CN202010319335.5A
Authority: CN
Inventors: 王捷; 马红艳
Original assignee: China Mobile Communications Group Co Ltd; China Mobile Group Guizhou Co Ltd
Current assignee: China Mobile Communications Group Co Ltd; China Mobile Group Guizhou Co Ltd
Priority date: 2020-04-21
Filing date: 2020-04-21
Publication date: 2022-06-28
Anticipated expiration: 2040-04-21
Also published as: CN113542203A

Abstract

本发明实施例公开了一种视频业务DPI识别方法及服务器，用于解决现有的视频业务DPI识别方法无法对用户访问的视频业务内容进行精准识别的问题，该方法包括：根据目标视频业务的拨测配置参数，获取所述目标视频业务在执行过程中用户所需的视频截图；识别所述视频截图，并将所述视频截图对应的第一视频内容信息回填至通过拨测获取的第一XDR数据中；根据所述第一XDR数据确定特征码信息，并将所述第一视频内容信息与预先采集的第二XDR数据进行关联；将所述第一视频内容信息回填至所述第二XDR数据中；根据回填后的第二XDR数据，生成用户的目标视频业务对应的视频用户画像，从而实现对用户访问的视频业务内容进行精准识别。

Description

一种视频业务DPI识别方法及服务器

技术领域

本发明实施例涉及视频识别技术领域，尤其涉及一种视频业务DPI识别方法及服务器。

背景技术

现有技术主要通过DPI深度包解析技术，针对网络会话报文进行解析，通过分析报文内容、url、contentdata、cookie、useragent、hostname等信息分析实际会话内容，分析访问的业务名称、类型具体为：

1、host域名解析：通过DPI深度包解析技术提取会话中的hostname域名，并结合域名业务静态库列表与域名进行匹配，分析出用户访问视频站点的应用名称、具体的视频类别等信息，如v.qq.com域名识别为大类视频类业务，业务小类是腾讯视频。

2、URL提取解析：通过DPI深度包解析技术提取会话中的URI信息，再同hostname域名或SPIP用户访问的目的IP结合，拼接成用户实际在浏览器中输入或点击链接后跳转到页面的全部链接地址即URL，并根据URL特征库，对用户访问的URL进行匹配，识别具体的一些应用分类小类信息。

3、Useragent识别：通过DPI深度包解析技术提取会话中的Useragent信息，并结合已有的Useragent特征库信息，对用户实际访问视频内容过程中所使用的浏览器、终端设备信息进行识别，从而确认应用业务小类，例如Useragent内容为MagicBox_M13或MiBOX3的设备，我们识别为小米盒子

当前DPI话单只能识别到用户使用了那种类型的视频应用软件，并不知道用户实际在使用视频软件过程中观看了哪些视频内容，无法对用户访问的视频业务内容进行精准识别。

发明内容

本发明实施例提供一种视频业务DPI识别方法及服务器，用于解决现有的视频业务DPI识别方法无法对用户访问的视频业务内容进行精准识别的问题。

本发明实施例采用下述技术方案：

第一方面，提供了一种视频业务DPI识别方法，所述方法包括：

根据目标视频业务的拨测配置参数，获取所述目标视频业务在执行过程中用户所需的视频截图；

识别所述视频截图，并将所述视频截图对应的第一视频内容信息回填至通过拨测获取的第一XDR数据中；

根据所述第一XDR数据确定特征码信息，并将所述第一视频内容信息与预先采集的第二XDR数据进行关联；

将所述第一视频内容信息回填至所述第二XDR数据中；

根据回填后的第二XDR数据，生成用户的目标视频业务对应的视频用户画像。

第二方面，提供了一种服务器，所述服务器包括：

获取模块，用于根据目标视频业务的拨测配置参数，获取所述目标视频业务在执行过程中用户所需的视频截图；

识别并回填模块，用于识别所述视频截图，并将所述视频截图对应的第一视频内容信息回填至通过拨测获取的第一XDR数据中；

关联模块，用于根据所述第一XDR数据确定特征码信息，并将所述第一视频内容信息与预先采集的第二XDR数据进行关联；

回填模块，用于将所述第一视频内容信息回填至所述第二XDR数据中；

生成模块，用于根据回填后的第二XDR数据，生成用户的目标视频业务对应的视频用户画像。

第三方面，提供了一种服务器，包括：存储器，存储有计算机程序指令；

处理器，当所述计算机程序被所述处理器执行时实现如上述所述的视频业务DPI识别方法。

第四方面，提供了一种计算机可读存储介质，所述计算机可读存储介质包括指令，当所述指令在计算机上运行时，使得计算机执行时实现如上述所述的视频业务DPI识别方法。

本发明实施例采用的上述至少一个技术方案能够达到以下有益效果：

本发明实施例中，根据目标视频业务的拨测配置参数，获取目标视频业务在执行过程中用户所需的视频截图，识别视频截图并将视频截图对应的第一视频内容信息回填至通过拨测获取的第一XDR数据中，以通过智能机器人进行拨测、拨测的同时对镜像流量进行DPI解析，采用机器学习和深度神经元网络的技术，识别原始码流中的特征码，生成带有特征码和业务识别的第一XDR数据；根据第一XDR数据确定特征码信息，并将第一视频内容信息与预先采集的第二XDR数据进行关联；将第一视频内容信息回填至第二XDR数据中，实现对视频业务除大小类业务类型外，视频内容的识别和回填；根据回填后的第二XDR数据，生成用户的目标视频业务对应的视频用户画像，从而实现对用户访问的视频业务内容进行精准识别。

附图说明

此处所说明的附图用来提供对本申请的进一步理解，构成本申请的一部分，本申请的示意性实施例及其说明用于解释本申请，并不构成对本申请的不当限定。在附图中：

图1为本说明书的一个实施例提供的视频业务DPI识别方法流程示意图；

图2为本说明书的一个实施例提供的视频业务DPI识别方法的实际应用场景示意图之一；

图3为本说明书的一个实施例提供的视频业务DPI识别方法的实际应用场景示意图之二；

图4为本说明书的一个实施例提供的视频业务DPI识别方法的实际应用场景示意图之三；

图5为本说明书的一个实施例提供的视频业务DPI识别方法的实际应用场景示意图之四；

图6为本说明书的一个实施例提供的视频业务DPI识别方法的实际应用场景示意图之五；

图7为本说明书的一个实施例提供的服务器结构示意图之一；

图8为本说明书一个实施例提供的服务器结构示意图之二。

具体实施方式

为使本申请的目的、技术方案和优点更加清楚，下面将结合本说明书具体实施例及相应的附图对本申请技术方案进行清楚、完整地描述。显然，所描述的实施例仅是本申请一部分实施例，而不是全部的实施例。基于本说明书中的实施例，本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例，都属于本申请保护的范围。

本发明实施例提供一种视频业务DPI识别方法及服务器，以解决现有的视频业务DPI识别方法无法对用户访问的视频业务内容进行精准识别的问题。本发明实施例提供一种视频业务DPI识别方法，该方法的执行主体，可以但不限于应用程序、服务器或能够被配置为执行本发明实施例提供的该方法的装置或***。

为便于描述，下文以该方法的执行主体为能够执行该方法的服务器为例，对该方法的实施方式进行介绍。可以理解，该方法的执行主体为服务器只是一种示例性的说明，并不应理解为对该方法的限定。

图1为本发明实施例提供的视频业务DPI识别方法的流程图，图1的方法可以由服务器执行，如图1所示，该方法可以包括：

步骤110、根据目标视频业务的拨测配置参数，获取所述目标视频业务在执行过程中用户所需的视频截图。

本步骤具体可实现为，根据目标视频业务的拨测配置参数，获取目标视频业务在执行过程中产生的监测信息，以截取该指定时间对应的图像，并根据拨测配置参数控制所截取的图像生成用户所需的视频截图。

示例性的，如图2所示构建智能机器人拨测平台，通过拨测平台，控制各个节点上部署的智能机器人，如包括：机顶盒拨测机器人、手机应用APP拨测机器人和互联网web站点爬虫拨测机器人，通过拨测平台远程控制拨测机器人进行视频拨测、记录、识别和数据上传工作。

其中，智能机器人内部可以包含图像处理模块、交互控制模块、文字视频图片链接收集模块、点击分析决策模块、流程学习模块等。

步骤120、识别所述视频截图，并将所述视频截图对应的第一视频内容信息回填至通过拨测获取的第一XDR数据中。

如图3所示，在智能机器人拨测过程中，采用人工智能机器学习技术和OCR图像识别技术，进行图片、视频到文本文字的转化工作，其中，图像识别运用了深度学习算法，将图片、视频截图中的文字内容，识别并写入到本地磁盘中来，并进行准确性处理和信息内容的标准化、格式化处理，以得到第一视频内容信息，该第一视频内容信息包括视频名称和视频播放时间段。

本步骤具体可实现为，将所述第一视频内容信息中的视频名称和视频播放时间段回填至通过拨测获取的第一XDR数据中。

步骤130、根据所述第一XDR数据确定特征码信息，并将所述第一视频内容信息与预先采集的第二XDR数据进行关联。

其中，该预先采集的第二XDR数据为全量的XDR数据。

本步骤中，根据所述第一XDR数据确定特征码信息具体可实现为：

将所述第一XDR数据中所述目标视频业务对应的每条播放记录信息作为特征码提取模型的输入，输出所述特征码信息。

本步骤具体可实现为：将所述第一XDR数据中所述目标视频业务对应的多条播放信息均转换成字符串；其中，每条播放信息中均包含网址URL、特征信息字段、字符串Useragent、域名hostname、视频源uri等信息。

将每条播放信息对应的字符串作为所述特征码提取模型中第i匹配层级中各节点的输入，输出所述第i匹配层级中各节点对应的第i匹配信息，所述第i匹配层级采用正则匹配运算进行信息匹配，i为大于0的正整数；

将所述第i匹配层级中各节点对应的第i匹配信息作为第i+1匹配层级中各节点的输入，输出所述第i+1匹配层级中各节点对应的第i+1匹配信息，所述第i+1匹配层级采用正则匹配运算进行信息匹配；

当i+1为n时，将第n匹配层级中各节点对应的第n匹配信息，组成所述特征码信息，n为大于等于i的正整数。

示例1，如图4所示的特征码提取模型对应的深度神经元网络的结构示意图，其中，input layer/hidden layer1/hidden layer2/hidden layer3/output layer为匹配层级，结合图5所示，假设一条播放信息的网址URL、特征信息字段、字符串Useragent、域名hostname、视频源uri等信息转换成如下字符串：

Usdsdf6sf134/MagicBox_M13/data.video.ptgy.gitv.tv/video/v0/20181214/cb/4f/918d30010c793d922d1198ce8595db2e.265ts？uid＝214753815719424&session＝sdkfksdjfi231，作为特征码提取模型中第i匹配层级中各节点的输入。

第i匹配层级中各节点的表达式为：

aⁱ ₁＝σ(zⁱ ₁)＝σ(wⁱ ₁₁x₁ regrex wⁱ ₁₂x₂regrex wⁱ ₁₃x₃regrex bⁱ ₁)

aⁱ ₂＝σ(zⁱ ₂)＝σ(wⁱ ₂₁x₁ regrex wⁱ ₂₂x₂ regrex wⁱ ₂₃x₃ regrex bⁱ ₂)

aⁱ ₃＝σ(z² ₃)＝σ(wⁱ ₃₁x₁ regrex wⁱ ₃₂x₂ regrex wⁱ ₃₃x₃ regrex bⁱ ₃)

Aⁱ⁺¹ ₁＝σ(zⁱ⁺¹ ₁)＝σ(wⁱ⁺¹ ₁₁aⁱ ₁regrex wⁱ⁺¹ ₁₂aⁱ ₂ regrex wⁱ⁺¹ ₁₃aⁱ ₃ regrex bⁱ⁺¹ ₁)

aⁱ⁺¹ ₂＝σ(zⁱ⁺¹ ₂)＝σ(wⁱ⁺¹ ₁₁aⁱ ₁ regrex wⁱ⁺¹ ₁₂aⁱ ₂ regrex wⁱ⁺¹ ₁₃aⁱ ₃ regrex bⁱ⁺¹ ₁)

aⁱ⁺¹ ₃＝σ(zⁱ⁺¹ ₃)＝σ(wⁱ⁺¹ ₁₁aⁱ ₁ regrex wⁱ⁺¹ ₁₂aⁱ ₂ regrex wⁱ⁺¹ ₁₃aⁱ ₃ regrex bⁱ⁺¹ ₁)

……

其中，regrex为正则匹配运算，W为系数。

经过n级匹配，最终的匹配信息为：

aⁿ ₁＝MagicBox_M13，

aⁿ ₂＝data.video.ptgy.gitv.tv，

aⁿ ₃＝video，

aⁿ ₄＝20181214，

aⁿ ₅＝cb，

aⁿ ₆＝4f

……

故，最终得到的特征码信息为：

MagicBox_M13/data.video.ptgy.gitv.tv/video/20181214/cb/4f/

本步骤中，将所述第一视频内容信息与预先采集的第二XDR数据进行关联具体可实现为：确定所述特征码信息是否与所述预先采集的第二XDR数据中的特征字段匹配；若匹配，则根据所述特征码信息将所述第一视频内容信息与预先采集的第二XDR数据进行关联。

步骤140、将所述第一视频内容信息回填至所述第二XDR数据中。

本步骤具体可实现为，将所述第一视频内容信息中的视频类型、视频源和视频名称回填至所述第二XDR数据中。

示例性的，如图6所示，采用以hadoop框架和spark-streaming和kafka组件技术为基础的实时计算平台，其中，数据源为234G DPI XDR、家宽DPI XDR为用户数据，视频内容特征码库为基础静态合成数据，回填的具体实现过程如下：

采用以hadoop框架的大数据平台，通过kafka组件实时流式读取数据源，包括有234G DPI XDR、家宽DPI XDR数据和实时更新的视频内容特征库数据，其中，DPI数据有采集接口机实时生成上传，视频内容特征库为拨测平台合成后实时上传，读取后录入到kafka集群中，交由spark-streaming读取。

Spark-streaming组件从kafka集群中读取实时流数据，按照建立的特征码回填SQL，用视频特征库与XDR的url、useragent、关键字等字段进行匹配，待匹配成功后，将视频类型、视频源、视频名称等信息回填到DPI的XDR中，实时生成合成话单，传输给后续的视频业务精准识别模块。

步骤150、根据回填后的第二XDR数据，生成用户的目标视频业务对应的视频用户画像。

作为一个实施例，在执行步骤130之后，本发明实施例提供的视频业务DPI识别方法还可以包括：

对回填后的第二XDR数据进行汇总，以得到包含多数据维度的宽表数据。

其中，所述多数据维度可以包括：用户、时间点、视频源、视频类型、视频内容、视频在线时长和视频流量中至少两个。

本发明实施例生成包含多数据维度的宽表数据，可以此为基础实现对用户的视频业务精准识别、分析，提供用户视频业务内容级的分析支撑能力。

以上，结合图1～图6详细说明了本说明书实施例的视频业务DPI识别方法，下面，结合图7，详细说明本说明书实施例的服务器。

图7示出了本说明书实施例提供的服务器的结构示意图，如图7所示，该服务器可以包括：

获取模块710，用于根据目标视频业务的拨测配置参数，获取所述目标视频业务在执行过程中用户所需的视频截图；

识别并回填模块720，用于识别所述视频截图，并将所述视频截图对应的第一视频内容信息回填至通过拨测获取的第一XDR数据中；

确定并关联模块730，用于根据所述第一XDR数据确定特征码信息，并将所述第一视频内容信息与预先采集的第二XDR数据进行关联；

回填模块740，用于将所述第一视频内容信息回填至所述第二XDR数据中；

生成模块750，用于根据回填后的第二XDR数据，生成用户的目标视频业务对应的视频用户画像。

在一实施例中，所述服务器还可以包括：

汇总模块760，用于对回填后的第二XDR数据进行汇总，以得到包含多数据维度的宽表数据。

作为一个实施例，确定并关联模块730可以包括：

输出单元，用于将所述第一XDR数据中所述目标视频业务对应的每条播放记录信息作为特征码提取模型的输入，输出所述特征码信息。

作为一个实施例，所述输出单元可以包括：

转换子单元，用于将所述第一XDR数据中所述目标视频业务对应的多条播放信息均转换成字符串；

第二输出子单元，用于将每条播放信息对应的字符串作为所述特征码提取模型中第i匹配层级中各节点的输入，输出所述第i匹配层级中各节点对应的第i匹配信息，所述第i匹配层级采用正则匹配运算进行信息匹配，i为大于0的正整数；

第三输出子单元，用于将所述第i匹配层级中各节点对应的第i匹配信息作为第i+1匹配层级中各节点的输入，输出所述第i+1匹配层级中各节点对应的第i+1匹配信息，所述第i+1匹配层级采用正则匹配运算进行信息匹配；

组成子单元，用于当i+1为n时，将第n匹配层级中各节点对应的第n匹配信息，组成所述特征码信息，n为大于等于i的正整数。

作为一个实施例，确定并关联模块730可以包括：

确定单元，用于确定所述特征码信息是否与所述预先采集的第二XDR数据中的特征字段匹配；

关联单元，用于若匹配，则根据所述特征码信息将所述第一视频内容信息与预先采集的第二XDR数据进行关联。

作为一个实施例，识别并回填模块720可以包括：。

第一回填单元，用于将所述第一视频内容信息中的视频名称和视频播放时间段回填至通过拨测获取的第一XDR数据中；

回填模块740可以包括：

第二回填单元，用于将所述第一视频内容信息中的视频类型、视频源和视频名称回填至所述第二XDR数据中。

作为一个实施例，所述多数据维度可以包括：用户、时间点、视频源、视频类型、视频内容、视频在线时长和视频流量中至少两个。

下面将结合图8详细描述根据本发明实施例的服务器。参考图8，在硬件层面，服务器包括处理器，可选地，包括内部总线、网络接口、存储器。其中，如图8所示，存储器可能包含内存，例如高速随机存取存储器(Random-Access Memory，RAM)，也可能还包括非易失性存储器(non-volatile memory)，例如至少1个磁盘存储器等。当然，该服务器还可能包括实现其他目标业务所需要的硬件。

处理器、网络接口和存储器可以通过内部总线相互连接，该内部总线可以是工业标准体系结构(Industry StandardArchitecture，ISA)总线、外设部件互连标准(Peripheral Component Interconnect，PCI)总线或扩展工业标准结构(ExtendedIndustry StandardArchitecture，EISA)总线等。所述总线可以分为地址总线、数据总线、控制总线等。为便于表示，图8中仅用一个双向箭头表示，但并不表示仅有一根总线或一种类型的总线。

存储器，用于存放程序。具体地，程序可以包括程序代码，所述程序代码包括计算机操作指令。存储器可以包括内存和非易失性存储器，并向处理器提供指令和数据。

处理器从非易失性存储器中读取对应的计算机程序到内存中然后运行，在逻辑层面上形成资源增值对象与资源对象的关联装置。处理器，执行存储器所存放的程序，并具体用于执行本说明书前文所述的方法实施例的操作。

上述图1至图7所示实施例揭示的方法、服务器执行的方法可以应用于处理器中，或者由处理器实现。处理器可能是一种集成电路芯片，具有信号的处理能力。在实现过程中，上述方法的各步骤可以通过处理器中的硬件的集成逻辑电路或者软件形式的指令完成。上述的处理器可以是通用处理器，包括中央处理器(Central Processing Unit，CPU)、网络处理器(Network Processor，NP)等；还可以是数字信号处理器(Digital SignalProcessor，DSP)、专用集成电路(Application Specific Integrated Circuit，ASIC)、现场可编程门阵列(Field－Programmable GateArray，FPGA)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件。可以实现或者执行本发明实施例中的公开的各方法、步骤及逻辑框图。通用处理器可以是微处理器或者该处理器也可以是任何常规的处理器等。结合本发明实施例所公开的方法的步骤可以直接体现为硬件译码处理器执行完成，或者用译码处理器中的硬件及软件模块组合执行完成。软件模块可以位于随机存储器，闪存、只读存储器，可编程只读存储器或者电可擦写可编程存储器、寄存器等本领域成熟的存储介质中。该存储介质位于存储器，处理器读取存储器中的信息，结合其硬件完成上述方法的步骤。

图8所示的服务器还可执行图1至图6的方法，实现视频业务DPI识别方法在图1至图6所示实施例的功能，本发明实施例在此不再赘述。

当然，除了软件实现方式之外，本申请的服务器并不排除其他实现方式，比如逻辑器件抑或软硬件结合的方式等等，也就是说以下处理流程的执行主体并不限定于各个逻辑单元，也可以是硬件或逻辑器件。

本发明实施例还提供一种计算机可读存储介质，计算机可读存储介质上存储有计算机程序，该计算机程序被处理器执行时实现上述各个方法实施例的各个过程，且能达到相同的技术效果，为避免重复，这里不再赘述。其中，所述的计算机可读存储介质，如只读存储器(Read-Only Memory，简称ROM)、随机存取存储器(Random Access Memory，简称RAM)、磁碟或者光盘等。

本领域内的技术人员应明白，本申请的实施例可提供为方法、***、或计算机程序产品。因此，本申请可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。而且，本申请可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、CD-ROM、光学存储器等)上实施的计算机程序产品的形式。

本申请是参照根据本发明实施例的方法、设备(***)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器，使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。

这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读存储器中，使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品，该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。

这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上，使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理，从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。

在一个典型的配置中，计算设备包括一个或多个处理器(CPU)、输入/输出接口、网络接口和内存。

内存可能包括计算机可读介质中的非永久性存储器，随机存取存储器(RAM)和/或非易失性内存等形式，如只读存储器(ROM)或闪存(flash RAM)。内存是计算机可读介质的示例。

计算机可读介质包括永久性和非永久性、可移动和非可移动媒体可以由任何方法或技术来实现信息存储。信息可以是计算机可读指令、数据结构、程序的模块或其他数据。计算机的存储介质的例子包括，但不限于相变内存(PRAM)、静态随机存取存储器(SRAM)、动态随机存取存储器(DRAM)、其他类型的随机存取存储器(RAM)、只读存储器(ROM)、电可擦除可编程只读存储器(EEPROM)、快闪记忆体或其他内存技术、只读光盘只读存储器(CD-ROM)、数字多功能光盘(DVD)或其他光学存储、磁盒式磁带，磁带磁磁盘存储或其他磁性存储设备或任何其他非传输介质，可用于存储可以被计算设备访问的信息。按照本文中的界定，计算机可读介质不包括暂存电脑可读媒体(transitory media)，如调制的数据信号和载波。

还需要说明的是，术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含，从而使得包括一系列要素的过程、方法、商品或者设备不仅包括那些要素，而且还包括没有明确列出的其他要素，或者是还包括为这种过程、方法、商品或者设备所固有的要素。在没有更多限制的情况下，由语句“包括一个……”限定的要素，并不排除在包括要素的过程、方法、商品或者设备中还存在另外的相同要素。

以上仅为本申请的实施例而已，并不用于限制本申请。对于本领域技术人员来说，本申请可以有各种更改和变化。凡在本申请的精神和原理之内所作的任何修改、等同替换、改进等，均应包含在本申请的权利要求范围之内。

Claims

1.一种视频业务DPI识别方法，其特征在于，包括：

将所述第一视频内容信息回填至所述第二XDR数据中；

根据回填后的第二XDR数据，生成用户的目标视频业务对应的视频用户画像；

根据所述第一XDR数据确定特征码信息，包括：

将所述第一XDR数据中所述目标视频业务对应的每条播放记录信息作为特征码提取模型的输入，输出所述特征码信息；

将所述第一XDR数据中所述目标视频业务对应的每条播放记录信息作为特征码提取模型的输入，输出所述特征码信息，包括：

将所述第一XDR数据中所述目标视频业务对应的多条播放信息均转换成字符串；

当i+1为n时，将第n匹配层级中各节点对应的第n匹配信息，组成所述特征码信息，n为大于等于i的正整数；

将所述第一视频内容信息与预先采集的第二XDR数据进行关联，包括：

确定所述特征码信息是否与所述预先采集的第二XDR数据中的特征字段匹配；

若匹配，则根据所述特征码信息将所述第一视频内容信息与预先采集的第二XDR数据进行关联。

2.根据权利要求1所述的方法，其特征在于，在将所述第一视频内容信息回填至所述第二XDR数据中之后，包括：

3.根据权利要求1所述的方法，其特征在于，将所述视频截图对应的第一视频内容信息回填至通过拨测获取的第一XDR数据中，包括：

将所述第一视频内容信息中的视频名称和视频播放时间段回填至通过拨测获取的第一XDR数据中；

将所述第一视频内容信息回填至所述第二XDR数据中，包括：

将所述第一视频内容信息中的视频类型、视频源和视频名称回填至所述第二XDR数据中。

4.根据权利要求2所述的方法，其特征在于，所述多数据维度包括：用户、时间点、视频源、视频类型、视频内容、视频在线时长和视频流量中至少两个。

5.一种服务器，其特征在于，包括：

生成模块，用于根据回填后的第二XDR数据，生成用户的目标视频业务对应的视频用户画像；

所述确定并关联模块包括：

输出单元，用于将所述第一XDR数据中所述目标视频业务对应的每条播放记录信息作为特征码提取模型的输入，输出所述特征码信息；

所述输出单元可以包括：

组成子单元，用于当i+1为n时，将第n匹配层级中各节点对应的第n匹配信息，组成所述特征码信息，n为大于等于i的正整数；

所述确定并关联模块可以包括：

6.一种服务器，其特征在于，包括：

存储器，存储有计算机程序指令；

处理器，当所述计算机程序被所述处理器执行时实现如权利要求1至4任一项所述的视频业务DPI识别方法。

7.一种计算机可读存储介质，其特征在于，

所述计算机可读存储介质包括指令，当所述指令在计算机上运行时，使得计算机执行时实现如权利要求1至4任一项所述的视频业务DPI识别方法。