CN106469202A - 一种影视大数据平台的数据分析方法 - Google Patents
一种影视大数据平台的数据分析方法 Download PDFInfo
- Publication number
- CN106469202A CN106469202A CN201610796573.9A CN201610796573A CN106469202A CN 106469202 A CN106469202 A CN 106469202A CN 201610796573 A CN201610796573 A CN 201610796573A CN 106469202 A CN106469202 A CN 106469202A
- Authority
- CN
- China
- Prior art keywords
- data
- video display
- user
- analysis
- big data
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/70—Information retrieval; Database structures therefor; File system structures therefor of video data
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04L—TRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
- H04L67/00—Network arrangements or protocols for supporting network services or applications
- H04L67/50—Network services
- H04L67/535—Tracking the activity of the user
Landscapes
- Engineering & Computer Science (AREA)
- General Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Physics & Mathematics (AREA)
- Databases & Information Systems (AREA)
- Data Mining & Analysis (AREA)
- Multimedia (AREA)
- Computer Hardware Design (AREA)
- Computer Networks & Wireless Communication (AREA)
- Signal Processing (AREA)
- Two-Way Televisions, Distribution Of Moving Picture Or The Like (AREA)
- Testing, Inspecting, Measuring Of Stereoscopic Televisions And Televisions (AREA)
Abstract
本发明公开了一种影视大数据平台的数据分析方法:通过设置离线数据分析服务器和实时数据分析服务器,对接收到的影视大数据进行分析;然后将分析结果存储至结果数据库。本发明与现有技术相比,能够实时提供收视率统计结果;能够提供多种基于大量数据统计的分析结果,包括影视用户画像,艺人综合评估、收视率、影视作品点播量;通过分析结果为影视作品提供商提供数据情报。
Description
技术领域
本发明涉及计算机大数据分析领域,具体涉及一种影视大数据平台的数据分析方法。
背景技术
随着数据分析技术的发展,影视作品提供商对于影视作品数据分析的要求越来越高。但是现有的影视数据分析方法都没有采用计算机大数据技术,且无法实时的提供收视率统计,无法提供多种基于大量数据统计的分析结果,无法通过分析结果为影视作品提供商提供数据情报。
发明内容
本发明的目的在于提供一种影视大数据平台的数据分析方法,该方法采用计算机大数据技术,能够实时提供收视率统计结果,能够提供多种基于大量数据统计的分析结果,通过分析结果为影视作品提供商提供数据情报。
为实现上述目的本发明提供了一种影视大数据平台的数据分析方法:通过设置离线数据分析服务器和实时数据分析服务器,对接收到的影视大数据进行分析;然后将分析结果存储至结果数据库。
所述的影视大数据包括用户数据和影视数据;用户数据包括影视用户画像,影视数据包括艺人综合评估、收视率、影视作品点播量。
所述的离线数据分析服务器用于分析影视用户画像和艺人综合评估;所述的实时数据分析服务器用于分析收视率多维度监测和影视作品点播量在线监测。
所述的影视用户画像的分析包括数据建模,具体为:首先对用户在智能电视端的观看行为数据,互联网和移动互联网上的影视点播行为数据建立特征值,每一个维度对应一个特征值,然后采用聚类和关联分析等算法对这些数据构建数据模型,并不断对这些数据模型进行迭代计算,当计算结果收敛于某个设定的阀值后,模型构建成功。
所述的影视用户画像分析方法为:
首先分析用户在智能电视端、互联网端的操作和观看行为,将这些终端的IP地址、PC的cookie、终端的唯一标识进行关联,确定终端的用户是否为同一人;
然后,基于用户在电视和互联网上的影视观看行为,精确分析用户属性,勾勒用户画像,划分7000个多维度属性标签,包括用户的性别、年龄、地域、学历、职业、收入、兴趣爱好等标签,精细勾勒出最具价值的核心用户领袖;
最后,将用户的属性标签和广告属性进行精准匹配,准确圈定目标受众。
所述的艺人综合评估分析方法为:结合艺人出演节目的收视率、在线点播量、评论等数据,对艺人进行打分,对其演技、公众口碑等进行综合评估。
所述的影视作品点播量分析为,描绘出节目在不同终端中目标用户所占比例、所在地域、在线时长等多维度的指标。
所述的收视率分析为,对收视率进行分钟级统计,对地区、电视台、节目、用户属性等多维度实时绘制收视率曲线。
本发明与现有技术相比,能够实时提供收视率统计结果;能够提供多种基于大量数据统计的分析结果,包括影视用户画像,艺人综合评估、收视率、影视作品点播量;通过分析结果为影视作品提供商提供数据情报。
附图说明
图1是本发明实施例1的影视大数据平台的数据分析方法的结构图。
具体实施方式
以下是本发明的具体实施例,对本发明的技术方案做进一步的描述,但是本发明的保护范围并不限于这些实施例。凡是不背离本发明构思的改变或等同替代均包括在本发明的保护范围之内。
实施例1
一种影视大数据平台的数据分析方法,通过设置离线数据分析服务器和实时数据分析服务器,对接收到的影视大数据进行分析;然后将分析结果存储至结果数据库。如图1所示,数据源会将数据逐条录入至一个数据的消息队列中,消息队列使用topic来标识不同类型或不同格式的数据源,默认采用FIFO的算法,并使用一个offset变量记录每个队列当前的访问位置,消息队列默认会将数据保存2天。离线数据分析服务器和实时数据分析服务器各自启动一个进程读取消息队列中的数据,消息队列会为这两个进程各自维护一个offset来记录读取进程所读取到的一行,离线数据分析服务器和实时数据分析服务器会按需到消息队列中取得所需要的数据,离线数据分析服务器会将数据写入到分布式文件***中并进行离线计算,计算的最终结果会录入至数据库中,实时数据分析服务器则直接读取并进行计算,计算的最终结果会录入至数据库中;这一方案将离线计算和实时在线计算隔离开,两种计算场景互不干扰,满足了业务中实时和离线的两种需求。
影视大数据包括用户数据和影视数据;用户数据包括影视用户画像,影视数据包括艺人综合评估、收视率、影视作品点播量。
所述的离线数据分析服务器用于分析影视用户画像和艺人综合评估;所述的实时数据分析服务器用于分析收视率多维度监测和影视作品点播量在线监测。
所述的影视用户画像的分析包括数据建模,具体为:首先对用户在智能电视端的观看行为数据,互联网和移动互联网上的影视点播行为数据建立特征值,每一个维度对应一个特征值,然后采用聚类和关联分析等算法对这些数据构建数据模型,并不断对这些数据模型进行迭代计算,当计算结果收敛于某个设定的阀值后,模型构建成功。
所述的影视用户画像分析方法为:
首先分析用户在智能电视端、互联网端的操作和观看行为,将这些终端的IP地址、PC的cookie、终端的唯一标识进行关联,确定终端的用户是否为同一人;
然后,基于用户在电视和互联网上的影视观看行为,精确分析用户属性,勾勒用户画像,划分7000个多维度属性标签,包括用户的性别、年龄、地域、学历、职业、收入、兴趣爱好等标签数据,精细勾勒出最具价值的核心用户领袖;
最后,将用户的属性标签和广告属性进行精准匹配,准确圈定目标受众。
所述的艺人综合评估分析方法为:结合艺人出演节目的收视率、在线点播量、评论等数据,对艺人进行打分,对其演技、公众口碑等进行综合评估。
所述的影视作品点播量分析为,描绘出节目在不同终端中目标用户所占比例、所在地域、在线时长等多维度的指标。
所述的收视率分析为,对收视率进行分钟级统计,对地区、电视台、节目、用户属性等多维度实时绘制收视率曲线。
本发明与现有技术相比,能够实时提供收视率统计结果;能够提供多种基于大量数据统计的分析结果,包括影视用户画像,艺人综合评估、收视率、影视作品点播量;通过分析结果为影视作品提供商提供数据情报。根据客户的需求定制化构建数据可视化页面,并以API的方式对用户提供门户网站和数据接口服务,API支持php、java、python等开发语言,客户可直接通过程序调用接口实时获取所需数据。
Claims (8)
1.一种影视大数据平台的数据分析方法,其特征在于:通过设置离线数据分析服务器和实时数据分析服务器,对接收到的影视大数据进行分析;然后将分析结果存储至结果数据库。
2.根据权利要求1所述的一种影视大数据平台的数据分析方法,其特征在于,所述的影视大数据包括用户数据和影视数据;用户数据包括影视用户画像,影视数据包括艺人综合评估、收视率、影视作品点播量。
3.根据权利要求2所述的一种影视大数据平台的数据分析方法,其特征在于,所述的离线数据分析服务器用于分析影视用户画像和艺人综合评估;所述的实时数据分析服务器用于分析收视率多维度监测和影视作品点播量在线监测。
4.根据权利要求3所述的一种影视大数据平台的数据分析方法,其特征在于,所述的影视用户画像的分析包括数据建模,具体为:首先对用户在智能电视端的观看行为数据,互联网和移动互联网上的影视点播行为数据建立特征值,每一个维度对应一个特征值,然后采用聚类和关联分析等算法对这些数据构建数据模型,并不断对这些数据模型进行迭代计算,当计算结果收敛于某个设定的阀值后,模型构建成功。
5.根据权利要求4所述的一种影视大数据平台的数据分析方法,其特征在于,所述的影视用户画像分析方法为:
首先分析用户在智能电视端、互联网端的操作和观看行为,将这些终端的IP地址、PC的cookie、终端的唯一标识进行关联,确定终端的用户是否为同一人;
然后,基于用户在电视和互联网上的影视观看行为,精确分析用户属性,勾勒用户画像,划分用户的性别、年龄、地域、学历、职业、收入、兴趣爱好等标签,精细勾勒出最具价值的核心用户领袖;
最后,将用户的属性标签和广告属性进行精准匹配,准确圈定目标受众。
6.根据权利要求3所述的一种影视大数据平台的数据分析方法,其特征在于,所述的艺人综合评估分析方法为:结合艺人出演节目的收视率、在线点播量、评论等数据,对艺人进行打分,对其演技、公众口碑等进行综合评估。
7.根据权利要求3所述的一种影视大数据平台的数据分析方法,其特征在于,所述的影视作品点播量分析为,描绘出节目在不同终端中目标用户所占比例、所在地域、在线时长等多维度的指标。
8.根据权利要求3所述的一种影视大数据平台的数据分析方法,其特征在于,所述的收视率分析为,对收视率进行分钟级统计,对地区、电视台、节目、用户属性等多维度实时绘制收视率曲线。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201610796573.9A CN106469202A (zh) | 2016-08-31 | 2016-08-31 | 一种影视大数据平台的数据分析方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201610796573.9A CN106469202A (zh) | 2016-08-31 | 2016-08-31 | 一种影视大数据平台的数据分析方法 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN106469202A true CN106469202A (zh) | 2017-03-01 |
Family
ID=58230626
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201610796573.9A Pending CN106469202A (zh) | 2016-08-31 | 2016-08-31 | 一种影视大数据平台的数据分析方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN106469202A (zh) |
Cited By (14)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN106934034A (zh) * | 2017-03-14 | 2017-07-07 | 杭州火剧科技有限公司 | 分析影视作品发行特征的方法和服务器 |
CN106980663A (zh) * | 2017-03-21 | 2017-07-25 | 上海星红桉数据科技有限公司 | 基于海量跨屏行为数据的用户画像方法 |
CN107454346A (zh) * | 2017-07-03 | 2017-12-08 | 李洪海 | 影视数据解析方法、视频制作模板推荐方法、装置及设备 |
CN107609487A (zh) * | 2017-08-17 | 2018-01-19 | 北京三快在线科技有限公司 | 一种用户头像的生成方法和装置 |
CN107911721A (zh) * | 2017-12-01 | 2018-04-13 | 北京蓝水科技文化有限公司 | 一种互联网影视作品的量化评价指标确定方法及*** |
CN108885628A (zh) * | 2016-03-28 | 2018-11-23 | 三菱电机株式会社 | 数据分析方法候选决定装置 |
CN109451335A (zh) * | 2018-12-26 | 2019-03-08 | 山东浪潮商用***有限公司 | 一种Java实现存储视频收视率的方法 |
CN109685579A (zh) * | 2018-12-29 | 2019-04-26 | 深圳市酷开网络科技有限公司 | 一种基于用户标签的数据处理方法、智能电视及存储介质 |
CN109697214A (zh) * | 2018-11-30 | 2019-04-30 | 武汉烽火众智数字技术有限责任公司 | 一种旅游数据分析***及方法 |
CN110087104A (zh) * | 2019-04-29 | 2019-08-02 | 秒针信息技术有限公司 | 信息推送的装置、方法、电子设备和计算机可读存储介质 |
CN110312149A (zh) * | 2018-03-20 | 2019-10-08 | 国家新闻出版广电总局广播电视规划院 | 一种用于收视数据处理的方法、装置及***以及数据处理设备 |
CN110502579A (zh) * | 2019-08-26 | 2019-11-26 | 第四范式(北京)技术有限公司 | 用于批量和实时特征计算的***和方法 |
CN112765237A (zh) * | 2021-01-25 | 2021-05-07 | 上海盛奕数字科技有限公司 | 一种区块链数据分析获取方法 |
WO2022111071A1 (zh) * | 2020-11-25 | 2022-06-02 | Oppo广东移动通信有限公司 | 用户画像生成方法、装置、服务器及存储介质 |
Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101527812A (zh) * | 2008-03-07 | 2009-09-09 | 上海贝尔阿尔卡特股份有限公司 | 网络电视***中用户事件信息和收视信息的自动统计方法 |
CN102541435A (zh) * | 2010-12-13 | 2012-07-04 | 索尼公司 | 用于对媒体内容区分优先级的用户界面 |
CN104902293A (zh) * | 2015-06-08 | 2015-09-09 | 福州大学 | 数字电视收视率统计管理***及其实现方法 |
CN105224576A (zh) * | 2014-07-01 | 2016-01-06 | 上海视畅信息科技有限公司 | 一种影视智能推荐方法 |
CN105577431A (zh) * | 2015-12-11 | 2016-05-11 | 青岛云成互动网络有限公司 | 一种基于互联网应用的用户信息识别分类方法和*** |
-
2016
- 2016-08-31 CN CN201610796573.9A patent/CN106469202A/zh active Pending
Patent Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101527812A (zh) * | 2008-03-07 | 2009-09-09 | 上海贝尔阿尔卡特股份有限公司 | 网络电视***中用户事件信息和收视信息的自动统计方法 |
CN102541435A (zh) * | 2010-12-13 | 2012-07-04 | 索尼公司 | 用于对媒体内容区分优先级的用户界面 |
CN105224576A (zh) * | 2014-07-01 | 2016-01-06 | 上海视畅信息科技有限公司 | 一种影视智能推荐方法 |
CN104902293A (zh) * | 2015-06-08 | 2015-09-09 | 福州大学 | 数字电视收视率统计管理***及其实现方法 |
CN105577431A (zh) * | 2015-12-11 | 2016-05-11 | 青岛云成互动网络有限公司 | 一种基于互联网应用的用户信息识别分类方法和*** |
Cited By (19)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN108885628A (zh) * | 2016-03-28 | 2018-11-23 | 三菱电机株式会社 | 数据分析方法候选决定装置 |
CN106934034A (zh) * | 2017-03-14 | 2017-07-07 | 杭州火剧科技有限公司 | 分析影视作品发行特征的方法和服务器 |
CN106934034B (zh) * | 2017-03-14 | 2019-11-12 | 杭州火剧科技有限公司 | 分析影视作品发行特征的方法和服务器 |
CN106980663A (zh) * | 2017-03-21 | 2017-07-25 | 上海星红桉数据科技有限公司 | 基于海量跨屏行为数据的用户画像方法 |
CN107454346A (zh) * | 2017-07-03 | 2017-12-08 | 李洪海 | 影视数据解析方法、视频制作模板推荐方法、装置及设备 |
CN107609487A (zh) * | 2017-08-17 | 2018-01-19 | 北京三快在线科技有限公司 | 一种用户头像的生成方法和装置 |
CN107609487B (zh) * | 2017-08-17 | 2021-01-22 | 北京三快在线科技有限公司 | 一种用户头像的生成方法和装置 |
CN107911721A (zh) * | 2017-12-01 | 2018-04-13 | 北京蓝水科技文化有限公司 | 一种互联网影视作品的量化评价指标确定方法及*** |
CN110312149A (zh) * | 2018-03-20 | 2019-10-08 | 国家新闻出版广电总局广播电视规划院 | 一种用于收视数据处理的方法、装置及***以及数据处理设备 |
CN110312149B (zh) * | 2018-03-20 | 2021-08-17 | 国家广播电视总局广播电视规划院 | 一种用于收视数据处理的方法、装置及***以及数据处理设备 |
CN109697214A (zh) * | 2018-11-30 | 2019-04-30 | 武汉烽火众智数字技术有限责任公司 | 一种旅游数据分析***及方法 |
CN109697214B (zh) * | 2018-11-30 | 2022-07-08 | 武汉烽火众智数字技术有限责任公司 | 一种旅游数据分析***及方法 |
CN109451335A (zh) * | 2018-12-26 | 2019-03-08 | 山东浪潮商用***有限公司 | 一种Java实现存储视频收视率的方法 |
CN109685579A (zh) * | 2018-12-29 | 2019-04-26 | 深圳市酷开网络科技有限公司 | 一种基于用户标签的数据处理方法、智能电视及存储介质 |
CN110087104A (zh) * | 2019-04-29 | 2019-08-02 | 秒针信息技术有限公司 | 信息推送的装置、方法、电子设备和计算机可读存储介质 |
CN110502579A (zh) * | 2019-08-26 | 2019-11-26 | 第四范式(北京)技术有限公司 | 用于批量和实时特征计算的***和方法 |
US11971882B2 (en) | 2019-08-26 | 2024-04-30 | The Fourth Paradigm (Beijing) Tech Co Ltd | System and method for batch and real-time feature computation |
WO2022111071A1 (zh) * | 2020-11-25 | 2022-06-02 | Oppo广东移动通信有限公司 | 用户画像生成方法、装置、服务器及存储介质 |
CN112765237A (zh) * | 2021-01-25 | 2021-05-07 | 上海盛奕数字科技有限公司 | 一种区块链数据分析获取方法 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN106469202A (zh) | 一种影视大数据平台的数据分析方法 | |
US20170142482A1 (en) | Video platform monitoring and analyzing system | |
US20200111241A1 (en) | Method and apparatus for processing video image and computer readable medium | |
CN109714610B (zh) | 自动式视频营销管理***及方法 | |
CN107203897A (zh) | 一种产品推荐度的评价方法、装置及*** | |
CN112818224B (zh) | 信息推荐方法、装置、电子设备及可读存储介质 | |
CN112287238B (zh) | 用户特征的确定方法和装置、存储介质及电子设备 | |
US11468479B2 (en) | Methods and apparatus for generating information about portable device advertising | |
US20150019324A1 (en) | System and method for centralized advertisements serving and verification | |
CN113761253A (zh) | 视频标签确定方法、装置、设备及存储介质 | |
CN112995690B (zh) | 直播内容品类识别方法、装置、电子设备和可读存储介质 | |
CN106202393A (zh) | 媒体信息推送方法及装置 | |
Ungerman et al. | Model of communication usable for small and medium-sized companies for the consumer communication in social media | |
CN104967690A (zh) | 一种信息推送方法及装置 | |
WO2022247666A1 (zh) | 一种内容的处理方法、装置、计算机设备和存储介质 | |
CN106919692B (zh) | 一种推送消息的方法和装置 | |
CN113763027B (zh) | 推荐信息处理方法、推荐信息生成方法及装置 | |
CN113821574A (zh) | 用户行为分类方法和装置及存储介质 | |
CN110727885A (zh) | 一种互联网全局统一标识符生成***及其生成方法 | |
US20230316106A1 (en) | Method and apparatus for training content recommendation model, device, and storage medium | |
US20150227970A1 (en) | System and method for providing movie file embedded with advertisement movie | |
JP2014002683A (ja) | コンテンツ配信装置 | |
CN111436213A (zh) | 基于情感分析选择视觉元素的***和方法 | |
CN111932315B (zh) | 数据展示的方法及装置、电子设备及计算机可读存储介质 | |
CN115344774A (zh) | 用户账号的筛选方法、装置及服务器 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
RJ01 | Rejection of invention patent application after publication |
Application publication date: 20170301 |
|
RJ01 | Rejection of invention patent application after publication |