CN111932109B - 一种面向移动短视频应用的用户影响力评价*** - Google Patents
一种面向移动短视频应用的用户影响力评价*** Download PDFInfo
- Publication number
- CN111932109B CN111932109B CN202010784889.2A CN202010784889A CN111932109B CN 111932109 B CN111932109 B CN 111932109B CN 202010784889 A CN202010784889 A CN 202010784889A CN 111932109 B CN111932109 B CN 111932109B
- Authority
- CN
- China
- Prior art keywords
- domain
- user
- information
- short video
- influence
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000011156 evaluation Methods 0.000 title claims abstract description 28
- 238000000034 method Methods 0.000 claims abstract description 16
- 238000013500 data storage Methods 0.000 claims description 52
- 238000007405 data analysis Methods 0.000 claims description 15
- 238000012163 sequencing technique Methods 0.000 claims description 6
- 238000004364 calculation method Methods 0.000 claims description 4
- 238000013480 data collection Methods 0.000 claims description 3
- 239000011159 matrix material Substances 0.000 abstract description 4
- 238000007418 data mining Methods 0.000 abstract description 2
- 230000005540 biological transmission Effects 0.000 description 2
- 238000010586 diagram Methods 0.000 description 2
- 206010044565 Tremor Diseases 0.000 description 1
- 238000007726 management method Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q10/00—Administration; Management
- G06Q10/06—Resources, workflows, human or project management; Enterprise or organisation planning; Enterprise or organisation modelling
- G06Q10/063—Operations research, analysis or management
- G06Q10/0639—Performance analysis of employees; Performance analysis of enterprise or organisation operations
- G06Q10/06393—Score-carding, benchmarking or key performance indicator [KPI] analysis
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/70—Information retrieval; Database structures therefor; File system structures therefor of video data
- G06F16/73—Querying
- G06F16/735—Filtering based on additional data, e.g. user or group profiles
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/90—Details of database functions independent of the retrieved data types
- G06F16/95—Retrieval from the web
- G06F16/951—Indexing; Web crawling techniques
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q50/00—Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
- G06Q50/01—Social networking
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02D—CLIMATE CHANGE MITIGATION TECHNOLOGIES IN INFORMATION AND COMMUNICATION TECHNOLOGIES [ICT], I.E. INFORMATION AND COMMUNICATION TECHNOLOGIES AIMING AT THE REDUCTION OF THEIR OWN ENERGY USE
- Y02D10/00—Energy efficient computing, e.g. low power processors, power management or thermal management
Landscapes
- Engineering & Computer Science (AREA)
- Business, Economics & Management (AREA)
- Human Resources & Organizations (AREA)
- Theoretical Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Physics & Mathematics (AREA)
- Economics (AREA)
- Databases & Information Systems (AREA)
- Strategic Management (AREA)
- Development Economics (AREA)
- Entrepreneurship & Innovation (AREA)
- Educational Administration (AREA)
- General Engineering & Computer Science (AREA)
- General Business, Economics & Management (AREA)
- Tourism & Hospitality (AREA)
- Marketing (AREA)
- Data Mining & Analysis (AREA)
- Primary Health Care (AREA)
- Computational Linguistics (AREA)
- General Health & Medical Sciences (AREA)
- Computing Systems (AREA)
- Health & Medical Sciences (AREA)
- Multimedia (AREA)
- Game Theory and Decision Science (AREA)
- Operations Research (AREA)
- Quality & Reliability (AREA)
- Two-Way Televisions, Distribution Of Moving Picture Or The Like (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
本发明涉及一种面向移动短视频应用的用户影响力评价***,属于数据挖掘技术领域。本方法充分考虑了移动短视频应用域内数据和多元化的域外新媒体平台数据,分别采集移动短视频应用域内的用户基本信息、短视频信息以及域外平台关联账号的粉丝数信息等,设计评估算法分别计算基于短视频质量的域内影响力值和基于传播潜力的域外影响力值,通过一定的权重合成最终的用户影响力值。所述方法对已有的单一平台数据来源的评价方法作出改进,考虑用户的跨平台传播潜力,以适应新媒体平台“矩阵式”传播的新形势,提高对移动短视频用户影响力评价的全面性和有效性,实现评价***的自动化运行和实时更新。
Description
技术领域
本发明涉及一种面向移动短视频应用的用户影响力评价***,属于数据挖掘技术领域。
背景技术
以快手、抖音等为代表的移动短视频应用,是继文字、图片、传统视频之后新兴的一种内容传播媒体。近年来,移动短视频应用发展迅速,其正在成为移动互联网时代全新的社交平台和超级入口。制作、发布短视频的创作者,同时也是移动短视频应用的用户,成为商业营销、行政监管的新对象。研究移动短视频用户的影响力对于精准投放广告、有效开展监督管理具有重要意义。
现有对移动短视频用户影响力的评价方法,主要基于短视频应用内某一用户的粉丝数以及所发视频的点赞数、评论数、转发数等运营指标。但是当前新媒体平台格局多样,除了移动短视频应用,微博、微信公众号等也拥有庞大的用户使用群体,呈现出多平台“矩阵式”传播的趋势,即一个用户同时拥有短视频账号、微博账号、微信公众号等,并充分利用各平台特点打造立体化的传播效果。现有评价方法只考虑到在单一平台上的影响力,而忽视了“新媒体平台组合”的传播潜力,不能有效的评估用户的实际影响力。
发明内容
本发明的目的是提出一种面向移动短视频应用的用户影响力评价***,对已有的单一平台数据来源的评价方法作出改进,考虑用户的跨平台传播潜力,以适应新媒体平台“矩阵式”传播的新形势,提高对移动短视频用户影响力评价的全面性和有效性,实现评价***的自动化运行和实时更新。
本发明提出的面向移动短视频应用的用户影响力评价***,包括数据采集服务器、数据存储服务器、数据分析服务器和***展示服务器;所说的数据采集服务器、数据存储服务器、数据分析服务器和***展示服务器通过数据线相连;其中:
数据采集服务器,用于采集移动短视频应用域内数据以及移动短视频应用域外数据(即其他主流媒体平台的数据);
数据存储服务器,用于存储数据采集服务器采集的移动短视频应用域内数据以及移动短视频应用域外数据;
数据分析服务器,用于根据移动短视频应用域内数据以及移动短视频应用域外数据,计算移动短视频应用的用户影响力,并定期更新采集的数据和影响力;
***展示服务器,用于读取影响力数据库的数值,设计展示页面,按照数值大小,从高到低排序并展示。
上述用户影响力评价***中,所说的数据采集服务器的工作过程如下:
(1)采集用户移动短视频应用域内数据:
在数据采集服务器上设置模拟器,利用网络爬虫工具,在模拟器上模拟登录用户移动短视频应用;利用事先设定的关键词,搜索用户移动短视频应用中的用户账号,并依次打开用户移动短视频应用的搜索列表中的用户基本页,从用户基本页获取用户基本信息,该用户基本信息包括移动短视频用户账号、昵称、头像、性别、生日、地区、用户简介、粉丝数和关注数,在用户基本页依次打开用户发布的短视频,获取该用户发布的短视频信息,短视频信息包括短视频链接、标题、发布时间、点赞数和转发数;
(2)使用户移动短视频应用域内账号与域外平台账号建立关联:
根据基本用户属性的相似性,从步骤(1)中的移动短视频用户账号中识别出用户在移动短视频以外的的账号信息,即域外平台账号,在域外平台账号中搜索与步骤(1)用户基本信息中昵称相同的昵称账号列表,并依次打开改昵称账号列表中的各页面,得到用户基本信息中的头像、性别、生日、地区和用户简介,将所有在域外平台账号获取的用户基本信息中的头像、性别、生日、地区和用户简介与步骤(1)中的相应信息依次进行匹配,将匹配项最多的域外平台账号记为该移动短视频用户账号在域外平台上的关联账号;
(3)用户移动短视频应用域外数据采集:
利用网络爬虫工具,获取步骤(2)关联到的域外平台账号上的粉丝数信息。
上述用户影响力评价***中,所说的数据存储服务器的工作过程如下:
(1)将数据采集服务器采集到的用户移动短视频应用域内数据中的用户基本信息和用户发布的短视频信息存储到数据存储服务器的域内信息库中;
(2)将数据采集服务器采集到的移动短视频用户账号在域外平台上的关联账号以及域外平台账号上的粉丝数信息存储到域外信息库中;
(3)将数据分析服务器计算得到的移动短视频应用的总影响力存入数据存储服务器的影响力数据库中。
上述用户影响力评价***中,所说的数据分析服务器用于计算移动短视频应用的用户影响力,并定期更新采集的数据和影响力,具体过程如下:
(1)计算移动短视频应用域内数据的用户影响力:
从数据存储服务器的域内信息库中读取用户发布的短视频信息,利用下式,依次计算移动短视频应用中用户u的域内影响力Iin(u):
其中,用户u在特定时间区间内,共发布m条短视频,d(i)为第i条短视频的点赞数,s(i)为第i条短视频的转发数;
(2)计算移动短视频应用域外数据的用户影响力:
从数据存储服务器的域外信息库中读取用户的域外关联账号和粉丝数信息,依次计算移动短视频应用中用户u的域外影响力Iout(u):
其中,用户u在n个域外平台有关联账号,分别为域外平台p1的关联账号u1、域外平台p2的关联账号u2...域外平台pn的关联账号un,各关联账号的粉丝数为f(uj),j=1,2,...n;
(3)计算移动短视频应用的总影响力:
设定域内影响力的权重为α,域外影响力的权重为1-α,则移动短视频应用的总影响力为:Iu=α×Iin(u)+(1-α)×Iout(u);
(4)将步骤(1)、步骤(2)和步骤(3)的计算结果存入数据存储服务器的影响力数据库中;
(5)定期从数据采集服务器中获取最新移动短视频应用的用户基本信息、用户短视频信息、域外平台关联账号信息和关联账号的粉丝数信息;
(6)对步骤(5)获取的最新用户账号信息进行判断,包括以下步骤;
(6-1)对步骤(5)用户基本信息中的最新用户账号进行判断,若该最新用户账号已存在于数据存储服务器的域内信息库中,则进行步骤(6-2),若该最新用户账号未存在于数据存储服务器的域内信息库中,则进行步骤(6-6);
(6-2)对步骤(5)用户基本信息中的最新其他信息,最新其他信息包括移动短视频用户账号、昵称、头像、性别、生日、地区和用户简介进行判断,若该最新其他信息与数据存储服务器的域内信息库中存储的相应信息相一致,则进行步骤(6-3),若该最新其他信息与数据存储服务器的域内信息库中存储的相应信息不一致,则以该最新其他信息更新域内信息库中的相应信息,进行步骤(6-3);
(6-3)对步骤(1)获取的最新用户短视频信息进行判断,若该最新用户短视频信息与数据存储服务器的域内信息库中存储的用户短视频信息一致,则进行步骤(6-4),若该最新用户短视频信息与数据存储服务器的域内信息库中存储的用户短视频信息不一致,则以该最新用户短视频信息更新域内信息库中的用户短视频信息,进行步骤(6-4);
(6-4)对步骤(5)中获取的最新域外平台关联账号信息进行判断,若该最新域外平台关联账号与数据采集服务器的域外信息库中存储的相应信息相一致,则进行步骤(6-5),若该最新域外平台关联账号与数据采集服务器的域外信息库中存储的不一致,则以该最新域外平台关联账号更新域外信息库后中的域外平台关联账号,进行步骤(6-5);
(6-5)对步骤(5)获取的最新域外平台关联账号的粉丝数信息进行判断,若最新域外平台关联账号的粉丝数信息与数据采集服务器的域外信息库中存储的相应信息相一致,则进行步骤(6-6),若最新域外平台关联账号的粉丝数信息与数据采集服务器的域外信息库中存储的相应信息相不一致,则以该最新域外平台关联账号的粉丝数信息更新域外信息库后中的域外平台关联账号的粉丝数信息,进行步骤(6-7);
(6-6)分别在数据存储服务器的域内信息库和域外信息库中增加一个新条目,在新条目中记录所有新获取的用户基本信息、用户短视频信息、域外平台关联账号信息和关联账号的粉丝数信息,进行步骤(6-7);
(6-7)重复步骤(6-1)-步骤(6-6),直到用户基本信息中的所有最新用户账号完成判断,完成数据采集和存储的更新,进行步骤(7);
(7)根据更新后的域内信息库和域外信息库,重复步骤(1)-(4),完成影响力数据库的更新。
上述用户影响力评价***中,所说的***展示服务器用于从数据存储服务器的影响力数据库读取影响力数据库的数值,设计展示页面,并按照影响力数值大小,并从高到低依次对影响力数值大小和用户短视频信息进行排序并展示。
本发明提出的一种面向移动短视频应用的用户影响力评价***,其优点是:
本发明提出的面向移动短视频应用的用户影响力评价***,充分考虑了移动短视频应用域内数据和多元化的域外新媒体平台数据,分别采集移动短视频应用域内的用户基本信息、短视频信息以及域外平台关联账号的粉丝数信息等,设计评估算法分别计算基于短视频质量的域内影响力值和基于传播潜力的域外影响力值,通过一定的权重合成最终的用户影响力值。本发明***对已有的单一平台数据来源的影响力评价方法作出改进,考虑用户的跨平台传播潜力,以适应新媒体平台“矩阵式”传播的新形势,提高对移动短视频用户影响力评价的全面性和有效性,实现评价***的自动化运行和实时更新,并从高到低依次对影响力数值大小和用户短视频信息进行排序并展示。
附图说明
图1是本发明提出的面向移动短视频应用的用户影响力评价***的结构示意图。
具体实施方式
本发明提出的面向移动短视频应用的用户影响力评价***,其结构示意图如图1所示,包括数据采集服务器、数据存储服务器、数据分析服务器和***展示服务器;所说的数据采集服务器、数据存储服务器、数据分析服务器和***展示服务器通过数据线相连;其中:
数据采集服务器,用于采集移动短视频应用域内数据以及移动短视频应用域外数据(即其他主流媒体平台的数据);
数据存储服务器,用于存储数据采集服务器采集的移动短视频应用域内数据以及移动短视频应用域外数据;
数据分析服务器,用于根据移动短视频应用域内数据以及移动短视频应用域外数据,计算移动短视频应用的用户影响力,并定期更新采集的数据和影响力;
***展示服务器,用于读取影响力数据库的数值,设计展示页面,并按照影响力数值大小,并从高到低依次对影响力数值大小和用户短视频信息进行排序并展示。
上述用户影响力评价***中,所说的数据采集服务器的工作过程如下:
(1)采集用户移动短视频应用域内数据:
在数据采集服务器上设置模拟器,利用网络爬虫工具,在模拟器上模拟登录用户移动短视频应用;利用事先设定的关键词,搜索用户移动短视频应用中的用户账号,并依次打开用户移动短视频应用的搜索列表中的用户基本页,从用户基本页获取用户基本信息,该用户基本信息包括移动短视频用户账号、昵称、头像、性别、生日、地区、用户简介、粉丝数和关注数,在用户基本页依次打开用户发布的短视频,获取该用户发布的短视频信息,短视频信息包括短视频链接、标题、发布时间、点赞数和转发数;
(2)使用户移动短视频应用域内账号与域外平台账号建立关联:
根据基本用户属性的相似性,从步骤(1)中的移动短视频用户账号中识别出用户在移动短视频以外的的账号信息,即域外平台账号,在域外平台账号中搜索与步骤(1)用户基本信息中昵称相同的昵称账号列表,并依次打开改昵称账号列表中的各页面,得到用户基本信息中的头像、性别、生日、地区和用户简介,将所有在域外平台账号获取的用户基本信息中的头像、性别、生日、地区和用户简介与步骤(1)中的相应信息依次进行匹配,将匹配项最多的域外平台账号记为该移动短视频用户账号在域外平台上的关联账号;
(3)用户移动短视频应用域外数据采集:
利用网络爬虫工具,获取步骤(2)关联到的域外平台账号上的粉丝数信息。
上述用户影响力评价***中,所说的数据存储服务器的工作过程如下:
(1)将数据采集服务器采集到的用户移动短视频应用域内数据中的用户基本信息和用户发布的短视频信息存储到数据存储服务器的域内信息库中;
(2)将数据采集服务器采集到的移动短视频用户账号在域外平台上的关联账号以及域外平台账号上的粉丝数信息存储到域外信息库中;
(3)将数据分析服务器计算得到的移动短视频应用的总影响力存入数据存储服务器的影响力数据库中。
上述用户影响力评价***中,所说的数据分析服务器用于计算移动短视频应用的用户影响力,并定期更新采集的数据和影响力,具体过程如下:
(1)计算移动短视频应用域内数据的用户影响力:
从数据存储服务器的域内信息库中读取用户发布的短视频信息,利用下式,依次计算移动短视频应用中用户u的域内影响力Iin(u):
其中,用户u在特定时间区间内,共发布m条短视频,d(i)为第i条短视频的点赞数,s(i)为第i条短视频的转发数;
(2)计算移动短视频应用域外数据的用户影响力:
从数据存储服务器的域外信息库中读取用户的域外关联账号和粉丝数信息,依次计算移动短视频应用中用户u的域外影响力Iout(u):
其中,用户u在n个域外平台有关联账号,分别为域外平台p1的关联账号u1、域外平台p2的关联账号u2...域外平台pn的关联账号un,各关联账号的粉丝数为f(uj),j=1,2,...n;
(3)计算移动短视频应用的总影响力:
设定域内影响力的权重为α,域外影响力的权重为1-α,则移动短视频应用的总影响力为:Iu=α×Iin(u)+(1-α)×Iout(u);
(4)将步骤(1)、步骤(2)和步骤(3)的计算结果存入数据存储服务器的影响力数据库中;
(5)定期从数据采集服务器中获取最新移动短视频应用的用户基本信息、用户短视频信息、域外平台关联账号信息和关联账号的粉丝数信息;
(6)对步骤(5)获取的最新用户账号信息进行判断,包括以下步骤;
(6-1)对步骤(5)用户基本信息中的最新用户账号进行判断,若该最新用户账号已存在于数据存储服务器的域内信息库中,则进行步骤(6-2),若该最新用户账号未存在于数据存储服务器的域内信息库中,则进行步骤(6-6);
(6-2)对步骤(5)用户基本信息中的最新其他信息,最新其他信息包括移动短视频用户账号、昵称、头像、性别、生日、地区和用户简介进行判断,若该最新其他信息与数据存储服务器的域内信息库中存储的相应信息相一致,则进行步骤(6-3),若该最新其他信息与数据存储服务器的域内信息库中存储的相应信息不一致,则以该最新其他信息更新域内信息库中的相应信息,进行步骤(6-3);
(6-3)对步骤(1)获取的最新用户短视频信息进行判断,若该最新用户短视频信息与数据存储服务器的域内信息库中存储的用户短视频信息一致,则进行步骤(6-4),若该最新用户短视频信息与数据存储服务器的域内信息库中存储的用户短视频信息不一致,则以该最新用户短视频信息更新域内信息库中的用户短视频信息,进行步骤(6-4);
(6-4)对步骤(5)中获取的最新域外平台关联账号信息进行判断,若该最新域外平台关联账号与数据采集服务器的域外信息库中存储的相应信息相一致,则进行步骤(6-5),若该最新域外平台关联账号与数据采集服务器的域外信息库中存储的不一致,则以该最新域外平台关联账号更新域外信息库后中的域外平台关联账号,进行步骤(6-5);
(6-5)对步骤(5)获取的最新域外平台关联账号的粉丝数信息进行判断,若最新域外平台关联账号的粉丝数信息与数据采集服务器的域外信息库中存储的相应信息相一致,则进行步骤(6-6),若最新域外平台关联账号的粉丝数信息与数据采集服务器的域外信息库中存储的相应信息相不一致,则以该最新域外平台关联账号的粉丝数信息更新域外信息库后中的域外平台关联账号的粉丝数信息,进行步骤(6-7);
(6-6)分别在数据存储服务器的域内信息库和域外信息库中增加一个新条目,在新条目中记录所有新获取的用户基本信息、用户短视频信息、域外平台关联账号信息和关联账号的粉丝数信息,进行步骤(6-7);
(6-7)重复步骤(6-1)-步骤(6-6),直到用户基本信息中的所有最新用户账号完成判断,完成数据采集和存储的更新,进行步骤(7);
(7)根据更新后的域内信息库和域外信息库,重复步骤(1)-(4),完成影响力数据库的更新。
上述用户影响力评价***中,所说的***展示服务器用于从数据存储服务器的影响力数据库读取影响力数据库的数值,设计展示页面,并按照影响力数值大小,并从高到低依次对影响力数值大小和用户短视频信息进行排序并展示。
以下介绍本发明***的详细工作过程:
首先进行数据采集。采集移动短视频应用本身的数据(即域内数据),以及其他主流媒体平台的数据(即域外数据),包括以下步骤:
(1-1)移动短视频应用域内数据采集。利用网络爬虫工具,在模拟器上模拟移动短视频应用的登录,利用事先设定的关键词搜索用户账号,依次打开搜索列表中的用户基本页,获取用户基本信息(包括用户账号、昵称、头像、性别、生日、地区、用户简介、粉丝数、关注数等),在用户基本页依次打开发布的短视频,获取该用户发布的短视频信息(包括短视频链接、标题、发布时间、点赞数、转发数等等)。
(1-2)移动短视频应用域内账号和域外平台账号的关联。利用基本用户属性相似性的方法识别(1-1)中获取的移动短视频用户账号在其他平台上的账号信息,利用(1-1)中获取的用户基本信息中的昵称,分别在域外平台中搜索具有相同昵称的账号列表,依次打开域外平台搜索列表中的账号页面,匹配(1-1)中获取的用户基本信息中的头像、性别、生日、地区、用户简介等,匹配内容最多的域外平台账号记为该移动短视频用户账号在域外平台上的关联账号。
(1-3)移动短视频应用域外数据采集。利用网络爬虫工具,获取(1-2)中关联到的域外平台账号的粉丝数信息。
然后进行数据存储,即将上述采集到的数据保存到相应的数据库,包括以下步骤:
(2-1)将(1-1)中获取的用户基本信息和用户发布的短视频信息存储到域内信息库。
(2-2)将(1-2)获取的域外关联账号信息和(1-3)中获取的域外平台账号的粉丝数信息存储到域外信息库。
再进行影响力分析,计算移动短视频应用的用户影响力,包括以下步骤:
(3-2)计算域外影响力。读取域外信息库,依次计算移动短视频应用中用户u的域外影响力Iout(u)。用户u在n个域外平台有关联账号,分别为域外平台p1的关联账号u1、域外平台p2的关联账号u2...域外平台pn的关联账号un,各关联账号的粉丝数为f(uj),j=1,2,...n。则
(3-3)计算总的影响力。域内影响力的权重为α,域外影响力的权重为1-α,则总影响力Iu=α×Iin(u)+(1-α)×Iout(u)。
(3-4)将(3-1)、(3-2)和(3-4)的计算结果存入影响力数据库。
再进行定期更新采集的数据和影响力的计算,包括以下步骤:
(4-1)更新步骤(1),获取新的移动短视频应用用户基本信息、短视频信息、域外平台关联账号信息和关联账号的粉丝数信息等。
(4-2)依次判断(4-1)中新获取的用户账号信息,进行(4-3)。直到所有用户账号都判断完进行(4-10)。
(4-3)判断新获取的用户账号是否已存在于域内信息库中,如果已经存在则进行(4-4),否则进行(4-9)。
(4-4)判断新获取的用户账号基本信息是否与域内信息库中存储的一致,如果一致进行(4-5),否则更新域内信息库后进行(4-5)。
(4-5)判断新获取的用户短视频信息是否与域内信息库中存储的一致,如果一致进行(4-6),否则更新域内信息库后进行(4-6)。
(4-6)判断新获取的域外平台关联账号信息是否与域外信息库中存储的一致,如果一致进行(4-7),否则更新域内信息库后进行(4-7)。
(4-7)判断新获取的域外平台关联账号的粉丝数信息是否与域外信息库中存储的一致,如果一致进行(4-8),否则更新域内信息库后进行(4-8)。
(4-8)返回(4-2)。
(4-9)分别在域内信息库和域外信息库中增加新获取的用户账号条目,将新获取的用户基本信息、短视频信息、域外平台关联账号信息和关联账号的粉丝数信息等存入新增的条目中。
(4-10)完成数据采集和存储的更新。
(4-11)根据更新后的域内信息库和域外信息库,重新计算(3),完成影响力数据库的更新。最后根据影响力数值的大小,设计展示页面,并按照影响力数值大小,并从高到低依次对影响力数值大小和用户短视频信息进行排序并展示。。
Claims (5)
1.一种面向移动短视频应用的用户影响力评价***,其特征在于该***包括数据采集服务器、数据存储服务器、数据分析服务器和***展示服务器;所说的数据采集服务器、数据存储服务器、数据分析服务器和***展示服务器通过数据线相连;其中:
数据采集服务器,用于采集移动短视频应用域内数据以及移动短视频应用域外数据,所述移动短视频应用域内数据和所述移动短视频应用域外数据均为媒体平台的数据;
数据存储服务器,用于存储数据采集服务器采集的移动短视频应用域内数据以及移动短视频应用域外数据,确定移动短视频应用的域内账号和域外账号,将所述域内账号和所述域外账号建立关联,基于所述关联获取域外平台账号上的粉丝数信息;
数据分析服务器,用于根据移动短视频应用域内数据以及移动短视频应用域外数据,计算移动短视频应用的用户影响力,并定期更新采集的数据和影响力,其中,所述计算移动短视频应用的用户影响力包括:
(1)计算移动短视频应用域内数据的用户影响力,其中,从数据存储服务器的域内信息库中读取用户发布的短视频信息,利用下式,依次计算移动短视频应用中用户u的域内影响力Iin(u):
其中,用户u在特定时间区间内,共发布m条短视频,d(i)为第i条短视频的点赞数,s(i)为第i条短视频的转发数,
(2)计算移动短视频应用域外数据的用户影响力,其中,从数据存储服务器的域外信息库中读取用户的域外关联账号和粉丝数信息,依次计算移动短视频应用中用户u的域外影响力Iout(u):
其中,用户u在n个域外平台有关联账号,分别为域外平台p1的关联账号u1、域外平台p2的关联账号u2...域外平台pn的关联账号un,各关联账号的粉丝数为f(uj),j=1,2,...n,
(3)计算移动短视频应用的总影响力,其中,设定域内影响力的权重为α,域外影响力的权重为1-α,则移动短视频应用的总影响力为:Iu=α×Iin(u)+(1-α)×Iout(u);
***展示服务器,用于读取影响力数据库的数值,设计展示页面,并按照影响力数值大小,从高到低依次对影响力数值大小和用户短视频信息进行排序并展示。
2.如权利要求1所述的用户影响力评价***,其特征在于,其中所说的数据采集服务器的工作过程如下:
(1)采集用户移动短视频应用域内数据:
在数据采集服务器上设置模拟器,利用网络爬虫工具,在模拟器上模拟登录用户移动短视频应用;利用事先设定的关键词,搜索用户移动短视频应用中的用户账号,并依次打开用户移动短视频应用的搜索列表中的用户基本页,从用户基本页获取用户基本信息,该用户基本信息包括移动短视频用户账号、昵称、头像、性别、生日、地区、用户简介、粉丝数和关注数,在用户基本页依次打开用户发布的短视频,获取该用户发布的短视频信息,短视频信息包括短视频链接、标题、发布时间、点赞数和转发数;
(2)使用户移动短视频应用域内账号与域外平台账号建立关联:
根据基本用户属性的相似性,从步骤(1)中的移动短视频用户账号中识别出用户在移动短视频以外的账号信息,即域外平台账号,在域外平台账号中搜索与步骤(1)用户基本信息中昵称相同的昵称账号列表,并依次打开改昵称账号列表中的各页面,得到用户基本信息中的头像、性别、生日、地区和用户简介,将所有在域外平台账号获取的用户基本信息中的头像、性别、生日、地区和用户简介与步骤(1)中的相应信息依次进行匹配,将匹配项最多的域外平台账号记为该移动短视频用户账号在域外平台上的关联账号;
(3)用户移动短视频应用域外数据采集:
利用网络爬虫工具,获取步骤(2)关联到的域外平台账号上的粉丝数信息。
3.如权利要求1所述的用户影响力评价***,其特征在于,其中所说的数据存储服务器的工作过程如下:
(1)将数据采集服务器采集到的用户移动短视频应用域内数据中的用户基本信息和用户发布的短视频信息存储到数据存储服务器的域内信息库中;
(2)将数据采集服务器采集到的移动短视频用户账号在域外平台上的关联账号以及域外平台账号上的粉丝数信息存储到域外信息库中;
(3)将数据分析服务器计算得到的移动短视频应用的总影响力存入数据存储服务器的影响力数据库中。
4.如权利要求1所述的用户影响力评价***,其特征在于,其中所说的数据分析服务器用于计算移动短视频应用的用户影响力,并定期更新采集的数据和影响力,具体过程还包括:
(4)将步骤(1)、步骤(2)和步骤(3)的计算结果存入数据存储服务器的影响力数据库中;
(5)定期从数据采集服务器中获取最新移动短视频应用的用户基本信息、用户短视频信息、域外平台关联账号信息和关联账号的粉丝数信息;
(6)对步骤(5)获取的最新用户账号信息进行判断,包括以下步骤;
(6-1)对步骤(5)用户基本信息中的最新用户账号进行判断,若该最新用户账号已存在于数据存储服务器的域内信息库中,则进行步骤(6-2),若该最新用户账号未存在于数据存储服务器的域内信息库中,则进行步骤(6-6);
(6-2)对步骤(5)用户基本信息中的最新其他信息,最新其他信息包括移动短视频用户账号、昵称、头像、性别、生日、地区和用户简介进行判断,若该最新其他信息与数据存储服务器的域内信息库中存储的相应信息相一致,则进行步骤(6-3),若该最新其他信息与数据存储服务器的域内信息库中存储的相应信息不一致,则以该最新其他信息更新域内信息库中的相应信息,进行步骤(6-3);
(6-3)对步骤(1)获取的最新用户短视频信息进行判断,若该最新用户短视频信息与数据存储服务器的域内信息库中存储的用户短视频信息一致,则进行步骤(6-4),若该最新用户短视频信息与数据存储服务器的域内信息库中存储的用户短视频信息不一致,则以该最新用户短视频信息更新域内信息库中的用户短视频信息,进行步骤(6-4);
(6-4)对步骤(5)中获取的最新域外平台关联账号信息进行判断,若该最新域外平台关联账号与数据采集服务器的域外信息库中存储的相应信息相一致,则进行步骤(6-5),若该最新域外平台关联账号与数据采集服务器的域外信息库中存储的不一致,则以该最新域外平台关联账号更新域外信息库后中的域外平台关联账号,进行步骤(6-5);
(6-5)对步骤(5)获取的最新域外平台关联账号的粉丝数信息进行判断,若最新域外平台关联账号的粉丝数信息与数据采集服务器的域外信息库中存储的相应信息相一致,则进行步骤(6-6),若最新域外平台关联账号的粉丝数信息与数据采集服务器的域外信息库中存储的相应信息相不一致,则以该最新域外平台关联账号的粉丝数信息更新域外信息库后中的域外平台关联账号的粉丝数信息,进行步骤(6-7);
(6-6)分别在数据存储服务器的域内信息库和域外信息库中增加一个新条目,在新条目中记录所有新获取的用户基本信息、用户短视频信息、域外平台关联账号信息和关联账号的粉丝数信息,进行步骤(6-7);
(6-7)重复步骤(6-1)-步骤(6-6),直到用户基本信息中的所有最新用户账号完成判断,完成数据采集和存储的更新,进行步骤(7);
(7)根据更新后的域内信息库和域外信息库,重复步骤(1)-(4),完成影响力数据库的更新。
5.如权利要求1所述的用户影响力评价***,其特征在于,其中所说的***展示服务器用于从数据存储服务器的影响力数据库读取影响力数据库的数值,设计展示页面,并按照影响力数值大小,从高到低依次对影响力数值大小和用户短视频信息进行排序并展示。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010784889.2A CN111932109B (zh) | 2020-08-06 | 2020-08-06 | 一种面向移动短视频应用的用户影响力评价*** |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010784889.2A CN111932109B (zh) | 2020-08-06 | 2020-08-06 | 一种面向移动短视频应用的用户影响力评价*** |
Publications (2)
Publication Number | Publication Date |
---|---|
CN111932109A CN111932109A (zh) | 2020-11-13 |
CN111932109B true CN111932109B (zh) | 2023-04-07 |
Family
ID=73307752
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202010784889.2A Active CN111932109B (zh) | 2020-08-06 | 2020-08-06 | 一种面向移动短视频应用的用户影响力评价*** |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN111932109B (zh) |
Families Citing this family (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN113158064A (zh) * | 2021-05-11 | 2021-07-23 | 两比特(北京)科技有限公司 | 一种云合数据短视频数据抓取以及统计汇总分析算法 |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN106658087A (zh) * | 2016-09-23 | 2017-05-10 | 东软集团股份有限公司 | 基于新媒体的电视台影响力指数计算方法及装置 |
CN109242710A (zh) * | 2018-08-16 | 2019-01-18 | 北京交通大学 | 社交网络节点影响力排序方法及*** |
CN111177533A (zh) * | 2019-12-05 | 2020-05-19 | 哈勃智远(北京)科技有限公司 | 一种融媒体影响力分析报表生成方法及设备 |
Family Cites Families (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US10354340B2 (en) * | 2015-10-13 | 2019-07-16 | Dell Products L.P. | Workflow to amplify content over a plurality of social media platforms in different regions |
-
2020
- 2020-08-06 CN CN202010784889.2A patent/CN111932109B/zh active Active
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN106658087A (zh) * | 2016-09-23 | 2017-05-10 | 东软集团股份有限公司 | 基于新媒体的电视台影响力指数计算方法及装置 |
CN109242710A (zh) * | 2018-08-16 | 2019-01-18 | 北京交通大学 | 社交网络节点影响力排序方法及*** |
CN111177533A (zh) * | 2019-12-05 | 2020-05-19 | 哈勃智远(北京)科技有限公司 | 一种融媒体影响力分析报表生成方法及设备 |
Also Published As
Publication number | Publication date |
---|---|
CN111932109A (zh) | 2020-11-13 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN110222267B (zh) | 一种游戏平台信息推送方法、***、存储介质及设备 | |
CN107665444B (zh) | 一种基于用户在线行为的网络广告即时效应评价方法及*** | |
CN106528693B (zh) | 面向个性化学习的教育资源推荐方法及*** | |
JP5078910B2 (ja) | 観察したユーザの行動からの広告品質の推定 | |
CN109597904B (zh) | 用于提供社交网络的方法和*** | |
EP2407897A1 (en) | Device for determining internet activity | |
EP1738524B1 (en) | Method and system for generating a population representative of a set of users of a communication network | |
CN110532351B (zh) | 推荐词展示方法、装置、设备及计算机可读存储介质 | |
CN105488697A (zh) | 一种基于客户行为特征的潜在客户挖掘方法 | |
CN108550068A (zh) | 一种基于用户行为分析的个性化商品推荐方法及*** | |
Carmagnola et al. | User data distributed on the social web: how to identify users on different social systems and collecting data about them | |
CN113592588B (zh) | 基于大数据协同过滤技术的电商平台商品推荐***及方法 | |
CN111309834B (zh) | 一种无线热点与兴趣点的匹配方法及装置 | |
JP2013061756A (ja) | 情報処理システム、情報処理方法、プログラム及び情報記憶媒体 | |
CN104050243A (zh) | 一种将搜索与社交相结合的网络搜索方法及其*** | |
CN113901308A (zh) | 基于知识图谱的企业推荐方法及推荐装置、电子设备 | |
CN111932109B (zh) | 一种面向移动短视频应用的用户影响力评价*** | |
JP5367632B2 (ja) | 知識量推定装置及びプログラム | |
CN108304570B (zh) | 一种搜索结果的处理方法及展现方法、服务器、客户端 | |
CN114528448B (zh) | 一种全球外贸客户客户画像精准分析*** | |
CN113254778B (zh) | 一种基于亚马逊平台的asin组的关键词推荐方法 | |
CN114398429A (zh) | 一种学校图书馆智能图书推荐方法及*** | |
Utama et al. | Scientific Articles Recommendation System Based On User’s Relatedness Using Item-Based Collaborative Filtering Method | |
KR101277300B1 (ko) | 맞춤형 광고 제공 방법 및 장치 | |
CN111859146A (zh) | 信息挖掘方法、装置及电子设备 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |