CN115640486A - 基于多源数据融合的网络新闻媒体影响力评估方法及装置 - Google Patents

基于多源数据融合的网络新闻媒体影响力评估方法及装置 Download PDF

Info

Publication number
CN115640486A
CN115640486A CN202211365279.4A CN202211365279A CN115640486A CN 115640486 A CN115640486 A CN 115640486A CN 202211365279 A CN202211365279 A CN 202211365279A CN 115640486 A CN115640486 A CN 115640486A
Authority
CN
China
Prior art keywords
influence
account
information
media
article
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202211365279.4A
Other languages
English (en)
Inventor
黄斐然
黄唯畅
支庭荣
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Jinan University
Original Assignee
Jinan University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Jinan University filed Critical Jinan University
Priority to CN202211365279.4A priority Critical patent/CN115640486A/zh
Publication of CN115640486A publication Critical patent/CN115640486A/zh
Pending legal-status Critical Current

Links

Images

Landscapes

  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本发明实施例公开了一种基于多源数据融合的网络新闻媒体影响力评估方法及装置,方法包括:收集账户信息,所述账户信息包括账户名和媒体平台账号;采集与账户信息相关的多源目标媒体信息,所述多源目标媒体信息包括粉丝数量、文章链接、传播数据;分别计算每一种类别的多源目标媒体信息对应的分项影响力,并根据所述分项影响力计算所述账户信息的综合影响力。实施例中基于网络社交媒体多个信源出发收集账户信息以及采集与账户信息相关的多源目标媒体信息,收集多个信源相关的信息,融合多源信息进行分析,有效避免了单一信源进行评估的局限性,评估结果全面、客观。

Description

基于多源数据融合的网络新闻媒体影响力评估方法及装置
技术领域
本发明涉及新闻媒体数据分析技术领域,具体涉及一种基于多源数据融合的网络新闻媒体影响力评估方法及装置。
背景技术
近年来,随着互联网飞速发展,各种社交平台不断涌现,如微信公众号、微博等。新闻媒体不再限于电视新闻、报纸等传统形式,尤其移动终端出现在人们日常生活中后,碎片化阅读给新闻媒体带来了新的生机与活力。在社交平台信息量日益增长的同时,利用这些信息进行媒体影响力评估仍处于探索阶段,传统的评估方法往往侧重于来自单一渠道的信息,而无法同时关注来自其他渠道的信息。因此,传统媒体影响力评估方法目前已很难用于网络时代下新闻媒体影响力的评估。
发明内容
针对所述缺陷,本发明实施例公开了一种基于多源数据融合的网络新闻媒体影响力评估方法及装置,其从多维角度挖掘潜在影响力,实现对新闻媒体影响力的有效评估。
本发明实施例第一方面公开了基于多源数据融合的网络新闻媒体影响力评估方法,包括:
收集账户信息,所述账户信息包括账户名和媒体平台账号;
采集与账户信息相关的多源目标媒体信息,所述多源目标媒体信息包括粉丝数量、文章链接、传播数据;
分别计算每一种类别的多源目标媒体信息对应的分项影响力,并根据所述分项影响力计算所述账户信息的综合影响力。
作为一种可选的实施方式,在本发明实施例第一方面中,所述收集账户信息包括:
收集目标网络媒体的账户名,所述账户名包括中文账户名和英文账户名;
基于爬虫技术和所述账户名采集与所述账户名匹配的媒体平台账户,所述媒体平台账户包括媒体平台账户名和官方网站链接。
作为一种可选的实施方式,在本发明实施例第一方面中,所述收集账户信息还包括:
整理所收集的全部账户名和媒体平台账户得到冗余数据,剔除所述冗余数据。
作为一种可选的实施方式,在本发明实施例第一方面中,所述采集与账户信息相关的多源目标媒体信息包括:
选取多个信源作为信息获取渠道,根据所述信息获取渠道获取与账户信息相关的多源目标媒体信息。
作为一种可选的实施方式,在本发明实施例第一方面中,所述信息获取渠道包括微博、微信公众号和搜索网站,所述传播数据还包括搜索指数、文章评论数量、文章点赞数量、文章转发数量和广告投放量。
作为一种可选的实施方式,在本发明实施例第一方面中,所述分别计算每一种类别的目标媒体信息对应的分项影响力,包括:
分别计算在不同设定期限内的搜索指数、粉丝数量、文章推送数量、文章评论数量、文章点赞数量、文章转发数量和广告投放量。
作为一种可选的实施方式,在本发明实施例第一方面中,所述根据所述分项影响力计算所述账户信息的综合影响力,包括:
根据所述分项影响力分别计算第一期限、第二期限和第三的综合影响力,所述第一期限为周、第二期限为月,第三期限为年。
本发明实施例第二方面公开一种基于多源数据融合的网络新闻媒体影响力评估装置,包括:
账户收集模块:用于收集账户信息,所述账户信息包括账户名和媒体平台账号;
信息采集模块:用于采集与账户信息相关的多源目标媒体信息,所述多源目标媒体信息包括粉丝数量、文章链接、传播数据;
影响力计算模块:用于分别计算每一种类别的目标媒体信息对应的分项影响力,并根据所述分项影响力计算所述账户信息的综合影响力。
作为一种可选的实施方式,在本发明实施例第二方面中,所述收集账户信息包括:
收集目标网络媒体的账户名,所述账户名包括中文账户名和英文账户名;
基于爬虫技术和所述账户名采集与所述账户名匹配的媒体平台账户,所述媒体平台账户包括媒体平台账户名和官方网站链接。
作为一种可选的实施方式,在本发明实施例第二方面中,所述收集账户信息还包括:
整理所收集的全部账户名和媒体平台账户得到冗余数据,剔除所述冗余数据。
作为一种可选的实施方式,在本发明实施例第二方面中,所述采集与账户信息相关的多源目标媒体信息包括:
选取多个信源作为信息获取渠道,根据所述信息获取渠道获取与账户信息相关的多源目标媒体信息。
作为一种可选的实施方式,在本发明实施例第二方面中,所述信息获取渠道包括微博、微信公众号和搜索网站,所述传播数据还包括搜索指数、文章评论数量、文章点赞数量、文章转发数量和广告投放量。
作为一种可选的实施方式,在本发明实施例第二方面中,所述分别计算每一种类别的目标媒体信息对应的分项影响力,包括:
分别计算在不同设定期限内的搜索指数、粉丝数量、文章推送数量、文章评论数量、文章点赞数量、文章转发数量和广告投放量。
作为一种可选的实施方式,在本发明实施例第二方面中,所述根据所述分项影响力计算所述账户信息的综合影响力,包括:
根据所述分项影响力分别计算第一期限和第二期限的综合影响力,所述第一期限为月,第二期限为年。
本发明实施例第三方面公开一种电子设备,包括:存储有可执行程序代码的存储器;与所述存储器耦合的处理器;所述处理器调用所述存储器中存储的所述可执行程序代码,用于执行本发明实施例第一方面公开的基于多源数据融合的网络新闻媒体影响力评估方法。
本发明实施例第四方面公开一种计算机可读存储介质,其存储计算机程序,其中,所述计算机程序使得计算机执行本发明实施例第一方面公开的基于多源数据融合的网络新闻媒体影响力评估方法。
与现有技术相比,本发明实施例具有以下有益效果:
本发明实施例中基于网络社交媒体多个信源出发收集账户信息以及采集与账户信息相关的多源目标媒体信息,收集多个信源相关的信息,融合多源信息进行分析,有效避免了单一信源进行评估的局限性,评估结果全面、客观。
附图说明
为了更清楚地说明本发明实施例中的技术方案,下面将对实施例中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1是本发明实施例公开的基于多源数据融合的网络新闻媒体影响力评估方法的流程示意图;
图2是本发明实施例的整体计算流程图;
图3是本发明实施例的综合影响力计算流程图;
图4是本发明实施例提供的一种基于多源数据融合的网络新闻媒体影响力评估装置的结构示意图;
图5是本发明实施例提供的一种电子设备的结构示意图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
需要说明的是,本发明的说明书和权利要求书中的术语“第一”、“第二”、“第三”、“第四”等是用于区别不同的对象,而不是用于描述特定顺序。本发明实施例的术语“包括”和“具有”以及他们的任何变形,意图在于覆盖不排他的包含,示例性地,包含了一系列步骤或单元的过程、方法、***、产品或设备不必限于清楚地列出的那些步骤或单元,而是可包括没有清楚地列出的或对于这些过程、方法、产品或设备固有的其它步骤或单元。
本发明实施例公开了基于多源数据融合的网络新闻媒体影响力评估方法、装置、电子设备及存储介质,基于网络社交媒体多个信源出发收集账户信息以及采集与账户信息相关的多源目标媒体信息,收集多个信源相关的信息,融合多源信息进行分析,有效避免了单一信源进行评估的局限性,评估结果全面、客观。
实施例一
请参阅图1,图1是本发明实施例公开的基于多源数据融合的网络新闻媒体影响力评估方法的流程示意图,图2是本发明实施例的整体计算流程图。其中,本发明实施例所描述的方法的执行主体为由软件或/和硬件组成的执行主体,该执行主体可以通过有线或/和无线方式接收相关信息,并可以发送一定的指令。当然,其还可以具有一定的处理功能和存储功能。该执行主体可以控制多个设备,例如远程的物理服务器或云服务器以及相关软件,也可以是对某处安置的设备进行相关操作的本地主机或服务器以及相关软件等。在一些场景中,还可以控制多个存储设备,存储设备可以与设备放置于同一地方或不同地方。如图1和图2所示,该基于多源数据融合的网络新闻媒体影响力评估方法包括以下步骤:
步骤101、收集账户信息,所述账户信息包括账户名和媒体平台账号。
具体的,在本步骤中,收集账户信息包括收集目标网络媒体的账户名,所述账户名包括中文账户名和英文账户名;基于爬虫技术和所述账户名采集与所述账户名匹配的媒体平台账户,所述媒体平台账户包括媒体平台账户名和官方网站链接。
实施例中,对于账户信息的收集主要是整理目标网络新闻媒体名称,包括中文和英文名称。例如知名的新闻媒体对于的账户名。示例性的,一个知名的新闻媒体名为AA新闻,则获取AA新闻这一账户名,如果AA新闻还有英文名,则对应获取该AA新闻的英文名。之后以AA新闻这一账户名为基础,利用爬虫技术,自动化采集该AA新闻对应的在不同平台的账户,包括微博账号、微信公众号账户、官方网站链接等。进一步的,还包括整理所收集的全部账户名和媒体平台账户得到冗余数据,剔除所述冗余数据。本步骤设置的原因在于所采集的账户信息可能存在冗余数据和错误数据,对于冗余数据需要去重,错误信息需要重新采集。
步骤102、采集与账户信息相关的多源目标媒体信息,所述多源目标媒体信息包括粉丝数量、文章链接、传播数据。
本步骤中,具体的是选取多个信源作为信息获取渠道,根据所述信息获取渠道获取与账户信息相关的多源目标媒体信息。其中,信息获取渠道包括微博、微信公众号和搜索网站,所述传播数据还包括搜索指数、文章评论数量、文章点赞数量、文章转发数量和广告投放量。
具体的,在实施例中,首先确定信源,实施例中,信源具体包括三类,一是与微博账户相关,二是与微信公众号相关,三是与网站相关。其中,与微博账户相关账户信息需要采集微博账户单日粉丝总数、微博单条博文链接、微博单条博文发表时间、微博单条博文转发数、微博单条博文评论数、微博单条博文点赞数、微博单条博文二级转发数。与微信公众号相关的账户信息需要采集微信公众号单日粉丝总数、微信公众号单篇文章链接、微信公众号单篇文章发表时间、微信公众号单篇文章阅读数、微信公众号单篇文章点赞数、微信公众号单篇文章评论数。与网站相关的账户信息需要采集媒体单日百度搜索指数、媒体单日谷歌趋势指数、官方网站单日入链数、官方网站单日访问量、官方网站单篇新闻发表时间、官方网站单篇新闻评论数、官方网站广告投放量、官方网站广告价格。根据上述所要采集的各类数据,实施爬取各公众平台的相关数据,并存入数据库中进行存储。
步骤103、分别计算每一种类别的目标媒体信息对应的分项影响力,并根据所述分项影响力计算所述账户信息的综合影响力。
根据步骤102中所采集的各类信息数据,可以对认知度影响力、覆盖面影响力、推送量影响力、传播影响力、广告影响力进行分别计算。也即是,可以分别计算在不同设定期限内的搜索指数、粉丝数量、文章推送数量、文章评论数量、文章点赞数量、文章转发数量和广告投放量。
具体的,实施的搜索指数计算也即是认知度影响力计算,包括单周认知度影响力和单月认知度影响力,单周和单月则是设定期限。由媒体单日百度搜索指数、媒体单日谷歌趋势指数、官方网站单日入链数进行计算。首先,计算媒体单周日均百度搜索指数bdsearch_avg_w,媒体单周日均谷歌趋势指数ggtrends_avg_w,网站单周日均入链数website_link_avg_w,媒体单月日均百度搜索指数bdsearch_avg_m,媒体单月日均谷歌趋势指数ggtrends_avg_m,网站单月日均入链数website_link_avg_m。通过以下公式进行计算:
bdsearch_avg_w=(∑i∈week***_search_di)/7;
ggtrends_avg_w=(∑i∈week***_trends_di)/7;
website_link_avg_w=(∑i∈weekwebsite_link_di)/7;
bdsearch_avg_m=(∑i∈month***_search_di)/day_of_month;
ggtrends_avg_m=(∑i∈month***_trends_di)/day_of_month;
website_link_avg_m=(∑i∈monthwebsite_link_di)/day_of_month;
其中,***_search_di、***_trends_di、website_link_di、day_of_month分别代表具体到某一天的媒体单日百度搜索指数、媒体单日谷歌趋势指数、官方网站单日入链数和单月总天数。
根据上述计算结果计算单周认知度影响力Impactrzd_w,单月认知度影响力Impactrzd_m
Impactrzd_w=lnbdsearch_avg_w+lnggtrends_avg_w+lnwebsite_link_avg_w,
Impactrzd_m=lnbdsearch_avg_m+lnggtrends_avg_m+lnwebsite_link_avg_m。
再者,计算覆盖面影响力也即是统计粉丝数量,同样是统计单周覆盖面影响力和单月覆盖面影响力,由微博账户单日粉丝数、微信公众号单日粉丝数、官方网站单日访问量进行计算。首先,计算微博账户单周日均粉丝数wb_fans_avg_w,微信公众号单周日均粉丝数wx_fans_avg_w,官方网站单周日均访问量website_access_avg_w,微博账户单月日均粉丝数wb_fans_avg_m,微信公众号单月日均粉丝数wx_fans_avg_m,官方网站单月日均访问量website_access_avg_m。具体通过以下公式计算:
Figure BDA0003923736600000081
wx_fans_avg_w=(∑i∈weekwx_fans_di)/7
website_access_avg_w=(∑i∈weekwebsite_access_di)/7
wb_fans_avg_m=(∑i∈monthwb_fans_di)/day_of_month
wx_fans_avg_m=(∑i∈monthwx_fans_di)/day_of_month
website_access_avg_m=(∑i∈monthwebsite_access_di)/day_of_month
其中,wb_fans_di、wx_fans_di、website_access_di、day_of_month分别代表具体到某一天的微博账户单日粉丝数、微信公众号单日粉丝数、官方网站单日访问量和单月总访问量。由于官网网站没有粉丝数,因此通过访问量来替代粉丝数量。基于上述计算求得的数据,进一步计算单周覆盖面影响力Impactfgm_w,单月覆盖面影响力Impactfgm_m
Impactfgm_w=lnwb_fans_avg_w+lnwx_fans_avg_w+lnwebsite_access_avg_w;
Impactfgm_m=lnwb_fans_avg_m+lnwx_fans_avg_m+lnwebsite_access_avg_m。
实施例还计算推送量影响力,也就是文章推送数量,包括单周推送量影响力和单月推送量影响力,由官方网站单篇新闻发表时间、微博单条博文发表时间、微信公众号单篇文章发表时间进行计算。需要分别计算官方网站单周日均新闻数website_news_avg_w,微博单周日均博文数wb_post_avg_w,微信公众号单周日均文章数wx_articles_avg_w,官方网站单月日均新闻数website_news_avg_m,微博单月日均博文数wb_post_avg_m,微信公众号单月日均文章数wx_articles_avg_m。具体通过以下公式进行计算:
website_news_avg_w=(∑i∈weekwebsite_news_di)/7;
wb_post_avg_w=(∑i∈weekwb_post_di)/7;
wx_articles_avg_w=(∑i∈weekwx_articles_di)/7;
website_news_avg_m=(∑i∈monthwebsite_news_di)/day_of_month;
wb_post_avg_m=(∑i∈monthwb_post_di)/day_of_mont;
wx_articles_avg_m=(∑i∈monthwx_articles_di)/day_of_month;
其中,website_news_di为官方网站单篇新闻发表时间落在这一天的总数,wb_post_di为微博单条博文发表时间落在这一天的总数,wx_articles_di为微信公众号单篇文章发表时间落在这一天的总数。基于此,再计算单周推送量影响力Impacttsl_w和单月推送量影响力Impacttsl_m
Impacttsl_w=lnwebsite_news_avg_w+lnwb_post_avg_w+lnwx_articles_avg_w;
Impacttsl_m=lnwebsite_news_avg_m+lnwb_post_avg_m+lnwx_articles_avg_m。
实施例还计算传播影响力,也即是文章评论数量、文章点赞数量、文章转发数量,包括单周传播影响力和单月传播影响力,由微信公众号单篇文章点赞数、微信公众号单篇文章评论数、微博单条博文转发数、微博单条博文评论数、微博单条博文点赞数、微博单条博文二级转发数进行计算。首先,计算单周微信每篇文章平均点赞数wx_dz_avg_w,单周微信每篇文章平均评论数wx_pl_avg_w,单周微博每条推文平均转发数wb_zf_avg_w,单周微博每条推文平均二级转发数wb_ejzf_avg_w,单周微博每条推文平均评论数wb_pl_avg_w,单周微博每条推文平均点赞数wb_dz_avg_w,单月微信每篇文章平均点赞数wx_dz_avg_m,单月微信每篇文章平均评论数wx_pl_avg_m,单月微博每条推文平均转发数wb_zf_avg_m,单月微博每条推文平均二级转发数wb_ejzf_avg_m,单月微博每条推文平均评论数wb_pl_avg_m。通过以下方式进行计算:
wx_dz_avg_w=(∑article∈weekarticledz)/number_of_articles_week;
wx_pl_avg_w=(∑article∈weekarticlepl)/number_of_articles_week;
wb_zf_avg_w=(∑post∈weekpostzf)/number_of_posts_week;
wb_ejzf_avg_w=(∑post∈weekpostejzf)/number_of_posts_week;
wb_pl_avg_w=(∑post∈weekpostpl)/number_of_posts_week;
wb_dz_avg_w=(∑post∈weekpostdz)/number_of_posts_week;
wx_dz_avg_m、wx_pl_avg_m、wb_zf_avg_m、wb_ejzf_avg_m、wb_pl_avg_m;
wx_dz_avg_m、wx_pl_avg_m、wb_zf_avg_m、wb_ejzf_avg_m、wb_pl_avg_m计算公式同理。其中,articledz、articlepl分别代表微信公众号单篇文章点赞数、微信公众号单篇文章评论数,其余数据含义同理。article∈week代表微信公众号单篇文章发表时间属于某一周的文章,number_of_articles_week代表微信公众号单篇文章发表时间属于某一周的总数,article∈month和number_of_articles_month含义同理。然后计算单周微信传播影响力wx_avg_w,单周微博传播影响力wb_avg_w,单月微信传播影响力wx_avg_m,单月微博传播影响力wb_avg_m:
wx_avg_w=lnwx_dz_avg_w+lnwx_pl_avg_w;
wb_avg_w=lnwb_zf_avg_w+lnwb_ejzf_avg_w+lnwb_pl_avg_w+lnwb_dz_avg_w;
wx_avg_m=lnwx_dz_avg_m+lnwx_pl_avg_m;
wb_avg_m=lnwb_zf_avg_m+lnwb_ejzf_avg_m+lnwb_pl_avg_m+lnwb_dz_avg_m。
实施例还计算广告投放量,也即是广告影响力,包括单周广告影响力和单月广告影响力,由官方网站广告投放量、官方网站广告价格进行计算,其计算公式包括:
Impactad_w=lnwebsite_ads_num_w+lnwebsite_ads_price_w;
Impactad_m=lnwebsite_ads_num_m+lnwebsite_ads_price_m;
其中,Impactad_w代表单周广告影响力,Impactad_m代表单月广告影响力,website_ads_num_w代表单周官方网站广告投放量,website_ads_price_w代表单周官方网站广告平均每展示一万次的价格,website_ads_num_m代表单月官方网站广告投放量,website_ads_price_m代表单月官方网站广告平均每展示一万次的价格。
结合图3,计算综合影响力包括计算单周综合影响力和单月综合影响力。计算单周综合影响力由单周认知度影响力、单周覆盖面影响力、单周推送量影响力、单周传播影响力、单周广告影响力进行计算,计算公式为:
Impactw=a*Impactrzd_w+b*Impactfgm_w+c*Impacttsl_w+d*Impactcb_w+e*Impactad_w;其中,Impactw为单周综合影响力,Impactrzd_w为单周认知度影响力,Impactfgm_w为单周覆盖面影响力,Impacttsl_w为单周推送量影响力,Impactcb_w为单周传播影响力,Impactad_w为单周广告影响力,a、b、c、d、e为各项权重,且权重之和为1。
实施例中根据所述分项影响力分别计算第一期限、第二期限和第三期限的综合影响力,所述第一期限为周、第二期限为月,第三期限为年。
而年度综合影响力根据单月综合影响力进行计算,计算公式为:Impacty=∑m∈monthImpactm;其中,Impacty为年度综合影响力,Impactm为单月综合影响力。经过步骤S4,最终获得目标网络新闻媒体的单周综合影响力、单月综合影响力和年度综合影响力。
实施例二
请参阅图4,图4是本发明实施例公开的基于多源数据融合的网络新闻媒体影响力评估装置的结构示意图。如图4所示,该基于多源数据融合的网络新闻媒体影响力评估装置可以包括账户收集模块401、信息采集模块402和影响力计算模块403,其中,账户收集模块401:用于收集账户信息,所述账户信息包括账户名和媒体平台账号;信息采集模块402:用于采集与账户信息相关的多源目标媒体信息,所述多源目标媒体信息包括粉丝数量、文章链接、传播数据;影响力计算模块403:用于分别计算每一种类别的目标媒体信息对应的分项影响力,并根据所述分项影响力计算所述账户信息的综合影响力。本实施例的具体实施原理和带来的有益效果与实施例一相同,在此不再赘述。
实施例三
请参阅图5,图5是本发明实施例公开的一种电子设备的结构示意图。电子设备可以是计算机以及服务器等,当然,在一定情况下,还可以是收集、平板电脑以及监控终端等智能设备,以及具有处理功能的图像采集装置。如图5所示,该电子设备可以包括:
存储有可执行程序代码的存储器501;
与存储器501耦合的处理器502;
其中,处理器502调用存储器501中存储的可执行程序代码,执行实施例一中的基于多源数据融合的网络新闻媒体影响力评估方法中的部分或全部步骤。
本发明实施例公开一种计算机可读存储介质,其存储计算机程序,其中,该计算机程序使得计算机执行实施例一中的基于多源数据融合的网络新闻媒体影响力评估方法中的部分或全部步骤。
本发明实施例还公开一种计算机程序产品,其中,当计算机程序产品在计算机上运行时,使得计算机执行实施例一中的基于多源数据融合的网络新闻媒体影响力评估方法中的部分或全部步骤。
本发明实施例还公开一种应用发布平台,其中,应用发布平台用于发布计算机程序产品,其中,当计算机程序产品在计算机上运行时,使得计算机执行实施例一中的基于多源数据融合的网络新闻媒体影响力评估方法中的部分或全部步骤。
在本发明的各种实施例中,应理解,所述各过程的序号的大小并不意味着执行顺序的必然先后,各过程的执行顺序应以其功能和内在逻辑确定,而不应对本发明实施例的实施过程构成任何限定。
所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物单元,即可位于一个地方,或者也可以分布到多个网络单元上。可根据实际的需要选择其中的部分或全部单元来实现本实施例方案的目的。
另外,在本发明各实施例中的各功能单元可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中。所述集成的单元既可以采用硬件的形式实现,也可以采用软件功能单元的形式实现。
所述集成的单元若以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可获取的存储器中。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的全部或者部分,可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储器中,包括若干请求用以使得一台计算机设备(可以为个人计算机、服务器或者网络设备等,具体可以是计算机设备中的处理器)执行本发明的各个实施例所述方法的部分或全部步骤。
在本发明所提供的实施例中,应理解,“与A对应的B”表示B与A相关联,根据A可以确定B。但还应理解,根据A确定B并不意味着仅仅根据A确定B,还可以根据A和/或其他信息确定B。
本领域普通技术人员可以理解所述实施例的各种方法中的部分或全部步骤是可以通过程序来指令相关的硬件来完成,该程序可以存储于计算机可读存储介质中,存储介质包括只读存储器(Read-Only Memory,ROM)、随机存储器(Random Access Memory,RAM)、可编程只读存储器(Programmable Read-only Memory,PROM)、可擦除可编程只读存储器(Erasable Programmable Read-Only Memory,EPROM)、一次可编程只读存储器(One-timeProgrammable Read-Only Memory,OTPROM)、电子抹除式可复写只读存储器(Electrically-Erasable Programmable Read-Only Memory,EEPROM)、只读光盘(CompactDisc Read-Only Memory,CD-ROM)或其他光盘存储器、磁盘存储器、磁带存储器、或者能够用于携带或存储数据的计算机可读的任何其他介质。
以上对本发明实施例公开的基于多源数据融合的网络新闻媒体影响力评估方法、装置、电子设备及存储介质进行了详细介绍,本文中应用了具体个例对本发明的原理及实施方式进行了阐述,以上实施例的说明只是用于帮助理解本发明的方法及其核心思想;同时,对于本领域的一般技术人员,依据本发明的思想,在具体实施方式及应用范围上均会有改变之处,综上所述,本说明书内容不应理解为对本发明的限制。

Claims (10)

1.一种基于多源数据融合的网络新闻媒体影响力评估方法,其特征在于,包括:
收集账户信息,所述账户信息包括账户名和媒体平台账号;
采集与账户信息相关的多源目标媒体信息,所述多源目标媒体信息包括粉丝数量、文章链接、传播数据;
分别计算每一种类别的多源目标媒体信息对应的分项影响力,并根据所述分项影响力计算所述账户信息的综合影响力。
2.根据权利要求1所述的网络新闻媒体影响力评估方法,其特征在于,所述收集账户信息包括:
收集目标网络媒体的账户名,所述账户名包括中文账户名和英文账户名;
基于爬虫技术和所述账户名采集与所述账户名匹配的媒体平台账户,所述媒体平台账户包括媒体平台账户名和官方网站链接。
3.根据权利要求2所述的网络新闻媒体影响力评估方法,其特征在于,所述收集账户信息还包括:
整理所收集的全部账户名和媒体平台账户得到冗余数据,剔除所述冗余数据。
4.根据权利要求1所述的网络新闻媒体影响力评估方法,其特征在于,所述采集与账户信息相关的多源目标媒体信息包括:
选取多个信源作为信息获取渠道,根据所述信息获取渠道获取与账户信息相关的多源目标媒体信息。
5.根据权利要求4所述的网络新闻媒体影响力评估方法,其特征在于,所述信息获取渠道包括微博、微信公众号和搜索网站,所述传播数据还包括搜索指数、文章评论数量、文章点赞数量、文章转发数量和广告投放量。
6.根据权利要求5所述的网络新闻媒体影响力评估方法,其特征在于,所述分别计算每一种类别的目标媒体信息对应的分项影响力,包括:
分别计算在不同设定期限内的搜索指数、粉丝数量、文章推送数量、文章评论数量和广告投放量。
7.根据权利要求6所述的网络新闻媒体影响力评估方法,其特征在于,所述根据所述分项影响力计算所述账户信息的综合影响力,包括:
根据所述分项影响力分别计算第一期限、第二期限和第三期限的综合影响力,所述第一期限为周、第二期限为月,第三期限为年。
8.一种基于多源数据融合的网络新闻媒体影响力评估装置,其特征在于,包括:
账户收集模块:用于收集账户信息,所述账户信息包括账户名和媒体平台账号;
信息采集模块:用于采集与账户信息相关的多源目标媒体信息,所述多源目标媒体信息包括粉丝数量、文章链接、传播数据;
影响力计算模块:用于分别计算每一种类别的目标媒体信息对应的分项影响力,并根据所述分项影响力计算所述账户信息的综合影响力。
9.一种电子设备,其特征在于,包括:存储有可执行程序代码的存储器;与所述存储器耦合的处理器;所述处理器调用所述存储器中存储的所述可执行程序代码,用于执行权利要求1至7任一项所述的基于多源数据融合的网络新闻媒体影响力评估方法。
10.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质存储计算机程序,其中,所述计算机程序使得计算机执行权利要求1至7任一项所述的基于多源数据融合的网络新闻媒体影响力评估方法。
CN202211365279.4A 2022-11-03 2022-11-03 基于多源数据融合的网络新闻媒体影响力评估方法及装置 Pending CN115640486A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202211365279.4A CN115640486A (zh) 2022-11-03 2022-11-03 基于多源数据融合的网络新闻媒体影响力评估方法及装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202211365279.4A CN115640486A (zh) 2022-11-03 2022-11-03 基于多源数据融合的网络新闻媒体影响力评估方法及装置

Publications (1)

Publication Number Publication Date
CN115640486A true CN115640486A (zh) 2023-01-24

Family

ID=84946524

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202211365279.4A Pending CN115640486A (zh) 2022-11-03 2022-11-03 基于多源数据融合的网络新闻媒体影响力评估方法及装置

Country Status (1)

Country Link
CN (1) CN115640486A (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN116634230A (zh) * 2023-05-24 2023-08-22 天津大学 一种基于多通道新媒体热点事件传播效果分析的投放方法

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20130218883A1 (en) * 2012-02-21 2013-08-22 Salesforce.Com, Inc. Method and system for providing information from a customer relationship management system
CN109299420A (zh) * 2018-09-18 2019-02-01 精硕科技(北京)股份有限公司 社交媒体账号处理方法、装置、设备及可读存储介质
CN112613692A (zh) * 2020-11-24 2021-04-06 中国传媒大学 融媒体传播效果评估方法、存储介质和电子设备

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20130218883A1 (en) * 2012-02-21 2013-08-22 Salesforce.Com, Inc. Method and system for providing information from a customer relationship management system
CN109299420A (zh) * 2018-09-18 2019-02-01 精硕科技(北京)股份有限公司 社交媒体账号处理方法、装置、设备及可读存储介质
CN112613692A (zh) * 2020-11-24 2021-04-06 中国传媒大学 融媒体传播效果评估方法、存储介质和电子设备

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
卢小兰: "基于主成分分析和聚类分析的新闻媒体微博影响力研究", 《武汉商学院学报》, vol. 35, no. 6 *

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN116634230A (zh) * 2023-05-24 2023-08-22 天津大学 一种基于多通道新媒体热点事件传播效果分析的投放方法
CN116634230B (zh) * 2023-05-24 2024-03-22 天津大学 一种基于多通道新媒体热点事件传播效果分析的投放方法

Similar Documents

Publication Publication Date Title
US20220116347A1 (en) Location resolution of social media posts
CN110704572B (zh) 疑似非法集资风险的预警方法、装置、设备和存储介质
CN107346496B (zh) 目标用户定向方法及装置
CN107122467B (zh) 一种搜索引擎的检索结果评价方法及装置、计算机可读介质
US20210042767A1 (en) Digital content prioritization to accelerate hyper-targeting
CN108805598B (zh) 相似度信息确定方法、服务器及计算机可读存储介质
CN109711955B (zh) 基于当前订单的差评预警方法、***、黑名单库建立方法
WO2011146391A2 (en) Data collection, tracking, and analysis for multiple media including impact analysis and influence tracking
CN111488385B (zh) 基于人工智能的数据处理方法、装置和计算机设备
CN115391669B (zh) 一种智能推荐方法、装置、电子设备
CN112070564B (zh) 广告拉取方法、装置、***与电子设备
CN112632405A (zh) 一种推荐方法、装置、设备及存储介质
CN113901308A (zh) 基于知识图谱的企业推荐方法及推荐装置、电子设备
CN111582932A (zh) 场景间信息推送方法、装置、计算机设备及存储介质
CN115640486A (zh) 基于多源数据融合的网络新闻媒体影响力评估方法及装置
CN112184300A (zh) 一种达人匹配方法、介质、***和设备
CN111429161A (zh) 特征提取方法、特征提取装置、存储介质及电子设备
CN114693409A (zh) 产品匹配方法、装置、计算机设备、存储介质和程序产品
KR101927578B1 (ko) 기업정보 제공 시스템 및 방법
CN108022150B (zh) 基于o2o数据的推荐方法和***
CN113468394A (zh) 一种数据处理方法、装置、电子设备及存储介质
CN116976995A (zh) 多目标推荐的处理方法及装置
US20220408155A1 (en) System and method for providing media content
CN111460300B (zh) 网络内容推送方法、装置及存储介质
CN111859146A (zh) 信息挖掘方法、装置及电子设备

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination