CN109388740A - 一种网络信息传播效果的监测方法及装置 - Google Patents
一种网络信息传播效果的监测方法及装置 Download PDFInfo
- Publication number
- CN109388740A CN109388740A CN201710663796.2A CN201710663796A CN109388740A CN 109388740 A CN109388740 A CN 109388740A CN 201710663796 A CN201710663796 A CN 201710663796A CN 109388740 A CN109388740 A CN 109388740A
- Authority
- CN
- China
- Prior art keywords
- text
- information
- preset
- network
- similar
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q30/00—Commerce
- G06Q30/02—Marketing; Price estimation or determination; Fundraising
- G06Q30/0241—Advertisements
- G06Q30/0242—Determining effectiveness of advertisements
- G06Q30/0245—Surveys
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q30/00—Commerce
- G06Q30/02—Marketing; Price estimation or determination; Fundraising
- G06Q30/0241—Advertisements
- G06Q30/0277—Online advertisement
Landscapes
- Business, Economics & Management (AREA)
- Engineering & Computer Science (AREA)
- Accounting & Taxation (AREA)
- Development Economics (AREA)
- Strategic Management (AREA)
- Finance (AREA)
- Game Theory and Decision Science (AREA)
- Entrepreneurship & Innovation (AREA)
- Economics (AREA)
- Marketing (AREA)
- Physics & Mathematics (AREA)
- General Business, Economics & Management (AREA)
- General Physics & Mathematics (AREA)
- Theoretical Computer Science (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
本发明公开了一种网络信息传播效果的监测方法及装置,涉及文本数据处理技术领域,主要目的在于对目标文本信息在网络中的传播进行自动跟踪、监测,以评估该目标文本信息在网络中的传播效果。本发明的方法包括:获取目标文本;检索网络中与所述目标文本相似的相似文本,所述相似文本是指与所述目标文本的正文信息相同或者基于所述目标文本在预定范围内修改得到的文本;通过预置爬虫爬取所述相似文本的预置参数信息,所述预置爬虫是具有可视化配置的基于浏览器核心的网络爬虫;利用所述预置参数信息在至少一个维度中进行分析,得到所述目标文本在网络中传播效果的评估结果。本发明主要用于评价网络信息的传播效果。
Description
技术领域
本发明涉及文本数据处理技术领域,尤其涉及一种网络信息传播效果的监测方法及装置。
背景技术
近年来,公关投放成为互联网营销中越来越重要的部分,较为常见的公关手段是利用互联网上的各类媒体站点来发布广告主的公关文章(包括广告、软文、公关稿等)来达到品牌曝光、提升品牌好感度的效果。通常的商业模式是由广告主会将自己的公关需求交给代理公司,由代理公司帮助写稿以及媒体投放,然后将投放的媒体以及软文所在网页的链接整理成报表反馈给广告主,以此来衡量软文投放的媒体数和效果。然而这里存在有两种风险:第一,代理公司反馈给客户的表格中的信息客户可能是没有时间逐一打开链接审核的,存在可能造假的情况,使得广告主无法达到宣传效果。第二,代理公司只反馈给广告主需要投放的文章链接,或者通过搜索引擎搜索文章标题等方式进行整理,如此对于有些媒体的主动转载,或者个别媒体的内容没有被搜索引擎收录,那这部分数据内容带来的广告效益也是无法监测的。
目前,广告主获取客观的评估公关稿传播效果的主要方式是通过舆情***,配置公关稿中的关键词,获取相应的文章,再通过人工二次筛选掉无关的文本信息,从而得到的评估报告。然而,该方法的问题是当含有相同关键词的文章很多时,舆情***无法识别出哪些是与广告主投放的公关稿相关的文本数据,仍然需要大量人工从众多数据中进行筛选。同时受限于舆情产品的监测范围,舆情产品所能够提供的分析维度较少,且售价一般都比较高,如果没有舆情监测需求,只是因为想要监测公关稿的相关数据的传播效果也是十分不经济的。
发明内容
鉴于上述问题,本发明提供一种网络信息传播效果的监测方法及装置,主要目的在于对目标文本信息在网络中的传播进行自动跟踪、监测,以评估该目标文本信息在网络中的传播效果。
为解决上述技术问题,一方面,本发明提供了一种网络信息传播效果的监测方法,该方法包括:
获取目标文本;
检索网络中与所述目标文本相似的相似文本,所述相似文本是指与所述目标文本的正文信息相同或者基于所述目标文本在预定范围内修改得到的文本;
通过预置爬虫爬取所述相似文本的预置参数信息,所述预置爬虫是具有可视化配置的基于浏览器核心的网络爬虫;
利用所述预置参数信息在至少一个维度中进行分析,得到所述目标文本在网络中传播效果的评估结果。
优选的,所述检索网络中与所述目标文本相似的相似文本包括:
获取网络中的文本信息;
在所述文本信息中筛选含有所述目标文本中的预置关键词的筛选文本;
在所述筛选文本中匹配出包含所述目标文本中的预置句子的相似文本。
优选的,所述获取网络中的文本信息包括:
利用网络爬虫爬取网络中文本格式的数据信息,并解析所述数据信息进行结构化保存,得到第一检索文本信息,所述结构化保存包括存储所述数据信息的标题、正文、链接地址、来源信息;
利用至少一个搜索引擎搜索所述标目标文本的标题信息,得到结构化保存的第二检索文本信息;
将所述第一检索文本信息与第二检索文本信息进行合并去重处理,得到用于检索的文本信息。
优选的,在所述文本信息中筛选含有所述目标文本中的预置关键词的筛选文本包括:
从所述目标文本中确定多个预置关键词;
逐一判断所述文本信息中是否含有所述多个预置关键词;
若含有,则将所述文本信息确定为所述筛选文本。
优选的,在所述筛选文本中匹配出包含所述目标文本中的预置句子的相似文本包括:
从所述目标文本中确定多个预置句子;
逐一判断所述筛选文本中含有与所述多个预置句子相同的句子的数量;
若所述数量大于阈值,则将所述筛选文本确定为所述相似文本。
优选的,所述通过预置爬虫爬取所述相似文本的预置参数信息包括:
根据所述预置爬虫的配置信息确定爬取位置与所述预置参数信息的对应关系;
利用所述预置爬虫获取在所述相似文本中所述爬取位置对应的数据信息;
将所述数据信息确定为所述预置参数信息,所述预置参数信息包含评论数、阅读数、点赞数以及评论内容中的至少一种。
优选的,利用所述预置参数信息在至少一个维度中进行分析包括:
确定各个维度中用于计算所述评估结果的所述相似文本中的结构化信息和/或预置参数信息;
确定用于计算所述评估结果的维度数量以及维度信息;
基于所述维度数量以及维度信息计算所述目标文本在网络中传播效果的评估结果。
第二方面,本发明还提供了一种网络信息传播效果的监测装置,该装置包括:
获取单元,用于获取目标文本;
检索单元,用于检索网络中与所述获取单元获取的目标文本相似的相似文本,所述相似文本是指与所述目标文本的正文信息相同或者基于所述目标文本在预定范围内修改得到的文本;
爬取单元,用于通过预置爬虫爬取所述检索单元得到的相似文本的预置参数信息,所述预置爬虫是具有可视化配置的基于浏览器核心的网络爬虫;
分析单元,用于利用所述爬取单元爬取的预置参数信息在至少一个维度中进行分析,得到所述目标文本在网络中传播效果的评估结果。
优选的,所述检索单元包括:
获取模块,用于获取网络中的文本信息;
筛选模块,用于在所述获取模块得到的文本信息中筛选含有所述目标文本中的预置关键词的筛选文本;
匹配模块,用于在所述筛选模块得到的筛选文本中匹配出包含所述目标文本中的预置句子的相似文本。
优选的,所述获取模块包括:
爬取子模块,用于利用网络爬虫爬取网络中文本格式的数据信息,并解析所述数据信息进行结构化保存,得到第一检索文本信息,所述结构化保存包括存储所述数据信息的标题、正文、链接地址、来源信息;
搜索子模块,用于利用至少一个搜索引擎搜索所述标目标文本的标题信息,得到结构化保存的第二检索文本信息;
处理子模块,用于将所述爬取子模块得到的第一检索文本信息与所述搜索子模块得到的第二检索文本信息进行合并去重处理,得到用于检索的文本信息。
优选的,所述筛选模块包括:
确定子模块,用于从所述目标文本中确定多个预置关键词;
判断子模块,用于逐一判断所述文本信息中是否含有所述确定子模块确定的多个预置关键词;
所述确定子模块还用于,当所述判断子模块判断含有多个预置关键词时,将所述文本信息确定为所述筛选文本。
优选的,所述匹配模块包括:
确定子模块,用于从所述目标文本中确定多个预置句子;
判断子模块,用于逐一判断所述筛选文本中含有与所述确定子模块确定的多个预置句子相同的句子的数量;
所述确定子模块还用于,当所述判断子模块判断含有与多个预置句子相同的句子的数量大于阈值时,将所述筛选文本确定为所述相似文本。
优选的,所述爬取单元包括:
确定模块,用于根据所述预置爬虫的配置信息确定爬取位置与所述预置参数信息的对应关系;
获取模块,用于利用所述预置爬虫获取在所述相似文本中所述确定模块确定的爬取位置对应的数据信息;
所述确定模块还用于,将所述获取模块得到的数据信息确定为所述预置参数信息,所述预置参数信息包含评论数、阅读数、点赞数以及评论内容中的至少一种。
优选的,所述分析单元包括:
确定模块,用于确定各个维度中用于计算所述评估结果的所述相似文本中的结构化信息和/或预置参数信息;
所述确定模块还用于,确定用于计算所述评估结果的维度数量以及维度信息;
计算模块,用于基于所述确定模块确定的维度数量以及维度信息计算所述目标文本在网络中传播效果的评估结果。
为了实现上述目的,根据本发明的第三方面,还提供了一种存储介质,所述存储介质包括存储的程序,其中,在所述程序运行时控制所述存储介质所在设备执行上述所述的网络信息传播效果的监测方法。
此外,根据本发明的第四方面,还提供了一种处理器,所述处理器用于运行程序,其中,所述程序运行时执行上述所述的网络信息传播效果的监测方法。
借由上述技术方案,本发明提供的网络信息传播效果的监测方法及装置,通过接收所要监测的目标文本的标题与正文,在网络中自动查找与该目标文本相似的文本,主要是指内容完全相同或大部分相同的文本,用这些文本作为评价目标文本在网络中的传播效果的基础信息,并且,本发明还基于该基础信息,使用预置爬虫来获取每篇相似文本中的预置参数信息,以此来衡量单个相似文本在网络中传播的具体效果,通过从不同的维度可以得到不同的分析结果,不论是传播的深度或者是广度,使得评估结果具有全方位的评价分析,能够为用户提供客观全面的分析数据,以指导用户进行更为高效的信息投放,从而提高文本信息在网络中的投放效果,为用户节省公关成本。
上述说明仅是本发明技术方案的概述,为了能够更清楚了解本发明的技术手段,而可依照说明书的内容予以实施,并且为了让本发明的上述和其它目的、特征和优点能够更明显易懂,以下特举本发明的具体实施方式。
附图说明
通过阅读下文优选实施方式的详细描述,各种其他的优点和益处对于本领域普通技术人员将变得清楚明了。附图仅用于示出优选实施方式的目的,而并不认为是对本发明的限制。而且在整个附图中,用相同的参考符号表示相同的部件。在附图中:
图1示出了本发明实施例提供的一种网络信息传播效果的监测方法流程图;
图2示出了本发明实施例提供的另一种网络信息传播效果的监测方法流程图;
图3示出了本发明实施例提供的一种网络信息传播效果的监测装置的组成框图;
图4示出了本发明实施例提供的另一种网络信息传播效果的监测装置的组成框图。
具体实施方式
下面将参照附图更详细地描述本发明的示例性实施例。虽然附图中显示了本发明的示例性实施例,然而应当理解,可以以各种形式实现本发明而不应被这里阐述的实施例所限制。相反,提供这些实施例是为了能够更透彻地理解本发明,并且能够将本发明的范围完整的传达给本领域的技术人员。
为了客观、高效的计算文本数据在网络中的传播效果,本发明实施例提供了一种网络信息传播效果的监测方法,具体如图1所示,该方法包括:
101、获取目标文本。
在本发明实施例中,所监测的网络信息包括用户上传的文本、视频、图片、音频等数据,而目前应用最为广泛的是文本信息,以此达到传播、宣传等公关效果。而对于文本信息的监控,本实施例仅需要用户上传目标文本即可实现对该文本在网络中的传播状态分析。
本步骤中是针对用户上传的目标文本进行解析,区分出该目标文本的标题信息和正文信息。其中,标题与正文的区分方式可以通过位置、字体等具体区分,一般标题都会出现在一篇文本的首段,并且,标题的字体也一般会大于正文的字体。此外,通过自然语言分析方法也可以解析出文本的标题与正文,因此,对于解析文本的标题与正文的具体方式,本发明实施例不做具体限定。
此外,对于所获取的目标文本,本步骤也不具体限定目标文本的数量,即可以是用户上传的一篇,也可以是多篇不同的目标文本。而对于多篇不同的目标文本,本步骤首先会判断这些目标文本中是否存在相同的文本,若相同,则对其进行去重处理,仅监测其中的一篇目标文本的网络传播状态。对于不同的目标文本,将逐一分析每一篇的标题信息与正文信息,并执行后续步骤分别对每一篇目标文本进行监控。
102、检索网络中与目标文本相似的相似文本。
本步骤是根据目标文本在整个互联网中检索相似的文本信息。其中,相似文本是指与目标文本的正文信息相同或者是基于目标文本在预定范围内修改得到的文本。
在本发明实施例中,检索到的相似文本将会视为与目标文本相同的文本,以此来统计分析目标文本在网络中的传播效果。而对于目标文本而言,其在网络中传播时可能会被传播的网络用户或媒体进行一定程度的修改,比如修改标题中的词汇,调整正文中语句的顺序,或者是对其中的部分语句进行删减、替换等,使得在该目标文本的基础上得到了一篇新的文本。对此,本步骤的主要目的就是要判断网络用户对目标文本的修改程度是否在一个预定的范围内,一般的,在该范围内的得到的文本会被认为还是该目标文本,此时,将修改过的文本定义为相似文本,而当文本的修改超出该范围时,则认为修改后的文本仅是借鉴了目标文本中的部分内容,并不能算对目标文本的网络传播。因此,对预定范围的设置就是确定目标文本修改程度的限定,将在此范围内修改得到的文本确认为相似文本。
对于具体的检索方式,本步骤通过采用网络爬虫爬取互联网中的大量文本数据,同时,通过检索引擎对目标文本的题目进行检索,将得到的检索结果与爬取的文本共同构建成一个基础数据库,以此作为查找显示文本的基础。
在所构建的数据库基础上,将目标文本与数据库中的文本进行匹配,判断其是否为相似文本,具体的判断方式可以通过自然语言处理的方式,具体的匹配方式在本步骤中不做限定,仅需要确定上述的预定范围,以此来筛选符合的文本,得到等同于目标文本的相似文本。
103、通过预置爬虫爬取相似文本的预置参数信息。
其中,所述的预置爬虫是具有可视化配置的基于浏览器核心的网络爬虫,该预置爬虫与现有的网络爬虫的区别在于设置配置文件的方式不同,该预置爬虫在设置配置文件时,可以通过可视化的圈选操作来指定页面中要爬取的内容,具体是预置爬虫通过接收用户在页面中圈选的内容或位置,由后台服务器根据该页面生成一个识别规则,将该识别规则再应用于其他所有的页面中,当然,该识别规则是要适用于文本所在的页面。由此,对于预置爬虫使用门槛将大幅减低,当用户需要重新设定要获取的相似文本的参数信息时,不需要用户具有专业的编程知识也可以方便对预置爬虫进行设置,实现了可视化的配置网络爬虫;另外,由于预置爬虫预先配置了所要爬取的内容或位置,爬取的准确度更高,且有效减少了爬虫爬取的数据量,返回数据更快更准。此外,该预置爬虫的另一特点是基于浏览器核心的网络爬虫端,如此,该预置爬虫所爬取的数据内容就是最终显示在浏览器页面中的数据,其隐藏了网络通信的复杂度,通过模拟浏览器加载页面的过程来爬取页面数据,因此,该网络爬虫能够爬取现有网络爬虫难于爬取的页面中通过二次加载所显示的数据,比如,通过Ajax请求加载的互动评论、弹幕等内容。
此外,预置参数信息是与所要爬取的相似文本显示在同一页面中的,与该相似文本相关联的数据内容。较为常见的预置参数信息包括评论数、阅读数、点赞数、评论内容等内容,这些参数可以较为直观的显示出当前相似文本的受关注程度。
104、利用预置参数信息在至少一个维度中进行分析,得到目标文本在网络中传播效果的评估结果。
本步骤是在对与目标文本相似的所有相似文本使用预置爬虫爬取了预置参数信息后,综合所有的相似文本对应的预置参数信息进行分析,计算出该目标文本传播效果的评估结果,进而可以再生成对应的评估报告反馈给用户。其中,在进行分析时,可以利用不同的预置参数信息从多个不同的维度分别进行分析,比如,通过统计总的阅读数或评论数,就可以评估出该目标文本传播的广度,而通过统计评论发布的时间,就可以评估出该目标文本传播速度的快慢。
针对分析的具体维度以及维度的数量,则是由用户在对目标文本进行监控时所预先设置的,本发明实施例提供基于用户的选择而进行的多维度的分析计算功能,并最终综合给出评估报告。
结合上述本发明上述实施例所提供的网络信息传播效果的监测方法可以看出,本发明实施例主要通过接收所要监测的目标文本,解析出对应的标题与正文,在网络中自动查找与该目标文本相似的文本,主要是指内容完全相同或大部分相同的文本,用这些文本作为评价目标文本在网络中的传播效果的基础数据信息,并且,本发明实施例还基于该基础信息,使用预置爬虫来获取每篇相似文本中的预置参数信息,以此来衡量单个相似文本在网络中传播的具体效果,再统计所有相似文本的预置参数信息通过从不同的维度所得到的不同分析结果,不论是传播的深度或者是广度,使得评估结果具有全方位的评价分析,以此为用户提供客观全面的分析数据,以指导用户进行更为高效的信息投放,从而提高文本信息在网络中的投放效果,为用户节省公关成本。
进一步的,作为对图1所示实施例的细化及扩展,本发明实施例还提供了另一种网络信息传播效果的监测方法,如图2所示,该方法中主要是针对相似文本的提取以及预置爬虫爬取相关参数信息的具体细化说明,具体步骤如下:
201、获取目标文本。
本步骤中,获取的目标文本的标题信息和正文信息可以是用户直接上传所获取的,也可以是用户直接上传目标文本,通过自动解析得到对应的标题信息与正文信息,对此,与上述实施例中的步骤101的内容相同,此处不再赘述。
202、获取网络中的文本信息。
本步骤是要构建一个用于检索相似文本的基础数据库,在该数据库中存储有能够从互联网中获取的所有的文本信息,其具体步骤如下:
首先,利用网络爬虫爬取网络中文本格式的数据信息,并解析爬取到的数据信息进行结构化保存,得到第一检索文本信息。
其中,对所使用的网络爬虫不做具体限定,需要说明的是,对于爬取数据信息的过程,是一个重复更新的过程,即爬虫根据设定的周期,定期爬取互联网中的文本信息,并对上一次所爬取的结果进行更新。
本步骤中进行的结构化保存是指对爬取到的文本格式的数据信息进行解析、识别,提取需要的数据信息,按照指定的结构存储该文本,其中,需要识别提取的结构信息包括标题、正文、链接地址、来源信息等。此外,通过链接地址和来源信息就可以进一步得到该文本信息的传播路径等信息。
将结构化保存的第一检索信息存储在基础数据库中,成为后续数据检索与分析的基础数据。
第二,利用至少一个搜索引擎搜索目标文本的标题信息,得到结构化保存的第二检索文本信息。
该步骤是对上以步骤的补充,因为爬虫在互联网中不可能完全地爬取到所有的文本信息,有一些网站或页面出于自身的访问性能考虑会阻止爬虫的数据爬取操作。所以本步骤通过从一个或多个搜索引擎中再次针对目标文本的标题进行检索。需要说明的是,本步骤中进行的检索的仅提供目标文本的标题,这是因为现有的搜索引擎已经具有较高的智能搜索算法,能够根据提供的题目匹配相关的文本信息,因此,在使用搜索引擎时无需再设置相关的匹配算法以及相关的数据信息。
记录一个或多个搜索引擎的检索结果,并将得到的检索结果进行与上述步骤相同的结构化解析,并存储至基础数据库中,定义本步骤得到的文本信息为第二检索文本信息。
第三,将第一检索文本信息与第二检索文本信息进行合并去重处理,得到用于检索的文本信息。
由于第一检索文本信息与第二检索文本信息是采用不同的检索方式在互联网中获取的文本信息,因此,两者之间有很大的几率存在相同的文本信息,对此,就需要在存储时先进行去重处理,以节省数据库占有的存储资源。本步骤中,对于具体的合并去重操作不做限定。
通过以上步骤,使用不同的文本检索方式获取基础数据库中的文本信息,使得文本信息的检索更加全面,从而避免因漏检影响后续计算结果准确性的情况。
203、在文本信息中筛选含有目标文本中的预置关键词的筛选文本。
本步骤是基于上述的基础数据库中存储的文本信息,先通过预置关键词筛选出部分符合的文本信息,其具体步骤如下:
首先,从目标文本中确定多个预置关键词。其中,预置关键词的确定一般是通过统计目标文本中的词汇,利用一定的算法得到该目标文本中重要的词汇,例如,TF-IDF(termfrequency–inverse document frequency,词频-逆文档频率)算法,余弦相似性等,都是关键词提取的常用算法。
对于预置关键词的数量,则是根据***自身的计算能力自定义设置的,预置关键词的数量越多,后续需要进行匹配计算量也就越大,而结果相对也会越准确。
其次,逐一判断文本信息中是否含有多个预置关键词。即对基础数据库中的每一篇文本信息进行匹配,判断是否含有所确定的预置关键词。
最后,将含有多个预置关键词的文本信息确定为筛选文本。
需要指出的是,筛选文本中需要含有所有的预置关键词,而不是含有其中的一个或多个。
经过上述操作,得到的筛选文本仅是本发明实施例中从基础数据库中初步筛选的文本信息,而后续步骤204还将在所筛选出的文本信息的基础上进行进一步的匹配,以得到与目标文本相似的文本信息。
204、在筛选文本中匹配出包含目标文本中的预置句子的相似文本。
本步骤是在筛选文本的基础上再逐一匹配每一篇筛选文本中是否包含目标文本中的预置句子,以此来确定是否为相似文本,其具体操作步骤如下:
首先,从目标文本中确定多个预置句子。其中,预置句子一般为目标文本中具有代表性的句子,比如,各段落的首句或尾句,目标文本中心段的句子。对于预置句子的提取方式,本步骤不限定是由用户上传文本时指定的句子,或者是根据设置的提取规则提取的句子,而该提取规则可以是指定句子位置或者预置关键词所在句子等预置的句子提取规则。同时,对于预置句子的提取数量,其与预置关键词数量的确定方式相似,主要考虑的依据为***的计算能力。
其次,逐一判断筛选文本中含有与所确定的多个预置句子相同的句子的数量。其中,具体的判断方式则不限定是将预置句子分词后按顺序匹配分词组合的方式,或者是通过计算预置句子对应的哈希值,再判断筛选文本中是否具有相同哈希值的句子的方式。需要指出的是,由于句子中含有的较多的词汇,而在文本传播的过程中,预置句子有可能被用户进行部分修改或删除,因此,在匹配预置句子时,要查找具有的完全相同的多个预置句子的筛选文本的数量可能将十分少甚至不存在,为此,本发明实施例采用的是判断具有相同预置句子的数量是否达到一个预置的阈值,即当筛选文本中具有相同预置句子的数量达到阈值时,就认为该筛选文本为相似文本。
最后,当与预置句子相同的句子的数量大于阈值,将筛选文本确定为相似文本。其中,阈值的设置是根据实际的应用场景所设置的,可以由用户进行自定义设置,比如,在筛选文本的数量较大时,就可以将该阈值的值设置的较高,以此来控制最终相似文本的数量。此外,为了便于设置,该阈值的表现形式也可以是百分比,即相同句子的数量占预置句子的数量的百分比。
通过上述的步骤,本发明实施例针对相似文本的匹配实现了多层次的过滤筛选,从而使得相似文本的确定更加准确,为后续的计算操作提供了更准确的基础数据,增加了评估结果的准确率。
205、通过预置爬虫爬取相似文本的预置参数信息。
其中,预置爬虫在上述实施例的步骤103中已做了具体说明,本步骤中不再赘述,本步骤主要针对预置爬虫的应用进行说明,也就是爬取相似文本的预置参数信息,具体步骤如下:
首先,根据预置爬虫的配置信息确定爬取位置与预置参数信息的对应关系。即提取预置爬虫中的配置信息,由于该预置爬虫是通过可视化操作进行配置的,因此,通过提取其配置信息,来确定该预置爬虫所爬取的预置参数信息有哪些,以及要爬取的页面中的具***置,以此来建立爬取位置与预置参数信息的关联关系。
其次,利用预置爬虫获取在相似文本中对应爬取位置的数据信息。其中,预置爬虫根据配置信息中指定的所有位置信息,对每一篇相似文本中对应位置的数据进行顺序爬取。
最后,根据位置与预置参数信息的关联关系,将数据信息确定为预置参数信息,并进行存储。如上述实施例的步骤103中所述的预置参数信息可以包括评论数、阅读数、点赞数以及评论内容等信息,可见,该预置参数并不是文本中的数据内容,而主要是在经过传播后得到的相关信息,一般是通过网络用户的操作所生成的,比如,评论数、点赞数以及评论内容的位置往往是在正文的后面,评论数和点赞数通过统计计算会显示在页面中的固定位置,评论内容则是根据时间进行更新,但在页面中加载评论内容的位置是相对固定的。
206、利用预置参数信息在至少一个维度中进行分析,得到目标文本在网络中传播效果的评估结果。
本实施例中对于分析的具体过程如下述的步骤:
首先,确定各个维度中用于计算评估结果的文本信息中的结构化信息和/或预置参数信息。
其中,该文本信息为上述的相似文本,在确定出相似文本后,在基础数据库中提取该相似文本的结构化信息,如标题,正文,链接地址等信息,以及预置爬虫所爬取的预置参数信息。同时,将这些数据信息按照需要计算的不同维度进行分类,以便于在不同维度中计算时便于提取。
其次,确定用于计算评估结果的维度数量以及维度信息。
其中,维度的数量需要各个维度信息一般是预先设置的。比如,设置评估的维度为传播的广度和深度,那么计算传播广度所需要对应的参数就是文本被转载的次数,可以通过链接地址的数量加以评价,而计算传播的深度是要看文本被关注的情况,可以通过评论数与评论内容进行评价。
最后,基于维度数量以及维度信息计算目标文本在网络中传播效果的评估结果。其中,对于具体的统计计算方式本发明实施例不做具体限定。
而基于得到的评估结果,可以在该结果的基础上进一步的计算提高目标文本传播效果的方案与途径,以报告的形式的提供给用户,以指导用户进行高效的文本传播或投放的操作。
在得到评估结果后,用户可以根据公关文章在网络中的传播效果判断各个媒体的宣传能力,从而调整投放策略(如对传播广度范围广、传播深度程度高的媒体加大投放力度,而对传播广度范围小、传播深度程度低的媒体减少或停止投放)。
通过大量的公关文章的传播路径,用户还能进一步识别出媒体之间的可能合作关系(例如A媒体的大部分娱乐类文章都被B媒体转载,B媒体的大部分娱乐类文章也会被A媒体转载),那么在公关文章投放时可以考虑选择可能相互合作的几个媒体之一(如A媒体)即可实现预期的媒体宣传效果,为用户大大节省推广费用。
通过对公关文章的传播路径,用户还能容易的查看到对公关文章传播的各个媒体,对于拥有原创版权的文章,可以及时要求未经授权的媒体停止转载文章、避免继续侵犯著作权。
本申请的网络信息传播效果的监测方法还有多种用途,本领域技术人员根据本文的记载和启示,还能想到其他应用场景,此处不一一列举。
进一步的,作为对上述图1、图2所示方法的实现,本发明实施例还提供了一种网络信息传播效果的监测装置,用于对上述图1、图2所示的方法进行实现。该装置实施例与前述方法实施例对应,为便于阅读,本装置实施例不再对前述方法实施例中的细节内容进行逐一赘述,但应当明确,本实施例中的装置能够对应实现前述方法实施例中的全部内容。如图3所示,该装置包括:
获取单元31,用于获取目标文本;
检索单元32,用于检索网络中与所述获取单元31获取的目标文本相似的相似文本,所述相似文本是指与所述目标文本的正文信息相同或者基于所述目标文本在预定范围内修改得到的文本;
爬取单元33,用于通过预置爬虫爬取所述检索单元32得到的相似文本的预置参数信息,所述预置爬虫是具有可视化配置的基于浏览器核心的网络爬虫;
分析单元34,用于利用所述爬取单元33爬取的预置参数信息在至少一个维度中进行分析,得到所述目标文本在网络中传播效果的评估结果。
进一步的,如图4所示,所述检索单元32包括:
获取模块321,用于获取网络中的文本信息;
筛选模块322,用于在所述获取模块321得到的文本信息中筛选含有所述目标文本中的预置关键词的筛选文本;
匹配模块323,用于在所述筛选模块322得到的筛选文本中匹配出包含所述目标文本中的预置句子的相似文本。
进一步的,如图4所示,所述获取模块321包括:
爬取子模块3211,用于利用网络爬虫爬取网络中文本格式的数据信息,并解析所述数据信息进行结构化保存,得到第一检索文本信息,所述结构化保存包括存储所述数据信息的标题、正文、链接地址、来源信息;
搜索子模块3212,用于利用至少一个搜索引擎搜索所述标目标文本的标题信息,得到结构化保存的第二检索文本信息;
处理子模块3213,用于将所述爬取子模块3211得到的第一检索文本信息与所述搜索子模块3212得到的第二检索文本信息进行合并去重处理,得到用于检索的文本信息。
进一步的,如图4所示,所述筛选模块322包括:
确定子模块3221,用于从所述目标文本中确定多个预置关键词;
判断子模块3222,用于逐一判断所述文本信息中是否含有所述确定子模块确定的多个预置关键词;
所述确定子模块3221还用于,当所述判断子模块3222判断含有多个预置关键词时,将所述文本信息确定为所述筛选文本。
进一步的,如图4所示,所述匹配模块323包括:
确定子模块3231,用于从所述目标文本中确定多个预置句子;
判断子模块3232,用于逐一判断所述筛选文本中含有与所述确定子模块3231确定的多个预置句子相同的句子的数量;
所述确定子模块3231还用于,当所述判断子模块3232判断含有与多个预置句子相同的句子的数量大于阈值时,将所述筛选文本确定为所述相似文本。
进一步的,如图4所示,所述爬取单元33包括:
确定模块331,用于根据所述预置爬虫的配置信息确定爬取位置与所述预置参数信息的对应关系;
获取模块332,用于利用所述预置爬虫获取在所述相似文本中所述确定模块331确定的爬取位置对应的数据信息;
所述确定模块331还用于,将所述获取模块332得到的数据信息确定为所述预置参数信息,所述预置参数信息包含评论数、阅读数、点赞数以及评论内容中的至少一种。
进一步的,如图4所示,所述分析单元34包括:
确定模块341,用于确定各个维度中用于计算所述评估结果的所述相似文本中的结构化信息和/或预置参数信息;
所述确定模块341还用于,确定用于计算所述评估结果的维度数量以及维度信息;
计算模块342,用于基于所述确定模块341确定的维度数量以及维度信息计算所述目标文本在网络中传播效果的评估结果。
综上所述,本发明实施例所采用的网络信息传播效果的监测方法及装置,主要是在获取目标文本的相似文本的步骤中,通过多种方式的获取文本信息来确保基础数据库中文本信息的全面性,并且,在过滤筛选相似文本的过程中,也通过多层次的过滤匹配操作来认定哪些文本是目标文本的相似本文,从而使得对目标文本的传播效果计算的基础数据更为精确。此外,在评估计算过程中,本发明实施例还通过预置爬虫来爬取相似文本的相关信息,而预置爬虫的使用有效的降低到了操作者的技术门槛,增加了用户操作的简便性与易用性,而通过提供的多维度分析,也使得用户具有了更多的可选择性,从而可以根据用户的需求为用户提供个性化服务,也极大提高了用户的应用体验。
进一步的,所述网络信息传播效果的监测装置包括处理器和存储器,上述获取单元31、检索单元32、爬取单元33以及分析单元34等均作为程序单元存储在存储器中,由处理器执行存储在存储器中的上述程序单元来实现相应的功能。
处理器中包含内核,由内核去存储器中调取相应的程序单元。内核可以设置一个或以上,通过调整内核参数来对目标文本信息在网络中的传播进行自动跟踪、监测,以评估该目标文本信息在网络中的传播效果。
存储器可能包括计算机可读介质中的非永久性存储器,随机存取存储器(RAM)和/或非易失性内存等形式,如只读存储器(ROM)或闪存(flash RAM),存储器包括至少一个存储芯片。
本发明实施例提供了一种存储介质,其上存储有程序,该程序被处理器执行时实现所述网络信息传播效果的监测方法。
本发明实施例提供了一种处理器,所述处理器用于运行程序,其中,所述程序运行时执行所述网络信息传播效果的监测方法。
本发明实施例提供了一种设备,设备包括处理器、存储器及存储在存储器上并可在处理器上运行的程序,处理器执行程序时实现以下步骤:获取目标文本的标题信息以及正文信息;检索网络中与所述目标文本相似的相似文本,所述相似文本是指与所述目标文本的正文信息相同或者基于所述目标文本在预定范围内修改得到的文本;通过预置爬虫爬取所述相似文本的预置参数信息,所述预置爬虫是具有可视化配置的基于浏览器核心的网络爬虫;利用所述预置参数信息在至少一个维度中进行分析,得到所述目标文本在网络中传播效果的评估结果。
进一步的,所述检索网络中与所述目标文本相似的相似文本包括:
获取网络中的文本信息;
在所述文本信息中筛选含有所述目标文本中的预置关键词的筛选文本;
在所述筛选文本中匹配出包含所述目标文本中的预置句子的相似文本。
进一步的,所述获取网络中的文本信息包括:
利用网络爬虫爬取网络中文本格式的数据信息,并解析所述数据信息进行结构化保存,得到第一检索文本信息,所述结构化保存包括存储所述数据信息的标题、正文、链接地址、来源信息;
利用至少一个搜索引擎搜索所述标目标文本的标题信息,得到结构化保存的第二检索文本信息;
将所述第一检索文本信息与第二检索文本信息进行合并去重处理,得到用于检索的文本信息。
进一步的,在所述文本信息中筛选含有所述目标文本中的预置关键词的筛选文本包括:
从所述目标文本中确定多个预置关键词;
逐一判断所述文本信息中是否含有所述多个预置关键词;
若含有,则将所述文本信息确定为所述筛选文本。
进一步的,在所述筛选文本中匹配出包含所述目标文本中的预置句子的相似文本包括:
从所述目标文本中确定多个预置句子;
逐一判断所述筛选文本中含有与所述多个预置句子相同的句子的数量;
若所述数量大于阈值,则将所述筛选文本确定为所述相似文本。
进一步的,所述通过预置爬虫爬取所述相似文本的预置参数信息包括:
根据所述预置爬虫的配置信息确定爬取位置与所述预置参数信息的对应关系;
利用所述预置爬虫获取在所述相似文本中所述爬取位置对应的数据信息;
将所述数据信息确定为所述预置参数信息,所述预置参数信息包含评论数、阅读数、点赞数以及评论内容中的至少一种。
进一步的,利用所述预置参数信息在至少一个维度中进行分析包括:
确定各个维度中用于计算所述评估结果的所述相似文本中的结构化信息和/或预置参数信息;
确定用于计算所述评估结果的维度数量以及维度信息;
基于所述维度数量以及维度信息计算所述目标文本在网络中传播效果的评估结果。
本发明实施例中的设备不限定是服务器、PC、PAD、手机等终端。
本发明实施例还提供了一种计算机程序产品,当在数据处理设备上执行时,适于执行初始化有如下方法步骤的程序:获取目标文本的标题信息以及正文信息;检索网络中与所述目标文本相似的相似文本,所述相似文本是指与所述目标文本的正文信息相同或者基于所述目标文本在预定范围内修改得到的文本;通过预置爬虫爬取所述相似文本的预置参数信息,所述预置爬虫是具有可视化配置的基于浏览器核心的网络爬虫;利用所述预置参数信息在至少一个维度中进行分析,得到所述目标文本在网络中传播效果的评估结果。
进一步的,所述检索网络中与所述目标文本相似的相似文本包括:
获取网络中的文本信息;
在所述文本信息中筛选含有所述目标文本中的预置关键词的筛选文本;
在所述筛选文本中匹配出包含所述目标文本中的预置句子的相似文本。
进一步的,所述获取网络中的文本信息包括:
利用网络爬虫爬取网络中文本格式的数据信息,并解析所述数据信息进行结构化保存,得到第一检索文本信息,所述结构化保存包括存储所述数据信息的标题、正文、链接地址、来源信息;
利用至少一个搜索引擎搜索所述标目标文本的标题信息,得到结构化保存的第二检索文本信息;
将所述第一检索文本信息与第二检索文本信息进行合并去重处理,得到用于检索的文本信息。
进一步的,在所述文本信息中筛选含有所述目标文本中的预置关键词的筛选文本包括:
从所述目标文本中确定多个预置关键词;
逐一判断所述文本信息中是否含有所述多个预置关键词;
若含有,则将所述文本信息确定为所述筛选文本。
进一步的,在所述筛选文本中匹配出包含所述目标文本中的预置句子的相似文本包括:
从所述目标文本中确定多个预置句子;
逐一判断所述筛选文本中含有与所述多个预置句子相同的句子的数量;
若所述数量大于阈值,则将所述筛选文本确定为所述相似文本。
进一步的,所述通过预置爬虫爬取所述相似文本的预置参数信息包括:
根据所述预置爬虫的配置信息确定爬取位置与所述预置参数信息的对应关系;
利用所述预置爬虫获取在所述相似文本中所述爬取位置对应的数据信息;
将所述数据信息确定为所述预置参数信息,所述预置参数信息包含评论数、阅读数、点赞数以及评论内容中的至少一种。
进一步的,利用所述预置参数信息在至少一个维度中进行分析包括:
确定各个维度中用于计算所述评估结果的所述相似文本中的结构化信息和/或预置参数信息;
确定用于计算所述评估结果的维度数量以及维度信息;
基于所述维度数量以及维度信息计算所述目标文本在网络中传播效果的评估结果。
本领域内的技术人员应明白,本申请的实施例可提供为方法、***、或计算机程序产品。因此,本申请可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。而且,本申请可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、CD-ROM、光学存储器等)上实施的计算机程序产品的形式。
本申请是参照根据本申请实施例的方法、设备(***)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器,使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。
这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读存储器中,使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品,该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。
这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上,使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理,从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。
在一个典型的配置中,计算设备包括一个或多个处理器(CPU)、输入/输出接口、网络接口和内存。
存储器可能包括计算机可读介质中的非永久性存储器,随机存取存储器(RAM)和/或非易失性内存等形式,如只读存储器(ROM)或闪存(flash RAM)。存储器是计算机可读介质的示例。
计算机可读介质包括永久性和非永久性、可移动和非可移动媒体可以由任何方法或技术来实现信息存储。信息可以是计算机可读指令、数据结构、程序的模块或其他数据。计算机的存储介质的例子包括,但不限于相变内存(PRAM)、静态随机存取存储器(SRAM)、动态随机存取存储器(DRAM)、其他类型的随机存取存储器(RAM)、只读存储器(ROM)、电可擦除可编程只读存储器(EEPROM)、快闪记忆体或其他内存技术、只读光盘只读存储器(CD-ROM)、数字多功能光盘(DVD)或其他光学存储、磁盒式磁带,磁带磁磁盘存储或其他磁性存储设备或任何其他非传输介质,可用于存储可以被计算设备访问的信息。按照本文中的界定,计算机可读介质不包括暂存电脑可读媒体(transitory media),如调制的数据信号和载波。
还需要说明的是,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、商品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、商品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括要素的过程、方法、商品或者设备中还存在另外的相同要素。
本领域技术人员应明白,本申请的实施例可提供为方法、***或计算机程序产品。因此,本申请可采用完全硬件实施例、完全软件实施例或结合软件和硬件方面的实施例的形式。而且,本申请可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、CD-ROM、光学存储器等)上实施的计算机程序产品的形式。
以上仅为本申请的实施例而已,并不用于限制本申请。对于本领域技术人员来说,本申请可以有各种更改和变化。凡在本申请的精神和原理之内所作的任何修改、等同替换、改进等,均应包含在本申请的权利要求范围之内。
Claims (10)
1.一种网络信息传播效果的监测方法,其特征在于,所述方法包括:
获取目标文本;
检索网络中与所述目标文本相似的相似文本,所述相似文本是指与所述目标文本的正文信息相同或者基于所述目标文本在预定范围内修改得到的文本;
通过预置爬虫爬取所述相似文本的预置参数信息,所述预置爬虫是具有可视化配置的基于浏览器核心的网络爬虫;
利用所述预置参数信息在至少一个维度中进行分析,得到所述目标文本在网络中传播效果的评估结果。
2.根据权利要求1所述的方法,其特征在于,所述检索网络中与所述目标文本相似的相似文本包括:
获取网络中的文本信息;
在所述文本信息中筛选含有所述目标文本中的预置关键词的筛选文本;
在所述筛选文本中匹配出包含所述目标文本中的预置句子的相似文本。
3.根据权利要求2所述的方法,其特征在于,所述获取网络中的文本信息包括:
利用网络爬虫爬取网络中文本格式的数据信息,并解析所述数据信息进行结构化保存,得到第一检索文本信息,所述结构化保存包括存储所述数据信息的标题、正文、链接地址、来源信息;
利用至少一个搜索引擎搜索所述目标文本的标题信息,得到结构化保存的第二检索文本信息;
将所述第一检索文本信息与第二检索文本信息进行合并去重处理,得到用于检索的文本信息。
4.根据权利要求2或3所述的方法,其特征在于,在所述文本信息中筛选含有所述目标文本中的预置关键词的筛选文本包括:
从所述目标文本中确定多个预置关键词;
逐一判断所述文本信息中是否含有所述多个预置关键词;
若含有,则将所述文本信息确定为所述筛选文本。
5.根据权利要求2或3所述的方法,其特征在于,在所述筛选文本中匹配出包含所述目标文本中的预置句子的相似文本包括:
从所述目标文本中确定多个预置句子;
逐一判断所述筛选文本中含有与所述多个预置句子相同的句子的数量;
若所述数量大于阈值,则将所述筛选文本确定为所述相似文本。
6.根据权利要求1-3中任一项所述的方法,其特征在于,所述通过预置爬虫爬取所述相似文本的预置参数信息包括:
根据所述预置爬虫的配置信息确定爬取位置与所述预置参数信息的对应关系;
利用所述预置爬虫获取在所述相似文本中所述爬取位置对应的数据信息;
将所述数据信息确定为所述预置参数信息,所述预置参数信息包含评论数、阅读数、点赞数以及评论内容中的至少一种。
7.根据权利要求3所述的方法,其特征在于,利用所述预置参数信息在至少一个维度中进行分析包括:
确定各个维度中用于计算所述评估结果的所述相似文本中的结构化信息和/或预置参数信息;
确定用于计算所述评估结果的维度数量以及维度信息;
基于所述维度数量以及维度信息计算所述目标文本在网络中传播效果的评估结果。
8.一种网络信息传播效果的监测装置,其特征在于,所述装置包括:
获取单元,用于获取目标文本;
检索单元,用于检索网络中与所述获取单元获取的目标文本相似的相似文本,所述相似文本是指与所述目标文本的正文信息相同或者基于所述目标文本在预定范围内修改得到的文本;
爬取单元,用于通过预置爬虫爬取所述检索单元得到的相似文本的预置参数信息,所述预置爬虫是具有可视化配置的基于浏览器核心的网络爬虫;
分析单元,用于利用所述爬取单元爬取的预置参数信息在至少一个维度中进行分析,得到所述目标文本在网络中传播效果的评估结果。
9.一种存储介质,其特征在于,所述存储介质包括存储的程序,其中,在所述程序运行时控制所述存储介质所在设备执行权利要求1至权利要求7中任意一项所述的网络信息传播效果的监测方法。
10.一种处理器,其特征在于,所述处理器用于运行程序,其中,所述程序运行时执行权利要求1至权利要求7中任意一项所述的网络信息传播效果的监测方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201710663796.2A CN109388740A (zh) | 2017-08-06 | 2017-08-06 | 一种网络信息传播效果的监测方法及装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201710663796.2A CN109388740A (zh) | 2017-08-06 | 2017-08-06 | 一种网络信息传播效果的监测方法及装置 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN109388740A true CN109388740A (zh) | 2019-02-26 |
Family
ID=65412978
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201710663796.2A Pending CN109388740A (zh) | 2017-08-06 | 2017-08-06 | 一种网络信息传播效果的监测方法及装置 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN109388740A (zh) |
Cited By (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110929127A (zh) * | 2019-12-05 | 2020-03-27 | 广州市原象信息科技有限公司 | 一种淘宝直播投放效果分析的方法及计算机设备 |
CN111125100A (zh) * | 2019-12-12 | 2020-05-08 | 东软集团股份有限公司 | 数据存储方法、装置、存储介质及电子设备 |
CN111666428A (zh) * | 2020-06-04 | 2020-09-15 | 杭州凡闻科技有限公司 | 网络媒体传播力评估方法 |
WO2021139343A1 (zh) * | 2020-06-29 | 2021-07-15 | 平安科技(深圳)有限公司 | 基于自然语言处理的数据分析方法、装置和计算机设备 |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20070192310A1 (en) * | 2006-02-13 | 2007-08-16 | Sony Corporation | Information processing apparatus and method, and program |
CN102541912A (zh) * | 2010-12-17 | 2012-07-04 | 北大方正集团有限公司 | 一种网络文章传播影响力的评价***及方法 |
CN106570171A (zh) * | 2016-11-03 | 2017-04-19 | 中国电子科技集团公司第二十八研究所 | 一种基于语义的科技情报处理方法及*** |
CN106980692A (zh) * | 2016-05-30 | 2017-07-25 | 国家计算机网络与信息安全管理中心 | 一种基于微博特定事件的影响力计算方法 |
-
2017
- 2017-08-06 CN CN201710663796.2A patent/CN109388740A/zh active Pending
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20070192310A1 (en) * | 2006-02-13 | 2007-08-16 | Sony Corporation | Information processing apparatus and method, and program |
CN102541912A (zh) * | 2010-12-17 | 2012-07-04 | 北大方正集团有限公司 | 一种网络文章传播影响力的评价***及方法 |
CN106980692A (zh) * | 2016-05-30 | 2017-07-25 | 国家计算机网络与信息安全管理中心 | 一种基于微博特定事件的影响力计算方法 |
CN106570171A (zh) * | 2016-11-03 | 2017-04-19 | 中国电子科技集团公司第二十八研究所 | 一种基于语义的科技情报处理方法及*** |
Cited By (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110929127A (zh) * | 2019-12-05 | 2020-03-27 | 广州市原象信息科技有限公司 | 一种淘宝直播投放效果分析的方法及计算机设备 |
CN111125100A (zh) * | 2019-12-12 | 2020-05-08 | 东软集团股份有限公司 | 数据存储方法、装置、存储介质及电子设备 |
CN111666428A (zh) * | 2020-06-04 | 2020-09-15 | 杭州凡闻科技有限公司 | 网络媒体传播力评估方法 |
CN111666428B (zh) * | 2020-06-04 | 2023-08-08 | 杭州凡闻科技有限公司 | 网络媒体传播力评估方法 |
WO2021139343A1 (zh) * | 2020-06-29 | 2021-07-15 | 平安科技(深圳)有限公司 | 基于自然语言处理的数据分析方法、装置和计算机设备 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN109657138A (zh) | 一种视频推荐方法、装置、电子设备及存储介质 | |
US11354700B2 (en) | Adaptive lead generation for marketing | |
Thurman | Computational journalism | |
CN108337316A (zh) | 信息推送方法、装置、计算机设备及存储介质 | |
CN106803190A (zh) | 一种广告个性化推送***及方法 | |
CN109388740A (zh) | 一种网络信息传播效果的监测方法及装置 | |
CA3153598A1 (en) | Method of and device for predicting video playback integrity | |
CN107918905A (zh) | 异常交易识别方法、装置及服务器 | |
CN108595583A (zh) | 动态图表类页面数据爬取方法、装置、终端及存储介质 | |
CN110348907B (zh) | 一种广告人群的定向方法及装置 | |
CN107578263A (zh) | 一种广告异常访问的检测方法、装置和电子设备 | |
US10537801B2 (en) | System and method for decision making in strategic environments | |
Srba et al. | Auditing YouTube’s recommendation algorithm for misinformation filter bubbles | |
TW201443812A (zh) | 社群媒體影響性評估(二) | |
CN107480854A (zh) | 一种风险识别的方法及装置 | |
CN112328857B (zh) | 一种产品知识聚合方法、装置、计算机设备及存储介质 | |
CN110069676A (zh) | 关键词推荐方法和装置 | |
Story et al. | Which apps have privacy policies? an analysis of over one million *** play store apps | |
CN103412958A (zh) | 一种搜索结果显示方法和装置 | |
KR20220079249A (ko) | 소비자 수요를 예측하고 이를 반영한 정기배송 방법 및 시스템 | |
CN109739989A (zh) | 文本分类方法和计算机设备 | |
CN111966915A (zh) | 信息巡检方法、计算机设备及存储介质 | |
CN109961311A (zh) | 客户推荐方法、装置、计算设备及存储介质 | |
CN106294785A (zh) | 内容筛选方法以及*** | |
CN111782925B (zh) | 物品推荐方法、装置、设备、***及可读存储介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
CB02 | Change of applicant information |
Address after: 100083 No. 401, 4th Floor, Haitai Building, 229 North Fourth Ring Road, Haidian District, Beijing Applicant after: BEIJING GRIDSUM TECHNOLOGY Co.,Ltd. Address before: 100086 Beijing city Haidian District Shuangyushu Area No. 76 Zhichun Road cuigongfandian 8 layer A Applicant before: BEIJING GRIDSUM TECHNOLOGY Co.,Ltd. |
|
CB02 | Change of applicant information | ||
RJ01 | Rejection of invention patent application after publication |
Application publication date: 20190226 |
|
RJ01 | Rejection of invention patent application after publication |