CN111523296A - 一种基于Selenium生成舆情报告的方法 - Google Patents

一种基于Selenium生成舆情报告的方法 Download PDF

Info

Publication number
CN111523296A
CN111523296A CN202010303618.0A CN202010303618A CN111523296A CN 111523296 A CN111523296 A CN 111523296A CN 202010303618 A CN202010303618 A CN 202010303618A CN 111523296 A CN111523296 A CN 111523296A
Authority
CN
China
Prior art keywords
report
data
page
generating
selenium
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202010303618.0A
Other languages
English (en)
Inventor
徐利东
远贵良
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Shandong Beisai Information Technology Co ltd
Original Assignee
Shandong Beisai Information Technology Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Shandong Beisai Information Technology Co ltd filed Critical Shandong Beisai Information Technology Co ltd
Priority to CN202010303618.0A priority Critical patent/CN111523296A/zh
Publication of CN111523296A publication Critical patent/CN111523296A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/10Text processing
    • G06F40/166Editing, e.g. inserting or deleting
    • G06F40/186Templates
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/958Organisation or management of web site content, e.g. publishing, maintaining pages or automatic linking
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F8/00Arrangements for software engineering
    • G06F8/30Creation or generation of source code
    • G06F8/38Creation or generation of source code for implementing user interfaces
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F9/00Arrangements for program control, e.g. control units
    • G06F9/06Arrangements for program control, e.g. control units using stored programs, i.e. using an internal store of processing equipment to receive or retain programs
    • G06F9/44Arrangements for executing specific programs
    • G06F9/445Program loading or initiating
    • G06F9/44521Dynamic linking or loading; Link editing at or after load time, e.g. Java class loading

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Software Systems (AREA)
  • General Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Databases & Information Systems (AREA)
  • Data Mining & Analysis (AREA)
  • Health & Medical Sciences (AREA)
  • Artificial Intelligence (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Computational Linguistics (AREA)
  • General Health & Medical Sciences (AREA)
  • Human Computer Interaction (AREA)
  • Information Transfer Between Computers (AREA)

Abstract

本发明公开了一种基于Selenium生成舆情报告的方法,Selenium生成舆情报告的方法步骤如下:生成报告的模板、绘制页面、信息存储、二次编辑、数据更新、报告预览、报告下载。本发明的关键点:将Selenium作为报告生成的核心技术;报告结构化数据和非结构化数据独立存储的架构体系;支持可视化二次在线编辑;支持实时预览和导出。

Description

一种基于Selenium生成舆情报告的方法
技术领域
本发明涉及计算机网络技术领域,确切地说是一种基于Selenium生成舆情报告的方法。
背景技术
近几年来,随着互联网的快速发展,网络媒体作为一种新的信息传播形式,已深入人们的日常生活。网友言论活跃已达到前所未有的程度,不论是国内还是国际重大事件,都能马上形成网上舆论,通过这种网络来表达观点、传播思想,进而产生巨大的舆论压力,达到任何部门、机构都无法忽视的地步。可以说,互联网已成为思想文化信息的集散地和社会舆论的放大器。
互联网舆情具有直接性、突发性、传播快、丰富性、互动性、联动性强等特点,因此需要因势利导,及时掌握社会舆情动态,及时掌握舆情动向。舆情简报作为舆情分析和处理的一种重要手段和有效工具,是充分利用舆情采集***的内容和数据,并通过模型分析和内容定制,快速生成各种文字、数据、图表分析等结果报告。通过舆情简报提供的信息依据,政府、企业将及时掌握舆情动向,准确捕捉预警信息,有利于快速发现、快速处理对较大影响的重要事件,以达到快速、高效正面引导舆论和宣传、构建积极向上主流舆论的目的。
目前主要的实现方式按照静态模板舆情报告的方法,这种方式相对简单,无法满足报告内容临时变动的情况,有时需要二次编辑;给予工作的辅助有限,效率和美观度不高。
发明内容
本发明要解决的技术问题是自动化生成的报告不支持在线编辑和报告不美观的问题;该方法通过Selenium框架调用谷歌浏览器,加载实时的数据页面信息;通过事件按钮循环反复确认是否加载完成;然后通过前端ajax技术,将网页中的数据和静态代码块保存到hdfs中;同时支持浏览器的预览和在线编辑;通过这项技术同时可以将报告保存成word。解决了在线生成舆情报告不能够在线编辑和报告样式不美观的核心问题。
为解决上述技术问题,本发明采用如下技术手段:
一种基于Selenium生成舆情报告的方法,Selenium生成舆情报告的方法步骤如下:
步骤1:生成报告的模板:通过Selenium调用浏览器,并给定一个生成报告的模板url;
步骤2:绘制页面:浏览器动态加载数据,绘出html页面;
步骤3:信息存储:将生成的图表信息发送到服务器,存储到文件服务器;将页面的静态代码块发送到服务器,存储到hdfs服务器;
步骤4:二次编辑:加载代码块和图片资源重新绘制页面,提供二次编辑功能;
步骤5:数据更新:二次编辑完成,将相关数据更新到mysql服务器;
步骤6:报告预览:直接从后台请求数据,动态加载渲染页面;
步骤7:报告下载:将后台数据通过字段映射,导出成文本格式。
作为优选,本发明更进一步的技术方案是:
所述的生成报告的模板的浏览器为谷歌浏览器。
所述的绘制页面是通过ajax技术动态加载数据。
所述的报告下载中文本格式为word格式。
本发明取得如下技术效果:解决自动生成的舆情报告,不美观的问题;解决大规模生成舆情报告,不稳定的问题;采用了报告信息、文件信息独立存储的架构,支持海量报告的永久存储;支持报告的动态预览和下载。
附图说明
图1为本发明的结构框图。
具体实施方式
下面结合实施例,进一步说明本发明。
参见图1可知,本发明一种基于Selenium生成舆情报告的方法,Selenium生成舆情报告的方法步骤如下:
步骤1:生成报告的模板:通过Selenium调用浏览器,并给定一个生成报告的模板url;所述的生成报告的模板的浏览器为谷歌浏览器。
步骤2:绘制页面:浏览器动态加载数据,绘出html页面;所述的绘制页面是通过ajax技术动态加载数据。
步骤3:信息存储:将生成的图表信息发送到服务器,存储到文件服务器;将页面的静态代码块发送到服务器,存储到hdfs服务器;
步骤4:二次编辑:加载代码块和图片资源重新绘制页面,提供二次编辑功能;
步骤5:数据更新:二次编辑完成,将相关数据更新到mysql服务器;
步骤6:报告预览:直接从后台请求数据,动态加载渲染页面;
步骤7:报告下载:将后台数据通过字段映射,导出成文本格式。所述的报告下载中文本格式为word格式。
本发明的关键点:将Selenium作为报告生成的核心技术;报告结构化数据和非结构化数据独立存储的架构体系;支持可视化二次在线编辑;支持实时预览和导出。
由于以上所述仅为本发明的具体实施方式,但本发明的保护不限于此,任何本技术领域的技术人员所能想到本技术方案技术特征的等同的变化或替代,都涵盖在本发明的保护范围之内。

Claims (4)

1.一种基于Selenium生成舆情报告的方法,其特征在于所述的Selenium生成舆情报告的方法步骤如下:
步骤1:生成报告的模板:通过Selenium调用浏览器,并给定一个生成报告的模板url;
步骤2:绘制页面:浏览器动态加载数据,绘出html页面;
步骤3:信息存储:将生成的图表信息发送到服务器,存储到文件服务器;将页面的静态代码块发送到服务器,存储到hdfs服务器;
步骤4:二次编辑:加载代码块和图片资源重新绘制页面,提供二次编辑功能;
步骤5:数据更新:二次编辑完成,将相关数据更新到mysql服务器;
步骤6:报告预览:直接从后台请求数据,动态加载渲染页面;
步骤7:报告下载:将后台数据通过字段映射,导出成文本格式。
2.根据权利要求1所述的一种基于Selenium生成舆情报告的方法,其特征在于:所述的生成报告的模板的浏览器为谷歌浏览器。
3.根据权利要求1所述的一种基于Selenium生成舆情报告的方法,其特征在于:所述的绘制页面是通过ajax技术动态加载数据。
4.根据权利要求1所述的一种基于Selenium生成舆情报告的方法,其特征在于:所述的报告下载中文本格式为word格式。
CN202010303618.0A 2020-04-16 2020-04-16 一种基于Selenium生成舆情报告的方法 Pending CN111523296A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202010303618.0A CN111523296A (zh) 2020-04-16 2020-04-16 一种基于Selenium生成舆情报告的方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202010303618.0A CN111523296A (zh) 2020-04-16 2020-04-16 一种基于Selenium生成舆情报告的方法

Publications (1)

Publication Number Publication Date
CN111523296A true CN111523296A (zh) 2020-08-11

Family

ID=71902858

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202010303618.0A Pending CN111523296A (zh) 2020-04-16 2020-04-16 一种基于Selenium生成舆情报告的方法

Country Status (1)

Country Link
CN (1) CN111523296A (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112966033A (zh) * 2021-02-26 2021-06-15 云账户技术(天津)有限公司 一种预览模板文件的方法、装置及存储介质

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101976235A (zh) * 2010-09-21 2011-02-16 天津神舟通用数据技术有限公司 基于动态网页的可扩展的Word报告自动生成方法
CN108334485A (zh) * 2018-01-16 2018-07-27 广东电网有限责任公司信息中心 一种运用自动化技术实现一键生成world报告的方法
CN108563799A (zh) * 2018-05-12 2018-09-21 苏州华必讯信息科技有限公司 一种动态生成舆情简报的方法
CN110110188A (zh) * 2018-01-30 2019-08-09 江苏博智软件科技股份有限公司 一种基于云计算技术的网络舆情监测***

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101976235A (zh) * 2010-09-21 2011-02-16 天津神舟通用数据技术有限公司 基于动态网页的可扩展的Word报告自动生成方法
CN108334485A (zh) * 2018-01-16 2018-07-27 广东电网有限责任公司信息中心 一种运用自动化技术实现一键生成world报告的方法
CN110110188A (zh) * 2018-01-30 2019-08-09 江苏博智软件科技股份有限公司 一种基于云计算技术的网络舆情监测***
CN108563799A (zh) * 2018-05-12 2018-09-21 苏州华必讯信息科技有限公司 一种动态生成舆情简报的方法

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112966033A (zh) * 2021-02-26 2021-06-15 云账户技术(天津)有限公司 一种预览模板文件的方法、装置及存储介质

Similar Documents

Publication Publication Date Title
CN104461484B (zh) 前端模板的实现方法和装置
CN104714982B (zh) 一种网页的加载方法和***
CN101122921B (zh) 基于ajax与html标记形成树形显示结构的方法
CN102184184B (zh) 一种网页动态信息获取方法
US20040006743A1 (en) Method and apparatus for re-editing and redistributing web documents
CN105068815A (zh) 页面编辑器交互装置和方法
CN112286513A (zh) 基于组件元数据的可视化设计方法和装置
CN103853543A (zh) 一种应用于企业信息***开发过程中快速构建表单的方法
CN101662493A (zh) 一种用户访问路径的数据采集方法、***及服务器
CN105224544A (zh) 一种数据库的数据编辑方法及装置
CN105447723A (zh) 推广***与推广方法
CN103389895A (zh) 一种前端页面的生成方法及***
CN105404514A (zh) JavaScript渲染方法和装置
CN112988123B (zh) 面向ddd的软件设计方法及***
CN105550165A (zh) 可将网页文章导入网页文本编辑器的插件及方法
CN110941428B (zh) 一种网站创建方法和装置
CN113378579A (zh) 一种语音录入结构化数据的方法、***及电子设备
CN101937335A (zh) 一种生成Widget图标的方法、Widget摘要文件的生成方法及Widget引擎
CN104834715A (zh) 一种基于部件和容器的网站生成方法及***
CN112084446A (zh) 一种网页编辑方法、编辑器、电子设备和可读存储介质
CN109240664A (zh) 一种采集用户行为信息的方法及终端
CN117057318A (zh) 领域模型生成方法、装置、设备以及存储介质
CN111523296A (zh) 一种基于Selenium生成舆情报告的方法
CN108984156A (zh) 一种基于模板的免代码开发的软件自动生成方法及***
CN112800724B (zh) 可视化配置模板的可读文件导出方法及相关装置

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication
RJ01 Rejection of invention patent application after publication

Application publication date: 20200811