CN113837630A - 基于文本识别的区域内esg指数确定方法及相关产品 - Google Patents
基于文本识别的区域内esg指数确定方法及相关产品 Download PDFInfo
- Publication number
- CN113837630A CN113837630A CN202111147475.XA CN202111147475A CN113837630A CN 113837630 A CN113837630 A CN 113837630A CN 202111147475 A CN202111147475 A CN 202111147475A CN 113837630 A CN113837630 A CN 113837630A
- Authority
- CN
- China
- Prior art keywords
- news
- target
- event
- index
- events
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Withdrawn
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q10/00—Administration; Management
- G06Q10/06—Resources, workflows, human or project management; Enterprise or organisation planning; Enterprise or organisation modelling
- G06Q10/063—Operations research, analysis or management
- G06Q10/0639—Performance analysis of employees; Performance analysis of enterprise or organisation operations
- G06Q10/06393—Score-carding, benchmarking or key performance indicator [KPI] analysis
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/35—Clustering; Classification
- G06F16/355—Class or cluster creation or modification
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/38—Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually
- G06F16/387—Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually using geographical or spatial information, e.g. location
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/20—Natural language analysis
- G06F40/205—Parsing
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/20—Natural language analysis
- G06F40/279—Recognition of textual entities
- G06F40/289—Phrasal analysis, e.g. finite state techniques or chunking
- G06F40/295—Named entity recognition
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Business, Economics & Management (AREA)
- Human Resources & Organizations (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Health & Medical Sciences (AREA)
- Educational Administration (AREA)
- Artificial Intelligence (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Computational Linguistics (AREA)
- Databases & Information Systems (AREA)
- Data Mining & Analysis (AREA)
- Strategic Management (AREA)
- Development Economics (AREA)
- Health & Medical Sciences (AREA)
- Economics (AREA)
- Entrepreneurship & Innovation (AREA)
- Game Theory and Decision Science (AREA)
- Library & Information Science (AREA)
- Marketing (AREA)
- Operations Research (AREA)
- Quality & Reliability (AREA)
- Tourism & Hospitality (AREA)
- General Business, Economics & Management (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
本申请涉及人工智能技术领域,具体涉及一种基于文本识别的区域内ESG指数确定方法及相关产品。该方法包括:对多篇新闻中的每篇新闻进行文本识别,得到多个新闻事件,以及发生区域;根据每个新闻事件的发生区域,从多个新闻事件中获取属于预设区域内的多个目标新闻事件;对多个目标新闻事件进行聚类,得到多个目标新闻事件中的每个目标新闻事件的热度指数;基于训练好的主题识别模型,确定多个目标新闻事件中的每个目标新闻事件的情感指数;根据每个目标新闻事件的热度指数以及情感指数,确定每个目标新闻事件的舆情指数;根据每个目标新闻事件的舆情指数,确定预设区域的ESG指数。本申请实施例实现对区域进行ESG评价,弥补了技术空白。
Description
技术领域
本申请涉及人工智能技术领域,具体涉及一种基于文本识别的区域内ESG指数确定方法及相关产品。
背景技术
企业的ESG评分是对企业的环境(E)、社会(S)、治理(G)方面的综合评分。国际和国内在对企业ESG表现进行评分方面已经积累了一些成功的经验,国际上知名的评级机构比如MSCI、FTSE等都建立了各自的评分标准,并对国际上知名的企业进行了ESG评价。随着国际社会,比如各类投资机构和政府对企业责任的重视,特别是最近随着全球气候变化合作的进展,投资者和政府对企业在ESG方面的评分有着大量的需求。
在评价企业的ESG表现的时,需要用到与企业相关的新闻来对企业做ESG评分。目前主要通过与企业相关的新闻的数量对企业进行ESG评分。
然而,目前只是给出了对某个企业进行ESG评分的方案,如何对某个区域进行ESG评分仍然处于空白阶段。
发明内容
本申请实施例提供了一种基于文本识别的区域内ESG指数确定方法及相关产品,实现对区域进行ESG评分,弥补了现有技术的空白。
第一方面,本申请实施例提供一种基于文本识别的区域内ESG指数确定方法,包括:
获取预设时间段内与ESG评价相关的多篇新闻;
对所述多篇新闻中的每篇新闻进行文本识别,得到多个新闻事件,以及所述多个新闻事件中的每个新闻事件的发生区域;
根据所述每个新闻事件的发生区域,从所述多个新闻事件中获取属于预设区域内的多个目标新闻事件;
对所述多个目标新闻事件进行聚类,得到所述多个目标新闻事件中的每个目标新闻事件的热度指数,其中,所述热度指数用于表征所述目标新闻事件在社会中的讨论热度;
基于训练好的主题识别模型,确定所述多个目标新闻事件中的每个目标新闻事件的情感指数,所述情感指数用于表征所述目标新闻事件对所述目标新闻事件相关的企业的影响程度;
根据所述每个目标新闻事件的热度指数以及情感指数,确定所述每个目标新闻事件的舆情指数,其中,所述舆情指数用于表征所述目标新闻事件对所述预设区域的ESG指数的贡献度;
根据所述每个目标新闻事件的舆情指数,确定所述预设区域的ESG指数。
第二方面,本申请实施例提供一种ESG指数确定装置,包括:获取单元和处理单元;
所述获取单元,用于获取预设时间段内与ESG评价相关的多篇新闻;
所述处理单元,用于对所述多篇新闻中的每篇新闻进行文本识别,得到多个新闻事件,以及所述多个新闻事件中的每个新闻事件的发生区域;
根据所述每个新闻事件的发生区域,从所述多个新闻事件中获取属于预设区域内的多个目标新闻事件;
对所述多个目标新闻事件进行聚类,得到所述多个目标新闻事件中的每个目标新闻事件的热度指数,其中,所述热度指数用于表征所述目标新闻事件在社会中的讨论热度;
基于训练好的主题识别模型,确定所述多个目标新闻事件中的每个目标新闻事件的情感指数,所述情感指数用于表征所述目标新闻事件对所述目标新闻事件相关的企业的影响程度;
根据所述每个目标新闻事件的热度指数以及情感指数,确定所述每个目标新闻事件的舆情指数,其中,所述舆情指数用于表征所述目标新闻事件对所述预设区域的ESG指数的贡献度;
根据所述每个目标新闻事件的舆情指数,确定所述预设区域的ESG指数。
第三方面,本申请实施例提供一种电子设备,包括:处理器,所述处理器与存储器相连,所述存储器用于存储计算机程序,所述处理器用于执行所述存储器中存储的计算机程序,以使得所述电子设备执行如第一方面所述的方法。
第四方面,本申请实施例提供一种计算机可读存储介质,所述计算机可读存储介质存储有计算机程序,所述计算机程序使得计算机执行如第一方面所述的方法。
第五方面,本申请实施例提供一种计算机程序产品,所述计算机程序产品包括存储了计算机程序的非瞬时性计算机可读存储介质,所述计算机可操作来使计算机执行如第一方面所述的方法。
实施本申请实施例,具有如下有益效果:
可以看出,在本申请实施例中,通过文本识别,得到新闻中的新闻事件,以及新闻事件的发生区域;从而基于新闻事件的发生区域筛选出属于预设区域的目标新闻事件;最后,基于聚类技术确定每个目标新闻事件的热度指数,基于主题识别模型,确定每个目标新闻事件的情感指数;基于每个目标新闻事件的热度指数以及情感指数,确定每个目标新闻事件的舆情指数;最后,基于每个目标新闻事件的舆情指数,确定出预设区域内的ESG指数,从而实现对预设区域进行ESG评价,弥补了现有技术的空白。
附图说明
为了更清楚地说明本申请实施例中的技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图是本申请的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1为本申请实施例提供的一种基于文本识别的区域内ESG指数确定方法的流程示意图;
图2为本申请实施例提供的另一种基于文本识别的区域内ESG指数确定方法的流程示意图;
图3为本申请实施例提供的一种ESG指数确定装置的功能单元组成框图;
图4为本申请实施例提供的一种电子设备的结构示意图。
具体实施方式
下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本申请一部分实施例,而不是全部的实施例。基于本申请中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本申请保护的范围。
本申请的说明书和权利要求书及所述附图中的术语“第一”、“第二”、“第三”和“第四”等是用于区别不同对象,而不是用于描述特定顺序。此外,术语“包括”和“具有”以及它们任何变形,意图在于覆盖不排他的包含。例如包含了一系列步骤或单元的过程、方法、***、产品或设备没有限定于已列出的步骤或单元,而是可选地还包括没有列出的步骤或单元,或可选地还包括对于这些过程、方法、产品或设备固有的其它步骤或单元。
在本文中提及“实施例”意味着,结合实施例描述的特定特征、结果或特性可以包含在本申请的至少一个实施例中。在说明书中的各个位置出现该短语并不一定均是指相同的实施例,也不是与其它实施例互斥的独立的或备选的实施例。本领域技术人员显式地和隐式地理解的是,本文所描述的实施例可以与其它实施例相结合。
首先说明,本申请实施例所涉及的ESG指数,即是ESG评分,也可以称为ESG评价,它们在本质上是一样的,后面不用再区分。相应的,对预设区域进行ESG评价,或者对预设区域进行ESG评分,它们在本质上也都是一样的,都是用于确定预设区域的ESG指数。
本申请实施例可以基于人工智能技术对相关的数据进行获取和处理。其中,人工智能(Artificial Intelligence,AI)是利用数字计算机或者数字计算机控制的机器模拟、延伸和扩展人的智能,感知环境、获取知识并使用知识获得最佳结果的理论、方法、技术及应用***。
人工智能基础技术一般包括如传感器、专用人工智能芯片、云计算、分布式存储、大数据处理技术、操作/交互***、机电一体化等技术。人工智能软件技术主要包括计算机视觉技术、机器人技术、生物识别技术、语音处理技术、自然语言处理技术以及机器学习/深度学习等几大方向。
参阅图1,图1为本申请实施例提供的一种基于文本识别的区域内ESG指数确定方法的流程示意图。该方法应用于ESG指数确定装置。该方法包括以下步骤内容:
101:获取预设时间段内与ESG评价相关的多篇新闻。
示例性的,可以从多个第三方平台获取多篇新闻,其中,多个第三方平台可以为新闻媒体的网站或者应用程序;然后,获取每篇新闻的发表时间,根据每篇新闻的发表时间,确定属于预设时间段内的多篇新闻;最后,对预设时间段内的多篇新闻中的每篇新闻进行文本处理,得到预设时间段内与ESG评价相关的多篇新闻,比如,对每篇新闻进行实体识别,得到每篇新闻的实体,将包含有ESG评价实体的新闻作为与ESG评价相关的新闻。
其中,该预设时间段可以为任意一个时间段,比如,上一个季度,上一个月,去年,等等。
102:对所述多篇新闻中的每篇新闻进行文本识别,得到多个新闻事件,以及所述多个新闻事件中的每个新闻事件的发生区域。
示例性的,对多篇新闻中的每篇新闻进行实体识别,得到每篇新闻的实体;从识别出的实体中筛选出与新闻事件相关的实体,基于该实体确定出每篇新闻的新闻事件。其中,每篇新闻中可以包含有一个或多个新闻事件。比如,实体为“消防安全不达标”,则确定新闻中的新闻事件为“消防安全不达标”;最后,将每篇新闻中的新闻事件进行合并,得到该多个新闻事件。应说明的是,此处的合并是将每篇新闻中的新闻事件当做不同的新闻事件进行合并。
进一步的,对每篇新闻中的新闻事件进行地点识别,若从每篇新闻中提取到该篇新闻中的新闻事件的发生地,则将从每篇新闻中提取到的发生地,作为每篇新闻中的新闻事件的发生区域,即可得到每个新闻事件的发生区域;若从每篇新闻中未提取到该篇新闻中的新闻事件的发生地,则获取每篇新闻中的新闻事件所涉及的企业,将该企业的主营业务的所在地作为每篇新闻中的新闻事件的发生区域,即可得到每个新闻事件的发生区域。
103:根据所述每个新闻事件的发生区域,从所述多个新闻事件中获取属于预设区域内的多个目标新闻事件。
其中,预设区域是预先设定的,比如,用户可以在ESG指数确定装置的可视化界面上输入想要进行ESG评分的区域,比如,用户输入的是深圳南山区,则会自动从多个新闻事件中筛选出属于深圳南山区的目标新闻事件。因此,该预设区域,可以理解为等待进行ESG评价的区域,可以为任意一个区域。
104:对所述多个目标新闻事件进行聚类,得到所述多个目标新闻事件中的每个目标新闻事件的热度指数,其中,所述热度指数用于表征所述目标新闻事件在社会中的讨论热度。
示例性的,对多个目标新闻事件进行聚类,得到至少一个目标新闻事件组,其中,每个目标新闻事件组中包含有至少一个目标新闻事件,且每个目标新闻事件组中的至少一个目标新闻事件本质上反映的是一个新闻事件,只是每个目标新闻事件可能是不同的描述形式,比如,一个目标新闻事件是“企业A消防不达标”,另一个目标新闻事件“企业A消防机制不健全”,这两个目标新闻事件本质上表示的新闻事件企业A存在消防隐患。
进一步的,对第一目标新闻事件组中的至少一个目标新闻事件对应的至少一篇新闻进行聚类,得到至少一个新闻组,其中,第一目标新闻事件组为至少一个目标新闻事件组中的任意一个,至少一个新闻组中的每个新闻组包括一篇原创新闻以及与该原创新闻对应的H篇转载新闻,H为大于或者等于0的整数。
具体的,对至少一篇新闻中的每篇新闻进行语义信息提取,得到每篇新闻所对应的语义向量;基于每篇新闻的语义向量对至少一篇新闻进行聚类,得到至少一个第一新闻组,即确定至少一篇新闻中任意两篇新闻的语义向量之间的欧式距离,将任意两篇新闻的语义向量之间的欧式距离作为任意两篇新闻之间的相似度;然后,将相似度大于第一阈值的两篇新闻归为一类,即归类为到一个新闻组里面,得到至少一个新闻组,由于两篇新闻的语义向量之间的相似度大于第一阈值,则说明这两篇新闻内容是比较相似的,也就是说其中一篇新闻可能是转载另外一篇新闻生成的,或者,两篇新闻都是转载同一篇新闻生成的。
因此,每个新闻组下包括一篇原创新闻和H篇转载新闻。此外,当H大于或者等于1时,若想确定出每个新闻组中的原创新闻,则可以获取每个新闻组中的每篇新闻的发表时间。对于原创新闻来说,发表时间必然是最早的,因此可以将每个新闻组中发表时间最早的新闻作为每个新闻组中的原创新闻,剩余的新闻均为每个新闻组中的转载新闻。
进一步的,根据每个新闻组包括的一篇原创新闻以及所述H篇转载新闻,确定每个新闻组对应的热度指数;将第一目标新闻事件组中的每个目标新闻事件所归属的新闻组对应的热度指数,作为该目标新闻事件的热度指数,即确定每个目标新闻事件的新闻归属于哪个新闻组,然后,将该新闻组对应的热度指数作为该目标新闻事件的热度指数。
示例性的,可以从新闻数量上确定每个新闻组的热度指数。应理解,原创新闻是由新闻工作者自主创作的,是与水军炒作无关的,因此,一个新闻事件下的所有原创新闻引起的对这个新闻事件的关注度应该是相同,也就是说,每篇原创新闻在新闻事件所受的社会的关注方面所作出的贡献度是相同。所以,为每篇原创新闻事件预先设定一个值,使原创新闻在关注度方面的贡献不受转载新闻数量的影响;根据每个新闻组中的原创新闻的设定值以及每个新闻组中所包含的转载新闻的数量H,确定每个新闻组的热度指数。
示例性的,每个新闻组的热度指数可以通过公式(1)表示:
HeatEventj=log2(Hj+1)+a 公式(1);
其中,HeatEventj为至少一个新闻组中的第j个新闻组的热度指数,Hj为第j个新闻组所包含的转载新闻的数量,a为原创新闻的设定值,一般取值为1。
可以看出,上述公式(1)在计算每个新闻组的热度指数时,随着转载新闻的数量增多,热度指数的增长幅度逐渐减弱,这样刻意转载或者炒作的行为就会被减弱,即通过公式(1)减弱了刻意转载或水军炒作的行为,使确定出的热度指数更加精确,即不容易受水军炒作的影响。
示例性的,每个新闻组的缩放比例还可以通过公式(2)表示:
可以看出,Hj=0时,也就是每个新闻组中的转载新闻的数量为零时,新闻组的热度指数为a,即热度指数只与原创新闻的数量相关;当Hj无穷大时,新闻组的热度指数为1+a,即有上限。这样即使有水军炒作,也会将炒作的行为收敛在1+a处,不会无休止的受炒作行为的影响,不会让社会对新闻事件的关注度无限放大,由于社会对某个新闻事件的关注度本身就不会无限放大,从而使确定出的热度指数更加精确。
105:基于训练好的主题识别模型,确定所述多个目标新闻事件中的每个目标新闻事件的情感指数,所述情感指数用于表征所述目标新闻事件对所述目标新闻事件相关的企业的影响程度。
示例性的,首先建立新闻ESG事件体系,即建立ESG事件与情感等级之间的映射关系。具体的,ESG事件包括评价维度、主题、事件、细分事件以及情感等级,评价维度、主题、事件、细分事件为依次的隶属关系,因此预先建立评价维度、主题、事件、细分事件以及情感等级之间的映射关系,其中,评价维度包括E、S、G三个维度。
表1:ESG事件与情感等级之间的映射关系。
然后,基于训练好的主题识别模型确定每个目标新闻事件的三级事件,即事件;然后,获取每个目标新闻事件的关键词;根据上述的映射关系,每个目标新闻事件的三级事件以及关键词,确定出每个目标新闻事件的四级事件,即细分事件;然后,根据每个目标新闻事件的细分事件,得到每个目标新闻事件的情感等级。
其中,该主题识别模型的训练过程包括:从历史新闻中选取多篇新闻,对于每篇新闻的三级和四级事件打上相应标签。利用打好标签的数据训练识别新闻三级事件的主题识别模型(文本分类);针对每个三级事件,开发基于关键字的规则来识别相应的四级事件。并用已经打好的标签数据对规则进行验证及优化,得到训练好的主题识别模型;之所以识别三级事件,不直接识别四级事件,是因为三级事件的类别相对来说少一些,如果识别四级事件,则需要设置多个分类结果,这样训练模型的收敛速度比较慢。如果直接识别二级事件,从二级事件到四级事件,之间差异过多,无法通过关键词匹配的方式实现。所以,识别出三级事件既可以提高模型收敛速度,又可以保证四级事件识别的精度。
最后,基于预先构建的情感等级与情感指数的映射关系,确定每个目标新闻事件的情感指数,其中,该映射关系可以通过表2表示:
表2:
情感等级 | 情感分数 |
重大负面 | -2 |
一般负面 | -1 |
中性 | 0 |
重大正面 | 1 |
一般正面 | 2 |
进一步地,获取每个目标新闻事件对应的新闻的发表媒体;根据发表媒体和调整量之间的映射关系,确定每个目标新闻事件的调整量;然后,基于每个目标新闻事件的调整量,调整每个目标新闻事件的情感指数,得到每个目标新闻事件最终的情感指数,将调整后的情感指数作为每个目标新闻时间的情感指数。比如,当目标新闻事件为一般负面事件,且该目标新闻事件的发表媒体为国家媒体时,调整量为-2,则可确定该目标新闻事件最终的情感指数为-3。
106:根据所述每个目标新闻事件的热度指数以及情感指数,确定所述每个目标新闻事件的舆情指数,其中,所述舆情指数用于表征所述目标新闻事件对所述预设区域的ESG指数的贡献度。
示例性的,基于上述确定出的多个目标新闻事件中的每个目标新闻事件的热度指数,以及每个目标新闻事件的情感指数,确定多个目标新闻事件中的每个目标新闻事件的舆情指数。
其中,每个目标新闻事件的舆情指数可以通过公式(3)表示:
EventScorej=HeatEventj*AdjScorej 公式(3);
其中,EventScorej为多个目标新闻事件中的第j个目标新闻事件的舆情指数,HeatEventj为第j个目标新闻事件的热度指数,AdjScorej为第j个目标新闻事件的情感指数。
107:根据所述每个目标新闻事件的舆情指数,确定所述预设区域的ESG指数。
示例性的,确定多个目标新闻事件中的每个目标新闻事件的类型,其中,每个目标新闻事件的类型包括正面新闻事件或负面新闻事件中的一种。然后,确定多个目标新闻事件中属于负面新闻事件的目标新闻事件的舆情指数之和,得到第一总舆情指数;确定所述多个目标新闻事件中属于正面新闻事件的目标新闻事件的舆情指数之和,得到第二总舆情指数。
示例性的,负面新闻事件可以理解为情感指数小于零的新闻事件,正面新闻事件可以理解为情感指数大于0的新闻事件。
可选的,第一总舆情指数可通过公式(4)表示:
NegScore=∑kEventScorekif EventScorek<0 公式(4)
NegScore为第一总舆情指数,EventScorek为第k个负面新闻事件。
可选的,第二总舆情指数可通过公式(5)表示:
PosScore=∑iEventScoreiif EventScorei>0 公式(5)
PosScore为第二总舆情指数,EventScorei为第i个负面新闻事件。
最后,为有效去除区域间大小以及经济发达程度造成的企业数量、企业规模等差异性,这里先计算负面新闻事件的第一总舆情指数的绝对值和正面新闻的第二总舆情指数的比例。该比例可能在不同区域内数字相差很大,故再用对数函数将统一到相近范围。
因此,预设区域内的ESG指数可以通过公式(6)表示:
FinalScore=log10(|NegScore|/PosScore) 公式(6);
其中,FinalScore为预设区域内的ESG指数。
可以看出,在本申请实施例中,通过文本识别,得到新闻中的新闻事件,以及新闻事件的发生区域;从而基于新闻事件的发生区域筛选出属于预设区域(即待评价区域)的目标新闻事件;最后,基于每个目标新闻事件的舆情指数,确定出预设区域内的ESG指数,从而实现对预设区域进行ESG评价,弥补了现有技术的空白。
应说明,若只想获取该预设区域在ESG三个维度中任意一个维度下的评分,则可以在筛选目标新闻时只获取与该维度下的目标新闻,然后执行步骤101~105中的内容,即可得到该预设区域在该维度下的评分。
参阅图2,图2为本申请实施例提供的另外一种基于文本识别的区域内ESG指数确定方法的流程示意图。该方法应用于ESG指数确定装置。本实施与图1示出的重复内容,在此不再重复描述。该方法包括以下步骤内容:
201:获取预设时间段内与ESG评价相关的多篇新闻。
202:对所述多篇新闻中的每篇新闻进行文本识别,得到多个新闻事件,以及所述多个新闻事件中的每个新闻事件的发生区域。
203:根据所述每个新闻事件的发生区域,从所述多个新闻事件中获取属于预设区域内的多个目标新闻事件。
204:对所述多个目标新闻事件进行聚类,得到所述多个目标新闻事件中的每个目标新闻事件的热度指数,其中,所述热度指数用于表征所述目标新闻事件在社会中的讨论热度。
205:基于训练好的主题识别模型,确定所述多个目标新闻事件中的每个目标新闻事件的情感指数,所述情感指数用于表征所述目标新闻事件对所述目标新闻事件相关的企业的影响程度。
206:根据所述每个目标新闻事件的热度指数以及情感指数,确定所述每个目标新闻事件的舆情指数,其中,所述舆情指数用于表征所述目标新闻事件对所述预设区域的ESG指数的贡献度。
207:根据所述每个目标新闻事件的舆情指数,确定所述预设区域的ESG指数。
208:向目标设备发送所述预设区域的ESG指数,以便所述目标设备的用户根据所述预设区域的ESG指数制定与所述预设区域相关的政策。
示例性,实质上根据目标设备的角色不同,可以制定出与预设区域相关的决策也是不同的,本申请的ESG指数有以下应用场景:
场景1:当目标设备为投资机构的设备时,将预设区域的ESG指数发送给投资机构,则投资机构可以制定出的与该预设区域相关的决策为:与该预设区域相关的投资决策。例如,由于预设区域的ESG指数反映了该预设区域的价值以及可持续发展的能力,则当预设区域的ESG指数较高时,则该投资决策可以为在该预设区域内追加投资金额以及投资周期,比如,从该预设区域内筛选出信用度较高的企业,追加投资和投资周期;当预设区域的ESG指数较低时,则该投资决策可以为撤资对预设区域的投资或者减少对预设区域的投资,等等,比如,当前在预设区域内有投资时,则可以从该预设区域内撤资。总的来说,将预设区域的ESG指数发送给投资机构,则可以对投资机构的投资决策的制定提供方向指引,降低投资风险。
场景2:当目标设备为预设区域内的任意一个企业的设备时,将预设区域的ESG指数发送给该企业,则该企业可以制定与该企业相关的管理决策。示例性的,由于预设区域的ESG指数反映了该预设区域的价值以及可持续发展的能力,随着投资者对ESG指数的接受程度加深,对企业社会责任的看重,更愿意投资ESG指数的较高的企业。因此,当预设区域的ESG指数较高时,为了继续保持ESG指数的高涨趋势,则该管理决策为企业制定出加强企业管理的决策,继续保持在ESG方面的优异表现;当预设区域的ESG指数较低时,该管理决策为调整公司发展战略,提高公司的可持续发展性,提高ESG指数。总体来说,将预设区域的ESG指数发送给企业,则有利于促进企业努力提高自身ESG评价情况,引导企业的良性发展。
可以看出,在本申请实施方式中,通过文本识别,得到新闻中的新闻事件,以及新闻事件的发生区域;从而基于新闻事件的发生区域筛选出属于预设区域(即待评价区域)的目标新闻事件;最后,基于每个目标新闻事件的舆情指数,确定出预设区域内的ESG指数,从而实现对预设区域进行ESG评价,弥补了现有技术的空白。而且,将预设区域内的ESG指数发送给目标设备,这样目标设备的用户就可以根据该ESG指数,引导预设区域的企业的良性发展,提高企业的可持续发展能力。
参阅图3,图3本申请实施例提供的一种ESG指数确定装置的功能单元组成框图。ESG指数确定装置300包括:获取单元301和处理单元302;
获取单元301,用于获取预设时间段内与ESG评价相关的多篇新闻
处理单元302,用于对所述多篇新闻中的每篇新闻进行文本识别,得到多个新闻事件,以及所述多个新闻事件中的每个新闻事件的发生区域;
根据所述每个新闻事件的发生区域,从所述多个新闻事件中获取属于预设区域内的多个目标新闻事件;
对所述多个目标新闻事件进行聚类,得到所述多个目标新闻事件中的每个目标新闻事件的热度指数,其中,所述热度指数用于表征所述目标新闻事件在社会中的讨论热度;
基于训练好的主题识别模型,确定所述多个目标新闻事件中的每个目标新闻事件的情感指数,所述情感指数用于表征所述目标新闻事件对所述目标新闻事件相关的企业的影响程度;
根据所述每个目标新闻事件的热度指数以及情感指数,确定所述每个目标新闻事件的舆情指数,其中,所述舆情指数用于表征所述目标新闻事件对所述预设区域的ESG指数的贡献度;
根据所述每个目标新闻事件的舆情指数,确定所述预设区域的ESG指数。
在一些可能的实施方式中,在对所述多篇新闻中的每篇新闻进行文本识别,得到多个新闻事件,以及所述多个新闻事件中的每个新闻事件的发生区域方面,处理单元302,具体用于:
对所述多篇新闻中的每篇新闻进行实体识别,得到所述每篇新闻中的新闻事件;
对所述多篇新闻的新闻事件进行合并,得到所述多个新闻事件;
对所述每篇新闻进行地点识别,若从所述每篇新闻中提取到该篇新闻中的新闻事件的发生地,则将从所述每篇新闻中提取到的发生地,作为所述每篇新闻中的新闻事件的发生区域,得到所述每个新闻事件的发生区域;
若从所述每篇新闻中未提取到该篇新闻中的新闻事件的发生地,则获取所述每篇新闻中的新闻事件所涉及的企业,将所述企业的主营业务的所在地作为所述每篇新闻中的新闻事件的发生区域,得到所述每个新闻事件的发生区域。
在一些可能的实施方式中,所述每个目标新闻事件的舆情指数满足以下公式:
EventScorej=HeatEventj*AdjScorej
其中,EventScorej为所述多个目标新闻事件中的第j个目标新闻事件的舆情指数,HeatEventj为所述第j个目标新闻事件的热度指数,AdjScorej为所述第j个目标新闻事件的情感指数。
在一些可能的实施方式中,在对所述多个目标新闻事件进行聚类,得到所述多个目标新闻事件中的每个目标新闻事件的热度指数方面,处理单元302,具体用于:
对所述多个目标新闻事件进行聚类,得到至少一个目标新闻事件组;
对第一目标新闻事件组中的至少一个目标新闻事件对应的至少一篇新闻进行聚类,得到至少一个新闻组,其中,所述第一目标新闻事件组为所述至少一个目标新闻事件组中的任意一个,所述至少一个新闻组中的每个新闻组包括一篇原创新闻以及与所述原创新闻对应的H篇转载新闻,H为大于或者等于0的整数;
根据所述每个新闻组包括的一篇原创新闻以及所述H篇转载新闻,确定所述每个新闻组对应的热度指数;
将所述第一目标新闻事件组中的每个目标新闻事件所归属的新闻对应的热度指数,作为该目标新闻事件的热度指数;
根据所述第一目标新闻事件组中的每个目标新闻事件的热度指数,得到所述多个目标新闻事件中的每个目标新闻事件的热度指数。
在一些可能的实施方式中,在基于训练好的主题识别模型,确定所述多个目标新闻事件中的每个目标新闻事件的情感指数方面,处理单元302,具体用于:
基于训练好的主题识别模型确定所述多个目标新闻事件中的每个目标新闻事件的事件主题;
获取所述多个目标新闻事件中的每个目标新闻事件的关键词;
根据所述多个目标新闻事件中的每个目标新闻事件的关键词以及该目标新闻事件的事件主题,确定所述每个目标新闻事件的细分事件;
根据预设的细分事件和情感指数之间的对应关系,以及所述多个目标新闻事件中的每个目标新闻事件的细分事件,确定所述多个目标新闻事件中的每个目标新闻事件的情感指数。
在一些可能的实施方式中,根据预设的细分事件和情感指数之间的对应关系,以及所述多个目标新闻事件中的每个目标新闻事件的细分事件,确定所述多个目标新闻事件中的每个目标新闻事件的情感指数之后,处理单元302,还用于:
获取所述多个目标新闻事件中的每个目标新闻事件对应的新闻的发表媒体;
根据预设的发表媒体和调整量之间的映射关系,确定所述多个目标新闻事件中的每个目标新闻事件对应的调整量;
基于所述多个目标新闻事件中的每个目标新闻事件的调整量,调整所述多个目标新闻事件中的每个目标新闻事件的情感指数;
将调整后的所述多个目标新闻事件中的每个目标新闻事件的情感指数作为所述多个目标新闻事件中的每个目标新闻事件的情感指数。
在一些可能的实施方式中,在根据所述每个目标新闻事件的舆情指数,确定所述预设区域的ESG指数方面,处理单元302,具体用于:
确定所述多个目标新闻事件中的每个目标新闻事件的类型,其中,所述每个目标新闻事件的类型包括负面新闻事件或正面新闻事件;
确定所述多个目标新闻事件中属于负面新闻事件的目标新闻事件的舆情指数之和,得到第一总舆情指数;
确定所述多个目标新闻事件中属于正面新闻事件的目标新闻事件的舆情指数之和,得到第二总舆情指数;
根据所述第一总舆情指数和所述第二总舆情指数,确定所述预设区域的ESG指数;
其中,所述预设区域的ESG指数满足以下公式:
FinalScore=log10(|NegScore|/PosScore);
其中,FinalScore为所述预设区域内的ESG指数,NegScore为所述第一总舆情指数,PosScore为所述第二总舆情指数。
参阅图4,图4为本申请实施例提供的一种电子设备的结构示意图。如图4所示,电子设备400包括收发器401、处理器402和存储器403。它们之间通过总线404连接。存储器403用于存储计算机程序和数据,并可以将存储器403存储的数据传输给处理器402。
处理器402用于读取存储器403中的计算机程序执行以下操作:
控制收发器401获取预设时间段内与ESG评价相关的多篇新闻;
对所述多篇新闻中的每篇新闻进行文本识别,得到多个新闻事件,以及所述多个新闻事件中的每个新闻事件的发生区域;
根据所述每个新闻事件的发生区域,从所述多个新闻事件中获取属于预设区域内的多个目标新闻事件;
对所述多个目标新闻事件进行聚类,得到所述多个目标新闻事件中的每个目标新闻事件的热度指数,其中,所述热度指数用于表征所述目标新闻事件在社会中的讨论热度;
基于训练好的主题识别模型,确定所述多个目标新闻事件中的每个目标新闻事件的情感指数,所述情感指数用于表征所述目标新闻事件对所述目标新闻事件相关的企业的影响程度;
根据所述每个目标新闻事件的热度指数以及情感指数,确定所述每个目标新闻事件的舆情指数,其中,所述舆情指数用于表征所述目标新闻事件对所述预设区域的ESG指数的贡献度;
根据所述每个目标新闻事件的舆情指数,确定所述预设区域的ESG指数。
在一些可能的实施方式中,在对所述多篇新闻中的每篇新闻进行文本识别,得到多个新闻事件,以及所述多个新闻事件中的每个新闻事件的发生区域方面,处理器402具体用于执行以下操作:
对所述多篇新闻中的每篇新闻进行实体识别,得到所述每篇新闻中的新闻事件;
对所述多篇新闻的新闻事件进行合并,得到所述多个新闻事件;
对所述每篇新闻进行地点识别,若从所述每篇新闻中提取到该篇新闻中的新闻事件的发生地,则将从所述每篇新闻中提取到的发生地,作为所述每篇新闻中的新闻事件的发生区域,得到所述每个新闻事件的发生区域;
若从所述每篇新闻中未提取到该篇新闻中的新闻事件的发生地,则获取所述每篇新闻中的新闻事件所涉及的企业,将所述企业的主营业务的所在地作为所述每篇新闻中的新闻事件的发生区域,得到所述每个新闻事件的发生区域。
在一些可能的实施方式中,所述每个目标新闻事件的舆情指数满足以下公式:
EventScorej=HeatEventj*AdjScorej
其中,EventScorej为所述多个目标新闻事件中的第j个目标新闻事件的舆情指数,HeatEventj为所述第j个目标新闻事件的热度指数,AdjScorej为所述第j个目标新闻事件的情感指数。
在一些可能的实施方式中,在对所述多个目标新闻事件进行聚类,得到所述多个目标新闻事件中的每个目标新闻事件的热度指数方面,处理器402具体用于执行以下操作:
对所述多个目标新闻事件进行聚类,得到至少一个目标新闻事件组;
对第一目标新闻事件组中的至少一个目标新闻事件对应的至少一篇新闻进行聚类,得到至少一个新闻组,其中,所述第一目标新闻事件组为所述至少一个目标新闻事件组中的任意一个,所述至少一个新闻组中的每个新闻组包括一篇原创新闻以及与所述原创新闻对应的H篇转载新闻,H为大于或者等于0的整数;
根据所述每个新闻组包括的一篇原创新闻以及所述H篇转载新闻,确定所述每个新闻组对应的热度指数;
将所述第一目标新闻事件组中的每个目标新闻事件所归属的新闻对应的热度指数,作为该目标新闻事件的热度指数;
根据所述第一目标新闻事件组中的每个目标新闻事件的热度指数,得到所述多个目标新闻事件中的每个目标新闻事件的热度指数。
在一些可能的实施方式中,在基于训练好的主题识别模型,确定所述多个目标新闻事件中的每个目标新闻事件的情感指数方面,处理器402具体用于执行以下操作:
基于训练好的主题识别模型确定所述多个目标新闻事件中的每个目标新闻事件的事件主题;
获取所述多个目标新闻事件中的每个目标新闻事件的关键词;
根据所述多个目标新闻事件中的每个目标新闻事件的关键词以及该目标新闻事件的事件主题,确定所述每个目标新闻事件的细分事件;
根据预设的细分事件和情感指数之间的对应关系,以及所述多个目标新闻事件中的每个目标新闻事件的细分事件,确定所述多个目标新闻事件中的每个目标新闻事件的情感指数。
在一些可能的实施方式中,根据预设的细分事件和情感指数之间的对应关系,以及所述多个目标新闻事件中的每个目标新闻事件的细分事件,确定所述多个目标新闻事件中的每个目标新闻事件的情感指数之后,处理器402还用于执行以下操作:
获取所述多个目标新闻事件中的每个目标新闻事件对应的新闻的发表媒体;
根据预设的发表媒体和调整量之间的映射关系,确定所述多个目标新闻事件中的每个目标新闻事件对应的调整量;
基于所述多个目标新闻事件中的每个目标新闻事件的调整量,调整所述多个目标新闻事件中的每个目标新闻事件的情感指数;
将调整后的所述多个目标新闻事件中的每个目标新闻事件的情感指数作为所述多个目标新闻事件中的每个目标新闻事件的情感指数。
在一些可能的实施方式中,在根据所述每个目标新闻事件的舆情指数,确定所述预设区域的ESG指数方面,处理器402具体用于执行以下操作:
确定所述多个目标新闻事件中的每个目标新闻事件的类型,其中,所述每个目标新闻事件的类型包括负面新闻事件或正面新闻事件;
确定所述多个目标新闻事件中属于负面新闻事件的目标新闻事件的舆情指数之和,得到第一总舆情指数;
确定所述多个目标新闻事件中属于正面新闻事件的目标新闻事件的舆情指数之和,得到第二总舆情指数;
根据所述第一总舆情指数和所述第二总舆情指数,确定所述预设区域的ESG指数;
其中,所述预设区域的ESG指数满足以下公式:
FinalScore=log10(|NegScore|/PosScore);
其中,FinalScore为所述预设区域内的ESG指数,NegScore为所述第一总舆情指数,PosScore为所述第二总舆情指数。
具体地,上述收发器401可为图3所述的实施例的ESG指数确定装置300的获取单元301,上述处理器402可以为图3所述的实施例的ESG指数确定装置300的处理单元302。
应理解,本申请中的电子设备可以包括智能手机(如Android手机、iOS手机、Windows Phone手机等)、平板电脑、掌上电脑、笔记本电脑、移动互联网设备MID(MobileInternet Devices,简称:MID)或穿戴式设备等。上述电子设备仅是举例,而非穷举,包含但不限于上述电子设备。在实际应用中,上述电子设备还可以包括:智能车载终端、计算机设备等等。
本申请实施例还提供一种计算机可读存储介质,所述计算机可读存储介质存储有计算机程序,所述计算机程序被处理器执行以实现如上述方法实施例中记载的任何一种基于文本识别的区域内ESG指数确定方法的部分或全部步骤。
本申请实施例还提供一种计算机程序产品,所述计算机程序产品包括存储了计算机程序的非瞬时性计算机可读存储介质,所述计算机程序可操作来使计算机执行如上述方法实施例中记载的任何一种基于文本识别的区域内ESG指数确定方法的部分或全部步骤。
需要说明的是,对于前述的各方法实施例,为了简单描述,故将其都表述为一系列的动作组合,但是本领域技术人员应该知悉,本申请并不受所描述的动作顺序的限制,因为依据本申请,某些步骤可以采用其他顺序或者同时进行。其次,本领域技术人员也应该知悉,说明书中所描述的实施例均属于可选实施例,所涉及的动作和模块并不一定是本申请所必须的。
在上述实施例中,对各个实施例的描述都各有侧重,某个实施例中没有详述的部分,可以参见其他实施例的相关描述。
在本申请所提供的几个实施例中,应该理解到,所揭露的装置,可通过其它的方式实现。例如,以上所描述的装置实施例仅仅是示意性的,例如所述单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,例如多个单元或组件可以结合或者可以集成到另一个***,或一些特征可以忽略,或不执行。另一点,所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些接口,装置或单元的间接耦合或通信连接,可以是电性或其它的形式。
所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。
另外,在本申请各个实施例中的各功能单元可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中。上述集成的单元既可以采用硬件的形式实现,也可以采用软件程序模块的形式实现。
所述集成的单元如果以软件程序模块的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储器中。基于这样的理解,本申请的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的全部或部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储器中,包括若干指令用以使得一台计算机设备(可为个人计算机、服务器或者网络设备等)执行本申请各个实施例所述方法的全部或部分步骤。而前述的存储器包括:U盘、只读存储器(ROM,Read-Only Memory)、随机存取存储器(RAM,Random Access Memory)、移动硬盘、磁碟或者光盘等各种可以存储程序代码的介质。
本领域普通技术人员可以理解上述实施例的各种方法中的全部或部分步骤是可以通过程序来指令相关的硬件来完成,该程序可以存储于一计算机可读存储器中,存储器可以包括:闪存盘、只读存储器(英文:Read-Only Memory,简称:ROM)、随机存取器(英文:Random Access Memory,简称:RAM)、磁盘或光盘等。
以上对本申请实施例进行了详细介绍,本文中应用了具体个例对本申请的原理及实施方式进行了阐述,以上实施例的说明只是用于帮助理解本申请的方法及其核心思想;同时,对于本领域的一般技术人员,依据本申请的思想,在具体实施方式及应用范围上均会有改变之处,综上所述,本说明书内容不应理解为对本申请的限制。
Claims (10)
1.一种基于文本识别的区域内ESG指数确定方法,其特征在于,包括:
获取预设时间段内与ESG评价相关的多篇新闻;
对所述多篇新闻中的每篇新闻进行文本识别,得到多个新闻事件,以及所述多个新闻事件中的每个新闻事件的发生区域;
根据所述每个新闻事件的发生区域,从所述多个新闻事件中获取属于预设区域内的多个目标新闻事件;
对所述多个目标新闻事件进行聚类,得到所述多个目标新闻事件中的每个目标新闻事件的热度指数,其中,所述热度指数用于表征所述目标新闻事件在社会中的讨论热度;
基于训练好的主题识别模型,确定所述多个目标新闻事件中的每个目标新闻事件的情感指数,所述情感指数用于表征所述目标新闻事件对所述目标新闻事件相关的企业的影响程度;
根据所述每个目标新闻事件的热度指数以及情感指数,确定所述每个目标新闻事件的舆情指数,其中,所述舆情指数用于表征所述目标新闻事件对所述预设区域的ESG指数的贡献度;
根据所述每个目标新闻事件的舆情指数,确定所述预设区域的ESG指数。
2.根据权利要求1所述的方法,其特征在于,所述对所述多篇新闻中的每篇新闻进行文本识别,得到多个新闻事件,以及所述多个新闻事件中的每个新闻事件的发生区域,包括:
对所述多篇新闻中的每篇新闻进行实体识别,得到所述每篇新闻中的新闻事件;
对所述多篇新闻的新闻事件进行合并,得到所述多个新闻事件;
对所述每篇新闻进行地点识别,若从所述每篇新闻中提取到该篇新闻中的新闻事件的发生地,则将从所述每篇新闻中提取到的发生地,作为所述每篇新闻中的新闻事件的发生区域,得到所述每个新闻事件的发生区域;
若从所述每篇新闻中未提取到该篇新闻中的新闻事件的发生地,则获取所述每篇新闻中的新闻事件所涉及的企业,将所述企业的主营业务的所在地作为所述每篇新闻中的新闻事件的发生区域,得到所述每个新闻事件的发生区域。
3.根据权利要求1或2所述的方法,其特征在于,所述每个目标新闻事件的舆情指数满足以下公式:
EventScorej=HeatEventj*AdjScorej
其中,EventScorej为所述多个目标新闻事件中的第j个目标新闻事件的舆情指数,HeatEventj为所述第j个目标新闻事件的热度指数,AdjScorej为所述第j个目标新闻事件的情感指数。
4.根据权利要求3所述的方法,其特征在于,所述对所述多个目标新闻事件进行聚类,得到所述多个目标新闻事件中的每个目标新闻事件的热度指数,包括:
对所述多个目标新闻事件进行聚类,得到至少一个目标新闻事件组;
对第一目标新闻事件组中的至少一个目标新闻事件对应的至少一篇新闻进行聚类,得到至少一个新闻组,其中,所述第一目标新闻事件组为所述至少一个目标新闻事件组中的任意一个,所述至少一个新闻组中的每个新闻组包括一篇原创新闻以及与所述原创新闻对应的H篇转载新闻,H为大于或者等于0的整数;
根据所述每个新闻组包括的一篇原创新闻以及所述H篇转载新闻,确定所述每个新闻组对应的热度指数;
将所述第一目标新闻事件组中的每个目标新闻事件所归属的新闻对应的热度指数,作为该目标新闻事件的热度指数;
根据所述第一目标新闻事件组中的每个目标新闻事件的热度指数,得到所述多个目标新闻事件中的每个目标新闻事件的热度指数。
5.根据权利要求3或4所述的方法,其特征在于,所述基于训练好的主题识别模型,确定所述多个目标新闻事件中的每个目标新闻事件的情感指数,包括:
基于训练好的主题识别模型确定所述多个目标新闻事件中的每个目标新闻事件的事件主题;
获取所述多个目标新闻事件中的每个目标新闻事件的关键词;
根据所述多个目标新闻事件中的每个目标新闻事件的关键词以及该目标新闻事件的事件主题,确定所述每个目标新闻事件的细分事件;
根据预设的细分事件和情感指数之间的对应关系,以及所述多个目标新闻事件中的每个目标新闻事件的细分事件,确定所述多个目标新闻事件中的每个目标新闻事件的情感指数。
6.根据权利要求5所述的方法,其特征在于,所述根据预设的细分事件和情感指数之间的对应关系,以及所述多个目标新闻事件中的每个目标新闻事件的细分事件,确定所述多个目标新闻事件中的每个目标新闻事件的情感指数之后,所述方法还包括:
获取所述多个目标新闻事件中的每个目标新闻事件对应的新闻的发表媒体;
根据预设的发表媒体和调整量之间的映射关系,确定所述多个目标新闻事件中的每个目标新闻事件对应的调整量;
基于所述多个目标新闻事件中的每个目标新闻事件的调整量,调整所述多个目标新闻事件中的每个目标新闻事件的情感指数;
将调整后的所述多个目标新闻事件中的每个目标新闻事件的情感指数作为所述多个目标新闻事件中的每个目标新闻事件的情感指数。
7.根据权利要求1-6中任一项所述的方法,其特征在于,所述根据所述每个目标新闻事件的舆情指数,确定所述预设区域的ESG指数,包括:
确定所述多个目标新闻事件中的每个目标新闻事件的类型,其中,所述每个目标新闻事件的类型包括负面新闻事件或正面新闻事件;
确定所述多个目标新闻事件中属于负面新闻事件的目标新闻事件的舆情指数之和,得到第一总舆情指数;
确定所述多个目标新闻事件中属于正面新闻事件的目标新闻事件的舆情指数之和,得到第二总舆情指数;
根据所述第一总舆情指数和所述第二总舆情指数,确定所述预设区域的ESG指数;
其中,所述预设区域的ESG指数满足以下公式:
FinalScore=log10(|NegScore|/PosScore);
其中,FinalScore为所述预设区域内的ESG指数,NegScore为所述第一总舆情指数,PosScore为所述第二总舆情指数。
8.一种ESG指数确定装置,其特征在于,包括:获取单元和处理单元;
所述获取单元,用于获取预设时间段内与ESG评价相关的多篇新闻;
所述处理单元,用于对所述多篇新闻中的每篇新闻进行文本识别,得到多个新闻事件,以及所述多个新闻事件中的每个新闻事件的发生区域;
根据所述每个新闻事件的发生区域,从所述多个新闻事件中获取属于预设区域内的多个目标新闻事件;
对所述多个目标新闻事件进行聚类,得到所述多个目标新闻事件中的每个目标新闻事件的热度指数,其中,所述热度指数用于表征所述目标新闻事件在社会中的讨论热度;
基于训练好的主题识别模型,确定所述多个目标新闻事件中的每个目标新闻事件的情感指数,所述情感指数用于表征所述目标新闻事件对所述目标新闻事件相关的企业的影响程度;
根据所述每个目标新闻事件的热度指数以及情感指数,确定所述每个目标新闻事件的舆情指数,其中,所述舆情指数用于表征所述目标新闻事件对所述预设区域的ESG指数的贡献度;
根据所述每个目标新闻事件的舆情指数,确定所述预设区域的ESG指数。
9.一种电子设备,其特征在于,包括:处理器和存储器,所述处理器与所述存储器相连,所述存储器用于存储计算机程序,所述处理器用于执行所述存储器中存储的计算机程序,以使得所述电子设备执行如权利要求1-7中任一项所述的方法。
10.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质存储有计算机程序,所述计算机程序被处理器执行以实现如权利要求1-7中任一项所述的方法。
Priority Applications (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202111147475.XA CN113837630A (zh) | 2021-09-28 | 2021-09-28 | 基于文本识别的区域内esg指数确定方法及相关产品 |
PCT/CN2022/071321 WO2023050652A1 (zh) | 2021-09-28 | 2022-01-11 | 基于文本识别的区域内esg指数确定方法及相关产品 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202111147475.XA CN113837630A (zh) | 2021-09-28 | 2021-09-28 | 基于文本识别的区域内esg指数确定方法及相关产品 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN113837630A true CN113837630A (zh) | 2021-12-24 |
Family
ID=78967301
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202111147475.XA Withdrawn CN113837630A (zh) | 2021-09-28 | 2021-09-28 | 基于文本识别的区域内esg指数确定方法及相关产品 |
Country Status (2)
Country | Link |
---|---|
CN (1) | CN113837630A (zh) |
WO (1) | WO2023050652A1 (zh) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2023050652A1 (zh) * | 2021-09-28 | 2023-04-06 | 平安科技(深圳)有限公司 | 基于文本识别的区域内esg指数确定方法及相关产品 |
Families Citing this family (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN117076751B (zh) * | 2023-10-10 | 2024-01-16 | 西安康奈网络科技有限公司 | 一种基于多维特征分析的舆情事件发展趋势判断*** |
Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2018109936A (ja) * | 2016-12-28 | 2018-07-12 | 株式会社グッドバンカー | Esg情報を用いたポートフォリオ構築方法 |
CN109508373A (zh) * | 2018-11-13 | 2019-03-22 | 深圳前海微众银行股份有限公司 | 企业舆情指数的计算方法、设备及计算机可读存储介质 |
CN110532357A (zh) * | 2019-09-04 | 2019-12-03 | 深圳前海微众银行股份有限公司 | Esg评分体系的生成方法、装置、设备及可读存储介质 |
CN111630518A (zh) * | 2017-11-23 | 2020-09-04 | 持续可能发展所株式会社 | 基于esg的企业评价执行装置及其运转方法 |
CN113190683A (zh) * | 2021-07-02 | 2021-07-30 | 平安科技(深圳)有限公司 | 基于聚类技术的企业esg指数确定方法及相关产品 |
CN113240272A (zh) * | 2021-05-12 | 2021-08-10 | 平安科技(深圳)有限公司 | 企业esg指数确定方法及相关产品 |
Family Cites Families (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20220321395A1 (en) * | 2019-05-15 | 2022-10-06 | Telefonaktiebolaget Lm Ericsson (Publ) | Managing network event data in a telecommunications network |
CN111143655B (zh) * | 2019-12-30 | 2023-03-21 | 创新奇智(青岛)科技有限公司 | 一种新闻热度的计算方法 |
CN112613296B (zh) * | 2020-12-07 | 2024-07-19 | 深圳价值在线信息科技股份有限公司 | 新闻的重要程度获取方法、装置、终端设备及存储介质 |
CN113837630A (zh) * | 2021-09-28 | 2021-12-24 | 平安科技(深圳)有限公司 | 基于文本识别的区域内esg指数确定方法及相关产品 |
-
2021
- 2021-09-28 CN CN202111147475.XA patent/CN113837630A/zh not_active Withdrawn
-
2022
- 2022-01-11 WO PCT/CN2022/071321 patent/WO2023050652A1/zh unknown
Patent Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2018109936A (ja) * | 2016-12-28 | 2018-07-12 | 株式会社グッドバンカー | Esg情報を用いたポートフォリオ構築方法 |
CN111630518A (zh) * | 2017-11-23 | 2020-09-04 | 持续可能发展所株式会社 | 基于esg的企业评价执行装置及其运转方法 |
CN109508373A (zh) * | 2018-11-13 | 2019-03-22 | 深圳前海微众银行股份有限公司 | 企业舆情指数的计算方法、设备及计算机可读存储介质 |
CN110532357A (zh) * | 2019-09-04 | 2019-12-03 | 深圳前海微众银行股份有限公司 | Esg评分体系的生成方法、装置、设备及可读存储介质 |
CN113240272A (zh) * | 2021-05-12 | 2021-08-10 | 平安科技(深圳)有限公司 | 企业esg指数确定方法及相关产品 |
CN113190683A (zh) * | 2021-07-02 | 2021-07-30 | 平安科技(深圳)有限公司 | 基于聚类技术的企业esg指数确定方法及相关产品 |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2023050652A1 (zh) * | 2021-09-28 | 2023-04-06 | 平安科技(深圳)有限公司 | 基于文本识别的区域内esg指数确定方法及相关产品 |
Also Published As
Publication number | Publication date |
---|---|
WO2023050652A1 (zh) | 2023-04-06 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN102929861B (zh) | 一种文本情感指数计算方法和*** | |
CN109767318A (zh) | 贷款产品推荐方法、装置、设备及存储介质 | |
CN110866110A (zh) | 基于人工智能的会议纪要生成方法、装置、设备及介质 | |
CN113190683B (zh) | 基于聚类技术的企业esg指数确定方法及相关产品 | |
CN113837630A (zh) | 基于文本识别的区域内esg指数确定方法及相关产品 | |
CN112686022A (zh) | 违规语料的检测方法、装置、计算机设备及存储介质 | |
CN110134842B (zh) | 基于信息图谱的信息匹配方法、装置、存储介质和服务器 | |
CN108021582B (zh) | 互联网舆情监控方法及装置 | |
CN109993448A (zh) | 一种企业网络舆情潜在风险的评估方法及*** | |
CN113342972B (zh) | 舆情识别模型训练方法、***以及舆情风险监测方法和*** | |
CN110309234A (zh) | 一种基于知识图谱的客户持仓预警方法、装置及存储介质 | |
WO2023071120A1 (zh) | 数字资产中的绿色资产的占比的识别方法及相关产品 | |
CN116362811A (zh) | 一种基于大数据的广告自动化投放管理*** | |
Jotheeswaran et al. | Feature reduction using principal component analysis for opinion mining | |
CN113378090B (zh) | 一种互联网网站相似度分析方法、装置以及可读存储介质 | |
CN110826315A (zh) | 使用神经网络***识别短文本时效性的方法 | |
CN113887202A (zh) | 文本纠错方法、装置、计算机设备及存储介质 | |
CN113569118A (zh) | 自媒体推送方法、装置、计算机设备及存储介质 | |
CN108427769B (zh) | 一种基于社交网络的人物兴趣标签提取方法 | |
WO2023071129A1 (zh) | 绿色资产的占比的识别方法及相关产品 | |
CN110134866A (zh) | 信息推荐方法及装置 | |
CN112597295B (zh) | 摘要提取方法、装置、计算机设备和存储介质 | |
Das et al. | Opinion based on polarity and clustering for product feature extraction | |
CN113051484B (zh) | 确定热点社交类信息的方法及装置 | |
CN109033050A (zh) | 文章生成方法、设备及存储介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
REG | Reference to a national code |
Ref country code: HK Ref legal event code: DE Ref document number: 40062856 Country of ref document: HK |
|
WW01 | Invention patent application withdrawn after publication | ||
WW01 | Invention patent application withdrawn after publication |
Application publication date: 20211224 |