CN111126879B - 一种绿色金融项目遴选评估方法 - Google Patents

一种绿色金融项目遴选评估方法 Download PDF

Info

Publication number
CN111126879B
CN111126879B CN201911421053.XA CN201911421053A CN111126879B CN 111126879 B CN111126879 B CN 111126879B CN 201911421053 A CN201911421053 A CN 201911421053A CN 111126879 B CN111126879 B CN 111126879B
Authority
CN
China
Prior art keywords
green
keywords
data
acquisition
standard
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201911421053.XA
Other languages
English (en)
Other versions
CN111126879A (zh
Inventor
邱涛
曾嘉凯
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Xiamen Meiqi Information Technology Co ltd
Original Assignee
Xiamen Meiqi Information Technology Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Xiamen Meiqi Information Technology Co ltd filed Critical Xiamen Meiqi Information Technology Co ltd
Priority to CN201911421053.XA priority Critical patent/CN111126879B/zh
Publication of CN111126879A publication Critical patent/CN111126879A/zh
Application granted granted Critical
Publication of CN111126879B publication Critical patent/CN111126879B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/06Resources, workflows, human or project management; Enterprise or organisation planning; Enterprise or organisation modelling
    • G06Q10/063Operations research, analysis or management
    • G06Q10/0639Performance analysis of employees; Performance analysis of enterprise or organisation operations

Landscapes

  • Business, Economics & Management (AREA)
  • Human Resources & Organizations (AREA)
  • Engineering & Computer Science (AREA)
  • Strategic Management (AREA)
  • Development Economics (AREA)
  • Economics (AREA)
  • Entrepreneurship & Innovation (AREA)
  • Educational Administration (AREA)
  • Operations Research (AREA)
  • Marketing (AREA)
  • Game Theory and Decision Science (AREA)
  • Quality & Reliability (AREA)
  • Tourism & Hospitality (AREA)
  • Physics & Mathematics (AREA)
  • General Business, Economics & Management (AREA)
  • General Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明公开了一种绿色金融项目遴选评估方法,包括以下步骤:采集原始环境数据;基于原始环境数据建立数据主题表;针对数据主题表进行关键词提取,获得绿色标准关键词、绿色条件限制关键词及非绿色标准关键词,得到绿色标准知识库;针对申报材料进行关键词提取,并基于绿色关键词知识库进行关键词匹配,获得绿色项目库;基于绿色标准知识库和绿色项目库,建立遴选评估模型。本发明通过对环境数据进行分类整理,梳理绿色金融评估规则,并基于遴选评估模型来实现项目的评估,从而能够给应用评估单位实现相关绿色金融决策。

Description

一种绿色金融项目遴选评估方法
技术领域
本发明涉及数据处理技术领域,特别涉及一种绿色金融项目遴选评估方 法。
背景技术
企绿色金融是指为支持环境改善、应对气候变化和资源节约高效利用的 经济活动,即对环保、节能、清洁能源、绿色交通、绿色建筑等领域的项目 投融资、项目运营、风险管理等所提供的金融服务。各地区正在大力通过金 融推进项目的建设,但如何评估一个项目,则需要大量的行业知识以及政策 数据,据不完全统计,国家一年所收到的申请金融评估的项目达到几十万个,评估工作量巨大,但目前仍主要依靠人工审核评估的方式,急需要一个标准 的评估方法才可以满足评估的要求。
发明内容
为解决上述问题,本发明提供了一种绿色金融项目遴选评估方法。
本发明采用以下技术方案:
一种绿色金融项目遴选评估方法,其包括以下步骤:
S1、采集原始环境数据;
S2、基于原始环境数据建立数据主题表;
S3、针对数据主题表进行关键词提取,获得绿色标准关键词、绿色条件 限制关键词及非绿色标准关键词,得到绿色标准知识库;
S4、针对申报材料进行关键词提取,并基于绿色关键词知识库进行关键 词匹配,获得绿色项目库;
S5、基于绿色标准知识库和绿色项目库,建立遴选评估模型。
优选地,所述步骤S1的采集原始环境数据具体为:
制定数据采集策略,利用爬虫工具对环保类网站进行数据采集,所述数 据采集策略包括采集频度、采集方式,所述采集方式包括增量采集和全量采 集。
优选地,所述步骤S2包括以下分步骤:
S21、针对原始环境数据按环境模型进行分类,分为基本信息、证照信息、 环评信息、处罚信息、排污监测、挂牌督办及突发事件;
S22、针对每类环境数据,按照数据库建表的方法建数据存储表,数据存 储表包括描述数据的所有字段。
优选地,所述步骤S4包括以下分步骤:
S41、基于申报材料,利用正则表达式的方式匹配和绿色标准关键词、绿 色条件限制关键词、非绿色标准关键词关联的关键词;
S42、采用特征工程匹配关键词。
优选地,所述步骤S42包括以下子步骤:
S421、命名实体识别,所述命名实体识别包括窗口方法和句子方法,所 述窗口方法使用当前预测词的上下文窗口进行输入,然后利用NN结构进行 识别,所述句子方法以整个句子作为当前预测词的输入,加入了句子中相对位置特征来区分句子中的每个词,然后使用了一层卷积神经网络CNN结构;
S422、实体关系提取,利用词向量、句法分析或分词方法进行实体关系 提取;
S423、文本信息分类,并进行序列标注。
采用上述技术方案后,本发明与背景技术相比,具有如下优点:
本发明通过对环境数据进行分类整理,梳理绿色金融评估规则,并基于 遴选评估模型来实现项目的评估,从而能够给应用评估单位实现相关绿色金 融决策。
附图说明
图1为本发明的流程示意图;
图2示出了绿色标准知识库;
图3示出了卷积神经网络的结构;
图4为本发明遴选评估模型的示意图。
具体实施方式
为了使本发明的目的、技术方案及优点更加清楚明白,以下结合附图及 实施例,对本发明进行进一步详细说明。应当理解,此处所描述的具体实施 例仅仅用以解释本发明,并不用于限定本发明。
实施例
参考图1所示,本发明公开了一种绿色金融项目遴选评估方法,其包括 以下步骤:
S1、采集原始环境数据。制定数据采集策略,利用爬虫工具对环保类网 站进行数据采集,所述数据采集策略包括采集频度、采集方式,所述采集方 式包括增量采集和全量采集。
S2、基于原始环境数据建立数据主题表。该步骤通过以下分步骤实现:
S21、针对原始环境数据按环境模型进行分类,分为基本信息、证照信息、 环评信息、处罚信息、排污监测、挂牌督办及突发事件。
S22、针对每类环境数据,按照数据库建表的方法建数据存储表,数据存 储表包括描述数据的所有字段。上述字段包括技术主键、安全生产许可类别、 企业名称、地址、企业类型、负责人、许可范围、发证日期、有效期、证书 编号、注销证书、备注、网页标题、详情链接、正文、页面标签详情、发布日期、审批文号、作者、发布机构、附件名称、附件ID、网址ID、数据采集 日期、数据来源代码、数据逻辑删除标志、数据加载更新日期等。
S3、针对数据主题表进行关键词提取,获得绿色标准关键词、绿色条件 限制关键词及非绿色标准关键词,得到绿色标准知识库(如图2所示)。
S4、针对申报材料进行关键词提取,并基于绿色关键词知识库进行关键 词匹配,获得绿色项目库。
S41、基于申报材料,利用正则表达式的方式匹配和绿色标准关键词、绿 色条件限制关键词、非绿色标准关键词关联的关键词;
S42、采用特征工程匹配关键词。
S421、命名实体识别,所述命名实体识别包括窗口方法和句子方法,所 述窗口方法使用当前预测词的上下文窗口进行输入,然后利用NN结构进行 识别,所述句子方法以整个句子作为当前预测词的输入,加入了句子中相对位置特征来区分句子中的每个词,然后使用了一层卷积神经网络CNN结构。 卷积神经网络的结构如图3所示。
S422、实体关系提取,利用词向量、句法分析或分词方法进行实体关系 提取。
S423、文本信息分类,并进行序列标注。该步骤中进行文本信息分类和 序列标注用到的模型包括LR(逻辑回归模型),SVM(支持向量机模型), HMM(隐马尔可夫模型),CRF(中文名称条件随机场算法),CNN(卷积 神经网络),RNN(循环神经网络),LSTM(长短期记忆)。
S5、基于绿色标准知识库和绿色项目库,建立遴选评估模型。遴选评估 模型包含分类、关键词及权重,具体参考图4所示。
以上所述,仅为本发明较佳的具体实施方式,但本发明的保护范围并不 局限于此,任何熟悉本技术领域的技术人员在本发明揭露的技术范围内,可轻易想到的变化或替换,都应涵盖在本发明的保护范围之内。因此,本发明 的保护范围应该以权利要求的保护范围为准。

Claims (3)

1.一种绿色金融项目遴选评估方法,其包括以下步骤:
S1、采集原始环境数据;
S2、基于原始环境数据建立数据主题表;
步骤S2包括以下分步骤:
S21、针对原始环境数据按环境模型进行分类,分为基本信息、证照信息、环评信息、处罚信息、排污监测、挂牌督办及突发事件;
S22、针对每类环境数据,按照数据库建表的方法建数据存储表,数据存储表包括描述数据的所有字段;
S3、针对数据主题表进行关键词提取,获得绿色标准关键词、绿色条件限制关键词及非绿色标准关键词,得到绿色标准知识库;
S4、针对申报材料进行关键词提取,并基于绿色关键词知识库进行关键词匹配,获得绿色项目库;
步骤S4包括以下分步骤:
S41、基于申报材料,利用正则表达式的方式匹配和绿色标准关键词、绿色条件限制关键词、非绿色标准关键词关联的关键词;
S42、采用特征工程匹配关键词;
S5、基于绿色标准知识库和绿色项目库,建立遴选评估模型。
2.如权利要求1所述的一种绿色金融项目遴选评估方法,其特征在于,所述步骤S1的采集原始环境数据具体为:
制定数据采集策略,利用爬虫工具对环保类网站进行数据采集,所述数据采集策略包括采集频度、采集方式,所述采集方式包括增量采集和全量采集。
3.如权利要求1所述的一种绿色金融项目遴选评估方法,其特征在于,所述步骤S42包括以下子步骤:
S421、命名实体识别,所述命名实体识别包括窗口方法和句子方法,所述窗口方法使用当前预测词的上下文窗口进行输入,然后利用NN结构进行识别,所述句子方法以整个句子作为当前预测词的输入,加入了句子中相对位置特征来区分句子中的每个词,然后使用了一层卷积神经网络CNN结构;
S422、实体关系提取,利用词向量、句法分析或分词方法进行实体关系提取;
S423、文本信息分类,并进行序列标注。
CN201911421053.XA 2019-12-31 2019-12-31 一种绿色金融项目遴选评估方法 Active CN111126879B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201911421053.XA CN111126879B (zh) 2019-12-31 2019-12-31 一种绿色金融项目遴选评估方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201911421053.XA CN111126879B (zh) 2019-12-31 2019-12-31 一种绿色金融项目遴选评估方法

Publications (2)

Publication Number Publication Date
CN111126879A CN111126879A (zh) 2020-05-08
CN111126879B true CN111126879B (zh) 2024-05-31

Family

ID=70507518

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201911421053.XA Active CN111126879B (zh) 2019-12-31 2019-12-31 一种绿色金融项目遴选评估方法

Country Status (1)

Country Link
CN (1) CN111126879B (zh)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113706309A (zh) * 2021-08-30 2021-11-26 山东理工大学 一种基于人工智能的投资风险评估方法及***

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2003036261A (ja) * 2001-07-26 2003-02-07 Kyodo News Service 文章自動分類装置、文章自動分類プログラム、文章自動分類方法及び文章自動分類プログラムを記録したコンピュータ読取可能な記録媒体
CN108038627A (zh) * 2017-12-27 2018-05-15 科大讯飞股份有限公司 一种对象评估方法及装置
CN110046225A (zh) * 2019-04-16 2019-07-23 广东省科技基础条件平台中心 一种科技项目材料完整性评估决策模型训练方法
CN110275935A (zh) * 2019-05-10 2019-09-24 平安科技(深圳)有限公司 政策信息的处理方法、装置、及存储介质、电子装置
CN110321471A (zh) * 2019-04-19 2019-10-11 四川政资汇智能科技有限公司 一种基于政策性资源汇聚的互联网科技金融智能匹配方法

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2003036261A (ja) * 2001-07-26 2003-02-07 Kyodo News Service 文章自動分類装置、文章自動分類プログラム、文章自動分類方法及び文章自動分類プログラムを記録したコンピュータ読取可能な記録媒体
CN108038627A (zh) * 2017-12-27 2018-05-15 科大讯飞股份有限公司 一种对象评估方法及装置
CN110046225A (zh) * 2019-04-16 2019-07-23 广东省科技基础条件平台中心 一种科技项目材料完整性评估决策模型训练方法
CN110321471A (zh) * 2019-04-19 2019-10-11 四川政资汇智能科技有限公司 一种基于政策性资源汇聚的互联网科技金融智能匹配方法
CN110275935A (zh) * 2019-05-10 2019-09-24 平安科技(深圳)有限公司 政策信息的处理方法、装置、及存储介质、电子装置

Also Published As

Publication number Publication date
CN111126879A (zh) 2020-05-08

Similar Documents

Publication Publication Date Title
Aamer et al. Data analytics in the supply chain management: Review of machine learning applications in demand forecasting
CN108897857B (zh) 面向领域的中文文本主题句生成方法
Wang et al. Dynamic attention deep model for article recommendation by learning human editors' demonstration
US20230334254A1 (en) Fact checking
Pan et al. A survey on transfer learning
CN107622050A (zh) 基于Bi‑LSTM和CRF的文本序列标注***及方法
CN112184525A (zh) 通过自然语义分析实现智能匹配推荐的***及方法
CN108984775B (zh) 一种基于商品评论的舆情监控方法及***
CN112307153B (zh) 一种产业知识库自动构建方法、装置及存储介质
CN104978587A (zh) 一种基于文档类型的实体识别合作学习算法
US11620453B2 (en) System and method for artificial intelligence driven document analysis, including searching, indexing, comparing or associating datasets based on learned representations
CN111462752A (zh) 基于注意力机制、特征嵌入及bi-lstm的客户意图识别方法
CN111126879B (zh) 一种绿色金融项目遴选评估方法
Chen et al. A knowledge-based method for eco-efficiency upgrading of remanufacturing process planning
CN111737498A (zh) 一种应用于离散制造业生产过程的领域知识库建立方法
CN115730603A (zh) 基于人工智能的信息提取方法、装置、设备及存储介质
CN116186266A (zh) Bert、ner实体抽取以及知识图谱的物料分类优化方法及***
CN115544112A (zh) 一种基于大数据人工智能的双创成果高价值专利筛选方法
CN115599910A (zh) 一种企业三级行业多标签分类方法
CN112488593B (zh) 一种用于招标的辅助评标***及方法
CN115456680A (zh) 基于交叉特征提取模型的广告点击预测方法及其相关设备
CN115204179A (zh) 基于电网公共数据模型的实体关系预测的方法及装置
Bao et al. Hot news prediction method based on natural language processing technology and its application
CN112464668A (zh) 一种提取智能家居行业动态信息的方法和***
CN109993231A (zh) 一种基于频繁项集的多标签分类方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant