CN111126879B - 一种绿色金融项目遴选评估方法 - Google Patents
一种绿色金融项目遴选评估方法 Download PDFInfo
- Publication number
- CN111126879B CN111126879B CN201911421053.XA CN201911421053A CN111126879B CN 111126879 B CN111126879 B CN 111126879B CN 201911421053 A CN201911421053 A CN 201911421053A CN 111126879 B CN111126879 B CN 111126879B
- Authority
- CN
- China
- Prior art keywords
- green
- keywords
- data
- acquisition
- standard
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000011156 evaluation Methods 0.000 title claims abstract description 21
- 238000000034 method Methods 0.000 claims abstract description 21
- 238000013210 evaluation model Methods 0.000 claims abstract description 8
- 239000000463 material Substances 0.000 claims abstract description 7
- 238000013527 convolutional neural network Methods 0.000 claims description 10
- 238000013500 data storage Methods 0.000 claims description 6
- 230000007613 environmental effect Effects 0.000 claims description 4
- 238000002372 labelling Methods 0.000 claims description 4
- 238000004458 analytical method Methods 0.000 claims description 3
- 238000012544 monitoring process Methods 0.000 claims description 3
- 230000011218 segmentation Effects 0.000 claims description 3
- 239000013598 vector Substances 0.000 claims description 3
- 238000010276 construction Methods 0.000 description 2
- 238000013528 artificial neural network Methods 0.000 description 1
- 230000010485 coping Effects 0.000 description 1
- 238000012217 deletion Methods 0.000 description 1
- 230000037430 deletion Effects 0.000 description 1
- 238000010586 diagram Methods 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 238000004134 energy conservation Methods 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 230000004927 fusion Effects 0.000 description 1
- PCHJSUWPFVWCPO-UHFFFAOYSA-N gold Chemical compound [Au] PCHJSUWPFVWCPO-UHFFFAOYSA-N 0.000 description 1
- 239000010931 gold Substances 0.000 description 1
- 229910052737 gold Inorganic materials 0.000 description 1
- 238000007477 logistic regression Methods 0.000 description 1
- 230000007787 long-term memory Effects 0.000 description 1
- 238000007726 management method Methods 0.000 description 1
- 238000004519 manufacturing process Methods 0.000 description 1
- 238000012545 processing Methods 0.000 description 1
- 230000000306 recurrent effect Effects 0.000 description 1
- 230000006403 short-term memory Effects 0.000 description 1
- 238000006467 substitution reaction Methods 0.000 description 1
- 238000012706 support-vector machine Methods 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q10/00—Administration; Management
- G06Q10/06—Resources, workflows, human or project management; Enterprise or organisation planning; Enterprise or organisation modelling
- G06Q10/063—Operations research, analysis or management
- G06Q10/0639—Performance analysis of employees; Performance analysis of enterprise or organisation operations
Landscapes
- Business, Economics & Management (AREA)
- Human Resources & Organizations (AREA)
- Engineering & Computer Science (AREA)
- Strategic Management (AREA)
- Development Economics (AREA)
- Economics (AREA)
- Entrepreneurship & Innovation (AREA)
- Educational Administration (AREA)
- Operations Research (AREA)
- Marketing (AREA)
- Game Theory and Decision Science (AREA)
- Quality & Reliability (AREA)
- Tourism & Hospitality (AREA)
- Physics & Mathematics (AREA)
- General Business, Economics & Management (AREA)
- General Physics & Mathematics (AREA)
- Theoretical Computer Science (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
本发明公开了一种绿色金融项目遴选评估方法,包括以下步骤:采集原始环境数据;基于原始环境数据建立数据主题表;针对数据主题表进行关键词提取,获得绿色标准关键词、绿色条件限制关键词及非绿色标准关键词,得到绿色标准知识库;针对申报材料进行关键词提取,并基于绿色关键词知识库进行关键词匹配,获得绿色项目库;基于绿色标准知识库和绿色项目库,建立遴选评估模型。本发明通过对环境数据进行分类整理,梳理绿色金融评估规则,并基于遴选评估模型来实现项目的评估,从而能够给应用评估单位实现相关绿色金融决策。
Description
技术领域
本发明涉及数据处理技术领域,特别涉及一种绿色金融项目遴选评估方 法。
背景技术
企绿色金融是指为支持环境改善、应对气候变化和资源节约高效利用的 经济活动,即对环保、节能、清洁能源、绿色交通、绿色建筑等领域的项目 投融资、项目运营、风险管理等所提供的金融服务。各地区正在大力通过金 融推进项目的建设,但如何评估一个项目,则需要大量的行业知识以及政策 数据,据不完全统计,国家一年所收到的申请金融评估的项目达到几十万个,评估工作量巨大,但目前仍主要依靠人工审核评估的方式,急需要一个标准 的评估方法才可以满足评估的要求。
发明内容
为解决上述问题,本发明提供了一种绿色金融项目遴选评估方法。
本发明采用以下技术方案:
一种绿色金融项目遴选评估方法,其包括以下步骤:
S1、采集原始环境数据;
S2、基于原始环境数据建立数据主题表;
S3、针对数据主题表进行关键词提取,获得绿色标准关键词、绿色条件 限制关键词及非绿色标准关键词,得到绿色标准知识库;
S4、针对申报材料进行关键词提取,并基于绿色关键词知识库进行关键 词匹配,获得绿色项目库;
S5、基于绿色标准知识库和绿色项目库,建立遴选评估模型。
优选地,所述步骤S1的采集原始环境数据具体为:
制定数据采集策略,利用爬虫工具对环保类网站进行数据采集,所述数 据采集策略包括采集频度、采集方式,所述采集方式包括增量采集和全量采 集。
优选地,所述步骤S2包括以下分步骤:
S21、针对原始环境数据按环境模型进行分类,分为基本信息、证照信息、 环评信息、处罚信息、排污监测、挂牌督办及突发事件;
S22、针对每类环境数据,按照数据库建表的方法建数据存储表,数据存 储表包括描述数据的所有字段。
优选地,所述步骤S4包括以下分步骤:
S41、基于申报材料,利用正则表达式的方式匹配和绿色标准关键词、绿 色条件限制关键词、非绿色标准关键词关联的关键词;
S42、采用特征工程匹配关键词。
优选地,所述步骤S42包括以下子步骤:
S421、命名实体识别,所述命名实体识别包括窗口方法和句子方法,所 述窗口方法使用当前预测词的上下文窗口进行输入,然后利用NN结构进行 识别,所述句子方法以整个句子作为当前预测词的输入,加入了句子中相对位置特征来区分句子中的每个词,然后使用了一层卷积神经网络CNN结构;
S422、实体关系提取,利用词向量、句法分析或分词方法进行实体关系 提取;
S423、文本信息分类,并进行序列标注。
采用上述技术方案后,本发明与背景技术相比,具有如下优点:
本发明通过对环境数据进行分类整理,梳理绿色金融评估规则,并基于 遴选评估模型来实现项目的评估,从而能够给应用评估单位实现相关绿色金 融决策。
附图说明
图1为本发明的流程示意图;
图2示出了绿色标准知识库;
图3示出了卷积神经网络的结构;
图4为本发明遴选评估模型的示意图。
具体实施方式
为了使本发明的目的、技术方案及优点更加清楚明白,以下结合附图及 实施例,对本发明进行进一步详细说明。应当理解,此处所描述的具体实施 例仅仅用以解释本发明,并不用于限定本发明。
实施例
参考图1所示,本发明公开了一种绿色金融项目遴选评估方法,其包括 以下步骤:
S1、采集原始环境数据。制定数据采集策略,利用爬虫工具对环保类网 站进行数据采集,所述数据采集策略包括采集频度、采集方式,所述采集方 式包括增量采集和全量采集。
S2、基于原始环境数据建立数据主题表。该步骤通过以下分步骤实现:
S21、针对原始环境数据按环境模型进行分类,分为基本信息、证照信息、 环评信息、处罚信息、排污监测、挂牌督办及突发事件。
S22、针对每类环境数据,按照数据库建表的方法建数据存储表,数据存 储表包括描述数据的所有字段。上述字段包括技术主键、安全生产许可类别、 企业名称、地址、企业类型、负责人、许可范围、发证日期、有效期、证书 编号、注销证书、备注、网页标题、详情链接、正文、页面标签详情、发布日期、审批文号、作者、发布机构、附件名称、附件ID、网址ID、数据采集 日期、数据来源代码、数据逻辑删除标志、数据加载更新日期等。
S3、针对数据主题表进行关键词提取,获得绿色标准关键词、绿色条件 限制关键词及非绿色标准关键词,得到绿色标准知识库(如图2所示)。
S4、针对申报材料进行关键词提取,并基于绿色关键词知识库进行关键 词匹配,获得绿色项目库。
S41、基于申报材料,利用正则表达式的方式匹配和绿色标准关键词、绿 色条件限制关键词、非绿色标准关键词关联的关键词;
S42、采用特征工程匹配关键词。
S421、命名实体识别,所述命名实体识别包括窗口方法和句子方法,所 述窗口方法使用当前预测词的上下文窗口进行输入,然后利用NN结构进行 识别,所述句子方法以整个句子作为当前预测词的输入,加入了句子中相对位置特征来区分句子中的每个词,然后使用了一层卷积神经网络CNN结构。 卷积神经网络的结构如图3所示。
S422、实体关系提取,利用词向量、句法分析或分词方法进行实体关系 提取。
S423、文本信息分类,并进行序列标注。该步骤中进行文本信息分类和 序列标注用到的模型包括LR(逻辑回归模型),SVM(支持向量机模型), HMM(隐马尔可夫模型),CRF(中文名称条件随机场算法),CNN(卷积 神经网络),RNN(循环神经网络),LSTM(长短期记忆)。
S5、基于绿色标准知识库和绿色项目库,建立遴选评估模型。遴选评估 模型包含分类、关键词及权重,具体参考图4所示。
以上所述,仅为本发明较佳的具体实施方式,但本发明的保护范围并不 局限于此,任何熟悉本技术领域的技术人员在本发明揭露的技术范围内,可轻易想到的变化或替换,都应涵盖在本发明的保护范围之内。因此,本发明 的保护范围应该以权利要求的保护范围为准。
Claims (3)
1.一种绿色金融项目遴选评估方法,其包括以下步骤:
S1、采集原始环境数据;
S2、基于原始环境数据建立数据主题表;
步骤S2包括以下分步骤:
S21、针对原始环境数据按环境模型进行分类,分为基本信息、证照信息、环评信息、处罚信息、排污监测、挂牌督办及突发事件;
S22、针对每类环境数据,按照数据库建表的方法建数据存储表,数据存储表包括描述数据的所有字段;
S3、针对数据主题表进行关键词提取,获得绿色标准关键词、绿色条件限制关键词及非绿色标准关键词,得到绿色标准知识库;
S4、针对申报材料进行关键词提取,并基于绿色关键词知识库进行关键词匹配,获得绿色项目库;
步骤S4包括以下分步骤:
S41、基于申报材料,利用正则表达式的方式匹配和绿色标准关键词、绿色条件限制关键词、非绿色标准关键词关联的关键词;
S42、采用特征工程匹配关键词;
S5、基于绿色标准知识库和绿色项目库,建立遴选评估模型。
2.如权利要求1所述的一种绿色金融项目遴选评估方法,其特征在于,所述步骤S1的采集原始环境数据具体为:
制定数据采集策略,利用爬虫工具对环保类网站进行数据采集,所述数据采集策略包括采集频度、采集方式,所述采集方式包括增量采集和全量采集。
3.如权利要求1所述的一种绿色金融项目遴选评估方法,其特征在于,所述步骤S42包括以下子步骤:
S421、命名实体识别,所述命名实体识别包括窗口方法和句子方法,所述窗口方法使用当前预测词的上下文窗口进行输入,然后利用NN结构进行识别,所述句子方法以整个句子作为当前预测词的输入,加入了句子中相对位置特征来区分句子中的每个词,然后使用了一层卷积神经网络CNN结构;
S422、实体关系提取,利用词向量、句法分析或分词方法进行实体关系提取;
S423、文本信息分类,并进行序列标注。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201911421053.XA CN111126879B (zh) | 2019-12-31 | 2019-12-31 | 一种绿色金融项目遴选评估方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201911421053.XA CN111126879B (zh) | 2019-12-31 | 2019-12-31 | 一种绿色金融项目遴选评估方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN111126879A CN111126879A (zh) | 2020-05-08 |
CN111126879B true CN111126879B (zh) | 2024-05-31 |
Family
ID=70507518
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201911421053.XA Active CN111126879B (zh) | 2019-12-31 | 2019-12-31 | 一种绿色金融项目遴选评估方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN111126879B (zh) |
Families Citing this family (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN113706309A (zh) * | 2021-08-30 | 2021-11-26 | 山东理工大学 | 一种基于人工智能的投资风险评估方法及*** |
Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2003036261A (ja) * | 2001-07-26 | 2003-02-07 | Kyodo News Service | 文章自動分類装置、文章自動分類プログラム、文章自動分類方法及び文章自動分類プログラムを記録したコンピュータ読取可能な記録媒体 |
CN108038627A (zh) * | 2017-12-27 | 2018-05-15 | 科大讯飞股份有限公司 | 一种对象评估方法及装置 |
CN110046225A (zh) * | 2019-04-16 | 2019-07-23 | 广东省科技基础条件平台中心 | 一种科技项目材料完整性评估决策模型训练方法 |
CN110275935A (zh) * | 2019-05-10 | 2019-09-24 | 平安科技(深圳)有限公司 | 政策信息的处理方法、装置、及存储介质、电子装置 |
CN110321471A (zh) * | 2019-04-19 | 2019-10-11 | 四川政资汇智能科技有限公司 | 一种基于政策性资源汇聚的互联网科技金融智能匹配方法 |
-
2019
- 2019-12-31 CN CN201911421053.XA patent/CN111126879B/zh active Active
Patent Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2003036261A (ja) * | 2001-07-26 | 2003-02-07 | Kyodo News Service | 文章自動分類装置、文章自動分類プログラム、文章自動分類方法及び文章自動分類プログラムを記録したコンピュータ読取可能な記録媒体 |
CN108038627A (zh) * | 2017-12-27 | 2018-05-15 | 科大讯飞股份有限公司 | 一种对象评估方法及装置 |
CN110046225A (zh) * | 2019-04-16 | 2019-07-23 | 广东省科技基础条件平台中心 | 一种科技项目材料完整性评估决策模型训练方法 |
CN110321471A (zh) * | 2019-04-19 | 2019-10-11 | 四川政资汇智能科技有限公司 | 一种基于政策性资源汇聚的互联网科技金融智能匹配方法 |
CN110275935A (zh) * | 2019-05-10 | 2019-09-24 | 平安科技(深圳)有限公司 | 政策信息的处理方法、装置、及存储介质、电子装置 |
Also Published As
Publication number | Publication date |
---|---|
CN111126879A (zh) | 2020-05-08 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Aamer et al. | Data analytics in the supply chain management: Review of machine learning applications in demand forecasting | |
CN108897857B (zh) | 面向领域的中文文本主题句生成方法 | |
Wang et al. | Dynamic attention deep model for article recommendation by learning human editors' demonstration | |
US20230334254A1 (en) | Fact checking | |
Pan et al. | A survey on transfer learning | |
CN107622050A (zh) | 基于Bi‑LSTM和CRF的文本序列标注***及方法 | |
CN112184525A (zh) | 通过自然语义分析实现智能匹配推荐的***及方法 | |
CN108984775B (zh) | 一种基于商品评论的舆情监控方法及*** | |
CN112307153B (zh) | 一种产业知识库自动构建方法、装置及存储介质 | |
CN104978587A (zh) | 一种基于文档类型的实体识别合作学习算法 | |
US11620453B2 (en) | System and method for artificial intelligence driven document analysis, including searching, indexing, comparing or associating datasets based on learned representations | |
CN111462752A (zh) | 基于注意力机制、特征嵌入及bi-lstm的客户意图识别方法 | |
CN111126879B (zh) | 一种绿色金融项目遴选评估方法 | |
Chen et al. | A knowledge-based method for eco-efficiency upgrading of remanufacturing process planning | |
CN111737498A (zh) | 一种应用于离散制造业生产过程的领域知识库建立方法 | |
CN115730603A (zh) | 基于人工智能的信息提取方法、装置、设备及存储介质 | |
CN116186266A (zh) | Bert、ner实体抽取以及知识图谱的物料分类优化方法及*** | |
CN115544112A (zh) | 一种基于大数据人工智能的双创成果高价值专利筛选方法 | |
CN115599910A (zh) | 一种企业三级行业多标签分类方法 | |
CN112488593B (zh) | 一种用于招标的辅助评标***及方法 | |
CN115456680A (zh) | 基于交叉特征提取模型的广告点击预测方法及其相关设备 | |
CN115204179A (zh) | 基于电网公共数据模型的实体关系预测的方法及装置 | |
Bao et al. | Hot news prediction method based on natural language processing technology and its application | |
CN112464668A (zh) | 一种提取智能家居行业动态信息的方法和*** | |
CN109993231A (zh) | 一种基于频繁项集的多标签分类方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |