CN112036150A - 电价政策条款解析方法、存储介质及计算机 - Google Patents

电价政策条款解析方法、存储介质及计算机 Download PDF

Info

Publication number
CN112036150A
CN112036150A CN202010644374.2A CN202010644374A CN112036150A CN 112036150 A CN112036150 A CN 112036150A CN 202010644374 A CN202010644374 A CN 202010644374A CN 112036150 A CN112036150 A CN 112036150A
Authority
CN
China
Prior art keywords
policy
execution
clause
information
price
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202010644374.2A
Other languages
English (en)
Inventor
李玫
丁德智
李国栋
张海俊
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Yuanguang Software Co Ltd
Original Assignee
Yuanguang Software Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Yuanguang Software Co Ltd filed Critical Yuanguang Software Co Ltd
Priority to CN202010644374.2A priority Critical patent/CN112036150A/zh
Publication of CN112036150A publication Critical patent/CN112036150A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • G06F40/205Parsing
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/31Indexing; Data structures therefor; Storage structures
    • G06F16/316Indexing structures
    • G06F16/319Inverted lists
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/33Querying
    • G06F16/332Query formulation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/33Querying
    • G06F16/3331Query processing
    • G06F16/334Query execution
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/22Matching criteria, e.g. proximity measures

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • General Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • Computational Linguistics (AREA)
  • Databases & Information Systems (AREA)
  • Artificial Intelligence (AREA)
  • Health & Medical Sciences (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Evolutionary Biology (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • General Health & Medical Sciences (AREA)
  • Mathematical Physics (AREA)
  • Evolutionary Computation (AREA)
  • Software Systems (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本发明公开一种电价政策条款解析方法,通过构建一个解析模板,利用多种有针对性的智能识别手段,从电价政策条款内容中解析并提取出包括执行对象、实施地区、标准执行条件、特殊执行条件、执行价格、政策名称的关键元素项,并且将关键元素项的相关内容按照预定的模板生成结构化数据。本发明的解析方法能够自动、准确、高效、全面的解读电价政策条款核心内容并且以设定数据格式呈现。

Description

电价政策条款解析方法、存储介质及计算机
技术领域
本发明涉及电子信息技术领域,尤其涉及一种电价政策条款解析方法、存储介质及计算机。
背景技术
电价政策信息是服从和服务于电力改革发展的经济政策,作为重要的经济杠杆和调节手段,它在电力改革发展中具有不可替代的作用。电价形成政策及演变就像一张“坐标图”,横向与国家宏观政策对应,纵向与所处年代对应。
近70年的历史演变,电价政策体系已十分庞大,加上电价政策具有专业性强、涉及行业众多、政策之间渊源深厚的特点,很难在短时间内理出历史调价脉络。此外政策的高速迭代和工作的频繁交接,不同人对政策的理解存在偏差,因此很难形成统一的理解,很难形成知识沉淀,这就给电价执行、结算、监督检查带来一系列风险隐患。为了最大限度的发挥电价政策文档对电价管理的指导作用,需要对政策文档的每一项调价条款进行统一语义解析。
发明内容
本发明提供了一种电价政策条款解析方法,能够自动、准确、高效、全面的解读电价政策条款核心内容并且以设定数据格式呈现。本发明通过以下技术方案实现:
一种电价政策条款解析方法,其特征在于,包括:
(1)构建一个解析模板,存储并供调用;所述解析模板包括电价政策条款需要解析出来的关键元素项,关键元素项包括:执行对象、实施地区、标准执行条件、特殊执行条件、执行价格、政策名称;
(2)接收电价政策条款文档,并以电子化的信息存储并供调用;
(3)通过正则表达式及需剔除的固定文本,剔除所述电价政策条款文档中除所述关键元素项以外的信息;
(4)顺序或者同时执行步骤(4-1)、(4-2)、(4-3)、(4-4):
(4-1)从所述条款文档中解析并提取与执行价格相关的信息,作为提取的执行价格信息;
(4-2)从所述条款文档中解析出与实施地区相关的信息;
(4-3)从所述条款文档中解析出与特殊执行条件相关的信息,作为提取的特殊执行条件信息;
(4-4)从所述条款文档中解析出与执行对象及政策名称相关的信息;
(5)利用提取的执行价格信息对与执行对象及政策名称相关的信息进行消歧,剔除不合理结果,保留的信息作为提取的政策名称信息及执行对象信息;
(6)根据提取的政策名称信息从依据专家整理的电价政策体系中关联出相应的标准执行条件信息;
(7)根据所提取的政策名称信息对所述与实施地区相关的信息进行修正,修正后的信息作为提取的实施地区信息;
(8)将所述提取的执行价格信息、实施地区信息、标准执行条件、特殊执行条件、执行对象信息及政策名称信息,按照所述解析模板生成结构化数据。
作为具体的技术方案,步骤(4-1)具体为:先根据正则表达式确定执行价格所属模式,再通过执行该执行价格所属模式下设定的解析结果表达式,提取出所述执行价格信息;每次只提取一种执行价格所属模式的执行价格信息,条款文档剔除匹配内容后,查看是否还能符合其他模式,直至无可匹配结果。
作为具体的技术方案,步骤(4-2)具体为:预先整理国家县级以上所有行政地区,汇总成行政地区库;按条款内容、条款所在段落整段内容、条款所在政策文档的通知对象内容、条款所在政策文档整篇内容的优先级顺序与行政地区库进行地区词匹配,若在某一步匹配成功,则将匹配结果作为最终实施地区;若匹配失败,则进入下一步匹配;若所有内容匹配完仍无结果,则解析失败。
作为具体的技术方案,所述特殊执行条件是指提取日期类和管理对象名称类的特殊执行条件;所述步骤(4-3)具体包括:首先,预先总结可能出现的日期类特殊执行属性及对应关键词,用所述条款文档与各关键词进行匹配,若匹配成功,则表示所述条款文档中出现对应执行属性;之后,根据正则表达式确定所述条款文档中日期所属模式,通过执行该模式下设定的解析结果表达式,得出日期提取结果;最后,将特殊执行属性与日期提取结果进行拼接,得出日期类和管理对象名称类的特殊执行条件;其中,若所述条款文档中出现多个特殊执行属性及日期,则根据特殊执行属性与日期在条款中出现的位置尽可能近为准则进行配对。
作为具体的技术方案,步骤(4-4)具体为:对所述条款文档先进行搜索识别政策名称,若无识别结果,则与专家根据历史解析经验总结的政策-关键词库匹配,识别政策名称。
作为具体的技术方案,所述搜索识别政策名称具体包括:
借助lucene全文检索引擎工具包,首先为已知的管理对象名称建立倒排索引;然后输入条款内容,返回与其BM25相似度大于设定阈值的管理对象名称;
将所述管理对象名称根据以下规则进一步剔除:(1)只保留相似度最高的前5条结果;(2)剔除掉与条款内容重合词为0个的返回结果;(3)若两条返回结果与条款内容匹配词相同,则剔除掉相似度更低的那条结果;(4)若几条结果与条款内容的匹配词有包含关系,则只保留匹配词个数最多的那一条结果;
最后,剔除剩余结果需用匹配词与条款内容反算相似度,相似度大于设定阈值的保留,其余剔除。得出唯一的一个管理对象名称后,用该管理对象的所有属性值与条款内容进行关键词匹配,得出识别政策。
作为具体的技术方案,所述与专家根据历史解析经验总结的政策-关键词库匹配,识别政策名称,具体包括:预先归纳每个政策名称相应的关键词,通过条款内容与各个政策关键词进行模糊匹配,得出识别政策。
作为具体的技术方案,步骤(5)具体包括:首先,借助专家梳理的政策体系对政策名称提取结果进行加价政策和非加价政策划分;然后,每个类别分别根据每个政策设定的优先级从高至低排序,只保留优先级最高的政策名称;最后,将两个类别的消歧结果合并;借助专家梳理的政策体系中各政策价格上下限与价格提取结果进行比对,剔除掉价格提取结果不在政策价格上下限范围的政策名称。
本发明还提供一种存储介质,存储支持处理器执行上述解析方法的程序指令。
本发明还提供一种计算机,包括存储器以及处理器,存储器存储支持处理器执行上述解析方法的程序指令,所述处理器被配置为用于执行所述存储器中存储的所述程序指令。
本发明的有益效果在于:通过多种有针对性的智能识别手段,从电价政策条款内容中解析并提取出关键元素项的相关内容,并且将关键元素项的相关内容按照预定的模板生成结构化数据,本发明的解析方法能够快速准确地展示电价政策条款的核心内容。
附图说明
图1是本发明实施例提供的电价政策条款解析方法的流程框图。
图2是本发明实施例中为进行解析的电价政策条款文档的示例图。
图3是本发明实施例中将电价政策条款文档解析为模板结构化数据的示例图。
具体实施方式
下面将结合附图对本发明方法作进一步的详细说明。
本实施例提供的电价政策条款解析模块包括:解析模板构建单元、电价政策信息接收单元、数据清洗单元、执行价格解析单元、实施地区解析单元、执行条件解析单元、政策名称解析单元、政策消歧执行单元、结果修正单元、解析结果生成单元。
上述单元分别执行解析模板构建、电价政策信息接收、数据清洗、执行价格解析、实施地区提取、执行条件提取、政策名称提取、政策消歧、结果修正、生成解析结果的功能。其中,电价政策信息进行数据清洗去除噪声内容后,通过正则表达式及与专业词库关键词匹配提取出执行价格、实施地区及执行条件,通过文本挖掘技术得出实施对象及政策名称;之后利用价格信息对政策名称和实施对象进行消歧;最后利用政策名称和实施对象的消歧结果修正实施地区与执行条件。详细内容可见条款解析技术路线图。
如图1所示,本实施例提供的相应的电价政策条款解析方法,包括以下主要步骤:
(1)构建一个解析模板,存储并供调用;所述解析模板包括电价政策条款需要解析出来的关键元素项,关键元素项包括:执行对象、实施地区、标准执行条件、特殊执行条件、执行价格、政策名称;
(2)接收电价政策条款文档,并以电子化的信息存储并供调用,参见图2;
(3)通过正则表达式及需剔除的固定文本,剔除所述电价政策条款文档中除所述关键元素项以外的信息;
(4)顺序或者同时执行步骤(4-1)、(4-2)、(4-3)、(4-4):
(4-1)从所述条款文档中解析并提取与执行价格相关的信息,作为提取的执行价格信息;
(4-2)从所述条款文档中解析出与实施地区相关的信息;
(4-3)从所述条款文档中解析出与特殊执行条件相关的信息,作为提取的特殊执行条件信息;
(4-4)从所述条款文档中解析出与执行对象及政策名称相关的信息;
(5)利用提取的执行价格信息对与执行对象及政策名称相关的信息进行消歧,剔除不合理结果,保留的信息作为提取的政策名称信息及执行对象信息;
(6)根据提取的政策名称信息从依据专家整理的电价政策体系中关联出相应的标准执行条件信息;
(7)根据所提取的政策名称信息对所述与实施地区相关的信息进行修正,修正后的信息作为提取的实施地区信息;
(8)将所述提取的执行价格信息、实施地区信息、标准执行条件、特殊执行条件、执行对象信息及政策名称信息,按照所述解析模板生成结构化数据,参见图3。
具体说明如下:
解析模板构建单元用于构建一个要实现的解析模板,存储并供调用。具体地,本实施例根据历史经验及使用需求,预先确定一个要实现的解析模板,该解析模板规定了电价政策条款需要解析出来的关键元素项,包括:执行对象(指电价条款的作用管理对象)、实施地区(指电价条款的作用地区范围)、执行条件(指电价条款的作用限定条件)、执行价格(指电价条款中的调价价格)、政策名称(指电价条款的政策分类)。
电价政策信息接收单元,接收电价政策条款文档,并以电子化的信息存储并供调用。
数据清洗单元,用于通过专家库总结的正则表达式及需剔除的固定文本,剔除所述条款文档中除关键元素项以外的信息。数据清洗的主要目的有两个:1. 条款中的部分描述中出现地区、政策名称、日期等,但不是解析条款的核心内容,对于解析结果会产生干扰,需要提前剔除。例如由于条款中通常会引用其他政策文件,因此会出现如“根据xx规定”、"符合xx要求"等描述,上述无效内容中的地区、政策名称并不是条款本身的地区与政策名称,会造成干扰,因此需剔除上述模式的内容;2.在后续政策名称提取时,需要条款内容尽可能只保留与管理对象名称有关的关键信息,因此对于条款中出现的如"经研究"、"详见附件"等无用内容提前剔除。
执行价格解析单元,用于从所述条款文档中解析并提取与执行价格相关的信息,包括数额及单位。具体地,对条款进行价格解析时,先根据正则表达式确定所属模式,例如"每千瓦时0.2元"符合模式"每千瓦时xx元",通过执行该模式下设定的解析结果表达式,得出价格提取结果"0.2"及单位"元/千瓦时"。每次只提取一种模式的价格,条款文档剔除匹配内容后,查看是否还能符合其他模式,直至无可匹配结果。
实施地区解析单元,用于从所述条款文档中解析并提取与实施地区相关的信息,实施地区包括国家县级以上所有行政地区。具体地,为解析条款中的实施地区,预先整理国家县级以上所有行政地区,汇总成行政地区库。按条款内容、条款所在段落整段内容、条款所在政策文档的通知对象内容、条款所在政策文档整篇内容的优先级顺序与行政地区库进行地区词匹配,若在某一步匹配成功,则将匹配结果作为最终实施地区;若匹配失败,则进入下一步匹配。若所有内容匹配完仍无结果,则解析失败。
执行条件解析单元,用于从所述条款文档中解析并提取与执行条件相关的信息。具体地,执行条件区分为特殊执行条件与标准执行条件。标准执行条件是专家根据历史解析经验汇总的各个政策必备的属性,如"统调燃煤上网电价"的标准执行条件为"对象状态=商运 同时 调度方式=统调 同时 发电类型包含 (燃煤,热电联产)"。特殊执行条件则为标准执行条件之外在条款中出现的政策实施前提。依据专家整理的电价政策体系,已知政策名称则即可关联出相应的标准执行条件。而对于特殊执行条件,目前我们只提取日期类和管理对象名称类特殊执行条件。对于日期类特殊执行条件,如"并网时间>=2017-01-01"或"投运时间=2018",可以分三步进行提取。首先,确定条款中是否出现日期类特殊执行条件。为此,业务专家总结了可能出现的日期类特殊执行属性及对应关键词,如特殊执行属性"投运时间"的相应关键词为"投运、投运日期、投产、投产时间、投产日期" 。用条款内容与各关键词进行匹配,若匹配成功,则表示条款中出现对应执行属性。之后,根据正则表达式确定条款中日期所属模式,例如"2017年之后"符合模式"x年之后",通过执行该模式下设定的解析结果表达式,得出日期提取结果">=2017-01-01"。最后,将特殊执行属性与日期进行拼接,得出如"并网时间>=2017-01-01"的日期类特殊执行条件。若条款中出现多个特殊执行属性及日期,则根据特殊执行属性与日期在条款中出现的位置尽可能近为准则进行配对。
政策名称解析单元,用于从所述条款文档中解析并提取与执行条件相关的信息。具体地,政策名称提取是整个条款解析最核心的部分,可以分为两部分:1.搜索识别政策名称;2.关键词匹配识别政策名称。条款内容先进行搜索识别政策名称,若无识别结果,则与专家根据历史解析经验总结的政策-关键词库匹配,识别政策名称。详细的搜索识别政策名称和关键词匹配识别政策名称如下:
1.搜索识别政策名称借助lucene全文检索引擎工具包,首先为已知的管理对象名称(如:"莱芜电厂六号机组"、"刘宝东分布式光伏项目")建立倒排索引。然后输入条款内容,返回与其BM25相似度大于设定阈值的管理对象名称。为得出唯一的管理对象名称,上述结果需根据以下规则进一步剔除:(1)只保留相似度最高的前5条结果;(2)剔除掉与条款内容重合词为0个的返回结果;(3)若两条返回结果与条款内容匹配词相同,则剔除掉相似度更低的那条结果;(4)若几条结果与条款内容的匹配词有包含关系,如两条结果与条款内容的匹配词分别为"电厂、1、菏泽"和"电厂、菏泽",则只保留匹配词个数最多的那一条结果。最后,剔除剩余结果需用匹配词与条款内容反算相似度,相似度大于设定阈值的保留,其余剔除。得出唯一的一个管理对象名称后,用该管理对象的所有属性值与条款内容进行关键词匹配,得出识别政策。
2.为进行关键词匹配识别政策名称,业务专家梳理政策体系时,归纳了每个政策名称相应的关键词,如"统调燃煤上网电价"的关键词为"燃煤+统调"或"热电联产+统调"或"公用+机组"。通过条款内容与各个政策关键词进行模糊匹配,得出识别政策。
政策消歧执行单元,用于剔除掉政策名称提取中的不合理结果。首先,借助专家梳理的政策体系对政策名称提取结果进行加价政策和非加价政策划分。然后,每个类别分别根据每个政策设定的优先级从高至低排序,只保留优先级最高的政策名称,最后将两个类别的消歧结果合并。借助专家梳理的政策体系中各政策价格上下限与价格提取结果进行比对,剔除掉价格提取结果不在政策价格上下限范围的政策名称。
结果修正单元,用于根据政策消歧结果对地区提取结果进行修正。具体地,由于专家梳理的政策体系中每个政策会有明确的行政地区,因此可以根据政策消歧结果对地区提取结果进行修正。若第五部分"搜索识别政策名称"得出有效管理对象名称,则将该条件补充至特殊执行条件结果中。
解析结果生成单元,将所述提取的执行价格信息、实施地区信息、标准执行条件、特殊执行条件、执行对象信息及政策名称信息,按照所述解析模板生成结构化数据,参见图3。此外,利用合理的价格-政策名称组合与所有提取出的实施地区、特殊执行条件生成笛卡尔积,将上述笛卡尔积结果作为最终解析结果输出。
以上实施例仅为充分公开而非限制本发明,凡基于本发明的创作主旨、无需经过创造性劳动即可等到的等效技术特征的替换,应当视为本申请揭露的范围。

Claims (10)

1.一种电价政策条款解析方法,其特征在于,包括:
(1)构建一个解析模板,存储并供调用;所述解析模板包括电价政策条款需要解析出来的关键元素项,关键元素项包括:执行对象、实施地区、标准执行条件、特殊执行条件、执行价格、政策名称;
(2)接收电价政策条款文档,并以电子化的信息存储并供调用;
(3)通过正则表达式及需剔除的固定文本,剔除所述电价政策条款文档中除所述关键元素项以外的信息;
(4)顺序或者同时执行步骤(4-1)、(4-2)、(4-3)、(4-4):
(4-1)从所述条款文档中解析并提取与执行价格相关的信息,作为提取的执行价格信息;
(4-2)从所述条款文档中解析出与实施地区相关的信息;
(4-3)从所述条款文档中解析出与特殊执行条件相关的信息,作为提取的特殊执行条件信息;
(4-4)从所述条款文档中解析出与执行对象及政策名称相关的信息;
(5)利用提取的执行价格信息对与执行对象及政策名称相关的信息进行消歧,剔除不合理结果,保留的信息作为提取的政策名称信息及执行对象信息;
(6)根据提取的政策名称信息从依据专家整理的电价政策体系中关联出相应的标准执行条件信息;
(7)根据所提取的政策名称信息对所述与实施地区相关的信息进行修正,修正后的信息作为提取的实施地区信息;
(8)将所述提取的执行价格信息、实施地区信息、标准执行条件、特殊执行条件、执行对象信息及政策名称信息,按照所述解析模板生成结构化数据。
2.根据权利要求1所述的解析方法,其特征在于,步骤(4-1)具体为:先根据正则表达式确定执行价格所属模式,再通过执行该执行价格所属模式下设定的解析结果表达式,提取出所述执行价格信息;每次只提取一种执行价格所属模式的执行价格信息,条款文档剔除匹配内容后,查看是否还能符合其他模式,直至无可匹配结果。
3.根据权利要求1所述的解析方法,其特征在于,步骤(4-2)具体为:预先整理国家县级以上所有行政地区,汇总成行政地区库;按条款内容、条款所在段落整段内容、条款所在政策文档的通知对象内容、条款所在政策文档整篇内容的优先级顺序与行政地区库进行地区词匹配,若在某一步匹配成功,则将匹配结果作为最终实施地区;若匹配失败,则进入下一步匹配;若所有内容匹配完仍无结果,则解析失败。
4.根据权利要求1所述的解析方法,其特征在于,所述特殊执行条件是指提取日期类和管理对象名称类的特殊执行条件;所述步骤(4-3)具体包括:首先,预先总结可能出现的日期类特殊执行属性及对应关键词,用所述条款文档与各关键词进行匹配,若匹配成功,则表示所述条款文档中出现对应执行属性;之后,根据正则表达式确定所述条款文档中日期所属模式,通过执行该模式下设定的解析结果表达式,得出日期提取结果;最后,将特殊执行属性与日期提取结果进行拼接,得出日期类和管理对象名称类的特殊执行条件;其中,若所述条款文档中出现多个特殊执行属性及日期,则根据特殊执行属性与日期在条款中出现的位置尽可能近为准则进行配对。
5.根据权利要求1所述的解析方法,其特征在于,步骤(4-4)具体为:对所述条款文档先进行搜索识别政策名称,若无识别结果,则与专家根据历史解析经验总结的政策-关键词库匹配,识别政策名称。
6.根据权利要求5所述的解析方法,其特征在于,所述搜索识别政策名称具体包括:
借助lucene全文检索引擎工具包,首先为已知的管理对象名称建立倒排索引;然后输入条款内容,返回与其BM25相似度大于设定阈值的管理对象名称;
将所述管理对象名称根据以下规则进一步剔除:(1)只保留相似度最高的前5条结果;(2)剔除掉与条款内容重合词为0个的返回结果;(3)若两条返回结果与条款内容匹配词相同,则剔除掉相似度更低的那条结果;(4)若几条结果与条款内容的匹配词有包含关系,则只保留匹配词个数最多的那一条结果;
最后,剔除剩余结果需用匹配词与条款内容反算相似度,相似度大于设定阈值的保留,其余剔除;得出唯一的一个管理对象名称后,用该管理对象的所有属性值与条款内容进行关键词匹配,得出识别政策。
7.根据权利要求6所述的解析方法,其特征在于,所述与专家根据历史解析经验总结的政策-关键词库匹配,识别政策名称,具体包括:预先归纳每个政策名称相应的关键词,通过条款内容与各个政策关键词进行模糊匹配,得出识别政策。
8.根据权利要求1所述的解析方法,其特征在于,步骤(5)具体包括:首先,借助专家梳理的政策体系对政策名称提取结果进行加价政策和非加价政策划分;然后,每个类别分别根据每个政策设定的优先级从高至低排序,只保留优先级最高的政策名称;最后,将两个类别的消歧结果合并;借助专家梳理的政策体系中各政策价格上下限与价格提取结果进行比对,剔除掉价格提取结果不在政策价格上下限范围的政策名称。
9.一种存储介质,其特征在于,所述存储介质存储支持处理器执行权利要求1-8任意一项所述的解析方法的程序指令。
10.一种计算机,包括存储器以及处理器,存储器存储支持处理器执行权利要求1-8任意一项所述的解析方法的程序指令,所述处理器被配置为用于执行所述存储器中存储的所述程序指令。
CN202010644374.2A 2020-07-07 2020-07-07 电价政策条款解析方法、存储介质及计算机 Pending CN112036150A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202010644374.2A CN112036150A (zh) 2020-07-07 2020-07-07 电价政策条款解析方法、存储介质及计算机

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202010644374.2A CN112036150A (zh) 2020-07-07 2020-07-07 电价政策条款解析方法、存储介质及计算机

Publications (1)

Publication Number Publication Date
CN112036150A true CN112036150A (zh) 2020-12-04

Family

ID=73579110

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202010644374.2A Pending CN112036150A (zh) 2020-07-07 2020-07-07 电价政策条款解析方法、存储介质及计算机

Country Status (1)

Country Link
CN (1) CN112036150A (zh)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112199475A (zh) * 2020-12-07 2021-01-08 远光软件股份有限公司 一种基于电价条款数据的内容解析方法
CN113609836A (zh) * 2021-09-29 2021-11-05 深圳市指南针医疗科技有限公司 医疗政策全量定义解析***及方法

Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103955463A (zh) * 2014-03-21 2014-07-30 宁波中小在线信息服务有限公司 一种政府的政策解构方法及***
US20150106378A1 (en) * 2013-10-14 2015-04-16 Barracuda Networks, Inc. Document Categorization By Rules and Clause Group Scores Associated with Type Profiles Apparatus and Method
CN108874928A (zh) * 2018-05-31 2018-11-23 平安科技(深圳)有限公司 简历数据信息解析处理方法、装置、设备及存储介质
CN109033135A (zh) * 2018-06-06 2018-12-18 北京大学 一种面向软件项目知识图谱的自然语言查询方法及***
CN109117479A (zh) * 2018-08-13 2019-01-01 数据地平线(广州)科技有限公司 一种金融文档智能核查方法、装置及存储介质
CN110096573A (zh) * 2019-04-22 2019-08-06 腾讯科技(深圳)有限公司 一种文本解析方法及相关设备
CN110609983A (zh) * 2019-08-19 2019-12-24 广州利科科技有限公司 一种政策文件结构化分解方法
CN111145052A (zh) * 2019-12-26 2020-05-12 北京法意科技有限公司 司法文书的结构化分析方法及***

Patent Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20150106378A1 (en) * 2013-10-14 2015-04-16 Barracuda Networks, Inc. Document Categorization By Rules and Clause Group Scores Associated with Type Profiles Apparatus and Method
CN103955463A (zh) * 2014-03-21 2014-07-30 宁波中小在线信息服务有限公司 一种政府的政策解构方法及***
CN108874928A (zh) * 2018-05-31 2018-11-23 平安科技(深圳)有限公司 简历数据信息解析处理方法、装置、设备及存储介质
CN109033135A (zh) * 2018-06-06 2018-12-18 北京大学 一种面向软件项目知识图谱的自然语言查询方法及***
CN109117479A (zh) * 2018-08-13 2019-01-01 数据地平线(广州)科技有限公司 一种金融文档智能核查方法、装置及存储介质
CN110096573A (zh) * 2019-04-22 2019-08-06 腾讯科技(深圳)有限公司 一种文本解析方法及相关设备
CN110609983A (zh) * 2019-08-19 2019-12-24 广州利科科技有限公司 一种政策文件结构化分解方法
CN111145052A (zh) * 2019-12-26 2020-05-12 北京法意科技有限公司 司法文书的结构化分析方法及***

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112199475A (zh) * 2020-12-07 2021-01-08 远光软件股份有限公司 一种基于电价条款数据的内容解析方法
CN113609836A (zh) * 2021-09-29 2021-11-05 深圳市指南针医疗科技有限公司 医疗政策全量定义解析***及方法
CN113609836B (zh) * 2021-09-29 2022-01-28 深圳市指南针医疗科技有限公司 医疗政策全量定义解析***及方法

Similar Documents

Publication Publication Date Title
CN110968699B (zh) 一种基于事理推荐的逻辑图谱构建及预警方法和装置
US11663254B2 (en) System and engine for seeded clustering of news events
Jayram et al. Avatar information extraction system.
CN111967761B (zh) 一种基于知识图谱的监控预警方法、装置及电子设备
CN106919689A (zh) 基于术语释义知识单元的专业领域知识图谱动态构建方法
CN104077407B (zh) 一种智能数据搜索***及方法
CN109766416A (zh) 一种新能源政策信息抽取方法及***
CN110544035A (zh) 一种内控检测方法、***和计算机可读存储介质
CN112036150A (zh) 电价政策条款解析方法、存储介质及计算机
CN109783638A (zh) 一种基于半监督学习的用户评论聚类方法
CN112084448A (zh) 相似信息处理方法以及装置
CN112328805A (zh) 基于nlp的漏洞描述信息与数据库表的实体映射方法
CN115358481A (zh) 一种企业外迁预警识别的方法、***及装置
Gao et al. Defect analysis of the same batch of substation equipment based on big data analysis algorithm
CN114154829A (zh) 企业的产业链节点确定方法、装置、终端及存储介质
Li et al. Automatic classification algorithm for multisearch data association rules in wireless networks
CN114722159B (zh) 针对数控机床制造资源的多源异构数据处理方法及***
CN115688729A (zh) 一种输变电工程造价数据集成管理***及其方法
CN113641705B (zh) 一种基于计算引擎的营销处置规则引擎方法
Hu et al. A classification model of power operation inspection defect texts based on graph convolutional network
CN115827885A (zh) 一种运维知识图谱的构建方法、装置及电子设备
Zhu Financial data analysis application via multi-strategy text processing
CN114528378A (zh) 文本分类方法、装置、电子设备及存储介质
CN112380321A (zh) 基于票据知识图谱的主次数据库分配方法及相关设备
CN114385794A (zh) 企业知识图谱的生成方法、装置、设备和存储介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination