CN105824847A - 一种信息整合的质量评估方法 - Google Patents

一种信息整合的质量评估方法 Download PDF

Info

Publication number
CN105824847A
CN105824847A CN201510010016.5A CN201510010016A CN105824847A CN 105824847 A CN105824847 A CN 105824847A CN 201510010016 A CN201510010016 A CN 201510010016A CN 105824847 A CN105824847 A CN 105824847A
Authority
CN
China
Prior art keywords
information
attribute
inspection
entity
consistency
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201510010016.5A
Other languages
English (en)
Other versions
CN105824847B (zh
Inventor
吴国威
周辉
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
State Grid Zhejiang Electric Power Co Ltd
Zhejiang Huayun Information Technology Co Ltd
Original Assignee
State Grid Zhejiang Electric Power Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by State Grid Zhejiang Electric Power Co Ltd filed Critical State Grid Zhejiang Electric Power Co Ltd
Priority to CN201510010016.5A priority Critical patent/CN105824847B/zh
Publication of CN105824847A publication Critical patent/CN105824847A/zh
Application granted granted Critical
Publication of CN105824847B publication Critical patent/CN105824847B/zh
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Landscapes

  • General Factory Administration (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

一种信息整合的质量评估方法,它以异构***中信息实体的关键属性和名称关键词为基准,对异构***间的信息实体进行全信息双向符合度检查,主要包括对象一致性检查和属性一致性检查两部分;所述的对象一致性检查主要检查异构***同一信息实体的是否表示同一个对象,通过信息实体名称进行双向逐字比对,计算出两边一致的字符数量,并给出信息符合度,符合度过低的说明存在疑似对象不一致。

Description

一种信息整合的质量评估方法
技术领域
本发明涉及一种可用于异构信息***间基础信息整合过程中信息质量评估方法,它依据异构信息***间基础信息关键属性信息差异来评估信息融合质量情况,主要用于信息***的数据融合。
背景技术
由于异构***之间存在数据颗粒度、信息维护规范、信息的完整存在差异,信息融合的难度非常高,融合后的信息质量好坏是异构***间信息融合成效的重要标准,但融合后的信息质量核查和评估还没有一套行之有效的方法,只能通过简单的信息比对来判别异构***间的信息实体是否一致,大部分还是在融合后信息再利用过程中发现存在的数据质量问题,这种事后再发现数据质量问题的方法,虽然对数据质量提升提供了一种途径,但是数据质量的提升周期非常漫长,也直接影响了信息融合的有效价值。
发明内容
本发明的目的在于克服现有技术存在的不足,而提供一种主要是为整合后的基础信息质量检查提供科学的评估方法,对融合后的信息进行数据质量检查,并利用检查结果开展针对性的数据治理和完善的信息整合质量评估方法。
本发明的目的是通过如下技术方案来完成的,一种信息整合的质量评估方法,该方法是:以异构***中信息实体的关键属性和名称关键词为基准,对异构***间的信息实体进行全信息双向符合度检查,主要包括对象一致性检查和属性一致性检查两部分;所述的对象一致性检查主要检查异构***同一信息实体的是否表示同一个对象,通过信息实体名称进行双向逐字比对,计算出两边一致的字符数量,并给出信息符合度,符合度过低的说明存在疑似对象不一致;
所述的属性一致性检查是从表示同一信息实体的关键属性入手,比对关键属性的信息是否一致,通过属性一致性检查可以发现异构***间的信息维护差异及信息完整性,即对象符合的信息实体可能存在关键属性不一致的情况,需要在源业务***中完善相应的相关信息,也可以间接发现同一信息实体表示的对象是否是同一个;
结合对象一致性检查和属性一致性检查两个维度的结果按权重计算出各类信息类别的信息融合质量。
本发明根据不符合字符数量累加得出不准确距离;根据字符符合度和不准确距离两个指标来衡量信息实体的对象是否一致;
所述的比对关键属性的信息是否一致,其中所述的关键属性包括电网设备台账中的电压等级、所属变电站、线路长度、容量。
本发明可以对信息融合的数据质量进行快速科学评估,在异构***信息融合过程中及时发现问题数据,及时修正问题数据,与传统事后核查的方式相比,所花费的大力人力成本和时间成本大大减少,数据质量提升更加直接,数据的可信度更高。
附图说明
图1是本发明所述对象一致性检查的示意图。
具体实施方式
下面将结合附图及具体实施例对本发明作详细的介绍:本发明所述的一种信息整合的质量评估方法,该方法是:以异构***中信息实体的关键属性和名称关键词为基准,对异构***间的信息实体进行全信息双向符合度检查,主要包括对象一致性检查和属性一致性检查两部分;所述的对象一致性检查主要检查异构***同一信息实体的是否表示同一个对象,通过信息实体名称进行双向逐字比对,计算出两边一致的字符数量,并给出信息符合度,符合度过低的说明存在疑似对象不一致;
所述的属性一致性检查是从表示同一信息实体的关键属性入手,比对关键属性的信息是否一致,通过属性一致性检查可以发现异构***间的信息维护差异及信息完整性,即对象符合的信息实体可能存在关键属性不一致的情况,需要在源业务***中完善相应的相关信息,也可以间接发现同一信息实体表示的对象是否是同一个;
结合对象一致性检查和属性一致性检查两个维度的结果按权重计算出各类信息类别的信息融合质量。
本发明所述根据不符合字符数量累加得出不准确距离;根据字符符合度和不准确距离两个指标来衡量信息实体的对象是否一致;
所述的比对关键属性的信息是否一致,包括电网设备台账中的电压等级、所属变电站、线路长度、容量。
实施例:本发明在“输变配业务电能质量监测分析与应用”中提出并应用。在输配电运行质量数据融合前期发现各业务***的基础台账差异非常大,通过简单的名称匹配自动对应方式和人工逐条对应方式效果不理想,对应错误率较高,需要投入更多的人力物力对这部分数据进行校核。通过该发明构建了电网基础台账整合数据质量监控信息化工具,实时评估各类基础台账信息的整合质量。应用本发明后,使得基础台账整合的工作周期缩短了50%左右,数据准确性也显著提高,经测算,各类基础数据的综合准确率达到了98%以上。
图1所示是本发明所述对象一致性检查的示意图,通过双向逐字比对和关键字比对得出信息符合度和信息不准确距离,再根据两个指标得出相关信息实体的关联程度;如***A:海新丝织有限公司,***B:海宁新海新纺织有限公司,两***的不准确距离如图所示,符合度为75%;而当另一状态下,***A:变为海新纺织有限公司,它与***B:海宁新海新纺织有限公司的不准确距离如图所示,两***的符合度为100%。

Claims (2)

1.一种信息整合的质量评估方法,该方法是:以异构***中信息实体的关键属性和名称关键词为基准,对异构***间的信息实体进行全信息双向符合度检查,主要包括对象一致性检查和属性一致性检查两部分;其特征在于所述的对象一致性检查主要检查异构***同一信息实体的是否表示同一个对象,通过信息实体名称进行双向逐字比对,计算出两边一致的字符数量,并给出信息符合度,符合度过低的说明存在疑似对象不一致;
所述的属性一致性检查是从表示同一信息实体的关键属性入手,比对关键属性的信息是否一致,通过属性一致性检查可以发现异构***间的信息维护差异及信息完整性,即对象符合的信息实体可能存在关键属性不一致的情况,需要在源业务***中完善相应的相关信息,也可以间接发现同一信息实体表示的对象是否是同一个;
结合对象一致性检查和属性一致性检查两个维度的结果按权重计算出各类信息类别的信息融合质量。
2.根据权利要求1所述的信息整合的质量评估方法,其特征在于所述根据不符合字符数量累加得出不准确距离;根据字符符合度和不准确距离两个指标来衡量信息实体的对象是否一致;
所述的比对关键属性的信息是否一致,包括电网设备台账中的电压等级、所属变电站、线路长度、容量。
CN201510010016.5A 2015-01-09 2015-01-09 一种信息整合的质量评估方法 Expired - Fee Related CN105824847B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201510010016.5A CN105824847B (zh) 2015-01-09 2015-01-09 一种信息整合的质量评估方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201510010016.5A CN105824847B (zh) 2015-01-09 2015-01-09 一种信息整合的质量评估方法

Publications (2)

Publication Number Publication Date
CN105824847A true CN105824847A (zh) 2016-08-03
CN105824847B CN105824847B (zh) 2019-08-16

Family

ID=56514110

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201510010016.5A Expired - Fee Related CN105824847B (zh) 2015-01-09 2015-01-09 一种信息整合的质量评估方法

Country Status (1)

Country Link
CN (1) CN105824847B (zh)

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107341603A (zh) * 2017-06-30 2017-11-10 国网山东省电力公司电力科学研究院 基于字符匹配的多源输电线路台账对应校核装置及方法
CN107402976A (zh) * 2017-07-03 2017-11-28 国网山东省电力公司经济技术研究院 一种基于多元异构模型的电网多源数据融合方法及***
CN109670692A (zh) * 2018-12-10 2019-04-23 国网湖北省电力有限公司 一种基于人工智能的电网数据融合方法与***
CN110136789A (zh) * 2019-05-14 2019-08-16 浪潮软件集团有限公司 一种基于电子病历应用的数据治理质量检测方法

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20030177412A1 (en) * 2002-03-14 2003-09-18 International Business Machines Corporation Methods, apparatus and computer programs for monitoring and management of integrated data processing systems
US20030187855A1 (en) * 2002-03-27 2003-10-02 International Business Machines Corporation Method of structuring a catalog
CN103294662A (zh) * 2012-03-01 2013-09-11 株式会社日立制作所 一致性判断装置及一致性判断方法
CN103631854A (zh) * 2013-09-27 2014-03-12 国家电网公司 基于模型对象化语义的icd与scd一致性校验方法

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20030177412A1 (en) * 2002-03-14 2003-09-18 International Business Machines Corporation Methods, apparatus and computer programs for monitoring and management of integrated data processing systems
US20030187855A1 (en) * 2002-03-27 2003-10-02 International Business Machines Corporation Method of structuring a catalog
CN103294662A (zh) * 2012-03-01 2013-09-11 株式会社日立制作所 一致性判断装置及一致性判断方法
CN103631854A (zh) * 2013-09-27 2014-03-12 国家电网公司 基于模型对象化语义的icd与scd一致性校验方法

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
于洋等: "基于本体的IEC 61968标准信息模型一致性校验", 《电力***自动化》 *

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107341603A (zh) * 2017-06-30 2017-11-10 国网山东省电力公司电力科学研究院 基于字符匹配的多源输电线路台账对应校核装置及方法
CN107341603B (zh) * 2017-06-30 2023-12-08 国网山东省电力公司电力科学研究院 基于字符匹配的多源输电线路台账对应校核装置及方法
CN107402976A (zh) * 2017-07-03 2017-11-28 国网山东省电力公司经济技术研究院 一种基于多元异构模型的电网多源数据融合方法及***
CN107402976B (zh) * 2017-07-03 2020-10-30 国网山东省电力公司经济技术研究院 一种基于多元异构模型的电网多源数据融合方法及***
CN109670692A (zh) * 2018-12-10 2019-04-23 国网湖北省电力有限公司 一种基于人工智能的电网数据融合方法与***
CN110136789A (zh) * 2019-05-14 2019-08-16 浪潮软件集团有限公司 一种基于电子病历应用的数据治理质量检测方法

Also Published As

Publication number Publication date
CN105824847B (zh) 2019-08-16

Similar Documents

Publication Publication Date Title
CA3014415C (en) Reliability evaluation method for hoist main shaft of kilometer-deep mine considering multiple failure modes
CN103247008B (zh) 一种电力统计指标数据的质量评估方法
CN105678481B (zh) 一种基于随机森林模型的管线健康状态评估方法
CN105824847A (zh) 一种信息整合的质量评估方法
CN103984623B (zh) 一种基于缺陷检测的软件安全风险评估方法
CN103337043B (zh) 电力通信设备运行状态的预警方法和***
CN106874483A (zh) 一种基于大数据技术的图形化的数据质量评测的装置及方法
CN103679384A (zh) 一种工作流协同办公的方法
CN105373472B (zh) 一种基于数据库的统计准确性的测试方法及测试***
CN107545043A (zh) 一种基于数据质量检测的数据应用方法及装置
CN104615658A (zh) 一种确定用户身份的方法
Fianko et al. Green supply chain management and environmental performance: the moderating role of firm size
Amirkhanov et al. Visual analysis of defects in glass fiber reinforced polymers for 4DCT interrupted in situ tests
PAPAIOANNOU Use of social media for assessing sustainable urban mobility indicators
CN108985471B (zh) 基于3d轻量化模型的航空器管理***
KR20160104064A (ko) 복잡한 양자 또는 다자 상대방 관계를 탐색하기 위해 이용되는 다차원 재귀적 학습 과정 및 시스템
CN111402241A (zh) 接触网数据的处理方法、装置、计算机设备和存储介质
CN105786682A (zh) 一种规避软件性能故障的实施***及方法
CN105868956A (zh) 一种数据处理方法及装置
CN112686388A (zh) 一种在联邦学习场景下的数据集划分方法及***
Zhenbo et al. Automatic generation of 3D assembly dimension chain based on feature model
CN117114412A (zh) 一种用于危险化学品生产企业的安全预控方法及装置
CN112380298A (zh) 一种油气管道缺陷修复的知识图谱构建方法及***
CN105354137B (zh) 一种基于iec61850协议的静态模型检测方法
CN105574081B (zh) 一种基于无回路有向图的数据溯源方法

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant
TR01 Transfer of patent right

Effective date of registration: 20191230

Address after: 310000 No. 8 Huanglong Road, Zhejiang, Hangzhou

Co-patentee after: ZHEJIANG HUAYUN INFORMATION TECHNOLOGY Co.,Ltd.

Patentee after: STATE GRID ZHEJIANG ELECTRIC POWER Co.

Address before: 310007 Huanglong Road, Zhejiang, Hangzhou, No. 8

Patentee before: STATE GRID ZHEJIANG ELECTRIC POWER Co.

TR01 Transfer of patent right
CF01 Termination of patent right due to non-payment of annual fee

Granted publication date: 20190816

Termination date: 20220109

CF01 Termination of patent right due to non-payment of annual fee