CN110362660B - 一种基于知识图谱的电子产品质量自动检测方法 - Google Patents

一种基于知识图谱的电子产品质量自动检测方法 Download PDF

Info

Publication number
CN110362660B
CN110362660B CN201910667154.9A CN201910667154A CN110362660B CN 110362660 B CN110362660 B CN 110362660B CN 201910667154 A CN201910667154 A CN 201910667154A CN 110362660 B CN110362660 B CN 110362660B
Authority
CN
China
Prior art keywords
product
data
detection
entity
knowledge graph
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201910667154.9A
Other languages
English (en)
Other versions
CN110362660A (zh
Inventor
李勇
李容
王平
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Chongqing University of Post and Telecommunications
Original Assignee
Chongqing University of Post and Telecommunications
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Chongqing University of Post and Telecommunications filed Critical Chongqing University of Post and Telecommunications
Priority to CN201910667154.9A priority Critical patent/CN110362660B/zh
Publication of CN110362660A publication Critical patent/CN110362660A/zh
Application granted granted Critical
Publication of CN110362660B publication Critical patent/CN110362660B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/33Querying
    • G06F16/3331Query processing
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/35Clustering; Classification
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/36Creation of semantic tools, e.g. ontology or thesauri
    • G06F16/367Ontology
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/06Resources, workflows, human or project management; Enterprise or organisation planning; Enterprise or organisation modelling
    • G06Q10/063Operations research, analysis or management
    • G06Q10/0639Performance analysis of employees; Performance analysis of enterprise or organisation operations
    • G06Q10/06395Quality analysis or management
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02PCLIMATE CHANGE MITIGATION TECHNOLOGIES IN THE PRODUCTION OR PROCESSING OF GOODS
    • Y02P90/00Enabling technologies with a potential contribution to greenhouse gas [GHG] emissions mitigation
    • Y02P90/30Computing systems specially adapted for manufacturing

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Business, Economics & Management (AREA)
  • Human Resources & Organizations (AREA)
  • General Physics & Mathematics (AREA)
  • Physics & Mathematics (AREA)
  • Databases & Information Systems (AREA)
  • General Engineering & Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Educational Administration (AREA)
  • Strategic Management (AREA)
  • Computational Linguistics (AREA)
  • Entrepreneurship & Innovation (AREA)
  • Economics (AREA)
  • Development Economics (AREA)
  • Tourism & Hospitality (AREA)
  • General Business, Economics & Management (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Animal Behavior & Ethology (AREA)
  • Quality & Reliability (AREA)
  • Operations Research (AREA)
  • Marketing (AREA)
  • Game Theory and Decision Science (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明涉及一种基于知识图谱的电子产品质量自动检测方法,属于电子产品质量检测和知识图谱领域,包括:构建领域知识图谱和质量检测方法实现。通过电子产品有关的标准文献及技术规格说明书,构建产品领域知识图谱;针对电子产品质量检测过程从四方面进行检测,采用本体建模的方法来管理知识图谱的模式层,然后在模式层的基础上构建数据层,从多个异构数据来源中采用Bi‑LSTM+Attention+CRF的方法抽取实体和实体关系,数据融合一般采用相似度计算方法,数据层用事实为单位将知识存储在neo4j图数据库中,利用产品标准领域知识图谱进行产品质量检测,添加一个前端模块,用于直接查询质量检测数据。

Description

一种基于知识图谱的电子产品质量自动检测方法
技术领域
本发明属于电子产品质量检测和知识图谱领域,涉及一种基于知识图谱的电子产品质量自动检测方法。
背景技术
电子产品现已成为人们生活中不可或缺的部分,电子产品质量好坏是人们选择的首要要求,对电子产品质量检测大部分采用人工检测的方法,检测人员对产品进行抽样检验,督促人员对产品生产进行自检,互检和首检,人工检测会使开发周期延长,开发的效率降低,出现许多的弊端。除此之外,在检测过程中会产生大量的数据,但各个检测***相互独立,这样会造大量数据冗余且数据结构不一致,无法建立数据知识之间的关联,不利于质量检测***的整体管理。因此,需要设计一种能够实现数据关联的电子产品质量自动检测方法来解决这些问题。
知识图谱是以结构化的形式描述现实世界中的各个实体,关系,理论,能够利用可视化技术描述实体之间关系,从构建,分析,显示,挖掘数据之间的关联,是新一代语义网的实现,知识图谱的使用为解决数据冗余问题提供可能性方法。对于电子产品故障检测,知识图谱现应用在这上面非常少,因此本方案创新利用知识图谱方案构建产品领域图谱,实现异构数据融合,数据共享,对产品检测数据进行分析进而实现产品质量检测。
发明内容
有鉴于此,本发明的目的在于提供一种基于知识图谱的电子产品质量自动检测方法,来解决在质量检测过程中人工参与过多,检测效率低,检测人员技术水平要求高,各个检测单元之间数据关联性少的问题。为达到上述目的,本发明提供如下技术方案:
一种基于知识图谱的电子产品质量检测方法,包括以下步骤:
S1:根据相关标准为基础,构建电子产品领域知识图谱,该图谱作为质量检测的基础;
S2:监测待检测产品的名称、检测的属性及取值范围;
S3:将待检测的产品属性与领域知识图谱中的属性相匹配,确定检测目标,将相对应的属性值进行查询,根据属性值的匹配结果,确定产品质量;
S4:添加前端模块,用于直接查询质量检测数据。
进一步,步骤S1中,包括以下步骤:
针对电子产品检测过程,相关标准来源于国家标准、行业标准、企业标准及产品技术规格说明书,具体针对电子产品质量检测过程从产品技术规格书、产品外观检测标准、和产品功能检测标准、产品可靠性检测标准四方面进行检测,确定知识图谱的模式层;
采用循环神经网络Bi-LSTM+Attention+CRF的方法对数据源进行实体识别,在模式层的基础上构建数据层;
采用基于聚类的实体消歧方法,对实体识别的结果进行消歧,得到无歧义的实体信息;
得到的数据包括电子产品领域相应的实体、实体关系及属性值,选择图数据库所述数据进行存储,即,将所述数据导入到图数据库neo4j中,形成节点与节点之间的关系,完成整个产品领域知识图谱。
对于电子产品领域的属性要求各不相同,对于手机电子产品检测属性常见于:外观,功能,可靠性等方面,因此提取的实体涉及产品名称、颜色、像素、内存、操作***、处理器、内存等多方面;
确定三元组实体及其关系,对于手机电子产品特性利用Bi-LSTM+Attention+CRF方法得到“产品名-属性名-属性值”三元组。具体方法为:
(1)利用word2vec方法将知识库中的文本向量转化成字符向量;
(2)将字符向量输入到Bi-LSTM网络中,将输入字符向量,通过前向LSTM得到过去的信息,通过后向LSTM得到未来的信息,依此经过Bi-LSTM模型能够同时包含上下文信息;
(3)加入Attention机制,突出有效关键词,提高识别效率;
(4)将训练后的向量,输入到CRF,弥补Bi-LSTM训练以后每个标签序列的局限性调高识别率。
进一步,步骤S1包括以下步骤:
S11:针对电子产品质量检测过程从产品技术规格书、产品外观检测标准、产品功能检测标准、以及产品可靠性检测标准四方面进行检测,确定知识图谱的模式层;
S12:采用循环神经网络Bi-LSTM+Attention+CRF的方法对数据源进行实体识别,在模式层的基础上构建数据层;
S13:采用基于聚类的实体消歧方法,对实体识别的结果进行消歧,得到无歧义的实体信息;
S14:利用框架匹配即本体对齐的方法对不同数据库来源的数据进行融合,进而得到知识图谱的补全;
S15:经过步骤S11-S14,得到的数据包括电子产品领域相应的实体、实体关系及属性值,选择图数据库所述数据进行存储,即,将所述数据导入到图数据库neo4j中,形成节点与节点之间的关系,完成整个产品领域知识图谱。
进一步,步骤S11,具体包括以下步骤:
S111:根据现在电子产品质量检测的方式,从产品技术规格书,产品外观检测标准,和产品功能检测标准,产品可靠性检测标准四方面检测,根据产品检测对象进行体系建模,形成产品检测本体结构;
S112:明确产品检测对象的概念和分类关系,将检测对象的概念完整且客观的形成一个整体;
S113:定义每一个检测对象的知识描述体系、类别以及每个检测对象之间可能存在的关系;
S114:通过知识表示形式产品检测的本体。
进一步,步骤S12具体包括以下步骤:
S121:数据层的数据包括电子产品标准检测文献和产品生产的技术规格说明书,属于非结构化数据,将非结构化数据以以文本作为输入;
S122:利用word2vec的方法转换成对应的字符向量,利用CBOW模型,在CBOW模型中,有原始句推测得到目标词,即通过已知当前词wn,利用前后2k个词,推测当前词存在的概率P:
P(wn|SUM(wn-k,wn-k+1…,wn-1+k,wn+k)) (1)
从而利用CBOW模型计算句子S的概率,计算表达式如下:
Figure BDA0002140505270000031
T是输入文本长度,P(S)表示句子以(w1,w2,…,wT)出现的概率即各个词语的联合概率;然后对整个文本构造似然函数:
Figure BDA0002140505270000032
从而推导出对数似然函数:
Figure BDA0002140505270000033
CBOW模型训练的目的就是使目标似然函数达到最大值;
S123:当输入的字符由Word2vec得到相应的字符向量,以此输入到Bi-LSTM网络中,将输入字符向量,通过前向LSTM得到过去的信息,通过后向LSTM得到未来的信息,依此经过Bi-LSTM模型能够同时包含上下文信息;
S124:为了提高识别效率,着重关注重点实体,加入Attention机制;
S125:当字符向量通过Attention机制以后,输入到CRF,起到一个多分类器的作用弥补Bi-LSTM训练以后每个词标签序列的局限性;
对于一个输入序列Z=(z1,z2,…,zn),其中n是输入序列长度,zi表示输入向量的第i个词,则Z对应的输出序列标签为Y=(y1,y2,…,yn);对于在给定序列Z取值为z的条件下,标注序列Y上的取值为y的条件概率为p(y|z)
Figure BDA0002140505270000041
S(z)=∑yexp(∑N,kλktk(yN-1,yN,z,N)+∑N,lμl sl(yN,z,N)) (6)
N=1,2,…,n,sl(·)和tk(·)是特征函数,μl和λk分别是其对应的权值,S(z)是规范化因子;在训练阶段,用最大似然估计求最优序列标注,其对应的似然对数为:∑Nlogp(y|z),通过训练得到最高条件概率y对输入序列进行标注:
Figure BDA0002140505270000042
进一步,步骤S13具体包括:
采用基于聚类的实体消歧方法,给定待消歧的实体指称集合O=O1,O2,…,On,对每一个实体指称O抽取其特征,将其表示为特征向量,计算实体之间的相似度,采用聚类的算法对实体指称项聚类,使得聚类结果中的每一个类别都对应到具体的目标实体上,计算相似度采用余弦相似度计算方法,计算公式如下:
Figure BDA0002140505270000043
上式表示两个n维向量A,B之间相似度大小,值越靠近1表明越相似。
进一步,步骤S2包括以下步骤:
S21:对于电子产品领域检测的内容不同,以手机电子产品为例,确定检测的产品类型
S22:确定产品的属性包括:外观,功能,可靠性等方面,确定属性的类型有产品名称、颜色、像素、内存、操作***、处理器、内存等多方面;
S23:根据每种属性,确定属性值。
进一步,步骤S3包括以下步骤:
S31:根据实际生产过程中电子产品检测得出的实际指标,作为数据库里的一种非结构化数据类型,传入到产品标准知识图谱中,转换为图数据库类型存入Neo4j图数据库中;
S32:将数据存入图谱中,利用图谱进行检索查询,通过检索比较标准数据和检测数据是否一致,得出检测结果是否符合标准,从而完成产品质量检测。
进一步,步骤S4具体包括:添加一个前端模块,给用户一个基本的展示页面,提供一个基础的拿数据接口加载测绘图数据和绘图的需要的数据,然后直接从数据接口请求数据,调用绘图JS在页面完成绘图,直观看到查询的项目有关联系和属性值,存在neo4j图数据库中的数据,节点和边都被赋予了相应的键值对属性,当前端页面发出http请求时,将相关条件参数传递到图数据库中作为查询主题,利用JavaScript从neo4j数据库读取相应数据,通过后台对JavaScript数据进行处理,然后给查询主题对应节点数据打上标签传至web浏览器,这样有效的对产品检测对象进行精确查询和展示,直观发现产品质量是否有误完成产品质量检测任务。
本发明的有益效果在于:本发明利用电子产品标准文献和技术规格说明书作为知识图谱的标准来源,采用模式层本体构建的方法,限定和明确产品检测的范围和内容,然后利用Bi-LSTM+Attention+CRF的方法抽取出标准文献和说明书里的实体与实体关系,利用相似度判定的方法解决数据融合的问题,将抽取的实体及关系存入到图数据库neo4j中,最后形成领域知识图谱,利用电子产品标准领域知识图谱进行产品质量检测。
当在生产过程中对每一个产品检测模块进行检测时,直接将检测的指标输入到知识库中,推理机将知识库中的规则和知识图谱中的模块对应的数据进行比较,比较该检测模块所对应的属性及属性值,如果实测数据在图谱标准范围之内,则质量达标,否则不符合标准。利用该方法,可以节省大量人力资源,并且能够将质量检测的四个方面同时关联,提高检测效率,最后利用JavaScript技术,设置一个前端,当前端页面发出http请求时,将相关条件参数传递到图数据库中作为查询主题,利用JavaScript从neo4j数据库读取相应数据,通过后台对JavaScript数据进行处理,然后给查询主题对应节点数据打上标签传至web浏览器,这样有效的对产品检测对象进行精确查询和展示,直观发现产品质量是否有误完成产品质量检测任务。利用知识图谱强大的数据处理能力,能够将整个检测***联系起来,让企业进行更好的数据管理。
本发明的其他优点、目标和特征在某种程度上将在随后的说明书中进行阐述,并且在某种程度上,基于对下文的考察研究对本领域技术人员而言将是显而易见的,或者可以从本发明的实践中得到教导。本发明的目标和其他优点可以通过下面的说明书来实现和获得。
附图说明
为了使本发明的目的、技术方案和优点更加清楚,下面将结合附图对本发明作优选的详细描述,其中:
图1为本发明构建的知识图谱的逻辑结构示意图;
图2为本发明所述电子产品检测本体构建流程图;
图3为本发明命名实体识别的方法流程图;
图4为知识图谱构建流程示意图;
图5为利用已构建的产品标准知识图谱,对产品质量进行检测的方法流程图。
具体实施方式
以下通过特定的具体实例说明本发明的实施方式,本领域技术人员可由本说明书所揭露的内容轻易地了解本发明的其他优点与功效。本发明还可以通过另外不同的具体实施方式加以实施或应用,本说明书中的各项细节也可以基于不同观点与应用,在没有背离本发明的精神下进行各种修饰或改变。需要说明的是,以下实施例中所提供的图示仅以示意方式说明本发明的基本构想,在不冲突的情况下,以下实施例及实施例中的特征可以相互组合。
其中,附图仅用于示例性说明,表示的仅是示意图,而非实物图,不能理解为对本发明的限制;为了更好地说明本发明的实施例,附图某些部件会有省略、放大或缩小,并不代表实际产品的尺寸;对本领域技术人员来说,附图中某些公知结构及其说明可能省略是可以理解的。
本发明实施例的附图中相同或相似的标号对应相同或相似的部件;在本发明的描述中,需要理解的是,若有术语“上”、“下”、“左”、“右”、“前”、“后”等指示的方位或位置关系为基于附图所示的方位或位置关系,仅是为了便于描述本发明和简化描述,而不是指示或暗示所指的装置或元件必须具有特定的方位、以特定的方位构造和操作,因此附图中描述位置关系的用语仅用于示例性说明,不能理解为对本发明的限制,对于本领域的普通技术人员而言,可以根据具体情况理解上述术语的具体含义。
本发明目的在于设计一种基于知识图谱的电子产品质量检测方法,来解决在质量检测过程中人工参与过多,检测效率低,检测人员技术水平要求高,各个检测单元之间数据关联性少的问题。本发明的技术方案如下:
首先,基于电子产品有关的标准文献及技术规格说明书,构建产品领域知识图谱。针对电子产品质量检测过程从四方面进行检测,确定知识图谱的模式层,图谱的模式层确定了电子产品检测的上层概念的规范性。采用本体建模的方法来管理知识图谱的模式层,从而借助本体库对于公理,规则,约束条件的支持能力来规范抽取的实体,实体关系,实体类型以及属性等众多对象之间的联系。然后在模式层的基础上构建数据层,从多个异构数据来源中采用Bi-LSTM+Attention+CRF的方法抽取实体和实体关系,数据融合一般采用相似度计算方法,利用该实体相似度和属性相似度确定是否是描述的同一个实体,从而进行数据融合。数据层用事实为单位将知识存储在neo4j图数据库中,将抽取的知识形成以“实体-关系-实体”或“实体-属性-属性值”类型的三元组,根据模式层构造的数据层,可以使知识库冗余的知识减少,图谱的结构更加清晰。最后将所有数据连接将形成一个庞大的实体关系网络,即产品领域知识图谱。
利用产品标准领域知识图谱进行产品质量检测,首先根据实际生产过程中电子产品检测得出的实际指标,作为数据库里的一种非结构化数据类型,传入到产品标准知识图谱中,转换为图数据库类型存入Neo4j,Neo4j是一种新型图数据库,能够实现传统关系型数据库支持的存储,分析处理数据的功能以外,还以图论为基础处理海量数据。将数据存入图谱中,利用图谱进行查询和推理,推理机将知识库中的规则和知识图谱中的事实进行比较,通过比较标准数据和检测数据是否一致,得出检测结果是否符合标准,从而完成产品质量检测。
添加一个前端模块,给用户一个基本的展示页面,提供一个基础的拿数据接口加载测绘图数据和绘图的需要的数据,然后直接从数据接口请求数据,调用绘图JS在页面完成绘图,可直观看到查询的项目有关联系和属性值,这样就可以更加直观的看到检测质量是否符合标准,这也有利于非专业人员直接查询数据。
构建电子产品领域知识图谱在构造逻辑上分为模式层和数据层,模式层指导数据层数据的类型和之间的联系。知识图谱的逻辑结构示意图如图1所示。
在模式层主要设计产品质量检测的内容对象,根据现在电子产品质量检测的方式,主要从产品技术规格书,产品外观检测标准,和产品功能检测标准,产品可靠性检测标准四方面检测,根据产品检测对象进行体系建模,形成产品检测本体结构,能够明确产品检测对象的概念和分类关系,并且将检测对象的概念完整且客观的形成一个整体,然后定义每一个检测对象的知识描述体系,类别,及其之间可能存在的关系,最后通过知识表示形式产品检测的本体。具体流程如图2所示。
模式层构建完成之后,在此基础上构建数据层。数据层的数据主要依靠电子产品标准检测文献如:“YD/T 1539-2006移动通信手持机可靠性技术要求和测试方法”,“YS/T711-2009手机及数码产品外壳用铝及铝合金板、带材”,“GB/T 9298-1998色漆和清漆漆膜的划格实验”,“GB/T 5170.1-2016电工电子产品环境试验设备检验方法第1部分:总则”等众多标准文献,和产品生产的技术规格说明书,这些数据大部分属于非结构化数据。对数据源进行相应处理,首先需要对于数据源进行相应的实体识别。实体识别采用循环神经网络
Bi-LSTM+Attention+CRF的方法,整体训练流程如图3所示。非结构化数据主要以文本作为输入,为了让计算机能够识别,将其用word2vec的方法转发为对应的字符向量,利用CBOW模型,在CBOW模型中,有原始句推测得到目标词,即通过已知当前词wn,利用前后2k个词,推测当前词存在的概率P:
P(wn|SUM(wn-k,wn-k+1…,wn-1+k,wn+k)) (1)
从而利用CBOW模型计算句子S的概率,计算表达式如下:
Figure BDA0002140505270000081
T是输入文本长度,P(S)表示句子以(w1,w2,…,wT)出现的概率即各个词语的联合概率。然后对整个文本构造似然函数:
Figure BDA0002140505270000082
从而推导出对数似然函数:
Figure BDA0002140505270000083
/>
CBOW模型训练的目的就是使目标似然函数达到最大值。
当输入的字符由Word2vec得到相应的字符向量,以此输入到Bi-LSTM网络中。将输入字符向量,通过前向LSTM得到过去的信息,通过后向LSTM得到未来的信息,依此经过Bi-LSTM模型能够同时包含上下文信息。为了提高识别效率,着重关注重点实体,加入Attention机制;
当字符向量通过Attention机制以后,输入到CRF,加入CRF层的目的是标注句子中的字词,能够从句子水平上对整个文本序列进行标注,它能起到一个多分类器的作用弥补Bi-LSTM训练以后每个词标签序列的局限性。CRF从句子级别研究序列特征,不仅可以得到每一个最优的实体标签序列还能够在训练过程中自动学习后面标签的限制规则。对于一个输入序列Z=(z1,z2,…,zn),其中n是输入序列长度,zi表示输入向量的第i个词,则Z对应的输出序列标签为Y=(y1,y2,…,yn)。对于在给定序列Z取值为z的条件下,标注序列Y上的取值为y的条件概率为p(y|z)
Figure BDA0002140505270000084
S(z)=∑yexp(∑N,kλktk(yN-1,yN,z,N)+∑N,lμlsl(yN,z,N)) (6)
N=1,2,…,n,sl(·)和tk(·)是特征函数,μl和λk分别是其对应的权值,S(z)是规范化因子。在训练阶段,用最大似然估计求最优序列标注,其对应的似然对数为:∑Nlogp(y|z),通过训练得到最高条件概率y对输入序列进行标注:
Figure BDA0002140505270000085
经过此流程能够完成对命名实体的识别,在整个训练过程中也完成了关系抽取,属性抽取。属性抽取是从文本中抽取出该实体的属性信息,可以把实体的属性看作是实体和属性间的一种名词性关系,因此将属性抽取的问题看作是关系抽取的一种。关系抽取和命名实体识别一样都属于信息抽取的一部分,从本质来看属于一个多分类的问题,利用Bi-LSTM从词嵌入层提取到高级特征,然后Attention机制生成一个权重向量,通过Bi-LSTM的输出值与权重向量相乘,使得每一次迭代中词汇级特征合并成句子级的特征,最后将句子级的特征向量用于关系分类。利用该方法可以避免传统方法中依赖于一些已有的词汇资源,***或手工提取的特征,降低了计算复杂度。
现已得到了相关实体,但实体具有歧义向,因此识别的结果是很难直接放到图库中,必须对实体识别的结果进行消歧,得到无歧义的实体信息。采用基于聚类的实体消歧方法,给定待消歧的实体指称集合O=O1,O2,…,On,对每一个实体指称O抽取其特征,将其表示为特征向量,计算实体之间的相似度,采用聚类的算法能对实体指称项聚类,使得聚类结果中的每一个类别都对应到具体的目标实体上。计算相似度采用余弦相似度计算方法,计算公式如下:
Figure BDA0002140505270000091
上式表示两个n维向量A,B之间相似度大小,值越靠近1表明越相似。
知识融合:针对不同数据库来源的数据进行处理,在构建标准的电子产品知识图谱时,数据来源主要是领域标准和产品说明书,但在对产品进行质量检测时,将会对生产的具体类型电子产品和要求的数据进行融合,因为产品检测时的目标比较明确,针对四个方面,产品技术规格书,产品外观检测,产品功能性检测和产品可靠性检测,所以利用框架匹配即本体对齐的方法进行融合进而得到知识图谱的补全。
经过上述技术,得到电子产品领域相应的实体,实体关系,属性值,在本领域中,检测时是根据实体的属性值进行判定,所以选择图数据库进行数据存储,基于图结构的存储方式能够直接准确的反映知识图谱内部结构,有利于知识的查询推理,因此将数据导入到图数据库neo4j中,形成节点与节点之间的关系,完成整个产品领域知识图谱,具体流程如图4所示。
按照上述步骤构建的知识图谱是电子产品检测标准的图谱,在生产中对产品检测时的项目和指标进行检测,将通过图谱进行检索查询,实现基于知识图谱的产品质量检测,流程图如图5所示。
在知识图谱中,已经构建了产品检测标准的各个方面类型,指标,属性值即正常测试值的范围或其他属性,在实际产品检测过程中,主要就是从四个方面检测产品是否达到标准,因此将实际获取的数据存入到知识库中,然后利用图搜索方式将知识库中的数据和图谱中的数据进行事实匹配,若和图谱中的属性值相符则表示正常,否则就不达标,该检测方法能够同时对检测的四方面数据进行查询,从而能够提高检测的效率和时效性,实现产品质量检测,当各方面检测完成时,若出现不符合标准的部分,可以利用图谱将数据整合在一起进行推理,有利于发现是故障出现单位,为检测人员减少排查时间。
但存在图数据库中知识图谱的内容不利于非专业人员直接查询,因此添加了一个前端模块,给用户一个基本的展示页面,提供一个基础的拿数据接口加载测绘图数据和绘图的需要的数据,然后直接从数据接口请求数据,调用绘图JS在页面完成绘图,可直观看到查询的项目有关联系和属性值,这样就可以更加直观的看到检测质量是否符合标准。
存在neo4j图数据库中的数据,节点和边都被赋予了相应的键值对属性,当前端页面发出http请求时,将相关条件参数传递到图数据库中作为查询主题,利用JavaScript从neo4j数据库读取相应数据,通过后台对JavaScript数据进行处理,然后给查询主题对应节点数据打上标签传至web浏览器,这样有效的对产品检测对象进行精确查询和展示,直观发现产品质量是否有误完成产品质量检测任务。
本方案可以应用在电子产品领域中,思路和方法是通用的,针对某一个具体电子产品,可以先构建本领域的标准知识图谱,然后在实际生产过程中,对检测产生的数据进行推理查询,可以检测出质量是否符合相关要求。比如在手机质量检测,以生产产家的要求说明,和现有的行业和国家标准作为标准数据源,根据模式层的规范,提取现有数据,把相对应要求的实体,属性值,关系利用神经网络的方法提出来,存入数据库中。在实际生产检测过程中,根据每一项具体检测指标数据,通过前端输入,通过图谱进行检索查询,确定检测指标是否合格,从而完成质量检测。
最后说明的是,以上实施例仅用以说明本发明的技术方案而非限制,尽管参照较佳实施例对本发明进行了详细说明,本领域的普通技术人员应当理解,可以对本发明的技术方案进行修改或者等同替换,而不脱离本技术方案的宗旨和范围,其均应涵盖在本发明的权利要求范围当中。

Claims (4)

1.一种基于知识图谱的电子产品质量检测方法,其特征在于:
S1:根据相关标准为基础,构建电子产品领域知识图谱,该图谱作为质量检测的基础;
S2:监测待检测产品的名称、检测的属性及取值范围;
S3:将待检测的产品属性与领域知识图谱中的属性相匹配,确定检测目标,将相对应的属性值进行查询,根据属性值的匹配结果,确定产品质量;
S4:添加前端模块,用于直接查询质量检测数据;
步骤S1中,包括以下步骤:
针对电子产品检测过程,相关标准来源于国家标准、行业标准、企业标准及产品技术规格说明书,具体针对电子产品质量检测过程从产品技术规格书、产品外观检测标准、和产品功能检测标准、产品可靠性检测标准四方面进行检测,确定知识图谱的模式层;
采用循环神经网络Bi-LSTM+Attention+CRF的方法对数据源进行实体识别,在模式层的基础上构建数据层;
采用基于聚类的实体消歧方法,对实体识别的结果进行消歧,得到无歧义的实体信息;
得到的数据包括电子产品领域相应的实体、实体关系及属性值,选择图数据库所述数据进行存储,即,将所述数据导入到图数据库neo4j中,形成节点与节点之间的关系,完成整个产品领域知识图谱;
确定三元组实体及其关系,对于手机电子产品特性利用Bi-LSTM+Attention+CRF方法得到“产品名-属性名-属性值”三元组,具体方法为:
(1)利用word2vec方法将知识库中的文本向量转化成字符向量;
(2)将字符向量输入到Bi-LSTM网络中,将输入字符向量,通过前向LSTM得到过去的信息,通过后向LSTM得到未来的信息,依此经过Bi-LSTM模型能够同时包含上下文信息;
(3)加入Attention机制,突出有效关键词,提高识别效率;
(4)将训练后的向量,输入到CRF,弥补Bi-LSTM训练以后每个标签序列的局限性调高识别率;
步骤S1包括以下步骤:
S11:针对电子产品质量检测过程从产品技术规格书、产品外观检测标准、产品功能检测标准、以及产品可靠性检测标准四方面进行检测,确定知识图谱的模式层;
S111:根据现在电子产品质量检测的方式,从产品技术规格书,产品外观检测标准,和产品功能检测标准,产品可靠性检测标准四方面检测,根据产品检测对象进行体系建模,形成产品检测本体结构;
S112:明确产品检测对象的概念和分类关系,将检测对象的概念完整且客观的形成一个整体;
S113:定义每一个检测对象的知识描述体系、类别以及每个检测对象之间可能存在的关系;
S114:通过知识表示形式产品检测的本体;
S12:采用循环神经网络Bi-LSTM+Attention+CRF的方法对数据源进行实体识别,在模式层的基础上构建数据层;
S121:数据层的数据包括电子产品标准检测文献和产品生产的技术规格说明书,属于非结构化数据,将非结构化数据以以文本作为输入;
S122:利用word2vec的方法转换成对应的字符向量,利用CBOW模型,在CBOW模型中,有原始句推测得到目标词,即通过已知当前词wn,利用前后2k个词,推测当前词存在的概率P:
P(wn|SUM(wn-k,wn-k+1…,wn-1+k,wn+k)) (1)
从而利用CBOW模型计算句子S的概率,计算表达式如下:
Figure FDA0004198158960000021
T是输入文本长度,P(S)表示句子以(w1,w2,…,wT)出现的概率即各个词语的联合概率;然后对整个文本构造似然函数:
Figure FDA0004198158960000022
从而推导出对数似然函数:
Figure FDA0004198158960000023
CBOW模型训练的目的就是使目标似然函数达到最大值;
S123:当输入的字符由Word2vec得到相应的字符向量,以此输入到Bi-LSTM网络中,将输入字符向量,通过前向LSTM得到过去的信息,通过后向LSTM得到未来的信息,依此经过Bi-LSTM模型能够同时包含上下文信息;
S124:为了提高识别效率,着重关注重点实体,加入Attention机制;
S125:当字符向量通过Attention机制以后,输入到CRF,起到一个多分类器的作用弥补Bi-LSTM训练以后每个词标签序列的局限性;
对于一个输入序列Z=(z1,z2,…,zn),其中n是输入序列长度,zi表示输入向量的第i个词,则Z对应的输出序列标签为Y=(y1,y2,…,yn);对于在给定序列Z取值为z的条件下,标注序列Y上的取值为y的条件概率为p(y|z)
Figure FDA0004198158960000031
Figure FDA0004198158960000032
N=1,2,…,n,sl(·)和tk(·)是特征函数,μl和λk分别是其对应的权值,S(z)是规范化因子;在训练阶段,用最大似然估计求最优序列标注,其对应的似然对数为:∑Nlogp(y|z),通过训练得到最高条件概率y对输入序列进行标注:
Figure FDA0004198158960000033
S13:采用基于聚类的实体消歧方法,对实体识别的结果进行消歧,得到无歧义的实体信息;采用基于聚类的实体消歧方法,给定待消歧的实体指称集合O=O1,O2,…,On,对每一个实体指称O抽取其特征,将其表示为特征向量,计算实体之间的相似度,采用聚类的算法对实体指称项聚类,使得聚类结果中的每一个类别都对应到具体的目标实体上,计算相似度采用余弦相似度计算方法,计算公式如下:
Figure FDA0004198158960000034
上式表示两个n维向量A,B之间相似度大小,值越靠近1表明越相似;
S14:利用框架匹配即本体对齐的方法对不同数据库来源的数据进行融合,进而得到知识图谱的补全;
S15:经过步骤S11-S14,得到的数据包括电子产品领域相应的实体、实体关系及属性值,选择图数据库所述数据进行存储,即,将所述数据导入到图数据库neo4j中,形成节点与节点之间的关系,完成整个产品领域知识图谱。
2.根据权利要求1所述的基于知识图谱的电子产品质量检测方法,其特征在于:步骤S2包括以下步骤:
S21:对于电子产品领域检测的内容不同,以手机电子产品为例,确定检测的产品类型
S22:确定产品的属性包括:外观,功能,可靠性,确定属性的类型有产品名称、颜色、像素、内存、操作***、处理器、内存;
S23:根据每种属性,确定属性值。
3.根据权利要求1所述的基于知识图谱的电子产品质量检测方法,其特征在于:步骤S3包括以下步骤:
S31:根据实际生产过程中电子产品检测得出的实际指标,作为数据库里的一种非结构化数据类型,传入到产品标准知识图谱中,转换为图数据库类型存入Neo4j图数据库中;
S32:将数据存入图谱中,利用图谱进行检索查询,通过检索比较标准数据和检测数据是否一致,得出检测结果是否符合标准,从而完成产品质量检测。
4.根据权利要求1所述的基于知识图谱的电子产品质量检测方法,其特征在于:步骤S4具体包括:添加一个前端模块,给用户一个基本的展示页面,提供一个基础的拿数据接口加载测绘图数据和绘图的需要的数据,然后直接从数据接口请求数据,调用绘图JS在页面完成绘图,直观看到查询的项目有关联系和属性值,存在neo4j图数据库中的数据,节点和边都被赋予了相应的键值对属性,当前端页面发出http请求时,将相关条件参数传递到图数据库中作为查询主题,利用JavaScript从neo4j数据库读取相应数据,通过后台对JavaScript数据进行处理,然后给查询主题对应节点数据打上标签传至web浏览器,这样有效的对产品检测对象进行精确查询和展示,直观发现产品质量是否有误完成产品质量检测任务。
CN201910667154.9A 2019-07-23 2019-07-23 一种基于知识图谱的电子产品质量自动检测方法 Active CN110362660B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201910667154.9A CN110362660B (zh) 2019-07-23 2019-07-23 一种基于知识图谱的电子产品质量自动检测方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201910667154.9A CN110362660B (zh) 2019-07-23 2019-07-23 一种基于知识图谱的电子产品质量自动检测方法

Publications (2)

Publication Number Publication Date
CN110362660A CN110362660A (zh) 2019-10-22
CN110362660B true CN110362660B (zh) 2023-06-09

Family

ID=68219834

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201910667154.9A Active CN110362660B (zh) 2019-07-23 2019-07-23 一种基于知识图谱的电子产品质量自动检测方法

Country Status (1)

Country Link
CN (1) CN110362660B (zh)

Families Citing this family (22)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110888808B (zh) * 2019-11-16 2023-01-31 云南湾谷科技有限公司 一种基于知识图谱的Web智能化测试的方法
CN111160847B (zh) * 2019-12-09 2023-08-25 中国建设银行股份有限公司 一种处理流程信息的方法和装置
CN110990748B (zh) * 2019-12-18 2023-06-27 成都迪普曼林信息技术有限公司 一种国别舆情数据采集与发布***
CN111159421A (zh) * 2019-12-25 2020-05-15 中国建设银行股份有限公司 基于知识图谱的基金查询方法及装置
CN111191851B (zh) * 2020-01-03 2023-06-23 中国科学院信息工程研究所 一种基于知识图谱的数据中心能效优化方法
CN111639498A (zh) * 2020-04-21 2020-09-08 平安国际智慧城市科技股份有限公司 知识抽取方法、装置、电子设备及存储介质
CN111695771B (zh) * 2020-05-07 2024-02-27 国网安徽省电力有限公司淮南供电公司 基于物联网技术的电力物资智能检测管控***及其方法
CN111667147A (zh) * 2020-05-11 2020-09-15 北京方升互联信息技术有限公司 一种检测服务产品的专业性定义方法
CN111506722B (zh) * 2020-06-16 2024-03-08 平安科技(深圳)有限公司 基于深度学习技术的知识图谱问答方法、装置及设备
CN112084302B (zh) * 2020-08-24 2024-04-30 江苏易达捷信数字科技有限公司 造价文件的清单数据检测方法、***、装置及存储介质
CN112364173B (zh) * 2020-10-21 2022-03-18 中国电子科技网络信息安全有限公司 一种基于知识图谱的ip地址机构溯源方法
CN112381438A (zh) * 2020-11-24 2021-02-19 北京三维天地科技股份有限公司 一种基于模糊相似度算法的产品质量与标准匹配模型
CN112559806A (zh) * 2020-12-02 2021-03-26 广东电网有限责任公司广州供电局 局部放电案例库构建方法
CN112541600A (zh) * 2020-12-07 2021-03-23 上海电科智能***股份有限公司 一种基于知识图谱的辅助维修决策方法
CN112598563B (zh) * 2020-12-29 2023-11-17 中国科学技术大学 一种基于知识图谱的智慧城市数据构建方法
CN112732939B (zh) * 2021-01-15 2022-11-29 中国科学院空天信息创新研究院 基于GraphDB的时空知识图谱构建方法、装置、介质及设备
CN112801492B (zh) * 2021-01-22 2023-07-25 中国平安人寿保险股份有限公司 基于知识阶层的数据质检的方法、装置及计算机设备
CN112883197B (zh) * 2021-02-08 2023-02-07 广东电网有限责任公司广州供电局 一种用于封闭开关设备的知识图谱构建方法与***
CN113626574B (zh) * 2021-08-19 2023-08-29 成都数联云算科技有限公司 一种信息查询方法及***及装置及介质
CN114417015B (zh) * 2022-01-26 2023-05-12 西南交通大学 一种高速列车可维修性知识图谱构建方法
CN115544265A (zh) * 2022-09-13 2022-12-30 南京航空航天大学 一种基于轴承故障知识图谱的轴承故障诊断方法
CN117171367B (zh) * 2023-09-26 2024-04-12 北京泰策科技有限公司 一种对不同数据库表的指定属性值的规范检测方法

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP3407151A1 (en) * 2017-05-24 2018-11-28 Tata Consultancy Services Limited Systems and methods for cognitive control of data acquisition for efficient fault diagnosis
CN109146611A (zh) * 2018-07-16 2019-01-04 浙江大学 一种电商产品质量信用指数分析方法及***
CN109378053A (zh) * 2018-11-30 2019-02-22 安徽影联云享医疗科技有限公司 一种用于医学影像的知识图谱构建方法
CN109460010A (zh) * 2018-12-18 2019-03-12 彩虹无线(北京)新技术有限公司 基于知识图谱的车辆故障检测方法、装置及存储介质
CN109948911A (zh) * 2019-02-27 2019-06-28 北京邮电大学 一种计算网络产品信息安全风险的评估方法
CN110032647A (zh) * 2019-03-12 2019-07-19 埃睿迪信息技术(北京)有限公司 基于工业领域构建知识图谱的方法、装置及存储介质

Family Cites Families (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US11392598B2 (en) * 2016-10-19 2022-07-19 Ebay Inc. Applying a quantitative range for qualitative terms
CN108647791B (zh) * 2018-03-30 2020-12-29 中国标准化研究院 一种多源汽车安全信息的处理方法、装置及***
CN108447534A (zh) * 2018-05-18 2018-08-24 灵玖中科软件(北京)有限公司 一种基于nlp的电子病历数据质量管理方法
CN109145122A (zh) * 2018-08-02 2019-01-04 北京仿真中心 一种产品知识图谱构建和查询方法及***
CN109064318A (zh) * 2018-08-24 2018-12-21 苏宁消费金融有限公司 一种基于知识图谱的互联网金融风险监测***

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP3407151A1 (en) * 2017-05-24 2018-11-28 Tata Consultancy Services Limited Systems and methods for cognitive control of data acquisition for efficient fault diagnosis
CN109146611A (zh) * 2018-07-16 2019-01-04 浙江大学 一种电商产品质量信用指数分析方法及***
CN109378053A (zh) * 2018-11-30 2019-02-22 安徽影联云享医疗科技有限公司 一种用于医学影像的知识图谱构建方法
CN109460010A (zh) * 2018-12-18 2019-03-12 彩虹无线(北京)新技术有限公司 基于知识图谱的车辆故障检测方法、装置及存储介质
CN109948911A (zh) * 2019-02-27 2019-06-28 北京邮电大学 一种计算网络产品信息安全风险的评估方法
CN110032647A (zh) * 2019-03-12 2019-07-19 埃睿迪信息技术(北京)有限公司 基于工业领域构建知识图谱的方法、装置及存储介质

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
Yachen Tang等.Enhancement of Equipment Mangement Using Knowledge Graph.《2019 IEEE Innovative Smart Grid Technologies-ASIA》.2019,第1-6页. *
李秀芳等.基于生产设备监测数据的故障诊断仪的开发与应用.《河南中烟工业有限责任公司》.2018,第1页. *

Also Published As

Publication number Publication date
CN110362660A (zh) 2019-10-22

Similar Documents

Publication Publication Date Title
CN110362660B (zh) 一种基于知识图谱的电子产品质量自动检测方法
CN110019732B (zh) 一种智能问答方法以及相关装置
US20180232443A1 (en) Intelligent matching system with ontology-aided relation extraction
CN110309268B (zh) 一种基于概念图的跨语言信息检索方法
US11194797B2 (en) Automatic transformation of complex tables in documents into computer understandable structured format and providing schema-less query support data extraction
CN108932342A (zh) 一种语义匹配的方法、模型的学习方法及服务器
CN116795973B (zh) 基于人工智能的文本处理方法及装置、电子设备、介质
CN110222045A (zh) 一种数据报表获取方法、装置及计算机设备、存储介质
KR100980579B1 (ko) 온톨로지에 대한 자연어 질의 검색 방법 및 시스템
Chang et al. Integrating a semantic-based retrieval agent into case-based reasoning systems: A case study of an online bookstore
CN116775847A (zh) 一种基于知识图谱和大语言模型的问答方法和***
CN112270188B (zh) 一种提问式的分析路径推荐方法、***及存储介质
CN111858940B (zh) 一种基于多头注意力的法律案例相似度计算方法及***
US11308083B2 (en) Automatic transformation of complex tables in documents into computer understandable structured format and managing dependencies
US20200334250A1 (en) Automatic transformation of complex tables in documents into computer understandable structured format with mapped dependencies and providing schema-less query support for searching table data
Geng et al. Cross-domain ontology construction and alignment from online customer product reviews
CN112182145A (zh) 文本相似度确定方法、装置、设备和存储介质
Miao et al. A dynamic financial knowledge graph based on reinforcement learning and transfer learning
CN113761208A (zh) 一种基于知识图谱的科技创新资讯分类方法和存储设备
Liu et al. Open intent discovery through unsupervised semantic clustering and dependency parsing
CN113901224A (zh) 基于知识蒸馏的涉密文本识别模型训练方法、***及装置
CN115952770B (zh) 一种数据标准化的处理方法、装置、电子设备及存储介质
CN116719915A (zh) 智能问答方法、装置、设备及存储介质
Angermann et al. Taxonomy Matching Using Background Knowledge
CN116151258A (zh) 文本消岐方法、电子设备、存储介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant