CN109284420B - 电子元器件替代选型***及替代选型方法 - Google Patents
电子元器件替代选型***及替代选型方法 Download PDFInfo
- Publication number
- CN109284420B CN109284420B CN201811010713.0A CN201811010713A CN109284420B CN 109284420 B CN109284420 B CN 109284420B CN 201811010713 A CN201811010713 A CN 201811010713A CN 109284420 B CN109284420 B CN 109284420B
- Authority
- CN
- China
- Prior art keywords
- similarity
- attribute
- component
- components
- attributes
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Images
Landscapes
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
本发明公开了一种电子元器件替代选型***及方法,属于电子元件替代选择方法技术领域,收集电子元器件原始数据库中电子元器件的属性信息,并对属性信息进行预处理,构建替换元件数据库;确定替换元件数据库中各替换元件的主要属性、次要属性以及距离计算属性;根据主要属性、次要属性和距离计算属性计算各替换元件间的综合相似度;根据被替换元件的属性信息,结合各替换元件间的综合相似度,确定替换元件。本发明通过建立元器件综合相似度模型寻找相似元器件,有效减少了计算复杂度,效率更高;同时结合替代元器件实际使用经历和用户的反馈信息,不断迭代更新替代方案,与现有的技术方案相比其替代结果经过实际检验,可信度更高。
Description
技术领域
本发明涉及电子元器件替代选择方法技术领域,具体涉及一种计算速度快、成本低、效率高的电子元器件替代选型***及选择方法。
背景技术
电子元器件,尤其是集成电路作为工业发展的基础和核心零部件广泛应用于电力、金融、交通、通信、计算机等公共设施以及航空、航天、电子、船舶、兵器、核工业等各种武器装备和军事设备中。
我国电子元器件行业已经形成多种所有制并存、门类较为齐全、拥有上万家企业的庞大产业。然而对于关键、核心元器件如集成电路、光电子器件、电真空器件仍大量依赖进口。
大量依赖进口元器件主要存在以下风险:停产断档与出口限制导致货源保障困难,假冒伪劣和筛选试验困难导致进口原器件存在质量风险,进口器件缺少相应的技术手册等相关资料,其性能参数、可靠性水平等往往无法预先开展检测和筛选工作,这将导致在设备使用过程中可能存在参数异常、早期失效等情况,进口元器件植入后门存在安全隐患,此外,我国进口的元器件大多为塑封工业级和商业级,应用于航空航天和武器装备等高可靠领域,其可靠性和环境适应性难以满足要求。
因此,元器件的国产化替代显得尤为重要。近年来,我国已在元器件国产化替代方面加大投入并取得了很大进展,但由于各单位在元器件国产化替代方面执行力度不一,元器件国产化替代仍然存在一些问题。缺乏顶层指导文件和对应的国家标准,元器件参数体系不完整、命名规则不统一,国内外元器件质量等级、分类体系不同,元器件参数名称、格式不统一,元器件的替代缺少实际的应用检验,同时,部分装备研制单位虽然自行制定了内部的元器件国产化替代规则,但由于设计、加工等因素,国产化替代验证只能结合实际的模块、整机统筹开展,难以全面验证元器件的性能。
目前国际上公认的几种替代类型主要包括:直接替代、基本替代、功能替代和相似替代。上述这些替代方式均需要从其性能参数、封装尺寸及外形、基本功能和可靠性与环境适应性这几个方面综合考虑。因此,现有的技术方案一般是比较元器件的固有参数指标,同时结合工程实际以及元器件应用经历判断替代是否可行。其中对于元器件性能参数的比较一般是通过计算相似度量化反映。
元器件,尤其是以集成电路为代表的各类器件,其固有的参数指标种类繁多,指标类型主要包括确定数字类型、确定符号类型和确定区间类型。因此其属性参数为混合型数据类型。确定数字类型:该类型元器件参数值可以是连续或离散的数值,如电阻30Ω,电压40V等。确定符号类型:该类型元器件参数值通常是以明确的专业术语枚举表示,如质量等级:军品级、工业级等;封装类型:引线、直插等。确定区间类型:该类型元器件参数值一般为某一数值区间,如温度范围:-65℃~175℃,-40℃~85℃等。
数值型数据其相似度的计算方法一般为欧式距离、余弦相似度或皮尔森相关系数等,而符号型数据其相似度的计算方法一般为杰卡德系数和简单匹配系数等。而对于混合型数据类型相似度的计算现有的技术方案主要是分别计算不同类型数据间的相似度,然后进行加权融合。如基于简单匹配方法。该方法是混合数据相似度计算的一种简单、高效的方式,对于同一属性参数,属性值相同数据距离标记为0,不同标记为1。D.Randall和Tony R提出的基于概率的相似度度量方法。该方法通过定义HVDM距离,计算属性值在一个类中出现的概率或条件概率来度量相似度。基于粗糙集方法,如滕书华、鲁敏等提出的基于一般二元关系的粗糙集加权不确定性度量。该方法利用粗糙集的相关理论,构造距离度量函数。Yogalaskshmi J、Chandrashekar R提出的混合数据的聚类算法,该方法对数值属性,利用欧式距离进行度量,对于符号属性则采用一种粗糙集方法的度量函数。基于信息熵方法,如Li X和YeN在混合数据相似性度量函数中引入信息熵的思想提高处理不确定信息的能力。基于概念层次树方法。该方法是层次距离的延伸,将两个相连结点之间赋予权值,以表示两个节点距离。
上述方法对混合数据的相似度计算时均将进行距离加权融合的操作,而部分方法对权值的选择有较大的主观性,其说服力和可信度较差。此外,在实际的元器件替代选型任务中,元器件种类繁多且数量庞大,若通过上述方式在全局解空间中计算搜索相似元器件,其时间成本和空间成本均较高。
发明内容
本发明的目的在于提供一种计算快、效率高、可信度高的电子元器件替代选型***及选型方法,以解决上述背景技术中存在的技术问题。
为了实现上述目的,本发明采取了如下技术方案:
一方面,本发明提供一种电子元器件替代选型***,该***包括:
数据预处理模块,用于收集电子元器件原始数据库中电子元器件的属性信息,并对所述属性信息进行预处理,构建替换元件数据库,建立元器件各参数属性倒排索引嵌套列表;
属性索引分类模块,用于确定所述替换元件数据库中各替换元件的主要属性、次要属性以及距离计算属性;
综合相似度计算模块,用于根据所述主要属性、所述次要属性和所述距离计算属性计算所述各替换元件间的综合相似度;
替换元件选择模块,用于根据被替换元件的属性信息,结合所述各替换元件间的综合相似度,确定替换元件。
另一方面,本发明提供一种电子元器件替代选型方法,该方法包括如下流程步骤:
步骤S110:收集电子元器件原始数据库中电子元器件的属性信息,并对所述属性信息进行预处理,构建替换元件数据库,建立元器件各参数属性倒排索引嵌套列表;
步骤S120:确定所述替换元件数据库中各替换元件的主要属性、次要属性以及距离计算属性;
步骤S130:根据所述主要属性、所述次要属性和所述距离计算属性计算所述各替换元件间的综合相似度;
步骤S140:根据被替换元件的属性信息,结合所述各替换元件间的综合相似度,确定替换元件。
进一步的,所述步骤S110具体包括:合并相同属性参数、统一属性参数单位格式、删除错误数据、补全缺失数据。
进一步的,所述步骤S120具体包括:
根据相应属性下不同种类数目来判段主要属性和距离计算属性:
其中,xi表示数值型属性i的种类数目,N为子类元器件数据库中元器件数据总数,η为属性种类丰富度,θ为判别阈值。
进一步的,所述步骤S130具体包括:
分别计算主要属性相似度、次要属性相似度和距离计算属性相似度,结合所述主要属性相似度和所述距离计算属性相似度确定主要相似度,结合所述主要相似度和所述次要属性相似度确定所述综合相似度。
进一步的,所述主要属性相似度的计算方法包括:
建立主要属性广义相似度计算公式:
进一步的,所述距离计算属性相似度的计算方法包括:
经Z-Score标准化处理后,替换元件数据库中各个元器件计算属性间的欧氏距离:
Di,j=0,ik=nan
Di,j=0.01,jk=nan
其中,Di,j为元器件i、j距离计算属性间的欧氏距离,i、j分别为被替代元器件和经过筛选后的相似元器件,ik、jk分别表示元器件i、j在第k个计算属性的取值,n为计算属性的总数;
将元器件距离计算属性间的欧氏距离转化为相似度:
进一步的,所述次要属性相似度的计算方法具体包括:
建立次要属性广义相似度的计算模型为:
进一步的,所述主要相似度计算模型为:
s.t.ω1+ω2=1
ω1≥0
ω2≥0
其中,Psi,j为元器件i,j间的主要相似度,ω1,ω2分别为主要属性相似度和距离计算属性相似度权值。
进一步的,所述综合相似度计算模型为:
结合主要相似度模型式和次要相似度模型,构建元器件综合相似度模型:
s.t.ωa+ωb=1
ωa≥ωb≥0
本发明有益效果:通过建立元器件综合相似度模型寻找相似元器件,该方法与现有的技术方法相比有效的减少了计算的时间复杂度和空间复杂度,效率更高;同时结合替代元器件实际使用经历和用户的反馈信息,不断迭代更新替代方案,与现有的技术方案相比其替代结果经过实际检验,可信度更高,具有广阔的应用前景。
本发明附加的方面和优点将在下面的描述中部分给出,这些将从下面的描述中变得明显,或通过本发明的实践了解到。
附图说明
为了更清楚地说明本发明实施例的技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1为本发明实施例一所述的电子元器件替代选型***原理框图。
图2为本发明实施例一所述的电子元器件替代选型方法流程图。
图3为本发明实施例二所述的电子元器件替代选型***原理框图。
图4为本发明实施例二所述的主要属性数目与距离计算属性数目的比值和主要属性的相似度权值的拟合函数示意图。
具体实施方式
下面详细叙述本发明的实施方式,所述实施方式的示例在附图中示出,其中自始至终相同或类似的标号表示相同或类似的元件或具有相同或类似功能的元件。下面通过附图描述的实施方式是示例性的,仅用于解释本发明,而不能解释为对本发明的限制。
本技术领域技术人员可以理解,除非特意声明,这里使用的单数形式“一”、“一个”、“所述”和“该”也可包括复数形式。应该进一步理解的是,本发明的说明书中使用的措辞“包括”是指存在所述特征、整数、步骤、操作、元件和/或组件,但是并不排除存在或添加一个或多个其他特征、整数、步骤、操作、元件和/或它们的组。应该理解,这里使用的“连接”或“耦接”可以包括无线连接或耦接,使用的措辞“和/或”包括一个或更多个相关联的列出项的任一单元和全部组合。
本技术领域技术人员可以理解,除非另外定义,这里使用的所有术语(包括技术术语和科学术语)具有与本发明所属领域中的普通技术人员的一般理解相同的意义。还应该理解的是,诸如通用字典中定义的那些术语应该被理解为具有与现有技术的上下文中的意义一致的意义,并且除非像这里一样定义,不会用理想化或过于正式的含义来解释。
为便于理解本发明,下面结合附图以具体实施例对本发明作进一步解释说明,且具体实施例并不构成对本发明实施例的限定。
本领域技术人员应该理解,附图只是实施例的示意图,附图中的部件并不一定是实施本发明所必须的。
实施例一
如图1所示,本发明实施例一提供一种电子元器件替代选型***,该***包括有如下功能模块:
数据预处理模块,用于收集电子元器件原始数据库中电子元器件的属性信息,并对所述属性信息进行预处理,构建替换元件数据库,建立元器件各参数属性倒排索引嵌套列表;
属性索引分类模块,用于确定所述替换元件数据库中各替换元件的主要属性、次要属性以及距离计算属性;
综合相似度计算模块,用于根据所述主要属性、所述次要属性和所述距离计算属性计算所述各替换元件间的综合相似度;
替换元件选择模块,用于根据被替换元件的属性信息,结合所述各替换元件间的综合相似度,确定替换元件。
如图2所示,本发明实施例一提供的一种利用上述电子元器件替代选型***进行电子元器件替代选型的方法,该方法主要包括如下流程步骤:
步骤S110:收集电子元器件原始数据库中电子元器件的属性信息,并对所述属性信息进行预处理,构建替换元件数据库,建立元器件各参数属性倒排索引嵌套列表;
步骤S120:确定所述替换元件数据库中各替换元件的主要属性、次要属性以及距离计算属性;
步骤S130:根据所述主要属性、所述次要属性和所述距离计算属性计算所述各替换元件间的综合相似度;
步骤S140:根据被替换元件的属性信息,结合所述各替换元件间的综合相似度,确定替换元件。
在本发明实施例一所述的方法中,所述步骤S110具体包括:合并相同属性参数、统一属性参数单位格式、删除错误数据、补全缺失数据。
在本发明实施例一所述的方法中,所述步骤S120具体包括:
根据相应属性下不同种类数目来判段主要属性和距离计算属性:
其中,xi表示数值型属性i的种类数目,N为子类元器件数据库中元器件数据总数,η为属性种类丰富度,θ为判别阈值。
在本发明实施例一所述的方法中,所述步骤S130具体包括:
分别计算主要属性相似度、次要属性相似度和距离计算属性相似度,结合所述主要属性相似度和所述距离计算属性相似度确定主要相似度,结合所述主要相似度和所述次要属性相似度确定所述综合相似度。
在本发明实施例一所述的方法中,所述主要属性相似度的计算方法包括:
建立主要属性广义相似度计算公式:
在本发明实施例一所述的方法中,所述距离计算属性相似度的计算方法包括:
经Z-Score标准化处理后,替换元件数据库中各个元器件计算属性间的欧氏距离:
Di,j=0, ik=nan
Di,j=0.01, jk=nan
其中,Di,j为元器件i、j距离计算属性间的欧氏距离,i、j分别为被替代元器件和经过筛选后的相似元器件,ik、jk分别表示元器件i、j在第k个计算属性的取值,n为计算属性的总数;
将元器件距离计算属性间的欧氏距离转化为相似度:
在本发明实施例一所述的方法中,所述次要属性相似度的计算方法具体包括:
建立次要属性广义相似度的计算模型为:
在本发明实施例一所述的方法中,所述主要相似度计算模型为:
s.t.ω1+ω2=1
ω1≥0
ω2≥0
其中,Psi,j为元器件i,j间的主要相似度,ω1,ω2分别为主要属性相似度和距离计算属性相似度权值。
在本发明实施例一所述的方法中,所述综合相似度计算模型为:
结合主要相似度模型式和次要相似度模型,构建元器件综合相似度模型:
s.t.ωa+ωb=1
ωa≥ωb≥0
其中,Sci,j为元器件i、j间的综合相似度,ωa,ωb分别表示元器件主要相似度和次要相似度的权值。
实施例二
如图3所示,本发明实施例提供了一种电子元器件替代选型***及方法,首先利用数据预处理模块对元器件原始数据进行预处理,合并相同属性参数、统一属性参数单位格式、删除错误数据、补全缺失数据。然后参考相关标准手册并结合技术人员的知识经验,确定被替代元器件的主要属性,次要属性和距离计算属性。(例如对于片式膜电阻器,其主要属性为功率、温度特性、精度、功率等,次要属性为质量等级、封装类型、介质类型等,距离计算属性为阻值。)其中,主要属性和次要属性是指其该属性包括的种类一般为枚举型数据或者种类数目较少的属性(对于片式膜电阻器的质量等级这一次要属性,其种类有“G”,“J”,“国军标”等等,为枚举型数据,该属性的种类数目仅为片式膜电阻器这一子类元器件数据数目的0.002%左右。)其次,根据替代原器件与被替代元器件主要属性中种类相同的数目计算广义相似度,筛选出相似度较高的部分替代元器件(一般为100组左右)。同样,对次要属性依据属性中种类相同的数目计算广义相似度。接下来,对距离计算属性(阻值)中的数据进行Z-Score标准化处理,并对筛选出的替代元器件距离计算属性计算欧氏距离,并将欧氏距离转换为相似度。将替代元器件所对应的各个相似度加权融合得到综合相似度,对综合相似度从大到小排序。最后,结合相关的元器件替代型号资料、元器件的实际使用经历数据和用户的反馈信息为用户推荐元器件替代型号,并不断根据用户反馈迭代、更新替代方案。
具体的,本发明实施例二所述的电子元器件替代选型***具体功能如下:
元器件数据清洗模块(数据预处理模块)实现功能主要包括:①元器件属性参数的拆分。如稳压二极管中某一属性参数名为“CURRENT-REVERSELEAKAGE@VR”,其值为1.1μ[email protected],如要获得该属性中的反向漏电流我们则需依据分隔符“@”拆分并提取数据。②元器件属性合并功能。如电阻中“电压”和“Voltage”这两属性参数实际为同一属性,对此需要将这两属性数据进行合并、统一。③错误数据删除功能。如电阻元器件其关键属性电阻数据缺失,或者对于电压属性某一数据记录为45KMV,数据单位错误,则认为其均为错误数据需要进行删除。④数据单位统一功能。如电阻属性单位包括Ω、KΩ、MΩ等,电压单位包括V、KV、mV等,需要将其单位统一。
元器件数据清洗模块由Python语言编写,其运行环境为Python 3.6.4.该模块所依赖的外部函数库包括:numpy 1.14.0、pandas 0.22.0、csv。该模块从数据库中读取元器件原始数据并对数据进行清洗,最后将处理所得数据保存至数据库中。
元器件相似度计算模块的主要功能:为衡量不同元器件间相似程度这一模糊指标,以寻找相似或相同元器件,通过建立数学模型,计算量化各个元器件间的相似程度,实现不同元器件的相互替代。具体建模过程如下:
1.1主要属性相似度的计算
主要属性是指在元器件属性参数中十分重要的那些属性。主要属性应需满足该属性下所包含的数据类型为枚举型字符串,或者其数据类型为数值型,但种类数目远小于数据库中这一子类元器件数目的要求。主要属性一般在该子类元器件中被大部分元器件所共有,通过确定主要属性可以将元器件数据划分为较多的小块,以较大的区分不同元器件。在实际计算中,本专利通过主要属性对相似元器件进行初步筛选,经过筛选后的相似元器件搜索范围能大大缩小至100组左右,以减少计算时间和存储空间,避免计算和存储资源不必要的浪费。
1.1.1主要属性的确定
举例来说,对于瓷介电容器这一元器件子类,参考相关的手册、标准,该元器件的关键属性包括容值、额定电压、温度特性、精度、介质类型等。对于介质类型这一属性,其种类主要包括1类瓷、2类瓷、2R1等等,为枚举数据类型。对于额定电压这一属性,其种类主要包括±10%、±5%、±20%、±2%等等,虽然该属性为数值数据类型,但是其种类数目为远小于该元器件子类数据总数,故将其视为主要属性而非距离计算属性。对于容值这一属性,其数据类型为数值型,且种类数目较多,故将其视为距离计算属性。对于同为数值型的关键属性.
本发明的具体实施例二中,主要依据该属性下不同种类数目来判段主要属性和距离计算属性,判别规则如下式(2-1)所示。
上式中,xi为数值型属性i的种类数目;N为子类元器件数据库中元器件数据总数;η为属性种类丰富度;θ为判别阈值。
η为属性种类丰富度,反映该属性下所包含种类的丰富程度,该值越大表示该属性包含的不同种类数目越多,当η=1时,表示该属性下每一元器件的种类均不相同,均为独自的一类。θ为判别阈值,若η≤θ则表示该属性为主要属性,否则为距离计算属性。其中,θ值的确定需考虑相似度距离计算的时间复杂度、空间复杂度、精度和搜索出的相似元器件数目,θ值一般取0.001,同时根据不同情况下,可对θ值做些许调整。
在实际应用中,如果θ值设置较小则大部分属性将被判别为距离计算属性,此时需通过计算每一元器件间的欧氏距离寻找相似元器件,其空间和时间成本虽然较高,但是该方法计算精度较高且能搜索出较多不同类型的相似元器件。如果θ值设定较大,则大部分属性将被判别为主要属性,主要属性的相似度计算较为简单,时间成本大大降低,但是其精度较低,搜索出的元器件种类数目较少。因此,合理设置θ值较为重要。
1.1.2主要属性相似度的计算
主要属性均为枚举型或种类数目较少的那些属性,对于主要属性相似度的计算,为降低计算成本,本专利并不采用现有的距离和相似度计算公式,而是建立广义相似度计算公式,如式(2-2)所示。
如果元器件i,j的主要属性中的类别取值均相同,则两元器件的相似度Smi,j为1,如果元器件i,j的主要属性的类别取值均不相同,则两元器件的相似度Smi,j为0。显然,对于两元器件,如果每一主要属性下种类相同的数目越多,则相似度的值越大。
在本发明的具体实施例二中,在编程过程中为减少时间复杂度,通过建立倒排索引,将该子类元器件下各个属性中不同种类的元器件索引保存为嵌套列表,在搜索元器件i的相似元器件时只需在列表中查找出每个属性中相同种类的元器件索引,再对每一属性的索引集合求并集,并依据相同索引出现次数从大到小排序,计算主要参数相似度。通过主要属性和式(2-3)对元器件数目进行筛选,可以缩小搜索范围。
do Sn=∑λi(i=n,n-1,n-2...),until Sn≥100
上式中,Sn为经主要属性筛选出的元器件数目;λi为各主要属性中类别相同数目为i的元器件数目;n为主要属性的个数。
1.2距离计算属性相似度的计算
距离计算属性一般是指数据类型为数值型且在式(2-1)中满足η>θ条件的关键属性。此时,距离计算属性对应的数据已经经过单位换算等处理后的数据。同时在计算各元器件间的欧氏距离时为避免不同量纲的影响,本专利对距离计算属性的数据进行Z-Score标准化处理如式(2-4)。
经Z-Score标准化处理后,各个元器件计算属性间的欧氏距离计算公式如(2-5)所示。
Di,j=0, ik=nan
Di,j=0.01, jk=nan (2-5)
上式中,Di,j为元器件i,j距离计算属性间的欧氏距离;i,j分别为被替代元器件和经过筛选后的相似元器件;ik,jk为元器件i,j在第k个计算属性的取值;n为计算属性的总数。
显然,元器件i,j计算属性间的距离Di,j越大表示两者差别越大,元器件i,j越不相似。如果被替代元器件i的属性种类数据k为空(nan),则定义元器件间的相似度为0,如果经过筛选后的相似元器件j的属性种类值k为空(nan),则定义元器件间的距离计算属性相似度为一个较小值0.01,用以区分当被替代元器件与相似元器件拥有相同属性种类值时其距离计算属性相似度为0的情形。为方便计算各元器件间的相似度,我们按式(2-6)将元器件计算属性间的欧氏距离转化为相似度。
上式中,Sci,j为元器件i,j间距离计算属性相似度;Max(Di)为元器件i与相似元器件距离计算属性的最大距离;Min(Di)为元器件i与相似元器件距离计算属性的最小距离。
如果该子类元器件没有距离计算属性,则Sci,j=0。此时,只对经过主要属性筛选后的元器件计算属性间的相似度,以减少计算量,缩短计算时间。
1.3主要相似度模型
根据关键参数即主要属性和距离计算属性构建主要相似度模型。如式(2-7)所示。
s.t.ω1+ω2=1
ω1≥0
ω2≥0 (2-7)
上式中,Psi,j为元器件i,j间的主要相似度;ω1,ω2分别为主要属性相似度和距离计算属性相似度权值。
在本发明的具体实施例二中,在相似元器件的搜索过程中采取的策略主要是,首先保证两元器件间主要属性的相同数目最多,在主要属性相同数目一致的情况下再计算距离计算属性间的相似度,该相似度越大则两元器件越相似。
主要属性相似度的计算,依赖元器件属性种类相同的数目,该相似度为离散值,且计算出的相似度在数值上有明显区别(例如,两元器件主要属性的相同数目分别为5和4时计算所得的相似度有较大区别),因此主要属性相似度这一指标对两元器件间的相似程度有较大的区分,对元器件是否相似的判别能力更强。
随着主要属性数目的增加,在主要相似度计算时赋予该项的权值将不断增大。而距离计算属性相似度为连续值,两元器件在此属性值相差较大的情况下仍有可能计算出较大的相似度。因此,该相似度对元器件相似程度的判别能力较弱,且随着主要属性数目的增加,赋予该项的权值将不断减小。
综上所述,在权值的设计时,应更偏向于对相似元器件判别能力较强的主要属性。当主要属性数目和距离计算属性数目的比值变化时,两不同类型的相似度权值的取值也应随之变化。记主要属性数目与距离计算属性数目的比值为ε。当ε取不同值时,本专利设计主要属性的相似度权值ω1的取值情况如表1所示。
表1
ε | 50 | 25 | 6 | 4 | 3 | 2 | 1 | 1/2 | 1/3 | 1/4 | 1/8 | 1/10 |
ω<sub>1</sub> | 0.96 | 0.92 | 0.9 | 0.85 | 0.8 | 0.7 | 0.65 | 0.6 | 0.55 | 0.5 | 0.22 | 0.2 |
由上表中ε与ω1间一一对应的取值关系,分别选择指数函数、幂函数、构造函数、四次多项式函数和有理数逼近函数,利用最小二乘法拟合ε与ω1间的函数关系,其拟合结果如表2所示。
表2
ε与ω1的各个拟合函数表达式和拟合精度如表2所示,其中构造函数的拟合精度最高,但函数表达式较为复杂,幂函数拟合精度次之,四次多项式函数拟合精度最低,其误差平方和SSE为0.044。此外,ε-ω1各自拟合函数如图4所示,由图4可以明显看出多项式函数拟合效果较差,并且其图像并不符合本文的设计要求。因此,综合考虑拟合函数复杂度和拟合精度的要求,选择幂函数ω1=-0.334ε-0..396+1.025作为主要属性数目与距离计算属性数目的比值ε与主要属性相似度权值ω1的关系函数,如式(2-8)。
ω1=Max[Min(-0.334ε-0..396+1.025,1),0] (2-8)
ε-ω1的函数表达式如上所示,由于权值要求0≤ω1≤1,故本专利通过Min-Max限制ω1的范围。
1.4次要属性相似度计算
次要属性是指元器件中较为关键的那些属性,其重要程度略低于主要属性。次要属性也需满足该属性下所包含的种类为枚举型字符串,或者数据类型为数值型但其种类数目远小于此子类元器件数目这一要求。次要属性应被该子类中的大部分元器件所共有,其各属性包含的种类数目可以相对较少。
次要属性相似度的计算与主要属性的方法相同。本发明一个具体实施例中,通过定义广义相似度来衡量两元器件间次要属性间的相似程度。参考(2-2)式,次要属性广义相似度的计算公式如下式(2-9)。
显然,如果两元器件每一次要属性下种类相同的数目越多,则两元器件间的次要属性相似度值Ssi,j将越大。将次要属性相似度作为次要相似度,同时构建元器件综合相似度模型。
1.5综合相似度模型
结合元器件间的主要相似度模型式(2-7)和次要相似度模型(2-9),构建元器件综合相似度模型,如式(2-10)所示。
s.t.ωa+ωb=1
ωa≥ωb≥0 (2-10)
上式中,Sci,j为元器件i,j间的综合相似度;ωa,ωb分别表示元器件主要相似度和次要相似度的权值。
在本发明的具体实施例二中,一般情况下,在计算元器件综合相似度时,认为主要相似度较次要相似度更为重要,故ωa≥ωb≥0,这里取ωa=0.65,ωb=0.35。若元器件无次要属性时,则将主要相似度作为元器件综合相似度。
通过构建元器件综合相似度模型计算综合相似度,可以衡量元器件间的相似程度,实现相似元器件的查找和元器件替代选型功能。
综上,本发明的具体实施例中,首先根据元器件的主要属性筛选出部分相似的元器件(约100组左右)并计算其主要属性相似度。然后在筛选出的元器件中计算各个元器件间距离计算属性的欧氏距离,并将其转换为相似度。接下来结合主要属性相似度和距离计算属性相似度构建主要相似度模型,计算各筛选器件的主要相似度。同时构建次要属性相似度模型,计算各筛选器件的次要属性相似度。最后根据元器件间的主要相似度和次要相似度构建综合相似度模型,计算元器件的综合相似度,并根据综合相似度由大到小对相似元器件进行排序,得到相似程度由大至小元器件列表。
在本发明的具体实施例二中,元器件替代选型模块(替换元件选择模块)由Python语言编写,其运行环境为Python 3.6.4。该模块所依赖的外部函数模块包括:numpy1.14.0、pandas 0.22.0、progressbar23.36.0、sklearn、csv、time、random。该某块可以根据被替代元器件的相关信息,查找与其相似的元器件,计算元器件间的综合相似度,同时保存相似元器件的索引和相似度。该模块所包含的主要函数如表3所示。
表3
本模块根据上述综合相似度模型计算所得相似元器件列表并结合元器件实际使用数据和元器件有关替代资料信息,获得元器件替代型号,并将其推荐给用户。同时,根据用户对替换元器件使用情况的反馈信息不断迭代、更新元器件替代方案。
综上所述,本发明实施例所述的电子元器件替代选型***及选型方法,针对元器件命名规则、性能参数格式、质量等级、分类体系不统一的问题,本专利通过对收集所得的大量元器件原始数据进行整理,制定统一的规则,编写数据清洗模块,对元器件的性能参数数据进行清洗,统一元器件的单位格式等。
针对元器件相似性搜索时间成本、空间成本高的问题,本专利结合元器件数据自有的特点,首先根据元器件的核心参数排除大部分相似度较低或不能实现功能替代的元器件。然后结合元器件属性参数数目判断该属性所属类型(数值型或符号型),对于符号型数据计算广义相似度,对于数值型数据计算欧氏距离,缩短计算时间。
通过以上的实施方式的描述可知,本领域的技术人员可以清楚地了解到本发明可借助软件加必需的通用硬件平台的方式来实现。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品可以存储在存储介质中,如ROM/RAM、磁碟、光盘等,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本发明各个实施例或者实施例的某些部分所述的方法。
以上所述,仅为本发明较佳的具体实施方式,但本发明的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本发明揭露的技术范围内,可轻易想到的变化或替换,都应涵盖在本发明的保护范围之内。因此,本发明的保护范围应该以权利要求的保护范围为准。
Claims (2)
1.一种电子元器件替代选型***,其特征在于,包括:
数据预处理模块,用于收集电子元器件原始数据库中电子元器件的属性信息,并对所述属性信息进行预处理,构建替换元件数据库,建立元器件各参数属性倒排索引嵌套列表;合并相同属性参数、统一属性参数单位格式、删除错误数据、补全缺失数据;
属性索引分类模块,用于确定所述替换元件数据库中各替换元件的主要属性、次要属性以及距离计算属性;其中,
根据相应属性下不同种类数目来判段主要属性和距离计算属性:
其中,xi表示数值型属性i的种类数目,N为子类元器件数据库中元器件数据总数,η为属性种类丰富度,θ为判别阈值;
综合相似度计算模块,用于根据所述主要属性、所述次要属性和所述距离计算属性计算所述各替换元件间的综合相似度;分别计算主要属性相似度、次要属性相似度和距离计算属性相似度,结合所述主要属性相似度和所述距离计算属性相似度确定主要相似度,结合所述主要相似度和所述次要属性相似度确定所述综合相似度;
所述主要属性相似度的计算方法包括:
建立主要属性广义相似度计算公式:
所述距离计算属性相似度的计算方法包括:
经Z-Score标准化处理后,替换元件数据库中各个元器件计算属性间的欧氏距离:
Di,j=0,ik=nan
Di,j=0.01,jk=nan
其中,Di,j为元器件i、j距离计算属性间的欧氏距离,i、j分别为被替代元器件和经过筛选后的相似元器件,ik、jk分别表示元器件i、j在第k个计算属性的取值,n为计算属性的总数;
将元器件距离计算属性间的欧氏距离转化为相似度:
所述次要属性相似度的计算方法具体包括:
建立次要属性广义相似度的计算模型为:
所述主要相似度计算模型为:
s.t.ω1+ω2=1
ω1≥0
ω2≥0
其中,Psi,j为元器件i,j间的主要相似度,ω1,ω2分别为主要属性相似度和距离计算属性相似度权值,
结合主要相似度模型式和次要相似度模型,构建元器件综合相似度模型:
s.t.ωa+ωb=1
ωa≥ωb≥0
其中,Sci,j为元器件i、j间的综合相似度,ωa,ωb分别表示元器件主要相似度和次要相似度的权值;
根据所述元器件综合相似度模型,将替代元器件所对应的各个主要相似度和次要相似度加权融合,得到替代元器件的综合相似度;
替换元件选择模块,用于根据被替换元件的属性信息,结合所述各替换元件间的综合相似度,确定替换元件。
2.一种电子元器件替代选型方法,其特征在于,包括如下流程步骤:
步骤S110:收集电子元器件原始数据库中电子元器件的属性信息,并对所述属性信息进行预处理,构建替换元件数据库,建立元器件各参数属性倒排索引嵌套列表;合并相同属性参数、统一属性参数单位格式、删除错误数据、补全缺失数据;
步骤S120:确定所述替换元件数据库中各替换元件的主要属性、次要属性以及距离计算属性;包括:
根据相应属性下不同种类数目来判段主要属性和距离计算属性:
其中,xi表示数值型属性i的种类数目,N为子类元器件数据库中元器件数据总数,η为属性种类丰富度,θ为判别阈值;
步骤S130:根据所述主要属性、所述次要属性和所述距离计算属性计算所述各替换元件间的综合相似度;包括:
分别计算主要属性相似度、次要属性相似度和距离计算属性相似度,结合所述主要属性相似度和所述距离计算属性相似度确定主要相似度,结合所述主要相似度和所述次要属性相似度确定所述综合相似度;
所述主要属性相似度的计算方法包括:
建立主要属性广义相似度计算公式:
步骤S140:根据被替换元件的属性信息,结合所述各替换元件间的综合相似度,确定替换元件;所述距离计算属性相似度的计算方法包括:
经Z-Score标准化处理后,替换元件数据库中各个元器件计算属性间的欧氏距离:
Di,j=0,ik=nan
Di,j=0.01,jk=nan
其中,Di,j为元器件i、j距离计算属性间的欧氏距离,i、j分别为被替代元器件和经过筛选后的相似元器件,ik、jk分别表示元器件i、j在第k个计算属性的取值,n为计算属性的总数;
将元器件距离计算属性间的欧氏距离转化为相似度:
所述次要属性相似度的计算方法具体包括:
建立次要属性广义相似度的计算模型为:
所述主要相似度计算模型为:
s.t.ω1+ω2=1
ω1≥0
ω2≥0
其中,Psi,j为元器件i,j间的主要相似度,ω1,ω2分别为主要属性相似度和距离计算属性相似度权值,
结合主要相似度模型式和次要相似度模型,构建元器件综合相似度模型:
s.t.ωa+ωb=1
ωa≥ωb≥0
其中,Sci,j为元器件i、j间的综合相似度,ωa,ωb分别表示元器件主要相似度和次要相似度的权值;
根据所述元器件综合相似度模型,将替代元器件所对应的各个主要相似度和次要相似度加权融合,得到替代元器件的综合相似度。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201811010713.0A CN109284420B (zh) | 2018-08-31 | 2018-08-31 | 电子元器件替代选型***及替代选型方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201811010713.0A CN109284420B (zh) | 2018-08-31 | 2018-08-31 | 电子元器件替代选型***及替代选型方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN109284420A CN109284420A (zh) | 2019-01-29 |
CN109284420B true CN109284420B (zh) | 2020-11-13 |
Family
ID=65183846
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201811010713.0A Active CN109284420B (zh) | 2018-08-31 | 2018-08-31 | 电子元器件替代选型***及替代选型方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN109284420B (zh) |
Families Citing this family (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110569211B (zh) * | 2019-09-02 | 2022-09-13 | 飞腾信息技术有限公司 | 片上***内部通讯方法 |
CN110647521A (zh) * | 2019-09-03 | 2020-01-03 | 中国航空工业集团公司沈阳飞机设计研究所 | 一种电子元器件数据清洗方法及设备 |
CN110837526A (zh) * | 2019-11-14 | 2020-02-25 | 陕西航空电气有限责任公司 | 一种基于物料信息管理平台的电子元器件选型方法及*** |
CN111078861B (zh) * | 2019-11-29 | 2023-12-12 | 广东工业大学 | 电气图纸元器件的选型替换推荐方法、***及存储介质 |
CN114064738B (zh) * | 2022-01-14 | 2022-04-29 | 杭州捷配信息科技有限公司 | 电子元器件替料查找方法、装置及应用 |
CN114117244B (zh) * | 2022-01-24 | 2022-08-26 | 百芯智能制造科技(深圳)有限公司 | 一种元器件关系的识别方法及电子设备 |
CN117609529A (zh) * | 2023-10-20 | 2024-02-27 | 粤港澳大湾区(广东)国创中心 | 电子元器件的替代检索方法及其*** |
Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN105677715A (zh) * | 2015-12-29 | 2016-06-15 | 海信集团有限公司 | 一种基于多用户的视频推荐方法及装置 |
CN107943938A (zh) * | 2017-11-23 | 2018-04-20 | 清华大学 | 一种基于深度乘积量化的大规模图像相似检索方法及*** |
Family Cites Families (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN103488751B (zh) * | 2013-09-24 | 2016-07-13 | 浙江大学 | 基于光谱曲线波形相似度的光谱匹配方法 |
US9665644B1 (en) * | 2015-01-05 | 2017-05-30 | Google Inc. | Perceptual characteristic similarity for item replacement in media content |
CN106372073A (zh) * | 2015-07-21 | 2017-02-01 | 北京大学 | 一种数学公式检索方法与装置 |
CN105787113B (zh) * | 2016-03-24 | 2019-03-19 | 武汉大学 | 一种基于plm数据库面向dpipp工艺信息的挖掘算法 |
CN106126649B (zh) * | 2016-06-24 | 2019-07-23 | 北京千安哲信息技术有限公司 | 一种相似中药材挖掘方法及装置 |
CN106407352B (zh) * | 2016-09-06 | 2019-09-10 | 广东顺德中山大学卡内基梅隆大学国际联合研究院 | 基于深度学习的交通图像检索方法 |
-
2018
- 2018-08-31 CN CN201811010713.0A patent/CN109284420B/zh active Active
Patent Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN105677715A (zh) * | 2015-12-29 | 2016-06-15 | 海信集团有限公司 | 一种基于多用户的视频推荐方法及装置 |
CN107943938A (zh) * | 2017-11-23 | 2018-04-20 | 清华大学 | 一种基于深度乘积量化的大规模图像相似检索方法及*** |
Also Published As
Publication number | Publication date |
---|---|
CN109284420A (zh) | 2019-01-29 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN109284420B (zh) | 电子元器件替代选型***及替代选型方法 | |
Budach et al. | The effects of data quality on machine learning performance | |
CN112732934B (zh) | 电网设备分词词典和故障案例库构建方法 | |
US10789149B2 (en) | Duplicate bug report detection using machine learning algorithms and automated feedback incorporation | |
CN112905580B (zh) | 一种基于工业大数据的多源异构数据融合***及方法 | |
CN112463971B (zh) | 一种基于层级组合模型的电商商品分类方法及*** | |
CN113702895B (zh) | 一种电压互感器误差状态在线定量评估方法 | |
CN111950922B (zh) | 一种基于多源数据交互分析的装备经济数据评估方法 | |
CN113254507B (zh) | 一种数据资产目录智能构建盘点方法 | |
CN113935440A (zh) | 一种电压互感器误差状态迭代评估方法及*** | |
CN112084294B (zh) | 一种基于人工智能的整车电磁兼容分级管理方法 | |
CN113767403B (zh) | 知识图中过指定和欠指定的自动解析 | |
Neela et al. | Modeling Software Defects as Anomalies: A Case Study on Promise Repository. | |
CN116842406A (zh) | 一种基于招投标信息的产业链网络构建方法、存储介质及*** | |
CN117010373A (zh) | 一种电力设备资产管理数据所属类别和组的推荐方法 | |
CN110543601A (zh) | 一种基于中智集的上下文感知兴趣点推荐方法及*** | |
Zhang et al. | Identification of key factors and mining of association relations in complex product assembly process | |
CN111858717B (zh) | 一种物料创建的实时智能推荐方法 | |
CN115034762A (zh) | 一种岗位推荐方法、装置、存储介质、电子设备及产品 | |
CN115204179A (zh) | 基于电网公共数据模型的实体关系预测的方法及装置 | |
CN113935819A (zh) | 核算异常特征提取方法 | |
Cheung et al. | Rapid data integration and analysis for upstream oil and gas applications | |
Liu et al. | Transformer fault diagnosis model based on iterative nearest neighbor interpolation and ensemble learning | |
Bellandi et al. | A Comparative Study of Clustering Techniques Applied on Covid-19 Scientific Literature | |
Li et al. | Analytic model and assessment framework for data quality evaluation in state grid |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |