CN116434880B - 一种基于模糊自洽式聚类集成的高熵合金硬度预测方法 - Google Patents
一种基于模糊自洽式聚类集成的高熵合金硬度预测方法 Download PDFInfo
- Publication number
- CN116434880B CN116434880B CN202310204380.XA CN202310204380A CN116434880B CN 116434880 B CN116434880 B CN 116434880B CN 202310204380 A CN202310204380 A CN 202310204380A CN 116434880 B CN116434880 B CN 116434880B
- Authority
- CN
- China
- Prior art keywords
- point
- fuzzy
- clustering
- cluster
- sample point
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000000034 method Methods 0.000 title claims abstract description 66
- 239000000956 alloy Substances 0.000 title claims abstract description 34
- 229910045601 alloy Inorganic materials 0.000 title claims abstract description 33
- 230000010354 integration Effects 0.000 title claims abstract description 17
- 239000011159 matrix material Substances 0.000 claims abstract description 16
- 238000012545 processing Methods 0.000 claims abstract description 16
- 239000013598 vector Substances 0.000 claims description 19
- 238000004422 calculation algorithm Methods 0.000 claims description 13
- 238000004364 calculation method Methods 0.000 claims description 12
- 230000008569 process Effects 0.000 claims description 10
- 238000013507 mapping Methods 0.000 claims description 6
- 238000010586 diagram Methods 0.000 claims description 3
- 230000000694 effects Effects 0.000 description 7
- 238000011160 research Methods 0.000 description 5
- 230000008878 coupling Effects 0.000 description 4
- 238000010168 coupling process Methods 0.000 description 4
- 238000005859 coupling reaction Methods 0.000 description 4
- 238000012360 testing method Methods 0.000 description 4
- 238000012549 training Methods 0.000 description 4
- 238000013461 design Methods 0.000 description 3
- XEEYBQQBJWHFJM-UHFFFAOYSA-N Iron Chemical compound [Fe] XEEYBQQBJWHFJM-UHFFFAOYSA-N 0.000 description 2
- PXHVJJICTQNCMI-UHFFFAOYSA-N Nickel Chemical compound [Ni] PXHVJJICTQNCMI-UHFFFAOYSA-N 0.000 description 2
- 230000006872 improvement Effects 0.000 description 2
- 238000002156 mixing Methods 0.000 description 2
- 238000012986 modification Methods 0.000 description 2
- 230000004048 modification Effects 0.000 description 2
- 238000005192 partition Methods 0.000 description 2
- 238000002360 preparation method Methods 0.000 description 2
- VYZAMTAEIAYCRO-UHFFFAOYSA-N Chromium Chemical compound [Cr] VYZAMTAEIAYCRO-UHFFFAOYSA-N 0.000 description 1
- RYGMFSIKBFXOCR-UHFFFAOYSA-N Copper Chemical compound [Cu] RYGMFSIKBFXOCR-UHFFFAOYSA-N 0.000 description 1
- WHXSMMKQMYFTQS-UHFFFAOYSA-N Lithium Chemical compound [Li] WHXSMMKQMYFTQS-UHFFFAOYSA-N 0.000 description 1
- FYYHWMGAXLPEAU-UHFFFAOYSA-N Magnesium Chemical compound [Mg] FYYHWMGAXLPEAU-UHFFFAOYSA-N 0.000 description 1
- ZOKXTWBITQBERF-UHFFFAOYSA-N Molybdenum Chemical compound [Mo] ZOKXTWBITQBERF-UHFFFAOYSA-N 0.000 description 1
- XUIMIQQOPSSXEZ-UHFFFAOYSA-N Silicon Chemical compound [Si] XUIMIQQOPSSXEZ-UHFFFAOYSA-N 0.000 description 1
- ATJFFYVFTNAWJD-UHFFFAOYSA-N Tin Chemical compound [Sn] ATJFFYVFTNAWJD-UHFFFAOYSA-N 0.000 description 1
- RTAQQCXQSZGOHL-UHFFFAOYSA-N Titanium Chemical compound [Ti] RTAQQCXQSZGOHL-UHFFFAOYSA-N 0.000 description 1
- HCHKCACWOHOZIP-UHFFFAOYSA-N Zinc Chemical compound [Zn] HCHKCACWOHOZIP-UHFFFAOYSA-N 0.000 description 1
- QCWXUUIWCKQGHC-UHFFFAOYSA-N Zirconium Chemical compound [Zr] QCWXUUIWCKQGHC-UHFFFAOYSA-N 0.000 description 1
- 239000000654 additive Substances 0.000 description 1
- 230000000996 additive effect Effects 0.000 description 1
- 229910052782 aluminium Inorganic materials 0.000 description 1
- XAGFODPZIPBFFR-UHFFFAOYSA-N aluminium Chemical compound [Al] XAGFODPZIPBFFR-UHFFFAOYSA-N 0.000 description 1
- 238000004458 analytical method Methods 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 230000008859 change Effects 0.000 description 1
- 229910052804 chromium Inorganic materials 0.000 description 1
- 239000011651 chromium Substances 0.000 description 1
- 229910017052 cobalt Inorganic materials 0.000 description 1
- 239000010941 cobalt Substances 0.000 description 1
- GUTLYIVDDKVIGB-UHFFFAOYSA-N cobalt atom Chemical compound [Co] GUTLYIVDDKVIGB-UHFFFAOYSA-N 0.000 description 1
- 229910052802 copper Inorganic materials 0.000 description 1
- 239000010949 copper Substances 0.000 description 1
- 238000012937 correction Methods 0.000 description 1
- 238000007418 data mining Methods 0.000 description 1
- 230000007547 defect Effects 0.000 description 1
- 238000009826 distribution Methods 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 230000001747 exhibiting effect Effects 0.000 description 1
- 238000000605 extraction Methods 0.000 description 1
- 230000006870 function Effects 0.000 description 1
- 229910052735 hafnium Inorganic materials 0.000 description 1
- VBJZVLUMGGDVMO-UHFFFAOYSA-N hafnium atom Chemical compound [Hf] VBJZVLUMGGDVMO-UHFFFAOYSA-N 0.000 description 1
- 238000000265 homogenisation Methods 0.000 description 1
- 229910052742 iron Inorganic materials 0.000 description 1
- 229910052744 lithium Inorganic materials 0.000 description 1
- 238000010801 machine learning Methods 0.000 description 1
- 229910052749 magnesium Inorganic materials 0.000 description 1
- 239000011777 magnesium Substances 0.000 description 1
- WPBNNNQJVZRUHP-UHFFFAOYSA-L manganese(2+);methyl n-[[2-(methoxycarbonylcarbamothioylamino)phenyl]carbamothioyl]carbamate;n-[2-(sulfidocarbothioylamino)ethyl]carbamodithioate Chemical compound [Mn+2].[S-]C(=S)NCCNC([S-])=S.COC(=O)NC(=S)NC1=CC=CC=C1NC(=S)NC(=O)OC WPBNNNQJVZRUHP-UHFFFAOYSA-L 0.000 description 1
- 238000004519 manufacturing process Methods 0.000 description 1
- 238000002844 melting Methods 0.000 description 1
- 230000008018 melting Effects 0.000 description 1
- 238000005065 mining Methods 0.000 description 1
- 229910052750 molybdenum Inorganic materials 0.000 description 1
- 239000011733 molybdenum Substances 0.000 description 1
- 229910052759 nickel Inorganic materials 0.000 description 1
- 229910052758 niobium Inorganic materials 0.000 description 1
- 239000010955 niobium Substances 0.000 description 1
- GUCVJGMIXFAOAE-UHFFFAOYSA-N niobium atom Chemical compound [Nb] GUCVJGMIXFAOAE-UHFFFAOYSA-N 0.000 description 1
- 238000003909 pattern recognition Methods 0.000 description 1
- 238000004663 powder metallurgy Methods 0.000 description 1
- 238000003672 processing method Methods 0.000 description 1
- 229910052706 scandium Inorganic materials 0.000 description 1
- SIXSYDAISGFNSX-UHFFFAOYSA-N scandium atom Chemical compound [Sc] SIXSYDAISGFNSX-UHFFFAOYSA-N 0.000 description 1
- 229910052710 silicon Inorganic materials 0.000 description 1
- 239000010703 silicon Substances 0.000 description 1
- 238000005482 strain hardening Methods 0.000 description 1
- 229910052715 tantalum Inorganic materials 0.000 description 1
- GUVRBAGPIYLISA-UHFFFAOYSA-N tantalum atom Chemical compound [Ta] GUVRBAGPIYLISA-UHFFFAOYSA-N 0.000 description 1
- 229910052718 tin Inorganic materials 0.000 description 1
- 239000011135 tin Substances 0.000 description 1
- 229910052719 titanium Inorganic materials 0.000 description 1
- 239000010936 titanium Substances 0.000 description 1
- WFKWXMTUELFFGS-UHFFFAOYSA-N tungsten Chemical compound [W] WFKWXMTUELFFGS-UHFFFAOYSA-N 0.000 description 1
- 229910052721 tungsten Inorganic materials 0.000 description 1
- 239000010937 tungsten Substances 0.000 description 1
- 229910052720 vanadium Inorganic materials 0.000 description 1
- LEONUFNNVUYDNQ-UHFFFAOYSA-N vanadium atom Chemical compound [V] LEONUFNNVUYDNQ-UHFFFAOYSA-N 0.000 description 1
- 229910052725 zinc Inorganic materials 0.000 description 1
- 239000011701 zinc Substances 0.000 description 1
- 229910052726 zirconium Inorganic materials 0.000 description 1
Classifications
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16C—COMPUTATIONAL CHEMISTRY; CHEMOINFORMATICS; COMPUTATIONAL MATERIALS SCIENCE
- G16C60/00—Computational materials science, i.e. ICT specially adapted for investigating the physical or chemical properties of materials or phenomena associated with their design, synthesis, processing, characterisation or utilisation
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02P—CLIMATE CHANGE MITIGATION TECHNOLOGIES IN THE PRODUCTION OR PROCESSING OF GOODS
- Y02P90/00—Enabling technologies with a potential contribution to greenhouse gas [GHG] emissions mitigation
- Y02P90/30—Computing systems specially adapted for manufacturing
Landscapes
- Engineering & Computer Science (AREA)
- Computing Systems (AREA)
- Theoretical Computer Science (AREA)
- Life Sciences & Earth Sciences (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Bioinformatics & Computational Biology (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
本发明提供一种基于模糊自洽式聚类集成的高熵合金硬度预测方法,属于合金硬度预测技术领域。为解决现有方法无法有效避免类簇标签值的大小对对象间关系的影响,共识结果很难准确地映射出基聚类结果间的实际差异,且处理不确定性关系的能力较弱的问题。本发明方法将基聚类结果作为样本点特征,将基聚类结果采用缩放的哑变量的形式表示;采用模糊算子构建所有样本点的关系矩阵;基于关系矩阵计算各样本点的局部密度和相对距离,以识别聚类中心和分配非中心点,并构建再分配策略对共识聚类结果中的不确定性样本点进行修正。本发明消除了基聚类结果间划分差异的影响,从模糊算子的角度审视对象间的模糊关系,有效地提升对模糊关系的处理能力。
Description
技术领域
本发明涉及合金硬度预测技术领域,具体而言,涉及一种基于模糊自洽式聚类集成的高熵合金硬度预测方法。
背景技术
高熵合金(HEAs)具有高硬度、良好的耐磨性、优异的低温断裂韧性、优异的磁性能等一些优质的物理机械性能。对高熵合金的硬度预测时,针对给定的未知高熵合金数据集,其包含内在属性和规律均存在较大差异的合金材料,差异较大的合金彼此之间存在较为复杂的内部关系,导致模型对于某一类合金的硬度预测值有较大的偏差。
聚类是一种用于解决无监督问题的先进分析技术,致力于将给定数据集中相似度较高的样本点划分到同一类簇,差异相对较大的样本点彼此分开,是机器学习和数据挖掘领域的热点研究课题。现已成功应用于诸多实际场景,如图像模式识别、医学研究、推荐***、文本挖掘和工程***等。针对对高熵合金的硬度预测中难点,现有研究“一种基于改进密度峰值聚类算法的高熵合金硬度预测方法CN114613456A”,通过改进的密度峰值聚类算法,解决了由于高熵合金数据集数据结构差异大而导致的模型不能较好的学习数据集内部结构特征的问题,提升了模型的预测能力。
聚类集成(CE)模型相较于传统的单一聚类模型,能够通过整合多个基本聚类结果获得具有更好聚类效果和稳健性能的集成结果。在CE模型中有起着桥梁般作用的关键一步是如何处理基聚类结果矩阵,该步处理的好坏将直接影响模型最终的聚类性能。现有的CE方法通常采用两种方式来处理基聚类结果矩阵。第一种是发展较为成熟且被绝大多数人广泛使用的方法,其主张将行向量作为共识过程的输入,现有研究“一种基于三种共识策略的双粒度聚类集成算法的高熵合金硬度预测方法CN115691700A”,解决了现有的集成聚类算法不能对不同共识结果间产生的划分冲突进行有效地整合的问题,最终达到了令人满意的聚类效果。第二种是一种相关研究较少的处理方法,其主张将基聚类结果的标签值直接作为原始数据的特征表示。该方法能够有效克服第一种方法存在的缺陷,即不同基聚类结果间的类簇不对应。同时,由于第二种处理方式处于起步阶段,它还存在一些缺点:1)无法有效避免类簇标签值的大小对对象间关系计算的影响;2)默认所有基聚类结果是等贡献力的对于最终的共识结果,很难准确地映射出基聚类结果间的实际差异。不同的处理方式将直接导致有效信息提取的质量,从而影响最终的集成效果。此外,虽然关于对象间相似性关系的定义方法层出不穷,但其实从计算本质上来看差别并不明显。而且大多数定义方法的耦合度是固定的,导致处理不确定性关系的能力较弱,无法适用于所有类型的数据结构。在分配类簇标签时不可避免的会出现某种程度的模糊现象。因此,很有必要从一种全新的角度重新审视对象间的不确定性,以提高模型的灵活性以及处理模糊关系的能力。
发明内容
本发明要解决的技术问题是:
现有方法无法有效避免类簇标签值的大小对对象间关系计算的影响,并默认所有基聚类结果是等贡献力的,最终的共识结果很难准确地映射出基聚类结果间的实际差异;同时对于处理不确定性关系的能力较弱,无法有效解决共识结果中的不确定性的问题。
本发明为解决上述技术问题所采用的技术方案:
本发明提供了一种基于模糊自洽式聚类集成的高熵合金硬度预测方法,包括如下步骤:
S1、针对高熵合金数据集,采用基聚类算法对数据集进行多次划分,生成基聚类结果,将基聚类结果作为样本点特征,将基聚类结果采用哑变量的形式表示,再对结果进行缩放的加权处理,得到原始数据缩放的哑变量特征表示;
S2、采用模糊算子定义所述缩放的哑变量特征表示下任意两个样本点之间的模糊关系,得到所有样本点构成的关系矩阵;
S3、将关系矩阵作为共识策略的输入,基于所述关系矩阵计算各样本点的局部密度和相对距离,基于局部密度和相对距离识别聚类中心和分配非中心点,得到初阶共识聚类结果πθ;
S4、构建再分配策略对初阶共识聚类结果中的不确定性样本点进行修正,得到终阶共识聚类结果π*;
S5、将终阶共识聚类结果中的不同类簇各自建立回归模型,进行高熵合金硬度预测计算。
进一步地,S1具体包括如下步骤:
S11、针对高熵合金数据集DX={dx1,dx2,…,dxN},其中N是样本数量,通过基聚类算法{A1,A2,…,AL}对数据集DX进行L次划分,得到基聚类结果矩阵其中πij表示第i个划分对第j个样本点分配的标签值,即第i个划分下的基聚类结果和类簇个数分别为/>和|C(ri)|,将基聚类结果作为样本点特征;
S12、将基聚类结果采用哑变量的形式表示,即对于任意一个样本点dxj,表示为:
其中,的长度为|C(ri)|,从左到右每个位置的值依次代表第1簇至第|C(ri)|簇,/>只有在第πij个位置的值为1,其余位置的值均为0;
S13、在S12的基础上对基聚类结果进行缩放的加权处理,其缩放系数ωi基于DBI指数,具体形式为:
其中,DBIi为第i个划分下基聚类结果的DBI指标得分;
则样本点dxj表示为:
其中,的长度为|C(ri)|,从左到右每个位置的值依次代表第1簇至第|C(ri)|簇,/>只有在第πij个位置的值为ωi,其余位置的值均为0;
最终得到原始数据缩放的哑变量特征表示。
进一步地,S2所述模糊算子的定义为:
设映射S:[0,1]2→[0,1],对于有γ-模糊算子/>
进一步地,S2中采用γ-模糊算子定义任意两个样本点d*xj和d*xk之间的模糊关系fjk,具体为:
其中,γ∈[-1,0]。
进一步地,S3对于任一样本点d*xj,其局部密度ρj的计算方法为:
其中,dc为截断距离。
进一步地,S3对于任一样本点d*xj,其相对距离δj的计算方法为:
如果d*xj为非最大局部密度点,其相对距离δj为:
此时δj由距离d*xj最近的邻居d*xk确定,且d*xk具有相对较大的局部密度值;
如果d*xj为最大局部密度点,则其相对距离δj记作δmax,表示为:
δmax=maxk(fjk)。
进一步地,S3中所述聚类中心的识别过程为:首先绘制二维决策图,其横纵坐标分别对应于ρ和δ;其次,将所有样本点映射到决策图中,任意一个点d*xj的位置由ρj和δj所确定,最后,通过识别决策图中右上角ρj和δj同时较大的样本点成为聚类中心;
所述非中心点的分配原则为该点与其距离最近的点同簇,且该近邻点具有较大的局部密度。
进一步地,S4中所述不确定性样本点的定义为:对于任意的样本点d*xj,如果其相对样本点d*xk与最近邻样本点d*xq在初阶共识聚类结果πθ中所在的簇不一致,则样本点d*xj为不确定性样本点,其中,相对样本点d*xk为获得点d*xj的相对距离δj时定位到的点。
进一步地,所述再分配策略的实施过程为:
Step1:构建对应于所有样本点{d*x1,d*x2,…d*xN}的两个向量,一个向量储存的是相对样本点对应的簇标签,另一个向量储存的是最近邻样本点对应的簇标签;
Step2:将两个向量对应位置簇标签值不一致的不确定性样本点挑出放到集合Q中;
Step3:计算πθ中每个簇的均值向量其中C*为πθ的类簇数;利用所述γ-模糊算子/>评估Q中每个不确定性点与Vmv中所有均值向量之间的模糊关系;
Step4:利用最大隶属度原则将不确定性点分配给与其具有最大模糊关系的类簇。
进一步地,所述γ-模糊算子需满足的基本条件的证明方法为:
推论1:构造的γ-模糊算子为S三角模,需满足S三角模中的四个基本条件:
(1)交换律:S(u,v)=S(v,u);
(2)结合律:S(S(u,v),p)=S(u,S(v,p));
(3)单调性:若u1≤u2,v1≤v2,则S(u1,v1)≤S(u2,v2);
(4)边界条件:S(u,0)=u;
证明:(1)交换律:对于则有:
即S(u,v)=S(v,u);
(2)结合律:对于则有:
即S(S(u,v),p)=S(u,S(v,p));
(3)单调性:对于且u1≤u2,v1≤v2,则有:
又∵γ∈[-1,0],∴上式即S(u1,v1)≤S(u2,v2);
(4)边界条件:对于有:
即S(u,0)=u,得证。
相较于现有技术,本发明的有益效果是:
本发明是一种基于模糊自洽式聚类集成的高熵合金硬度预测方法,将基聚类结果作为样本点特征,将基聚类结果缩放的哑变量表示作为原始数据点的新特征,根本上消除无实际意义的类簇标签值对样本点间实际关系的影响,并消除了基聚类结果间划分差异对集成结果准确性的影响。本发明设计了一种可根据实际问题的不确定性调节耦合强度模糊算子,并首次从模糊算子的角度重新审视了CE问题中对象间的模糊关系,有效地提升了CE模型对模糊关系的处理能力。针对集成结果中的模糊对象提出了一种再分配策略以获得更高质量的终阶集成结果;本发明方法有效地强化了传统CE方法处理模糊关系的能力和鲁棒性。
附图说明
图1为本发明实施例中模糊自洽式聚类集成完成聚类的整体流程图;
图2为本发明实施例中将基聚类结果进行缩放加权的哑变量表示的流程图;
图3为本发明实施例中多个模型硬度预测结果对比图,其中,从上向下依次为线性SVR模型、SKTDPC+线性SVR模型、BCESF-DSC+线性SVR模型以及本发明方法,在90%训练集、10%测试集下运行40次的平均预测结果与实验结果的拟合情况图;
图4为本发明实施例中多个模型硬度预测结果对比图,其中,从上向下依次为线性SVR模型、SKTDPC+线性SVR模型、BCESF-DSC+线性SVR模型以及本发明方法,在80%训练集、20%测试集下运行40次的平均预测结果与实验结果的拟合情况图;
图5为本发明实施例中多个模型硬度预测结果对比图,其中,从上向下依次为线性SVR模型、SKTDPC+线性SVR模型、BCESF-DSC+线性SVR模型以及本发明方法,在70%训练集、30%测试集下运行40次的平均预测结果与实验结果的拟合情况图。
具体实施方式
在本发明的描述中,应当说明的是,在本发明的实施例中所提到的术语“第一”、“第二”、“第三”仅用于描述目的,并不能理解为指示或暗示相对重要性或者隐含指明所指示的技术特征的数量。由此,限定有“第一”、“第二”、“第三”的特征可以明示或者隐含地包括一个或者多个该特征。
为使本发明的上述目的、特征和优点能够更为明显易懂,下面结合附图对本发明的具体实施例做详细的说明。
结合图1至图2所示,本发明提供一种基于模糊自洽式聚类集成的高熵合金硬度预测方法,包括如下步骤:
S1、针对高熵合金数据集,采用基聚类算法对数据集进行多次划分,生成基聚类结果,将基聚类结果作为样本点特征,将基聚类结果采用哑变量的形式表示,再对结果进行缩放的加权处理,得到原始数据缩放的哑变量特征表示。
S1具体包括如下步骤:
S11、针对高熵合金数据集DX={dx1,dx2,…,dxN},其中N是样本数量,通过基聚类算法{A1,A2,…,AL}对数据集DX进行L次划分,得到基聚类结果矩阵其中πij表示第i个划分对第j个样本点分配的标签值,即第i个划分下的基聚类结果和类簇个数分别为/>和|C(ri)|,将基聚类结果作为样本点特征;
S12、将基聚类结果采用哑变量的形式表示,即对于任意一个样本点dxj,表示为:
其中,的长度为|C(ri)|,从左到右每个位置的值依次代表第1簇至第|C(ri)|簇,/>只有在第πij个位置的值为1,其余位置的值均为0;
S13、在S12的基础上对基聚类结果进行缩放的加权处理,其缩放系数ωi基于DBI(Davies-Bouldin)指数,具体形式为:
其中,DBIi为第i个划分下基聚类结果的DBI指标得分,其值越小表示聚类效果越好;
则样本点dxj表示为:
其中,的长度为|C(ri)|,从左到右每个位置的值依次代表第1簇至第|C(ri)|簇,/>只有在第πij个位置的值为ωi,其余位置的值均为0;
最终得到原始数据缩放的哑变量特征表示。
S12的处理方式可以从根本上消除无实际意义的类簇标签值对样本点间关系远近的影响。现有方法默认所有基聚类结果的贡献力是恒等的,但是,在实际随机生成的多个基聚类结果间一定存在着或多或少的划分差异;为了对原始数据更准确地刻画,S13将所有的基聚类结果赋予各自的缩放系数ω,采用缩放系数ωi衡量第i个基聚类结果的贡献力。
S2、采用模糊算子定义所述缩放的哑变量特征表示下任意两个样本点之间的模糊关系,得到所有样本点构成的关系矩阵。
所述模糊算子的定义为:
设映射S:[0,1]2→[0,1],对于有γ-模糊算子/>
所述γ-模糊算子需满足的基本条件的证明方法为:
推论1:构造的γ-模糊算子为S三角模,需满足S三角模中的四个基本条件:
(1)交换律:S(u,v)=S(v,u);
(2)结合律:S(S(u,v),p)=S(u,S(v,p));
(3)单调性:若u1≤u2,v1≤v2,则S(u1,v1)≤S(u2,v2);
(4)边界条件:S(u,0)=u;
证明:(1)交换律:对于则有:
即S(u,v)=S(v,u);
(2)结合律:对于则有:
即S(S(u,v),p)=S(u,S(v,p));
(3)单调性:对于且u1≤u2,v1≤v2,则有:
又∵γ∈[-1,0],∴上式即S(u1,v1)≤S(u2,v2);
(4)边界条件:对于有:
即S(u,0)=u,得证。
S2中采用γ-模糊算子定义任意两个样本点d*xj和d*xk之间的模糊关系fjk,具体为:
其中,γ∈[-1,0]。
fjk的值越小,表示样本点d*xj和d*xk的距离越近,即两者之间的吸引力越强。此外,γ在不同的取值下两者之间的耦合强度也会随之改变。一般来说,当数据集中存在较多不确定的数据点时,γ往往取值会偏小一点。反之,γ取值则会偏大一点。
所述γ-模糊算子属于参数化类型的模糊算子。该算子在实际应用中具有较强的可伸缩性,可根据实际问题需要通过调节参数γ来控制模糊算子的耦合强度。因此,在CE模型的设计中引入γ-模糊算子/>能够有效地提升其对模糊关系的处理能力,进而改善CE模型的聚类效果和泛化能力。
S3、将关系矩阵作为共识策略的输入,基于所述关系矩阵计算各样本点的局部密度和相对距离,基于局部密度和相对距离识别聚类中心和分配非中心点,得到初阶共识聚类结果πθ。
对于任一样本点d*xj,其局部密度ρj的计算方法为:
其中,dc为截断距离,是该共识策略的唯一超参数。
对于任一样本点d*xj,其相对距离δj的计算方法为:
如果d*xj为非最大局部密度点,其相对距离δj为:
此时δj由距离d*xj最近的邻居d*xk确定,且d*xk具有相对较大的局部密度值;
如果d*xj为最大局部密度点,则其相对距离δj记作δmax,表示为:
δmax=maxk(fjk)。
S3中所述聚类中心的识别过程为:首先绘制二维决策图,其横纵坐标分别对应于ρ和δ;其次,将所有样本点映射到决策图中,任意一个点d*xj的位置由ρj和δj所确定,最后,通过识别决策图中右上角ρj和δj同时较大的样本点成为聚类中心;
所述非中心点的分配原则为该点与其距离最近的点同簇,且该近邻点具有较大的局部密度。
S4、构建再分配策略对初阶共识聚类结果中的不确定性样本点进行修正,得到终阶共识聚类结果π*。
考虑到不管在共识过程中使用哪种类型的处理策略,在分配类簇标签时都不可避免的会出现不同程度的模糊现象。也就是说,在初阶共识聚类结果πθ中仍然存在着某些具有不确定性的样本点。这些不确定性点需要一种有效的处理方式对其重新分配,以获得稳定且准确的共识结果。因此,本发明设计了一种能够降低不确定性、提高聚类效果的再分配策略。
首先,对所述不确定性样本点的定义为:对于任意的样本点d*xj,如果其相对样本点d*xk与最近邻样本点d*xq在初阶共识聚类结果πθ中所在的簇不一致,则样本点d*xj为不确定性样本点,其中,相对样本点d*xk为获得点d*xj的相对距离δj时定位到的点。
所述再分配策略的实施过程为:
Step1:构建对应于所有样本点{d*x1,d*x2,…d*xN}的两个向量,一个向量储存的是相对样本点对应的簇标签,另一个向量储存的是最近邻样本点对应的簇标签;
Step2:将两个向量对应位置簇标签值不一致的不确定性样本点挑出放到集合Q中;
Step3:计算πθ中每个簇的均值向量其中C*为πθ的类簇数;利用所述γ-模糊算子/>评估Q中每个不确定性点与Vmv中所有均值向量之间的模糊关系;
Step4:利用最大隶属度原则将不确定性点分配给与其具有最大模糊关系的类簇。
以此完成对不确定性点的修正,得到终阶共识聚类结果π*。
S5、将终阶共识聚类结果中的不同类簇各自建立回归模型,进行高熵合金硬度预测计算。
S5中所采用的回归模型为线性SVR模型。
为验证本发明方法的准确性,针对一个包含601个样本点的高熵合金数据集,样本点特征参数类型为:相位参数、力学参数、加工制备参数、元素成分摩尔占比参数。相位参数包括价电子浓度、电负性差、原子半径差、混合焓、混合熵、电子浓度和内聚能;力学参数包括功函数、模量失配、剪切模量差、剪切模量和熔点;加工制备参数包括铸态、增材制造、粉末冶金、加工硬化和均质化;元素成分摩尔占比参数包括锂、镁、铝、硅、钪、钛、钒、铬、锰、铁、镍、钴、铜、锌、锆、铌、钼、锡、铪、钽和钨的摩尔占比。
针对该数据集分别采用线性SVR模型、SKTDPC+线性SVR模型、BCESF-DSC+线性SVR模型以及本发明方法对数据集中样本点进行硬度预测。其中SVR模型即将数据集直接采用SVR算法进行高熵合金硬度预测;SKTDPC+线性SVR模型基于背景技术中“一种基于改进密度峰值聚类算法的高熵合金硬度预测方法”,BCESF-DSC+线性SVR模型基于背景技术中“一种基于三种共识策略的双粒度聚类集成算法的高熵合金硬度预测方法”,本发明方法及各模型的预测结果如图3、图4和图5所示。
从上述的对比结果图可以非常直观地看到,在不同的训练集与测试集的分配比例下,本发明方法的预测能力相较于原始SVR模型有大幅度的提升,R2已经实现了高达50%左右的提升。此外,本发明方法相比相较于现有的预测能力较强的SKTDPC+线性SVR模型、BCESF-DSC+线性SVR模型R2也呈现出13%和8%左右的提升。值得注意的是,当某一类方法逐渐发展成熟到达一定高度时,往往模型性能的提升幅度会随之变得越来越小,相对应的提升难度也随之飙升。在这种情况下,本发明所提出的方法还能够突破百分之十几的指标值是极其艰难的。此外,还可以发现,本发明方法在不同的实验设置下均呈现出很稳定的预测效果。而且本发明方法的思想具有普适性,当遇到与本发明研究内容类似的情况时,可以考虑将该方法与其它回归模型结合,以从根本上提高模型的预测能力。
虽然本发明公开披露如上,但本发明公开的保护范围并非仅限于此。本发明领域技术人员在不脱离本发明公开的精神和范围的前提下,可进行各种变更与修改,这些变更与修改均将落入本发明的保护范围。
Claims (7)
1.一种基于模糊自洽式聚类集成的高熵合金硬度预测方法,其特征在于包括如下步骤:
S1、针对高熵合金数据集,采用基聚类算法对数据集进行多次划分,生成基聚类结果,将基聚类结果作为样本点特征,将基聚类结果采用哑变量的形式表示,再对结果进行缩放的加权处理,得到原始数据缩放的哑变量特征表示;
S1具体包括如下步骤:
S11、针对高熵合金数据集DX={dx1,dx2,...,dxN},其中N是样本数量,通过基聚类算法{A1,A2,...,AL}对数据集DX进行L次划分,得到基聚类结果矩阵其中πij表示第i个划分对第j个样本点分配的标签值,即第i个划分下的基聚类结果和类簇个数分别为和|C(ri)|,将基聚类结果作为样本点特征;
S12、将基聚类结果采用哑变量的形式表示,即对于任意一个样本点dxj,表示为:
其中,的长度为|C(ri)|,从左到右每个位置的值依次代表第1簇至第|C(ri)|簇,/>只有在第πij个位置的值为1,其余位置的值均为0;
S13、在S12的基础上对基聚类结果进行缩放的加权处理,其缩放系数ωi基于DBI指数,具体形式为:
其中,DBIi为第i个划分下基聚类结果的DBI指标得分;
则样本点dxj表示为:
其中,的长度为|C(ri)|,从左到右每个位置的值依次代表第1簇至第|C(ri)|簇,只有在第πij个位置的值为ωi,其余位置的值均为0;
最终得到原始数据缩放的哑变量特征表示;
S2、采用模糊算子定义所述缩放的哑变量特征表示下任意两个样本点之间的模糊关系,得到所有样本点构成的关系矩阵;
所述模糊算子的定义为:
设映射S:[0,1]2→[0,1],对于γ∈[-1,0],有γ-模糊算子/>
采用γ-模糊算子定义任意两个样本点d*xj和d*xk之间的模糊关系fjk,具体为:
其中,γ∈[-1,0];
S3、将关系矩阵作为共识策略的输入,基于所述关系矩阵计算各样本点的局部密度和相对距离,基于局部密度和相对距离识别聚类中心和分配非中心点,得到初阶共识聚类结果πθ;
S4、构建再分配策略对初阶共识聚类结果中的不确定性样本点进行修正,得到终阶共识聚类结果π*;
S5、将终阶共识聚类结果中的不同类簇各自建立回归模型,进行高熵合金硬度预测计算。
2.根据权利要求1所述的方法,其特征在于S3对于任一样本点d*xj,其局部密度ρj的计算方法为:
其中,dc为截断距离。
3.根据权利要求2所述的方法,其特征在于S3对于任一样本点d*xj,其相对距离δj的计算方法为:
如果d*xj为非最大局部密度点,其相对距离δj为:
此时δj由距离d*xj最近的邻居d*xk确定,且d*xk具有相对较大的局部密度值;
如果d*xj为最大局部密度点,则其相对距离δj记作δmax,表示为:
δmax=maxk(fjk)。
4.根据权利要求3所述的方法,其特征在于S3中所述聚类中心的识别过程为:首先绘制二维决策图,其横纵坐标分别对应于ρ和δ;其次,将所有样本点映射到决策图中,任意一个点d*xj的位置由ρj和δj所确定,最后,通过识别决策图中右上角ρj和δj同时较大的样本点成为聚类中心;
所述非中心点的分配原则为该点与其距离最近的点同簇,且该近邻点具有较大的局部密度。
5.根据权利要求4所述的方法,其特征在于S4中所述不确定性样本点的定义为:对于任意的样本点d*xj,如果其相对样本点d*xk与最近邻样本点d*xq在初阶共识聚类结果πθ中所在的簇不一致,则样本点d*xj为不确定性样本点,其中,相对样本点d*xk为获得点d*xj的相对距离δj时定位到的点。
6.根据权利要求5所述的方法,其特征在于所述再分配策略的实施过程为:
step1:构建对应于所有样本点{d*x1,d*x2,...d*xN}的两个向量,一个向量储存的是相对样本点对应的簇标签,另一个向量/>储存的是最近邻样本点对应的簇标签;
Step2:将两个向量对应位置簇标签值不一致的不确定性样本点挑出放到集合Q中;
Step3:计算πθ中每个簇的均值向量其中C*为πθ的类簇数;利用所述γ-模糊算子/>评估Q中每个不确定性点与Vmv中所有均值向量之间的模糊关系;
Step4:利用最大隶属度原则将不确定性点分配给与其具有最大模糊关系的类簇。
7.根据权利要求1所述的方法,其特征在于所述γ-模糊算子需满足的基本条件的证明方法为:
推论1:构造的γ-模糊算子为S三角模,需满足S三角模中的四个基本条件:
(1)交换律:S(u,v)=S(v,u);
(2)结合律:S(S(u,v),p)=S(u,S(v,p));
(3)单调性:若u1≤u2,v1≤v2,则S(u1,v1)≤S(u2,v2);
(4)边界条件:S(u,0)=u;
证明:(1)交换律:对于则有:
即S(u,v)=S(v,u);
(2)结合律:对于则有:
即S(S(u,v),p)=S(u,S(v,p));
(3)单调性:对于且u1≤u2,v1≤v2,则有:
又∵γ∈[-1,0],∴上式即S(u1,v1)≤S(u2,v2);
(4)边界条件:对于有:
即S(u,0)=u,得证。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202310204380.XA CN116434880B (zh) | 2023-03-06 | 2023-03-06 | 一种基于模糊自洽式聚类集成的高熵合金硬度预测方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202310204380.XA CN116434880B (zh) | 2023-03-06 | 2023-03-06 | 一种基于模糊自洽式聚类集成的高熵合金硬度预测方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN116434880A CN116434880A (zh) | 2023-07-14 |
CN116434880B true CN116434880B (zh) | 2023-09-08 |
Family
ID=87093317
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202310204380.XA Active CN116434880B (zh) | 2023-03-06 | 2023-03-06 | 一种基于模糊自洽式聚类集成的高熵合金硬度预测方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN116434880B (zh) |
Citations (13)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN105986024A (zh) * | 2015-02-27 | 2016-10-05 | 复旦大学附属肿瘤医院 | 一组用于三阴性乳腺癌预后的基因及其应用 |
CN107103336A (zh) * | 2017-04-28 | 2017-08-29 | 温州职业技术学院 | 一种基于密度峰值的混合属性数据聚类方法 |
CN110263227A (zh) * | 2019-05-15 | 2019-09-20 | 阿里巴巴集团控股有限公司 | 基于图神经网络的团伙发现方法和*** |
CN110415111A (zh) * | 2019-08-01 | 2019-11-05 | 信雅达***工程股份有限公司 | 基于用户数据与专家特征合并逻辑回归信贷审批的方法 |
CN111088490A (zh) * | 2020-01-11 | 2020-05-01 | 贵州大学 | 一种高硬度高耐磨性的高熵合金涂层及其制备方法 |
CN112216356A (zh) * | 2020-10-22 | 2021-01-12 | 哈尔滨理工大学 | 一种基于机器学习的高熵合金硬度预测方法 |
CN113240506A (zh) * | 2021-05-10 | 2021-08-10 | 浙江大学 | 一种基于无监督领域自适应的金融风控冷启动建模方法 |
CN114093440A (zh) * | 2021-11-16 | 2022-02-25 | 昆明理工大学 | 一种基于深度学习预测高熵合金硬度的方法 |
WO2022117664A1 (en) * | 2020-12-04 | 2022-06-09 | Thiry Cedric Robert | Computer implemented engineering materials mechanical property based search method |
CN114613456A (zh) * | 2022-03-07 | 2022-06-10 | 哈尔滨理工大学 | 一种基于改进密度峰值聚类算法的高熵合金硬度预测方法 |
CN114807720A (zh) * | 2022-04-18 | 2022-07-29 | 贵州大学 | 一种耐强酸冲蚀的磷酸反应槽搅拌桨叶片修复用高熵合金涂层及其制备方法 |
CN115394381A (zh) * | 2022-08-24 | 2022-11-25 | 哈尔滨理工大学 | 一种基于机器学习和两步法数据扩充的高熵合金硬度预测方法及装置 |
CN115691700A (zh) * | 2022-11-09 | 2023-02-03 | 哈尔滨理工大学 | 一种基于三种共识策略的双粒度聚类集成算法的高熵合金硬度预测方法 |
Family Cites Families (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20230011781A1 (en) * | 2021-07-01 | 2023-01-12 | Divergent Technologies, Inc. | Al-mg-si based near-eutectic alloy composition for high strength and stiffness applications |
-
2023
- 2023-03-06 CN CN202310204380.XA patent/CN116434880B/zh active Active
Patent Citations (13)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN105986024A (zh) * | 2015-02-27 | 2016-10-05 | 复旦大学附属肿瘤医院 | 一组用于三阴性乳腺癌预后的基因及其应用 |
CN107103336A (zh) * | 2017-04-28 | 2017-08-29 | 温州职业技术学院 | 一种基于密度峰值的混合属性数据聚类方法 |
CN110263227A (zh) * | 2019-05-15 | 2019-09-20 | 阿里巴巴集团控股有限公司 | 基于图神经网络的团伙发现方法和*** |
CN110415111A (zh) * | 2019-08-01 | 2019-11-05 | 信雅达***工程股份有限公司 | 基于用户数据与专家特征合并逻辑回归信贷审批的方法 |
CN111088490A (zh) * | 2020-01-11 | 2020-05-01 | 贵州大学 | 一种高硬度高耐磨性的高熵合金涂层及其制备方法 |
CN112216356A (zh) * | 2020-10-22 | 2021-01-12 | 哈尔滨理工大学 | 一种基于机器学习的高熵合金硬度预测方法 |
WO2022117664A1 (en) * | 2020-12-04 | 2022-06-09 | Thiry Cedric Robert | Computer implemented engineering materials mechanical property based search method |
CN113240506A (zh) * | 2021-05-10 | 2021-08-10 | 浙江大学 | 一种基于无监督领域自适应的金融风控冷启动建模方法 |
CN114093440A (zh) * | 2021-11-16 | 2022-02-25 | 昆明理工大学 | 一种基于深度学习预测高熵合金硬度的方法 |
CN114613456A (zh) * | 2022-03-07 | 2022-06-10 | 哈尔滨理工大学 | 一种基于改进密度峰值聚类算法的高熵合金硬度预测方法 |
CN114807720A (zh) * | 2022-04-18 | 2022-07-29 | 贵州大学 | 一种耐强酸冲蚀的磷酸反应槽搅拌桨叶片修复用高熵合金涂层及其制备方法 |
CN115394381A (zh) * | 2022-08-24 | 2022-11-25 | 哈尔滨理工大学 | 一种基于机器学习和两步法数据扩充的高熵合金硬度预测方法及装置 |
CN115691700A (zh) * | 2022-11-09 | 2023-02-03 | 哈尔滨理工大学 | 一种基于三种共识策略的双粒度聚类集成算法的高熵合金硬度预测方法 |
Non-Patent Citations (1)
Title |
---|
模糊积分和控制理论的研究及在自吸泵中的应用;单云霄;《中国优秀硕士学位论文全文数据库 工程科技II辑》;第C029-493页 * |
Also Published As
Publication number | Publication date |
---|---|
CN116434880A (zh) | 2023-07-14 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN108447062A (zh) | 一种基于多尺度混合分割模型的病理切片非常规细胞的分割方法 | |
CN109145921B (zh) | 一种基于改进的直觉模糊c均值聚类的图像分割方法 | |
CN110232414A (zh) | 基于k近邻与共享近邻的密度峰值聚类算法 | |
CN108280472A (zh) | 一种基于局部密度和聚类中心优化的密度峰聚类方法 | |
CN114613456B (zh) | 一种基于改进密度峰值聚类算法的高熵合金硬度预测方法 | |
Couceiro et al. | Accuracy of pattern detection methods in the performance of golf putting | |
CN111784595B (zh) | 一种基于历史记录的动态标签平滑加权损失方法及装置 | |
CN111626321B (zh) | 一种图像数据的聚类方法及装置 | |
CN110197113B (zh) | 一种高精度锚点匹配策略的人脸检测方法 | |
CN110059730A (zh) | 一种基于胶囊网络的甲状腺结节超声图像分类方法 | |
CN116434880B (zh) | 一种基于模糊自洽式聚类集成的高熵合金硬度预测方法 | |
CN111428764B (zh) | 一种用于图像类别识别的图像聚类方法 | |
Azad et al. | Loss functions in the era of semantic segmentation: A survey and outlook | |
CN113298184B (zh) | 用于小样本图像识别的样本抽取、扩充方法及存储介质 | |
CN110222772A (zh) | 一种基于块级别主动学习的医疗图像标注推荐方法 | |
CN111126403B (zh) | 一种基于磁共振血管造影图像的脑血管分割方法和*** | |
CN113642668A (zh) | 基于改进麻雀搜索算法的抑制式粗糙直觉模糊聚类方法 | |
CN115691700B (zh) | 一种基于三种共识策略的双粒度聚类集成算法的高熵合金硬度预测方法 | |
CN116523877A (zh) | 一种基于卷积神经网络的脑mri图像肿瘤块分割方法 | |
CN110070120B (zh) | 基于判别采样策略的深度度量学习方法及*** | |
CN108182684B (zh) | 一种基于加权核函数模糊聚类的图像分割方法及其装置 | |
CN113296947B (zh) | 基于改进XGBoost模型的资源需求预测方法 | |
CN113469270B (zh) | 基于分解多目标差分进化超像素的半监督直觉聚类方法 | |
US11645827B2 (en) | Detection method and device for assembly body multi-view change based on feature matching | |
CN112508844B (zh) | 一种基于弱监督的大脑磁共振图像分割方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |