CN114495096A - 一种细胞分类模型的获取方法和装置 - Google Patents

一种细胞分类模型的获取方法和装置 Download PDF

Info

Publication number
CN114495096A
CN114495096A CN202011148471.9A CN202011148471A CN114495096A CN 114495096 A CN114495096 A CN 114495096A CN 202011148471 A CN202011148471 A CN 202011148471A CN 114495096 A CN114495096 A CN 114495096A
Authority
CN
China
Prior art keywords
classification model
distance
cell classification
feature maps
obtaining
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202011148471.9A
Other languages
English (en)
Inventor
沈立松
杨俊瑶
曾亮
马娟
曾俊祥
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
XinHua Hospital Affiliated To Shanghai JiaoTong University School of Medicine
Original Assignee
XinHua Hospital Affiliated To Shanghai JiaoTong University School of Medicine
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by XinHua Hospital Affiliated To Shanghai JiaoTong University School of Medicine filed Critical XinHua Hospital Affiliated To Shanghai JiaoTong University School of Medicine
Priority to CN202011148471.9A priority Critical patent/CN114495096A/zh
Priority to PCT/CN2021/080290 priority patent/WO2022083047A1/zh
Publication of CN114495096A publication Critical patent/CN114495096A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/045Combinations of networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/70Arrangements for image or video recognition or understanding using pattern recognition or machine learning
    • G06V10/82Arrangements for image or video recognition or understanding using pattern recognition or machine learning using neural networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V20/00Scenes; Scene-specific elements
    • G06V20/60Type of objects
    • G06V20/69Microscopic objects, e.g. biological cells or cellular parts

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Health & Medical Sciences (AREA)
  • Evolutionary Computation (AREA)
  • General Health & Medical Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Artificial Intelligence (AREA)
  • Biomedical Technology (AREA)
  • Software Systems (AREA)
  • Molecular Biology (AREA)
  • Computing Systems (AREA)
  • Biophysics (AREA)
  • General Engineering & Computer Science (AREA)
  • Mathematical Physics (AREA)
  • Data Mining & Analysis (AREA)
  • Computational Linguistics (AREA)
  • Multimedia (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Databases & Information Systems (AREA)
  • Medical Informatics (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Image Analysis (AREA)

Abstract

本申请实施例公开了一种细胞分类模型的获取方法和装置,该方法包括:获取训练好的细胞分类模型;根据测试数据和所述细胞分类模型获取待分类目标的M个特征图;M为大于或等于1的正整数;所述测试数据包括一个或多个待分类目标;获取所述M个特征图的权重;将具有权重的M个特征图输入所述细胞分类模型,对细胞分类模型进行优化,从而获取最优细胞分类模型。通过该实施例方案,实现了对类间差距小的目标进行分类,提高了分类效率和准确率。

Description

一种细胞分类模型的获取方法和装置
技术领域
本文涉及分类技术,尤指一种细胞分类模型的获取方法和装置。
背景技术
目前,存在多种类间差距小的物体需要进一步分类,但是采用常规的分类方法或分类模型很难实现类间距离小的目标的准确分类,此类物体大部分仍是通过人工分类来实现,例如白细胞分类,目前仍依靠人工镜检,临床工作量大,人工工作效率低,易导致由于疲劳产生的错误,从而使得准确率低。
发明内容
本申请实施例提供了一种细胞分类模型的获取方法和装置,能够实现对类间差距小的目标进行分类,提高分类效率和准确率。
本申请实施例提供了一种细胞分类模型的获取方法,所述方法可以包括:
获取训练好的细胞分类模型;
根据测试数据和所述细胞分类模型获取待分类目标的M个特征图;M为大于或等于1的正整数;所述测试数据包括一个或多个待分类目标;
获取所述M个特征图的权重;
将具有权重的M个特征图输入所述细胞分类模型,对所述细胞分类模型进行优化,从而获取最优细胞分类模型。
在本申请的示例性实施例中,所述根据测试数据和所述细胞分类模型获取待分类目标的M个特征图可以包括:
将测试数据输入所述细胞分类模型,获取所述细胞分类模型的输出结果,并从所述输出结果中区分出正确分类结果和错误分类结果;
将所述正确分类结果输入所述细胞分类模型,通过所述细胞分类模型对所述正确分类结果进行特征提取,获取所述M个特征图。
在本申请的示例性实施例中,所述获取所述M个特征图的权重可以包括:
对所述M个特征图进行特征分类;
根据所述特征分类计算所述M个特征图的权重。
在本申请的示例性实施例中,所述对所述M个特征图进行分类可以包括:
以迭代的形式从所述M个特征图中依次选出多组特征图作为簇中心,每组特征图包括a个特征图,所述a个特征图分别作为当次迭代的簇中心,所述M个特征图中未被选取的b个特征图作为非簇中心;a+b=M,a、b均为正整数;
在每次迭代中,将每个特征图作为一维向量,计算每个簇中心对应的向量与每一个非簇中心对应的向量之间的距离;并将当次迭代计算出的全部距离按照距离大小划分为N个距离区间,每个距离区间作为一个特征分类;N为大于或等于2的正整数;
直至计算出任意两个特征图之间的距离,并获取全部所述M个特征图所属的距离区间,停止迭代。
在本申请的示例性实施例中,所述以迭代的形式从所述M个特征图中依次选出多组特征图作为簇中心可以包括:
在初次迭代中,从所述M个特征图中随机选取a个特征图作为簇中心;并在每次迭代过程中,根据预设的概率算法计算作为非簇中心的b个特征图中每个特征图被选取为下一次迭代过程中的簇中心的概率;在下一次迭代过程中,选取概率最高的a个特征图作为簇中心。
在本申请的示例性实施例中,所述概率算法可以包括:
在每次迭代中计算每一个非簇中心对应的向量与b个非簇中心中任意的第i个非簇中心b(i)对应的向量之间的距离,从计算出的关于第i个非簇中心b(i)的全部距离中选出最小距离dmin(i),并计算所述最小距离dmin(i)与所述关于第i个非簇中心b(i)的全部距离之和的比值,将所述比值作为第i个非簇中心b(i)被选取为下一次迭代过程中的簇中心的概率;i为正整数,1≤i≤b。
在本申请的示例性实施例中,所述根据所述特征分类计算所述M个特征图的权重可以包括:
根据每个距离区间内所包含距离的大小赋予每个距离区间不同大小的权重;并相应赋予每个距离区间内所包含的特征图相应的权重;
其中,每个距离区间内所包含的距离值越大,该距离区间被赋予的权重越高,该距离区间内所包含的特征图被赋予的权重越高;每个距离区间内所包含的距离值越小,该距离区间被赋予的权重越低,该距离区间内所包含的特征图被赋予的权重越低。
在本申请的示例性实施例中,所述方法还可以包括:将全部权重归一化到0至1之间。
在本申请的示例性实施例中,所述获取训练好的细胞分类模型可以包括:
采用预设的训练数据对预先构建的用于分类的卷积神经网络CNN进行训练,获取所述细胞分类模型;
其中,所述训练数据为预先将所述待分类目标进行分类获取的正确分类结果。
本申请实施例还提供了一种细胞分类模型的获取装置,可以包括处理器和计算机可读存储介质,所述计算机可读存储介质中存储有指令,当所述指令被所述处理器执行时,实现上述任意一项所述的细胞分类模型的获取方法。
本申请实施例包括:获取训练好的细胞分类模型;根据测试数据和所述细胞分类模型获取待分类目标的M个特征图;M为大于或等于1的正整数;所述测试数据包括一个或多个待分类目标;获取所述M个特征图的权重;将具有权重的M个特征图输入所述细胞分类模型,对所述细胞分类模型进行优化,从而获取最优细胞分类模型。通过该实施例方案,实现了对类间差距小的目标进行分类,提高了分类效率和准确率。
本申请的其它特征和优点将在随后的说明书中阐述,并且,部分地从说明书中变得显而易见,或者通过实施本申请而了解。本申请的其他优点可通过在说明书以及附图中所描述的方案来实现和获得。
附图说明
附图用来提供对本申请技术方案的理解,并且构成说明书的一部分,与本申请的实施例一起用于解释本申请的技术方案,并不构成对本申请技术方案的限制。
图1为本申请实施例的细胞分类模型的获取方法流程图;
图2为本申请实施例的细胞分类模型的获取方法示意图;
图3为本申请实施例的细胞分类模型的获取装置组成框图。
具体实施方式
本申请描述了多个实施例,但是该描述是示例性的,而不是限制性的,并且对于本领域的普通技术人员来说显而易见的是,在本申请所描述的实施例包含的范围内可以有更多的实施例和实现方案。尽管在附图中示出了许多可能的特征组合,并在具体实施方式中进行了讨论,但是所公开的特征的许多其它组合方式也是可能的。除非特意加以限制的情况以外,任何实施例的任何特征或元件可以与任何其它实施例中的任何其他特征或元件结合使用,或可以替代任何其它实施例中的任何其他特征或元件。
本申请包括并设想了与本领域普通技术人员已知的特征和元件的组合。本申请已经公开的实施例、特征和元件也可以与任何常规特征或元件组合,以形成由权利要求限定的独特的发明方案。任何实施例的任何特征或元件也可以与来自其它发明方案的特征或元件组合,以形成另一个由权利要求限定的独特的发明方案。因此,应当理解,在本申请中示出和/或讨论的任何特征可以单独地或以任何适当的组合来实现。因此,除了根据所附权利要求及其等同替换所做的限制以外,实施例不受其它限制。此外,可以在所附权利要求的保护范围内进行各种修改和改变。
此外,在描述具有代表性的实施例时,说明书可能已经将方法和/或过程呈现为特定的步骤序列。然而,在该方法或过程不依赖于本文所述步骤的特定顺序的程度上,该方法或过程不应限于所述的特定顺序的步骤。如本领域普通技术人员将理解的,其它的步骤顺序也是可能的。因此,说明书中阐述的步骤的特定顺序不应被解释为对权利要求的限制。此外,针对该方法和/或过程的权利要求不应限于按照所写顺序执行它们的步骤,本领域技术人员可以容易地理解,这些顺序可以变化,并且仍然保持在本申请实施例的精神和范围内。
本申请实施例提供了一种细胞分类模型的获取方法,如图1、图2所示,所述方法可以包括步骤S101-S104:
S101、获取训练好的细胞分类模型;
S102、根据测试数据和所述细胞分类模型获取待分类目标的M个特征图;M为大于或等于1的正整数;所述测试数据包括一个或多个待分类目标;
S103、获取所述M个特征图的权重;
S104、将具有权重的M个特征图输入所述细胞分类模型,对所述细胞分类模型进行优化,从而获取最优细胞分类模型。
在本申请的示例性实施例中,白细胞分类是在进行血液显微镜检查时,将白细胞分类计数的一种医学检测法。血液中的白细胞共有五种,即中性粒细胞、嗜酸性粒细胞、嗜碱性粒细胞、淋巴细胞和单核细胞。在骨髓中,分类类型达到40类以上更多,它们各有其生理功能。在环境医学研究中白细胞分类是一项重要的指标。然而。各种白细胞之间的类间差距很小,不易区分,白细胞分类目前依靠人工镜检,临床工作量大,人工工作效率低,易导致由于疲劳产生的错误,采用本申请实施例的最优模型,能够快速、准确地提取出各类细胞,有效提高工作效率和准确度。
在本申请的示例性实施例中,当本申请实施例的最优细胞分类模型用于细胞分类时,测试数据可以为一个或多个待分类的细胞图像,特征图为各种类细胞的一种或多种特征图像。
在本申请的示例性实施例中,本申请实施例的最优细胞分类模型还可以用于汽车品牌分类、同一动植物物种(如羊)的不同类别的划分(如山羊、绵羊、羚羊等)等任何类间差别较小的物体的分类。
在本申请的示例性实施例中,所述获取训练好的细胞分类模型可以包括:
采用预设的训练数据对预先构建的用于分类的卷积神经网络CNN进行训练,获取所述细胞分类模型;
其中,所述训练数据为预先将所述待分类目标进行分类获取的正确分类结果。
在本申请的示例性实施例中,卷积神经网络(Convolutional Neural Networks,CNN)是一类包含卷积计算且具有深度结构的前馈神经网络(Feedforward NeuralNetworks),是深度学习(deep learning)的代表算法之一。卷积神经网络可以由卷积层、池化层等结构组成。
在本申请的示例性实施例中,对于细胞分类来说,该训练数据可以为预先分类好的各种细胞图像。
在本申请的示例性实施例中,单纯通过上述的细胞分类模型对类间差距较大的目标(如自行车和汽车)能够实现准确分类,然而对于前述的各种细胞、各种品牌的汽车、不同品种的羊等这种类间差距娇小的物体进行分类,则不能满足要求,因此,可以对该细胞分类模型进一步优化,获取最优细胞分类模型。
在本申请的示例性实施例中,为了获取最优细胞分类模型,可以通过卷积神经网络CNN提取待分类目标体中每一类物体的特征,并对CNN提取的特征设置特征权重,该特征权重的作用是提高特征筛选的速度和准确率,其中,越是能够显著区分出所述待分类目标的不同种类的特征的权重越大,越是共性的特征,即不能显著区分出所述待分类目标的不同种类的特征的权重越小。
在本申请的示例性实施例中,上述步骤S102-S104为细胞分类模型优化步骤,下面将对每一个优化步骤作详细介绍。
在本申请的示例性实施例中,所述根据测试数据和所述细胞分类模型获取待分类目标的M个特征图可以包括:
将测试数据输入所述细胞分类模型,获取所述细胞分类模型的输出结果,并从所述输出结果中区分出正确分类结果和错误分类结果;
将所述正确分类结果输入所述细胞分类模型,通过所述细胞分类模型对所述正确分类结果进行特征提取,获取所述M个特征图。
在本申请的示例性实施例中,获取的特征图数量M的数量可以根据待分类目标体的种类不同,以及不同物体的区别特征的多少来确定,在此对于M的具体数值不做限定。例如,对于白细胞分类来说,M可以包括几千种。
在本申请的示例性实施例中,所述获取所述M个特征图的权重可以包括:
对所述M个特征图进行特征分类;
根据所述特征分类划分出的N1+N2类特征图计算所述M个特征图的权重。
在本申请的示例性实施例中,对所述M个特征图进行特征分类可以划分出N1+N2类特征图;其中,N1类是指能够区分出所述待分类目标的不同种类的N1个目标特征种类,N2类是指不同种类的待分类目标共同包含的、不能或很难区分出所述待分类目标的不同种类的N2个非目标特征种类;N1和N2均可以为大于或等于1的正整数。
在本申请的示例性实施例中,对于区分出的N1类目标特征种类可以设置较高的权重,对于N2类非目标特征种类可以设置较低的权重。另外,还可以根据不同的目标特征种类以及非目标特征种类的显著性(用于区分不同种类的明显程度的特性,区分的明显程度越高,显著性越高,区分的明显程度越低,显著性越低)高低,分别设置不同的权重,其中,显著性越高,权重越高,显著性越低,权重越低。
在本申请的示例性实施例中,对所述M个特征图进行特征分类可以采用无监督分类方法,也可以采用有监督分类方法,再次对于具体实现方法不做限制。
在本申请的示例性实施例中,下面对无监督分类方法实施例进行详细介绍。
在本申请的示例性实施例中,所述对所述M个特征图进行分类可以包括:
以迭代的形式从所述M个特征图中依次选出多组特征图作为簇中心,每组特征图包括a个特征图,所述a个特征图分别作为当次迭代的簇中心,所述M个特征图中未被选取的b个特征图作为非簇中心;a+b=M,a、b均为正整数;
在每次迭代中,将每个特征图作为一维向量,计算每个簇中心对应的向量与每一个非簇中心对应的向量之间的距离;并将当次迭代计算出的全部距离按照距离大小划分为N个距离区间,每个距离区间作为一个特征分类;N为大于或等于2的正整数;
直至计算出任意两个特征图之间的距离,并获取全部所述M个特征图所属的距离区间,停止迭代。
在本申请的示例性实施例中,a的数值可以根据分类精度不同以及实际需求自行定义。
在本申请的示例性实施例中,所述以迭代的形式从所述M个特征图中依次选出多组特征图作为簇中心可以包括:
在初次迭代中,从所述M个特征图中随机选取a个特征图作为簇中心;并在每次迭代过程中,根据预设的概率算法计算作为非簇中心的b个特征图中每个特征图被选取为下一次迭代过程中的簇中心的概率;在下一次迭代过程中,选取概率最高的a个特征图作为簇中心。
在本申请的示例性实施例中,所述概率算法可以包括:
在每次迭代中计算每一个非簇中心对应的向量与b个非簇中心中任意的第i个非簇中心b(i)对应的向量之间的距离,从计算出的关于第i个非簇中心b(i)的全部距离中选出最小距离dmin(i),并计算所述最小距离dmin(i)与所述关于第i个非簇中心b(i)的全部距离之和的比值,将所述比值作为第i个非簇中心b(i)被选取为下一次迭代过程中的簇中心的概率;i为正整数,1≤i≤b。
在本申请的示例性实施例中,可以从M个特征图中选出a个簇中心C1、C2、……、Ca,并分别计算簇中心C1、C2、……、Ca与b个非簇中心中每一个非簇中心之间的距离,例如,簇中心C1、C2、……、Ca与第i个非簇中心b(i)的距离可以分别记为d[b(i),C1]、d[b(i),C2]、……、d[b(i),Ca],则d[b(i),C1]、d[b(i),C2]、……、d[b(i),Ca]中的最小值可以记为dmin(i),即:dmin(i)=min{d[b(i),C1]、d[b(i),C2]、……、d[b(i),Ca]}。
在本申请的示例性实施例中,在该次迭代中,获取第i个非簇中心b(i)与簇中心C1、C2、……、Ca的最小距离dmin(i)后,可以根据该最小距离dmin(i)计算第i个非簇中心b(i)被选取为下一轮迭代中的簇中心的概率P:
Figure BDA0002740419110000091
在本申请的示例性实施例中,P值越高,可以确定该第i个非簇中心b(i)被选取为下一轮迭代中的簇中心的概率越高,反之,P值越低,可以确定该第i个非簇中心b(i)被选取为下一轮迭代中的簇中心的概率越低。再计算出每一个非簇中心的概率P以后,可以从计算出的多个概率P中选取a个概率P最高的非簇中心作为下一轮迭代的簇中心。
在本申请的示例性实施例中,在每次迭代获取a个簇中心以后,可以在每次迭代中计算出a个簇中心与每个非簇中心的距离,从而可以计算出任意两个特征图之间的距离。
在本申请的示例性实施例中,通过计算任意两个特征图之间的距离,可以确定两个特征图(每个特征图可以代表一种区别特征)之间的相似度,即获取两个区别特征之间的相似度;其中,相似度越小,则说明这两个特征图越能够区分出所述待分类目标的不同种类,相似度越大,则说明这两个特征图区分出所述待分类目标的不同种类的能力越低。
在本申请的示例性实施例中,可以将计算出的不同的距离按照距离的大小划分到不同距离区间内,其中,每个距离区间内包含一定大小的一个或多个距离,不同的距离区间内所包含的距离大小不同。
在本申请的示例性实施例中,不同的距离区间表示具有不同显著性的特征图的集合;所包含的距离值大的距离区间,为显著性较高的特征图的集合,所包含的距离值小的距离区间,为显著性较低的特征图的集合。
在本申请的示例性实施例中,所述根据所述特征分类计算所述M个特征图的权重可以包括:
根据每个距离区间内所包含距离的大小赋予每个距离区间不同大小的权重;并相应赋予每个距离区间内所包含的特征图相应的权重;
其中,每个距离区间内所包含的距离值越大,该距离区间被赋予的权重越高,该距离区间内所包含的特征图被赋予的权重越高;每个距离区间内所包含的距离值越小,该距离区间被赋予的权重越低,该距离区间内所包含的特征图被赋予的权重越低。
在本申请的示例性实施例中,由于所包含的距离值大的距离区间,为显著性较高的特征图的集合,因此,可以将该类距离区间赋予较高的权重,以便于增加该类距离区间内的特征图在特征区分中的重要性,从而可以提高分类速度和准确率;反之,由于所包含的距离值小的距离区间,为显著性较低的特征图的集合,因此,可以将该类距离区间赋予较低的权重,以便于减小该类距离区间内的特征图在特征区分中的重要性,从而减小不利于进行种类区分的特征图在分类过程中的影响力。
在本申请的示例性实施例中,针对不同的距离区间设置不同的权重,相应地对距离区间包含的特征图也赋予相应的权重。对于同一个距离区间包含的多个特征图,可以均赋予相同的权重,也可以根据不同特征图之间的距离大小分别赋予不同的权重。
在本申请的示例性实施例中,具体的权重值可以根据不同的需求自行定义,在此不作具体限制。
在本申请的示例性实施例中,所述方法还可以包括:将全部权重归一化到0至1之间。
在本申请的示例性实施例中,获取全部M个特征图的权重之后,可以获取一个具有M维的权重向量,可以将得到的权重向量中的每一维权重累加求和,并归一化到0~1之间。
在本申请的示例性实施例中,该归一化方法可以包括:针对每一维权重,进行以下计算:
Figure BDA0002740419110000101
其中,Xj指第j维权重,
Figure BDA0002740419110000102
为全部权重之和,j为1到M之间的正整数。
在本申请的示例性实施例中,获取每个特征图的权重之后,可以将具有权重的M个特征图输入所述细胞分类模型,作为所述细胞分类模型进行分类的依据,从而获取最优细胞分类模型。
在本申请的示例性实施例中,将待分类目标体(如细胞、汽车等)的数据(如图像等)输入该最优细胞分类模型,从而可以对待分类目标体进行快速、准确地分类。
本申请实施例还提供了一种细胞分类模型的获取装置1,如图3所示,可以包括处理器11和计算机可读存储介质12,所述计算机可读存储介质12中存储有指令,当所述指令被所述处理器11执行时,实现上述任意一项所述的细胞分类模型的获取方法。
在本申请的示例性实施例中,上述的方法实施例中的任意实施例均适用于该装置实施例中,在此不再一一赘述。
本领域普通技术人员可以理解,上文中所公开方法中的全部或某些步骤、***、装置中的功能模块/单元可以被实施为软件、固件、硬件及其适当的组合。在硬件实施方式中,在以上描述中提及的功能模块/单元之间的划分不一定对应于物理组件的划分;例如,一个物理组件可以具有多个功能,或者一个功能或步骤可以由若干物理组件合作执行。某些组件或所有组件可以被实施为由处理器,如数字信号处理器或微处理器执行的软件,或者被实施为硬件,或者被实施为集成电路,如专用集成电路。这样的软件可以分布在计算机可读介质上,计算机可读介质可以包括计算机存储介质(或非暂时性介质)和通信介质(或暂时性介质)。如本领域普通技术人员公知的,术语计算机存储介质包括在用于存储信息(诸如计算机可读指令、数据结构、程序模块或其他数据)的任何方法或技术中实施的易失性和非易失性、可移除和不可移除介质。计算机存储介质包括但不限于RAM、ROM、EEPROM、闪存或其他存储器技术、CD-ROM、数字多功能盘(DVD)或其他光盘存储、磁盒、磁带、磁盘存储或其他磁存储装置、或者可以用于存储期望的信息并且可以被计算机访问的任何其他的介质。此外,本领域普通技术人员公知的是,通信介质通常包含计算机可读指令、数据结构、程序模块或者诸如载波或其他传输机制之类的调制数据信号中的其他数据,并且可包括任何信息递送介质。

Claims (10)

1.一种细胞分类模型的获取方法,其特征在于,所述方法包括:
获取训练好的细胞分类模型;
根据测试数据和所述细胞分类模型获取待分类目标的M个特征图;M为大于或等于1的正整数;所述测试数据包括一个或多个待分类目标;
获取所述M个特征图的权重;
将具有权重的M个特征图输入所述细胞分类模型,对所述细胞分类模型进行优化,从而获取最优细胞分类模型。
2.根据权利要求1所述的细胞分类模型的获取方法,其特征在于,所述根据测试数据和所述细胞分类模型获取待分类目标的M个特征图包括:
将测试数据输入所述细胞分类模型,获取所述细胞分类模型的输出结果,并从所述输出结果中区分出正确分类结果和错误分类结果;
将所述正确分类结果输入所述细胞分类模型,通过所述细胞分类模型对所述正确分类结果进行特征提取,获取所述M个特征图。
3.根据权利要求1所述的细胞分类模型的获取方法,其特征在于,所述获取所述M个特征图的权重包括:
对所述M个特征图进行特征分类;
根据所述特征分类计算所述M个特征图的权重。
4.根据权利要求3所述的细胞分类模型的获取方法,其特征在于,所述对所述M个特征图进行分类包括:
以迭代的形式从所述M个特征图中依次选出多组特征图作为簇中心,每组特征图包括a个特征图,所述a个特征图分别作为当次迭代的簇中心,所述M个特征图中未被选取的b个特征图作为非簇中心;a+b=M,a、b均为正整数;
在每次迭代中,将每个特征图作为一维向量,计算每个簇中心对应的向量与每一个非簇中心对应的向量之间的距离;并将当次迭代计算出的全部距离按照距离大小划分为N个距离区间,每个距离区间作为一个特征分类;N为大于或等于2的正整数;
直至计算出任意两个特征图之间的距离,并获取全部所述M个特征图所属的距离区间,停止迭代。
5.根据权利要求4所述的细胞分类模型的获取方法,其特征在于,所述以迭代的形式从所述M个特征图中依次选出多组特征图作为簇中心包括:
在初次迭代中,从所述M个特征图中随机选取a个特征图作为簇中心;并在每次迭代过程中,根据预设的概率算法计算作为非簇中心的b个特征图中每个特征图被选取为下一次迭代过程中的簇中心的概率;在下一次迭代过程中,选取概率最高的a个特征图作为簇中心。
6.根据权利要求5所述的细胞分类模型的获取方法,其特征在于,所述概率算法包括:
在每次迭代中计算每一个非簇中心对应的向量与b个非簇中心中任意的第i个非簇中心b(i)对应的向量之间的距离,从计算出的关于第i个非簇中心b(i)的全部距离中选出最小距离dmin(i),并计算所述最小距离dmin(i)与所述关于第i个非簇中心b(i)的全部距离之和的比值,将所述比值作为第i个非簇中心b(i)被选取为下一次迭代过程中的簇中心的概率;i为正整数,1≤i≤b。
7.根据权利要求4所述的细胞分类模型的获取方法,其特征在于,所述根据所述特征分类计算所述M个特征图的权重包括:
根据每个距离区间内所包含距离的大小赋予每个距离区间不同大小的权重;并相应赋予每个距离区间内所包含的特征图相应的权重;
其中,每个距离区间内所包含的距离值越大,该距离区间被赋予的权重越高,该距离区间内所包含的特征图被赋予的权重越高;每个距离区间内所包含的距离值越小,该距离区间被赋予的权重越低,该距离区间内所包含的特征图被赋予的权重越低。
8.根据权利要求1-7任意一项所述的细胞分类模型的获取方法,其特征在于,所述方法还包括:将全部权重归一化到0至1之间。
9.根据权利要求1-7任意一项所述的细胞分类模型的获取方法,其特征在于,所述获取训练好的细胞分类模型包括:
采用预设的训练数据对预先构建的用于分类的卷积神经网络CNN进行训练,获取所述细胞分类模型;
其中,所述训练数据为预先将所述待分类目标进行分类获取的正确分类结果。
10.一种细胞分类模型的获取装置,包括处理器和计算机可读存储介质,所述计算机可读存储介质中存储有指令,其特征在于,当所述指令被所述处理器执行时,实现如权利要求1-9任意一项所述的细胞分类模型的获取方法。
CN202011148471.9A 2020-10-23 2020-10-23 一种细胞分类模型的获取方法和装置 Pending CN114495096A (zh)

Priority Applications (2)

Application Number Priority Date Filing Date Title
CN202011148471.9A CN114495096A (zh) 2020-10-23 2020-10-23 一种细胞分类模型的获取方法和装置
PCT/CN2021/080290 WO2022083047A1 (zh) 2020-10-23 2021-03-11 细胞分类模型的获取方法、装置及计算机可读存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202011148471.9A CN114495096A (zh) 2020-10-23 2020-10-23 一种细胞分类模型的获取方法和装置

Publications (1)

Publication Number Publication Date
CN114495096A true CN114495096A (zh) 2022-05-13

Family

ID=81291469

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202011148471.9A Pending CN114495096A (zh) 2020-10-23 2020-10-23 一种细胞分类模型的获取方法和装置

Country Status (2)

Country Link
CN (1) CN114495096A (zh)
WO (1) WO2022083047A1 (zh)

Family Cites Families (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108009559B (zh) * 2016-11-02 2021-12-24 哈尔滨工业大学 一种基于空谱联合信息的高光谱数据分类方法
JP6915349B2 (ja) * 2017-04-04 2021-08-04 コニカミノルタ株式会社 画像処理装置、画像処理方法、及び画像処理プログラム
CN110119710A (zh) * 2019-05-13 2019-08-13 广州锟元方青医疗科技有限公司 细胞分类方法、装置、计算机设备和存储介质
CN111091147B (zh) * 2019-12-10 2024-01-19 东软集团股份有限公司 一种图像分类方法、装置及设备

Also Published As

Publication number Publication date
WO2022083047A1 (zh) 2022-04-28

Similar Documents

Publication Publication Date Title
WO2021164625A1 (en) Method of training an image classification model
EP2259215B1 (en) Method and structure for a neural associative memory based on optimal Bayesian learning
KR102305568B1 (ko) 일정한 처리 시간 내에 k개의 극값을 찾는 방법
CN112733904B (zh) 一种水质异常检测方法及电子设备
EP3336763A1 (en) Device for classifying data
CN110942091B (zh) 寻找可靠的异常数据中心的半监督少样本图像分类方法
CN113850281B (zh) 一种基于meanshift优化的数据处理方法和装置
CN113257364B (zh) 基于多目标进化的单细胞转录组测序数据聚类方法及***
CN111723915A (zh) 深度卷积神经网络的剪枝方法、计算机设备及应用方法
CN111325276A (zh) 图像分类方法及装置、电子设备、计算机可读存储介质
CN112926570A (zh) 一种自适应比特网络量化方法、***及图像处理方法
CN112308161A (zh) 一种基于人工智能半监督聚类目标下的粒子群算法
CN114116829A (zh) 异常数据分析方法、异常数据分析***和存储介质
CN113283573A (zh) 一种卷积神经网络最优结构自动搜索方法
CN114495096A (zh) 一种细胞分类模型的获取方法和装置
CN117173697A (zh) 细胞团分类识别方法、装置、电子设备及存储介质
CN115984671A (zh) 模型在线更新方法、装置、电子设备及可读存储介质
CN108596390B (zh) 一种解决车辆路径问题的方法
Thiodorus et al. Convolutional neural network with transfer learning for classification of food types in tray box images
CN115293639A (zh) 一种基于隐马尔可夫模型的战场态势研判方法
CN111984812B (zh) 一种特征提取模型生成方法、图像检索方法、装置及设备
US20220284261A1 (en) Training-support-based machine learning classification and regression augmentation
Westwańska et al. Counting instances of objects in color images using u-net network on example of honey bees
CN113537290B (zh) 一种基于超高维数据元聚类的图像匹配方法
EP4283494A1 (en) Analysis of clustered data

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination