CN118096797A - 图像处理方法、装置、电子设备及存储介质 - Google Patents
图像处理方法、装置、电子设备及存储介质 Download PDFInfo
- Publication number
- CN118096797A CN118096797A CN202410521542.7A CN202410521542A CN118096797A CN 118096797 A CN118096797 A CN 118096797A CN 202410521542 A CN202410521542 A CN 202410521542A CN 118096797 A CN118096797 A CN 118096797A
- Authority
- CN
- China
- Prior art keywords
- image
- target point
- mask
- segmentation
- type
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000003672 processing method Methods 0.000 title claims abstract description 26
- 238000003860 storage Methods 0.000 title claims abstract description 19
- 230000011218 segmentation Effects 0.000 claims abstract description 147
- 238000012545 processing Methods 0.000 claims abstract description 76
- 238000000034 method Methods 0.000 claims abstract description 42
- 230000004044 response Effects 0.000 claims abstract description 11
- 238000005070 sampling Methods 0.000 claims description 70
- 238000012549 training Methods 0.000 claims description 12
- 238000004590 computer program Methods 0.000 claims description 8
- 230000007246 mechanism Effects 0.000 claims description 7
- 238000003709 image segmentation Methods 0.000 abstract description 59
- 210000002220 organoid Anatomy 0.000 description 34
- 230000008569 process Effects 0.000 description 25
- 230000000694 effects Effects 0.000 description 14
- 238000010586 diagram Methods 0.000 description 12
- 239000003086 colorant Substances 0.000 description 8
- 230000006870 function Effects 0.000 description 7
- 238000004458 analytical method Methods 0.000 description 6
- 230000000007 visual effect Effects 0.000 description 6
- 238000000338 in vitro Methods 0.000 description 5
- 238000004422 calculation algorithm Methods 0.000 description 4
- ZZUFCTLCJUWOSV-UHFFFAOYSA-N furosemide Chemical group C1=C(Cl)C(S(=O)(=O)N)=CC(C(O)=O)=C1NCC1=CC=CO1 ZZUFCTLCJUWOSV-UHFFFAOYSA-N 0.000 description 4
- 238000010801 machine learning Methods 0.000 description 4
- 230000008878 coupling Effects 0.000 description 3
- 238000010168 coupling process Methods 0.000 description 3
- 238000005859 coupling reaction Methods 0.000 description 3
- 230000002452 interceptive effect Effects 0.000 description 3
- 238000007726 management method Methods 0.000 description 3
- 238000005457 optimization Methods 0.000 description 3
- 230000009286 beneficial effect Effects 0.000 description 2
- 230000008901 benefit Effects 0.000 description 2
- 230000008859 change Effects 0.000 description 2
- 238000006243 chemical reaction Methods 0.000 description 2
- 238000004891 communication Methods 0.000 description 2
- 238000013461 design Methods 0.000 description 2
- 238000010191 image analysis Methods 0.000 description 2
- 230000003993 interaction Effects 0.000 description 2
- 210000000056 organ Anatomy 0.000 description 2
- 238000007781 pre-processing Methods 0.000 description 2
- 230000009467 reduction Effects 0.000 description 2
- 238000011160 research Methods 0.000 description 2
- 210000000130 stem cell Anatomy 0.000 description 2
- 230000001960 triggered effect Effects 0.000 description 2
- 238000012800 visualization Methods 0.000 description 2
- 206010028980 Neoplasm Diseases 0.000 description 1
- 230000001133 acceleration Effects 0.000 description 1
- 230000003416 augmentation Effects 0.000 description 1
- 230000006399 behavior Effects 0.000 description 1
- 238000004364 calculation method Methods 0.000 description 1
- 238000003759 clinical diagnosis Methods 0.000 description 1
- 238000004040 coloring Methods 0.000 description 1
- 238000013500 data storage Methods 0.000 description 1
- 230000007423 decrease Effects 0.000 description 1
- 230000007547 defect Effects 0.000 description 1
- 238000002059 diagnostic imaging Methods 0.000 description 1
- 238000007599 discharging Methods 0.000 description 1
- 238000009826 distribution Methods 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 230000002708 enhancing effect Effects 0.000 description 1
- 230000036541 health Effects 0.000 description 1
- 238000003384 imaging method Methods 0.000 description 1
- 230000001939 inductive effect Effects 0.000 description 1
- 230000000670 limiting effect Effects 0.000 description 1
- 230000000873 masking effect Effects 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 238000012544 monitoring process Methods 0.000 description 1
- 230000000877 morphologic effect Effects 0.000 description 1
- 238000010606 normalization Methods 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 230000036961 partial effect Effects 0.000 description 1
- 230000008447 perception Effects 0.000 description 1
- 230000002829 reductive effect Effects 0.000 description 1
- 230000009466 transformation Effects 0.000 description 1
- 238000010200 validation analysis Methods 0.000 description 1
Landscapes
- Image Analysis (AREA)
Abstract
本申请提供了一种图像处理方法、装置、电子设备及存储介质,该方法包括:获取并显示原始图像;响应于对原始图像的点击操作,确定目标点以及目标点在点击操作历史记录中的点击顺序,根据目标点的点击顺序确定目标点的权重,其中,点击顺序与权重呈负相关;根据目标点以及目标点的权重确定子掩码图像;基于原始图像和子掩码图像,确定特征图像;通过预先训练好的图像处理模型从特征图像中识别前景分割区域和背景分割区域,基于前景分割区域和背景分割区域输出分割掩码图像;基于分割掩码图像和原始图像,确定并显示目标图像。基于本申请方案,通过结合手动点击与自动图像处理模型,有效兼顾了图像分割的效率和准确度。
Description
技术领域
本申请涉及图像处理技术领域,尤其涉及一种图像处理方法、装置、电子设备及存储介质。
背景技术
图像分割是一种数字图像处理技术,旨在将图像划分为多个区域。例如在生物医学的应用场景中,对体外生物模型的图像进行分割,可以得到包含体外生物模型内容的前景区域和不含体外生物模型内容的背景区域。
目前存在手动图像分割和自动图像分割的方案。其中,手动图像分割是指手动绘制边界或选择区域来对图像进行分割,这种方案效率较低;自动图像分割是指利用机器学习模型直接对图像进行分割,由于机器学习模型的泛化能力有限,在很多情况下都不能给出准确的分割结果。体外生物模型如肿瘤球、类器官等模型大都尺寸较小,且体外生物模型的图像数据具有复杂性和多样性,在数据处理和解释过程存在较大的困难。
也即,现有的图像分割方案难以兼顾效率和准确度。
发明内容
本申请提供了一种图像处理方法、装置、电子设备及存储介质,该方法通过结合手动点击与自动图像处理模型,有效兼顾了图像分割的效率和准确度。
第一方面,提供了一种图像处理方法,包括:
获取并显示原始图像;
响应于对原始图像的点击操作,确定目标点以及目标点在点击操作历史记录中的点击顺序,根据目标点的点击顺序确定目标点的权重,其中,点击顺序与权重呈负相关;
根据目标点以及目标点的权重确定子掩码图像;
基于原始图像和子掩码图像,确定特征图像;
通过预先训练好的图像处理模型从特征图像中识别前景分割区域和背景分割区域,基于前景分割区域和背景分割区域输出分割掩码图像;
基于分割掩码图像和原始图像,确定并显示目标图像。
第二方面,提供了一种图像处理装置,该装置包括:
获取模块,用于获取并显示原始图像;
第一确定模块,用于响应于对原始图像的点击操作,确定目标点以及目标点在点击操作历史记录中的点击顺序,根据目标点的点击顺序确定目标点的权重,其中,点击顺序与权重呈负相关;
第二确定模块,用于根据目标点以及目标点的权重确定子掩码图像;
第三确定模块,用于基于原始图像和子掩码图像,确定特征图像;
分割模块,用于通过预先训练好的图像处理模型从特征图像中识别前景分割区域和背景分割区域,基于前景分割区域和背景分割区域输出分割掩码图像;
第四确定模块,用于基于分割掩码图像和原始图像,确定并显示目标图像。
第三方面,提供一种电子设备,电子设备包括:
存储器,用于存储可执行程序代码;
处理器,用于从所述存储器中调用并运行所述可执行程序代码,使得所述电子设备执行如上任意一项所述的图像处理方法。
第四方面,提供了一种计算机可读存储介质,所述计算机可读存储介质存储有计算机程序,当所述计算机程序被执行时,实现如上任意一项所述的图像处理方法。
本申请一些实施例提供的技术方案带来的有益效果至少包括:在获取并显示原始图像的基础上,响应于对原始图像的点击操作,依次确定目标点、目标点的点击顺序、目标点的权重,并且点击顺序与权重呈负相关可以灵活控制分割细节。进一步地,根据目标点以及目标点的权重确定子掩码图像,基于原始图像和子掩码图像确定特征图像,利用预先训练的图像处理模型对特征图像进行自动分割得到分割掩码图像,确保了处理速度。最后基于分割掩码图像和原始图像确定并显示目标图像,实现了分割结果可视化。基于上述方案,通过结合手动点击与自动图像处理模型,有效兼顾了图像分割的效率和准确度。
附图说明
为了更清楚地说明本申请实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本申请的一些实施例,对于本领域技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1是本申请实施例提供的图像处理方法的第一种流程示意图;
图2是本申请实施例提供的类器官图像分割交互界面示意图;
图3是本申请实施例提供的原始图像显示效果示意图;
图4是本申请实施例提供的目标图像显示效果示意图;
图5是本申请实施例提供的图像处理方法的第二种流程示意图;
图6是本申请实施例提供的连续点击图像分割流程示意图;
图7是本申请实施例提供的图像处理装置的结构示意图;
图8是本申请实施例提供的电子设备的第一种结构示意图;
图9是本申请实施例提供的电子设备的第二种结构示意图。
具体实施方式
为使得本申请的特征和优点能够更加的明显和易懂,下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本申请一部分实施例,而非全部实施例。基于本申请中的实施例,本领域技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本申请保护的范围。
下面的描述涉及附图时,除非另有表示,不同附图中的相同数字表示相同或相似的要素。以下示例性实施例中所描述的实施方式并不代表与本申请相一致的所有实施方式。相反,它们仅是如所附权利要求书中所详述的、本申请的一些方面相一致的装置和方法的例子。
以下,术语“第一”“第二”仅用于描述目的,而不能理解为暗示或暗示相对重要性或隐含指明所指示的技术特征的数量。由此,限定有“第一”“第二”的特征可以明示或者隐含地包括一个或者多个该特征。
以下分别进行详细说明,需要说明的是,以下实施例的描述顺序不作为对实施例优选顺序的限定。
图像分割,作为一种关键的数字图像处理技术,已经在各种领域中发挥着不可替代的作用。尤其是在生物医学领域,对类器官图像的精确分割显得尤为重要。通过对类器官的图像进行细致入微的分割,能够更加清晰地观察到类器官的生长状态和健康程度,进而为医学研究和临床诊断提供宝贵的依据。
目前在实际应用中,两种主要采用两种图像分割方案:手动图像分割和自动图像分割,它们各存在着一定的局限性。
手动图像分割,这一方案主要依赖于人工绘制边界或选择特定区域来完成图像的分割。虽然其精度较高,但人工操作决定其效率极低。特别是在需要处理大量图像数据的情况下,手动分割不仅耗时耗力,而且容易受到人为因素的影响,如疲劳、经验差异等。此外,手动分割对于操作人员的专业技能要求较高,这无疑增加了其应用的门槛和成本。
相比之下,自动图像分割则显得更为高效和便捷。通过机器学习模型对图像进行自动处理和分析,从而快速完成图像的分割任务。然而,自动分割的准确性却常常受到机器学习模型泛化能力的限制。由于类器官培养环境的复杂性和多样性,以及不同类器官之间的形态差异和相互干扰,自动分割方法往往难以应对各种复杂情况,导致分割结果出现误差。更为棘手的是,这些误差一旦产生,就很难进行及时有效纠正。因为自动图像分割的固定性和不可修改性使得无法对分割结果进行微调或优化,这严重影响了后续的数据处理和分析工作。
综上所述,不难发现现有的图像分割方案在效率和准确度之间难以取得理想的平衡。无论是手动图像分割还是自动图像分割,都存在着各自的局限性和挑战。
针对上述问题,本申请实施例提出一种既高效又准确的图像处理方法,具体用于图像分割。
请参阅图1,图1是本申请实施例提供的图像处理方法的第一种流程示意图。该图像处理方法的具体流程可以如下:
S101,获取并显示原始图像。
具体地,首先需要从指定的数据源中获取原始图像。获取原始图像的过程可能涉及从文件***中读取图像文件,或者通过网络从远程服务器下载图像数据,甚至可能是从实时摄像头或医学成像设备中直接捕获图像。一旦原始图像被成功获取,它将被显示在用户交互界面上,供用户进行初步的观察和分析。这一步是后续处理的基础,确保用户能够直观地看到待处理的原始图像的内容。
显示原始图像通常是通过图形用户界面(GUI)来实现的。在GUI框架中,比如Qt、wxPython或Tkinter等,会有一个专门的图像显示组件,如图片框或画布。将读取到的原始图像转换为GUI框架能够理解的格式后,就可以将其渲染到这些组件上,从而让用户看到图像。
原始图像包含了用户想要分析和处理的视觉信息。具体而言,原始图像特指包含待分割对象的图像,例如类器官。类器官是由干细胞或多功能干细胞在特定的三维培养环境中自组织形成的微型器官模型,它们能够模拟真实器官的部分结构和功能,对于生物医学研究具有重要意义。
需要说明的是,原始图像是四通道的图像,这意味着除了标准的RGB(红蓝绿)三个颜色通道外,还有一个额外的通道。其中,RGB通道用于显示彩色图像,其中每个通道分别代表红色、绿色和蓝色的亮度信息。而RGB通道之外的额外的通道亦可称之为分割掩码通道,通常用于存储分割掩码图像。
分割掩码通道的存在两种可能的存储情况:其一,如果分割掩码通道已经有内容,那么它可包含基于上一次点击操作生成的分割掩码图像。其二,如果分割掩码通道为空,那么本次点击操作为第一次点击操作。可以理解的是,由于分割掩码通道的存在,使得本实施例图像分割的方案能够记录连续的点击操作对图像分割所带来的影响。
S102,响应于对原始图像的点击操作,确定目标点以及目标点在点击操作历史记录中的点击顺序,根据目标点的点击顺序确定目标点的权重,其中,点击顺序与权重呈负相关。
具体地,用户可以在原始图像上进行点击操作。一般而言,点击操作可以分为正点击和负点击,正点击通常用于标记用户感兴趣或认为是前景的区域,而负点击则用于标记用户认为应该被排除或视为背景的区域。实现这些点击操作的设备可以包括:
(1)计算机鼠标:用户可以使用鼠标左键进行正点击,使用鼠标右键进行负点击。
(2)触摸屏设备:在智能手机或平板电脑上,用户可以直接通过手指触摸屏幕进行点击操作。
(3)专用交互设备:如数字笔、触控笔等,这些设备可以提供更精确的点击和绘制功能。
在用户对原始图像进行点击操作之后,响应于对原始图像的点击操作,确定目标点以及目标点在点击操作历史记录中的点击顺序。可以理解的是,目标点至少附有以下三种属性:①坐标位置:这是目标点最基本的属性,表示了目标点在原始图像中的具***置,通常以像素坐标(x, y)的形式来表示。②点击类型:表示这是正点击还是负点击。正点击通常代表用户感兴趣的区域或者前景对象,而负点击则可能代表用户希望排除的背景区域。③点击顺序:记录了这是用户的第几次点击,对于后续分析用户意图和点击模式很重要。
需要说明的是,点击操作历史记录是一个记录用户所有点击操作的数据结构,它可以是一个列表、数组或其他形式的数据存储,用于追踪用户在原始图像上点击的顺序和位置。这个点击操作历史记录可以分别为正点击操作和负点击操作设置,也可以合并在一起。每次用户进行点击操作时,都将这次点击操作添加到点击操作历史记录中。
例如,如果用户首先进行一次正点击操作,然后进行两次负点击操作,再进行一次正点击操作,那么点击操作历史记录可能如下:
正点击操作(位置X1, Y1;点击顺序1);负点击操作(位置X2, Y2;点击顺序2);负点击操作(位置X3, Y3;点击顺序3);正点击操作(位置X4, Y4;点击顺序4)。
点击操作历史记录也可能如下:正点击操作(位置X1, Y1;点击顺序1);负点击操作(位置X2, Y2;点击顺序1);负点击操作(位置X3, Y3;点击顺序2);正点击操作(位置X4,Y4;点击顺序2)。
进一步地,根据目标点的点击顺序确定目标点的权重。点击顺序与权重呈负相关,意味着越早点击确定的目标点被赋予更高的权重,这是因为用户通常首先点击他们认为最重要或最显著的区域。或者,基于该规则可引导用户先点击最重要或最显著的区域。
其中,权重是一个准确的数值,它与点击顺序的关系可以是线性的,也可以是非线性的。以线性关系为例,可以设定第一次点击操作的权重为最高值(如5),然后每次后续的点击操作权重依次递减(如第二次为4,第三次为3,以此类推)。到达某个点之后(如第五次及以后),权重可能保持恒定(如1)。
权重与点击顺序的关系举例:第一次正点击操作的权重为5;第二次正点击操作的权重为权重4;第三次正点击操作的权重为权重3;第四次正点击操作的权重为权重2;第五次及以后的正点击操作的权重为权重1。同样的规则也适用于负点击。
结合图2,图2是本申请实施例提供的类器官图像分割交互界面示意图。其中类器官001的形状大致为圆形,每次对类器官图像的点击操作都会确定一目标点,并在该目标点的基础上形成一圆盘掩码区域。圆盘掩码区域可以在圆盘掩码区域的基础上进行可视化展示,圆盘掩码区域是由目标点及目标点的权重确定的。在图2中,正点击操作对应的圆盘掩码区域002具体包括第一次正点击操作对应的圆盘掩码区域002a、第二次正点击操作对应的圆盘掩码区域002b、第三次正点击操作对应的圆盘掩码区域002c;负点击操作对应的圆盘掩码区域003具体包括第一次负点击操作对应的圆盘掩码区域003a、第二次负点击操作对应的圆盘掩码区域003b。可见,圆盘掩码区域的面积随点击顺序的增加而逐渐下降,以显示越靠后的点击操作重要性越低。可见,第一次正点击操作接近类器官001的中心点,因为这是最具有代表性或最重要的区域,随后的正点击操作集中在类器官001的边缘附近,以帮助***更精确地识别类器官001的边界。通过这种方式,可以为图像分割任务提供有价值的指导信息。
另外,为了向用户提供更好的视觉反馈,正点击操作对应的圆盘掩码区域002和负点击操作对应的圆盘掩码区域003可以显示不同颜色。可以理解的是,图2中还包括其他点击操作形成的圆盘掩码区域,此处不再一一赘述。
S103,根据目标点以及目标点的权重确定子掩码图像。
具体地,在图像处理中,点击编码是一种将用户的点击信息转换为一种可被算法识别的格式的方法,而距离变换编码和圆盘编码是两种常见的点击编码方式。距离变换编码是通过计算每个像素到最近点击点的距离来进行编码的,而圆盘编码则是通过以点击点为中心,以一定半径画一个圆盘来进行编码。
本实施例优选采用圆盘编码的方式确定子掩码图像,原因包括:(1)圆盘编码只影响圆盘掩码区域内的像素,这使得编码的影响更加局部化。这种局部性影响有助于保留图像的细节,并且避免了对整个图像进行全局性的改变。(2)相比距离变换编码,圆盘编码的计算更为简单和直接。圆盘编码只需要判断像素是否在圆盘掩码区域内,而距离变换编码则需要计算每个像素到最近点击点的距离,这可能会增加计算复杂度。(3)圆盘编码在视觉上更为直观,易于理解和解释。用户可以清楚地看到点击点对周围像素的影响范围,这有助于用户更好地理解和控制图像处理的结果。(4)在图像分割任务中,用户可能更关心某个特定区域内的像素,而圆盘编码能够很好地表示这种局部性的关注。
为确定子掩码图像,需要先创建一个与原始图像尺寸相同的单通道图像,确定目标点在单通道图像中的位置,并以该位置为圆心,在目标点的权重的基础上确定半径,进而规划出一个圆盘掩码区域。
对于正点击操作确定的目标点,圆盘掩码区域内的像素被赋予正值(例如1);对于负点击操作确定的目标点,圆盘掩码区域内的像素被赋予负值(例如-1)。经过上述步骤,就可以得到一个包含圆盘掩码区域的子掩码图像,这个圆盘掩码区域将用于标记目标点在子掩码图像中的影响范围,子掩码图像将作为后续图像分割过程的重要输入。
S104,基于原始图像和子掩码图像,确定特征图像。
具体地,原始图像具有四个通道,除了标准的RGB通道用于显示彩色图像外,还有一个分割掩码通道。RGB通道分别存储红色、绿色和蓝色的亮度信息,共同构成彩色图像。而分割掩码通道则用于存储可能已有的分割掩码图像或者将有的分割掩码图像,也即分割掩码通道在初始阶段可能为空,但在后续的图像处理流程中可能会被填充。
子掩码图像是单通道的,反映了对原始图像中不同区域的关注程度。将子掩码图像作为第五通道与原始图像进行叠加,可以得到特征图像。具体做法是,保持原始图像中的RGB通道和分割掩码通道不变,将子掩码图像叠加到原始图像上作为一个新的通道,即子掩码通道。
这样,得到的特征图像就是一个五通道图像。其中,第一、二、三通道仍然是原始的RGB通道;第四通道是分割掩码通道;第五通道是新增的子掩码通道,用于存储根据用户点击确定的子掩码图像。
通过这种方式,特征图像融合了原始图像的彩色信息、可能的分割掩码信息和用户通过点击提供的额外子掩码信息,为后续的图像处理和分析提供了丰富的特征基础。
S105,通过预先训练好的图像处理模型从特征图像中识别前景分割区域和背景分割区域,基于前景分割区域和背景分割区域输出分割掩码图像。
具体地,图像分割需要基于图像处理模型实现,图像处理模型是由初始模型经过训练得到的。初始模型为基于自注意力机制预先构建,自注意力机制是一种允许模型在处理每个元素时,关注到输入序列中不同部分的能力。例如,Transformer模型就是基于自注意力机制的典型代表,它通过自注意力层来计算输入序列中每个元素与其他所有元素之间的相关性。EfficientViT模型则是Transformer模型的一个变种,它在保持Transformer模型优点的同时,提高了计算效率和准确性。
当特征图像(包含RGB通道、分割掩码通道和子掩码通道)输入到预先训练好的图像处理模型中时,图像处理模型会识别特征图像中的前景分割区域和背景分割区域。前景分割区域通常指的是用户感兴趣或需要被特别关注的部分,而背景分割区域则是图像中除了前景之外的其他部分。
以类器官图像分割为例,前景分割区域可能是包含用户点击的某个类器官的区域,而背景分割区域则是排除该类器官的区域。图像处理模型通过学习和分析特征图像中的信息,能够准确地识别出这两类区域。
最后,基于识别出的前景分割区域和背景分割区域,图像处理模型会输出一个分割掩码图像。分割掩码图像是单通道的,并且用像素值来表示不同的区域。例如,在基于正点击操作确定的分割掩码图像中,前景分割区域的各像素值可以设为1,表示这些区域是用户关注的;而背景分割区域的各像素值可以设为0,表示这些区域不是用户关注的重点。通过这样的方式,分割掩码图像清晰地展示了图像中不同区域的划分情况。同理,在基于负点击操作确定的分割掩码图像中,前景分割区域的各像素值可以设为﹣1。
在一些可能的实现方式中,特征图像的通道数量为第一通道数量;初始模型包括第一层卷积层和第二层卷积层;第一层卷积层被配置为接收第一通道数量的图像作为输入,将第一通道数量的图像转换为第二通道数量的图像,将第二通道数量的图像传递至第二层卷积层,第一通道数量高于第二通道数量。
具体而言,通常基于自注意力机制的模型被设计为只接受RGB三通道输入。然而,在本实施例中,初始模型相对于标准的Transformer模型或EfficientViT模型等模型进行了改进,增加了一层额外的卷积层,即初始模型的第一层卷积层。初始模型的第一层卷积层非常关键,因为它被配置为将第一通道数量的特征图像转换为第二通道数量的图像,然后将第二通道数量的图像传递至第二层卷积层,第一通道数量比第二通道数量高。例如,第一通道数量可以是5,第二通道数量可以是3,第二层卷积层可以是Transformer模型在未改进之前的第一层卷积层。这样,通过第一层卷积层实现了对图像的通道数量缩减,基于初始模型训练而来的图像处理模型就具备了接受并处理除RGB图像外的额外信息的能力,从而增强了模型的性能和灵活性。
S106,基于分割掩码图像和原始图像,确定并显示目标图像。
具体地,将分割掩码图像与原始图像相叠加,可以得到目标图像。叠加的方式取决于具体的应用需求,例如,可以基于分割掩码图像生成透明通道图像并叠加到原始图像上,最终得到目标图像。
目标图像对应前景分割区域的部分可以用不同颜色或亮度突出显示。最后,将目标图像显示在用户界面上,供用户查看和分析。
为进一步说明本实施例对图像分割结果的显示效果,结合图3和图4。其中,图3是本申请实施例提供的原始图像显示效果示意图,存在一个类似椭圆形的类器官,但并没有任何突出显示;图4是本申请实施例提供的目标图像显示效果示意图,对该类器官的主体赋予了突出显示的效果,可选地,对该类器官的边缘进一步突出显示。如此可见,目标图像为用户提供了强烈的视觉反馈,用户可以很容易地在目标图像中找到所点击的类器官。
通过上述方案,在获取并显示原始图像的基础上,响应于对原始图像的点击操作,依次确定目标点、目标点的点击顺序、目标点的权重,并且点击顺序与权重呈负相关可以灵活控制分割细节。进一步地,根据目标点以及目标点的权重确定子掩码图像,基于原始图像和子掩码图像确定特征图像,利用预先训练的图像处理模型对特征图像进行自动分割得到分割掩码图像,确保了处理速度。最后基于分割掩码图像和原始图像确定并显示目标图像,实现了分割结果可视化。基于上述方案,通过结合手动点击与自动图像处理模型,有效兼顾了图像分割的效率和准确度。
请参阅图5,图5是本申请实施例提供的图像处理方法的第二种流程示意图。该图像处理方法的具体流程可以包括:
S201,获取包含待分割对象的图像样本;
S202,从图像样本中获取前景蒙版和背景蒙版,其中,前景蒙版包含待分割对象对应的图像内容,背景蒙版包含待分割对象之外的图像内容;
S203,从前景蒙版中采集第一类目标点样本,以及从背景蒙版中采集第二类目标点样本;
S204,基于第一类目标点样本和第二类目标点样本对初始模型进行训练直至达到预设收敛条件,得到图像处理模型,其中,初始模型为基于自注意力机制预先构建。
具体地,为了构建一个自动高效进行图像分割的图像处理模型,首先需要获取一系列包含待分割对象的图像样本。例如,当待分割对象为类器官时,可以通过编程接口(API)与医疗设备或实验室仪器连接,自动下载和保存原始的图像数据。此外,还可以使用自动化图像采集***,如设置在显微镜或摄像机前的自动化装置,定时或触发式地捕捉和保存图像。这些获取图像样本的方式都能有效减少人工操作,提高效率。当然,手动导入图像样本可是一个可选的方式。
在获取到图像样本后,从图像样本中获取前景蒙版和背景蒙版。前景蒙版主要用于突出显示待分割对象本身,即用户感兴趣的区域。而背景蒙版则用于标示出待分割对象以外的所有区域,帮助模型区分前景与背景,从而更准确地进行分割。
紧接着,从前景蒙版和背景蒙版中分别采集目标点样本。从前景蒙版中选取的点,即第一类目标点样本,代表了待分割对象的具***置,是模型学习识别和分割类器官的关键信息。而从背景蒙版中采集的第二类目标点样本,则代表了非待分割对象的区域,对于训练模型区分待分割对象与其周围环境同样重要。
最后,利用第一类目标点样本和第二类目标点样本对初始模型进行训练。具体来说,第一类目标点样本代表了图像中感兴趣的区域——待分割对象(如类器官),而第二类目标点样本则代表了图像中的其他部分,即背景。这两类目标点样本为初始模型提供了明确的监督信号:哪些像素属于待分割对象,哪些不属于待分割对象。训练过程中,初始模型会尝试根据提供的样本数据调整其内部参数,以最小化预测错误。这通常是通过优化算法(如梯度下降)来实现的,该算法会根据模型预测与实际标签之间的差异来更新模型参数。训练过程会持续进行,直到初始模型的表现达到一个预设的收敛条件。收敛条件可以是多种形式的,例如训练损失达到某个阈值以下,或者在验证集上的性能达到某个标准。一旦满足这些条件,训练过程就会停止,此时得到的参数优化的初始模型就是图像处理模型。
图像处理模型现在已经学会了如何从图像中识别和分割出特定对象。在后续的应用中,可以使用图像处理模型来处理新的图像数据,自动识别和分割出特定对象,从而辅助各种图像分析和处理任务。
通过上述方案,利用前景蒙版和背景蒙版精确区分待分割对象与背景,提升了分割准确性。通过采集两类目标点样本训练初始模型,使其能更准确地识别和分割特定对象。自注意力机制的初始模型能够快速收敛,优化训练过程。最终得到的图像处理模型可高效、准确地处理和分割新图像数据,显著提升图像分析和处理的自动化水平。
在一些可能的实现方式中,对步骤S202进一步细化,具体可以包括:
从前景蒙版中确定若干个第一类采样区域;确定各第一类采样区域的采样顺序;根据各第一类采样区域的采样顺序,依次在各第一类采样区域中随机采样,得到若干个附带顺序属性的第一类目标点样本;以及,
从背景蒙版中确定若干个第二类采样区域;确定各第二类采样区域的采样顺序;根据各第二类采样区域的采样顺序,依次在各第二类采样区域中随机采样,得到若干个附带顺序属性的第二类目标点样本。
具体地,在前景蒙版中识别和划分出若干个第一类采样区域。第一类采样区域主要对应于感兴趣的部分,也即正点击或待分割对象(如类器官)。由于不同的部分或细节在图像分割中的重要性不同,因此,第一类采样区域的选择是有针对性的,以确保模型能够更好地学习和识别关键特征。
同时,需要为这些第一类采样区域分配对应的采样顺序,采用顺序反映了不同的第一类采样区域在图像分割任务中的重要性。例如,在类器官图像分割中,类器官的中心附近的采样区域可能包含更多关键信息,因此会被赋予更高的采样优先级(如采样顺序为1),而接近边缘部分的采样区域可能相对不那么重要,采样顺序会靠后。
按照之前确定的采样顺序,依次在每个第一类采样区域中进行随机采样。这里“随机采样”意味着在每个指定的第一类采样区域内随机选择一个或多个点作为第一类目标点样本。每个第一类目标点样本都会附带一个顺序属性,这个顺序属性与其所在第一类采样区域的采样顺序相对应。这样做可以帮助初始模型在训练过程中更好地理解图像中不同部分的重要性和特征。
对于背景蒙版的处理也是类似的。首先,在背景蒙版中识别和划分出若干个第二类采样区域,这些第二类采样区域主要代表图像中的背景部分,与负点击或背景(待分割对象之外的部分)相对应。
进一步地,为这些第二类采样区域分配对应的采样顺序。虽然背景可能不像前景那样具有复杂的结构或重要性差异,但合理的采样顺序仍然有助于模型更好地学习背景的特征和分布。
按照之前确定的采样顺序,依次在每个第二类采样区域中进行随机采样。也即在每个指定的第二类采样区域内随机选择一个或多个点作为第二类目标点样本。每个第二类目标点样本都会附带一个顺序属性,这个顺序属性与其所在第二类采样区域的采样顺序相对应。
通过上述方案,确定采样区域和顺序,能够采集到符合用户操作规律的目标点样本,使模型能够考虑分割过程中的顺序影响,进一步优化分割结果。这一细化步骤显著提升了图像分割的精度以及模型的泛化能力。
S205,获取并显示原始图像;
S206,响应于对原始图像的点击操作,确定目标点以及目标点在点击操作历史记录中的点击顺序,根据目标点的点击顺序确定目标点的权重,其中,点击顺序与权重呈负相关;
具体地,步骤S205的实现方式参照步骤S101,步骤S206的实现方式参照步骤S102。
首先获取需要进行分割处理的原始图像,并将其显示出来。原始图像的来源是多样的,如文件、摄像头捕捉或网络下载等,显示原始图像是为了让用户能够直观地看到图像内容,从而进行后续的操作和交互。
当用户在显示的原始图像上进行点击操作时,响应于对原始图像的点击操作,确定用户点击的位置作为目标点。同时,记录这个点击操作,并将其加入点击操作历史记录中。
接着,根据目标点在点击操作历史记录中的点击顺序来确定该目标点的权重。这里的“点击顺序与权重呈负相关”意味着,如果用户先点击了某个目标点,那么该点的权重会相对较高;反之,后点击的目标点权重会相对较低。这种设计是为了突出用户首次点击或早期点击的重要性,因为这些点击往往反映了用户最先注意到的图像区域或特征。
通过这种方式,能够捕捉到用户对原始图像不同区域的关注程度,有助于后续的图像处理或分析任务。
S207,根据目标点以及目标点的权重确定子掩码图像。
具体地,步骤S207的实现方式参考上述步骤S103。首先需要先创建一个与原始图像尺寸相同的单通道图像,确定目标点在单通道图像中的位置,并以该位置为圆心,在目标点的权重的基础上确定半径,进而规划出一个圆盘掩码区域。
对于正点击操作确定的目标点,圆盘掩码区域内的像素被赋予正值(例如1);对于负点击操作确定的目标点,圆盘掩码区域内的像素被赋予负值(例如-1)。经过上述步骤,就可以得到一个包含圆盘掩码区域的子掩码图像,这个圆盘掩码区域将用于标记目标点在子掩码图像中的影响范围,子掩码图像将作为后续图像分割过程的重要输入。
在一些可能的实现方式中,当点击操作为第一类点击操作时,目标点为第一类目标点,对步骤S207进一步细化,具体可以包括:
创建第一单通道图像,其中,第一单通道图像与原始图像的尺寸相同,第一单通道图像的各像素为0值;
根据第一类目标点在原始图像中的像素位置,确定第一类目标点在第一单通道图像中的像素位置;
以第一类目标点在第一单通道图像中的像素位置为对应的圆心,以第一类目标点的权重乘以预设系数为对应的半径,在第一单通道图像中确定第一类目标点对应的圆盘掩码区域;
在第一单通道图像中为第一类目标点对应的圆盘掩码区域的像素赋正值,得到第一子掩码图像。
具体地,当点击操作为第一类点击操作(正点击操作)时,所确定的目标点为第一类目标点。为确定第一类目标点对应的第一子掩码图像,具体操作如下:
创建第一单通道图像。“单通道图像”通常指的是灰度图像,它只有一个颜色通道,与彩色图像(通常有三个颜色通道:红、绿、蓝)相对。第一单通道图像与原始图像尺寸完全相同,并且第一单通道图像的每一个像素的初始值都被设置为0,这样做的目的是在第一单通道图像上绘制或标记特定的区域。
由于第一单通道图像与原始图像尺寸相同,因此第一类目标点在原始图像中的像素位置可以直接映射到第一单通道图像上相应的像素位置。
进一步地,在第一单通道图像上为第一类目标点创建一个圆盘状的区域,即圆盘掩码区域。该圆盘掩码区域的圆心就是第一类目标点在第一单通道图像上的像素位置;该圆盘掩码区域的半径是根据第一类目标点的权重和一个预设系数计算得出的,这意味着权重越大的第一类目标点会产生一个更大的圆盘掩码区域。在一些情况下,预设系数被配置为1,也即第一类目标点的权重可以直接作为对应圆盘掩码区域的半径。
在确定了第一类目标点对应的圆盘掩码区域之后,圆盘掩码区域内的每一个像素值会被赋予一个正值(与之前的0值相对),正值可表示圆盘掩码区域内的像素是被关注的或重要的。
经过上述处理后,就得到了第一子掩码图像。在第一子掩码图像中,只有圆盘掩码区域内的像素有正值,其他区域的像素值仍然为0。
在一些可能的实现方式中,当点击操作为第二类点击操作时,目标点为第二类目标点,对步骤S207进一步细化,具体可以包括:
创建第二单通道图像,其中,第二单通道图像与原始图像的尺寸相同,第二单通道图像的各像素为0值;
根据第二类目标点在原始图像中的像素位置,确定第二类目标点在第二单通道图像中的像素位置;
以第二类目标点在第二单通道图像中的像素位置为对应的圆心,以第二类目标点的权重乘以预设系数为对应的半径,在第二单通道图像中确定第二类目标点对应的圆盘掩码区域;
在第二单通道图像中为第二类目标点对应的圆盘掩码区域的像素赋负值,得到第二子掩码图像。
具体地,当点击操作为第二类点击操作(负点击操作)时,所确定的目标点为第二类目标点。为确定第二类目标点对应的第二子掩码图像,具体操作如下:
创建第二单通道图像。“单通道图像”通常指的是灰度图像,它只有一个颜色通道,与彩色图像(通常有三个颜色通道:红、绿、蓝)相对。第二单通道图像与原始图像尺寸完全相同,并且第二单通道图像的每一个像素的初始值都被设置为0,这样做的目的是在第二单通道图像上绘制或标记特定的区域。
由于第二单通道图像与原始图像尺寸相同,因此第二类目标点在原始图像中的像素位置可以直接映射到第二单通道图像上相应的像素位置。
进一步地,在第二单通道图像上为第二类目标点创建一个圆盘状的区域,即圆盘掩码区域。该圆盘掩码区域的圆心就是第二类目标点在第二单通道图像上的像素位置;该圆盘掩码区域的半径是根据第二类目标点的权重和一个预设系数计算得出的,这意味着权重越大的第二类目标点会产生一个更大的圆盘掩码区域。在一些情况下,预设系数被配置为1,即第二类目标点的权重可以直接作为对应圆盘掩码区域的半径。
在确定了第二类目标点对应的圆盘掩码区域之后,圆盘掩码区域内的每一个像素值会被赋予一个负值(与之前的0值相对),负值可表示圆盘掩码区域内的像素是不被关注的或不重要的。
经过上述处理后,就得到了第二子掩码图像。在第二子掩码图像中,只有圆盘掩码区域内的像素有负值,其他区域的像素值仍然为0。
通过上述方案,创建与原始图像尺寸相同的单通道图像,确保了掩码与原始图像的精确对应。利用圆盘掩码区域,有效地将用户点击转化为图像分割的指令。赋予圆盘掩码区域内像素正值或负值,清晰标识出用户关注区域或不关注的区域,为后续图像分割提供了准确的指导,显著提高了交互式图像分割的精确性和效率。
S208,基于原始图像和子掩码图像,确定特征图像;
S209,通过预先训练好的图像处理模型从特征图像中识别前景分割区域和背景分割区域,基于前景分割区域和背景分割区域输出分割掩码图像;
具体地,步骤S208的实现方式参考上述步骤S104,步骤S209的实现方式参考上述步骤S105。
首先,将子掩码图像作为第五通道与原始图像进行叠加,可以得到特征图像。具体做法是,保持原始图像中的RGB通道和分割掩码通道不变,将子掩码图像叠加到原始图像上作为一个新的通道,即子掩码通道。这样,得到的特征图像就是一个五通道图像。其中,第一、二、三通道仍然是原始的RGB通道;第四通道是分割掩码通道;第五通道是新增的子掩码通道,用于存储根据用户点击确定的子掩码图像。
当特征图像(包含RGB通道、分割掩码通道和子掩码通道)输入到预先训练好的图像处理模型中时,图像处理模型会识别特征图像中的前景分割区域和背景分割区域。前景分割区域通常指的是用户感兴趣或需要被特别关注的部分,而背景分割区域则是图像中除了前景之外的其他部分。
最后,基于识别出的前景分割区域和背景分割区域,图像处理模型会输出一个分割掩码图像。分割掩码图像是单通道的,并且用像素值来表示不同的区域。例如,在基于正点击操作确定的分割掩码图像中,前景分割区域的各像素值可以设为1,表示这些区域是用户关注的;而背景分割区域的各像素值可以设为0,表示这些区域不是用户关注的重点。通过这样的方式,分割掩码图像清晰地展示了图像中不同区域的划分情况。同理,在基于负点击操作确定的分割掩码图像中,前景分割区域的各像素值可以设为﹣1。
S210,基于分割掩码图像生成第一透明通道图像,其中,第一透明通道图像的透明度不为0,第一透明通道图像包括被配置为无色的第一透明区域和第二透明区域,第一透明区域对应前景分割区域,第二透明区域对应背景分割区域;
S211,在第一透明通道图像中将第一透明区域配置为有色,得到第二透明通道图像;
S212,将第二透明通道图像与原始图像叠加,得到目标图像;显示目标图像。
具体地,分割掩码图像通常是一个二值化的图像,其中的像素值通常只有两种:0(代表背景)和1(代表前景),或者在某些情况下可能是0和255(如果使用的是8位灰度图像)。可以理解的是,在分割掩码图像中,前景是被关注或需要分割出来的部分,而背景则是除了前景之外的所有内容。
进一步地,基于分割掩码图像生成第一透明通道图像。生成第一透明通道图像的过程是将分割掩码图像转换为一个具有透明度信息的图像层。在这个转换过程中,原本分割掩码图像中标记为前景(通常是1或255的值)的像素,在第一透明通道图像中会被设置为一个具有一定透明度的区域(即第一透明区域),而背景像素(0值)则会被设置为另一个透明度区域(即第二透明区域)。
透明度通常用一个介于0到1之间的值来表示,0表示完全透明,1表示完全不透明。第一透明通道图像的透明度不设为0,意味着第一透明区域和第二透明区域都不是完全透明的,能够提供一定的视觉反馈。具体的透明度值取决于实现的需求,可能是一个固定的值,也可能是根据某些条件动态计算的,例如透明度可设置为0.5。可以理解的是,如果透明度为0,那么在叠加时第一透明通道图像就会完全透明,无法看到它对最终的目标图像的影响。
另外,第一透明区域和第二透明区域是被配置为无色的,无色指的是这些透明区域本身不携带任何颜色信息。它们只是定义了透明度,而没有定义具体的颜色。
进一步地,在第一透明通道图像中将第一透明区域配置为有色,得到第二透明通道图像。“有色”意味着为第一透明区域指定了一个具体的颜色值,这通常是通过为第一透明区域内的每个像素分配一个RGB(红绿蓝)颜色值来实现的。例如,如果想要将第一透明区域着色为红色,可能会为每个像素分配一个类似于(255, 0, 0)的RGB值,这代表纯红色。
着色的过程不会改变第一透明区域的透明度值,之前设置的透明度仍然有效,它决定了这个颜色区域在最终的目标图像中的可见程度。一旦第一透明区域被着色,就得到了一个新的透明通道图像,这里称其为第二透明通道图像。
在第二透明通道图像中,前景区域(第一透明区域)现在不仅具有之前的透明度,还拥有了具体的颜色。而背景区域(第二透明区域)保持不变,仍然是无色且具有一定透明度。
进一步地,将第二透明通道图像与原始图像叠加,即可得到并显示目标图像。在前景区域(已着色的第一透明区域),原始图像的颜色会与第二透明通道图像中指定的颜色按透明度进行混合,从而形成一种颜色叠加的效果。在背景区域(第二透明区域),由于该区域未被着色,叠加过程主要受到透明度的影响,可能会让原始图像的背景略微变暗或变亮,具体取决于透明度的设置。
也即,在目标图像中的前景区域会呈现出第二透明通道图像中指定的颜色,并且这种颜色会与原始图像中的颜色根据透明度进行混合。背景区域则会保留原始图像的大部分颜色和细节,但可能会受到第二透明通道图像中背景区域透明度的影响。
最后一步是将目标图像显示出来。这可以通过将目标图像输出到显示器、保存为文件或在网络上进行传输来实现。
通过上述方案,生成透明度不为0的透明通道图像,并在前景区域着色,实现了在保留原始图像细节的同时,突出显示了用户关注的前景区域。这种叠加方式既能够清晰地展示出分割结果,又不会完全遮挡原始图像的信息,提高了图像分割结果的可视化效果,便于用户观察和评估分割效果。
需要说明的是,在本申请的一实施例中,图像分割还可以基于连续的点击操作触发进行。结合图6,图6是本申请实施例提供的连续点击图像分割流程示意图。
首先需要获取未处理图像,并对未处理图像进行预处理得到原始图像。未处理图像是原始的、未经任何处理的图像,通常只包含红色、绿色和蓝色三个颜色通道的信息,未处理图像的来源可以是相机、存储设备或网络等。
为了确保图像能够适配图像处理模型的输入需求,需要对未处理图像进行尺寸调整。尺寸调整的过程可包括图像缩放或图像裁剪等步骤,以确保图像的长宽等参数符合图像处理模型的输入规格。另外,尺寸调整还可以使用插值算法(如最近邻插值、双线性插值等)来保持图像的清晰度和质量。
进一步地,给三通道的未处理图像增加一个通道,这个新增的通道可以作为分割掩码通道,分割掩码通道用于存储分割掩码图像。
除了上述的尺寸调整和增加通道外,预处理还可能包括其他一系列的操作,以提高图像的质量或提取出对模型训练更有用的特征。这些操作可能包括:(1)归一化:将图像的像素值缩放到一个特定的范围(如0到1之间),有助于模型的收敛和稳定性。(2)色彩空间转换:如从RGB色彩空间转换到HSV或Lab色彩空间,以更好地反映人类对颜色的感知方式或提取特定特征。(3)降噪:通过滤波器或算法减少图像中的噪声,以提高图像的信噪比。(4)对比度增强:通过直方图均衡化或对比度拉伸等方法提升图像的对比度,使图像中的特征更加明显。通过这些预处理步骤,所得到的原始图像更适合图像处理模型的输入要求,从而提高了图像分割的准确性。
进一步地,获取并显示原始图像;响应于点击操作,确定分割图像掩码;基于分割图像掩码图像和原始图像,确定并显示目标图像。这些步骤的具体实现方式可参照上述步骤S101~S106,此处不再赘述。
在显示目标图像之后,用户可以判断目标图像是否符合要求。
如果目标图像符合要求,用户可以通过相关操作确认流程结束,以结束整个图像分割流程。
如果目标图像不符合要求,用户还可以通过相关操作确认流程继续。相应地,响应于用户确认流程继续的操作,根据当前点击操作确定的分割掩码图像和原始图像,确定下一次点击操作的原始图像。具体而言,是将当前点击操作确定的分割掩码图像放入原始图像的分割掩码通道,得到下一次点击操作的原始图像。然后返回执行“获取并显示原始图像”的步骤,相当于“获取并显示下一次点击操作的原始图像”。以此循环,用户可以实现连续多次的点击操作,每次操作都会对图像分割的结果产生微调。
点击操作历史记录会跟踪用户的点击操作,包括多次连续的点击。每次点击产生的目标点的点击顺序不同,目标点的点击顺序又会影响目标点的权重,并且权重会影响子掩码图像的确定,进而影响到特征图像的生成和最终的图像分割结果。因此,用户的连续点击行为及其顺序实际上是在图像分割过程中被考虑和反映的。
需要说明的是,本方案支持连续的点击操作,并且选用了圆盘编码来确定子掩码图像。这一选择是出于圆盘编码在连续点击操作中的稳定性和局部性考虑。首先,圆盘编码的特点在于其局部性。当用户进行连续点击操作时,圆盘编码能够确保每次点击所引起的编码更改是局部的,这意味着每次点击只会对点击点附近的编码产生影响,而不会对整个编码映射造成大规模的重构。这种局部性更改的特性在连续的点击操作中非常重要,因为它允许用户通过微调来逐步优化图像分割的结果。相比之下,距离变换编码在添加新点或移动现有点时可能会导致整个距离变换图发生显著变化,特别是在只有少数几个点的情况下。这种全局性的影响在连续的点击操作中是不利的,因为它可能使得之前的点击操作所得到的结果被完全颠覆,导致用户需要重新开始调整,这无疑降低了用户体验和效率。圆盘编码克服了距离变换编码的这一缺点。由于圆盘编码的局部性更改特性,用户的连续点击可以逐步微调图像分割的结果,而不是引发全局性的重构。这使得用户可以通过连续的点击操作来精确控制图像分割的细节,从而实现越来越准确的图像分割。此外,本方案还通过跟踪用户的点击操作历史记录,利用点击顺序来确定目标点的权重。这种设计进一步增强了连续点击操作的灵活性和准确性。因为不同的点击顺序反映了用户对图像中不同区域的关注程度,通过调整权重可以更加精细地控制图像分割的结果。综上,通过采用圆盘编码和跟踪点击操作历史记录的方式,支持连续的点击操作,并且实现了图像分割结果的逐步微调。这种方式不仅克服了距离变换编码在连续点击操作中的缺点,还通过局部性的更改和权重的调整提高了图像分割的准确性和用户体验。
另外,在一些可能的实现方式中,目标图像的显示效果可以基于预设输出参数进行调整。例如,可通过预设输出参数控制目标图像中显示各待分割对象的序号、颜色等,并且可以预设输出参数控制各待分割对象对应区域的显示面积。
举例来说,在一张包含多个类器官的显微图像(原始图像)中,通过图像分割识别出了这些类器官,并根据它们的面积大小进行了排序。然后,为每个类器官分配了一个从1开始的连续编号,比如最大的类器官被编号为1,次大的为2,以此类推。这些编号和掩码结果(即类器官的轮廓或边界)会被叠加显示在目标图像上,使得用户可以一目了然地看到每个编号对应的类器官位置和形状。此外,可以根据需求调整预设输出参数,进而调整编号的显示顺序(比如按照面积大小或某种特定的逻辑顺序),添加自定义的文本注释,以及为每个编号或掩码指定不同的颜色以便于区分和识别。或者,上述类器官的编号也可以根据被点击的顺序来设定。
通过上述方案,支持连续的点击操作进行图像分割,通过圆盘编码确保每次点击只局部影响编码,实现逐步微调分割结果,提高图像分割的准确性和用户体验。此外,通过预设输出参数调整目标图像显示效果,如编号、颜色和显示面积等,提供更丰富、更直观的视觉反馈,便于用户理解和分析图像分割结果。
另外,本申请实施例还提供了一种图像处理装置。请参阅图7,图7是本申请实施例提供的图像处理装置的结构示意图。其中,图像处理装置800可以包括获取模块801、第一确定模块802、第二确定模块803、第三确定模块804、分割模块805以及第四确定模块806,具体如下:
获取模块801,用于获取并显示原始图像;
第一确定模块802,用于响应于对原始图像的点击操作,确定目标点以及目标点在点击操作历史记录中的点击顺序,根据目标点的点击顺序确定目标点的权重,其中,点击顺序与权重呈负相关;
第二确定模块803,用于根据目标点以及目标点的权重确定子掩码图像;
第三确定模块804,用于基于原始图像和子掩码图像,确定特征图像;
分割模块805,用于通过预先训练好的图像处理模型从特征图像中识别前景分割区域和背景分割区域,基于前景分割区域和背景分割区域输出分割掩码图像;
第四确定模块806,用于基于分割掩码图像和原始图像,确定并显示目标图像。
可选地,当点击操作为第一类点击操作时,目标点为第一类目标点,该第二确定模块803还包括第一确定单元,该第一确定单元可用于:创建第一单通道图像,其中,第一单通道图像与原始图像的尺寸相同,第一单通道图像的各像素为0值;根据第一类目标点在原始图像中的像素位置,确定第一类目标点在第一单通道图像中的像素位置;以第一类目标点在第一单通道图像中的像素位置为对应的圆心,以第一类目标点的权重乘以预设系数为对应的半径,在第一单通道图像中确定第一类目标点对应的圆盘掩码区域;在第一单通道图像中为第一类目标点对应的圆盘掩码区域的像素赋正值,得到第一子掩码图像。
可选地,当点击操作为第二类点击操作时,目标点为第二类目标点,该第二确定模块803还包括第二确定单元,该第二确定单元可用于:创建第二单通道图像,其中,第二单通道图像与原始图像的尺寸相同,第二单通道图像的各像素为0值;根据第二类目标点在原始图像中的像素位置,确定第二类目标点在第二单通道图像中的像素位置;以第二类目标点在第二单通道图像中的像素位置为对应的圆心,以第二类目标点的权重乘以预设系数为对应的半径,在第二单通道图像中确定第二类目标点对应的圆盘掩码区域;在第二单通道图像中为第二类目标点对应的圆盘掩码区域的像素赋负值,得到第二子掩码图像。
可选地,该第四确定模块806还用于:基于分割掩码图像生成第一透明通道图像,其中,第一透明通道图像的透明度不为0,第一透明通道图像包括被配置为无色的第一透明区域和第二透明区域,第一透明区域对应前景分割区域,第二透明区域对应背景分割区域;在第一透明通道图像中将第一透明区域配置为有色,得到第二透明通道图像;将第二透明通道图像与原始图像叠加,得到目标图像;显示目标图像。
可选地,该图像处理装置800可用于:获取包含待分割对象的图像样本;从图像样本中获取前景蒙版和背景蒙版,其中,前景蒙版包含待分割对象对应的图像内容,背景蒙版包含待分割对象之外的图像内容;从前景蒙版中采集第一类目标点样本,以及从背景蒙版中采集第二类目标点样本;基于第一类目标点样本和第二类目标点样本对初始模型进行训练直至达到预设收敛条件,得到图像处理模型,其中,初始模型为基于自注意力机制预先构建。
可选地,该图像处理装置800还用于:从前景蒙版中确定若干个第一类采样区域;确定各第一类采样区域的采样顺序;根据各第一类采样区域的采样顺序,依次在各第一类采样区域中随机采样,得到若干个附带顺序属性的第一类目标点样本;以及,从背景蒙版中确定若干个第二类采样区域;确定各第二类采样区域的采样顺序;根据各第二类采样区域的采样顺序,依次在各第二类采样区域中随机采样,得到若干个附带顺序属性的第二类目标点样本。
可选地,特征图像的通道数量为第一通道数量;初始模型包括第一层卷积层和第二层卷积层;第一层卷积层被配置为接收第一通道数量的图像作为输入,将第一通道数量的图像转换为第二通道数量的图像,将第二通道数量的图像传递至第二层卷积层。
在本实施例中,该图像处理装置800通过获取模块801获取并显示原始图像;通过第一确定模块802响应于对原始图像的点击操作,确定目标点以及目标点在点击操作历史记录中的点击顺序,根据目标点的点击顺序确定目标点的权重,其中,点击顺序与权重呈负相关;通过第二确定模块803根据目标点以及目标点的权重确定子掩码图像;通过第三确定模块804基于原始图像和子掩码图像,确定特征图像;通过分割模块805通过预先训练好的图像处理模型从特征图像中识别前景分割区域和背景分割区域,基于前景分割区域和背景分割区域输出分割掩码图像;通过第四确定模块806基于分割掩码图像和原始图像,确定并显示目标图像。能够结合手动点击与自动图像处理模型,有效兼顾了图像分割的效率和准确度。
本实施例还提供一种计算机可读存储介质,该计算机可读存储介质中存储有计算机程序代码,当该计算机程序代码在计算机上运行时,使得计算机执行上述相关方法步骤实现上述实施例提供的一种图像处理方法。
其中,该存储介质可以包括:只读存储器(ROM,Read Only Memory)、随机存取记忆体(RAM,Random Access Memory)、磁盘或光盘等。
由于该存储介质中所存储的指令,可以执行本申请实施例所提供的任一种图像处理方法中的步骤,因此,可以实现本申请实施例所提供的任一种图像处理方法所能实现的有益效果,详见前面的实施例,在此不再赘述。
相应地,本申请实施例还提供了一种电子设备900。请参阅图8,图8是本申请实施例提供的电子设备的第一种结构示意图。该电子设备900包括处理器901和存储器902。其中,处理器901与存储器902电性连接。
处理器901是电子设备900的控制中心,利用各种接口和线路连接整个电子设备的各个部分,通过运行或调用存储在存储器902内的计算机程序,以及调用存储在存储器902内的数据,执行电子设备的各种功能和处理数据,从而对电子设备进行整体监控。
存储器902可用于存储软件程序以及模块,处理器901通过运行存储在存储器902的计算机程序以及模块,从而执行各种功能应用以及图像处理。存储器902可主要包括存储程序区和存储数据区,其中,存储程序区可存储操作***、至少一个功能所需的计算机程序等;存储数据区可存储根据电子设备的使用所创建的数据等。
此外,存储器902可以包括高速随机存取存储器,还可以包括非易失性存储器,例如至少一个磁盘存储器件、闪存器件,或其他易失性固态存储器件。相应地,存储器902还可以包括存储器控制器,以提供处理器901对存储器902的访问。
在本实施例中,电子设备900中的处理器901会按照如下步骤将一个或一个以上的计算机程序的进程对应的指令加载到存储器902中,并由处理器901来运行存储在存储器902中的计算机程序,从而实现各种功能,如下:
获取并显示原始图像;
响应于对原始图像的点击操作,确定目标点以及目标点在点击操作历史记录中的点击顺序,根据目标点的点击顺序确定目标点的权重,其中,点击顺序与权重呈负相关;
根据目标点以及目标点的权重确定子掩码图像;
基于原始图像和子掩码图像,确定特征图像;
通过预先训练好的图像处理模型从特征图像中识别前景分割区域和背景分割区域,基于前景分割区域和背景分割区域输出分割掩码图像;
基于分割掩码图像和原始图像,确定并显示目标图像。
在一些实施例中,请参阅图9,图9是本申请实施例提供的电子设备的第二种结构示意图。该电子设备900可以包括:处理器901、存储器902、显示屏903、摄像组件904、音频电路905、传感器906以及电源907。其中,处理器901分别与显示器903、摄像组件904、音频电路905、传感器906以及电源907电性连接。
显示屏903可用于显示由用户输入的信息或提供给用户的信息以及电子设备的各种图形用户接口,这些图形用户接口可以由图像、文本、图标、视频和其任意组合来构成。
摄像组件904可以包括图像处理电路,图像处理电路可以利用硬件和/或软件组件实现,可包括定义图像信号处理(Image Signal Processing)管线的各种处理单元。图像处理电路至少可以包括:多个摄像头、图像信号处理器(Image Signal Processor,ISP处理器)、控制逻辑器以及图像存储器等。其中每个摄像头至少可以包括一个或多个透镜和图像传感器。图像传感器可包括色彩滤镜阵列(如Bayer滤镜)。图像传感器可获取用图像传感器的每个成像像素捕捉的光强度和波长信息,并提供可由图像信号处理器处理的一组原始图像数据。
音频电路905可以用于通过扬声器、传声器提供用户与电子设备之间的音频接口。其中,音频电路905包括麦克风。所述麦克风与所述处理器901电性连接。所述麦克风用于接收用户输入的语音信息。
传感器906用于采集电子设备自身的信息或者用户的信息或者外部环境信息。例如,传感器906可以包括震动传感器、温度传感器、距离传感器、磁场传感器、光线传感器、加速度传感器、指纹传感器、霍尔传感器、位置传感器、陀螺仪、惯性传感器、姿态感应器、气压计、心率传感器等传感器中的一种或多种。
电源907用于给电子设备900的各个部件供电。在一些实施例中,电源907可以通过电源管理***与处理器901逻辑相连,从而通过电源管理***实现管理充电、放电,以及功耗管理等功能。
在本申请所提供的实施例中,应该理解到,所揭露的装置和方法,可以通过其他的方式实现。例如,以上所描述的装置实施例仅仅是示意性的,例如,模块或单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,例如多个单元或组件可以结合或者可以集成到另一个装置,或一些特征可以忽略,或不执行。另一点,所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些接口,装置或单元的间接耦合或通信连接,可以是电性,机械或其他的形式。
对本申请实施例的图像处理装置而言,其各功能模块可以集成在一个处理芯片中,也可以是各个模块单独物理存在,也可以两个或两个以上模块集成在一个模块中。上述集成的模块既可以采用硬件的形式实现,也可以采用软件功能模块的形式实现。该集成的模块如果以软件功能模块的形式实现并作为独立的产品销售或使用时,也可以存储在一个计算机可读取存储介质中。
以上对本申请实施例所提供的图像处理方法、装置、电子设备及存储介质进行了详细介绍。本文中应用具体个例对本申请的原理及实施方式进行了阐述,以上实施例说明只是用于帮助理解本申请的方法及其核心思想;同时,对于本领域的技术人员,依据本申请的思想,在具体实施方式及应用范围上均会有改变之处,综上所述,本说明书内容不应理解为对本申请的限制。
Claims (10)
1.一种图像处理方法,其特征在于,包括:
获取并显示原始图像;
响应于对所述原始图像的点击操作,确定目标点以及所述目标点在点击操作历史记录中的点击顺序,根据所述目标点的点击顺序确定所述目标点的权重,其中,所述点击顺序与所述权重呈负相关;
根据所述目标点以及所述目标点的权重确定子掩码图像;
基于所述原始图像和所述子掩码图像,确定特征图像;
通过预先训练好的图像处理模型从所述特征图像中识别前景分割区域和背景分割区域,基于所述前景分割区域和所述背景分割区域输出分割掩码图像;
基于所述分割掩码图像和所述原始图像,确定并显示目标图像。
2.根据权利要求1所述的图像处理方法,其特征在于,当所述点击操作为第一类点击操作时,所述目标点为第一类目标点,所述根据所述目标点以及所述目标点的权重确定子掩码图像,包括:
创建第一单通道图像,其中,所述第一单通道图像与所述原始图像的尺寸相同,所述第一单通道图像的各像素为0值;
根据所述第一类目标点在所述原始图像中的像素位置,确定所述第一类目标点在所述第一单通道图像中的像素位置;
以所述第一类目标点在所述第一单通道图像中的像素位置为对应的圆心,以所述第一类目标点的权重乘以预设系数为对应的半径,在所述第一单通道图像中确定所述第一类目标点对应的圆盘掩码区域;
在所述第一单通道图像中为所述第一类目标点对应的圆盘掩码区域的像素赋正值,得到第一子掩码图像。
3.根据权利要求1所述的图像处理方法,其特征在于,当所述点击操作为第二类点击操作时,所述目标点为第二类目标点,所述根据所述目标点以及所述目标点的权重确定子掩码图像,包括:
创建第二单通道图像,其中,所述第二单通道图像与所述原始图像的尺寸相同,所述第二单通道图像的各像素为0值;
根据所述第二类目标点在所述原始图像中的像素位置,确定所述第二类目标点在所述第二单通道图像中的像素位置;
以所述第二类目标点在所述第二单通道图像中的像素位置为对应的圆心,以所述第二类目标点的权重乘以预设系数为对应的半径,在所述第二单通道图像中确定所述第二类目标点对应的圆盘掩码区域;
在所述第二单通道图像中为所述第二类目标点对应的圆盘掩码区域的像素赋负值,得到第二子掩码图像。
4.根据权利要求1所述的图像处理方法,其特征在于,所述基于所述分割掩码图像和所述原始图像,确定并显示目标图像,还包括:
基于所述分割掩码图像生成第一透明通道图像,其中,所述第一透明通道图像的透明度不为0,所述第一透明通道图像包括被配置为无色的第一透明区域和第二透明区域,所述第一透明区域对应所述前景分割区域,所述第二透明区域对应所述背景分割区域;
在所述第一透明通道图像中将所述第一透明区域配置为有色,得到第二透明通道图像;
将所述第二透明通道图像与所述原始图像叠加,得到所述目标图像;
显示所述目标图像。
5.根据权利要求1所述的图像处理方法,其特征在于,所述获取并显示原始图像之前,还包括:
获取包含待分割对象的图像样本;
从所述图像样本中获取前景蒙版和背景蒙版,其中,所述前景蒙版包含所述待分割对象对应的图像内容,所述背景蒙版包含所述待分割对象之外的图像内容;
从所述前景蒙版中采集第一类目标点样本,以及从所述背景蒙版中采集第二类目标点样本;
基于所述第一类目标点样本和所述第二类目标点样本对初始模型进行训练直至达到预设收敛条件,得到所述图像处理模型,其中,所述初始模型为基于自注意力机制预先构建。
6.根据权利要求5所述的图像处理方法,其特征在于,所述从所述前景蒙版中采集第一类目标点样本,以及从所述背景蒙版中采集第二类目标点样本,包括:
从所述前景蒙版中确定若干个第一类采样区域;确定各第一类采样区域的采样顺序;根据所述各第一类采样区域的采样顺序,依次在所述各第一类采样区域中随机采样,得到若干个附带顺序属性的第一类目标点样本;以及,
从所述背景蒙版中确定若干个第二类采样区域;确定各第二类采样区域的采样顺序;根据所述各第二类采样区域的采样顺序,依次在所述各第二类采样区域中随机采样,得到若干个附带顺序属性的第二类目标点样本。
7.根据权利要求5所述的图像处理方法,其特征在于,所述特征图像的通道数量为第一通道数量;所述初始模型包括第一层卷积层和第二层卷积层;所述第一层卷积层被配置为接收所述第一通道数量的图像作为输入,将所述第一通道数量的图像转换为第二通道数量的图像,将所述第二通道数量的图像传递至所述第二层卷积层,所述第一通道数量高于所述第二通道数量。
8.一种图像处理装置,其特征在于,所述装置包括:
获取模块,用于获取并显示原始图像;
第一确定模块,用于响应于对所述原始图像的点击操作,确定目标点以及所述目标点在点击操作历史记录中的点击顺序,根据所述目标点的点击顺序确定所述目标点的权重,其中,所述点击顺序与所述权重呈负相关;
第二确定模块,用于根据所述目标点以及所述目标点的权重确定子掩码图像;
第三确定模块,用于基于所述原始图像和所述子掩码图像,确定特征图像;
分割模块,用于通过预先训练好的图像处理模型从所述特征图像中识别前景分割区域和背景分割区域,基于所述前景分割区域和所述背景分割区域输出分割掩码图像;
第四确定模块,用于基于所述分割掩码图像和所述原始图像,确定并显示目标图像。
9.一种电子设备,其特征在于,所述电子设备包括:
存储器,用于存储可执行程序代码;
处理器,用于从所述存储器中调用并运行所述可执行程序代码,使得所述电子设备执行如权利要求1至7中任意一项所述的方法。
10.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质存储有计算机程序,当所述计算机程序被执行时,实现如权利要求1至7中任意一项所述的方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202410521542.7A CN118096797A (zh) | 2024-04-28 | 2024-04-28 | 图像处理方法、装置、电子设备及存储介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202410521542.7A CN118096797A (zh) | 2024-04-28 | 2024-04-28 | 图像处理方法、装置、电子设备及存储介质 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN118096797A true CN118096797A (zh) | 2024-05-28 |
Family
ID=91153641
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202410521542.7A Pending CN118096797A (zh) | 2024-04-28 | 2024-04-28 | 图像处理方法、装置、电子设备及存储介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN118096797A (zh) |
Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110415253A (zh) * | 2019-05-06 | 2019-11-05 | 南京大学 | 一种基于深度神经网络的点交互式医学图像分割方法 |
WO2021150017A1 (en) * | 2020-01-23 | 2021-07-29 | Samsung Electronics Co., Ltd. | Method for interactive segmenting an object on an image and electronic computing device implementing the same |
CN116109656A (zh) * | 2023-02-20 | 2023-05-12 | 河北大学 | 一种基于无监督学习的交互式图像分割方法 |
CN116824138A (zh) * | 2023-06-12 | 2023-09-29 | 香港中文大学(深圳) | 基于点击点影响增强的交互式图像分割方法及设备 |
CN116977359A (zh) * | 2022-11-15 | 2023-10-31 | 腾讯数码(天津)有限公司 | 图像处理方法、装置、设备、可读存储介质及程序产品 |
CN117372701A (zh) * | 2023-12-07 | 2024-01-09 | 厦门瑞为信息技术有限公司 | 基于Transformer的交互式图像分割方法 |
-
2024
- 2024-04-28 CN CN202410521542.7A patent/CN118096797A/zh active Pending
Patent Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110415253A (zh) * | 2019-05-06 | 2019-11-05 | 南京大学 | 一种基于深度神经网络的点交互式医学图像分割方法 |
WO2021150017A1 (en) * | 2020-01-23 | 2021-07-29 | Samsung Electronics Co., Ltd. | Method for interactive segmenting an object on an image and electronic computing device implementing the same |
CN116977359A (zh) * | 2022-11-15 | 2023-10-31 | 腾讯数码(天津)有限公司 | 图像处理方法、装置、设备、可读存储介质及程序产品 |
CN116109656A (zh) * | 2023-02-20 | 2023-05-12 | 河北大学 | 一种基于无监督学习的交互式图像分割方法 |
CN116824138A (zh) * | 2023-06-12 | 2023-09-29 | 香港中文大学(深圳) | 基于点击点影响增强的交互式图像分割方法及设备 |
CN117372701A (zh) * | 2023-12-07 | 2024-01-09 | 厦门瑞为信息技术有限公司 | 基于Transformer的交互式图像分割方法 |
Non-Patent Citations (1)
Title |
---|
K. SOFIIUK, I. PETROV, O. BARINOVA AND A. KONUSHIN: "F-BRS: Rethinking Backpropagating Refinement for Interactive Segmentation", 2020 IEEE/CVF CONFERENCE ON COMPUTER VISION AND PATTERN RECOGNITION (CVPR), 5 August 2020 (2020-08-05) * |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP6799146B2 (ja) | 視覚化されたスライド全域画像分析を提供するためのデジタル病理学システムおよび関連するワークフロー | |
KR102014377B1 (ko) | 학습 기반 수술동작 인식 방법 및 장치 | |
TWI777092B (zh) | 一種圖像處理方法、電子設備及存儲介質 | |
US20210018742A1 (en) | Augmented reality microscope for pathology with overlay of quantitative biomarker data | |
CN113474811A (zh) | 数字病理学图像中的感兴趣区域的基于神经网络的标识 | |
CN108388882B (zh) | 基于全局-局部rgb-d多模态的手势识别方法 | |
KR20210107667A (ko) | 이미지 분할 방법 및 장치, 전자 기기 및 저장 매체 | |
CN107516319A (zh) | 一种高精度简易交互式抠图方法、存储设备及终端 | |
JP2021512446A (ja) | 画像処理方法、電子機器および記憶媒体 | |
US8692846B2 (en) | Image processing apparatus, method for retouching images based upon user applied designated areas and annotations | |
CN110619318A (zh) | 基于人工智能的图像处理方法、显微镜、***和介质 | |
WO2020174862A1 (ja) | 情報処理装置、情報処理方法および情報処理システム | |
WO2021213068A1 (zh) | 基于人工智能的图像显示方法、装置、设备及介质 | |
CN110648762A (zh) | 病灶区识别模型生成方法、装置及病灶区识别方法、装置 | |
CN112085663A (zh) | 利用上下文感知传感器和多维姿势输入生成增强数字图像 | |
CN111754431B (zh) | 一种图像区域替换方法、装置、设备及存储介质 | |
JP2020038600A (ja) | 医療システム、医療装置および医療方法 | |
CN105580050A (zh) | 提供图像中的控制点 | |
US20140198177A1 (en) | Realtime photo retouching of live video | |
CN114372931A (zh) | 一种目标对象虚化方法、装置、存储介质及电子设备 | |
CN117333928B (zh) | 一种人脸特征点检测方法、装置、电子设备及存储介质 | |
CN113052166A (zh) | 病理图像的显示方法及装置 | |
CN110047126B (zh) | 渲染图像的方法、装置、电子设备和计算机可读存储介质 | |
CN112819741A (zh) | 一种图像融合方法、装置,电子设备及存储介质 | |
Kim et al. | Interactive image segmentation using semi-transparent wearable glasses |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |