CN109635669A - 图像分类方法、装置及分类模型的训练方法、装置 - Google Patents
图像分类方法、装置及分类模型的训练方法、装置 Download PDFInfo
- Publication number
- CN109635669A CN109635669A CN201811381979.6A CN201811381979A CN109635669A CN 109635669 A CN109635669 A CN 109635669A CN 201811381979 A CN201811381979 A CN 201811381979A CN 109635669 A CN109635669 A CN 109635669A
- Authority
- CN
- China
- Prior art keywords
- image
- medical image
- eye
- disaggregated model
- eye medical
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V40/00—Recognition of biometric, human-related or animal-related patterns in image or video data
- G06V40/10—Human or animal bodies, e.g. vehicle occupants or pedestrians; Body parts, e.g. hands
- G06V40/18—Eye characteristics, e.g. of the iris
- G06V40/193—Preprocessing; Feature extraction
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/21—Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
- G06F18/214—Generating training patterns; Bootstrap methods, e.g. bagging or boosting
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/24—Classification techniques
- G06F18/241—Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches
- G06F18/2411—Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches based on the proximity to a decision surface, e.g. support vector machines
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V40/00—Recognition of biometric, human-related or animal-related patterns in image or video data
- G06V40/10—Human or animal bodies, e.g. vehicle occupants or pedestrians; Body parts, e.g. hands
- G06V40/18—Eye characteristics, e.g. of the iris
- G06V40/197—Matching; Classification
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Data Mining & Analysis (AREA)
- General Physics & Mathematics (AREA)
- Physics & Mathematics (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Evolutionary Biology (AREA)
- Evolutionary Computation (AREA)
- Bioinformatics & Computational Biology (AREA)
- General Engineering & Computer Science (AREA)
- Artificial Intelligence (AREA)
- Life Sciences & Earth Sciences (AREA)
- Health & Medical Sciences (AREA)
- General Health & Medical Sciences (AREA)
- Ophthalmology & Optometry (AREA)
- Human Computer Interaction (AREA)
- Multimedia (AREA)
- Image Analysis (AREA)
Abstract
本发明提供了一种图像分类方法、装置及分类模型的训练方法、装置,将待分类的眼部医学图像划分为至少包括两个主分区的多个区域;然后将所述两个主分区的图像输入到预先训练好的分类模型,根据所述分类模型对所述两个主分区的图像中左右眼区分要素进行识别;根据所述两个主分区的识别结果的差异,确定所述眼部医学图像的分类。在整个分类过程中,可以不需要使用GPU,计算复杂度低,同时,在将眼部医学图像进行左右眼识别时,不需要去定位左右眼区分要素的具***置,只需要比较要素更可能在眼部医学图像的哪个主分区中即可得到分类结果,以此达到对眼部医学图像进行左右眼分类的目的,避免了阈值选择的问题。
Description
技术领域
本发明涉及图像处理技术领域,具体而言,涉及一种图像分类方法、装置及分类模型的训练方法、装置。
背景技术
在眼科临床医学中,经常依靠眼部医学图像作为生理判断的依据,其中眼科的诊断和处置是针对眼(而非人)作出的,正确的“眼别”是正确诊断和处置的基础。比如,在临床上检测后极部(指视盘以及颞侧上下血管弓周围内在的范围)眼底图为左眼还是右眼,一方面有助于定位病灶,另一方面有助于将来在眼底自动诊断***中对左右眼使用不同的诊断模型。如果诊断时不能正确识别眼别,导致在眼球摘除术中进行了错误的处置,后果将不堪设想。同时,在眼底彩照研究工作中,各种辅助性实验是在左右眼图像上分开进行的。因此,将眼底后极部眼底图像进行左右分类非常有必要。但对于大量的影像数据,不可能完全依靠人工识别,需要机器辅助处理以减轻临床工作压力以及错误造成的风险,但现有技术中机器识别的效率和准确性尚难以保证,严重制约了眼部医学图像的深入应用。
在现有的技术方案中,一般采用人工标记方法和基于视盘定位的自动检测方法来对眼底后极部眼底图像进行左右分类。但是人工标记方法效率低;在基于视盘定位的自动检测方法中,对视盘的定位和视盘区域的血管进行分割,中间涉及到各种阈值,使得定位本身就存在一定的误差,使得准确度较低。
发明内容
有鉴于此,本发明实施例的目的在于提供一种图像分类方法、装置及分类模型的训练方法、装置,以帮助识别眼部医学图像的类别。
第一方面,本发明实施例提供了一种图像分类方法,所述方法包括:将待分类的眼部医学图像划分为至少包括两个主分区的多个区域;将所述两个主分区的图像输入到预先训练好的分类模型,根据所述分类模型对所述两个主分区的图像中左右眼区分要素进行识别;根据所述两个主分区的识别结果的差异,确定所述眼部医学图像的分类。
第二方面,本发明实施例提供一种分类模型的训练方法,所述方法包括:获取至少一个样本眼部医学图像及所述样本眼部医学图像的标注信息;其中,所述标注信息包括对所述样本眼部医学图像的至少两个主分区的赋值;将所述样本眼部医学图像及所述标注信息输入分类模型进行训练,根据所述分类模型对所述两个主分区的图像中左右眼区分要素进行识别;得到根据所述两个主分区的识别结果的差异确定所述样本眼部医学图像的分类的优选模型参数。
第三方面,本发明实施例提供了一种图像分类装置,所述装置包括:分区模块,用于将待分类的眼部医学图像划分为至少包括两个主分区的多个区域;识别模块,用于将所述两个主分区的图像输入到预先训练好的分类模型,根据所述分类模型对所述两个主分区的图像中左右眼区分要素进行识别;分类确定模块,用于根据所述两个主分区的识别结果的差异,确定所述眼部医学图像的分类。
第四方面,本发明实施例提供一种分类模型的训练装置,其特征在于,所述装置包括:获取模块,用于获取至少一个样本眼部医学图像及所述样本眼部医学图像的标注信息;其中,所述标注信息包括对所述样本眼部医学图像的至少两个主分区的赋值;训练模块,用于将所述样本眼部医学图像及所述标注信息输入分类模型进行训练,根据所述分类模型对所述两个主分区的图像中左右眼区分要素进行识别;参数确定模块,用于得到根据所述两个主分区的识别结果的差异确定所述样本眼部医学图像的分类的优选模型参数。
第五方面,本发明实施例提供一种电子设备,该电子设备包括处理器以及与所述处理器连接的存储器,所述存储器内存储计算机程序,当所述计算机程序被所述处理器执行时,使得所述电子设备执行本发明实施例所述的方法。
第六方面,本发明实施例提供一种计算机可读存储介质,所述计算机可读存储介质中存储有计算机程序,当所述计算机程序在计算机上运行时,使得所述计算机执行本发明实施例所述的方法。
与现有技术相比,本发明各实施例提出的图像分类方法、装置及分类模型的训练方法、装置的有益效果是:在进行分类时,将待分类的眼部医学图像划分为至少包括两个主分区的多个区域;然后将所述两个主分区的图像输入到预先训练好的分类模型,根据所述分类模型对所述两个主分区的图像中左右眼区分要素进行识别;根据所述两个主分区的识别结果的差异,确定所述眼部医学图像的分类。在整个分类过程中,可以不需要使用GPU(Graphics Processing Unit,图像处理单元),计算复杂度低,同时,在将眼部医学图像进行左右眼区分时,不需要去定位左右眼区分要素的具***置,只需要比较左右眼区分要素更可能在眼部医学图像的哪个主分区即可得到分类结果,以此达到对眼部医学图像进行左右眼分类的目的,避免了阈值选择的问题。
为使本发明的上述目的、特征和优点能更明显易懂,下文特举较佳实施例,并配合所附附图,作详细说明如下。
附图说明
为了更清楚地说明本发明实施例的技术方案,下面将对实施例中所需要使用的附图作简单地介绍,应当理解,以下附图仅示出了本发明的某些实施例,因此不应被看作是对范围的限定,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他相关的附图。
图1为本发明实施例提供的电子设备的结构示意图;
图2为本发明第一实施例提供的图像分类方法的流程图;
图3为本发明第二实施例提供的分类模型的训练方法的流程图;
图4为本发明第三实施例提供的图像分类装置的结构框图;
图5为本发明第四实施例提供的图像分类装置的结构框图。
具体实施方式
下面将结合本发明实施例中附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。通常在此处附图中描述和示出的本发明实施例的组件可以以各种不同的配置来布置和设计。因此,以下对在附图中提供的本发明的实施例的详细描述并非旨在限制要求保护的本发明的范围,而是仅仅表示本发明的选定实施例。基于本发明的实施例,本领域技术人员在没有做出创造性劳动的前提下所获得的所有其他实施例,都属于本发明保护的范围。
应注意到:相似的标号和字母在下面的附图中表示类似项,因此,一旦某一项在一个附图中被定义,则在随后的附图中不需要对其进行进一步定义和解释。同时,在本发明的描述中,术语“第一”、“第二”等仅用于区分描述,而不能理解为指示或暗示相对重要性。
本发明实施例提供一种电子设备100的结构示意图,所述电子设备100可以是个人电脑(personal computer,PC)、平板电脑、智能手机、个人数字助理(personal digitalassistant,PDA)等。
如图1所示,所述电子设备100可以包括:图像分类装置和/或分类模型的训练装置、存储器110、存储控制器120、处理器130、外设接口140、输入输出单元150、音频单元160、显示单元170。
所述存储器110、存储控制器120、处理器130、外设接口140、输入输出单元150、音频单元160以及显示单元170各元件相互之间直接或间接地电性连接,以实现数据的传输或交互。例如,这些元件相互之间可通过一条或多条通讯总线或信号线实现电性连接。所述图像分类装置和/或分类模型的训练装置包括至少一个可以软件或固件(firmware)的形式存储于所述存储器110中或固化在客户端设备的操作***(operating system,OS)中的软件功能模块。所述处理器130用于执行存储器110中存储的可执行模块,例如所述图像分类装置和/或分类模型的训练装置包括的软件功能模块或计算机程序。
其中,存储器110可以是,但不限于,随机存取存储器(Random Access Memory,RAM),只读存储器(Read Only Memory,ROM),可编程只读存储器(Programmable Read-OnlyMemory,PROM),可擦除只读存储器(Erasable Programmable Read-Only Memory,EPROM),电可擦除只读存储器(Electric Erasable Programmable Read-Only Memory,EEPROM)等。其中,存储器110用于存储程序,所述处理器130在接收到执行指令后,执行所述程序,前述本发明实施例任一实施例揭示的流程定义的电子设备100所执行的方法可以应用于处理器130中,或者由处理器130实现。
处理器130可能是一种集成电路芯片,具有信号的处理能力。上述的处理器130可以是通用处理器,包括中央处理器(Central Processing Unit,简称CPU)、网络处理器(Network Processor,简称NP)等;还可以是数字信号处理器(DSP)、专用集成电路(ASIC)、现场可编程门阵列(FPGA)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件。可以实现或者执行本发明实施例中的公开的各方法、步骤及逻辑框图。通用处理器可以是微处理器或者该处理器也可以是任何常规的处理器等。
所述外设接口140将各种输入/输出装置耦合至处理器130以及存储器110。在一些实施例中,外设接口140,处理器130以及存储控制器120可以在单个芯片中实现。在其他一些实例中,他们可以分别由独立的芯片实现。
输入输出单元150用于提供给用户输入数据实现用户与电子设备100的交互。所述输入输出单元150可以是,但不限于,鼠标和键盘等。
音频单元160向用户提供音频接口,其可包括一个或多个麦克风、一个或者多个扬声器以及音频电路。
显示单元170在电子设备100与用户之间提供一个交互界面(例如用户操作界面)或用于显示图像数据给用户参考。在本实施例中,所述显示单元170可以是液晶显示器或触控显示器。若为触控显示器,其可为支持单点和多点触控操作的电容式触控屏或电阻式触控屏等。支持单点和多点触控操作是指触控显示器能感应到来自该触控显示器上一个或多个位置处同时产生的触控操作,并将该感应到的触控操作交由处理器130进行计算和处理。
第一实施例
请参照图2,图2是本发明第一实施例提供的一种图像分类方法的流程图。下面将对图2所示的流程进行详细阐述,所述方法包括:
步骤S110:将待分类的眼部医学图像划分为至少包括两个主分区的多个区域。
如前所述,在眼科临床医学中,正确识别眼部医学图像的眼别是有效诊治的基础。但对于大量的影像数据,现有技术往往需要人工经验或复杂的检测才能识别当前图像具体属于哪只眼睛,人工处理会因为经验不足或过于疲劳而失误;现有的机器检测方式(比如基于视盘定位的检测方式)的计算复杂度较高,又因图像质量参差、病变形态各异,识别阈值选择困难,效率及准确度难以保证。为实现便捷的自动检测,本申请依靠人工智能的方式对眼部医学图像中的关键要素进行识别,从而快速区分该图像的左右眼类别。其中,眼部医学图像可以是任意一张眼底图像、眼底OCT影像、眼外观图像或眼超声波图像等;进一步地,眼底图像优选为后极部眼底彩照。
为了使得后续得到的分类结果更加准确,作为一种可选的实施方式,可以将获取到的眼部医学图像的尺寸进行调整,使得眼部医学图像的尺寸与后续出现的用于训练分类模型时所采用的样本图像的尺寸一致。例如在训练分类模型时所用的样本图像的尺寸统一为720×720时,可以将获取到的待分类的眼部医学图像的尺寸也调整为720×720。
可选的,在将眼部医学图像划分为至少包括两个主分区的多个区域时,可以至少将所述眼部医学图像进行一次平均的纵向分割,得到左右两个主分区,当然,也可以对所述眼部医学图像进行多次任意方式的分割(包括任意位置的纵向分割、横向分割和任意直线/曲线分割等),得到多个主分区。这里主分区通常指图像划分后面积较大的区域,当然还可以指包括关键要素的区域。在图像划分的同时,还可根据分割方式对各个区域进行标记,以确定主分区的逻辑属性,比如主分区在图像中的位置。当然,确定主分区在图像中的位置还可以采用多种已知手段,比如根据主分区边界的坐标来确定等,在此不对其具体实现方式做出限制。
下面以将眼部医学图像划分为左右两个主分区为例进行介绍。其中,因图像质量参差、病变形态各异等原因,从图像中直接识别确定视盘、黄斑、血管等要素的存在难度较大,即单纯对单个分区打分很难有准确的阈值选择,故采用比较两个分区的识别结果的差异来判断左右属于较为优选的实施方式,该方式避免了复杂情况下阈值选择的困难。
作为一种可选的实施方式,可以随机将所述眼部医学图像进行纵向分割,得到左右两个主分区。此时,左分区以及右分区的尺寸大小可能不同。
作为另一种可选的实施方式,可以将所述眼部医学图像均分为左右两个主分区。此时,左分区以及右分区的尺寸大小相同。
步骤S120:将所述两个主分区的图像输入到预先训练好的分类模型,根据所述分类模型对所述两个主分区的图像中左右眼区分要素进行识别。
步骤S130:根据所述两个主分区的识别结果的差异,确定所述眼部医学图像的分类。
本申请技术方案中的图像分类主要是用来识别图像是属于左眼图像还是右眼图像,或者基于左右眼识别结果进一步确定图像的具体属性,比如确定图像类型、医学用途、病理情况等,鉴于现有技术中眼部医学图像按其具体属性有多种不同的用途,在此不对图像分类的具体模式做出限制。其中,左右眼区分要素主要指能帮助区分图像所采集的对象是左眼还是右眼的要素,典型地,可以是视盘、黄斑、血管和内眼角中的至少一个;由于这些要素在左右眼的眼部医学图像中会按一定规律呈现出不同的表现形式,故可用于帮助进行左右眼识别。比如视盘、黄斑、血管和内眼角在图像中出现的位置与左右眼有较为明确的关联,这些关联或规律属于本领域相关技术人员所熟知的内容,或者可采用统计的方式来确认,在此不再一一展开描述。
在分类模型对所述主分区的图像中左右眼区分要素进行识别时,可以对作为识别对象的主分区的图像中提取的图像特征进行识别。其中,所述识别至少包括对所述图像特征中包含所述左右眼区分要素的情况进行打分;当根据左右两个分区的差异确定分类时,所述分类模型可以为任意二分类的分类器模型,比如支持向量机SVM、最近邻法、决策树、LDA、人工神经网络等等。
可选的,可以对图像进行预处理,比如选取特定颜色通道的图像特征以减小色彩差异对识别结果的影响。所述颜色通道可以为红色通道、绿色通道或者蓝色通道中的至少一个通道。可选的,可以通过预先保存的OpenCV来提取预设颜色通道特征。当然,也可以通过其他的工具来提取预设颜色通道特征。
可选的,由于在眼部医学彩照中绿色通道表现的图像信息更完整,因此,在本发明实施例中,可以提取所述后极部眼部医学图像中的绿色通道的通道图像特征。
在提取图像特征时,可以根据分类模型的工作原理提取任意的图像特征;对于常用的图像识别模型,纹理特征通常比较有效,故优选提取图像的纹理特征。作为一种可选的实施方式,可以先提取眼部医学图像的局部二值模式(LBP,Local Binary Pattern)直方图特征和亮度直方图特征;并将所述局部二值模式直方图特征和亮度直方图特征进行拼接。当然,除LBP和颜色直方图外,可以使用的特征还有GLCM(灰度共生矩阵)、SIFT、SURF、Gabor等等,事实上现有典型的图像特征提取和图像识别方式均可有效应用于本申请的技术方案中,故在此不对特征提取的实现方式做出更具体的限制。
上述LBP直方图特征为25维特征,可以调用scikit-image库的feature.local_binary_pattern函数进行提取,亮度直方图特征为8维特征,可以通过OpenCV来提取。LBP直方图特征以及亮度直方图特征一方面描述了左右眼区分的纹理特征,另一方面也参考了左右眼区分区域亮度高于其他区域的特性。
作为另一种可选的实施方式,分类模型以两个主分区为识别对象来进行识别,得到识别结果。
在这种实施方式下,分类模型可以分别对两个主分区的图像中左右眼区分要素进行识别,得到多个分类分数。在发明本实施例中,以左右两个主分区为例来进行介绍。当得到与左右两个主分区分别对应的分类分数后,若左主分区的分类分数大于右主分区的分类分数时,表征左主分区包含左右眼区分的概率大于右主分区包含左右眼区分的概率,此时,确定左主分区包含左右眼区分,相应的,所述眼部医学图像就为左眼图像。反之,若左主分区的分类分数小于右主分区的分类分数时,表征左主分区包含左右眼区分的概率小于右主分区包含左右眼区分的概率,此时,确定右主分区包含左右眼区分,相应的,所述眼部医学图像就为右眼图像。
本发明第一实施例提供的一种图像分类方法,先获取待分类的眼部医学图像;然后将所述眼部医学图像划分为至少包括两个主分区的多个区域;然后将至少一个所述主分区的图像输入到预先训练好的分类模型,根据所述分类模型对至少一个所述主分区的图像中左右眼区分要素的识别结果,确定所述眼部医学图像的分类。在整个分类过程中,可以不需要使用GPU(Graphics Processing Unit,图像处理单元),计算复杂度低,同时,在将眼部医学图像进行左右眼区分时,不需要去定位左右眼区分的具***置,只需要比较左右眼区分更可能在后极部眼部医学图像的哪个主分区即可得到分类结果,以此达到对眼部医学图像进行左右眼分类的目的,避免了阈值选择的问题。
第二实施例
请参照图3,图3是本发明第二实施例提供的一种分类模型的训练方法的流程图。该分类模型可以对第一实施例中的眼部医学图像进行分类。下面将对图3所示的流程进行详细阐述,所述方法包括:
步骤S210:获取至少一个样本眼部医学图像及所述样本眼部医学图像的标注信息。
其中,样本眼部医学图像组成了训练集,训练集用于分类模型的训练,使分类模型学到特征。
可选的,每张样本眼部医学图的尺寸可以预先被调整成一致,例如都被调整为720×720。值得指出的是,每张样本眼部医学图像都至少被人为地划分为至少两个主分区的多个区域,每个主分区携带有表征是否包含左右眼区分的标注信息,在属于同一张样本图像的两个区域中,只有一个区域的标注信息表征包含有左右眼区分。例如对于同一张作为样本的样本眼部医学,包含左右眼区分的主分区的标注信息设置为1(label=1),不包含左右眼区分的主分区的标注信息设置为0(label=0)。
当然,值得指出的是,对于同一张作为样本的眼部医学图像而言,此处的包含左右眼区分与不包含左右眼区分是一个相对概念,可能该眼部医学图像的某一个主分区与另一个主分区均包含左右眼区分的一部分特征,此时,将两个主分区中包含左右眼区分的特征多少进行比对,将包含左右眼区分的特征多的主分区确定为包含左右眼区分的主分区,将包含左右眼区分的特征少的区域确定为不包含左右眼区分的主分区。
值得指出的是,上述对每张样本眼部医学图像划分为至少两个主分区与上文步骤S110一致,此处不再进行赘述。
步骤S220:将所述样本眼部医学图像及所述标注信息输入分类模型进行训练,根据所述分类模型对所述两个主分区的图像中左右眼区分要素进行识别。
步骤S230:得到根据所述两个主分区的识别结果的差异确定所述样本眼部医学图像的分类的优选模型参数。
如前所述,所述分类模型优选可以是通过调用来自scikit-learn库里的svm函数而得到的支持向量机(SVM,Support Vector Machine)。
可选的,在训练好分类模型后,可以将训练好的分类模型在验证集上进行准确率的验证,根据至少一个所述主分区的图像中左右眼区分要素的识别结果以选取最优参数,得到最优模型。
其中,训练集和验证集均可以从kaggle数据集中随机选择。
可选的,一种最优模型的参数为:线性核SVM,惩罚项C=1500。
第三实施例
请参照图4,图4是本发明第三实施例提供的一种图像分类装置400的结构框图。下面将对图4所示的结构框图进行阐述,所示装置包括:
分区模块410,用于将待分类的眼部医学图像划分为至少包括两个主分区的多个区域;
识别模块420,用于将所述两个主分区的图像输入到预先训练好的分类模型,根据所述分类模型对所述两个主分区的图像中左右眼区分要素进行识别;
分类确定模块430,用于根据所述两个主分区的识别结果的差异,确定所述眼部医学图像的分类。
可选的,所述识别模块420包括特征提取模块,用于在提取所述主分区的图像中的图像特征;所述识别至少包括对所述图像特征中包含所述左右眼区分要素的情况进行打分。
可选的,所述特征提取模块包括纹理提取模块,用于提取图像的纹理特征。
可选的,所述预设颜色通道为绿色通道,所述分类模型为支持向量机SVM。
可选的,所述分区模块410,用于至少将所述眼部医学图像纵向分割,得到左右两个主分区;其中,所述眼部医学图像为后极部眼部医学图像。
本实施例对图像分类装置400的各功能模块实现各自功能的过程,请参见上述图1至图2所示实施例中描述的内容,此处不再赘述。
第四实施例
请参照图5,图5是本发明第四实施例提供的一种分类模型的训练装置500的结构框图。下面将对图5所示的结构框图进行阐述,所示装置包括:
获取模块510,用于获取至少一个样本眼部医学图像及所述样本眼部医学图像的标注信息;其中,所述标注信息包括对所述样本眼部医学图像的至少两个主分区的赋值;
训练模块520,用于将所述样本眼部医学图像及所述标注信息输入分类模型进行训练,根据所述分类模型对所述两个主分区的图像中左右眼区分要素进行识别;
参数确定模块530,用于得到根据所述两个主分区的识别结果的差异确定所述样本眼部医学图像的分类的优选模型参数。
本实施例对分类模型的训练装置500的各功能模块实现各自功能的过程,请参见上述图3所示实施例中描述的内容,此处不再赘述。
此外,本发明实施例还提供了一种电子设备,包括处理器以及与所述处理器连接的存储器,所述存储器内存储计算机程序,当所述计算机程序被所述处理器执行时,使得所述电子设备执行第一实施例中任意一项实施方式所提供的图像分类方法。其中,电子设备的结构示意图可以参看图1。
此外,本发明实施例还提供了一种计算机可读存储介质,在该计算机可读存储介质中存储有计算机程序,当所述计算机程序在计算机上运行时,使得所述计算机执行本发明任一项实施方式所提供的图像分类方法。
综上所述,本发明实施例提出的图像分类方法、装置及分类模型的训练方法、装置,通过将待分类的眼部医学图像划分为至少包括两个主分区的多个区域;然后将所述两个主分区的图像输入到预先训练好的分类模型,根据所述分类模型对所述两个主分区的图像中左右眼区分要素进行识别;根据所述两个主分区的识别结果的差异,确定所述眼部医学图像的分类。在整个分类过程中,可以不需要使用GPU(Graphics Processing Unit,图像处理单元),计算复杂度低,同时,在将眼部医学图像进行左右眼识别时,不需要去定位左右眼区分要素的具***置,只需要比较要素更可能在后极部眼部医学图像的哪个主分区中即可得到分类结果,以此达到对眼部医学图像进行左右眼分类的目的,避免了阈值选择的问题。
在本申请所提供的几个实施例中,应该理解到,所揭露的装置和方法,也可以通过其它的方式实现。以上所描述的装置实施例仅仅是示意性的,例如,附图中的流程图和框图显示了根据本发明的多个实施例的装置、方法和计算机程序产品的可能实现的体系架构、功能和操作。在这点上,流程图或框图中的每个方框可以代表一个模块、程序段或代码的一部分,所述模块、程序段或代码的一部分包含一个或多个用于实现规定的逻辑功能的可执行指令。也应当注意,在有些作为替换的实现方式中,方框中所标注的功能也可以以不同于附图中所标注的顺序发生。例如,两个连续的方框实际上可以基本并行地执行,它们有时也可以按相反的顺序执行,这依所涉及的功能而定。也要注意的是,框图和/或流程图中的每个方框、以及框图和/或流程图中的方框的组合,可以用执行规定的功能或动作的专用的基于硬件的***来实现,或者可以用专用硬件与计算机指令的组合来实现。
另外,在本发明各个实施例中的各功能模块可以集成在一起形成一个独立的部分,也可以是各个模块单独存在,也可以两个或两个以上模块集成形成一个独立的部分。
所述功能如果以软件功能模块的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本发明各个实施例所述方法的全部或部分步骤。而前述的存储介质包括:U盘、移动硬盘、只读存储器(ROM,Read-Only Memory)、随机存取存储器(RAM,Random Access Memory)、磁碟或者光盘等各种可以存储程序代码的介质。需要说明的是,在本文中,诸如第一和第二等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来,而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括所述要素的过程、方法、物品或者设备中还存在另外的相同要素。
以上所述仅为本发明的优选实施例而已,并不用于限制本发明,对于本领域的技术人员来说,本发明可以有各种更改和变化。凡在本发明的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。应注意到:相似的标号和字母在下面的附图中表示类似项,因此,一旦某一项在一个附图中被定义,则在随后的附图中不需要对其进行进一步定义和解释。
以上所述,仅为本发明的具体实施方式,但本发明的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本发明揭露的技术范围内,可轻易想到变化或替换,都应涵盖在本发明的保护范围之内。因此,本发明的保护范围应所述以权利要求的保护范围为准。
Claims (11)
1.一种图像分类方法,其特征在于,所述方法包括:
将待分类的眼部医学图像划分为至少包括两个主分区的多个区域;
将所述两个主分区的图像输入到预先训练好的分类模型,根据所述分类模型对所述两个主分区的图像中左右眼区分要素进行识别;
根据所述两个主分区的识别结果的差异,确定所述眼部医学图像的分类。
2.根据权利要求1所述的方法,其特征在于,所述分类模型对所述主分区的图像中左右眼区分要素进行识别包括:
所述分类模型对所述主分区的图像中提取的图像特征进行识别;
所述识别至少包括对所述图像特征中包含所述左右眼区分要素的情况进行打分。
3.根据权利要求2所述的方法,其特征在于,所述提取的图像特征包括:图像的纹理特征。
4.根据权利要求1-3中任一项所述的方法,其特征在于,所述将所述眼部医学图像划分为至少包括两个主分区的多个区域包括:
至少将所述眼部医学图像纵向分割,得到左右两个主分区图像。
5.根据权利要求1所述的方法,其特征在于,所述分类模型为二分类的分类器模型。
6.根据权利要求1中任一项所述的方法,其特征在于,所述眼部医学图像包括眼底图像、眼底OCT影像、眼外观图像和眼超声波图像中的至少一种;所述左右眼区分要素包括视盘、黄斑、血管和眼眦中的至少一个。
7.一种分类模型的训练方法,其特征在于,包括:
获取至少一个样本眼部医学图像及所述样本眼部医学图像的标注信息;其中,所述标注信息包括对所述样本眼部医学图像的至少两个主分区的赋值;
将所述样本眼部医学图像及所述标注信息输入分类模型进行训练,根据所述分类模型对所述两个主分区的图像中左右眼区分要素进行识别;
得到根据所述两个主分区的识别结果的差异确定所述样本眼部医学图像的分类的优选模型参数。
8.一种图像分类装置,其特征在于,所述装置包括:
分区模块,用于将待分类的眼部医学图像划分为至少包括两个主分区的多个区域;
识别模块,用于将所述两个主分区的图像输入到预先训练好的分类模型,根据所述分类模型对所述两个主分区的图像中左右眼区分要素进行识别;
分类确定模块,用于根据所述两个主分区的识别结果的差异,确定所述眼部医学图像的分类。
9.一种分类模型的训练装置,其特征在于,所述装置包括:
获取模块,用于获取至少一个样本眼部医学图像及所述样本眼部医学图像的标注信息;其中,所述标注信息包括对所述样本眼部医学图像的至少两个主分区的赋值;
训练模块,用于将所述样本眼部医学图像及所述标注信息输入分类模型进行训练,根据所述分类模型对所述两个主分区的图像中左右眼区分要素进行识别;
参数确定模块,用于得到根据所述两个主分区的识别结果的差异确定所述样本眼部医学图像的分类的优选模型参数。
10.一种电子设备,其特征在于,包括处理器以及与所述处理器连接的存储器,所述存储器内存储计算机程序,当所述计算机程序被所述处理器执行时,使得所述电子设备执行权利要求1-7中任意一项所述的方法。
11.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质中存储有计算机程序,当所述计算机程序在计算机上运行时,使得所述计算机执行如权利要求1-7中任意一项所述的方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201811381979.6A CN109635669B (zh) | 2018-11-19 | 2018-11-19 | 图像分类方法、装置及分类模型的训练方法、装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201811381979.6A CN109635669B (zh) | 2018-11-19 | 2018-11-19 | 图像分类方法、装置及分类模型的训练方法、装置 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN109635669A true CN109635669A (zh) | 2019-04-16 |
CN109635669B CN109635669B (zh) | 2021-06-29 |
Family
ID=66068280
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201811381979.6A Active CN109635669B (zh) | 2018-11-19 | 2018-11-19 | 图像分类方法、装置及分类模型的训练方法、装置 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN109635669B (zh) |
Cited By (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110321952A (zh) * | 2019-07-02 | 2019-10-11 | 腾讯医疗健康(深圳)有限公司 | 一种图像分类模型的训练方法及相关设备 |
CN110826470A (zh) * | 2019-11-01 | 2020-02-21 | 复旦大学 | 基于深度主动学习的眼底图像左右眼识别方法 |
CN111046717A (zh) * | 2019-10-11 | 2020-04-21 | 平安科技(深圳)有限公司 | 眼底图像黄斑中心定位方法、装置、电子设备及存储介质 |
CN111967539A (zh) * | 2020-09-29 | 2020-11-20 | 北京大学口腔医学院 | 基于cbct数据库的颌面部骨折的识别方法、装置及终端设备 |
CN112101438A (zh) * | 2020-09-08 | 2020-12-18 | 南方科技大学 | 一种左右眼分类方法、装置、服务器和存储介质 |
CN116757915A (zh) * | 2023-08-16 | 2023-09-15 | 北京蓝耘科技股份有限公司 | 一种集群gpu资源调度方法 |
Citations (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2003034335A2 (en) * | 2001-10-11 | 2003-04-24 | Koninklijke Philips Electronics N.V. | Method and apparatus for discriminating between different regions of an image |
US20130163844A1 (en) * | 2011-12-21 | 2013-06-27 | Fuji Xerox Co., Ltd. | Image processing apparatus, image processing method, non-transitory computer-readable medium, and image processing system |
CN103348380A (zh) * | 2011-02-10 | 2013-10-09 | 日本电气株式会社 | 差异区域检测***和差异区域检测方法 |
US20150249815A1 (en) * | 2013-05-01 | 2015-09-03 | Legend3D, Inc. | Method for creating 3d virtual reality from 2d images |
CN105894656A (zh) * | 2016-03-30 | 2016-08-24 | 浙江大学 | 一种纸币图像识别方法 |
CN106326874A (zh) * | 2016-08-30 | 2017-01-11 | 天津中科智能识别产业技术研究院有限公司 | 一种人眼图像中的虹膜识别方法及其装置 |
CN107273872A (zh) * | 2017-07-13 | 2017-10-20 | 北京大学深圳研究生院 | 用于图像或视频中行人重识别的深度判别网络模型方法 |
CN107292877A (zh) * | 2017-07-05 | 2017-10-24 | 北京至真互联网技术有限公司 | 一种基于眼底图像特征的左右眼识别方法 |
CN107437238A (zh) * | 2016-05-25 | 2017-12-05 | 上海联影医疗科技有限公司 | 一种图像分块自适应递归降噪方法及装置 |
-
2018
- 2018-11-19 CN CN201811381979.6A patent/CN109635669B/zh active Active
Patent Citations (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2003034335A2 (en) * | 2001-10-11 | 2003-04-24 | Koninklijke Philips Electronics N.V. | Method and apparatus for discriminating between different regions of an image |
CN103348380A (zh) * | 2011-02-10 | 2013-10-09 | 日本电气株式会社 | 差异区域检测***和差异区域检测方法 |
US20130163844A1 (en) * | 2011-12-21 | 2013-06-27 | Fuji Xerox Co., Ltd. | Image processing apparatus, image processing method, non-transitory computer-readable medium, and image processing system |
US20150249815A1 (en) * | 2013-05-01 | 2015-09-03 | Legend3D, Inc. | Method for creating 3d virtual reality from 2d images |
CN105894656A (zh) * | 2016-03-30 | 2016-08-24 | 浙江大学 | 一种纸币图像识别方法 |
CN107437238A (zh) * | 2016-05-25 | 2017-12-05 | 上海联影医疗科技有限公司 | 一种图像分块自适应递归降噪方法及装置 |
CN106326874A (zh) * | 2016-08-30 | 2017-01-11 | 天津中科智能识别产业技术研究院有限公司 | 一种人眼图像中的虹膜识别方法及其装置 |
CN107292877A (zh) * | 2017-07-05 | 2017-10-24 | 北京至真互联网技术有限公司 | 一种基于眼底图像特征的左右眼识别方法 |
CN107273872A (zh) * | 2017-07-13 | 2017-10-20 | 北京大学深圳研究生院 | 用于图像或视频中行人重识别的深度判别网络模型方法 |
Non-Patent Citations (5)
Title |
---|
D. RAM NIVAS等: "Classification of Human Eye Image using Different Methods for Medical Applications", 《INTERNATIONAL JOURNAL OF ADVANCED RESEARCH IN COMPUTER AND COMMUNICATION ENGINEERING》 * |
李英杰等: "基于自学习特征的林业业务图像分类方法", 《林业科学》 * |
王玉亮: "眼底图像处理与分析中的关键技术研究", 《中国博士学位论文全文数据库_信息科技辑》 * |
肖玉玲等: "结合分块模糊熵和随机森林的图像分类方法", 《电子技术应用》 * |
钟志权等: "基于卷积神经网络的左右眼识别", 《计算机研究与发展》 * |
Cited By (10)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110321952A (zh) * | 2019-07-02 | 2019-10-11 | 腾讯医疗健康(深圳)有限公司 | 一种图像分类模型的训练方法及相关设备 |
CN110321952B (zh) * | 2019-07-02 | 2024-02-09 | 腾讯医疗健康(深圳)有限公司 | 一种图像分类模型的训练方法及相关设备 |
CN111046717A (zh) * | 2019-10-11 | 2020-04-21 | 平安科技(深圳)有限公司 | 眼底图像黄斑中心定位方法、装置、电子设备及存储介质 |
CN111046717B (zh) * | 2019-10-11 | 2024-01-30 | 平安科技(深圳)有限公司 | 眼底图像黄斑中心定位方法、装置、电子设备及存储介质 |
CN110826470A (zh) * | 2019-11-01 | 2020-02-21 | 复旦大学 | 基于深度主动学习的眼底图像左右眼识别方法 |
CN112101438A (zh) * | 2020-09-08 | 2020-12-18 | 南方科技大学 | 一种左右眼分类方法、装置、服务器和存储介质 |
CN112101438B (zh) * | 2020-09-08 | 2024-04-16 | 南方科技大学 | 一种左右眼分类方法、装置、服务器和存储介质 |
CN111967539A (zh) * | 2020-09-29 | 2020-11-20 | 北京大学口腔医学院 | 基于cbct数据库的颌面部骨折的识别方法、装置及终端设备 |
CN116757915A (zh) * | 2023-08-16 | 2023-09-15 | 北京蓝耘科技股份有限公司 | 一种集群gpu资源调度方法 |
CN116757915B (zh) * | 2023-08-16 | 2023-11-28 | 北京蓝耘科技股份有限公司 | 一种集群gpu资源调度方法 |
Also Published As
Publication number | Publication date |
---|---|
CN109635669B (zh) | 2021-06-29 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN109635669A (zh) | 图像分类方法、装置及分类模型的训练方法、装置 | |
WO2020151489A1 (zh) | 基于面部识别的活体检测的方法、电子设备和存储介质 | |
US9959617B2 (en) | Medical image processing apparatus and breast image processing method thereof | |
CN101689301B (zh) | 在ct图像数据中检测出血性卒中 | |
Harangi et al. | Automatic exudate detection by fusing multiple active contours and regionwise classification | |
CN107977671A (zh) | 一种基于多任务卷积神经网络的舌象分类方法 | |
CN107644213A (zh) | 视频人物提取方法及装置 | |
Zong et al. | U-net based method for automatic hard exudates segmentation in fundus images using inception module and residual connection | |
Harangi et al. | Automatic exudate detection using active contour model and regionwise classification | |
CN112384127B (zh) | 眼睑下垂检测方法及*** | |
CN112150477B (zh) | 脑影像动脉全自动分割方法及装置 | |
CN106157279A (zh) | 基于形态学分割的眼底图像病变检测方法 | |
Harangi et al. | Detection of exudates in fundus images using a Markovian segmentation model | |
CN111860369A (zh) | 一种欺诈识别方法、装置以及存储介质 | |
CN109614869A (zh) | 一种基于多尺度压缩奖惩网络的病理图像分类方法 | |
CN108369644A (zh) | 一种定量检测人脸抬头纹的方法和智能终端 | |
CN110163839A (zh) | 豹纹状眼底图像识别方法、模型训练方法及设备 | |
TWI587844B (zh) | 醫療影像處理裝置及其***影像處理方法 | |
CN103279960B (zh) | 一种基于x射线背散射图像的人体隐藏物的图像分割方法 | |
CN114816055A (zh) | 基于vr设备的眼球运动轨迹捕捉分析方法、装置及介质 | |
Shaik et al. | Glaucoma identification based on segmentation and fusion techniques | |
Li et al. | Application of Clustering‐Based Analysis in MRI Brain Tissue Segmentation | |
CN110428405A (zh) | 一种检测生物组织图像中肿块的方法、相应设备及介质 | |
CN103530595A (zh) | 检测眼睛状态的方法和设备 | |
CN113393445B (zh) | 乳腺癌影像确定方法及*** |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |