CN113032622A - 一种新型医学视频图像采集和数据管理*** - Google Patents
一种新型医学视频图像采集和数据管理*** Download PDFInfo
- Publication number
- CN113032622A CN113032622A CN202110372204.8A CN202110372204A CN113032622A CN 113032622 A CN113032622 A CN 113032622A CN 202110372204 A CN202110372204 A CN 202110372204A CN 113032622 A CN113032622 A CN 113032622A
- Authority
- CN
- China
- Prior art keywords
- image
- video image
- gradient
- medical video
- pixel
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Withdrawn
Links
- 238000013523 data management Methods 0.000 title claims description 17
- 238000000034 method Methods 0.000 claims abstract description 51
- 238000013441 quality evaluation Methods 0.000 claims abstract description 21
- 238000013527 convolutional neural network Methods 0.000 claims abstract description 17
- 238000007637 random forest analysis Methods 0.000 claims abstract description 17
- 238000013500 data storage Methods 0.000 claims abstract description 11
- 230000009466 transformation Effects 0.000 claims abstract description 9
- 239000013598 vector Substances 0.000 claims description 47
- 238000012545 processing Methods 0.000 claims description 23
- 230000008569 process Effects 0.000 claims description 18
- 239000011159 matrix material Substances 0.000 claims description 15
- 238000004422 calculation algorithm Methods 0.000 claims description 9
- 238000007726 management method Methods 0.000 claims description 9
- 238000013507 mapping Methods 0.000 claims description 6
- 238000010606 normalization Methods 0.000 claims description 6
- 238000012549 training Methods 0.000 claims description 6
- 238000004364 calculation method Methods 0.000 claims description 5
- 238000011426 transformation method Methods 0.000 claims description 5
- 238000011176 pooling Methods 0.000 claims description 4
- 230000003321 amplification Effects 0.000 claims description 3
- 238000013528 artificial neural network Methods 0.000 claims description 3
- 230000006835 compression Effects 0.000 claims description 3
- 238000007906 compression Methods 0.000 claims description 3
- 238000009499 grossing Methods 0.000 claims description 3
- 238000003199 nucleic acid amplification method Methods 0.000 claims description 3
- 230000002093 peripheral effect Effects 0.000 claims description 3
- 230000006870 function Effects 0.000 description 17
- 238000007635 classification algorithm Methods 0.000 description 5
- 210000000056 organ Anatomy 0.000 description 5
- 238000012360 testing method Methods 0.000 description 5
- 238000011161 development Methods 0.000 description 4
- 230000003902 lesion Effects 0.000 description 4
- 238000002474 experimental method Methods 0.000 description 3
- 238000011160 research Methods 0.000 description 3
- 238000010586 diagram Methods 0.000 description 2
- 239000003814 drug Substances 0.000 description 2
- 238000000605 extraction Methods 0.000 description 2
- 239000004973 liquid crystal related substance Substances 0.000 description 2
- 230000003287 optical effect Effects 0.000 description 2
- 230000008878 coupling Effects 0.000 description 1
- 238000010168 coupling process Methods 0.000 description 1
- 238000005859 coupling reaction Methods 0.000 description 1
- 238000001514 detection method Methods 0.000 description 1
- 238000003745 diagnosis Methods 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 239000000463 material Substances 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000003672 processing method Methods 0.000 description 1
- 238000005070 sampling Methods 0.000 description 1
- 230000000007 visual effect Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/70—Information retrieval; Database structures therefor; File system structures therefor of video data
- G06F16/71—Indexing; Data structures therefor; Storage structures
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/70—Information retrieval; Database structures therefor; File system structures therefor of video data
- G06F16/75—Clustering; Classification
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/70—Information retrieval; Database structures therefor; File system structures therefor of video data
- G06F16/78—Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually
- G06F16/783—Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually using metadata automatically derived from the content
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/24—Classification techniques
- G06F18/243—Classification techniques relating to the number of classes
- G06F18/24323—Tree-organised classifiers
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T3/00—Geometric image transformations in the plane of the image
- G06T3/40—Scaling of whole images or parts thereof, e.g. expanding or contracting
- G06T3/4007—Scaling of whole images or parts thereof, e.g. expanding or contracting based on interpolation, e.g. bilinear interpolation
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T7/00—Image analysis
- G06T7/0002—Inspection of images, e.g. flaw detection
- G06T7/0012—Biomedical image inspection
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/40—Extraction of image or video features
- G06V10/44—Local feature extraction by analysis of parts of the pattern, e.g. by detecting edges, contours, loops, corners, strokes or intersections; Connectivity analysis, e.g. of connected components
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T2207/00—Indexing scheme for image analysis or image enhancement
- G06T2207/10—Image acquisition modality
- G06T2207/10016—Video; Image sequence
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T2207/00—Indexing scheme for image analysis or image enhancement
- G06T2207/10—Image acquisition modality
- G06T2207/10024—Color image
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T2207/00—Indexing scheme for image analysis or image enhancement
- G06T2207/20—Special algorithmic details
- G06T2207/20081—Training; Learning
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T2207/00—Indexing scheme for image analysis or image enhancement
- G06T2207/30—Subject of image; Context of image processing
- G06T2207/30004—Biomedical image processing
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T2207/00—Indexing scheme for image analysis or image enhancement
- G06T2207/30—Subject of image; Context of image processing
- G06T2207/30168—Image quality inspection
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Data Mining & Analysis (AREA)
- Multimedia (AREA)
- General Engineering & Computer Science (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Databases & Information Systems (AREA)
- Library & Information Science (AREA)
- Software Systems (AREA)
- Health & Medical Sciences (AREA)
- Artificial Intelligence (AREA)
- Life Sciences & Earth Sciences (AREA)
- Bioinformatics & Computational Biology (AREA)
- Evolutionary Biology (AREA)
- Evolutionary Computation (AREA)
- Bioinformatics & Cheminformatics (AREA)
- General Health & Medical Sciences (AREA)
- Medical Informatics (AREA)
- Nuclear Medicine, Radiotherapy & Molecular Imaging (AREA)
- Radiology & Medical Imaging (AREA)
- Quality & Reliability (AREA)
- Measuring And Recording Apparatus For Diagnosis (AREA)
- Image Analysis (AREA)
Abstract
本发明涉及视频图像采集和存储的技术领域,揭露了一种医学视频图像采集和存储方法,包括:利用无参考质量评价模型对得到的每帧视频图像进行质量评估,计算最优医学视频图像;利用双立方插值变换初始化最优医学视频图像的图片;通过梯度强度和梯度方向计算检测图像梯度特征;利用卷积神经网络获得输出特征,并联合提取到的图像梯度特征,作为组合特征,利用随机森林分类器进行分类;基于最优医学视频图像分类信息建立索引,并利用高性能分布式存储结构进行医学影像视频数据存储。本发明还提出了一种新型医学视频图像采集和数据存储***。本发明实现了医学视频图像数据采集与数据存储。
Description
技术领域
本发明涉及视频数据处理和存储的技术领域,尤其涉及一种新型医学视频图像采集和数据管理方法。
背景技术
医学扫描视频数据是医学上判断器官病变和病灶发展的重要依据,对于医学类视频,医学研究者不仅要对病变情况进行判断,在同一个视频扫描到多个器官位置时,也需要对扫描到的器官进行辨别。
随着互联网的发展和医学的发达,可获取的医学视频影像数据越来越多,数据量越来越庞大,医学研究者也有了越来越多的研究参照和判别依据。但是作为学科分类细致的医学研究者们,如何提取同类器质的医学影像数据成为了亟待解决的问题。与此同时,如何对海量视频数据进行存储,也是需要解决的重点问题。
鉴于此,如何快速检索提取同类器质的信息和进行大容量存储,成为本领域技术人员亟待解决的问题。
发明内容
本发明提供一种医学视频图像采集和数据管理存储方法,通过利用无参考质量评价模型对视频图像进行质量评估得到最优医学视频图像,并利用双立方插值变换初始化最优医学视频图像的图片统一图像规格,检测梯度特征,同时利用卷积神经网络获得输出特征,输入到随机森林分类器中进行分类,最终利用高性能分布式存储结构进行医学影像视频数据存储,实现分类检索。
为实现上述目的,本发明提供的一种新型医学视频图像采集和数据管理方法,包括:
利用无参考质量评价模型对得到的每帧视频图像进行质量评估,计算最优医学视频图像;
利用双立方插值变换初始化最优医学视频图像的图片,得到目标规格的图像;
通过梯度强度和梯度方向计算检测目标规格图像的梯度特征;
利用卷积神经网络获得输出特征,并联合提取到的图像梯度特征,作为组合特征,利用随机森林分类器进行分类;
基于最优医学视频图像分类信息建立索引,利用高性能分布式存储结构进行医学影像视频数据存储。
可选地,所述利用无参考质量评价模型对得到的每帧视频图像进行质量评估,计算最优医学视频图像,包括:
1)灰度化压缩后图像,计算相邻帧像素点的灰度值,对于一个像素点(i,j),其灰度值为L(i,j):
其中:
R(i,j)、G(i,j)、B(i,j)分别为像素点(i,j)在R、G、B颜色通道的色彩度;
2)将每一像素点(i,j)按照3×3区域滑动,计算区域内灰度值高斯均值μ(i,j)为:
其中:
高斯核wk,h为2维循环对称高斯权重函数;
Lk,h(i,j)为区域中心点像素灰度值;
得到区域方差为:
因此区域亮度系数为:
计算每一点区域亮度系数得到亮度系数矩阵M:
其中:
n为压缩后图像的像素行数,m为压缩后图像的像素列数;
4)利用零均值的广义高斯分布模型对亮度系数矩阵M进行拟合,所述零均值的广义高斯分布模型表示如下:
其中:
x在[0,+∞]内任意取值;
α控制广义高斯分布的形状,α∈(0.5,8.5),在拟合过程中随机取值;
σ控制广义高斯分布的方差;
Γ(·)为gamma函数;
计算尺度函数β的公式为:
用矩匹配算法拟合得到估计参数(α,σ),并将估计参数作为图像的二维估计特征;
4)将中心像素点与周边四个方向像素点亮度系数进行内积,获得像素点的内积矩阵;所述像素点内积矩阵如下所示:
H(i,j)=L′(i,j)*L′(i,j+1)
V(i,j)=L′(i,j)*L′(i+1,j)
D(i,j)=L′(i,j)*L′(i+1,j+1)
N(i,j)=L′(i,j)*L′(i+1,j-1)
其中:
v控制广义高斯分布的形状,在拟合过程中的范围与α相同;
继而得到特征η:
6)将所述16维特征向量与二维估计特征进行拼接处理,得到18维特征向量;利用所述18维特征向量去训练一个SVM概率分类器以及支持向量回归器(SVR),利用SVM概率分类器输出图像在该失真类型的概率值,并利用支持向量回归器(SVR)输出该失真类型得分;最终质量为上述概率值和类型得分的乘积;联合上下时域,得到附近15帧中质量最优的医学视频图像。
可选地,所述利用双立方插值变换方法初始化质量最优的医学视频图像最优医学视频图像,包括:
将质量最优的医学视频图像像素点p(x,y)映射到指定大小的目标规格图像的位置P(X,Y),所述利用双立方插值变换方法进行图像像素映射的流程为:
构造核函数计算质量最优的医学视频图像中邻域像素点对目标像素点的权重,核函数BiCubic公式为:
其中:
∈表示目标规格邻域像素点到P点的距离,如邻域像素点为(Xi,Yj),横坐标上∈取值即为X-Xi;
a为参数,将其取值为0.5;
利用核函数得到目标图像在P(X,Y)像素值;
其中:
i和j分别为取值0到3之间的自然数;
p(xi,xj)为质量最优的医学视频图像像素;
(Xi,Yj)为邻域点坐标;
按照以上方式计算目标图像所有像素点的像素值,即得到目标规格的图像;在本发明一个具体实施例中,所述目标规格为224*224像素大小的规格。
可选地,所述通过梯度强度和梯度方向计算检测图像梯度特征,包括:
1)使用高斯滤波器对目标规格图像的灰度图进行卷积处理,得到平滑后的灰度值;所述卷积处理的公式为:
其中:
f为灰度图中像素(x,y)的灰度值;
gλ(x,y)为平滑后的像素灰度值;
λ为分布参数,数值越大则边缘曲线越平滑,将λ设置为0.4;
2)利用sobel算子分别与平滑后的图像像素在水平与垂直方向上进行卷积,即:
水平方向上:
dx(x,y)=[gλ(x,y+1)-gλ(x,y)+gλ(x+1,y+1)-gλ(x+1,y)]/2
垂直方向上:
dy(x,y)=[gλ(x+1,y)-gλ(x,y)+gλ(x+1,y+1)-gλ(x,y+1)]/2
其中:
dx(x,y)、dy(x,y)分别为像素(x,y)在水平和垂直方向上的像素增幅;
计算图像梯度强度M(x,y)和梯度方向θm:
M(x,y)=|dx(x,y)|+|dy(x,y)|
θm=arctan(dy/dx)
其中:
arctan为反正切函数;
3)设每16*16的像素为一个细胞,每2*2个细胞组成一个扫描窗口,以16个像素为步长,水平方向将有13个扫描窗口,垂直方向将有13个扫描窗口;
每个细胞根据角度与权重建立角度直方图,角距为20度,因此每个细胞得到9个梯度向量,每一次扫描即得到当前窗口的36个梯度向量;
将一个窗口的梯度向量组合起来进行归一化,归一化公式为:
其中:
KI(i)为第i个梯度向量归一化后的值;
N为所有向量值平方开根号相加之和;
ki为第i个梯度向量;
得到36*1维的归一化向量,即为一个窗口的特征点。
可选地,所述利用卷积神经网络获得输出特征,并联合提取到的图像梯度特征,作为组合特征,利用随机森林分类器进行分类,包括:
所述卷积神经网络部分采用VGG_16的结构,构建5层卷积层,卷积核大小皆为3×3像素,卷积步长为1;层与层之间使用最大化池分开,池化单元大小为2*2,所有层后都采用ReLU函数进行激活;卷积层后连接前2个全连接层,将图像梯度特征作为卷积神经网络的输入,得到4096维多尺度特征向量;
利用随机森林分类器代替softmax层执行分类,输入图像梯度特征和4096维多尺度特征向量,输出为最优医学视频图像分类;并将最优医学视频图像作为该段视频的标识点,最优医学视频图像分类即为对应的视频信息分类。
可选地,所述基于最优医学视频图像分类信息建立索引,利用高性能分布式存储结构进行医学影像视频数据存储,包括:
1)获取医学视频的时间信息、名称信息,并将每一个视频获取终端唯一标识记为Mid,其中Mid为视频信息分类结果、医学视频的时间信息以及名称信息的hash值;采用最优医学视频图像作为图像时序表达,一个最优医学视频图像对应存储15帧视频信息;
2)将键值对数据库作为数据管理引擎,创建一级索引作为目录管理,存储录像段信息,一个录像段包含录像段的起始时间、时长以及对应的存储服务器组ID等,并将Mid作为Key值,按起始时间排序的录像段记录列表作为对应的Value值;
3)创建二级索引作为存储管理,基本的索引单元为最优医学视频图像,其中一个最优医学视频图像的描述信息包括该帧对应视频信息的起始时间戳、存放的磁盘号、分配的磁盘空间位置、位置内偏移和分类等信息,并将Mid作为Key值,按时间戳有序的最优医学视频图像描述信息列表作为对应的Value值;
4)将存储服务器按照按照每组多台进行分组,构成存储集群,组内任意两台服务器互为备份,一个组的存储容量由存储容量最小的服务器决定,集群最大容量为所有组总容量。
此外,为实现上述目的,本发明还提供视频图像采集和数据存储装置,所述装置包括:
视频获取设备,用于接收医学视频并将其上传至视频处理装置中进行压缩;
图像处理单元,用于利用无参考质量评价模型对得到的每帧图像进行质量评估,计算最优医学视频图像并利用双立方插值变换初始化最优医学视频图像的图片,得到目标规格的图像;
图像分类器,用于通过梯度强度和梯度方向计算检测梯度特征;利用卷积神经网络获得输出特征,并联合提取到的图像梯度特征,作为组合特征输入到随机森林分类器,对处理得到的图像进行分类;
视频存储装置,用于利用高性能分布式存储结构进行医学影像视频数据存储,并基于最优医学视频图像分类信息建立索引;
视频检索终端,用于检索视频信息。
此外,为实现上述目的,本发明还提供一种图像分类单元,所述图像分类单元上存储有视频图像数据分类程序指令,所述视频图像分类程序指令可被一个或者多个处理器执行,以实现如上所述的视频图像处理的实现方法的步骤。
相对于现有技术,本发明提出一种视频图像采集和数据存储方法,该技术具有以下优势:
首先,相较于传统的图像特征提取方法,本发明通过梯度强度和梯度方向计算检测梯度特征时,忽略方向角度对图片特征的影响,相同物体对不同角度、大小可以提取到相同的特征,提高了特征精度和准确性,降低了局部误差影响。同时,本发明利用卷积神经网络对梯度特征进行特征提取得到输出特征,联合图像梯度特征,作为组合特征输入到随机森林分类器,对处理得到的图像进行分类,所述卷积神经网络部分采用VGG_16的结构,保障复杂学***方向将有13个扫描窗口,垂直方向将有13个扫描窗口;每个细胞根据角度与权重建立角度直方图,角距为20度,因此每个细胞得到9个梯度向量,每一次扫描即得到当前窗口的36个梯度向量,图片梯度特征的提取增加分类特征的维度,丰富了特征信息,对于分类准确性能够较好的提升,增加了结果的可解释性。
与此同时,在医学扫描视频存储中一般采用时序存储和检索的方式,对于在同一视频中出现的不同的器官和病变往往需要人为判断,工作效率低且匹配需要的信息速度较慢。一般的存储管理使用视频时间等信息作为检索,在使用过程中提供辅助判断需要经过长时间的搜索和匹配,利用分类信息创建键值对建立索引将在查询时可以直接查询同类别的数据,也使得医学研究领域能够自动获取高匹配度的研究材料,医生和研究人员获得一个设备记录下的最感兴趣的部位和信息,可以更好地辅助诊断。在数据存储过程中,本发明将存储过程中元数据设计为为两级索引结构,分为存放于状态管理器和存储服务器管理,一级索引位于状态管理器,主要存储视频唯一编号、起始时间和存储组ID,而二级索引位于存储服务器上,存放具体数据位置分类信息,这样状态管理器上数据量会减少,进而能够提供更快的检索速度。并且本发明提供的数据存储结构按照多台进行分组,每组至少两台服务器,可以在组间和组内增加服务器进行扩展,这种方式具备灵活的分组策略,能够满足***存储量增长时***进行动态扩容。同时,每个分组间互为备份也是其具备更高的灵活性,同时保障了扩展的可行性。
附图说明
图1为本发明一实施例提供的一种视频图像采集和数据存储方法的流程示意图;
图2为本发明一实施例提供的一种新型视频图像采集和数据存储***的结构示意图;
本发明目的的实现、功能特点及优点将结合实施例,参照附图做进一步说明。
具体实施方式
应当理解,此处所描述的具体实施例仅仅用以解释本发明,并不用于限定本发明。
通过利用无参考质量评价模型对视频图像进行质量评估得到最优医学视频图像,并利用双立方插值变换初始化最优医学视频图像的图片统一图像规格,检测梯度特征,同时利用卷积神经网络获得输出特征,输入到随机森林分类器中进行分类,最终利用高性能分布式存储结构进行医学影像视频数据存储,实现分类检索。参照图1所示,为本发明一实施例提供的视频图像采集和数据存储方法示意图。
在本实施例中,视频图像采集与数据存储方法包括:
S1、利用无参考质量评价模型对得到的每帧视频图像进行质量评估,计算最优医学视频图像。
首先,本发明采集医学视频中的每一帧医学视频图像,并利用无参考质量评价模型对得到的每帧视频图像进行质量评估,所述对每帧视频图像进行质量评估的流程为:
1)灰度化压缩后图像,计算相邻帧像素点的灰度值,对于一个像素点(i,j),其灰度值为L(i,j):
其中:
R(i,j)、G(i,j)、B(i,j)分别为像素点(i,j)在R、G、B颜色通道的色彩度;
2)将每一像素点(i,j)按照3×3区域滑动,计算区域内灰度值高斯均值μ(i,j)为:
其中:
高斯核wk,h为2维循环对称高斯权重函数;
Lk,h(i,j)为区域中心点像素灰度值;
得到区域方差为:
因此区域亮度系数为:
计算每一点区域亮度系数得到亮度系数矩阵M:
其中:
n为压缩后图像的像素行数,m为压缩后图像的像素列数;
3)利用零均值的广义高斯分布模型对亮度系数矩阵M进行拟合,所述零均值的广义高斯分布模型表示如下:
其中:
x在[0,+∞]内任意取值;
α控制广义高斯分布的形状,α∈(0.5,8.5),在拟合过程中随机取值;
σ控制广义高斯分布的方差;
Γ(·)为gamma函数;
计算尺度函数β的公式为:
用矩匹配算法拟合得到估计参数(α,σ),并将估计参数作为图像的二维估计特征;
4)将中心像素点与周边四个方向像素点亮度系数进行内积,获得像素点的内积矩阵;所述像素点内积矩阵如下所示:
H(i,j)=L′(i,j)*L′(i,j+1)
V(i,j)=L′(i,j)*L′(i+1,j)
D(i,j)=L′(i,j)*L′(i+1,j+1)
N(i,j)=L′(i,j)*L′(i+1,j-1)
其中:
v控制广义高斯分布的形状,在拟合过程中的范围与α相同;
继而得到特征η:
6)将所述16维特征向量与二维估计特征进行拼接处理,得到18维特征向量;利用所述18维特征向量去训练一个SVM概率分类器以及支持向量回归器(SVR),利用SVM概率分类器输出图像在该失真类型的概率值,并利用支持向量回归器(SVR)输出该失真类型得分;最终质量为上述概率值和类型得分的乘积;联合上下时域,得到附近15帧中质量最优的医学视频图像。
S2、利用双立方插值变换初始化最优医学视频图像,得到目标规格图像。
将质量最优的医学视频图像像素点p(x,y)映射到指定大小的目标规格图像的位置P(X,Y),所述利用双立方插值变换方法进行图像像素映射的流程为:
构造核函数计算质量最优的医学视频图像中邻域像素点对目标像素点的权重,核函数BiCubic公式为:
其中:
∈表示目标规格邻域像素点到P点的距离,如邻域像素点为(Xi,Yj),横坐标上∈取值即为X-Xi;
a为参数,将其取值为0.5;
利用核函数得到目标图像在P(X,Y)像素值;
其中:
i和j分别为取值0到3之间的自然数;
p(xi,xj)为质量最优的医学视频图像像素;
(Xi,Yj)为邻域点坐标;
按照以上方式计算目标图像所有像素点的像素值,即得到目标规格的图像;在本发明一个具体实施例中,所述目标规格为224*224像素大小的规格。
S3、通过梯度强度和梯度方向计算检测目标规格图像的图像梯度特征。
进一步地,本发明从梯度强度以及梯度方向分别对目标规格图像进行计算,得到图像梯度特征:
1)使用高斯滤波器对目标规格图像的灰度图进行卷积处理,得到平滑后的灰度值;所述卷积处理的公式为:
其中:
f为灰度图中像素(x,y)的灰度值;
gλ(x,y)为平滑后的像素灰度值;
λ为分布参数,数值越大则边缘曲线越平滑,将λ设置为0.4;
2)利用sobel算子分别与平滑后的图像像素在水平与垂直方向上进行卷积,即:
水平方向上:
dx(x,y)=[gλ(x,y+1)-gλ(x,y)+gλ(x+1,y+1)-gλ(x+1,y)]/2
垂直方向上:
dy(x,y)=[gλ(x+1,y)-gλ(x,y)+gλ(x+1,y+1)-gλ(x,y+1)]/2
其中:
dx(x,y)、dy(x,y)分别为像素(x,y)在水平和垂直方向上的像素增幅;
计算图像梯度强度M(x,y和梯度方向θm:
M(x,y)=|dx(x,y)|+|dy(x,y)|
θm=arctan(dy/dx)
其中:
arctan为反正切函数;
3)设每16*16的像素为一个细胞,每2*2个细胞组成一个扫描窗口,以16个像素为步长,水平方向将有13个扫描窗口,垂直方向将有13个扫描窗口;
每个细胞根据角度与权重建立角度直方图,角距为20度,因此每个细胞得到9个梯度向量,每一次扫描即得到当前窗口的36个梯度向量;
将一个窗口的梯度向量组合起来进行归一化,归一化公式为:
其中:
KI(i)为第i个梯度向量归一化后的值;
N为所有向量值平方开根号相加之和;
ki为第i个梯度向量;
得到36*1维的归一化向量,即为一个窗口的特征点。
S4、利用卷积神经网络获得输出特征,并联合提取到的图像梯度特征,作为组合特征,利用随机森林分类器进行分类,得到医学视频图像分类信息。
进一步地,本发明利用卷积神经网络获得输出特征,并联合提取到的图像梯度特征,作为组合特征,利用随机森林分类器进行分类,包括:
所述卷积神经网络部分采用VGG_16的结构,构建5层卷积层,卷积核大小皆为3×3像素,卷积步长为1;层与层之间使用最大化池分开,池化单元大小为2*2,所有层后都采用ReLU函数进行激活;卷积层后连接前2个全连接层,将图像梯度特征作为卷积神经网络的输入,得到4096维多尺度特征向量;
利用随机森林分类器代替softmax层执行分类,输入图像梯度特征和4096维多尺度特征向量,输出为最优医学视频图像分类;并将最优医学视频图像作为该段视频的标识点,最优医学视频图像分类即为对应的视频信息分类。
S5、基于最优医学视频图像分类信息建立索引,并利用高性能分布式存储结构进行医学影像视频数据存储。
进一步地,本发明基于最优医学视频图像分类信息建立索引,并利用高性能分布式存储结构进行医学影像视频数据存储,所述医学视频存储流程为:
1)获取医学视频的时间信息、名称信息,并将每一个视频获取终端唯一标识记为Mid,其中Mid为视频信息分类结果、医学视频的时间信息以及名称信息的hash值;采用最优医学视频图像作为图像时序表达,一个最优医学视频图像对应存储15帧视频信息;
2)将键值对数据库作为数据管理引擎,创建一级索引作为目录管理,存储录像段信息,一个录像段包含录像段的起始时间、时长以及对应的存储服务器组ID等,并将Mid作为Key值,按起始时间排序的录像段记录列表作为对应的Value值;
3)创建二级索引作为存储管理,基本的索引单元为最优医学视频图像,其中一个最优医学视频图像的描述信息包括该帧对应视频信息的起始时间戳、存放的磁盘号、分配的磁盘空间位置、位置内偏移和分类等信息,并将Mid作为Key值,按时间戳有序的最优医学视频图像描述信息列表作为对应的Value值;
4)将存储服务器按照按照每组多台进行分组,构成存储集群,组内任意两台服务器互为备份,一个组的存储容量由存储容量最小的服务器决定,集群最大容量为所有组总容量。
下面通过一个实验来说明本发明的具体实施方式,并对发明的处理方法进行测试。本发明的算法开发及测试环境为:处理器:Intel(R)Xeon(R)CPU E3-1230;开发工具:Python 3.7.0,测试环境为:PyTorch。对比方法为VGG16图片分类算法,基于ResNet50网络的图片分类算法。
在本发明所述算法实验中,数据集为来自于209名病人的1300个超声数据,将训练集提取出的最优医学视频图像进行人工分类,训练集与测试集比例为3:7。本实验通过将图像数据输入到图像处理方法中,将图像处理的有效性作为方法可行性的评价指标。
根据实验结果,VGG16图片分类算法的图像分类准确性为92.61%,基于ResNet50网络的图片分类算法的图像分类准确性为89.70%,本发明所述方法的图像分类准确性为95.11%,相较于对比算法,本发明所提出的视频图像分类方法具有更高的图像分类准确性。
数据存储模块由一台状态管理器和40台存储服务器组成。存储服务器采用IntelCore i5-7700 CPU 4核,8块1TB 15000RPM SATA Disks和40Gb/s网卡.操作***为CentOS7.4,键值对数据库Redis采用V3.2版本。经测试,检索速度能够做到秒级效应。在并发路数高时,吞吐量呈线性增长直至达到11000路时达到最高吞吐量。
发明还提供一种新型医学视频图像和数据管理***。参照图2所示,为本发明一实施例提供的医学视频图像和数据管理***的结构示意图。
在本实施例中,所述医学视频图像和数据管理***至少包括视频获取装置1、图像处理单元21,图像分类器22,视频存储装置23,视频检索终端3。
其中,视频获取装置1可以是医学扫描设备、摄像机等录入设备。
图像处理单元21为在一些实施例中可以是一中央处理器(CentralProcessingUnit,CPU)、控制器、微控制器、微处理器或其他数据处理芯片,用于运行存储的图像最优医学视频图像计算及规格转换程序代码或处理数据,例如视频标准化处理程序指令等。
图像分类器22至少包括一种类型的可读存储介质,所述可读存储介质包括闪存、硬盘、磁盘、光盘等。图像分类器22在一些实施例中可以是视频图像分类算法计算的内部存储单元,例如该算法处理装置的硬盘。图像分类器22在另一些实施例中也可以是该算法的外部存储设备,例如配备的插接式硬盘,智能存储卡(Smart Media Card,SMC),安全数字(Secure Digital,SD)卡,闪存卡(Flash Card)等。进一步地,图像处理器22还可以既包括该算法的内部存储单元也包括外部存储设备。图像处理器22还可以用于暂时地存储已经分类的数据。
视频存储装置23至少包括状态管理器和存储服务器两个部分。状态管理器为数据存储控制单元,在一些实施例中可以是一种数据库管理***,也可以是一段指令,例如数据库管理指令。存储服务器可以包括多台服务器和分组网络。
图像检索装置3为可以是PC(Personal Computer,个人电脑),或者是智能手机、平板电脑、便携计算机等终端设备,也可以是一种服务器等。
可选地,该装置3还可以包括用户接口,用户接口可以包括显示器(Display)、输入单元比如键盘(Keyboard),可选的用户接口还可以包括标准的有线接口、无线接口。可选地,在一些实施例中,显示器可以是LED显示器、液晶显示器、触控式液晶显示器以及OLED(Organic Light-Emitting Diode,有机发光二极管)触摸器等。其中,显示器也可以适当的称为显示屏或显示单元,用于显示在视频图像处理与分类中处理的信息以及用于显示可视化的用户界面。
图2仅示出了医学视频图像采集和存储***以及组建1,21-23和3,本领域技术人员可以理解的是,图1示出的结构并不构成对新型医学视频图像采集和存储***的限定,可以包括比图示更少或者更多的部件,或者组合某些部件,或者不同的部件布置。
在图2所示的装置1实施例中,图像处理单元21中存储有视频图像数据处理程序指令;图像分类器22执行对图像处理器21中存储的图像数据分类程序指令的步骤;图像分类器23执行对图像处理器22中分类的图像数据以及图像处理单元21中处理的视频压缩执行数据存储程序指令的步骤。以上装置与本法命中视频采集与分类的实现方法相同,在此不作类述。
此外,本发明实施例还提出一种计算机可读存储介质,其特征在于,所述计算机可读存储介质上存储有视频数据处理程序指令,所述视频数据处理程序指令可被一个或者多个处理器执行,以实现如下操作:
利用无参考质量评价模型对得到的每帧视频图像进行质量评估,计算最优医学视频图像;
利用双立方插值变换初始化最优医学视频图像的图片,得到目标规格的图像;
通过梯度强度和梯度方向计算检测目标规格图像的梯度特征;
利用卷积神经网络获得输出特征,并联合提取到的图像梯度特征,作为组合特征,利用随机森林分类器进行分类;
基于最优医学视频图像分类信息建立索引,利用高性能分布式存储结构进行医学影像视频数据存储。
需要说明的是,上述本发明实施例序号仅仅为了描述,不代表实施例的优劣。并且本文中的术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、装置、物品或者方法不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、装置、物品或者方法所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括该要素的过程、装置、物品或者方法中还存在另外的相同要素。
通过以上的实施方式的描述,本领域的技术人员可以清楚地了解到上述实施例方法可借助软件加必需的通用硬件平台、以及存储硬件的方式来实现。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品存储在如上所述的一个存储介质(如ROM/RAM、磁碟、光盘)中,包括若干指令用以使得一台终端设备(可以是手机,计算机,服务器,或者网络设备等)执行本发明各个实施例所述的方法。
以上仅为本发明的优选实施例,并非因此限制本发明的专利范围,凡是利用本发明说明书及附图内容所作的等效结构或等效流程变换,或直接或间接运用在其他相关的技术领域,均同理包括在本发明的专利保护范围内。
Claims (8)
1.一种新型医学视频图像采集和数据管理方法,其特征在于,所述方法包括:
利用无参考质量评价模型对得到的每帧视频图像进行质量评估,计算最优医学视频图像;
利用双立方插值变换初始化最优医学视频图像的图片,得到目标规格的图像;
通过梯度强度和梯度方向计算检测目标规格图像的梯度特征;
利用卷积神经网络获得输出特征,并联合提取到的图像梯度特征,作为组合特征,利用随机森林分类器进行分类;
基于最优医学视频图像分类信息建立索引,利用高性能分布式存储结构进行医学影像视频数据存储。
2.如权利要求1所述的一种新型医学视频图像采集和数据管理方法,其特征在于,所述利用无参考质量评价模型对得到的每帧视频图像进行质量评估,计算最优医学视频图像,包括:
1)灰度化压缩后图像,计算相邻帧像素点的灰度值,对于一个像素点(i,j),其灰度值为L(i,j):
其中:
R(i,j)、G(i,j)、B(i,j)分别为像素点(i,j)在R、G、B颜色通道的色彩度;
2)将每一像素点(i,j)按照3×3区域滑动,计算区域内灰度值高斯均值μ(i,j)为:
其中:
高斯核wk,h为2维循环对称高斯权重函数;
Lk,h(i,j)为区域中心点像素灰度值;
得到区域方差为:
因此区域亮度系数为:
计算每一点区域亮度系数得到亮度系数矩阵M:
其中:
n为压缩后图像的像素行数,m为压缩后图像的像素列数;
3)利用零均值的广义高斯分布模型对亮度系数矩阵M进行拟合,所述零均值的广义高斯分布模型表示如下:
其中:
x在[0,+∞]内任意取值;
α控制广义高斯分布的形状,α∈(0.5,8.5),在拟合过程中随机取值;
σ控制广义高斯分布的方差;
Γ(·)为gamma函数;
计算尺度函数β的公式为:
用矩匹配算法拟合得到估计参数(α,σ),并将估计参数作为图像的二维估计特征;
4)将中心像素点与周边四个方向像素点亮度系数进行内积,获得像素点的内积矩阵;所述像素点内积矩阵如下所示:
H(i,j)=L′(i,j)*L′(i,j+1)
V(i,j)=L′(i,j)*L′(i+1,j)
D(i,j)=L′(i,j)*L′(i+1,j+1)
N(i,j)=L′(i,j)*L′(i+1,j-1)
其中:
v控制广义高斯分布的形状,在拟合过程中的范围与α相同;
继而得到特征η:
6)将所述16维特征向量与二维估计特征进行拼接处理,得到18维特征向量;利用所述18维特征向量去训练一个SVM概率分类器以及支持向量回归器(SVR),利用SVM概率分类器输出图像在该失真类型的概率值,并利用支持向量回归器(SVR)输出该失真类型得分;最终质量为上述概率值和类型得分的乘积;联合上下时域,得到附近15帧中质量最优的医学视频图像。
3.如权利要求2所述的一种新型医学视频图像采集和数据管理方法,其特征在于,所述利用双立方插值变换方法初始化质量最优的医学视频图像最优医学视频图像,包括:
将质量最优的医学视频图像像素点p(x,y)映射到指定大小的目标规格图像的位置P(X,Y),所述利用双立方插值变换方法进行图像像素映射的流程为:
构造核函数计算质量最优的医学视频图像中邻域像素点对目标像素点的权重,核函数BiCubic公式为:
其中:
∈表示目标规格邻域像素点到P点的距离;
a为参数,将其取值为0.5;
利用核函数得到目标图像在P(X,Y)像素值;
其中:
i和j分别为取值0到3之间的自然数;
p(xi,xj)为质量最优的医学视频图像像素;
(Xi,Yj)为邻域点坐标;
按照以上方式计算目标图像所有像素点的像素值,即得到目标规格的图像。
4.如权利要求3所述的一种新型医学视频图像采集和数据管理方法,其特征在于,所述通过梯度强度和梯度方向计算检测图像梯度特征,包括:
1)使用高斯滤波器对目标规格图像的灰度图进行卷积处理,得到平滑后的灰度值;所述卷积处理的公式为:
其中:
f为灰度图中像素(x,y)的灰度值;
gλ(x,y)为平滑后的像素灰度值;
λ为分布参数,将λ设置为0.4;
2)利用sobel算子分别与平滑后的图像像素在水平与垂直方向上进行卷积,即:
水平方向上:
dx(x,y)=[gλ(x,y+1)-gλ(x,y)+gλ(x+1,y+1)-gλ(x+1,y)]/2
垂直方向上:
dy(x,y)=[gλ(x+1,y)-gλ(x,y)+gλ(x+1,y+1)-gλ(x,y+1)]/2
其中:
dx(x,y)、dy(x,y)分别为像素(x,y)在水平和垂直方向上的像素增幅;
计算图像梯度强度M(x,y)和梯度方向θm:
M(x,y)=|dx(x,y)|+|dy(x,y)|
θm=arctan(dy/dx)
其中:
arctan为反正切函数;
3)设每16*16的像素为一个细胞,每2*2个细胞组成一个扫描窗口,以16个像素为步长,水平方向将有13个扫描窗口,垂直方向将有13个扫描窗口;
每个细胞根据角度与权重建立角度直方图,角距为20度,因此每个细胞得到9个梯度向量,每一次扫描即得到当前窗口的36个梯度向量;
将一个窗口的梯度向量组合起来进行归一化,归一化公式为:
其中:
KI(i)为第i个梯度向量归一化后的值;
N为所有向量值平方开根号相加之和;
ki为第i个梯度向量;
得到36*1维的归一化向量,即为一个窗口的特征点。
5.如权利要求4所述的一种新型医学视频图像采集和数据管理方法,其特征在于,所述利用卷积神经网络获得输出特征,并联合提取到的图像梯度特征,作为组合特征,利用随机森林分类器进行分类,包括:
所述卷积神经网络部分采用VGG_16的结构,构建5层卷积层,卷积核大小皆为3×3像素,卷积步长为1;层与层之间使用最大化池分开,池化单元大小为2*2,所有层后都采用ReLU函数进行激活;卷积层后连接前2个全连接层,将图像梯度特征作为卷积神经网络的输入,得到4096维多尺度特征向量;
利用随机森林分类器代替softmax层执行分类,输入图像梯度特征和4096维多尺度特征向量,输出为最优医学视频图像分类;并将最优医学视频图像作为该段视频的标识点,最优医学视频图像分类即为对应的视频信息分类。
6.如权利要求5所述的一种新型医学视频图像采集和数据管理方法,其特征在于,所述基于最优医学视频图像分类信息建立索引,利用高性能分布式存储结构进行医学影像视频数据存储,包括:
1)获取医学视频的时间信息、名称信息,并将每一个视频获取终端唯一标识记为Mid,其中Mid为视频信息分类结果、医学视频的时间信息以及名称信息的hash值;采用最优医学视频图像作为图像时序表达,一个最优医学视频图像对应存储15帧视频信息;
2)将键值对数据库作为数据管理引擎,创建一级索引作为目录管理,存储录像段信息,一个录像段包含录像段的起始时间、时长以及对应的存储服务器组ID等,并将Mid作为Key值,按起始时间排序的录像段记录列表作为对应的Value值;
3)创建二级索引作为存储管理,基本的索引单元为最优医学视频图像,其中一个最优医学视频图像的描述信息包括该帧对应视频信息的起始时间戳、存放的磁盘号、分配的磁盘空间位置、位置内偏移和分类等信息,并将Mid作为Key值,按时间戳有序的最优医学视频图像描述信息列表作为对应的Value值;
4)将存储服务器按照按照每组多台进行分组,构成存储集群,组内任意两台服务器互为备份,一个组的存储容量由存储容量最小的服务器决定,集群最大容量为所有组总容量。
7.一种新型医学视频图像采集和数据管理方法,其特征在于,所述装置包括:
视频获取设备,用于接收医学视频并将其上传至视频处理装置中进行压缩;
图像处理单元,用于利用无参考质量评价模型对得到的每帧图像进行质量评估,计算最优医学视频图像并利用双立方插值变换初始化最优医学视频图像的图片,得到目标规格的图像;
图像分类器,用于通过梯度强度和梯度方向计算检测梯度特征;利用卷积神经网络获得输出特征,并联合提取到的图像梯度特征,作为组合特征输入到随机森林分类器,对处理得到的图像进行分类;
视频存储装置,用于利用高性能分布式存储结构进行医学影像视频数据存储,并基于最优医学视频图像分类信息建立索引;
视频检索终端,用于检索视频信息。
8.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质上存储有视频数据处理程序指令,所述视频数据处理程序指令可被一个或者多个处理器执行,以实现如权利要求1至6中任一项所述的一种新型医学视频图像处理和存储的实现方法的步骤。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110372204.8A CN113032622A (zh) | 2021-04-07 | 2021-04-07 | 一种新型医学视频图像采集和数据管理*** |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110372204.8A CN113032622A (zh) | 2021-04-07 | 2021-04-07 | 一种新型医学视频图像采集和数据管理*** |
Publications (1)
Publication Number | Publication Date |
---|---|
CN113032622A true CN113032622A (zh) | 2021-06-25 |
Family
ID=76453986
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202110372204.8A Withdrawn CN113032622A (zh) | 2021-04-07 | 2021-04-07 | 一种新型医学视频图像采集和数据管理*** |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN113032622A (zh) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN116521940A (zh) * | 2023-06-20 | 2023-08-01 | 上海临滴科技有限公司 | 一种工业视频云存储实时监管方法及*** |
-
2021
- 2021-04-07 CN CN202110372204.8A patent/CN113032622A/zh not_active Withdrawn
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN116521940A (zh) * | 2023-06-20 | 2023-08-01 | 上海临滴科技有限公司 | 一种工业视频云存储实时监管方法及*** |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN110378381B (zh) | 物体检测方法、装置和计算机存储介质 | |
US9633282B2 (en) | Cross-trained convolutional neural networks using multimodal images | |
US11270204B2 (en) | Systems and methods for barcode annotations for digital images | |
JP5261501B2 (ja) | 不変の視覚場面及び物体の認識 | |
KR101917369B1 (ko) | 컨볼루션 신경망을 이용한 영상 검색 방법 및 그 장치 | |
WO2019033570A1 (zh) | 嘴唇动作分析方法、装置及存储介质 | |
CN111400528B (zh) | 一种图像压缩方法、装置、服务器及存储介质 | |
WO2019033568A1 (zh) | 嘴唇动作捕捉方法、装置及存储介质 | |
WO2024077781A1 (zh) | 基于卷积神经网络模型的图像识别方法、装置及终端设备 | |
Singhal et al. | Directional local ternary co-occurrence pattern for natural image retrieval | |
CN111340213B (zh) | 神经网络的训练方法、电子设备、存储介质 | |
Sukhia et al. | Content-based histopathological image retrieval using multi-scale and multichannel decoder based LTP | |
Singh et al. | A novel position prior using fusion of rule of thirds and image center for salient object detection | |
Jing et al. | ECFRNet: Effective corner feature representations network for image corner detection | |
Singh et al. | Performance enhancement of salient object detection using superpixel based Gaussian mixture model | |
CN113032622A (zh) | 一种新型医学视频图像采集和数据管理*** | |
Hameed et al. | Content based image retrieval based on feature fusion and support vector machine | |
Peng et al. | Fully convolutional neural networks for tissue histopathology image classification and segmentation | |
Ramesh et al. | Multiple object cues for high performance vector quantization | |
CN113658145B (zh) | 一种肝脏超声标准切面识别方法、装置、电子设备及存储介质 | |
CN113011506A (zh) | 一种基于深度重分形频谱网络的纹理图像分类方法 | |
CN114387489A (zh) | 电力设备识别方法、装置和终端设备 | |
CN113192085A (zh) | 三维器官图像分割方法、装置及计算机设备 | |
CN113052802A (zh) | 基于医学图像的小样本图像分类方法、装置及设备 | |
WO2019183712A1 (en) | Methods of generating an encoded representation of an image and systems of operating thereof |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
WW01 | Invention patent application withdrawn after publication |
Application publication date: 20210625 |
|
WW01 | Invention patent application withdrawn after publication |