CN113542762A - 一种车辆红外图像的压缩与增强方法和*** - Google Patents
一种车辆红外图像的压缩与增强方法和*** Download PDFInfo
- Publication number
- CN113542762A CN113542762A CN202110822091.7A CN202110822091A CN113542762A CN 113542762 A CN113542762 A CN 113542762A CN 202110822091 A CN202110822091 A CN 202110822091A CN 113542762 A CN113542762 A CN 113542762A
- Authority
- CN
- China
- Prior art keywords
- image
- infrared
- compression
- dct
- data
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Images
Classifications
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/42—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals characterised by implementation details or hardware specially adapted for video compression or decompression, e.g. dedicated software implementation
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/10—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
- H04N19/102—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
- H04N19/124—Quantisation
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/40—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using video transcoding, i.e. partial or full decoding of a coded input stream followed by re-encoding of the decoded output stream
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/60—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding
- H04N19/625—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding using discrete cosine transform [DCT]
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N23/00—Cameras or camera modules comprising electronic image sensors; Control thereof
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N5/00—Details of television systems
- H04N5/30—Transforming light or analogous information into electric information
- H04N5/33—Transforming infrared radiation
Landscapes
- Engineering & Computer Science (AREA)
- Multimedia (AREA)
- Signal Processing (AREA)
- Physics & Mathematics (AREA)
- Discrete Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Compression Or Coding Systems Of Tv Signals (AREA)
Abstract
本发明公开了一种车辆红外图像的压缩与增强方法和***,该方法从车辆采集的视频流中截取红外图像数据,按传输协议将十六进制的所述图像数据转换成各个像素点的位置信息以及像素值大小,形成格式为BMP的红外位图图像;将所述红外位图图像压缩至适合传输的大小得到压缩图像,保存至存储器中备份;根据base64编码将所述压缩图像转换成8bit字节码。利用红外成像与图像压缩与增强原理,解决了车联网中视觉传感器低精度、低速率以及图像占用空间大的问题。
Description
技术领域
本发明涉及图像处理技术领域,特别涉及一种车辆红外图像的压缩与增强方法和***。
背景技术
图像压缩编码的研究,最早要追溯到1984年电视信号数字化的提出。直到如今,使用得最久同时也应用得最广泛的图像压缩技术是1992年正式确立的JPEG(JointPhotographic Experts Group)压缩标准,其正式名称为“信息技术连续色调静止图像的数字压缩编码”。它采用了预测编码、离散余弦变换和熵编码的联合编码方式,以较低的算法复杂度,实现了较高的压缩比,压缩后的图像还拥有良好的重建质量。但当压缩比过高时,图像质量容易受损,因此JPEG不适用于显示高清晰度的图像。
传统图像压缩编码以信息论和数字信号处理等理论为理论基础,研究已进入成熟期,客观和视觉的去冗余能力已接近极限,编码效率、压缩比和重建质量等几个主要指标都难以突破瓶颈。随着相关新兴学科的研究不断取得突破,许多新的图像压缩算法被提出,如子带编码、分形编码、模型基编码、小波变换图像压缩和基于神经网络的图像压缩等,组成了新一代的图像压缩编码技术。
将分形的概念用于图像压缩基于分形特征对图像的描述和处理,其基本思想是利用图像内部自相似的特点,通过迭代函数***用一定的变换来模拟代替原图像,解压缩时只需对图像进行若干次反变换迭代,即可得到近似较好的重建图像。分形算法相较于JPEG标准压缩拥有更好的图像压缩质量,但它的计算量较为庞大,时间成本高。
小波变换(Wavelet Transform)用于多分辨率图像的描述,其基本思想是将图像信号分解成一簇经过平移和伸缩的基函数的加权和。小波变换是不会产生能量损失的正交变换,可以采用有针对性的非均匀量化对图像进行压缩,且其算法可逆,能通过重构完全复原图像。
图像增强是图像处理的一大重要组成部分,传统的图像增强方法在提高图像质量方面发挥着极其重要的作用。上世纪90年代以来,人们使用了改善图像的数字技术,以制定和分析遥感图像进行有效地资源和矿产资源勘探、调查、农业土地利用总体规划和城市,估计作物产量、天气预报和灾害监测。在生物医学工程领域,图像增强技术用于处理放射图像、超声波图像和生物切片的微观图像,以提高图像的清晰度和分辨率。
随着图像技术研究的发展,图像增强的新方法不断出现。一些学者在图像增强算法中引入了模糊映射理论来解决在增强算法中映射函数选择的问题。此外,通过应用交互式图像增强技术,可以主观监测图像增强效果。利用条形平衡技术在图像增强方面取得了许多新进展。例如,提出了一种多级条形平衡算法,结合亮度的保留,以及一种动态层级条形平衡算法。这些算法可以通过分割图像,然后平衡子层图像来解决条形图均衡化中对比度范围的问题。
现有技术中,对于图像的增强处理存在大量的研究方案,但是,具体的车载红外图像的识别以及压缩增强等方面还存在着大量的亟待解决的问题,例如,对于图像处理的实时性、图像的精度、图像的压缩比等方面,都还有较大的改进空间。
发明内容
本发明提供一种车辆红外图像的压缩与增强方法和***,能够解决车联网中视觉传感器低精度、低速率以及图像占用空间大的问题。
根据本发明的一个方面,提供了一种车辆红外图像的压缩与增强方法,包括以下步骤:
从车辆采集的视频流中截取红外图像数据,按传输协议将十六进制的所述图像数据转换成各个像素点的位置信息以及像素值大小,形成格式为BMP的红外位图图像;
将所述红外位图图像压缩至适合传输的大小得到压缩图像,保存至存储器中备份;
根据base64编码将所述压缩图像转换成8bit字节码。
所述将所述红外位图图像压缩至适合传输的大小得到压缩图像,包括:
将所述BMP的红外位图图像的RGB颜色进行YCbCr颜色空间变换,得到JPEG图像;
对所述JPEG图像进行DC电平转移;
对所述JPEG图像的YCbCr分量进行子采样;采样YCbCr分量比为4∶1∶1或4∶2∶2;
将所述子采样后的JPEG图像根据像素点进行N×N的子块分块;
对所述JPEG图像分块得到的N×N的子块进行离散傅里叶DCT变换,将图像数据转换为对应的DCT系数;
对所述DCT系数进行量化压缩;
对所述量化编码后的数据进行Zig-zag扫描;
对所述Zig-zag扫描后的数据分开进行交流AC系数和直流DC系数的编码;
对所述AC系数进行行程长度RLC编码。
所述将所述BMP的红外位图图像的RGB颜色进行YCbCr颜色空间变换,根据如下公式进行:
Y=0.299000R+0.587000G+0.114000B
Cb=-0.169736R-0.331264G+0.500002B
Cr=0.500000R-0.418688G-0.081312B
其中,Y为亮度分量,Cb(U)和Cr(V)为蓝红色度分量,R、G和B分别为红、绿、蓝三个通道的颜色。
所述将所述子采样后的JPEG图像根据像素点进行N×N的子块分块,包括:
将所述JPEG图像中的每个像素点对应的3个交替出现的分量分离并存入3张表中。
所述离散傅里叶DCT变换,根据如下方式进行:
一维DCT变换的正变换公式为:
其中,n,k=0,…,N-1,N为压缩前图像序列长度,x(n)为压缩前图像序列;
二维DCT的正变换公式为:
其中,F(u,v)为变换后的图像,f(x,y)为原图像,C(u)和C(v)为蓝红色度分量;
二维DCT的反变换公式为:
其中,F(u,v)为变换后的图像,f(x,y)为原图像,C(u)和C(v)为蓝红色度分量;
以上各式的系数分别为:x,y,u,v=0,1,......,N-1
其中,C(u)和C(v)为蓝红色度分量。
所述方法还包括:
通过车辆的采集模块从红外摄像头发送给数据处理器的视频流中截取红外图像数据,按传输协议将十六进制的图像数据转换成各个像素点的位置信息以及像素值大小,形成格式为BMP的红外位图图像;
由压缩模块将图像压缩至适合传输的大小,保存至存储器中备份;
用base64编码将压缩后的图像转换成8bit字节码由发射电台通过全向天线发射到空中,传给接收电台。
根据本发明的另一个方面,提供了一种车辆红外图像的压缩与增强***,所述***包括红外摄像头模块、采集模块、压缩模块、存储器、发射电台和全向天线,其中:
所述红外摄像头模块,用于采集视频流数据;
所述采集模块,用于从所述红外摄像头模块采集的视频流中截取红外图像数据,按传输协议将十六进制的图像数据转换成各个像素点的位置信息以及像素值大小,形成格式为BMP的红外位图图像;
所述压缩模块,用于将图像压缩至适合传输的大小的压缩图像,保存至所述存储器中备份;
所述存储器,用于保存和备份所述压缩图像;
所述发射电台,用于根据base64编码将压缩图像转换成8bit字节码发送给全向天线;
所述全向天线,用于发射所述压缩图像。
所述压缩模块具体包括:
空间变化单元,用于将所述BMP的红外位图图像的RGB颜色进行YCbCr颜色空间变换,得到JPEG图像;
DC平移单元,用于对所述JPEG图像进行DC电平转移;
子采样单元,用于对所述JPEG图像的YCbCr分量进行子采样;采样YCbCr分量比为4∶1∶1或4∶2∶2;
分块单元,用于将所述子采样后的JPEG图像根据像素点进行N×N的子块分块;
DCT变换单元,用于对所述JPEG图像分块得到的N×N的子块进行离散傅里叶DCT变换,将图像数据转换为对应的DCT系数;
量化单元,用于对所述DCT系数进行量化压缩;
Zig-zag扫描单元,用于对所述量化编码后的数据进行Zig-zag扫描;
编码单元,用于对所述Zig-zag扫描后的数据分开进行交流AC系数和直流DC系数的编码;
行程码编码单元,用于对所述AC系数进行行程长度RLC编码。
所述空间变化单元中将所述BMP的红外位图图像的RGB颜色进行YCbCr颜色空间变换,根据如下公式进行:
Y=0.299000R+0.587000G+0.114000B
Cb=-0.169736R-0.331264G+0.500002B
Cr=0.500000R-0.418688G-0.081312B
其中,Y为亮度分量,Cb(U)和Cr(V)为蓝红色度分量,R、G和B分别为红、绿、蓝三个通道的颜色。
所述DCT变换单元中的离散傅里叶DCT变换,根据如下方式进行:
一维DCT变换的正变换公式为:
其中,n,k=0,......,N-1,N为压缩前图像序列长度,x(n)为压缩前图像序列;
二维DCT的正变换公式为:
其中,F(u,v)为变换后的图像,f(x,y)为原图像,C(u)和C(v)为蓝红色度分量;
二维DCT的反变换公式为:
其中,F(u,v)为变换后的图像,f(x,y)为原图像,C(u)和C(v)为蓝红色度分量;
以上各式的系数分别为:x,y,u,v=0,1,......,N-1
其中,C(u)和C(v)为蓝红色度分量。
采用本发明的技术方案,提出了一种车辆红外图像的压缩与增强方案,从车辆采集的视频流中截取红外图像数据,按传输协议将十六进制的所述图像数据转换成各个像素点的位置信息以及像素值大小,形成格式为BMP的红外位图图像;将所述红外位图图像压缩至适合传输的大小得到压缩图像,保存至存储器中备份;根据base64编码将所述压缩图像转换成8bit字节码。利用红外成像与图像压缩与增强原理,解决了车联网中视觉传感器低精度、低速率以及图像占用空间大的问题。本发明的优点还在于:压缩率高,对通信信道带宽要求较低;传输速率快,提升数据处理中心处理速率;硬件实现简单,可编程性强,便于后续的升级开发。
下面通过附图和实施例,对本发明的技术方案做进一步的详细描述。
附图说明
附图用来提供对本发明的进一步理解,并且构成说明书的一部分,与本发明的实施例一起用于解释本发明,并不构成对本发明的限制。在附图中:
图1为本发明实施例中车辆红外图像的压缩与增强原理流程图;
图2为本发明实施例中红外图像的压缩与增强***硬件设计总体框图;
图3为本发明实施例中JPEG编码器流程图;
图4为本发明实施例中Zig-zag扫描的地址顺序图;
图5为本发明实施例中行程编码示意图;
图6为本发明实施例中车辆红外图像的压缩与增强***结构示意图。
具体实施方式
以下结合附图对本发明的优选实施例进行说明,应当理解,此处所描述的优选实施例仅用于说明和解释本发明,并不用于限定本发明。
通常,一幅可见图像是一个平面能量分布图,其本身可以是一个发光物体辐射源,也可以是物体受光辐射源照射后反射或透射的能量。
数字图像可以用二维离散函数来表示:
I=f(x,y)
其中,(x,y)表示图像像素的坐标,函数值f(x,y)表示在坐标处像素的灰度值。
也可以用二维矩阵来表示:
I=A(M,N)
其中,A为矩阵表示形式,M和N为矩阵行列长度。
对一幅图像采样时,若每行像素为M个,每列像素为N个,则图像大小为M×N个像素,从而A[M,N]构成一个M×N实数矩阵。矩阵元素a(m,n)表示图像在第m行第n列的像素值,称为像素或像元。
灰度图像中的每个像素的信息由一个量化的灰度级来描述,没有色彩信息。灰度图像像素的灰度级通常为8bits,即0~255。“0”表示纯黑色,“255”表示纯白色。
图像用数字任意描述像素点、强度和颜色。描述信息文件存储量较大,所描述对象在缩放过程中会损失细节或产生锯齿。在显示方面它是将对象以一定的分辨率分辨以后将每个点的色彩信息以数字化方式呈现,可直接快速在屏幕上显示。分辨率和灰度是影响显示的主要参数。
在满足一定保真度的要求下,对图像数据的进行变换、编码和压缩,去除多余数据减少表示数字图像时需要的数据量,以便于图像的存储和传输。即以较少的数据量有损或无损地表示原来的像素矩阵的技术,也称图像编码。
图像压缩编码可分为两类:一类压缩是可逆的,即从压缩后的数据可以完全恢复原来的图像,信息没有损失,称为无损压缩编码;另一类压缩是不可逆的,即从压缩后的数据无法完全恢复原来的图像,信息有一定损失,称为有损压缩编码。
在实用技术上,可通过以下途径来压缩图像数据的总量:
(1)采用亮度(Y)、色度(C)取样方式;
(2)将整幅图像分割为小区域进行分割处理;
(3)采用帧间和帧内数据压缩技术。
JPEG是Joint Photographic Experts Group(联合图像专家组)的缩写,文件后辍名为“.jpg”或“.jpeg”,是最常用的图像文件格式,由一个软件开发联合会组织制定,是一种有损压缩格式,能够将图像压缩在很小的储存空间,图像中重复或不重要的资料会被丢失,因此容易造成图像数据的损伤。尤其是使用过高的压缩比例,将使最终解压缩后恢复的图像质量明显降低,如果追求高品质图像,不宜采用过高压缩比例。但是JPEG压缩技术十分先进,它用有损压缩方式去除冗余的图像数据,在获得极高的压缩率的同时能展现十分丰富生动的图像,即可以用最少的磁盘空间得到较好的图像品质。而且JPEG是一种很灵活的格式,具有调节图像质量的功能,允许用不同的压缩比例对文件进行压缩,支持多种压缩级别,压缩比率通常在10∶1到40∶1之间,压缩比越大,品质就越低;相反地,压缩比越小,品质就越好。比如可以把1.37Mb的BMP位图文件压缩至20.3KB。也可以在图像质量和文件尺寸之间找到平衡点。JPEG格式压缩的主要是高频信息,对色彩的信息保留较好,适合应用于互联网,可减少图像的传输时间,可以支持24bit真彩色,也普遍应用于需要连续色调的图像。经过多次比较,采用第8级压缩为存储空间与图像质量兼得的最佳比例。
增强图像中的有用信息,它可以是一个失真的过程,其目的是要改善图像的视觉效果,针对给定图像的应用场合。有目的地强调图像的整体或局部特性,将原来不清晰的图像变得清晰或强调某些感兴趣的特征,扩大图像中不同物体特征之间的差别,抑制不感兴趣的特征,使之改善图像质量、丰富信息量,加强图像判读和识别效果,满足某些特殊分析的需要。
图像增强的方法是通过一定手段对原图像附加一些信息或变换数据,有选择地突出图像中感兴趣的特征或者抑制图像中某些不需要的特征,使图像与视觉响应特性相匹配。在图像增强过程中,不分析图像降质的原因,处理后的图像不一定逼近原始图像。图像增强技术根据增强处理过程所在的空间不同,可分为基于空域的算法和基于频域的算法两大类。
空域法是对图像中的像素点进行操作,用公式描述如下:
g(x,y)=f(x,y)×h(x,y)
其中是f(x,y)是原图像;h(x,y)为空间转换函数;g(x,y)表示进行处理后的图像。
基于空域的算法处理时直接对图像灰度级做运算,基于频域的算法是在图像的某种变换域内对图像的变换系数值进行某种修正,是一种间接增强的算法。基于空域的算法分为点运算算法和邻域去噪算法。点运算算法即灰度级校正、灰度变换和直方图修正等,目的或使图像成像均匀,或扩大图像动态范围,扩展对比度。邻域增强算法分为图像平滑和锐化两种。
红外图像一般都因受到某种干扰而含有噪声。噪声使图像模糊,甚至淹没特征,如果不对噪声进行及时处理,就会对后续的处理过程乃至输出结果产生影响,甚至可能得到错误的结论。因此,图像噪声滤除成为红外图像预处理中的重要组成部分。空域或频域的平滑滤波可以抑制图像噪声,提高图像的信噪比。
采用邻域平均法时,大模板的运算量大,耗时长,模糊程度较重,处理后的图像效果差。而且随着模板的变大,运算量迅速增大,耗时加长,模糊程度变重,图像效果差。因此,若用此法处理图像时,最好选用较小的模板。采用中值滤波法时,用大窗口的运算量大,耗时长,但处理后的图像效果与用小窗口时基本相当。而且随着窗口的变大,运算量越大,耗时越长,但图像效果提高不明显。因此,若用此法处理图像时,最好选用较小的窗口,采用快速算法。从处理后的图像看,邻域平均法滤波后的图像效果较差,噪声减少不明显,而且使图像的模糊度增加。中值滤波后的图像效果好,图像轮廓清晰,噪声大大降低,使后续的目标识别、跟踪等更加方便。中值滤波不仅较好地消除了强脉冲性噪声的影响,而且较好地保留了图像的边缘。梯度倒数平滑算法的滤波效果较好,但运算时间太长,在实时性要求不高的场合应用,效果是很好的。鉴于中值滤波的诸多优点,加上中值滤波易于硬件实现,能满足实时性的要求。
图1为本发明实施例中车辆红外图像的压缩与增强流程图。如图1所示,该车辆红外图像的压缩与增强流程包括以下步骤:
步骤101、从车辆采集的视频流中截取红外图像数据,按传输协议将十六进制的所述图像数据转换成各个像素点的位置信息以及像素值大小,形成格式为BMP的红外位图图像。
本发明实施例中,基于一种红外图像传输***,其中,发射端由红外摄像头模块、采集模块、压缩模块、存储器、发射电台和全向天线组成;接收端由全向天线、接收电台、复原模块、增强模块、存储器以及上位机显示器组成。如图2所示,为发射端的硬件结构框图。基于图2所示的***,本发明实施例实现对红外图像的压缩与增强处理。
本发明设计了一种车辆红外图像的压缩与增强***,利用红外成像与图像压缩与增强原理,解决了车联网中视觉传感器低精度、低速率以及图像占用空间大的问题。本发明实施例主要为红外图像传输***发射端。其中,发射端由红外摄像头模块、采集模块、压缩模块、存储器、发射电台和全向天线组成;接收端由全向天线、接收电台、复原模块、增强模块、存储器以及上位机显示器组成。
本发明所设计的车辆红外图像的压缩与增强***发射端的的主要工作流程为:***通过采集模块从红外摄像头发送给数据处理器的视频流中截取红外图像数据,按传输协议将十六进制的图像数据转换成各个像素点的位置信息以及像素值大小,形成格式为BMP的红外位图图像,再由压缩模块将图像压缩至适合传输的大小,保存至存储器中备份,最后用base64编码将压缩后的图像转换成8bit字节码由发射电台通过全向天线发射到空中,传给接收电台;
所述的红外摄像头模块使用非制冷焦平面微热型DM20网络测温型模组,其分为前后两个部分,前半部分负责拍摄获取红外图像,并由内置芯片整理打包为若干十六进制的数据包,以SPI信号的形式从芯片上的SPI_MISO管脚输出,发送给红外探测器的后半部分;后半部分负责将接收到的若干数据包通过网线从RJ45接口传到数据处理器上。
所述的采集模块可以使用任意能运行C++程序的上位机,例如PC机、树莓派和单片机等。本发明使用的是***为Windows10的电脑。红外探测器和电脑之间由一条网线连接,接口为网口,即RJ45。红外探测器和电脑均有各自的电源配适器为其稳定供电。
所述的图像传输模块采用日精ND系列19.2Kbps高速数传电台,搭载有MD192型智能调制解调器,采用数字信号处理DSP技术,以软件的方式实时地实现无线数字调制解调算法,可通过AT指令用软件设置各种参数;
所述的压缩模块使用JPEG图像压缩算法,采用的压缩比例为10∶1。
所述的存储器使用16g的闪存芯片。
步骤102、将所述红外位图图像压缩至适合传输的大小得到压缩图像,保存至存储器中备份。
如图3所示,为本发明实施例提供的JPEG编码器流程图。JPEG采用的YCbCr色彩空间,支持1~4个颜色分量,BMP则是RGB颜色空间。压缩BMP图像,首先要转换颜色空间。RGB、YUV、YCbCr等拥有3种颜色分量;洋红、青、黄和黑(Magenta,Cyan,Yellow,and Black)有4种颜色分量。计算机显示图像采用的是RGB颜色模型,图像数据由R、G、B三个分量相加而成。本例中采用YCbCr色彩空间,要进行从RGB到YCbCr的颜色空间变换。RGB和YCrCb之间的转换关系如下所示:
Y=0.299000R+0.587000G+0.114000B
Cb=-0.169736R-0.331264G+0.500002B
Cr=0.500000R-0.418688G-0.081312B
其中,Y为亮度分量,Cb(U)和Cr(V)为蓝红色度分量,R、G和B分别为红、绿、蓝三个通道的颜色。
图像像素存储在无符号整数中。在图像中,在进行任何变换或数学计算之前,必须将这些采样数据转换成两个补码来表示。DC电平偏移是为保证输入数据信息的采样有近似的集中在零的动态范围附近。方法是:假设图像分量的采样精度为n,则分量中的每个像素值应减去2n-1。
通常,人眼对亮度变化的比色彩变换更敏感,因此,Y分量要比Cb,Cr分量重要。色彩空间转换之后,图像的信息主要包含在亮度分量Y中。大量冗余的颜色信息保存在色度分量Cb和Cr中。因此,可以运用子采样较少色度数据量,丢失少量信息来实现图像压缩。JPEG图像标准中,通常采取的子采样格式有4∶1∶1或4∶2∶2。
DCT(Discrete Fourier Transform,离散余弦变换)是基于8×8的子块进行处理,因此,需在变换前,把原图像数据进行分块。原图像中的每个像素点是3个分量交替出现,需将这3个分量分离,并存入3张表中。
DCT变换在码率压缩中,是应用较为普遍的变换编码方式,是通过正交变换,去除空间冗余信息,实现压缩编码。先将源图像数据划分N×N的像素块,再利用DCT针对各像素块一个接一个的实施变换操作。通常,图像的能量都会集在离散余弦变换后的低频区域,因此DCT主要用来去除图像数据的空间冗余。经DCT之后,图像数据的系数间的相关性会下降,图像数据的大部分能量会集在少数几个DCT系数中。DCT可以有效去除图像数据间的相关性,集中信号能量,是JPEG标准实现数据压缩的核心算法,在图像压缩应用中非常重要。DCT是从傅立叶变换演变而来。
一维离散余弦变换的正变换公式为:
其中,n,k=0,......,N-1,N为压缩前图像序列长度,x(n)为压缩前图像序列。
二维DCT的正变换公式为(N一般取8):
其中,F(u,v)为变换后的图像,f(x,y)为原图像,C(u)和C(v)为蓝红色度分量。
二维DCT的反变换公式为:
其中,F(u,v)为变换后的图像,f(x,y)为原图像,C(u)和C(v)为蓝红色度分量。
以上各式的系数分别为:x,y,u,v=0,1,......,N-1
其中,C(u)和C(v)为蓝红色度分量。
图像数据转化为DCT系数后,还要进行量化阶段,才能进行编码。8×8的图象数据经过DCT变换后,其高频、低频能量分别会集在右下角、左上角,如表1及表2所示。
表1标准亮度量化表
16 | 11 | 10 | 16 | 24 | 40 | 51 | 61 |
12 | 12 | 14 | 19 | 26 | 58 | 60 | 55 |
14 | 13 | 16 | 24 | 40 | 57 | 69 | 56 |
14 | 17 | 22 | 29 | 51 | 87 | 80 | 62 |
18 | 22 | 37 | 56 | 68 | 109 | 103 | 77 |
24 | 35 | 55 | 64 | 81 | 104 | 113 | 92 |
49 | 64 | 78 | 87 | 103 | 121 | 120 | 101 |
72 | 92 | 95 | 98 | 112 | 100 | 103 | 99 |
表2标准色度量化表
17 | 18 | 24 | 47 | 99 | 99 | 99 | 99 |
18 | 21 | 26 | 66 | 99 | 99 | 99 | 99 |
24 | 26 | 56 | 99 | 99 | 99 | 99 | 99 |
47 | 66 | 99 | 99 | 99 | 99 | 99 | 99 |
99 | 99 | 99 | 99 | 99 | 99 | 99 | 99 |
99 | 99 | 99 | 99 | 99 | 99 | 99 | 99 |
99 | 99 | 99 | 99 | 99 | 99 | 99 | 99 |
99 | 99 | 99 | 99 | 99 | 99 | 99 | 99 |
从空间域上看,取左上角,去右下角,实现的功能类似于低通滤波器。量化后,DCT系数精度会减小,图像数据中相对作用较低的交流(AC)系数会减少,图像数据量就会降低(AC系数表示图像细节),从而达到了图像压缩的目的。因此,通常来讲,量化是图像压缩中最为重要的一步,图像品质下降的主要原因也就是量化。量化需要两个频率系数,分别处理亮度和色度,用每个DCT系数去除以各自的量化矩阵得到的量化系数值后再取整(通常是四舍五入),即可完成量化。在JPEG中采用的是均匀量化,从量化表可以看到,右下角的值较大,左上角的值较小,通过此步骤,就可以实现保留低频分量,而控制高频分量的目标。
通常,使用不同的量化表,达到的图像压缩效果是不同的。如表1和表2所示为JPEG标准提出的一个参考标准,在使用时,用户还可根据源图像的特性和图像显示器的性能作以调整。从标准量化表中可以发现,两张表对量化并步长是不一样的,对亮度的要细一些,对色度的要粗一些。这是因为图像使用的颜色是YUV格式。相对而言,色度(Y)分量的值就更重要一些。我们可以分别对亮度分量(Y)实现细量化,对色度分量(UV)实现粗量化,可确保压缩比更高。
JPEG标准规定按照下图顺序一次保存储64个DCT的系数值。这样的好处是,在这样的序列里的相邻点在图像中也是相邻的。具体过程如图4所示。
在JPEG标准中,DC系数采用的编码方式为差分脉冲调制编码DPCM(DifferencePulse Code Modulation)。DC系数有两个特性,一个是系数值较高;二是相邻两个8×8图像块的系数值变化不大,DC系数在编码时,采用同一图像数据的两个相邻块的DC系数差值:Diff=DCi-DCi-1,对差值实施编码。这样的好处是对差值进行编码的位数比对原值实施编码的位数要少。
8×8图像块中的其他值为AC系数,采用的行程长度编码(RLC)。量化后的AC系数中有很多为0的数值,采用行程编码可以有效降低数据的大小。行程编码的码字由两个Byte描述,如图5所示。
步骤103、根据base64编码将所述压缩图像转换成8bit字节码。
为了实现上述流程,本发明技术方案还提供车辆红外图像的压缩与增强***,如图6所示,该车辆红外图像的压缩与增强***包括红外摄像头模块21、采集模块22、压缩模块23、存储器24、发射电台25和全向天线26,其中:
所述红外摄像头模块21,用于采集视频流数据;
所述采集模块22,用于从所述红外摄像头模块采集的视频流中截取红外图像数据,按传输协议将十六进制的图像数据转换成各个像素点的位置信息以及像素值大小,形成格式为BMP的红外位图图像;
所述压缩模块23,用于将图像压缩至适合传输的大小的压缩图像,保存至所述存储器中备份;
所述存储器24,用于保存和备份所述压缩图像;
所述发射电台25,用于根据base64编码将压缩图像转换成8bit字节码发送给全向天线;
所述全向天线26,用于发射所述压缩图像。
所述压缩模块23具体包括:
空间变化单元,用于将所述BMP的红外位图图像的RGB颜色进行YCbCr颜色空间变换,得到JPEG图像;
DC平移单元,用于对所述JPEG图像进行DC电平转移;
子采样单元,用于对所述JPEG图像的YCbCr分量进行子采样;采样YCbCr分量比为4∶1∶1或4∶2∶2;
分块单元,用于将所述子采样后的JPEG图像根据像素点进行N×N的子块分块;
DCT变换单元,用于对所述JPEG图像分块得到的N×N的子块进行离散傅里叶DCT变换,将图像数据转换为对应的DCT系数;
量化单元,用于对所述DCT系数进行量化压缩;
Zig-zag扫描单元,用于对所述量化编码后的数据进行Zig-zag扫描;
编码单元,用于对所述Zig-zag扫描后的数据分开进行交流AC系数和直流DC系数的编码;
行程码编码单元,用于对所述AC系数进行行程长度RLC编码。
所述空间变化单元中将所述BMP的红外位图图像的RGB颜色进行YCbCr颜色空间变换,根据如下公式进行:
Y=0.299000R+0.587000G+0.114000B
Cb=-0.169736R-0.331264G+0.500002B
Cr=0.500000R-0.418688G-0.081312B
其中,Y为亮度分量,Cb(U)和Cr(V)为蓝红色度分量,R、G和B分别为红、绿、蓝三个通道的颜色。
所述DCT变换单元中的离散傅里叶DCT变换,根据如下方式进行:
一维DCT变换的正变换公式为:
其中,n,k=0,......,N-1,N为压缩前图像序列长度,x(n)为压缩前图像序列;
二维DCT的正变换公式为:
其中,F(u,v)为变换后的图像,f(x,y)为原图像,C(u)和C(v)为蓝红色度分量;
二维DCT的反变换公式为:
其中,F(u,v)为变换后的图像,f(x,y)为原图像,C(u)和C(v)为蓝红色度分量;
以上各式的系数分别为:x,y,u,v=0,1,......,N-1
其中,C(u)和C(v)为蓝红色度分量。
综上所述,本发明的技术方案,提出了一种车辆红外图像的压缩与增强方案,从车辆采集的视频流中截取红外图像数据,按传输协议将十六进制的所述图像数据转换成各个像素点的位置信息以及像素值大小,形成格式为BMP的红外位图图像;将所述红外位图图像压缩至适合传输的大小得到压缩图像,保存至存储器中备份;根据base64编码将所述压缩图像转换成8bit字节码。利用红外成像与图像压缩与增强原理,解决了车联网中视觉传感器低精度、低速率以及图像占用空间大的问题。本发明的优点还在于:压缩率高,对通信信道带宽要求较低;传输速率快,提升数据处理中心处理速率;硬件实现简单,可编程性强,便于后续的升级开发。
本领域内的技术人员应明白,本发明的实施例可提供为方法、***、或计算机程序产品。因此,本发明可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。而且,本发明可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器和光学存储器等)上实施的计算机程序产品的形式。
本发明是参照根据本发明实施例的方法、设备(***)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器,使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。
这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读存储器中,使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品,该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。
这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上,使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理,从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。
显然,本领域的技术人员可以对本发明进行各种改动和变型而不脱离本发明的精神和范围。这样,倘若本发明的这些修改和变型属于本发明权利要求及其等同技术的范围之内,则本发明也意图包含这些改动和变型在内。
Claims (10)
1.一种车辆红外图像的压缩与增强方法,其特征在于,包括以下步骤:
从车辆采集的视频流中截取红外图像数据,按传输协议将十六进制的所述图像数据转换成各个像素点的位置信息以及像素值大小,形成格式为BMP的红外位图图像;
将所述红外位图图像压缩至适合传输的大小得到压缩图像,保存至存储器中备份;
根据base64编码将所述压缩图像转换成8bit字节码。
2.根据权利要求1所述的一种车辆红外图像的压缩与增强方法,其特征在于,所述将所述红外位图图像压缩至适合传输的大小得到压缩图像,包括:
将所述BMP的红外位图图像的RGB颜色进行YCbCr颜色空间变换,得到JPEG图像;
对所述JPEG图像进行DC电平转移;
对所述JPEG图像的YCbCr分量进行子采样;采样YCbCr分量比为4:1:1或4:2:2;
将所述子采样后的JPEG图像根据像素点进行N×N的子块分块;
对所述JPEG图像分块得到的N×N的子块进行离散傅里叶DCT变换,将图像数据转换为对应的DCT系数;
对所述DCT系数进行量化压缩;
对所述量化编码后的数据进行Zig-zag扫描;
对所述Zig-zag扫描后的数据分开进行交流AC系数和直流DC系数的编码;
对所述AC系数进行行程长度RLC编码。
3.根据权利要求2所述的一种车辆红外图像的压缩与增强方法,其特征在于,所述将所述BMP的红外位图图像的RGB颜色进行YCbCr颜色空间变换,根据如下公式进行:
Y=0.299000R+0.587000G+0.114000B
Cb=-0.169736R-0.331264G+0.500002B
Cr=0.500000R-0.418688G-0.081312B
其中,Y为亮度分量,Cb和Cr为蓝红色度分量,R、G和B分别为红、绿、蓝三个通道的颜色。
4.根据权利要求2所述的一种车辆红外图像的压缩与增强方法,其特征在于,所述将所述子采样后的JPEG图像根据像素点进行N×N的子块分块,包括:
将所述JPEG图像中的每个像素点对应的3个交替出现的分量分离并存入3张表中。
6.根据权利要求1所述的一种车辆红外图像的压缩与增强方法,其特征在于,所述方法还包括:
通过车辆的采集模块从红外摄像头发送给数据处理器的视频流中截取红外图像数据,按传输协议将十六进制的图像数据转换成各个像素点的位置信息以及像素值大小,形成格式为BMP的红外位图图像;
由压缩模块将图像压缩至适合传输的大小,保存至存储器中备份;
用base64编码将压缩后的图像转换成8bit字节码由发射电台通过全向天线发射到空中,传给接收电台。
7.一种车辆红外图像的压缩与增强***,其特征在于,所述***包括红外摄像头模块、采集模块、压缩模块、存储器、发射电台和全向天线,其中:
所述红外摄像头模块,用于采集视频流数据;
所述采集模块,用于从所述红外摄像头模块采集的视频流中截取红外图像数据,按传输协议将十六进制的图像数据转换成各个像素点的位置信息以及像素值大小,形成格式为BMP的红外位图图像;
所述压缩模块,用于将图像压缩至适合传输的大小的压缩图像,保存至所述存储器中备份;
所述存储器,用于保存和备份所述压缩图像;
所述发射电台,用于根据base64编码将压缩图像转换成8bit字节码发送给全向天线;
所述全向天线,用于发射所述压缩图像。
8.根据权利要求7所述的一种车辆红外图像的压缩与增强***,其特征在于,所述压缩模块具体包括:
空间变化单元,用于将所述BMP的红外位图图像的RGB颜色进行YCbCr颜色空间变换,得到JPEG图像;
DC平移单元,用于对所述JPEG图像进行DC电平转移;
子采样单元,用于对所述JPEG图像的YCbCr分量进行子采样;采样YCbCr分量比为4∶1∶1或4∶2∶2;
分块单元,用于将所述子采样后的JPEG图像根据像素点进行N×N的子块分块;
DCT变换单元,用于对所述JPEG图像分块得到的N×N的子块进行离散傅里叶DCT变换,将图像数据转换为对应的DCT系数;
量化单元,用于对所述DCT系数进行量化压缩;
Zig-zag扫描单元,用于对所述量化编码后的数据进行Zig-zag扫描;
编码单元,用于对所述Zig-zag扫描后的数据分开进行交流AC系数和直流DC系数的编码;
行程码编码单元,用于对所述AC系数进行行程长度RLC编码。
9.根据权利要求8所述的一种车辆红外图像的压缩与增强***,其特征在于,所述空间变化单元中将所述BMP的红外位图图像的RGB颜色进行YCbCr颜色空间变换,根据如下公式进行:
Y=0.299000R+0.587000G+0.114000B
Cb=-0.169736R-0.331264G+0.500002B
Cr=0.500000R-0.418688G-0.081312B
其中,Y为亮度分量,Cb和Cr为蓝红色度分量,R、G和B分别为红、绿、蓝三个通道的颜色。
10.根据权利要求8所述的一种车辆红外图像的压缩与增强***,其特征在于,所述DCT变换单元中的离散傅里叶DCT变换,根据如下方式进行:
一维DCT变换的正变换公式为:
其中,n,k=0,......,N-1,N为压缩前图像序列长度,x(n)为压缩前图像序列;
二维DCT的正变换公式为:
其中,F(u,v)为变换后的图像,f(x,y)为原图像,C(u)和C(v)为蓝红色度分量;
二维DCT的反变换公式为:
其中,F(u,v)为变换后的图像,f(x,y)为原图像,C(u)和C(v)为蓝红色度分量;
以上各式的系数分别为:x,y,u,v=0,1,......,N-1
其中,C(u)和C(v)为蓝红色度分量。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110822091.7A CN113542762A (zh) | 2021-07-20 | 2021-07-20 | 一种车辆红外图像的压缩与增强方法和*** |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110822091.7A CN113542762A (zh) | 2021-07-20 | 2021-07-20 | 一种车辆红外图像的压缩与增强方法和*** |
Publications (1)
Publication Number | Publication Date |
---|---|
CN113542762A true CN113542762A (zh) | 2021-10-22 |
Family
ID=78100555
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202110822091.7A Pending CN113542762A (zh) | 2021-07-20 | 2021-07-20 | 一种车辆红外图像的压缩与增强方法和*** |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN113542762A (zh) |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20130016401A1 (en) * | 2011-07-11 | 2013-01-17 | Nenad Rijavec | Halftoning run length encoded datastreams |
CN104349168A (zh) * | 2014-08-11 | 2015-02-11 | 大连戴姆科技有限公司 | 一种超高速图像实时压缩方法 |
CN106612436A (zh) * | 2016-01-28 | 2017-05-03 | 四川用联信息技术有限公司 | 一种基于dct变换下的视觉感知修正图像压缩方法 |
CN107919943A (zh) * | 2016-10-11 | 2018-04-17 | 阿里巴巴集团控股有限公司 | 二进制数据的编码、解码方法和装置 |
-
2021
- 2021-07-20 CN CN202110822091.7A patent/CN113542762A/zh active Pending
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20130016401A1 (en) * | 2011-07-11 | 2013-01-17 | Nenad Rijavec | Halftoning run length encoded datastreams |
CN104349168A (zh) * | 2014-08-11 | 2015-02-11 | 大连戴姆科技有限公司 | 一种超高速图像实时压缩方法 |
CN106612436A (zh) * | 2016-01-28 | 2017-05-03 | 四川用联信息技术有限公司 | 一种基于dct变换下的视觉感知修正图像压缩方法 |
CN107919943A (zh) * | 2016-10-11 | 2018-04-17 | 阿里巴巴集团控股有限公司 | 二进制数据的编码、解码方法和装置 |
Non-Patent Citations (1)
Title |
---|
任婷婷: "红外成像人体测温***软件设计", 《中国信息科技辑》, pages 4 - 5 * |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US6125201A (en) | Method, apparatus and system for compressing data | |
US6865291B1 (en) | Method apparatus and system for compressing data that wavelet decomposes by color plane and then divides by magnitude range non-dc terms between a scalar quantizer and a vector quantizer | |
JP6141295B2 (ja) | 知覚的に無損失のおよび知覚的に強調された画像圧縮システムならびに方法 | |
JP4097873B2 (ja) | マルチスペクトル画像の画像圧縮方法および画像圧縮装置 | |
Fischer et al. | Sparse overcomplete Gabor wavelet representation based on local competitions | |
Yadav et al. | A review on image compression techniques | |
JP3986221B2 (ja) | マルチスペクトル画像の画像圧縮方法および画像圧縮装置 | |
Li et al. | Image compression using transformed vector quantization | |
US20140267916A1 (en) | Selective perceptual masking via scale separation in the spatial and temporal domains using intrinsic images for use in data compression | |
JP4097874B2 (ja) | マルチスペクトル画像の画像圧縮方法および画像圧縮装置 | |
Sadkhan | A proposed image compression technique based on DWT and predictive techniques | |
WO2023241188A1 (zh) | 一种无人机定量遥感应用的数据压缩方法 | |
Zhang et al. | Fractal color image compression using vector distortion measure | |
Roterman et al. | Progressive image coding using regional color correlation | |
CN113542762A (zh) | 一种车辆红外图像的压缩与增强方法和*** | |
Markman et al. | Hyperspectral image coding using 3D transforms | |
US20140270567A1 (en) | Selective perceptual masking via scale separation in the spatial and temporal domains using intrinsic images for use in data compression | |
US20040264787A1 (en) | Image processing decompression apparatus and method of using same different scaling algorithms simultaneously | |
Gowthami et al. | A novel approach towards high-performance image compression using multilevel wavelet transformation for heterogeneous datasets | |
Schmalz et al. | Data compression techniques for underwater imagery | |
JP3986219B2 (ja) | マルチスペクトル画像の画像圧縮方法および画像圧縮装置 | |
JPH03133290A (ja) | 画像符号化装置 | |
Hakami et al. | Improve data compression performance using wavelet transform based on HVS | |
Raju et al. | Fuzzy based super resolution multispectral image compression with improved SPIHT | |
Siddique et al. | Exhaustive crisp parameter modification in quantization table for effective image compression |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |