CN102801971A - 编码装置、编码方法和程序 - Google Patents

编码装置、编码方法和程序 Download PDF

Info

Publication number
CN102801971A
CN102801971A CN2012101506473A CN201210150647A CN102801971A CN 102801971 A CN102801971 A CN 102801971A CN 2012101506473 A CN2012101506473 A CN 2012101506473A CN 201210150647 A CN201210150647 A CN 201210150647A CN 102801971 A CN102801971 A CN 102801971A
Authority
CN
China
Prior art keywords
unit
object image
adjustment
picture
coded object
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN2012101506473A
Other languages
English (en)
Inventor
小鹰直彦
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Sony Corp
Original Assignee
Sony Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Sony Corp filed Critical Sony Corp
Publication of CN102801971A publication Critical patent/CN102801971A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/60Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding
    • H04N19/61Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding in combination with predictive coding
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/115Selection of the code volume for a coding unit prior to coding
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/134Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
    • H04N19/136Incoming video signal characteristics or properties
    • H04N19/137Motion inside a coding unit, e.g. average field, frame or block difference
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/134Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
    • H04N19/162User input
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/17Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object
    • H04N19/172Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object the region being a picture, frame or field
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/124Quantisation

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Compression Or Coding Systems Of Tv Signals (AREA)

Abstract

本发明涉及编码装置、编码方法和程序。速率控制单元基于拍摄编码对象图像时的拍摄单元的状态调整当对编码对象图像进行编码时的目标码量,该编码对象图像为编码的对象,该目标码量为码量的目标,并且正交变换单元、量子化单元和可变长度编码单元根据调整的目标码量对编码对象图像进行编码。本发明技术例如能够应用到对通过拍摄单元的拍摄获得的每个图像进行编码的编码装置。

Description

编码装置、编码方法和程序
技术领域
本发明涉及编码装置、编码方法和程序,具体地讲,例如涉及能够控制编码时的码量以抑制解码时的图像恶化的编码装置、编码方法和程序。
背景技术
例如,在诸如使用变成编码对象的图像之间的相关性来编码图像的运动图像专家组(MPEG)的编码方案之中,提议了一种控制编码每个图像时的码量以抑制解码时的图像恶化的技术。
根据该控制码量的技术,通过反馈参数(例如,通过编码每个图像获得的码量和编码时使用的量子化标度(quantization scale))控制编码时每个图像的码量(参见日本专利公布No.2009-118097)。
发明内容
然而,例如,当变成编码对象的每个图像是要通过在拍摄单元中进行拍摄获得的图像时,图像之间的相关性根据拍摄时拍摄单元的状态变化。
也就是说,例如,当通过拍摄单元执行快速移近或移远(下文简单称作变焦)时,图像之间的相关性相对下降。
在这种情况下,在上述的控制码量的技术中,需要预测变成编码对象的图像,并且控制参照获得的预测图像进行编码的图像(例如,在MPEG情况下的P和B画面)的码量变得较大以抑制解码时的图像恶化。
此外,例如,当没有通过拍摄单元执行快速变焦等等时,图像之间的相关性相对增加。
在这种情况下,在上述的控制码量的技术中,需要控制作为预测图像被参照的图像(例如,MPEG情况下的I和P画面)的码量增加以抑制解码时图像恶化。
然而,在上述的控制码量的技术中,没有基于拍摄单元的状态控制码量。因此,当通过拍摄单元执行快速变焦等等时,难于执行跟随拍摄单元的快速变焦等等控制码量,由此解码时图像恶化。
鉴于以上情形做出本发明,并且本发明可以抑制解码时的图像恶化而不管拍摄单元的状态如何。
根据本发明的实施例的编码装置,包括:调整单元,被构造为基于拍摄编码对象图像时的拍摄单元的状态调整当对编码对象图像进行编码时的目标码量,该编码对象图像为编码的对象,该目标码量为码量的目标;以及编码单元,被构造为根据调整的目标码量对编码对象图像进行编码。
调整单元可以基于拍摄单元的状态,通过向第一编码对象图像和第二编码对象图像之一分配较大目标码量执行调整,第一编码对象图像参照通过预测编码对象图像获得的预测图像进行编码,第二编码对象图像作为预测图像被参照。
调整单元可以基于拍摄编码对象图像时的拍摄单元的变焦的状态调整目标码量。
调整单元可以通过如下动作执行调整:当以具有预定阈值或更高的速度执行变焦时向第一编码对象图像分配较大目标码量,当以具有预定阈值或更高的速度执行的变焦完成时向第二编码对象图像分配较大目标码量。
调整单元可以基于拍摄编码对象图像时的拍摄单元的聚焦的状态调整目标码量。
调整单元可以通过如下动作执行调整:当聚焦改变时向第一编码对象图像分配较大目标码量,当聚焦改变完成时向第二编码对象图像分配较大目标码量。
调整单元可以基于拍摄编码对象图像时拍摄单元的移动的状态调整目标码量。
调整单元可以通过如下动作执行调整:当拍摄单元以具有预定阈值或更高的速度移动时向第一编码对象图像分配较大目标码量,当以具有预定阈值或更高的速度的拍摄单元的移动完成时向第二编码对象图像分配较大目标码量。
调整单元可以基于拍摄编码对象图像时拍摄单元的曝光的状态调整目标码量。
调整单元可以通过如下动作执行调整:当曝光改变时向第一编码对象图像分配较大目标码量,当曝光改变完成时向第二编码对象分配较大目标码量。
编码装置还可以包括:检测单元,被构造为根据用户对拍摄单元的操作检测拍摄编码对象图像时的拍摄单元的状态,其中,调整单元可以基于检测的拍摄单元的状态调整目标码量。
根据本发明的另一个实施例的编码方法提供了一种对图像进行编码的编码装置的编码方法,包括:通过编码装置基于拍摄编码对象图像时的拍摄单元的状态调整当对编码对象图像进行编码时的目标码量,该编码对象图像为编码的对象,该目标码量为码量的目标;以及通过编码装置根据调整的目标码量对编码对象图像进行编码。
根据本发明的另一个实施例的程序提供了一种使得计算机发挥如下作用的程序:调整单元,被构造为基于拍摄编码对象图像时的拍摄单元的状态调整当对编码对象图像进行编码时的目标码量,该编码对象图像为编码的对象,该目标码量为码量的目标;以及编码单元,被构造为根据调整的目标码量对编码对象图像进行编码。
根据本发明的一个实施例,基于拍摄编码对象图像时的拍摄单元的状态调整当对编码对象图像进行编码时的目标码量,并且根据调整的目标码量对编码对象图像进行编码,该编码对象图像为编码的对象,该目标码量为码量的目标。
根据本发明,不管拍摄单元的状态如何均能够抑制图像恶化。
附图说明
图1是示出根据本发明的实施例的数字视频相机的结构例子的框图;
图2是示出了根据拍摄单元的状态调整分配给每个画面的目标码量的例子的示图;
图3是示出由数字视频相机执行的压缩编码处理的流程图;
图4是示出速率控制处理的细节的流程图;以及
图5是示出计算机的结构例子的框图。
具体实施方式
将在下文中参照附图详细描述本发明的优选实施例。注意:在这个说明书和附图中,功能和结构基本相同的组成部件由相同标号进行指示,并且省去这些组成部件的重复解释。
将在下文中描述本发明的实施例(下文称作本实施例)。基于下面顺序进行说明。
1.本实施例(根据拍摄单元的状态调整分配给每个画面的目标码量的情况的例子)
2.变型
<1.本实施例>
[数字视频相机1的结构例子]
图1是示出根据本实施例的数字视频相机1的结构例子的框图。
数字视频相机1包括拍摄单元21、重排单元22、切换开关23、正交变换单元24、量子化单元25、逆量子化单元26、逆正交变换27、加法单元28、连接开关29、具有内置帧存储器30a的运动补偿预测单元30、差计算单元31、可变长度编码单元32、缓冲器单元33、输出端子34、速率控制单元35和操作单元36。
此外,数字视频相机1能够通过根据拍摄单元21的拍摄时的快速变焦等等控制使用例如MPEG(下文还称作压缩编码)的编码方案进行编码时的每个图像的码量,抑制解码时的图像恶化。
此外,在数字视频相机1中,除了变焦等等以外,还可以根据拍摄时的聚焦或曝光的变化、拍摄单元21的移动(摇摆或倾斜、手模糊)等等控制压缩编码时的每个图像的码量。然而,在本实施例中,为了易于解释,将描述根据拍摄时的变焦控制码量的情况。其它情况的说明将被描述为变型例子。
拍摄单元21拍摄被摄体,并且将通过拍摄获得的帧(图像)提供给重排单元22。
重排单元22使用以显示顺序从拍摄单元21提供的帧作为画面,并且根据例如由15个画面组成的画面组(GOP)结构以画面顺序对帧重排以进行压缩。
重排单元22根据重排的顺序使用作为帧的每个画面作为I画面、P画面和B画面的任何一个。重排单元22然后以例如由16×16像素组成的宏块为单位输出每帧。
这里,I画面是没有参照其它画面进行内编码的帧。此外,P画面是通过参照之前显示的I画面或P画面并且使用从参照的画面产生(预测)的预测图像进行预测编码的帧。此外,B画面是通过参照之前显示的I或P画面以及以后显示的I和P画面之一或二者,并且使用从参照的图像产生的预测图像进行预测编码的帧。此外,在预测编码其它画面时参照I和P画面,而在预测编码其它画面时没有参照B画面。
具体地讲,例如,在输出I画面时,重排单元22将切换开关23的一端连接到连接端子A并且没有将连接开关29连接到连接端子C。然后,重排单元22将I画面划分成多个宏块IMB,并且通过连接端子A和切换开关23将这些宏块提供给正交切换单元24。
此外,例如,在输出P画面时,重排单元22将切换开关23的一端连接到连接端子B并且将连接开关29连接到连接端子C。然后,重排单元22将P画面划分成多个宏块PMB,并且将这些宏块提供给运动补偿预测单元30和差计算单元31。
以类似方法,在输出B画面时,重排单元22将切换开关23的一端连接到连接端子B并且将连接开关29连接到连接端子C。重排单元22然后将B画面划分成多个宏块BMB,并且将这些宏块提供给运动补偿预测单元30和差计算单元31。
根据重排单元22的控制,切换开关23的一端能够连接到连接端子A和连接端子B之一,并且由此连接到连接端子A和连接端子B。此外,切换开关23的另一端连接到正交变换单元24。
正交变换单元24例如对经由连接端子A和切换开关23从重排单元22提供的宏块IMB执行诸如离散余弦变换(DCT)的正交变换并且将获得的变换系数f(IMB)提供给量子化单元25。
此外,在正交变换单元24中,例如,16×16像素的宏块IMB被划分成每个由8×8像素组成的多个块,并且对划分的每个块执行正交变换。此外,正交变换不限于DCT而可以采用例如卡洛南-洛依(K-L)变换或离散小波变换、等等。
此外,正交变换单元24对经由连接端子B和切换开关23从差计算单元31提供的预测残差PMBD执行正交变换,并且将获得的变换系数f(PMBD)提供给量子化单元25。
此外,预测残差PMBD指示宏块PMB与通过基于由运动补偿预测单元30执行的运动补偿预测宏块PMB获得的预测宏块PMB′之间的差(PMB-PMB′)。
此外,正交变换单元24对经由连接端子B和切换开关23从差计算单元31提供的预测残差BMBD执行正交变换,并且将获得的变换系数f(BMBD)提供给量子化单元25。
此外,预测残差BMBD指示宏块BMB与通过基于由运动补偿预测单元30执行的运动补偿预测宏块BMB获得的预测宏块BMB′之间的差(BMB-BMB′)。
量子化单元25基于来自速率控制单元35的量子化标度量子化来自正交变换单元24的变换系数f(IMB),并且将获得的量子化变换系数F(IMB)提供给逆量子化单元26和可变长度编码单元32。
此外,量子化单元25基于来自速率控制单元35的量子化标度量子化来自正交变换单元24的变换系数f(PMBD),并且将获得的量子化变换系数F(PMBD)提供给逆量子化单元26和可变长度编码单元32。
此外,量子化单元25基于来自速率控制单元35的量子化标度量子化来自正交变换单元24的变换系数f(BMBD),并且将获得的量子化变换系数F(BMBD)提供给可变长度编码单元32。
逆量子化单元26对来自量子化单元25的量子化变换系数F(IMB)执行逆量子化,并且将获得的变换系数f(IMB)提供给逆正交变换单元27。此外,逆量子化单元26对来自量子化单元25的量子化变换系数F(PMBD)执行逆量子化,并且将获得的变换系数f(PMB)提供给逆正交变换单元27。
逆正交变换单元27对来自逆量子化单元26的变换系数f(IMB)执行逆正交变换,并且通过加法单元28将获得的宏块IMB提供给运动补偿预测单元30。
逆正交变换单元27对来自逆量子化单元26的变换系数f(PMBD)执行逆正交变换,并且将获得的预测残差PMBD提供给加法单元28。
加法单元28原样将来自逆正交变换单元27的宏块IMB提供给运动补偿预测单元30。
此外,加法单元28将来自逆正交变换单元27的预测残差PMBD(=PMB-PMB′)与经由连接开关29从运动补偿预测单元30提供的预测宏块PMB′相加。加法单元28然后将通过相加获得的宏块PMB提供给运动补偿预测单元30。
根据重排单元22的控制,连接开关29的一端经由连接端子C连接到加法单元28。
运动补偿预测单元30具有内置帧存储器30a,并且将来自加法单元28的宏块IMB和PMB保存在内置帧存储器30a中作为产生预测宏块PMB′或BMB′所参照的基准宏块。
此外,例如,运动补偿预测单元30基于保存在帧存储器30a中的基准宏块IMB检测指示来自重排单元22的宏块PMB的运动的运动矢量PMV,并且将检测的运动矢量提供给可变长度编码单元32。
此外,例如,运动补偿预测单元30基于检测的运动矢量PMV和保存在帧存储器30a中的基准宏块IMB对宏块PMB进行运动补偿。运动补偿预测单元30将通过运动补偿获得的预测宏块PMB′提供给连接开关29和差计算单元31。
此外,例如,运动补偿预测单元30基于保存在帧存储器30a内的基准宏块IMB或基准宏块PMB检测指示来自重排单元22的宏块BMB的运动的运动矢量BMV,并且将检测的运动矢量提供给可变长度编码单元32。
运动补偿预测单元30然后基于检测的运动矢量BMV和保存在帧存储器30a内的基准宏块IMB或基准宏块PMB对宏块BMB进行运动补偿。运动补偿预测单元30将通过运动补偿获得的预测宏块BMB′提供给差计算单元31。
差计算单元31计算指示来自重排单元22的宏块PMB与来自运动补偿预测单元30的预测宏块PMB′之间的差的预测残差PMBD(=PMB-PMB′),并且经由输出端子B和切换开关23将预测残差提供给正交变换单元24。
此外,差计算单元31计算指示来自重排单元22的宏块BMB与来自运动补偿预测单元30的预测宏块BMB′之间的差的预测残差BMBD(=BMB-BMB′),并且经由输出端子B和切换开关23将预测残差提供给正交变化单元24。
可变长度编码单元32对来自量子化单元25的量子化变换系数F(IMB)执行可变长度编码,并且将获得的码EN(I)提供给缓冲器单元33并且使得缓冲器单元保存获得的码。
此外,可变长度编码单元32对来自量子化单元25的量子化变换系数F(PMBD)和来自运动补偿预测单元30的运动矢量PMV执行可变长度编码,并且将获得的码EN(P)提供给缓冲器单元33并且使得缓冲器单元保存获得的码。
此外,可变长度编码单元32对来自量子化单元25的量子化变换系数F(BMBD)和来自运动补偿预测单元30的运动矢量BMV执行可变长度编码,并且将获得的码EN(B)提供给缓冲器单元33并且使得缓冲器单元保存获得的码。
缓冲器单元33临时保存来自可变长度编码单元32的码,并且将码提供给输出端子34。
此外,缓冲器单元33基于来自可变长度编码单元32的码EN(I)计算产生的指示码EN(I)的码量的码量Si,并且将产生的码量提供给速率控制单元35。
以类似的方法,缓冲器单元33基于来自可变长度编码单元32的码EN(P)计算产生的指示码EN(P)的码量的码量Sp,并且将产生的码量提供给速率控制单元35。此外,缓冲器单元33基于来自可变长度编码单元32的码EN(B)计算产生的指示码EN(B)的码量的码量Sb,并且将产生的码量提供给速率控制单元35。
输出端子34是将保存在缓冲器单元33中的码输出到例如未示出的硬盘等等作为MPEG压缩编码的编码结果的端子。
速率控制单元35例如使用TM5的码量控制算法控制1GOP的编码速率。具体地讲,例如,速率控制单元35计算1GOP中的每个画面的量子化标度,并且将计算的量子化标度提供给量子化单元25。
针对使用TM5的码量控制算法的速率控制,采用从缓冲器单元33提供给速率控制单元35的产生的码量Si、Sp和Sb以及在速率控制单元35中计算的平均量子化标度Qi、Qp和Qb。
此外,将在以后描述TM5的细节。还在专利文献1或者http://mpeg.org/MPEG/MSSG/tm5/Ch10/Ch10.html等等中描述了 TM5
此外,速率控制单元35根据来自操作单元36的操作信号检测拍摄单元21的状态(例如,是否在拍摄单元21中执行快速变焦、等等)。
然后,速率控制单元35通过基于检测的拍摄单元21的状态改变用于码量控制算法的参数(将在以后描述的R、Kb或Kp)调整目标码量(指示产生的作为压缩编码每个画面时的目标的码量)。
也就是说,例如,当速率控制单元35检测没有在拍摄单元21中执行快速变焦等等作为拍摄单元21的状态时,速率控制单元确定通过拍摄单元21的拍摄获得的帧(画面)的预测残差没有增加。
当速率控制单元35确定预测残差没有增加时,速率控制单元改变用于计算目标码量Ti、Tp和Tb的参数,从而使得I画面的目标码量Ti和P画面的目标码量Tp增加而B画面的目标码量Tb减小(如图2A所示)。
这里,目标码量Ti指示产生的作为对包括在1GOP内的I画面进行压缩编码时的目标的码量Si。此外,目标码量Tp指示产生的码量Sp即对包括在1GOP内的P画面进行压缩编码时的目标。此外,目标码量Tb指示产生的码量Sb即对包括在1GOP内的B画面进行编码时的目标。
此外,例如,当速率控制单元35检测在拍摄单元21中执行快速变焦等等作为拍摄单元21的状态时,速率控制单元确定预测残差增加。
当速率控制单元35确定预测残差增加时,速率控制单元改变参数,从而使得I画面的目标码量Ti减少而P画面的目标码量Tp和B画面的目标码量Tb增加(如图2B所示)。
此外,图2B所示的目标码量Ti例如是图2A所示的目标码量Ti的0.7倍,图2B所示的目标码量Tp例如是图2A所示的目标码量Tp的1.1倍,图2B所示的目标码量Tb例如是图2A所示的目标码量Tb的1.2倍。
当参数改变时,速率控制单元35在码量控制算法中使用改变的参数执行码量控制算法。
也就是说,例如,速率控制单元35使用上述的参数通过使用TM5中的第一步骤计算1GOP中的目标码量Ti、Tp和Tb。
在TM5的第二和第三步骤中,速率控制单元35然后基于在第一步骤中计算的目标码量Ti、Tp和Tb确定编码对象画面的每个宏块的量子化标度mquantj,并且将确定的量子化标度提供给量子化单元25。
也就是说,速率控制单元35通过使得量子化单元25使用量子化标度mquantj(根据该量子化标度mquantj,每1GOP中的I、P和B画面被压缩编码成在第一步骤中计算的对应目标码量Ti、Tp和Tb)执行量子化控制编码率。
操作单元36包括当执行拍摄单元21的变焦等等时进行操作的按钮等等并且由用户操作。例如,操作单元36根据用户的操作向速率控制单元35提供对应操作信号。
[TM5中的第一到第三步骤的细节]
接下来,将描述TM5的细节。通过下面的第一步骤到第三步骤执行TM5。
(第一步骤)确定分配给每1GOP的I画面的目标码量Ti、分配给每1GOP的P画面的目标码量Tp和分配给每1GOP的B画面的目标码量Tb的步骤。
(第二步骤)基于在第一步骤内确定的目标码量Ti、Tp和Tb确定编码对象画面的第j宏块中的适宜量子化标度Qj的步骤。
(第三步骤)基于在第二步骤中确定的适宜量子化标度Qj确定最终量子化标度mquantj的步骤。
每当在第一步骤中执行I画面的压缩编码时,速率控制单元35更新压缩编码I画面时的全局复杂度测量Xi、压缩编码P画面时的全局复杂度测量Xp和压缩编码B画面时的全局复杂度测量Xb。
此外,分别在下面的方程(1)到(3)中计算全局复杂度测量Xi、Xp和Xb的初始值。
Xi=(160×bit_rate)/115---(1)
Xp=(60×bit_rate)/115---(2)
Xb=(42×bit_rate)/115---(3)
这里,预先根据拍摄单元21的拍摄模式、将从输出端子34输出的码写入硬盘时的写入率等等确定bit_rate(比特/秒),bit_rate指示对从可变长度编码单元32输出的码的编码率。
也就是说,例如,每当在第一步骤内执行I画面的压缩编码时,速率控制单元35通过下面方程(4)更新全局复杂度测量Xi。这里,产生的码量Si指示通过I画面的压缩编码产生的码EN(I)的码量。此外,平均量子化标度Qi指示当量子化组成I画面的各个宏块IMB时使用的量子化标度的均值。
Xi=Si×Qi  ---(4)
此外,例如,每当在第一步骤内执行P画面的压缩编码时,速率控制单元35通过方程(5)更新全局复杂度测量Xp。这里,产生的码量Sp指示通过P画面的压缩编码产生的码EN(P)的码量。此外,平均量子化标度Qp指示当量子化组成P画面的各个宏块的预测残差PMBD时使用的量子化标度的均值。
Xp=Sp×Qp---(5)
此外,例如,每当在第一步骤内执行B画面的压缩编码时,速率控制单元35通过下面的方程(6)更新全局复杂度测量Xb。这里,产生的码量Sb指示通过B画面的压缩编码产生的码EN(B)的码量。此外,平均量子化标度Qb指示在量子化组成B画面的各个宏块的预测残差BMBD时使用的量子化标度的均值。
Xb=Sb×Qb---(6)
此外,每当在第一步骤内压缩编码一个画面时,速率控制单元35更新GOP目标码量R,其指示在压缩编码1GOP时的目标的码量。此外,在下面方程(7)中表达GOP目标码量R。
R=G+Rpre---(7)
这里,例如,当1GOP由N个画面组成时,初始目标码量G被表示为G=N×bit_rate/picture_rate。此外,GOP目标码量Rpre指示前一时间的1GOP中的GOP目标码量R的残余(余数)。此外,GOP目标码量Rpre的初始值是0。此外,预先根据拍摄单元21的拍摄模式或者在将从输出端子34等输出的码写入硬盘时的写入速率确定画面速率picture_rate(画面/秒),picture_rate指示与从可变长度编码单元32输出的码对应的每个画面的画面速率。
也就是说,例如,每当执行I画面的压缩编码时速率控制单元35从GOP目标码量R减去通过压缩编码I画面获得的产生的码EN(I)的码量Si,并且由此在第一步骤中更新GOP目标码量R。
此外,例如,每当执行P画面的压缩编码时速率控制单元35从GOP目标码量R减去通过压缩编码P画面获得的产生的码EN(P)的码量Sp,并且由此在第一步骤中更新GOP目标码量R。
此外,例如,每当执行B画面的压缩编码时速率控制单元35从GOP目标码量R减去通过压缩编码B画面获得的产生的码EN(B)的码量Sb,并且由此在第一步骤中更新GOP目标码量R。
速率控制单元35然后更新全局复杂度测量Xi、Xp和Xb以及GOP目标码量R,并且在第一步骤中通过下面方程(8)计算目标码量Ti。
Ti=max{R/(1+((Np×Xp)/(Xi×Xp))+((Nb×Xb)/(Xi×Kb))),bit_rate/(8×picture_rate)}---(8)
此外,余数Np的数字指示1GOP内还没有进行压缩编码的P画面的余数的数字。此外,余数Nb的数字指示1GOP内还没有进行压缩编码的剩余B画面的数字。此外,常数Kb例如是1.4。
以类似方法,速率控制单元35更新全局复杂度测量Xi、Xp和Xb以及GOP目标码量R,然后在第一步骤中通过下面的方程(9)和(10)计算目标码量Tp和目标码量Tb。此外,常数Kp例如是1.0。
Tp=max{R/(Np+((Nb×Kp×Xb)/(Kb×Xp))),bit_rate/(8×picture_rate)}---(9)
Tb=max{R/(Nb+((Np×Kb×Xp)/(Kp×Xb))),bit_rate/(8×picture_rate)}---(10)
由此,速率控制单元35中的第一步骤由此完成。
在第二步骤内速率控制单元35通过下面方程(11)计算第j宏块IMB中的适宜量子化标度Qj。
Qj=(dj×31/r)---(11)
这里,r=2×bit_rate/picture_rate,dj=doi+Bj-1-(Ti×(j-1)/MB_cnt),并且doi=10×r/31。此外,MB_cnt指示一个画面中的宏块的总数。此外,例如,产生的码量Bj-1指示以光栅扫描顺序在一直到第(j-1)宏块IMB内产生的码量。
此外,以类似方法,在第二步骤内计算第j宏块PMB中的适宜量子化标度Qj的情况下,速率控制单元35通过方程(11)计算量子化标度Qj。在这种情况下,dj=dop+Bj-1-(Tp×(j-1)/MB_cnt),并且dop=Kp×doi
此外,以类似方法,在第二步骤内计算第j宏块BMB中的适宜量子化标度Qj的情况下,速率控制单元35通过方程(11)计算量子化标度Qj。在这种情况下,dj=dob+Bj-1-(Tb×(j-1)/MB_cnt),并且dob=Kb×doi
由此,速率控制单元35中的第二步骤由此完成。
在第二步骤完成以后,在第三步骤内速率控制单元35通过下面方程(12)计算指示每个宏块IMB的第j宏块IMB中的图像的复杂度的空间活动actj。
actj=1+min(vblk1,vblk2,…,vblk8)---(12)
这里,vblnkn由下面方程(13)进行表示。
vblnkn=(1/64)×Σ64 k=1(Pn kP_meank)2---(13)
此外,P_meank由下面方程(14)进行表示。
P meank=(1/64)×Σ64 k=1Pn k---(14)
此外,Pn k指示宏块IMB中的第n个8×8像素块的像素中的第k像素的像素值。
此外,速率控制单元35通过方程(15)对空间活动actj进行标准化,并且在第三步骤内计算标准化的空间活动N_actj。
N_actj={(2×actj)+avg_act}/{actj+(2×avg_act)}---(15)
这里,avg_act指示组成刚好先前压缩编码的画面(在这种情况下,例如,刚好在由宏块IMB组成的I画面之前压缩编码的画面)的各个宏块的空间活动actj的均值。此外,当压缩编码画面还不存在时,avg_act例如变成400。
然后,在第三步骤内速率控制单元35通过方程(16)计算在量子化第j宏块IMB时使用的量子化标度mquantj。
mquantj=Qj×N_actj  ---(16)
此外,以类似方式,在第三步骤内,速率控制单元35计算在量子化与第j宏块PMB对应的预测残差PMBD时使用的量子化标度和在量子化与第j宏块BMB对应的预测残差BMBD时使用的量子化标度。
[数字视频相机1的操作的说明]
接下来,将参照图3的流程图描述由数字视频相机1执行的压缩编码处理。
例如,当用户使用操作单元36执行用于启动拍摄单元21的拍摄的操作时,启动压缩编码处理。
在步骤S1中,拍摄单元21拍摄被摄体,并且将通过拍摄获得的帧(图像)提供给重排单元22。
在步骤S2中,重排单元22根据GOP结构以用于压缩的画面顺序将画面重排为以显示顺序从拍摄单元21提供的帧。
在步骤S3中,重排单元22根据重排的画面顺序顺序使用每个画面作为关注画面。
在步骤S4中,速率控制单元35执行计算组成关注画面的各个宏块的量子化标度的速率控制处理,并且将获得的量子化标度提供给量子化单元25。此外,将参照图4的流程图描述速率控制处理的细节。
在步骤S5中,重排单元22根据重排的画面顺序确定关注画面是否是I画面,并且当确定关注画面是I画面时处理进入步骤S6。
在步骤S6中,重排单元22将切换开关23的一端连接到连接端子A,并且没有将连接开关29连接到连接端子C。重排单元22然后将作为关注画面的I画面划分成多个宏块IMB,并且经由连接端子A和切换开关23将这些宏块提供给正交变换单元24。
在步骤S7中,正交变换单元24对经由连接端子A和切换开关23从重排单元22提供的宏块IMB执行诸如DCT等等的正交变换,并且将获得的变换系数f(IMB)提供给量子化单元25。
此外,当关注画面是P画面时,正交变换单元24对经由连接端子B从差计算单元31提供的预测残差PMBD执行正交变换,并且将获得的变换系数f(PMBD)提供给量子化单元25。此外,当关注画面是B画面时,正交变换单元24对经由连接端子B从差计算单元31提供的预测残差BMBD执行正交变换,并且将获得的变换系数f(BMBD)提供给量子化单元25。
在步骤S8中,量子化单元25基于来自速率控制单元35的与宏块IMB对应的量子化标度量子化来自正交变换单元24的变换系数f(IMB)。量子化单元25然后将获得的量子化变换系数F(IMB)提供给逆量子化单元26和可变长度编码单元32。
此外,当关注画面是P画面时,量子化单元25基于来自速率控制单元35的与宏块PMB(其预测残差PMBD)对应的量子化标度量子化来自正交变换单元24的变换系数f(PMB)。量子化单元25然后将获得的量子化变换系数F(PMB)提供给逆量子化单元26和可变长度编码单元32。
此外,当关注画面是B画面时,量子化单元25基于来自速率控制单元35的与宏块BMB(其预测残差BMBD)对应的量子化标度量子化来自正交变换单元24的变换系数f(BMB)。量子化单元25然后将获得的量子化变换系数F(BMB)提供给可变长度编码单元32。
在步骤S9中,可变长度编码单元32对来自量子化单元25的量子化变换系数F(IMB)执行可变长度编码,并且将获得的码EN(I)提供给缓冲器单元33,并且使得缓冲器单元保存获得的码。
此外,当关注画面是P画面时,可变长度编码单元32对来自量子化单元25的量子化变换系数F(PMB)和来自运动补偿预测单元30的运动矢量PMV执行可变长度编码,并且将获得的码EN(P)提供给缓冲器单元33并且使得缓冲器单元保存获得的码。此外,当关注画面是B画面时,可变长度编码单元32对来自量子化单元25的量子化变换系数F(BMB)和来自运动补偿预测单元30的运动矢量BMV执行可变长度编码,并且将获得的码EN(B)提供给缓冲器单元33并且使得缓冲器单元保存获得的码。
在步骤S10中,缓冲器单元33基于来自可变长度编码单元32的码EN(I)计算产生的码EN(I)的码量Si,并且将产生的码量提供给速率控制单元35。
此外,当关注画面是P画面时,缓冲器单元33基于来自可变长度编码单元32的码EN(P)计算产生的码EN(P)的码量Sp,并且将产生的码量提供给速率控制单元35。此外,当关注画面是B画面时,缓冲器单元33基于来自可变长度编码单元32的码EN(B)计算产生的码EN(B)的码量Sb,并且将产生的码量提供给速率控制单元35。
在步骤S11中,逆量子化单元26对来自量子化单元25的量子化变换系数F(IMB)执行逆量子化,并且将获得的变换系数f(IMB)提供给逆正交变换单元27。
此外,当关注画面是P画面时,逆量子化单元26对来自量子化单元25的量子化变换系数F(PMB)执行逆量子化,并且将获得的变换系数f(PMB)提供给逆正交变换单元27。此外,当关注画面是B画面时,步骤S11到步骤S13的处理被跳过。
在步骤S12中,逆正交变换单元27对来自逆量子化26的变换系数f(IMB)执行逆正交变换,并且经由加法单元28将获得的宏块IMB提供给运动补偿预测单元30。
此外,当关注画面是P画面时,逆正交变换单元27对来自逆量子化单元26的变换系数f(PMB)执行逆正交变换,并且将获得的宏块PMB的预测残差PMBD提供给加法单元28。
加法单元28将来自逆正交变换单元27的预测残差PMBD(=PMB-PMB ′)与经由连接开关29从运动补偿预测单元30提供的预测宏块PMB′之间的对应像素值进行相加。加法单元28然后将通过加法获得的宏块PMB提供给运动补偿预测单元30。
在步骤S13中,运动补偿预测单元30将经由加法单元28从逆正交变换单元27提供的宏块IMB作为用于产生预测宏块PMB′或BMB′所参照的基准宏块保存在内置帧存储器30a中。
此外,当关注画面是P画面时,运动补偿预测单元30将从加法单元28提供的宏块PMB作为用于产生预测宏块BMB所参照的基准宏块保存在内置帧存储器30a内。
在步骤S14中,重排单元22确定组成1GOP的每个画面是否用作关注画面,并且当重排单元确定组成1GOP的所有画面没有用作关注画面时返回到步骤S3。
在步骤S3中,重排单元22使用组成1GOP的画面中的还没有用作关注画面的画面作为新关注画面,并且处理进入步骤S4。
在步骤S4中,除了来自操作单元36的操作信号以外,速率控制单元35基于从缓冲器单元33提供的产生的码量Si等等利用步骤S10的刚好之前的处理执行速率控制处理,并且从步骤S5执行相同处理。
此外,在步骤S14中,当重排单元22确定组成1GOP的每个画面用作关注画面时,重排单元返回到步骤S2,并且从这里执行相同处理。
此外,在步骤S5中,当重排单元22确定关注画面不是I画面时,处理进入步骤S15。
在步骤S15中,例如,当重排单元22确定关注画面是P画面时,重排单元22将切换开关23的一端连接到连接端子B,并且将连接开关29连接到连接端子C。
重排单元22然后将作为关注画面的P画面划分成多个宏块PMB,并且将划分的宏块提供给运动补偿预测单元30和差计算单元31。
在步骤S16中,运动补偿预测单元30基于保存在帧存储器30a中的基准宏块IMB检测指示来自重排单元22的宏块PMB的运动的运动矢量PMV,并且将检测的运动矢量提供给可变长度编码单元32。
此外,例如,运动补偿预测单元30基于检测的运动矢量PMV和保存在帧存储器30a内的基准宏块IMB运动补偿宏块PMB。运动补偿预测单元30然后将获得的预测宏块PMB′提供给连接开关29和差计算单元31。
在步骤S17中,差计算单元31计算指示来自重排单元22的宏块PMB与来自运动补偿预测单元30的预测宏块PMB′之间的差的预测残差PMBD(=PMB-PMB′),并且经由输出端子B和切换开关23将预测残差提供给正交变换单元24,并且处理进入步骤S7。
在步骤S7中,正交变换单元24对经由连接端子B和切换开关23从差计算单元31提供的预测残差PMBD执行正交变换,并且将获得的变换系数f(PMBD)提供给量子化单元25,并且从此执行相同处理。
此外,在步骤S15中,例如,当重排单元22确定关注画面是B画面时,重排单元将切换开关23的一端连接到连接端子B并且将连接开关29连接到连接端子C。
重排单元22然后将作为关注画面的B画面划分成多个宏块BMB,并且将划分的宏块提供给运动补偿预测单元30和差计算单元31。
在步骤S16中,运动补偿预测单元30基于保存在帧存储器30a内的基准宏块IMB或基准宏块PMB检测指示来自重排单元22的宏块BMB的运动的运动矢量BMV,并且将检测的运动矢量提供给可变长度编码单元32。
此外,例如,运动补偿预测单元30基于检测的运动矢量BMV和保存在帧存储器30a内的基准宏块IMB或基准宏块PMB运动补偿宏块BMB。运动补偿预测单元30然后将获得的预测宏块BMB′提供给差计算单元31。
在步骤S17中,差计算单元31计算指示来自重排单元22的宏块BMB与来自运动补偿预测单元30的预测宏块BMB′之间的差的预测残差PMBD(=PMB-PMB′),并且经由输出端子B和切换开关23将预测残差提供给正交变换单元24,并且处理进入步骤S7。
在步骤S7中,正交变换单元24对经由连接端子B和切换开关23从差计算单元31提供的预测残差BMBD执行正交变换,并且将获得的变换系数f(BMBD)提供给量子化单元25,并且从此执行相同处理。
此外,例如,当用户使用操作单元36执行用于停止拍摄单元21的拍摄的操作时,压缩编码处理结束。
[速率控制处理的细节]
接下来,将参照图4的流程图描述图3的步骤S4中的速率控制处理的细节。
在步骤S31中,速率控制单元35基于来自操作单元36的操作信号检测拍摄关注画面时的拍摄单元21的状态。
也就是说,例如,当用户使用操作单元36执行使得拍摄单元21执行变焦的变焦操作时,操作单元36将与用户的变焦操作对应的操作信号提供给速率控制单元35。
速率控制单元35然后基于来自操作单元36的操作信号检测拍摄关注画面时的拍摄单元21的变焦状态(例如,执行变焦多快、等等)。
此外,当操作信号没有从操作单元36提供时,速率控制单元35检测拍摄单元21的状态,例如为在拍摄关注画面时没有在拍摄单元21中执行变焦等等的状态。
在步骤S31中,速率控制单元35基于来自操作单元36的操作信号检测拍摄单元21的状态,然而,检测拍摄单元21的状态的方法不限于此。也就是说,例如,拍摄单元21可以在拍摄时产生指示关注画面的拍摄的信息,并且将拍摄时的信息提供给速率控制单元35,速率控制单元35可以基于来自拍摄单元21的拍摄时的信息检测拍摄单元21的状态。
在步骤S32中,速率控制单元35基于检测的变焦的状态确定是否启动以等于或高于预定阈值th1的速度执行的快速变焦。
当速率控制单元35基于检测的变焦的状态确定启动快速变焦时,处理进入步骤S33。
在步骤S33中,速率控制单元35通过改变当前参数R、Kb和Kp中的至少一个执行调整以使得参照基准帧(组成基准帧的基准宏块)进行压缩编码的各个P和B画面的目标码量Tp和Tb增加。
在步骤S34中,速率控制单元35然后通过TM5中的第一步骤使用在步骤S33中改变的参数R、Kb和Kp计算关注画面的目标码量T。也就是说,例如,当关注画面是I画面时,速率控制单元35通过方程(1)到(4)计算目标码量Ti。
此外,在步骤S34中,当关注画面是I画面时,速率控制单元35根据步骤S33的处理中的参数R、Kb和Kp的变化计算如图2B所示的目标码量Ti。
此外,速率控制单元35当关注画面是P画面时计算如图2B所示的目标码量Tp,并且当关注画面是B画面时计算如图2B所示的目标码量Tb。
在步骤S35中,速率控制单元35通过TM5中的第二和第三步骤基于在步骤S34中计算的目标码量T计算关注画面中的量子化标度,并且将量子化标度提供给量子化单元25。
此外,在步骤S32中,当速率控制单元35基于检测的变焦的状态确定没有启动快速变焦时,处理进入步骤S36,步骤S36和步骤S37被跳过,并且处理进入步骤S34。
在步骤S34中,速率控制单元35通过TM5中的第一步骤使用当前参数R、Kb和Kp计算关注画面的目标码量T,并且从此执行相同处理。
此外,当在步骤S32中速率控制单元135确定启动快速变焦时,处理进入步骤S36直到在确定快速变焦完成以后执行S37的处理。
在步骤S36中,速率控制单元35基于检测的变焦的状态确定快速变焦是否完成。
当速率控制单元35基于检测的变焦的状态确定快速变焦没有完成但在执行时,处理进入步骤S34。
在步骤S34中,当启动快速变焦时,速率控制单元35通过TM5中的第一步骤使用已经在步骤S33中改变的参数R、Kb和Kp计算关注画面的目标码量T,并且处理进入步骤S35。
因此,当执行快速变焦时,在步骤S34中,速率控制单元35充分地计算参照基准帧进行压缩编码的各个P和B画面的目标码量Tp和Tb。
此外,在步骤S36中,当速率控制单元35基于检测的变焦的状态确定快速变焦完成时,处理进入步骤S37。
在步骤S37中,速率控制单元35通过改变当前参数R、Kb和Kp中的至少一个执行调整以使得作为基准帧被参照的各个I和P画面的目标码量Ti和Tp增加,并且处理进入步骤S34。
在步骤S34中,速率控制单元35然后通过TM5中的第一步骤使用在步骤S37的处理中改变的参数R、Kb和Kp计算关注画面的目标码量T。
也就是说,例如,在步骤S34中,当关注画面是I画面时,速率控制单元35根据步骤S37的处理中的参数R、Kb和Kp的变化计算如图2A所示的目标码量Ti。
此外,速率控制单元35当关注画面是P画面时计算如图2A所示的目标码量Tp,当关注画面是B画面时计算如图2A所示的目标码量Tb。
因此,当快速变焦完成时,在步骤S34中,速率控制单元35充分计算作为基准帧被参照的各个I和P画面的目标码量Ti和Tp。
在步骤S34的处理完成以后,处理进入步骤S35,并且从此执行相同处理。
速率控制处理由此完成,并且处理返回到图3的步骤S4并且进入步骤S5。
如上所述,根据压缩编码处理中的速率控制处理,当在拍摄单元21中执行快速变焦时,速率控制单元35充分计算参照基准帧进行压缩编码的各个P和B画面的目标码量Tp和Tb。
结果,即使当由于在拍摄单元21中执行的快速变焦导致预测残差PMB和BMB增加时,例如,也可以抑制量子化时P和B画面中的图像信息的丢失并且由此抑制解码时的图像恶化。
此外,例如,当由于没有在拍摄单元21中执行快速变焦所以预测残差PMB和BMB减少时,速率控制单元35充分计算作为基准帧被参照的各个I和P画面的目标码量Ti和Tp。
结果,可以抑制作为基准帧被参照的I和P画面中的量子化时的图像信息的丢失。此外,可以更大程度地减少参照基准帧进行压缩编码的各个P和B画面的预测残差PMB和BMB,并且还可以抑制解码时的图像恶化。
<2.变型>
在本实施例中,根据拍摄关注画面时拍摄单元21的变焦的状态调整目标码量Ti、Tp和Tb,然而,在调整目标码量Ti、Tp和Tb时所参照的拍摄单元21的状态不限于此。
也就是说,例如,可以采用拍摄单元21的变焦的状态、拍摄单元21的聚焦的状态(例如,聚焦是否变化、等等)、拍摄单元21等的移动(例如,摇摆、倾斜、手动模糊)以及拍摄单元21的曝光的状态(例如,是否执行曝光)中的至少一个作为拍摄关注画面时拍摄单元21的状态。
例如,由速率控制单元35根据来自操作单元36的操作信号检测这些状态。此外,加速度传感器可以设置在拍摄单元21中,并且可以根据由设置在拍摄单元21中的加速度传感器检测的加速度计算运动拍摄单元21的状态(例如,移动速度、等等)。
具体地讲,例如,当采用拍摄单元21的聚焦的状态作为拍摄单元21的状态时,在步骤S31中检测聚焦的状态。然后,根据在步骤S32中检测的聚焦的状态确定是否启动聚焦改变,并且在步骤S36中确定聚焦改变是否完成。在这种情况下,当确定启动聚焦改变时执行步骤S33的处理,当确定聚焦改变完成时执行步骤S37的处理。
此外,例如,当采用运动拍摄单元21的状态作为拍摄单元21的状态时,在步骤S31中检测运动拍摄单元21的状态。然后,在步骤S32中根据运动拍摄单元21的状态确定是否启动以等于或高于预定阈值th2的速度的拍摄单元的运动,并且在步骤S36中确定以等于或高于预定阈值th2的速度的运动是否完成。在这种情况下,当确定启动以等于或高于预定阈值th2的速度的运动时执行步骤S33的处理,并且当确定以等于或高于预定阈值th2的速度的运动完成时执行步骤S37的处理。
此外,例如,当采用拍摄单元21的曝光的状态作为拍摄单元21的状态时,在步骤S31中检测拍摄单元21的曝光的状态。然后,在步骤S32中根据曝光的状态确定是否启动曝光改变,并且在步骤S36中确定曝光改变是否完成。在这种情况下,当确定启动曝光改变时执行步骤S33的处理,并且当确定曝光改变完成时执行步骤S37的处理。
此外,例如,当采用多个状态作为拍摄单元21的状态时,在步骤S32中确定是否要针对多个状态中的每个状态执行步骤S33的处理。然后,当确定基于多个状态中的任何一个状态要执行步骤S33的处理时,执行步骤S33的处理。
具体地讲,例如,在步骤S32中确定启动使用拍摄单元21的处理(例如,快速变焦、聚焦改变、拍摄单元21的移动、曝光改变等等中的至少一个的处理),执行步骤S33的处理。
当在步骤S36中确定在拍摄单元21中启动的所有处理完成时(例如,当确定快速变焦、聚焦改变、拍摄单元21的移动、曝光改变、等等都没有执行时),处理进入步骤S37。
在本实施例中,数字视频相机1使用MPEG编码方案对帧进行压缩编码,然而,对帧进行压缩编码的方法不限于MPEG编码方案还可以采用例如先进视频编码(AVC)等等。
此外,在AVC中,例如,不仅I和P画面变成基准帧,B画面也变成基准帧。在这种情况下,在图4的步骤S33中,改变参数以使得目标码量Ti减小而目标码量Tp和Tb中的任何一个增加。然后,在图4的步骤S37中,改变参数以使得目标码量Ti、Tp和Tb中的任何一个增加。
此外,除了帧以外,还可以对场作为目标执行压缩编码。
在本实施例中,通过执行正交变换对变换系数进行偏置以有效执行可变长度编码,然而,使得变换系数被偏置的处理不限于正交变换。
也就是说,例如,替代正交变换,差分脉冲代码调制(DPCM)编码方案根据相邻像素计算像素的预测值,并且计算预测值与像素的像素值之间的差作为变换系数。此外,预测值是依据每个像素的差进行偏置的值。
此外,在本实施例中,速率控制单元35通过使用TM5的算法计算量子化标度。然而,用于计算量子化标度的算法不限于TM5,但可以采用其它算法。
在本实施例中,描述了将本发明技术应用到数字视频相机的情况,然而,本发明技术还可以应用到其它电子设备。也就是说,本发明技术可以应用到任何装置,只要通过拍摄获取的图像被压缩编码为预测残差即可。
此外,本发明技术可以采用下面的结构。
(1)一种编码装置,包括:调整单元,被构造为基于拍摄编码对象图像时的拍摄单元的状态调整当对编码对象图像进行编码时的目标码量,该编码对象图像为编码的对象,该目标码量为码量的目标;以及编码单元,被构造为根据调整的目标码量对编码对象图像进行编码。
(2)根据(1)的编码装置,其中,调整单元可以基于拍摄单元的状态,通过向第一编码对象图像和第二编码对象图像之一分配较大目标码量执行调整,第一编码对象图像参照通过预测编码对象图像获得的预测图像进行编码,第二编码对象图像作为预测图像被参照。
(3)根据(2)的编码装置,其中,调整单元可以基于基于拍摄编码对象图像时的拍摄单元的变焦的状态调整目标码量。
(4)根据(3)的编码装置,其中,调整单元可以通过如下动作执行调整:当以具有预定阈值或更高的速度执行变焦时向第一编码对象图像分配较大目标码量,当以具有预定阈值或更高的速度执行的变焦完成时向第二编码对象图像分配较大目标码量。
(5)根据(2)的编码装置,其中,调整单元可以基于拍摄编码对象图像时的拍摄单元的聚焦的状态调整目标码量。
(6)根据(5)的编码装置,其中,调整单元可以调整单元通过如下动作执行调整:当聚焦改变时向第一编码对象图像分配较大目标码量,当聚焦改变完成时向第二编码对象图像分配较大目标码量。
(7)根据(2)的编码装置,其中,调整单元可以基于拍摄编码对象图像时拍摄单元的移动的状态调整目标码量。
(8)根据(7)的编码装置,其中,调整单元可以通过如下动作执行调整:当拍摄单元以具有预定阈值或更高的速度移动时向第一编码对象图像分配较大目标码量,当以具有预定阈值或更高的速度的拍摄单元的移动完成时向第二编码对象图像分配较大目标码量。
(9)根据(2)的编码装置,其中,调整单元可以基于拍摄编码对象图像时拍摄单元的曝光的状态调整目标码量。
(10)根据(9)的编码装置,其中,调整单元可以通过如下动作执行调整:当曝光改变时向第一编码对象图像分配较大目标码量,当曝光改变完成时向第二编码对象分配较大目标码量。
(11)根据(2)到(10)的编码装置,还包括:检测单元,被构造为根据用户对拍摄单元的操作检测拍摄编码对象图像时的拍摄单元的状态,其中,调整单元基于检测的拍摄单元的状态调整目标码量。
然而,上述的一系列处理可以通过硬件以及可以通过软件执行。当这一系列处理由软件执行时,组成软件的程序从程序记录介质安装在嵌入在专用硬件内的计算机或诸如能够安装各种程序以执行各种功能的通用计算机的计算机上。
[计算机的结构例子]
图5示出了通过程序执行上述的一系列处理的计算机硬件结构的例子。
中央处理单元(CPU)51根据存储在只读存储器(ROM)52或存储单元58内的程序执行各种处理。由CPU 51执行的程序、数据等等恰当存储在随机访问存储器(RAM)53内。CPU 51、ROM52和RAM 53通过总线54进行互连。
输入和输出接口55也经由总线54连接到CPU 51。输入单元56(例如,键盘、鼠标、麦克风等等)和输出单元57(例如,显示器、扬声器、等等)连接到输入和输出接口55。CPU 51根据从输入单元56输入的指令执行各种处理。CPU 51然后将处理结果输出到输出单元57。
连接到输入和输出接口55的存储单元58例如包括硬盘,并且存储由CPU 51执行的各种数据或程序。通信单元59经由诸如互联网或局域网的网络与外部装置进行通信。
此外,程序可以通过通信单元59获取并且存储在存储单元58中。
当可移动介质61(例如,磁盘、光盘、磁光盘和半导体存储器等等)安装在驱动器上时,连接到输入和输出接口55的驱动器60驱动可移动介质并且获取记录在可移动介质上的程序或数据。获取的程序或数据被传输到存储单元58并且根据需要存储在存储单元内。
如图5所示,安装在计算机内并且记录(存储)能够由计算机执行的程序的记录介质包括可移动介质61,例如磁盘(包括软盘)、光盘(包括紧凑盘只读存储器(CD-ROM)和数字多功能盘(DVD))、以及磁光盘(包括迷你盘(MD))、以及由半导体存储器等等组成的封装介质、临时或永久存储程序的ROM 52、组成存储单元58的硬盘、等等。根据需要使用有线或无线通信介质(例如,局域网、互联网和数字卫星广播)经由通信单元59(即,诸如路由器、调制解调器等等的接口)执行将程序记录在记录介质上。
此外,描述本说明书中的一系列处理的步骤不仅包括以时序方式基于描述的顺序执行的处理,还包括并行或独立执行的处理(即使当不需要以时序方式处理这些处理时)。
此外,在本说明书中,术语***是指由多个装置组成的普通装置。
此外,本发明技术不限于上述的实施例,而是在不脱离本发明技术的主题的情况下可以进行各种改变。
本申请包含与在于2011年5月23日提交到日本专利局的日本优先权专利申请JP 2011-114904中公开的主题有关的主题,该日本优先权专利申请的全部内容以引用方式并入本文。

Claims (13)

1.一种编码装置,包括:
调整单元,被构造为基于拍摄编码对象图像时的拍摄单元的状态调整当对编码对象图像进行编码时的目标码量,该编码对象图像为编码的对象,该目标码量为码量的目标;以及
编码单元,被构造为根据调整的目标码量对编码对象图像进行编码。
2.根据权利要求1的编码装置,其中,调整单元基于拍摄单元的状态,通过向第一编码对象图像和第二编码对象图像之一分配较大目标码量执行调整,第一编码对象图像参照通过预测编码对象图像获得的预测图像进行编码,第二编码对象图像作为预测图像被参照。
3.根据权利要求2的编码装置,其中,调整单元基于拍摄编码对象图像时的拍摄单元的变焦的状态调整目标码量。
4.根据权利要求3的编码装置,其中,调整单元通过如下动作执行调整:当以具有预定阈值或更高的速度执行变焦时向第一编码对象图像分配较大目标码量,当以具有预定阈值或更高的速度执行的变焦完成时向第二编码对象图像分配较大目标码量。
5.根据权利要求2的编码装置,其中,调整单元基于拍摄编码对象图像时的拍摄单元的聚焦的状态调整目标码量。
6.根据权利要求5的编码装置,其中,调整单元通过如下动作执行调整:当聚焦改变时向第一编码对象图像分配较大目标码量,当聚焦改变完成时向第二编码对象图像分配较大目标码量。
7.根据权利要求2的编码装置,其中,调整单元基于拍摄编码对象图像时拍摄单元的移动的状态调整目标码量。
8.根据权利要求7的编码装置,其中,调整单元通过如下动作执行调整:当拍摄单元以具有预定阈值或更高的速度移动时向第一编码对象图像分配较大目标码量,当以具有预定阈值或更高的速度的拍摄单元的移动完成时向第二编码对象图像分配较大目标码量。
9.根据权利要求2的编码装置,其中,调整单元基于拍摄编码对象图像时拍摄单元的曝光的状态调整目标码量。
10.根据权利要求9的编码装置,其中,调整单元通过如下动作执行调整:当曝光改变时向第一编码对象图像分配较大目标码量,当曝光改变完成时向第二编码对象分配较大目标码量。
11.根据权利要求2的编码装置,还包括:
检测单元,被构造为根据用户对拍摄单元的操作检测拍摄编码对象图像时的拍摄单元的状态,
其中,调整单元基于检测的拍摄单元的状态调整目标码量。
12.一种对图像进行编码的编码装置的编码方法,包括:
通过编码装置基于拍摄编码对象图像时的拍摄单元的状态调整当对编码对象图像进行编码时的目标码量,该编码对象图像为编码的对象,该目标码量为码量的目标;以及
通过编码装置根据调整的目标码量对编码对象图像进行编码。
13.一种使得计算机发挥如下作用的程序:
调整单元,被构造为基于拍摄编码对象图像时的拍摄单元的状态调整当对编码对象图像进行编码时的目标码量,该编码对象图像为编码的对象,该目标码量为码量的目标;以及
编码单元,被构造为根据调整的目标码量对编码对象图像进行编码。
CN2012101506473A 2011-05-23 2012-05-15 编码装置、编码方法和程序 Pending CN102801971A (zh)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
JP2011114904A JP2012244542A (ja) 2011-05-23 2011-05-23 符号化装置、符号化方法、及びプログラム
JP2011-114904 2011-05-23

Publications (1)

Publication Number Publication Date
CN102801971A true CN102801971A (zh) 2012-11-28

Family

ID=47200926

Family Applications (1)

Application Number Title Priority Date Filing Date
CN2012101506473A Pending CN102801971A (zh) 2011-05-23 2012-05-15 编码装置、编码方法和程序

Country Status (3)

Country Link
US (1) US8761530B2 (zh)
JP (1) JP2012244542A (zh)
CN (1) CN102801971A (zh)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20230118711A (ko) * 2019-10-11 2023-08-11 베이징 다지아 인터넷 인포메이션 테크놀로지 컴퍼니 리미티드 4:4:4 크로마 포맷의 비디오 코딩 방법 및 장치

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1723709A (zh) * 2003-10-29 2006-01-18 索尼株式会社 视频编码设备和视频编码控制方法
CN1909066A (zh) * 2005-08-03 2007-02-07 上海杰得微电子有限公司 音频编码码量控制和调整的方法
US20080317139A1 (en) * 2007-06-19 2008-12-25 Hiroshi Arakawa Moving picture coding apparatus
JP2009147827A (ja) * 2007-12-17 2009-07-02 Canon Inc 記録装置、その制御方法、プログラム
US20110064134A1 (en) * 2007-11-27 2011-03-17 Casio Computer Co., Ltd. Bitrate control device for controlling bitrate of video data

Family Cites Families (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP5006633B2 (ja) * 2006-03-10 2012-08-22 キヤノン株式会社 画像符号化装置、画像符号化方法、プログラム及び記憶媒体
JP4901460B2 (ja) * 2006-12-26 2012-03-21 富士フイルム株式会社 撮影装置、方法およびプログラム
JP4857243B2 (ja) 2007-11-05 2012-01-18 キヤノン株式会社 画像符号化装置及びその制御方法、コンピュータプログラム
JP5256803B2 (ja) * 2008-03-19 2013-08-07 株式会社メガチップス トランスコーダ
JP4784650B2 (ja) * 2009-01-07 2011-10-05 ソニー株式会社 符号化装置、目標符号量調整方法及び記録媒体

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1723709A (zh) * 2003-10-29 2006-01-18 索尼株式会社 视频编码设备和视频编码控制方法
CN1909066A (zh) * 2005-08-03 2007-02-07 上海杰得微电子有限公司 音频编码码量控制和调整的方法
US20080317139A1 (en) * 2007-06-19 2008-12-25 Hiroshi Arakawa Moving picture coding apparatus
US20110064134A1 (en) * 2007-11-27 2011-03-17 Casio Computer Co., Ltd. Bitrate control device for controlling bitrate of video data
JP2009147827A (ja) * 2007-12-17 2009-07-02 Canon Inc 記録装置、その制御方法、プログラム

Also Published As

Publication number Publication date
US8761530B2 (en) 2014-06-24
JP2012244542A (ja) 2012-12-10
US20120301041A1 (en) 2012-11-29

Similar Documents

Publication Publication Date Title
JP4591657B2 (ja) 動画像符号化装置及びその制御方法、プログラム
JP6862633B2 (ja) レート制御方法及びレート制御装置
CN103650504A (zh) 基于图像捕获参数对视频编码的控制
JP2011527874A (ja) 複数のフィルタを使用してビデオ・データをフィルタすること
KR20150009578A (ko) 비디오 인코딩을 위한 모션 센서 보조 레이트 제어
JP2010130558A (ja) 動画像符号化装置および動画像符号化方法
JP4557752B2 (ja) 動画像処理装置、動画像処理方法、及び動画像処理プログラム
JP2011091772A (ja) 画像符号化装置
JP2004040811A (ja) 動映像符号化のためのdct演算量調節方法及びその装置
CN102801971A (zh) 编码装置、编码方法和程序
JP5832263B2 (ja) 画像符号化装置及び画像符号化方法
JP2009159541A (ja) 動画像符号化装置、動画像符号化方法及び動画像符号化プログラム
JP4393341B2 (ja) 動画像符号化装置及び動画像符号化方法
JP2006303987A (ja) 画像符号化装置及び画像符号化方法
JP2005045736A (ja) 画像信号符号化方法及び装置、符号化制御装置並びにプログラム
KR100987922B1 (ko) 선택적 참조영상을 이용한 움직임 보상기법을 적용한 동영상 압축부호화장치및 복호화 장치와 움직임 보상을 위한 선택적 참조영상 결정방법
JP4700992B2 (ja) 画像処理装置
JP2008245201A (ja) 符号化装置
JP4857243B2 (ja) 画像符号化装置及びその制御方法、コンピュータプログラム
JP2008182408A (ja) 動画像符号化装置及び方法
JP5006763B2 (ja) 画像符号化装置及びその制御方法、コンピュータプログラム
US7623720B2 (en) Image processing apparatus and method
JP2014003587A (ja) 画像符号化装置及びその方法
JP2010166275A (ja) 画像符号化装置
JP5419560B2 (ja) 撮像装置

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
WD01 Invention patent application deemed withdrawn after publication
WD01 Invention patent application deemed withdrawn after publication

Application publication date: 20121128