CN112053323A - 单镜头多帧图像数据物体追踪标注方法和装置、存储介质 - Google Patents

单镜头多帧图像数据物体追踪标注方法和装置、存储介质 Download PDF

Info

Publication number
CN112053323A
CN112053323A CN202010757794.1A CN202010757794A CN112053323A CN 112053323 A CN112053323 A CN 112053323A CN 202010757794 A CN202010757794 A CN 202010757794A CN 112053323 A CN112053323 A CN 112053323A
Authority
CN
China
Prior art keywords
data
frame
marking
labeling
annotation
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202010757794.1A
Other languages
English (en)
Inventor
郑贺
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Tusimple Inc
Original Assignee
Tusimple Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Tusimple Inc filed Critical Tusimple Inc
Priority to CN202010757794.1A priority Critical patent/CN112053323A/zh
Publication of CN112053323A publication Critical patent/CN112053323A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T7/00Image analysis
    • G06T7/0002Inspection of images, e.g. flaw detection
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T11/002D [Two Dimensional] image generation
    • G06T11/60Editing figures and text; Combining figures or text
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T7/00Image analysis
    • G06T7/20Analysis of motion
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T2207/00Indexing scheme for image analysis or image enhancement
    • G06T2207/10Image acquisition modality
    • G06T2207/10016Video; Image sequence
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T2207/00Indexing scheme for image analysis or image enhancement
    • G06T2207/20Special algorithmic details
    • G06T2207/20092Interactive image processing based on input by user
    • G06T2207/20104Interactive definition of region of interest [ROI]
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T2207/00Indexing scheme for image analysis or image enhancement
    • G06T2207/30Subject of image; Context of image processing
    • G06T2207/30204Marker
    • G06T2207/30208Marker matrix

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Quality & Reliability (AREA)
  • Multimedia (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Image Analysis (AREA)

Abstract

本发明公开一种单镜头多帧图像数据中物体追踪标注的方法和装置,用以解决相关技术中的通过标注员对图像数据中的物体进行逐一标注造成的标注速度慢、效率低的问题。标注装置显示单镜头多帧图像数据中的第N帧图像数据,接收并保存对一个物体的第N帧标注数据;其中,N为大于等于1的自然数;显示第N+i帧图像数据,接收并保存对该物体的第N+i帧标注数据;其中,i为大于等于2的自然数;根据该物体的第N帧标注数据和第N+i帧标注数据,确定该物体的第N帧和第N+i帧之间的每一帧图像数据的中间帧标注数据,保存每一帧中间帧标注数据。

Description

单镜头多帧图像数据物体追踪标注方法和装置、存储介质
技术领域
本发明涉及数据标注领域,特别涉及一种单镜头多帧图像数据物体追踪标注方法和装置、存储介质。
背景技术
在相关技术中,标注员对图像数据中的物体进行标注时,需要观察并识别出其中的物体,并在图像数据上叠加标注框标注出该物体,标注***记录标注框在图像数据中的位置和尺寸来记录该物体的标注信息。对单镜头获取的多帧图像数据进行标注时,逐一执行上述的操作。可见,相关技术中对单镜头多帧图像数据中的物体进行标注时,存在标注速度慢、标注效率低的问题。
发明内容
有鉴于此,本申请提供了一种单镜头多帧图像数据中物体追踪标注的方法和装置,用以解决相关技术中的通过标注员对图像数据中的物体进行逐一标注造成的标注速度慢、效率低的问题。
一方面,本申请实施例提供了一种单镜头多帧图像数据中物体追踪标注的方法,包括:标注装置显示单镜头多帧图像数据中的第N帧图像数据,接收并保存对一个物体的第N帧标注数据;其中,N为大于等于1的自然数;显示第N+i帧图像数据,接收并保存对该物体的第N+i帧标注数据;其中,i为大于等于2的自然数;根据该物体的第N帧标注数据和第N+i帧标注数据,确定该物体的第N帧和第N+i帧之间的每一帧图像数据的中间帧标注数据,保存每一帧中间帧标注数据。
一方面,本申请实施例提供了一种单镜头多帧图像数据中物体追踪标注的装置,包括:一个处理器和至少一个存储器,至少一个存储器中存储有至少一条机器可执行指令,处理器执行至少一条机器可执行指令以执行如上所述的单镜头多帧图像数据中物体追踪标注的方法。
一方面,本申请实施例还提供了一种非易失性机器可读存储介质,存储有至少一条机器可执行指令,至少一条机器可执行指令被处理器执行后实现如上所述的单镜头多帧图像数据中物体追踪标注的方法。
附图说明
附图用来提供对本发明的进一步理解,并且构成说明书的一部分,与本发明的实施例一起用于解释本发明,并不构成对本发明的限制。
图1为本申请实施例提供的单镜头多帧图像数据中物体追踪标注的装置的结构框图;
图2为本申请实施例提供的单镜头多帧图像数据中物体追踪标注处理的架构示意图;
图3为本申请实施例提供的单镜头多帧图像数据中物体追踪标注处理流程图;
图4为本申请实施例提供的单镜头多帧图像数据中物体追踪标注处理的另一种处理流程图;
图5a为图3或图4中第N帧图像数据中物体的标注处理流程图;
图5b为图3或图4中第N帧图像数据中物体的另一标注处理流程图;
图5c为图3或图4中第N帧图像数据中物体的另一标注处理流程图;
图6a为图3或图4中第N+i帧图像数据中物体的标注处理流程图;
图6b为图3或图4中第N+i帧图像数据中物体的另一标注处理流程图;
图6c为图3或图4中第N+i帧图像数据中物体的另一标注处理流程图;
图7为图3或图4中第N+i帧图像数据中物体的另一标注处理流程图;
图8为图3或图4中中间帧图像数据中物体的标注处理流程图;
图9为图3或图4中中间帧图像数据中物体的另一标注处理流程图;
图10为图3或图4中中间帧图像数据中物体的另一标注处理流程图;
图11为图3或图4中中间帧图像数据中物体的另一标注处理流程图。
具体实施方式
为了使本技术领域的人员更好地理解本发明中的技术方案,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都应当属于本发明保护的范围。
在相关技术中,标注员对图像数据中的物体进行标注时,通常需要观察并识别出图像数据中的物体,并对物体进行逐一标注。标注的方法是在图像数据中在表达物体的像素区域上叠加标注框,关联记录标注框的位置和尺寸、以及物体类别或属性。在标注员对多帧图像数据中的物体进行标注时,需要重复执行上述操作。这样的操作存在标注速度慢、标注效率低的问题,并且存在无法对单镜头多帧图像数据中的物体进行追踪标注的问题。
本申请实施例针对这一问题,提供了一种单镜头多帧图像数据中物体追踪标注的方案。在该方案中,标注装置显示单镜头多帧图像数据中第N帧图像数据,接收并保存对一个物体的第N帧标注数据,显示第N+i帧图像数据,接收并保存对该物体的第N+i帧标注数据,其中第N帧图像数据和第N+i帧图像数据之间相隔至少一帧中间帧图像数据;标注装置根据第N帧的和第N+i帧的标注数据,自动生成该物体的第N帧和第N+i帧之间的每一帧中间帧标注数据。
从而本申请实施例提供的标注装置能够向标注员先后显示两帧图像数据,该两帧图像数据之间间隔至少一帧图像数据,通过标注员标注的这两帧图像数据中同一物体的标注数据,自动生成该物体的每一帧中间帧图像数据的标注数据;能够通过标注装置的处理实现高速、高效的标注操作,解决现有技术中标注员对单镜头多帧图像数据中的物体进行标注时存在的标注速度慢、效率低的问题。
本申请的一些实施例提供了一种单镜头多帧图像数据中物体追踪标注的方案。图1示出了本申请实施例提供的标注装置的结构,该装置1包括处理器11和至少一个存储器12。
在一些实施例中,至少一个存储器12可以是多种形态的存储装置,例如暂态或非暂态的存储介质。在存储器12中可以存储至少一条机器可执行指令,至少一条机器可执行指令被处理器11执行后实现本申请实施例提供的对单镜头多帧图像数据中物体追踪标注的处理。
在一些实施例中,标注装置1可以位于服务器端。在另一些实施例中,标注装置1也可以位于云端服务器中。在另一些实施例中,标注装置1还可以位于客户端中。
如图2所示,本申请实施例提供的单镜头多帧图像数据中物体追踪标注处理可以包括前端处理12和后端处理14。通过前端处理12显示相关的图像数据或者其它数据,并接收标注员输入的相关数据或信息,例如,前端处理12可以是通过web页面实现的处理,或者是通过单独的应用界面实现的处理。后端处理14根据前端处理12接收到的相关数据和信息,进行相应的标注处理。在标注处理完成后,标注装置1可以进一步将标注结果提供给客户端、服务器、云端服务器上的其它处理或应用。
下面对标注装置1执行至少一条机器可执行指令实现的单镜头多帧图像数据中物体的追踪标注处理进行说明。
在本申请的一些实施例中,单镜头多帧图像数据可以是连续的多帧图像数据,例如是1秒钟内的多帧连续图像数据。在有些应用场景中,获取图像数据的时间间隔非常短,帧与帧之间的场景区别并不大,为了节省处理量,不需要对每一帧图像数据中的物体进行标注,可以只对其中具有一定时间间隔的图像数据进行标注,从而在一些实施例中,多帧图像数据可以是具有相同时间间隔的多帧图像数据。在另外的一些场景中,只需要对场景具有明显变化的图像数据进行标注,可以从多帧的图像数据中挑选出部分数据进行标注,从而在一些实施例中,多帧图像数据可以是不具有相同的时间间隔的多帧数据。
在本申请实施例中,对多帧图像数据中的物体进行标注时,可以将1+i个图像数据帧作为一个处理周期。例如,在一些实施例中,在标注任务启动之时,可以按照帧顺序,将第一帧设置为第一个处理周期的起始帧,将第1+i帧设置为第一个处理周期的结束帧,中间的i-1个帧为中间帧。在第二个处理周期中,将第1+i+1帧图像数据作为起始帧,将第1+i+1+i帧作为结束帧,中间的i-1个帧为中间帧。其它的处理周期依次类推。在另一些实施例中,如果多帧图像数据中已经有部分图像数据(例如N-1帧图像数据)被标注了,可以从待标注的图像数据帧(例如第N帧图像数据)开始实施本申请实施例提供的物体追踪标注处理。在另一些实施例中,在标注员发现当前的中间帧图像数据中出现新的物体时,可以重置帧顺序、将当前的中间帧图像数据重置为一个处理周期的起始帧。
在本申请实施例中,i的具体数值可以根据应用场景的需要而设置。当多个图像数据表达的场景之间的变化较小时,可以设置较大数值的i,在多个图像数据表达的场景之间的变化较大的时候,可以设置较小数值的i。
下面以一个处理周期为例,分别对不同的实施方式进行说明。本领域普通技术人员可以理解的是,虽然以下以一个处理周期为例进行说明,在实际的应用场景中,当图像数据的帧数较多,需要执行多个处理周期时,每个处理周期均可以采用本申请实施例提供的多帧图像数据中物体追踪标注的处理。
图3示出了本申请实施例提供的单镜头多帧图像数据中物体追踪标注处理流程,也即标注装置进行物体追踪标注的处理,包括:
步骤301、标注装置显示单镜头多帧图像数据中的第N帧图像数据,接收并保存对一个物体的第N帧标注数据;其中,N为大于等于1的自然数;
步骤303、显示第N+i帧图像数据,接收并保存对该物体的第N+i帧标注数据;其中,i为大于等于2的自然数;
步骤305、根据该物体的第N帧标注数据和第N+i帧标注数据,确定该物体的第N帧和第N+i帧之间的每一帧图像数据的中间帧标注数据,保存每一帧中间帧标注数据。
通过图3所示的处理,对于单镜头多帧图像数据,可以从第一帧图像数据开始进行处理,也可以从其中的某一帧图像数据开始进行处理。
通过图3所示的处理,标注装置能够向标注员先后显示单镜头多帧图像数据中的两帧图像数据,该两帧图像数据之间间隔至少一帧图像数据,通过标注员标注的这两帧图像数据中同一物体的标注数据,自动生成该物体的每一帧中间帧图像数据的标注数据;能够通过标注装置的处理实现高速、高效的物体追踪标注操作,解决现有技术中标注员对单镜头多帧图像数据中的物体进行标注时存在的标注速度慢、效率低的问题。
图4示出了本申请实施例提供的单镜头多帧图像数据中物体追踪标注处理的另一种处理流程,包括:
步骤401、标注装置显示单镜头多帧图像数据中的第N帧图像数据,接收并保存对一个物体的第N帧标注数据;其中,N为大于等于1的自然数;
步骤403、显示第N+i帧图像数据,接收并保存对该物体的第N+i帧标注数据;其中,i为大于等于2的自然数;
步骤405、根据该物体的第N帧标注数据和第N+i帧标注数据,确定该物体的第N帧和第N+i帧之间的每一帧图像数据的中间帧标注数据;
步骤407、显示当前的中间帧图像数据;
步骤409、接收帧重置指令,将当前的中间帧设置为第N帧图像数据,将确定的该物体的当前帧标注数据保存为第N帧标注数据,接收并保存对另一个物体的标注数据;
步骤411、显示第N+i帧图像数据,接收并保存对上述两个物体的第N+i帧标注数据;
步骤413、根据上述两个物体的第N帧标注数据和第N+i帧标注数据,分别确定上述两个物体的第N帧和第N+i帧之间的每一帧图像数据的中间帧标注数据。
对于本领域普通技术人员而言可以理解的是,在图4所示处理中,可以通过对物体分配不同的标识来区别多个物体。为物体分配的标识可以是由标注装置自动分配的,也可以是标注员输入的。
通过图4所示的处理,在图3所示处理的基础上,标注装置还可以对在中间帧图像数据中新出现的物体进行标注,能够避免无法对中间帧图像数据中新出现的物体进行标注的问题。相比于图3,图4所示处理提供了一种更为灵活的标注方式。
在上述图3或图4的处理中,可以将对第N帧图像数据中物体的标注称为首次标注,将对第N+i帧图像数据中物体的标注称为末次标注,将对中间帧图像数据中的物体的标注称为中间自动标注。
在一些实施例中,图5a中示出了首次标注的处理流程图,包括:
步骤501、显示单镜头多帧图像数据中的第N帧图像数据,接收输入的标注一个物体的标注框的标注数据;其中,标注数据中包括标注框的位置数据和标注框的尺寸数据;
步骤503、保存该物体的第N帧标注数据。
其中,在步骤501中,标注装置接收到的标注数据可以是标注员通过多种方式输入的,例如,在人机界面中的数据输入框中直接输入具体的参数数值,点击人机界面上预设的按钮、按键,按钮或者按键具有对应的预设的指令或者数据,或者在人机界面提供的下拉菜单中选择相应的选项,下拉菜单中可以包括一级或多级子菜单、每个子菜单可以包括一个或多个选项,标注装置通过人机界面接收标注员输入的标注数据。
在以下实施例的处理流程中,标注装置接收输入的标注数据或其它数据的处理与步骤501中的接收处理相类似,以下将不进行赘述。
在步骤503中,标注装置保存一个物体的第N帧标注数据的处理,可以将物体的标识与第N帧标注数据进行关联保存。
通过图5a所示的处理,标注装置能够接收并保存标注员对一个物体的首次标注的标注数据。
在图5a所示处理的基础上,标注装置在接收到标注数据后,还可以进一步生成标注框、并显示该标注框,以便于标注员进行观察。在一些实施例中,图5b中示出了首次标注处理的另一个流程图,包括:
步骤501、显示单镜头多帧图像数据中的第N帧图像数据,接收输入的标注一个物体的标注框的标注数据;其中,标注数据中包括标注框的位置数据和标注框的尺寸数据;
步骤502、根据标注数据生成并显示对应的标注框;
步骤503、保存该物体的第N帧标注数据。
在一些实施例中,标注装置根据标注数据生成并显示了标注框后,标注员还可以进一步对生成的标注框进行调整,以实现对物体的准确标注。在图5b所示处理的基础上,标注装置还能够进一步根据标注员的输入对标注数据进行调整,得到调整后的标注数据。在另一些实施例中,图5c中示出了首次标注的处理的另一个流程图,包括:
步骤501、显示单镜头多帧图像数据中的第N帧图像数据,接收输入的标注一个物体的标注框的标注数据;其中,标注数据中包括标注框的位置数据和标注框的尺寸数据;
步骤502、根据接收到的标注数据生成并显示对应的标注框;
步骤504、接收输入的标注框调整数据,调整数据中包括以下的一个或多个:标注框的位置调整数据、标注框的尺寸调整数据;
步骤505、根据调整数据和接收到的标注数据,确定得到调整后的标注数据;
步骤503、保存该物体的第N帧标注数据。
在步骤505中,根据调整数据和标注数据确定得到调整后的标注数据的处理,根据标注数据中包括的数据的不同,可以包括如下的调整方式。
调整方式一、在调整数据包括标注框的位置调整数据的情况下,标注装置根据标注框的位置调整数据和接收到的标注数据中的标注框的位置数据,确定得到调整后的标注框的位置数据。
在一些实施例中,在位置调整数据中包括调整后的标注框的位置数据时,标注装置将位置调整数据中的调整后的位置数据确定为调整后的标注框的位置数据。例如,接收到的位置数据为(x,y),位置调整数据中包括的调整后的标注框的位置数据为(x’,y’),标注装置将坐标(x’,y’)确定为调整后的标注框的位置数据。
在一些实施例中,在位置调整数据包括标注框的位置调整方向和位置偏移量时,标注装置根据标注数据中的标注框的位置数据和标注框的位置调整方向和位置偏移量,确定得到调整后的标注框的位置数据。例如,接收到的位置数据为(x,y),位置调整数据中包括的调整方向为x轴方向,偏移量为a,则调整后的位置坐标为(x’,y),x’=x+a。
调整方式二、在调整数据包括标注框的尺寸调整数据的情况下,标注装置根据标注框的尺寸调整数据和标注数据中的标注框的尺寸数据,确定得到调整后的标注框的尺寸数据。
在一些实施例中,在尺寸调整数据中包括调整后的标注框的尺寸数据的情况下,标注装置将调整后的尺寸数据确定为调整后的标注框的尺寸数据。例如,接收到的尺寸数据为s*r,调整后的标注框的尺寸数据为s’*r’,标注装置将s’*r’确定为标注框调整后的尺寸数据。
在一些实施例中,在尺寸调整数据中包括尺寸增减数据的情况下,标注装置根据标注数据中的标注框的尺寸数据和标注框的尺寸增减数据,确定得到调整后的标注框的尺寸数据。例如,接收到的尺寸数据为s*r,尺寸增减数据为(+i,-j),调整后的标注框的尺寸数据为s’*r’,s’=s+i,r’=r-j,标注装置确定s’*r’为调整后的标注框的尺寸数据。
本申请实施例虽然列举出了标注装置进行首次标注操作的一些实施方式,在具体的应用场景中,还可以包括其它的等同实施方式或替代实施方式。
在标注装置执行完首次标注后,即可执行末次标注。
在一些实施例中,图6a示出了末次标注的一种处理流程,包括:
步骤601、显示单镜头多帧图像数据中的第N+i帧图像数据,接收输入的标注该物体的标注框的标注数据;其中,标注数据中包括标注框的位置数据和标注框的尺寸数据;
步骤603、保存该物体的第N+i帧标注数据。
其中,步骤601中标注装置接收输入的标注数据的方式与上述步骤501中的接收方式相类似,这里不再赘述。步骤603中标注装置保存一个物体的第N+i帧标注数据时,也可以如步骤503所示,对物体标识和标注数据进行关联保存。
在一些实施例中,与图5b的处理相类似,为了便于标注员观察和识别标注情况,标注装置还根据标注数据相应地生成和显示标注框,图6b示出了末次标注的另一种处理流程,包括:
步骤601、显示单镜头多帧图像数据中的第N+i帧图像数据,接收输入的标注该物体的标注框的标注数据;其中,标注数据中包括标注框的位置数据和标注框的尺寸数据;
步骤602、根据接收到的标注数据生成并显示对应的标注框;
步骤603、保存该物体的第N+i帧标注数据。
在一些实施例中,与图5c的处理相类似,为了进行更准确的标注处理,标注装置还根据标注员输入的调整数据来调整生成的标注框,图6c示出了末次标注的一种处理流程,包括:
步骤601、显示单镜头多帧图像数据中的第N+i帧图像数据,接收输入的标注一个物体的标注框的标注数据;其中,标注数据中包括标注框的位置数据和标注框的尺寸数据;
步骤602、根据接收到的标注数据生成并显示对应的标注框;
步骤604、接收输入的标注框调整数据,调整数据中包括以下的一个或多个:标注框的位置调整数据、标注框的尺寸调整数据;
步骤605、根据调整数据和接收到的标注数据,确定得到调整后的标注数据;
步骤603、保存该物体的第N+i帧标注数据。
在步骤605中,标注确定得到调整后的标注数据的处理,可以根据如上所示的调整方式一和或调整方式二来进行,这里不再赘述。
图6a~6c示出了标注装置根据标注员输入的标注数据进行末次标注的处理。本申请实施例还提供了一种自动进行末次标注的处理,在一些实施例中,图7示出了末次标注的另一种处理流程,包括:
步骤701、显示单镜头多帧图像数据中的第N+i帧图像数据,根据保存的第N帧标注数据生成并显示对应的标注框;
步骤703、在接收到输入的标注框调整数据的情况下,根据调整数据和第N帧标注数据,确定得到第N+i帧标注数据;其中,调整数据中包括以下的一个或多个:标注框的位置调整数据、标注框的尺寸调整数据;处理进行到步骤705;
步骤704、在未接收到输入的标注框调整数据的情况下,将保存的第N帧标注数据确定为第N+i帧标注数据;处理进行到步骤705;
步骤705、保存该物体的第N+i帧标注数据。
其中,步骤703中根据调整数据确定得到第N+i帧标注数据的处理,可以参考上述调试方式一和调整方式二,这里不再赘述。
通过图7所示的处理,在标注静态物体时,或者标注员认为自动标注的结果准确时,末次标注处理中能够自动地对物体进行标注;在标注动态物体时,末次标注处理中能够向标注员显示第N帧中的标注情况,便于标注员观察和识别物体,并根据标注员输入的调整数据来对应地调整第N+i帧中物体的标注框。
本申请实施例虽然列举出了标注装置进行末次标注操作的一些实施方式,在具体的应用场景中,还可以包括其它的等同实施方式或替代实施方式。
标注装置在执行完首次标注和末次标注后,就可以执行中间自动标注处理。
在一些实施例中,如图8所示,中间自动标注处理可以包括:
步骤801、根据第N+i帧标注数据和第N帧标注数据,以及中间帧图像数据的帧数,确定得到标注数据中每项数据的差值均值;
步骤803、根据第N帧标注数据中包括的每项数据的数值、中间帧图像数据的顺序、以及确定的标注数据中每项数据的差值均值,确定得到该物体每一帧中间帧标注数据包括的每项数据的数值;
步骤805、保存每一帧中间帧标注数据。
通过图8所示的处理,标注装置能够根据首次标注的结果和末次标注的结果,自动地对每一个中间帧图像数据进行物体标注处理。
在一些实施例中,在标注数据中包括标注框尺寸数据的情况下,图8所示处理可以实施为图9所示的处理流程:
步骤801a、根据第N+i帧标注数据和第N帧标注数据中包括的标注框尺寸数据,以及中间帧图像数据的帧数,确定得到标注框尺寸数据的差值均值;
步骤803a、根据第N帧标注数据中的标注框尺寸数据、中间帧图像数据的顺序、以及确定的标注框尺寸数据的差值均值,确定得到该物体每一帧中间帧标注数据包括的标注框尺寸数据的数值;
步骤805a、保存每一帧中间帧标注数据。
在步骤801a中,例如一个物体的第N帧的标注框尺寸为s*r,第N+i帧的标注框尺寸为s’*r’,中间帧图像的帧数为n,则标注框尺寸数据的差值均值为u、v,u=(s’―s)/n,v=(r’―r)/n。在步骤803a中,在确定中间帧第2帧的标注数据的标注框尺寸数据时,可以确定得到标注框尺寸数据s2*r2,s2=s+2u,r2=r+2v。
在一些实施例中,在标注数据中包括标注框位置数据的情况下,图8所示处理可以实施为图10所示的处理流程:
步骤801b、根据第N+i帧标注数据和第N帧标注数据中包括的标注框位置数据,以及中间帧图像数据的帧数,确定得到标注框位置数据的差值均值;
步骤803b、根据第N帧标注数据中的标注框位置数据、中间帧图像数据的顺序、以及确定的标注框位置数据的差值均值,确定得到该物体每一帧中间帧标注数据包括的标注框位置数据的数值;
步骤805b、保存每一帧中间帧标注数据。
在步骤801b中,例如一个物体的第N帧的位置数据为(x,y),第N+i帧的位置数据为(x’,y’),可以确定得到标注框位置数据的差值均值为p、q,p=(x’―x)/n,q=(y’―y)/n。在步骤803b中,在确定中间帧第2帧的标注数据的标注框位置数据时,可以确定得到标注框位置数据为(x2,y2),x2=x+2p,y2=y+2q。
在另一些实施例中,在标注数据中包括标注框尺寸数据和标注框位置数据的情况下,可以通过图9和图10的处理来确定得到一个物体中间帧标注数据包括的标注框尺寸数据的数值和标注框位置数据的数值。
通过图8~10的处理,可以确定得到对物体的预估标注数据。当物体是静态物体时,物体的首次标注的标注数据与末次标注的标注数据的差别不大,通过图8~10的处理可以得到较为准确的中间帧标注数据。当物体是在连续帧中运动的物体时,由于连续帧的时间间隔较小(例如一秒钟获得60帧图像数据的情况下,相邻帧之间的时间间隔较小),运动物体的位置变化相对于如此小的时间间隔而言也是非常小的,可以将物体的运动看作是线性运动,通过图8~10所示的处理能够得到较为准确的中间帧标注数据。
在另一些实施例中,对于物体在图像数据中的位置或者尺寸变化较大的情况,在标注装置确定得到了一个物体的中间帧标注数据后,还可以对确定得到的中间帧标注数据进行调整,以得到与中间帧图像数据中该物体相符的标注数据。如图11所示,在图8所示处理的基础上,中间自动标注处理还可以实施为如下过程:
步骤801、根据第N+i帧标注数据和第N帧标注数据,以及中间帧图像数据的帧数,确定得到标注数据中每项数据的差值均值;
步骤803、根据第N帧标注数据中包括的每项数据的数值、中间帧图像数据的顺序、以及确定的标注数据中每项数据的差值均值,确定得到该物体每一帧中间帧标注数据包括的每项数据的数值;
步骤807、标注装置显示当前的中间帧图像数据,根据确定的当前的中间帧标注数据,生成并显示对应的标注框;
步骤809、接收输入的标注框调整数据,调整数据中包括以下的一个或多个:标注框的位置调整数据、标注框的尺寸调整数据;
步骤810、根据确定的当前的中间帧标注数据和调整数据,确定得到调整后的当前的中间帧标注数据;
步骤805、保存当前中间帧标注数据。
其中步骤809中确定调整数据的处理,可以参考上述调整方式一和调整方式二,这里不再赘述。
通过图11所示的处理,标注装置能够向标注员显示中间帧的自动标注情况,并且能够根据标注员输入的调整数据,对中间标注预估的标注数据进行调整,得到与图像数据中的物体更为匹配的标注数据。
本申请中描述的实质内容以及功能性操作的实施方式,能够通过多种***、数字电子电路、或者计算机软件、固件或者硬件来实现,这些实施方式包括说明书中公开的结构以及等同结构,或者这些结构的结合。说明书中描述的实质内容的实施方式,能够被实施为一个或者多个计算机程序产品,例如,计算机程序指令的一个或多个模块,该计算机程序指令被编码存储在一个有形且非易失性的计算机可读介质中,该计算机程序指令可被数据处理装置执行,或者用于控制数据处理装置的操作。该计算机可读介质可以是一个机器可读存储装置、机器可读存储基板、存储设备、能够影响机器可读传播信号的组合物、或者这些物质的组合。术语“数据处理单元”或者“数据处理装置”包括用于处理数据的所有装置、设备以及机器,示例性地包括可编程处理器、计算机、或者多处理器、多计算机。除硬件之外,这些装置可以包括为所讨论的计算机程序建立一个可执行环境的代码,例如,构成处理器防火墙、协议栈、数据库管理***、操作***的代码,或者这些代码的组合。
计算机程序(也被称为程序、软件、软件应用、脚本或者代码)可以通过任何一种编程语言来编写,包括编译或翻译语音;并且可以被以任何形式来部署,包括一个独立的程序或者一个模块、构件、子用例、或者其它适于计算环境的单元。一个计算机程序不必对应于一个文件***中的一个文件。一个程序能够被存储在一个文件中的一部分,该文件还存储有其他的程序或者数据(例如,存储在一个标记语言文档中的一个或多个脚本),或者该程序被存储在一个专门针对于所讨论的程序的单独的文件中,或者被存储在一个相互协同的文件中(例如,存储有一个或多个模块、子程序或者代码部分的多个文件)。一个计算机程序可以被部署为被一个或多个计算机执行,这些计算机位于一个地址、或者分布在多个地址,并且通过一个通信网络进行互连。
本说明书描述的处理或者逻辑图可以被一个或者多个可编程处理器执行,以执行一个或多个计算机程序,并根据输入数据进行处理生成输出结果。处理或者逻辑图可以被专用逻辑电路执行,并且多种设备也可以被实现为专用逻辑电路,例如现场可编程门阵列(Field programmable gate array,FPGA)、或者专用集成电路(Application Specificintegrated circuit,ASIC)。
用于执行计算机程序的处理器,示例性地包括通用微处理器和专用微处理器,以及任何种类的数字计算机中的任何一种或者多种处理器。通常,一个处理器会从一个只读存储器和/或一个随机接入存储器中接收指令和数据。一个计算机的基本单元包括一个处理器以及一个或多个存储装置,处理器用于执行指令,存储装置用于存储指令和数据。通常,一个计算机还包括或者操作性地耦合到一个或多个大型存储设备,以接收数据和/或发送数据,该大型存储设备包括磁盘、磁光盘或者光盘。但是,一个计算机不是必须包括这些设备。用于存储指令和数据的计算机可读介质包括所有形式的非易失性存储器、介质以及存储设备,示例性地包括半导体存储设备,例如EPROM、EEPROM以及闪存设备。处理器和存储器可以被专用逻辑电路所替代,或者结合到专用逻辑电路中。
虽然本申请文件包括了多种实施方式,但是这些实施方式不用于解释为本申请的保护范围的限定,只是特征的描述,这些特征可以被实施到特定发明的特定实施例中。本申请中独立的实施例中描述的一些特征也可以被结合实施到一个单独的实施例中。在一个单独的实施例中描述的多个特征也可被分别实施到多个实施例中,或者实施到任何适合的更细一步的结合中。并且,虽然上述在一个特定的组合中描述一些特征,也可以将所要求的一个或者多个组合中去掉一个或多个特征,所要求的组合可以被进一步地组合或者对进一步组合进行变形。
相类似地,虽然在附图中以一定的顺序描述了多种操作,但是不应被理解为必须要以这样的顺序来执行这些操作,以达到理想的结果。并且,实施例中多种***构件的拆分也不应被理解为在所有的实施例中都需要这样的拆分。显然,本领域的技术人员可以对本申请进行各种改动和变型而不脱离本申请的精神和范围。这样,倘若本申请的这些修改和变型属于本申请权利要求及其等同技术的范围之内,则本申请也意图包含这些改动和变型在内。
显然,本领域的技术人员可以对本发明进行各种改动和变型而不脱离本发明的精神和范围。这样,倘若本发明的这些修改和变型属于本发明权利要求及其等同技术的范围之内,则本发明也意图包含这些改动和变型在内。

Claims (17)

1.一种单镜头多帧图像数据中物体追踪标注的方法,其特征在于,包括:
标注装置接收并保存对一个物体的第N帧标注数据;其中,N为大于等于1的自然数;
接收并保存对该物体的第N+i帧标注数据;其中,i为大于等于2的自然数;
根据该物体的第N帧标注数据和第N+i帧标注数据,确定该物体的第N帧和第N+i帧之间的每一帧图像数据的中间帧标注数据,保存每一帧中间帧标注数据。
2.根据权利要求1所述的方法,其特征在于,接收并保存对一个物体的第N帧标注数据,包括:
接收输入的标注该物体的标注框的标注数据;其中,标注数据中包括标注框的位置数据和标注框的尺寸数据;
保存该物体的第N帧标注数据。
3.根据权利要求2所述的方法,其特征在于,接收输入的标注该物体的标注框的标注数据之后,还包括:
接收输入的标注框调整数据,调整数据中包括以下的一个或多个:标注框的位置调整数据、标注框的尺寸调整数据;
根据调整数据和接收到的标注数据,确定得到调整后的标注数据。
4.根据权利要求1所述的方法,其特征在于,接收并保存对该物体的第N+i帧标注数据,包括:
接收输入的标注该物体的标注框的标注数据;标注数据中包括标注框的位置数据和标注框的尺寸数据;其中,标注数据中包括标注框的位置数据和标注框的尺寸数据;
保存该物体的第N+i帧标注数据。
5.根据权利要求4所述的方法,其特征在于,接收输入的标注该物体的标注框的标注数据之后,还包括:
接收输入的标注框调整数据,调整数据中包括以下的一个或多个:标注框的位置调整数据、标注框的尺寸调整数据;
根据调整数据和接收到的标注数据,确定得到调整后的标注数据。
6.根据权利要求1所述的方法,其特征在于,接收并保存对该物体的第N+i帧标注数据,包括:
在未接收到输入的标注框调整数据的情况下,将保存的第N帧标注数据确定为第N+i帧标注数据;
在接收到输入的标注框调整数据的情况下,根据调整数据和第N帧标注数据,确定得到第N+i帧标注数据;其中,调整数据中包括以下的一个或多个:标注框的位置调整数据、标注框的尺寸调整数据;
保存该物体的第N+i帧标注数据。
7.根据权利要求1所述的方法,其特征在于,根据该物体的第N帧标注数据和第N+i帧标注数据,生成该物体的第N帧和第N+i帧之间的每一帧图像数据的中间帧标注数据,包括:
根据第N+i帧标注数据和第N帧标注数据,以及中间帧图像数据的帧数,确定得到标注数据中每项数据的差值均值;
根据第N帧标注数据中包括的每项数据的数值、中间帧图像数据的顺序、以及确定的标注数据中每项数据的差值均值,确定得到该物体每一帧中间帧标注数据包括的每项数据的数值;其中,标注数据中包括标注框的位置调整数据和标注框的尺寸调整数据。
8.根据权利要求7所述的方法,其特征在于,确定得到该物体每一帧中间帧标注数据包括的每项数据的数值之后,还包括:
接收输入的标注框调整数据,调整数据中包括以下的一个或多个:标注框的位置调整数据、标注框的尺寸调整数据;
根据确定的当前的中间帧标注数据和调整数据,确定得到调整后的当前的中间帧标注数据。
9.根据权利要求3、5、6、8任一项所述的方法,其特征在于,在调整数据包括标注框的位置调整数据的情况下,根据调整数据和标注数据,确定得到调整后的标注数据,包括:
根据标注框的位置调整数据和接收到的标注数据中的标注框的位置数据,确定得到调整后的标注框的位置数据。
10.根据权利要求9所述的方法,其特征在于,位置调整数据中包括调整后的标注框的位置数据;
根据标注框的位置调整数据和标注数据中的标注框的位置数据,确定得到调整后的标注框的位置数据,包括:将位置调整数据中的调整后的位置数据确定为调整后的标注框的位置数据。
11.根据权利要求9所述的方法,其特征在于,位置调整数据包括标注框的位置调整方向和位置偏移量;
根据标注框的位置调整数据和标注数据中的标注框的位置数据,确定得到调整后的标注框的位置数据,包括:根据标注数据中的标注框的位置数据和标注框的位置调整方向和位置偏移量,确定得到调整后的标注框的位置数据。
12.根据权利要求3、5、6、8任一项所述的方法,其特征在于,在调整数据包括标注框的尺寸调整数据的情况下,根据调整数据和标注数据,确定得到调整后的标注数据,包括:
根据标注框的尺寸调整数据和标注数据中的标注框的尺寸数据,确定得到调整后的标注框的尺寸数据。
13.根据权利要求12所述的方法,其特征在于,尺寸调整数据中包括调整后的标注框的尺寸数据;
根据标注框的尺寸调整数据和标注数据中的标注框的尺寸数据,确定得到调整后的标注框的尺寸数据,包括:将调整后的尺寸数据确定为调整后的标注框的尺寸数据。
14.根据权利要求12所述的方法,其特征在于,尺寸调整数据中包括尺寸增减数据;
根据标注框的尺寸调整数据和标注数据中的标注框的尺寸数据,确定得到调整后的标注框的尺寸数据,包括:根据标注数据中的标注框的尺寸数据和标注框的尺寸增减数据,确定得到调整后的标注框的尺寸数据。
15.根据权利要求1所述的方法,其特征在于,确定该物体的第N帧和第N+i帧之间的每一帧图像数据的中间帧标注数据之后,还包括:
标注装置显示当前的中间帧图像数据;
接收帧重置指令,将当前的中间帧设置为第N帧图像数据。
16.一种单镜头多帧图像数据物体追踪标注的装置,其特征在于,包括一个处理器和至少一个存储器,至少一个存储器中存储有至少一条机器可执行指令,处理器执行至少一条机器可执行指令以执行如权利要求1~15中任一项所述的方法。
17.一种非易失性存储介质,其特征在于,存储有至少一条机器可执行指令,至少一条机器可执行指令被处理器执行后实现如权利要求1~15中任一项所述的方法。
CN202010757794.1A 2020-07-31 2020-07-31 单镜头多帧图像数据物体追踪标注方法和装置、存储介质 Pending CN112053323A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202010757794.1A CN112053323A (zh) 2020-07-31 2020-07-31 单镜头多帧图像数据物体追踪标注方法和装置、存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202010757794.1A CN112053323A (zh) 2020-07-31 2020-07-31 单镜头多帧图像数据物体追踪标注方法和装置、存储介质

Publications (1)

Publication Number Publication Date
CN112053323A true CN112053323A (zh) 2020-12-08

Family

ID=73601953

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202010757794.1A Pending CN112053323A (zh) 2020-07-31 2020-07-31 单镜头多帧图像数据物体追踪标注方法和装置、存储介质

Country Status (1)

Country Link
CN (1) CN112053323A (zh)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN115757871A (zh) * 2022-11-15 2023-03-07 北京字跳网络技术有限公司 视频标注方法、装置、设备、介质及产品
WO2024104239A1 (zh) * 2022-11-15 2024-05-23 北京字跳网络技术有限公司 视频标注方法、装置、设备、介质及产品

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108520218A (zh) * 2018-03-29 2018-09-11 深圳市芯汉感知技术有限公司 一种基于目标跟踪算法的舰船样本收集方法
CN108986134A (zh) * 2018-08-17 2018-12-11 浙江捷尚视觉科技股份有限公司 一种基于相关滤波跟踪的视频目标半自动标注方法
CN110084895A (zh) * 2019-04-30 2019-08-02 上海禾赛光电科技有限公司 对点云数据进行标注的方法和设备
CN110705405A (zh) * 2019-09-20 2020-01-17 阿里巴巴集团控股有限公司 目标标注的方法及装置
CN110866936A (zh) * 2018-08-07 2020-03-06 阿里巴巴集团控股有限公司 视频标注方法、跟踪方法、装置、计算机设备及存储介质

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108520218A (zh) * 2018-03-29 2018-09-11 深圳市芯汉感知技术有限公司 一种基于目标跟踪算法的舰船样本收集方法
CN110866936A (zh) * 2018-08-07 2020-03-06 阿里巴巴集团控股有限公司 视频标注方法、跟踪方法、装置、计算机设备及存储介质
CN108986134A (zh) * 2018-08-17 2018-12-11 浙江捷尚视觉科技股份有限公司 一种基于相关滤波跟踪的视频目标半自动标注方法
CN110084895A (zh) * 2019-04-30 2019-08-02 上海禾赛光电科技有限公司 对点云数据进行标注的方法和设备
CN110705405A (zh) * 2019-09-20 2020-01-17 阿里巴巴集团控股有限公司 目标标注的方法及装置

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN115757871A (zh) * 2022-11-15 2023-03-07 北京字跳网络技术有限公司 视频标注方法、装置、设备、介质及产品
WO2024104239A1 (zh) * 2022-11-15 2024-05-23 北京字跳网络技术有限公司 视频标注方法、装置、设备、介质及产品
WO2024104272A1 (zh) * 2022-11-15 2024-05-23 北京字跳网络技术有限公司 视频标注方法、装置、设备、介质及产品

Similar Documents

Publication Publication Date Title
CN110781423B (zh) 网页生成方法、装置及电子设备
CN106250104B (zh) 一种针对服务器的远程操作***、方法及装置
CN112053323A (zh) 单镜头多帧图像数据物体追踪标注方法和装置、存储介质
CN110866936B (zh) 视频标注方法、跟踪方法、装置、计算机设备及存储介质
CN106651992B (zh) 优化Android资源图片的方法及***
US10002553B2 (en) Method, system, and device for determining a location of micro digital signage devices
CN110609912B (zh) 元器件信息记录方法、装置、设备及可读存储介质
CN109492686A (zh) 一种图片标注方法与***
CN111260752A (zh) 一种流程图绘制方法、装置及设备、存储介质
CN114117128A (zh) 视频标注的方法、***及设备
JP2020028096A (ja) 画像処理装置、画像処理装置の制御方法及びプログラム
CN104333699A (zh) 自定义拍照区域合成方法及装置
JP2024502516A (ja) データ注釈方法、装置、システム、デバイスおよび記憶媒体
CN112036442A (zh) 多帧3d点云数据中物体追踪标注的方法和装置、存储介质
CN113949920A (zh) 视频标注方法、装置、终端设备及存储介质
CN114092753A (zh) 多帧3d点云数据中物体追踪标注的方法、装置和存储介质
CN105407114A (zh) 处理Zookeeper集群数据的客户端及方法
CN111309221B (zh) 页面处理方法、装置及设备
CN117201883A (zh) 用于图像编辑的方法、装置、设备和存储介质
CN110458141A (zh) 一种视频关键帧的提取方法、装置及***
CN112053388A (zh) 多相机多帧图像数据物体追踪标注方法和装置、存储介质
CN115757871A (zh) 视频标注方法、装置、设备、介质及产品
CN109948075B (zh) 网页数据的标记方法及装置
US10796451B2 (en) Object tracking method, device, augmented reality system and storage medium
CN104463839A (zh) 图像处理装置、图像处理方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination