CN111709357B - 识别目标区域的方法、装置、电子设备和路侧设备 - Google Patents

识别目标区域的方法、装置、电子设备和路侧设备 Download PDF

Info

Publication number
CN111709357B
CN111709357B CN202010538224.3A CN202010538224A CN111709357B CN 111709357 B CN111709357 B CN 111709357B CN 202010538224 A CN202010538224 A CN 202010538224A CN 111709357 B CN111709357 B CN 111709357B
Authority
CN
China
Prior art keywords
location information
target area
categories
identifiers
category
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202010538224.3A
Other languages
English (en)
Other versions
CN111709357A (zh
Inventor
刘博�
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Apollo Intelligent Connectivity Beijing Technology Co Ltd
Original Assignee
Apollo Zhilian Beijing Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Apollo Zhilian Beijing Technology Co Ltd filed Critical Apollo Zhilian Beijing Technology Co Ltd
Priority to CN202010538224.3A priority Critical patent/CN111709357B/zh
Publication of CN111709357A publication Critical patent/CN111709357A/zh
Application granted granted Critical
Publication of CN111709357B publication Critical patent/CN111709357B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V20/00Scenes; Scene-specific elements
    • G06V20/40Scenes; Scene-specific elements in video content
    • G06V20/41Higher-level, semantic clustering, classification or understanding of video scenes, e.g. detection, labelling or Markovian modelling of sport events or news items
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/23Clustering techniques
    • G06F18/232Non-hierarchical techniques
    • G06F18/2321Non-hierarchical techniques using statistics or function optimisation, e.g. modelling of probability density functions
    • G06F18/23213Non-hierarchical techniques using statistics or function optimisation, e.g. modelling of probability density functions with fixed number of clusters, e.g. K-means clustering
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/24Classification techniques
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/20Image preprocessing
    • G06V10/25Determination of region of interest [ROI] or a volume of interest [VOI]
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V20/00Scenes; Scene-specific elements
    • G06V20/50Context or environment of the image
    • G06V20/52Surveillance or monitoring of activities, e.g. for recognising suspicious objects
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V2201/00Indexing scheme relating to image or video recognition or understanding
    • G06V2201/07Target detection

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • General Physics & Mathematics (AREA)
  • Multimedia (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Artificial Intelligence (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Evolutionary Biology (AREA)
  • Evolutionary Computation (AREA)
  • General Engineering & Computer Science (AREA)
  • Probability & Statistics with Applications (AREA)
  • Computational Linguistics (AREA)
  • Software Systems (AREA)
  • Traffic Control Systems (AREA)

Abstract

本公开的实施例涉及一种识别目标区域的方法、装置、电子设备、计算机可读存储介质和路测设备,涉及智能交通领域。该方法包括确定在视频的当前帧中检测到的标识物的位置信息。该方法还包括确定用于对标识物进行分类的类别数目。进而基于位置信息和类别数目,对标识物进行分类。该方法还包括基于分类的结果,将属于主要类别的标识物所围绕的区域确定为目标区域,属于主要类别的标识物的数目大于第一阈值数目。本公开可以及时准确地更新路况信息,通过车路协同V2X技术将目标区域信息向路侧设备、云平台、车辆等进行播报,从而为车辆的路径规划提供可靠的数据支持,提升用户体验。

Description

识别目标区域的方法、装置、电子设备和路侧设备
技术领域
本公开的实施例主要涉及智能交通领域,并且更具体地,涉及用于识别目标区域的方法、装置、电子设备、计算机可读存储介质、路测设备和计算机程序产品。
背景技术
对于自动驾驶车辆或者其他普通车辆而言,在规划车辆的行驶路线时,如果能够提早发现前方存在可能阻挡交通的目标区域(例如,施工区域等),则将会为用户提供极大便利。然而,对于自动驾驶的无人车而言,其本身携带的传感器所具有的感知范围有限;而对于普通车辆而言,驾驶员的视距以及视角也存在局限性。因此,无法准确判定路面上的目标区域,这为后续的路径规划增加了难度。
发明内容
根据本公开的示例实施例,提供了一种用于识别目标区域的方案。
在本公开的第一方面中,提供了一种用于识别目标区域的方法。该方法可以包括确定在视频的当前帧中检测到的标识物的位置信息。该方法进一步包括确定用于对标识物进行分类的类别数目。该方法还可以包括基于位置信息和类别数目,对标识物进行分类。此外,该方法可以进一步包括基于分类的结果,将属于主要类别的标识物所围绕的区域确定为目标区域,属于主要类别的标识物的数目大于第一阈值数目。
在本公开的第二方面中,提供了一种用于识别目标区域的装置,包括:位置信息确定模块,被配置为确定在视频的当前帧中检测到的标识物的位置信息;类别数目确定模块,被配置为确定用于对所述标识物进行分类的类别数目;分类模块,被配置为基于所述位置信息和所述类别数目,对所述标识物进行分类;以及目标区域确定模块,被配置为基于所述分类的结果,将属于主要类别的标识物所围绕的区域确定为所述目标区域,属于所述主要类别的标识物的数目大于第一阈值数目。
在本公开的第三方面中,提供了一种电子设备,包括一个或多个处理器;以及存储装置,用于存储一个或多个程序,当一个或多个程序被一个或多个处理器执行,使得一个或多个处理器实现根据本公开的第一方面的方法。
在本公开的第四方面中,提供了一种计算机可读存储介质,其上存储有计算机程序,该程序被处理器执行时实现根据本公开的第一方面的方法。
在本公开的第五方面中,提供了一种路侧设备,包括如本公开的第三方面所述的电子设备。
在本公开的第六方面中,提供了一种计算机程序产品,包括计算机程序,该计算机程序在被处理器执行时实现根据本公开的第一方面的方法。
应当理解,发明内容部分中所描述的内容并非旨在限定本公开的实施例的关键或重要特征,亦非用于限制本公开的范围。本公开的其它特征将通过以下的描述变得容易理解。
附图说明
结合附图并参考以下详细说明,本公开各实施例的上述和其他特征、优点及方面将变得更加明显。在附图中,相同或相似的附图标注表示相同或相似的元素,其中:
图1示出了本公开的多个实施例能够在其中实现的示例环境的示意图;
图2示出了根据本公开的实施例的监控场景的示意图;
图3A示出了根据本公开的另一实施例的监控视频中的一帧的示意图;
图3B示出了图3A的帧中被识别的各个标识物在平面坐标系下的示意图;
图4示出了根据本公开的实施例的用于识别目标区域的过程的流程图;
图5示出了根据本公开的实施例的用于识别目标区域的装置的框图;以及
图6示出了能够实施本公开的多个实施例的计算设备的框图。
具体实施方式
下面将参照附图更详细地描述本公开的实施例。虽然附图中显示了本公开的某些实施例,然而应当理解的是,本公开可以通过各种形式来实现,而且不应该被解释为限于这里阐述的实施例,相反提供这些实施例是为了更加透彻和完整地理解本公开。应当理解的是,本公开的附图及实施例仅用于示例性作用,并非用于限制本公开的保护范围。
在本公开的实施例的描述中,术语“包括”及其类似用语应当理解为开放性包含,即“包括但不限于”。术语“基于”应当理解为“至少部分地基于”。术语“一个实施例”或“该实施例”应当理解为“至少一个实施例”。术语“第一”、“第二”等等可以指代不同的或相同的对象。下文还可能包括其他明确的和隐含的定义。
如以上提及的,自动驾驶车辆需要通过路侧感测装置获取与路况有关的信息来生成较为合理的驾驶策略。需要理解的是,由于道路附近或道路上可能存在施工、损毁、塌陷等情况,故及时识别发生这些情况的目标区域并重新规划行车路线对于自动驾驶车辆至关重要。
传统的识别方案主要有两种。第一种方案是人工采集上报。这是一种最原始、但是简单易行且可靠性高的方法。即,专人开车巡查,当发现存在目标区域的位置后,通过全站仪或者手持GPS,获取目标区域的具***置,并且进行记录和上报。然而,这种方案成本过高并且效率较低,尤其对于较大规模的城市,进行一次全面的路况检查耗费时间太长,更新速率过慢,且不支持实时更新。
为了克服第一种方案的缺陷,第二种方案是行人、司机上报模式。即,借助于每天在路上行走的行人或者行驶车辆的司机来上报目标区域。然而,这种方案的覆盖率无法得到保证。并且,对于车辆行人较少的道路可能会存在漏报的情况。
近年来,无人驾驶技术逐渐崭露头角。越来越多的企业开始投入无人驾驶的研发和生产中。可预想到,未来一段时间内的道路上将会出现部分自动驾驶车辆。如何为这些自动驾驶车辆提供可靠的路面信息是目前亟待解决的问题。
根据本公开的实施例,提出了一种识别目标区域的方案。例如,可以获取识别出的标识物的位置信息,并使用K均值(Kmeans)算法来对这些标识物的位置信息进行聚类。属于同一类别的标识物很可能用于围绕目标区域。由此,可以通过上报该目标区域以及其中包含的每个锥桶的位置信息和时间戳,来实时更新路面信息。此外,本方案依靠路侧设备中的路侧传感器和边缘计算节点对道路上是否存在目标区域进行实时检测,并且路侧设备可以通过诸如车路协同v2x技术将检测到目标区域的各种信息发送至云平台、其他路侧设备和车辆等。以此方式,自动驾驶车辆或者其他普通车辆均可以获知实时更新的路面信息,从而为行车路径的规划带来极大便利。
以下将参照附图来具体描述本公开的实施例。图1示出了本公开的多个实施例能够在其中实现的示例环境100的示意图。如图1所示,示例环境100中包含监控视频的当前帧110、计算设备120和目标区域130。出当前帧110外,监控视频中还包含多个先前帧111。
如图1所示,为了识别目标区域,当前帧110被输入至计算设备120。在一些实施例中,计算设备120可以位于云端,其用于根据特定的识别模型来识别用于围绕目标区域的标识物。应理解,本文所描述的“标识物”是指用于标识目标区域(诸如、施工区域、塌陷区域等)的具有明显外形特征的物体,其可以是锥桶或者具有斑纹图案的柱状桶等。在一些实施列中,计算设备120可以包括但不限于个人计算机、服务器计算机、手持或膝上型设备、移动设备(诸如移动电话、个人数字助理(PDA)、媒体播放器等)、多处理器***、消费电子产品、小型计算机、大型计算机、包括上述***或设备中的任意一个的分布式计算环境等。
经过计算设备120的处理,当前帧110中的特定部分可能会被确定为是目标区域130。例如,可以实时监控视频中的每一帧,当发现当前帧110中的标识物的个数大于或等于阈值数目时,使用K均值(Kmeans)算法来对这些标识物的位置信息进行聚类。之后,对于聚类到一个类别中的标识物,如果属于该类别的标识物的数目大于阈值数目,则将属于该类别的标识物所围绕的区域确定为目标区域130。由此,可以通过上报该目标区域130以及其中包含的每个标识物的位置信息和时间戳,来实时更新路面信息。应理解,目标区域130用于指示包括车辆的交通工具不能通过的区域,从而影响行车路线的规划。
图2示出了根据本公开的实施例的监控场景200的示意图。在该监控场景200中,存在包含路测监控装置210和计算设备120的路测设备,计算设备120可以通过有线或无线的方式与路测监控装置210通信连接。如图2所示,路侧监控装置210可以被设置在诸如用于进行违章拍照的监控器的位置,用于监控一条基本笔直的道路的路面信息。应理解,该道路通常会被多个处于不同位置的路测监控装置监控,且不同的监控结果可以通过计算设备120关联融合,并最终确定目标区域。路侧设备可以通过诸如车路协同v2x技术将检测到目标区域的各种信息上报至云平台,或者向其他路侧设备或车辆等进行广播。
如图2所示,路侧监控装置210可以拍摄到诸如锥桶221、222的标识物。应理解,路侧监控装置210还可以拍摄到诸如人、自行车、摩托车等的运动对象(未示出)。还应理解,为了便于讨论,本公开图2所示的方案仅示出了锥桶221、222。然而,本公开并非仅限于使用路侧监控装置210监控锥桶221、222,出现在路侧监控装置210的监控场景中的用于指示目标区域的其他标识物(例如,具有斑纹图案的柱状桶等)均可以被路侧监控装置210同时监控。
下文将详细描述图2中的路侧监控装置210所拍摄到的监控视频中的一帧。图3A示出了根据本公开的另一实施例的监控视频中的帧300A的示意图。在图3A中,标识物310-1、310-2、310-3、310-4以及310-5(下文统称为310)均出现在帧300A中。普通人通常可以直接判断出,帧300A中存在由标识物310-1、310-2、310-3、310-4组成的目标区域,并且标识物310-5孤立于该目标区域之外。然而,为了节约人力资源,计算设备120被配置为承担识别目标区域的任务。
计算设备120要从帧300A中检测出标识物310,首先需要对帧300A中的标识物310进行识别。图3B示出了图3A的帧中被识别的各个标识物在平面坐标系下的位置关系图300B的示意图。应理解,位置关系图300B是通过对帧300A进行二维空间转换而得到的。在图3B中,可以利用预先训练好的二维目标检测模型对位置关系图300B进行检测。例如,当检测到位置关系图300B中存在标识物310时,可以为标识物310添加检测框(如图3B中围绕标识物310的方框)。应理解,长方形的检测框仅是示例性的,根据需要,检测框还可以是圆形、菱形、或者是恰好可以包围标识物的外周轮廓的形状等。
之后,计算设备120可以基于经确定的各个检测框的中点来确定各个标识物的位置信息。应理解,还可以基于各个检测框的左下角点或其他点来确定各个标识物的位置信息。计算设备120可以基于这些标识物的位置信息来确定是否存在目标区域以及目标区域的位置。
上文描述的技术方案仅用于示例,而非限制本发明。应理解,还可以按照其他方式和连接关系来布置整个监控***。为了更清楚地解释上述方案的原理,下文将参考图4来更详细描述识别目标区域的过程。
图4示出了根据本公开的实施例的用于识别目标区域的过程400的流程图。在某些实施例中,方法400可以在图1示出的计算设备120中实现。现参照图4描述根据本公开实施例的用于识别目标区域的过程400。为了便于理解,在下文描述中提及的具体数据均是示例性的,并不用于限定本公开的保护范围。
在402,计算设备120可以确定在视频的当前帧110中检测到的标识物310的位置信息。作为示例,如果计算设备120确定在当前帧110中的标识物310的数目大于或等于一阈值数目,则说明这些标识物可能用于围绕目标区域。由此,计算设备120可以确定这些标识物310的位置信息。以此方式,可以结合先验信息准确确定围绕目标区域的标识物。备选地或附加地,如果计算设备120确定在视频中的预定数目的连续帧(如图1中所示,连续的先前帧111直至当前帧110)中的标识物310的数目大于或等于一阈值数目,则说明在一段时间内这些标识物310稳定地出现在视频中,并且这些标识物310可能用于围绕目标区域。由此,计算设备120可以确定这些标识物310的位置信息。以此方式,可以过滤掉不稳定的识别结果。
在某些实施例中,标识物可以是如图2、图3A和图3B中所示的锥桶。备选地或附加地,标识物还可以是柱形桶、路障球等具备路障功能且具有特定形状和颜色的物体。此类标识物均具有特定外形,便于计算设备120进行识别。
在404,计算设备120可以确定用于对标识物310进行分类的类别数目。应理解,该类别数目可以是基于先验信息预先选定的整数值,其可以是K均值算法中的K值,例如,如果监控视频中的目标区域的个数通常为1,最多为2,则可以将K值选为1。作为示例,可以通过传统的肘部法则确定类别数目K。例如,每次聚类后计算类别内所有点与聚类中心的聚类紧凑度,记为compactness_k,随着聚类中心数的增加,compactness_k的下降趋势逐渐降低,当找到compactness_k的下降趋势很低或者反而上升的时候,可以将这个聚类中心数确定为类别数目K。例如,可以从K=1开始进行聚类,在K>=2之后,每次计算第K次紧凑度与第K-1次紧凑度的差相对于第1次紧凑度和第2次紧凑度之间的提升程度Diff。如果Diff在某一次的值小于例如0.4,则认为找到了当前的最佳聚类中心。
在406,计算设备120可以基于上文确定的位置信息和类别数目对标识物310进行分类。作为示例,计算设备120可以基于位置信息和类别数目对标识物310执行K均值聚类。如图3B所示,计算设备120可以将标识物310-1、310-2、310-3、310-4确定为属于主要分类,并且将标识物310-5确定为属于另一分类。
在408,计算设备120可以基于上述分类的结果,将属于主要类别的标识物310-1、310-2、310-3、310-4所围绕的区域确定为目标区域130。应理解,“主要类别”是通过分类模型、分类函数或算法所确定的一个或多个分类,并且该分类中的标识物的个数大于阈值个数,例如,3个或4个。
计算设备120通过识别多个标识物并对其位置信息进行聚类运算,实现了对由标识物所围绕的目标区域的识别。以此方式,计算设备120可以及时准确地更新路况信息,从而为车辆的路径规划提供可靠的数据支持。
在某些实施例中,由于类别数目K是基于先验信息人为确定的,故可能存在分类错误的问题。例如,有可能将标识物310-1、310-2、310-3、310-4与标识物310-5分为一类。为此,计算设备120需要对分类结果进行验证。作为示例,计算设备120可以计算属于主要类别的标识物310-1、310-2、310-3、310-4与标识物310-5中的一个标识物到属于该主要类别的标识物310-1、310-2、310-3、310-4与标识物310-5中的另一标识物的距离。如果确定的距离中存在大于阈值距离的距离,即,出现标识物310-5与其他标识物的距离过大的情况,则说明存在分类错误。由此,计算设备120可以增加类别数目,例如,将其更改为K+1。由于存在分类错误,说明基于之前的分类结果所确定的目标区域存在错误,故计算设备120基于各标识物的位置信息和经增加的类别数目K+1来更新目标区域130。以此方式,计算设备120可以随时检测分类的结果是否正确,并对不正确的分类结果进行更正,进而提升识别目标区域的正确率。
应理解,对分类结果进行检验的方式还有很多中。例如,计算设备120可以遍历每个分类,计算属于该类内的标识物中是否存在一个标识物,其与该分类内所有其他标识物中的至少两个标识物的距离大于阈值距离。如果存在这种标识物,则说明存在分类错误。计算设备120可以执行如上调整来更新目标区域130。
在某些实施例中,计算设备120还可以对目标区域130进行更新检测。作为示例,计算设备120可以对视频中的每一帧中检测出的标识物使用K均值算法进行聚类。之后,可以如上所述对分类的结果进行检验。例如,遍历每个分类,计算属于该分类内的标识物中是否存在一个标识物,其与该分类内所有其他的标识物中的至少两个标识物的距离大于阈值距离。如果存在这种标识物,则说明存在分类错误。计算设备120可以将类别数目加1并重新进行聚类。如果尝试预定次数均找不到合适的分类,则说明目标区域130已消失,从而更新识别结果。
此外,计算设备120还可以将确定的目标区域130的当前轮廓与基于视频中的先前帧111确定的先前目标区域的先前轮廓进行比较。如果当前轮廓与先前轮廓的重叠的比率小于或等于阈值比率(例如,80%),则可以利用目标区域130更新先前目标区域,反之,则目标区域130未发生变化。具体地,计算设备120可以遍历已经存在的所有先前轮廓,找到与当前轮廓重合最大的先前轮廓,并记下两者之间的重复率。以此方式,计算设备120可以确定最新确定的目标区域是否曾经发生改变,并上报改变情况。
应理解,本公开的目标区域识别方式相对于传统识别方式的优势在于,每当监控视频中出现新的目标区域时,本公开的目标区域识别方式无需如传统方式那样通过人工手段进行信息采集和上报。原因在于,本公开利用了诸如K均值聚类手段来对识别出的多个标识物进行聚类,进而找到适于组成目标区域的类别,从而完成对目标区域的识别。由此,可以在不进行过多人工干预的前提下充分涵盖装配有监控摄像设备的道路,从而为用户提供及时准确的道路信息,节约了人力资源成本,并且提升了用户体验。
图5示出了根据本公开的实施例的用于识别目标区域130的装置500的框图。如图5所示,装置500可以包括:位置信息确定模块502,被配置为确定在视频的当前帧中检测到的标识物的位置信息;类别数目确定模块504,被配置为确定用于对标识物进行分类的类别数目;分类模块506,被配置为基于所述位置信息和所述类别数目,对所述标识物进行分类;以及目标区域确定模块508,被配置为基于所述分类的结果,将属于主要类别的标识物所围绕的区域确定为所述目标区域,属于所述主要类别的标识物的数目大于第一阈值数目。
在某些实施例中,装置500还可以包括:距离计算模块,被配置为计算属于所述主要类别的标识物中的一个标识物到属于所述主要类别的标识物中的另一标识物的距离;类别数目增加模块,被配置为如果确定所述距离中存在大于阈值距离的距离,增加所述类别数目;以及目标区域更新模块,被配置为基于所述位置信息和经增加的所述类别数目,更新所述目标区域。
在某些实施例中,位置信息确定模块502可以被配置为:如果确定在所述视频中的预定数目的连续帧中的所述标识物的数目大于或等于所述第二阈值数目,确定所述位置信息。
在某些实施例中,位置信息确定模块502可以被配置为:如果确定在所述当前帧中的所述标识物的数目大于或等于第三阈值数目,确定所述位置信息。
在某些实施例中,装置500还可以包括:轮廓比较模块,被配置为将确定的所述目标区域的当前轮廓与基于所述视频中的先前帧确定的先前目标区域的先前轮廓进行比较;以及更新模块,被配置为响应于所述当前轮廓与所述先前轮廓的重叠的比率小于或等于阈值比率,利用目标区域更新先前目标区域。
在某些实施例中,分类模块506可以包括:K均值聚类模块,被配置为基于所述位置信息和所述类别数目,对所述标识物执行K均值聚类。
在某些实施例中,标识物可以包括锥桶、柱形桶、以及路障球中的至少一项。
图6示出了能够实施本公开的多个实施例的计算设备600的框图。设备600可以用于实现图1的计算设备120。如图所示,设备600包括中央处理单元(CPU)601,其可以根据存储在只读存储器(ROM)602中的计算机程序指令或者从存储单元608加载到随机访问存储器(RAM)603中的计算机程序指令,来执行各种适当的动作和处理。在RAM 603中,还可存储设备600操作所需的各种程序和数据。CPU 601、ROM 602以及RAM 603通过总线604彼此相连。输入/输出(I/O)接口605也连接至总线504。
设备600中的多个部件连接至I/O接口605,包括:输入单元606,例如键盘、鼠标等;输出单元607,例如各种类型的显示器、扬声器等;存储单元608,例如磁盘、光盘等;以及通信单元609,例如网卡、调制解调器、无线通信收发机等。通信单元609允许设备600通过诸如因特网的计算机网络和/或各种电信网络与其他设备交换信息/数据。
处理单元601执行上文所描述的各个方法和处理,例如过程200、300和400。例如,在一些实施例中,过程200、300和400可被实现为计算机软件程序,其被有形地包含于机器可读介质,例如存储单元608。在一些实施例中,计算机程序的部分或者全部可以经由ROM602和/或通信单元609而被载入和/或安装到设备600上。当计算机程序加载到RAM 603并由CPU 601执行时,可以执行上文描述的过程200、300和400的一个或多个步骤。备选地,在其他实施例中,CPU 601可以通过其他任何适当的方式(例如,借助于固件)而被配置为执行过程200、300和400。
本文中以上描述的功能可以至少部分地由一个或多个硬件逻辑部件来执行。例如,非限制性地,可以使用的示范类型的硬件逻辑部件包括:场可编程门阵列(FPGA)、专用集成电路(ASIC)、专用标准产品(ASSP)、芯片上***的***(SOC)、负载可编程逻辑设备(CPLD)等等。
用于实施本公开的方法的程序代码可以采用一个或多个编程语言的任何组合来编写。这些程序代码可以提供给通用计算机、专用计算机或其他可编程数据处理装置的处理器或控制器,使得程序代码当由处理器或控制器执行时使流程图和/或框图中所规定的功能/操作被实施。程序代码可以完全在机器上执行、部分地在机器上执行,作为独立软件包部分地在机器上执行且部分地在远程机器上执行或完全在远程机器或服务器上执行。
在本公开的上下文中,机器可读介质可以是有形的介质,其可以包含或存储以供指令执行***、装置或设备使用或与指令执行***、装置或设备结合地使用的程序。机器可读介质可以是机器可读信号介质或机器可读储存介质。机器可读介质可以包括但不限于电子的、磁性的、光学的、电磁的、红外的、或半导体***、装置或设备,或者上述内容的任何合适组合。机器可读存储介质的更具体示例会包括基于一个或多个线的电气连接、便携式计算机盘、硬盘、随机存取存储器(RAM)、只读存储器(ROM)、可擦除可编程只读存储器(EPROM或快闪存储器)、光纤、便捷式紧凑盘只读存储器(CD-ROM)、光学储存设备、磁储存设备、或上述内容的任何合适组合。
此外,虽然采用特定次序描绘了各操作,但是这应当理解为要求这样操作以所示出的特定次序或以顺序次序执行,或者要求所有图示的操作应被执行以取得期望的结果。在一定环境下,多任务和并行处理可能是有利的。同样地,虽然在上面论述中包含了若干具体实现细节,但是这些不应当被解释为对本公开的范围的限制。在单独的实施例的上下文中描述的某些特征还可以组合地实现在单个实现中。相反地,在单个实现的上下文中描述的各种特征也可以单独地或以任何合适的子组合的方式实现在多个实现中。
尽管已经采用特定于结构特征和/或方法逻辑动作的语言描述了本主题,但是应当理解所附权利要求书中所限定的主题未必局限于上面描述的特定特征或动作。相反,上面所描述的特定特征和动作仅仅是实现权利要求书的示例形式。

Claims (15)

1.一种用于识别目标区域的方法,包括:
确定在视频的当前帧中检测到的标识物的数目;
如果所述标识物的数目大于或等于一阈值数目,确定所述标识物的位置信息;
确定用于对所述标识物进行分类的类别数目;
基于所述位置信息和所述类别数目,对所述标识物进行分类;以及
基于所述分类的结果,如果属于主要类别的标识物的数目大于第一阈值数目,将属于所述主要类别的标识物所围绕的区域确定为所述目标区域。
2.根据权利要求1所述的方法,还包括:
计算属于所述主要类别的标识物中的一个标识物到属于所述主要类别的标识物中的另一标识物的距离;
如果确定所述距离中存在大于阈值距离的距离,增加所述类别数目;以及
基于所述位置信息和经增加的所述类别数目,对所述标识物进行重新分类;以及
基于所述重新分类的结果,更新所述目标区域。
3.根据权利要求1所述的方法,其中确定所述标识物的位置信息包括:
如果确定在所述视频中的预定数目的连续帧中的所述标识物的数目大于或等于所述阈值数目,确定所述位置信息。
4.根据权利要求1所述的方法,还包括:
将确定的所述目标区域的当前轮廓与基于所述视频中的先前帧确定的先前目标区域的先前轮廓进行比较;以及
响应于所述当前轮廓与所述先前轮廓的重叠的比率小于或等于阈值比率,利用所述目标区域更新所述先前目标区域。
5.根据权利要求1所述的方法,其中对所述标识物进行分类包括:
基于所述位置信息和所述类别数目,对所述标识物执行K均值聚类。
6.根据权利要求1所述的方法,其中所述标识物包括如下至少一项:
锥桶;
柱形桶;以及
路障球。
7.一种用于识别目标区域的装置,包括:
位置信息确定模块,被配置为确定在视频的当前帧中检测到的标识物的数目,如果所述标识物的数目大于或等于一阈值数目,确定所述标识物的位置信息;
类别数目确定模块,被配置为确定用于对所述标识物进行分类的类别数目;
分类模块,被配置为基于所述位置信息和所述类别数目,对所述标识物进行分类;以及
目标区域确定模块,被配置为基于所述分类的结果,如果属于主要类别的标识物的数目大于第一阈值数目,将属于所述主要类别的标识物所围绕的区域确定为所述目标区域,属于所述主要类别的标识物的数目大于第一阈值数目。
8.根据权利要求7所述的装置,还包括:
距离计算模块,被配置为计算属于所述主要类别的标识物中的一个标识物到属于所述主要类别的标识物中的另一标识物的距离;
类别数目增加模块,被配置为如果确定所述距离中存在大于阈值距离的距离,增加所述类别数目;以及
目标区域更新模块,被配置为基于所述位置信息和经增加的所述类别数目,更新所述目标区域。
9.根据权利要求7所述的装置,其中所述位置信息确定模块被配置为:
如果确定在所述视频中的预定数目的连续帧中的所述标识物的数目大于或等于所述阈值数目,确定所述位置信息。
10.根据权利要求7所述的装置,还包括:
轮廓比较模块,被配置为将确定的所述目标区域的当前轮廓与基于所述视频中的先前帧确定的先前目标区域的先前轮廓进行比较;以及
更新模块,被配置为响应于所述当前轮廓与所述先前轮廓的重叠的比率小于或等于阈值比率,利用所述目标区域更新所述先前目标区域。
11.根据权利要求7所述的装置,其中所述分类模块包括:
K均值聚类模块,被配置为基于所述位置信息和所述类别数目,对所述标识物执行K均值聚类。
12.根据权利要求7所述的装置,其中所述标识物包括如下至少一项:
锥桶;
柱形桶;以及
路障球。
13.一种电子设备,所述电子设备包括:
一个或多个处理器;以及
存储装置,用于存储一个或多个程序,当所述一个或多个程序被所述一个或多个处理器执行,使得所述一个或多个处理器实现如权利要求1-6中任一项所述的方法。
14.一种计算机可读存储介质,其上存储有计算机程序,所述程序被处理器执行时实现如权利要求1-6任一项所述的方法。
15.一种路侧设备,包括如权利要求13所述的电子设备。
CN202010538224.3A 2020-06-12 2020-06-12 识别目标区域的方法、装置、电子设备和路侧设备 Active CN111709357B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202010538224.3A CN111709357B (zh) 2020-06-12 2020-06-12 识别目标区域的方法、装置、电子设备和路侧设备

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202010538224.3A CN111709357B (zh) 2020-06-12 2020-06-12 识别目标区域的方法、装置、电子设备和路侧设备

Publications (2)

Publication Number Publication Date
CN111709357A CN111709357A (zh) 2020-09-25
CN111709357B true CN111709357B (zh) 2023-07-28

Family

ID=72539929

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202010538224.3A Active CN111709357B (zh) 2020-06-12 2020-06-12 识别目标区域的方法、装置、电子设备和路侧设备

Country Status (1)

Country Link
CN (1) CN111709357B (zh)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113139542B (zh) * 2021-04-28 2023-08-11 北京百度网讯科技有限公司 目标检测方法、装置、设备和计算机可读存储介质

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8195394B1 (en) * 2011-07-13 2012-06-05 Google Inc. Object detection and classification for autonomous vehicles
CN103995889A (zh) * 2014-06-03 2014-08-20 广东欧珀移动通信有限公司 图片分类方法及装置
CN110472655A (zh) * 2019-07-03 2019-11-19 特斯联(北京)科技有限公司 一种用于跨境旅游的标志物机器学习识别***及方法

Family Cites Families (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105973245A (zh) * 2016-04-28 2016-09-28 百度在线网络技术(北京)有限公司 利用无人驾驶车辆更新在线地图的方法和装置
US10685239B2 (en) * 2018-03-18 2020-06-16 Tusimple, Inc. System and method for lateral vehicle detection
CN109284348B (zh) * 2018-10-30 2021-02-05 百度在线网络技术(北京)有限公司 一种电子地图的更新方法、装置、设备和存储介质
CN110728229B (zh) * 2019-10-09 2023-07-18 百度在线网络技术(北京)有限公司 图像处理方法、装置、设备和存储介质
CN110867132B (zh) * 2019-10-15 2022-03-01 阿波罗智能技术(北京)有限公司 环境感知的方法、装置、电子设备和计算机可读存储介质
CN110929639B (zh) * 2019-11-20 2023-09-19 北京百度网讯科技有限公司 用于确定图像中障碍物位置的方法、装置、设备和介质

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8195394B1 (en) * 2011-07-13 2012-06-05 Google Inc. Object detection and classification for autonomous vehicles
CN103995889A (zh) * 2014-06-03 2014-08-20 广东欧珀移动通信有限公司 图片分类方法及装置
CN110472655A (zh) * 2019-07-03 2019-11-19 特斯联(北京)科技有限公司 一种用于跨境旅游的标志物机器学习识别***及方法

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
基于标识归属关系的室内服务机器人物品搜寻识别与定位;李文静等;《计算机辅助设计与图形学学报》;第30卷(第12期);第2335-2343页 *

Also Published As

Publication number Publication date
CN111709357A (zh) 2020-09-25

Similar Documents

Publication Publication Date Title
RU2693400C2 (ru) Виртуальная карта транспортных средств
Koukoumidis et al. Leveraging smartphone cameras for collaborative road advisories
CN105793669B (zh) 车辆位置推定***、装置、方法以及照相机装置
JP2023523243A (ja) 障害物検出方法及び装置、コンピュータデバイス、並びにコンピュータプログラム
CN110287276A (zh) 高精地图更新方法、装置及存储介质
CN110785719A (zh) 在自动驾驶车辆中用于经由交叉时态验证的即时物体标记的方法和***
WO2021155685A1 (zh) 一种更新地图的方法、装置和设备
CN106097755A (zh) 用于识别泊车场地和/或空出场地的方法
CN110869559A (zh) 用于自动驾驶车辆中的集成的全局式与分布式学习的方法和***
CN110753953A (zh) 用于自动驾驶车辆中经由交叉模态验证的以物体为中心的立体视觉的方法和***
WO2021253245A1 (zh) 识别车辆变道趋势的方法和装置
CN111898491B (zh) 一种车辆逆向行驶的识别方法、装置及电子设备
CN112101223B (zh) 检测方法、装置、设备和计算机存储介质
JP2023508705A (ja) データ伝送方法および装置
CN113743171A (zh) 目标检测方法及装置
CN1800783A (zh) 路径规划***及方法
CN111460986A (zh) 一种车道线处理方法和装置
CN111709357B (zh) 识别目标区域的方法、装置、电子设备和路侧设备
CN112447060A (zh) 识别车道的方法、装置及计算设备
CN111709354B (zh) 识别目标区域的方法、装置、电子设备和路侧设备
CN111709355B (zh) 识别目标区域的方法、装置、电子设备和路侧设备
CN110264725B (zh) 路段流量的确定方法及装置
CN111709356B (zh) 识别目标区域的方法、装置、电子设备和路侧设备
CN112258881B (zh) 基于智慧交通的车辆管理方法
CN115979215A (zh) 一种楼层识别方法、装置及计算机可读存储介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
TA01 Transfer of patent application right
TA01 Transfer of patent application right

Effective date of registration: 20211013

Address after: 100176 101, floor 1, building 1, yard 7, Ruihe West 2nd Road, Beijing Economic and Technological Development Zone, Daxing District, Beijing

Applicant after: Apollo Intelligent Connectivity (Beijing) Technology Co., Ltd.

Address before: 100094 2 / F, *** building, No.10 Shangdi 10th Street, Haidian District, Beijing

Applicant before: BEIJING BAIDU NETCOM SCIENCE AND TECHNOLOGY Co.,Ltd.

GR01 Patent grant
GR01 Patent grant