CN116263944A - 针对自主***和应用程序使用图像对比度分析的眩光减轻 - Google Patents

针对自主***和应用程序使用图像对比度分析的眩光减轻 Download PDF

Info

Publication number
CN116263944A
CN116263944A CN202211193096.9A CN202211193096A CN116263944A CN 116263944 A CN116263944 A CN 116263944A CN 202211193096 A CN202211193096 A CN 202211193096A CN 116263944 A CN116263944 A CN 116263944A
Authority
CN
China
Prior art keywords
vehicle
pixels
data
contrast
objects
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202211193096.9A
Other languages
English (en)
Inventor
I·特伦金
A·巴基帕耶
Y·王
H-J·徐
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Nvidia Corp
Original Assignee
Nvidia Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nvidia Corp filed Critical Nvidia Corp
Publication of CN116263944A publication Critical patent/CN116263944A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T5/00Image enhancement or restoration
    • G06T5/80Geometric correction
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/40Extraction of image or video features
    • G06V10/60Extraction of image or video features relating to illumination properties, e.g. using a reflectance or lighting model
    • BPERFORMING OPERATIONS; TRANSPORTING
    • B60VEHICLES IN GENERAL
    • B60QARRANGEMENT OF SIGNALLING OR LIGHTING DEVICES, THE MOUNTING OR SUPPORTING THEREOF OR CIRCUITS THEREFOR, FOR VEHICLES IN GENERAL
    • B60Q1/00Arrangement of optical signalling or lighting devices, the mounting or supporting thereof or circuits therefor
    • B60Q1/02Arrangement of optical signalling or lighting devices, the mounting or supporting thereof or circuits therefor the devices being primarily intended to illuminate the way ahead or to illuminate other areas of way or environments
    • B60Q1/04Arrangement of optical signalling or lighting devices, the mounting or supporting thereof or circuits therefor the devices being primarily intended to illuminate the way ahead or to illuminate other areas of way or environments the devices being headlights
    • B60Q1/14Arrangement of optical signalling or lighting devices, the mounting or supporting thereof or circuits therefor the devices being primarily intended to illuminate the way ahead or to illuminate other areas of way or environments the devices being headlights having dimming means
    • B60Q1/1415Dimming circuits
    • B60Q1/1423Automatic dimming circuits, i.e. switching between high beam and low beam due to change of ambient light or light level in road traffic
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T7/00Image analysis
    • G06T7/0002Inspection of images, e.g. flaw detection
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/10Image acquisition
    • G06V10/12Details of acquisition arrangements; Constructional details thereof
    • G06V10/14Optical characteristics of the device performing the acquisition or on the illumination arrangements
    • G06V10/141Control of illumination
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/20Image preprocessing
    • G06V10/25Determination of region of interest [ROI] or a volume of interest [VOI]
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V20/00Scenes; Scene-specific elements
    • G06V20/50Context or environment of the image
    • G06V20/56Context or environment of the image exterior to a vehicle by using sensors mounted on the vehicle
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V20/00Scenes; Scene-specific elements
    • G06V20/50Context or environment of the image
    • G06V20/56Context or environment of the image exterior to a vehicle by using sensors mounted on the vehicle
    • G06V20/58Recognition of moving objects or obstacles, e.g. vehicles or pedestrians; Recognition of traffic objects, e.g. traffic signs, traffic lights or roads
    • HELECTRICITY
    • H05ELECTRIC TECHNIQUES NOT OTHERWISE PROVIDED FOR
    • H05BELECTRIC HEATING; ELECTRIC LIGHT SOURCES NOT OTHERWISE PROVIDED FOR; CIRCUIT ARRANGEMENTS FOR ELECTRIC LIGHT SOURCES, IN GENERAL
    • H05B47/00Circuit arrangements for operating light sources in general, i.e. where the type of light source is not relevant
    • H05B47/10Controlling the light source
    • H05B47/105Controlling the light source in response to determined parameters
    • H05B47/115Controlling the light source in response to determined parameters by determining the presence or movement of objects or living beings
    • H05B47/125Controlling the light source in response to determined parameters by determining the presence or movement of objects or living beings by using cameras
    • BPERFORMING OPERATIONS; TRANSPORTING
    • B60VEHICLES IN GENERAL
    • B60QARRANGEMENT OF SIGNALLING OR LIGHTING DEVICES, THE MOUNTING OR SUPPORTING THEREOF OR CIRCUITS THEREFOR, FOR VEHICLES IN GENERAL
    • B60Q1/00Arrangement of optical signalling or lighting devices, the mounting or supporting thereof or circuits therefor
    • B60Q1/02Arrangement of optical signalling or lighting devices, the mounting or supporting thereof or circuits therefor the devices being primarily intended to illuminate the way ahead or to illuminate other areas of way or environments
    • B60Q1/04Arrangement of optical signalling or lighting devices, the mounting or supporting thereof or circuits therefor the devices being primarily intended to illuminate the way ahead or to illuminate other areas of way or environments the devices being headlights
    • B60Q1/14Arrangement of optical signalling or lighting devices, the mounting or supporting thereof or circuits therefor the devices being primarily intended to illuminate the way ahead or to illuminate other areas of way or environments the devices being headlights having dimming means
    • B60Q1/1415Dimming circuits
    • B60Q1/1423Automatic dimming circuits, i.e. switching between high beam and low beam due to change of ambient light or light level in road traffic
    • B60Q1/143Automatic dimming circuits, i.e. switching between high beam and low beam due to change of ambient light or light level in road traffic combined with another condition, e.g. using vehicle recognition from camera images or activation of wipers
    • BPERFORMING OPERATIONS; TRANSPORTING
    • B60VEHICLES IN GENERAL
    • B60QARRANGEMENT OF SIGNALLING OR LIGHTING DEVICES, THE MOUNTING OR SUPPORTING THEREOF OR CIRCUITS THEREFOR, FOR VEHICLES IN GENERAL
    • B60Q2300/00Indexing codes for automatically adjustable headlamps or automatically dimmable headlamps
    • B60Q2300/40Indexing codes relating to other road users or special conditions
    • B60Q2300/45Special conditions, e.g. pedestrians, road signs or potential dangers
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T2207/00Indexing scheme for image analysis or image enhancement
    • G06T2207/10Image acquisition modality
    • G06T2207/10016Video; Image sequence

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Multimedia (AREA)
  • Software Systems (AREA)
  • Mechanical Engineering (AREA)
  • Quality & Reliability (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Traffic Control Systems (AREA)
  • Lighting Device Outwards From Vehicle And Optical Signal (AREA)

Abstract

本公开涉及针对自主***和应用程序使用图像对比度分析的眩光减轻。在各种示例中,可以计算对应于使用车辆的一个或更多个传感器生成的一个或更多个图像的像素的对比度值,以检测和识别触发眩光减轻操作的对象。确定像素亮度值并基于将像素亮度值与基于一组像素和对应的亮度值的参考亮度值进行比较用于计算对比度值。对比度阈值可以应用于计算的对比度值,以识别图像数据中的眩光,从而触发眩光减轻操作,使得车辆可以修改一个或更多个照明源的配置,从而减少车辆的乘员和/或传感器所经历的眩光。

Description

针对自主***和应用程序使用图像对比度分析的眩光减轻
背景技术
自主和半自主驾驶***,以及高级驾驶员辅助***(ADAS),可以使用传感器(例如相机)来实时或近实时地形成对车辆周围环境的了解。这种了解可以包括关于对象、障碍物、路标、道路表面和/或其他标记的位置的信息。通过使用反射器、反射涂料和/或反射涂层,道路标志和表面通常设计为在弱光条件下易于被驾驶员和车辆的其他乘员看到。然而,这可能导致道路标志、指示器和/或标记在被车辆的前照灯照亮时有时会产生高度的反射光。在一些情况下,反射光会在车辆乘员的视场中或在车辆的一个或更多个相机和/或传感器的视场中引起眩光。当前照灯发出的光特别强时,例如当照亮很远的对象和/或当光从近距离反射时,这个问题可能会更加严重。强烈的眩光会导致人的视觉不适,并降低车辆传感器捕获和分析传感器数据的能力。减轻眩光影响的尝试包括基于检测眩光来停用车辆的远光灯,或者在矩阵远光灯的情况下,通过停用矩阵远光灯的定向到要排除的位置的发光部分来排除照明区域中的位置。
传统上,检测车辆中的眩光依赖于使用绝对亮度计量来测量从表面反射的发光能量。因为绝对亮度计量直接测量来自特定对象的反射光能量,所以需要了解反射光的对象的大小。为了绝对亮度测量的目的确定对象的大小需要传感和计算资源来估计对象的大小(例如,表面积),这超出了传统眩光检测解决方案中可用的范围。例如,相机图像中描绘的对象的大小可以通过将对象的位置转换为三维(3D)位置(例如,估计表面积)来确定。由于各种可能的相机取向、光学失真和/或实时距离测量,这需要额外的计算操作。此外,使用这种方法准确地执行绝对亮度测量需要额外的校准操作和相关的硬件来存储校准参数,这样相机可能需要针对已知的亮度目标进行例行校准,以在随时间推移发生传感器组件磨损和/或退化时保持准确的亮度计量。
发明内容
本公开的实施例涉及针对自主***和应用程序使用图像对比度分析的眩光减轻。公开了根据来自车辆或其他机器或***的一个或更多个传感器的传感器数据计算对比度以检测具有显著水平眩光的区域,从而可以执行减轻操作的***和方法。
与诸如上述那些的传统方法相比,本公开提供了使用相对亮度计量来检测眩光。使用所公开的方法,可以为图像的像素计算对比度值,可以对对比度值进行分析以检测眩光(例如,从标志和其他对象反射的光)。在一个或更多个实施例中,***可以接收描绘由车辆的前照灯照亮的一个或更多个对象的图像数据。图像数据中表示的像素可用于计算相对于图像数据的其他像素的对比度值。在至少一个实施例中,可以为像素计算一个或更多个局部对比度值(例如,通过计算相对于图像的全部或一部分的亮度的对比度)。
在一个或更多个实施例中,可以计算图像中的一组像素的平均亮度值以确定参考亮度。可以通过计算像素的亮度与计算的参考亮度的比率来确定局部对比度值。可以将亮度阈值应用于与一组像素相关联的局部对比度值以确定具有满足亮度阈值的对比度值的像素的数量。可以应用大小阈值来确定是否应该基于满足亮度阈值的像素的尺寸和/或数量来触发眩光减轻操作。
附图说明
下面参考附图详细描述用于针对自主***和应用程序使用图像对比度分析的眩光减轻的本***和方法,其中:
图1是根据本公开的一些实施例的用于使用传感器数据检测眩光的对比度分析***的示例***图;
图2A示出了根据本公开的一些实施例的从车辆的角度看的示例图像;
图2B示出了根据本公开的一些实施例的在眩光减轻之后从车辆的角度看的示例图像;
图3是根据本公开的一些实施例的用于确定与检测到的对象相关联的像素的局部对比度值的示例图像的可视化;
图4A-4C是根据本公开的一些实施例的将对比度分析器应用于与检测到的对象相对应的像素的示例;
图5是示出根据本公开的一些实施例的用于眩光减轻的图像对比度分析的示例方法的流程图;
图6是说明根据本公开的一些实施例的用于基于对象检测的眩光减轻的图像对比度分析的示例方法的流程图;
图7A是根据本公开的一些实施例的示例自主车辆的图示;
图7B是根据本公开的一些实施例的图7A的示例性自主车辆的相机位置和视场的示例;
图7C是根据本公开的一些实施例的图7A的示例自主车辆的示例***架构的框图;
图7D是根据本公开的一些实施例的用于基于云的服务器与图7A的示例自主车辆之间的通信的***图;
图8是适用于实现本公开的一些实施例的示例计算设备的框图;以及
图9是适用于实现本公开的一些实施例的示例数据中心的框图。
具体实施方式
公开了与针对自主***和应用程序使用图像对比度分析来减轻眩光有关的***和方法。尽管本公开可针对示例自主车辆700(在本文中也称为“车辆700”,其示例参照图7A-7D进行描述)进行描述,这并非意在限制。例如,本文所述的***和方法可以由非自主车辆、半自主车辆(例如,在一个或更多个自适应驾驶员辅助***(ADAS)中)、有人驾驶和无人驾驶机器人或机器人平台、仓库车辆、越野车辆、连接到一个或更多个拖车的车辆、飞行器、船只、穿梭车、应急响应车辆、摩托车、电动或机动自行车、飞机、工程车辆、水下航行器、无人机和/或其他车辆类型使用,但不限于此。此外,虽然本公开可针对车辆的眩光减轻进行描述,但这并非旨在限制,并且本文描述的***和方法可用于增强现实、虚拟现实、混合现实、机器人技术、安全和监视、自主或半自主机器应用和/或任何其他可能需要检测或估计眩光的技术空间,例如用于减轻或减少眩光。公开的方法可以在自主或半自主机器的控制***、自主或半自主机器的感知***、用于执行模拟操作的***、用于执行深度学习操作的***、使用边缘设备实现的***、使用机器人实现的***、结合一个或更多个虚拟机(VM)的***、至少部分在数据中心实现的***或至少部分使用云计算资源实现的***中的一个或更多个中实施。
与诸如上述那些的传统方法相比,本公开提供了使用相对亮度计量来检测眩光。使用所公开的方法,可以为图像的像素计算对比度值,并且可以进一步分析对比度值以检测眩光(例如,反射到驾驶员和/或车辆传感器的光)。在一个或更多个实施例中,***可以接收描绘由车辆的前照灯照亮的一个或更多个对象的图像数据。图像数据中表示的像素可用于计算相对于图像数据的其他像素的对比度值。在至少一个实施例中,可以为像素计算一个或更多个全局对比度值(例如,通过计算相对于所有或基本上所有图像的亮度的对比度)。在至少一个实施例中,可以为像素计算一个或更多个区域对比度值(例如,通过计算相对于包括一个或更多个像素的图像的一个或更多个区域的亮度的对比度)。在至少一个实施例中,可以为像素计算一个或更多个局部对比度值(例如,通过基于与像素的接近度或距离计算相对于图像的一个或更多个区域的亮度的对比度)。通过使用相对亮度,可以在不执行传感器校准或必须确定3D空间中对象的物理尺寸的情况下检测眩光,因为仅计算相对对比度。
在一些示例中,***可以接收使用一个或更多个相机生成的图像数据,这些相机可以放置在相对于车辆的各种位置(例如,前中心、仪表板等)。在使用多个相机的情况下,每个相机可以共享相似或不同的视场(例如,广角、长焦等)。在各种示例中,图像数据可以表示由相机捕获的具有相同分辨率的一个或更多个图像,和/或可以被下采样或上采样到不同的分辨率。在至少一个实施例中,图像数据可以包括RAW、类RAW和/或其他传感器数据,其中图像像素信号呈线性表示(例如,保留从成像传感器读取的原始像素水平)并且与光的发光强度成比例。可以使用一个或更多个不会引入显著渐晕或“透镜阴影”(角落变暗)现象的相机镜头生成图像数据,或者可以校正呈现渐晕的像素(例如,在图像信号处理器(ISP)中使用RAW上的镜头阴影校正)。
在至少一个实施例中,可以至少基于将像素亮度与一个或更多个其他像素的亮度进行比较从图像数据计算像素的对比度值。例如,可以从图像的任何数量的像素的亮度值计算一个或更多个统计值,以建立用于计算一个或更多个对比度值的参考或相对亮度。作为示例而非限制,这可以包括计算均值(平均)图像亮度水平。用于计算参考亮度的合适技术包括计算直方图或像素对比度值的均值,执行全局像素平均,和/或计算修剪后的均值(例如,在考虑中去掉较低和较高百分位数的情况下,产生在高对比度场景中更稳定的均值)。
用于计算全局对比度值的参考亮度的像素可以对应于所有或基本上所有图像。在至少一个实施例中,可以从计算参考亮度中丢弃或排除一个或更多个像素,例如异常值、对应于图像或视觉伪影的像素、感兴趣区域之外的像素(例如,将不会应用于CNN或其他MLM)等。用于计算区域对比度值的参考亮度的像素可以对应于图像的一个或更多个区域,包括一个或更多个像素(和/或对应于像素的对象的至少一部分)。例如,区域可以包括图像中50%或不同百分比的像素、图像中心区域中的像素、图像象限中的像素等)。在至少一个实施例中,区域的参考亮度可以用于至少基于被包括在区域中的像素来计算像素的对比度值(其中区域被定义而不考虑区域的位置)。可以至少基于到一个或更多个像素(和/或与像素对应的对象的至少一部分)的接近度和/或距离来选择或确定用于计算局部对比度值的参考亮度的像素。
在至少一个实施例中,***可以产生图像,其中每个像素记录对应的对比度值。可以至少基于像素值的亮度与参考亮度之间的比率(例如,均值)来计算像素的对比度值。根据选择来计算参考亮度的区域的大小(例如,半径),计算出的对比度值可能代表不同的现象。小半径(例如,<0.1%的图像尺寸)可以表示图像的清晰度,小到中等的半径(例如,<3-4%的图像尺寸)可以表示对象细节的对比度,中等半径可以表示对象的对比度,并且包含或基本上包含整个图像的大半径可以表示全局对比度。
在至少一个实施例中,诸如卷积神经网络(CNN)和/或其他机器学习模型(MLM)的对象检测器可用于检测图像数据中的一个或更多个对象(例如,道路标志、反射器、道路标记等)。例如,MLM可以预测由图像数据表示的一个或更多个图像中的一个或更多个对象位置和/或区域(例如,一个或更多个边界形状)。检测到的对象可以使用一个或更多个对象位置和/或区域与图像数据的一个或更多个像素相关联(例如,对象可以与边界形状内的一个或更多个像素相关联)。该***可以至少基于检测到的位置和/或边界形状中的一个或更多个来计算输入图像的一个或更多个像素的对比度值。例如,位置或边界形状可用于计算一个或更多个对应像素的局部、全局和/或区域对比度值。
另外或备选地,可以使用其他方法检测或选择图像的一个或更多个对象和/或区域,这些方法不一定包括机器学习。例如,图像中的像素可以使用任何合适的聚类算法进行分组,该算法可以至少基于图像特征,例如亮度、颜色值、对比度值(例如,通过首先确定全局对比度值用于分组,然后使用组确定局部对比度值)、相对辉度、相对色度、相对色调等将像素聚类到一个或更多个组中。在一个或更多个实施例中,可以为组计算对比度值(例如,应用于组中的所有像素)和/或用于组中的一个或更多个像素(例如,每个像素)。
在计算对比度值之后,***可以分析对比度值以检测眩光和/或其他照明现象。在至少一个实施例中,分析对比度值可以包括将对比度值与一个或更多个阈值进行比较。阈值可以是预先确定的和/或动态确定或计算的。作为示例而非限制,可以至少基于用于计算对比度值的一个或更多个参考亮度值来计算或选择对比度值的阈值。在至少一个实施例中,阈值可以是参考亮度的倍数,例如但不限于参考亮度的5倍、10倍或100倍。在至少一个实施例中,可以将阈值应用于对比度图像以生成阈值化对比度图像。在至少一个实施例中,阈值化对比度图像可以至少基于在计算对比度值时将一个或更多个阈值应用于对比度值而直接生成(没有初始对比度图像)。例如,对比度值高于阈值的任何像素(例如,高对比度像素)可以被保留或设置为特定值(例如,1),而对比度值低于阈值的像素(例如,低对比度像素)可以被删除或设置为特定值(例如,0)。
在一个或更多个实施例中,基于对应于具有满足阈值的对比度值的一组像素(例如,与检测到的对象相关联)的像素数量,***可以传输数据以使车辆改变车辆的一个或更多个前照灯和/或其他灯的强度(例如,增加辉度、降低辉度、停用等)或配置(例如,位置、方向、镜头焦距等)。例如,可以至少基于图像中像素组的一个或更多个位置和/或现实世界中的对应位置来修改或改变强度。
在至少一个实施例中,可以对高于阈值的像素数量进行计数或将其与特定区域中的像素数量进行比较。例如,可以将与具有高于阈值的对比度值的对象相对应的边界框或形状中的像素数量与边界框或形状中的像素数量进行比较,以确定高对比度像素与低对比度像素的比率。
在至少一个实施例中,***可以将大小阈值应用于具有满足阈值的对应对比度值的像素的数量。例如,大小阈值可以指示触发眩光减轻或其他照明操作所需的最小像素数。在一些示例中,可以基于像素的数量、像素占据的区域的尺寸(例如,满足阈值的像素占据的边界框或子区域)、一个或更多个图像的一个或更多个尺寸和/或用于确定与像素相关联的大小的任何合适的方法来应用大小阈值。例如,可以将边界框内具有高于阈值的对比度值的像素的比率与边界框的一个或更多个尺寸进行比较。
如本文所述,***可以传输使车辆或机器执行试图减轻眩光的操作的数据。例如,基于像素对比度值,可以传输使车辆修改或改变一个或更多个照明源(例如,前照灯、雾灯等)以减轻检测到的眩光的数据。在一些示例中,减轻眩光可涉及修改前照灯的一个或更多个元件的配置。例如,基于检测眩光,矩阵光束前照灯——具有多个可独立配置的照明元件,照亮车辆环境的一部分——可以停用和/或降低与对应于图像数据的高对比度像素的物理位置相关联的一个或更多个照明元件的强度。
参考图1,图1是根据本公开的一些实施例的用于使用传感器数据检测眩光的对比度分析***100(也称为“***100”)的示例***图。应当理解,本文描述的这种和其他布置仅作为示例阐述。除了所示的那些之外或代替所示的那些,可以使用其他布置和元素(例如,机器、接口、功能、命令、功能分组等),并且可以完全省略一些元素。此外,本文描述的许多元素是功能实体,它们可以实现为离散或分布式组件或与其他组件结合,并以任何合适的组合和位置实现。本文描述为由实体执行的各种功能可以由硬件、固件和/或软件来执行。例如,可以通过处理器执行存储在存储器中的指令来执行各种功能。在一些实施例中,本文描述的***、方法和过程可以使用与图7A-7D的示例性自主车辆700、图8的示例计算设备800和/或图9的示例数据中心900的组件、特征和/或功能相似的组件、特征和/或功能来执行。
对比度分析***100可以包括传感器数据102、照明分析器104、对象检测器120、去眩光管理器130、位置计算器124、一个或更多个控制组件140和一个或更多个前照灯150(或更一般地照明元件)等。对比度分析***100可以执行用于从一个或更多个传感器生成和/或接收传感器数据102的操作。作为非限制性示例,传感器数据102可以从车辆(例如,图7A-7D和本文描述的车辆700)的一个或更多个传感器接收。传感器数据102可以包括但不限于来自车辆700的传感器的任何组合的传感器数据的一个或更多个部分,包括例如并参考图7A-7D,全球导航卫星***(GNSS)传感器758(例如,全球定位***传感器),雷达(RADAR)传感器760,超声波传感器762,激光雷达(LIDAR)传感器764,惯性测量单元(IMU)传感器766(例如,加速度计、陀螺仪、磁罗盘、磁力计等)、麦克风796、立体相机768、广角相机770(例如鱼眼相机)、红外相机772、环绕相机774(例如360度相机)、远程和/或中程相机798、速度传感器744(例如,用于测量车辆700的速度)和/或其他传感器类型。
另外或替代地,传感器数据102可以包括从虚拟车辆或虚拟(例如,测试)环境中的其他虚拟对象的任何数量的传感器生成的虚拟(例如,模拟的或增强的)传感器数据。在这样的示例中,虚拟传感器可以对应于模拟环境中的虚拟车辆或其他虚拟对象(例如,用于测试、训练和/或验证神经网络性能),并且虚拟传感器数据可以表示通过模拟或虚拟环境中的虚拟传感器捕获的传感器数据。这样,通过使用虚拟传感器数据,可以使用来自模拟环境的模拟数据和/或增强的现实世界数据来测试、训练和/或验证本文描述的机器学习模型122,这可以允许在实际环境之外测试更极端的场景,在实际环境中此类测试可能不太安全。
在一些实施例中,传感器数据102可以包括表示图像的图像数据、表示视频的图像数据(例如,视频的快照)和/或表示传感器的感觉场的表示的传感器数据(例如,LiDAR传感器的深度图、超声波传感器的值图等)。在传感器数据102包括图像数据的情况下,可以使用任何类型的图像数据格式,例如但不限于,压缩图像,例如联合图像专家组(JPEG)或亮度/色度(YUV)格式的压缩图像,作为源自诸如H.264/高级视频编码(AVC)或H.265/高效视频编码(HEVC)的压缩视频格式的帧的压缩图像,原始图像(例如源自红色透明透明蓝色(RCCB)、红色透明透明透明(RCCC)、红色绿色绿色蓝色(RGGB)或其他类型的成像传感器),和/或其他格式。此外,在一些示例中,传感器数据102可以在***100内使用而无需任何预处理(例如,以原始或捕获格式),而在其他示例中,传感器数据102可以经历预处理(例如,噪声平衡、去马赛克、缩放、裁剪、增强、白平衡、色调曲线调整等,例如使用传感器数据预处理器(未示出))。如本文所使用的,传感器数据102可以参考未处理的传感器数据、预处理的传感器数据或其组合。
参考照明分析器104,照明分析器104除其他外可包括用于测量和/或计算由图像数据表示的对比度的一个或更多个组件。例如,照明分析器104可以用于为诸如传感器数据102之类的图像数据提供对比度值。在一些实施例中,照明分析器104可以包括亮度分析器106、对比度分析器108和/或对比度阈值器110。尽管在图1中仅示出了照明分析器104的几个组件和/或特征,这不是限制性的。例如,照明分析器104可以包括附加的或替代的组件,例如下文关于图7A-7D的示例性自主车辆700所描述的那些。
亮度分析器106可以包括一个或更多个组件,用于从图像数据的一个或更多个像素执行亮度值的测量和/或提取。例如,可以为包括在代表传感器数据102的图像数据中的一个或更多个像素确定亮度值。在至少一个实施例中,亮度分析器106可以确定图像的每个像素的亮度值。例如,由传感器数据102表示的图像可以具有与该特定图像中的每个像素相关联的亮度值。在至少一个实施例中,可以选择少于图像中每个像素的像素数量,并且可以由亮度分析器106确定相应的亮度值。例如,可以根据由对象检测器120和/或MLM 122指示的传感器数据的一部分来确定亮度值102。例如,对象检测器120可以将与检测到的对象相关联的信息(例如,对象位置、对象定位、分类、标签、特征和/或关于检测到的对象的其他相关信息)提供给照明分析器104,照明分析器104可以使用所提供的信息来确定要对其确定对亮度和/或对比度值的像素(例如,表示对象的像素、接近对象的像素等)的选择。
对比度分析器108可以使用由亮度分析器106确定的像素亮度值来计算对应于图像像素(例如,全局、区域和/或局部)的对比度值。例如,对比度分析器108可以根据一组像素的平均亮度值(或本文描述的其他统计值)评估特定像素的亮度值,例如图像中每个像素的平均亮度值。在一些实施例中,对比度分析器108可以计算一组像素的平均亮度值作为参考亮度。尽管本文描述了像素亮度值的平均值,但其并非意在限制,并且本文考虑用于计算参考亮度的任何合适的技术,包括计算直方图平均值、执行全局像素平均和/或计算修整的均值。例如,对比度分析器108可以通过计算对应于检测到的对象和到检测到的对象的特定接近度和/或距离半径内的区域的一组像素的亮度值的直方图或均值来确定参考亮度。参考亮度可用于计算图像中一个或更多个像素的对比度值。对比度分析器108可以计算像素的对比度值,其表示为特定像素的亮度值和参考亮度之间的比率或其他关系。
对比度阈值器110可以包括一个或更多个组件,用于应用对比度阈值以确定具有满足对比度阈值的对应对比度值的一组像素。在至少一个实施例中,对比度阈值是预先确定的。例如,对比度阈值可以被确定为眩光对于观察者来说可能变得不舒服的值(例如,相对于参考亮度的5倍、10倍、100倍等)和/或任何眩光可能破坏传感器捕获传感器数据的能力的值。对比度阈值可以预先确定或基于亮度分析器106确定的像素亮度值动态确定。对比度阈值器110可以从对比度分析器108接收与一组像素相关联的对比度值。例如,对比度阈值器110可以计数或确定具有高于阈值的相对对比度值的像素的数量。
现在参考对象检测器120,除其他外,对象检测器120可以包括用于检测图像数据中的一个或更多个对象(例如,道路标志、反射器、道路标记等)的一个或更多个组件。在一些实施例中,对象检测器120可以使用卷积神经网络(CNN)和/或其他机器学习模型(MLM)来检测图像数据中的一个或更多个对象(例如,道路标志、反射器、道路标记等)。例如,对象检测器120可以使用一个或更多个MLM 122来检测传感器数据102中(例如,图像中)的对象。在至少一个实施例中,对象检测器120可以使用不一定依赖MLM 122的方法来检测一个或更多个对象。例如,对象检测器120可以通过聚类和分析与由传感器数据102表示的图像的像素相对应的诸如亮度、颜色值、对比度值、相对辉度、相对色度、相对色调等特征来检测对象。
在MLM 122可用于检测图像中的一个或更多个对象的情况下,传感器数据102和/或从其导出的数据可应用于MLM 122以预测由传感器数据102表示为包含对象的一个或更多个图像中的一个或更多个对象位置和/或区域。检测到的对象可以使用一个或更多个对象位置和/或区域与图像数据的一个或更多个像素相关联(例如,对象可以与边界形状或框内的一个或更多个像素相关联)。对比度分析器108可以至少基于检测到的位置和/或边界形状中的一个或更多个来计算输入图像的一个或更多个像素的对比度值。例如,位置或边界形状可用于计算一个或更多个对应像素的局部、全局和/或区域对比度值。
现在参考位置计算器124,位置计算器可以包括被配置为确定检测到的对象的一个或更多个2D和/或3D位置的一个或更多个组件。例如,位置计算器124可以接收由对象检测器120检测到的一个或更多个对象的指示,并且可以确定一个或更多个检测到的对象的定位和/或到一个或更多个检测到的对象的距离。在一个或更多个实施例中,这可以包括对来自MLM 122的预测数据进行后处理。在一些实施例中,位置计算器124可以确定一个或更多个检测到的对象相对于自主机器(诸如图7A-7D的自主车辆700)的定位。例如,位置计算器124可以计算从车辆到检测到的对象(例如标志)的距离,并生成与计算出的标志相对于车辆的位置相关联的信息(例如,距离、相对于车辆行驶方向的角度、对象的高度、对象的大小等)。在一些实施例中,位置计算器124可以将与一个或更多个检测到的对象相关联的定位信息提供给去眩光管理器130。
去眩光管理器130可以包括一个或更多个组件,用于至少基于与对应于传感器数据102的图像的像素相对应的相对对比度值来确定要执行的眩光减轻操作。例如,基于由照明分析器104计算的对比度值,去眩光管理器130可以将传感器数据102中表示的一个或更多个对象确定为眩光减轻操作的候选对象,从而触发眩光减轻操作。在一些实施例中,去眩光管理器130可以基于将大小阈值应用于与对象相关联的像素来确定传感器数据102中表示的对象作为眩光减轻操作的候选对象。例如,去眩光管理器130可以基于对象的大小和/或超过对比度阈值(例如,如对比度阈值器110所指示的那样)的像素数量来确定应该与检测到的对象相关联地执行眩光减轻操作。例如,在一个或更多个实施例中,可以仅在与对象相关联的高对比度像素的数量满足最小数量时执行眩光减轻操作。在一些示例中,如果不满足大小阈值,即使与检测到的对象相关联的所有像素的对比度值都高于对比度阈值,也不会触发眩光减轻操作。
在至少一个实施例中,去眩光管理器130可以接收与一个或更多个检测到的对象相关联的定位信息。在至少一个实施例中,来自位置计算器124的定位信息可用于确定检测到的对象是否满足大小阈值。例如,可以使用由位置计算器124确定的到对象的距离并基于传感器数据102来估计对象的大小。在至少一个实施例中,去眩光管理器130可以接收来自位置计算器124的与计算的检测到的对象的3D位置相对应的信息。去眩光管理器130可以使用来自位置计算器124的定位信息来确定要执行的眩光减轻操作。例如,如果来自位置计算器124的定位信息基于检测到的对象、车辆乘员、车辆传感器和/或一个或更多个前照灯150的定位表明由前照灯150发出的光可以在车辆的乘员或传感器的方向上从反射的对象反射的可能性,则可以触发眩光减轻操作(例如,减少对前照灯的一个或更多个元件的照明功率)。作为示例,去眩光管理器130可以估计检测到的标志和前照灯150之间的一个或更多个距离和/或角度和/或车辆的特定部分的位置,例如传感器或潜在驾驶员/乘员的位置。
在一些实施例中,基于去眩光管理器130确定应当与检测到的对象相关联地执行眩光减轻操作,去眩光管理器130可以向一个或更多个控制组件140提供与检测到的对象相关联的信息,该信息可以引起对一个或更多个前照灯150的修改(例如,控制改变)。例如,去眩光管理器130可以向一个或更多个控制组件140提供眩光诱导对象的定位的指示以引起对前照灯150的至少一个照明元件的调整。
前照灯150可以包括一个或更多个与自主机器(例如图7A-7D的自主车辆700)相关联的照明源。尽管本文描述了朝前的前照灯,但这并不旨在进行限制,并且本文设想了任何其他光源或光源的取向。例如,前照灯150可以包括近光前照灯、远光前照灯、雾灯、行车灯、危险灯、信号灯和/或任何其他照明源(例如,能够将光反射回车辆700的乘客和/或传感器或以其他方式引起或促成眩光的照明源)。在一些实施例中,前照灯150可以发射具有在可见光谱之外的波长的光(例如,人眼可见的)。例如,前照灯150可以发射不可见辐射或不可见光(例如,对人眼),例如红外光(IR)。前照灯150可以包括一个或更多个可独立配置的照明元件。例如,前照灯150可以包括以矩阵布置(例如,网格)布置的多个照明元件。在这样的示例中,每个照明元件可以单独配置或与一个或更多个其他元件相关联地配置。例如,可以通过激活/停用发射光、增加或降低元件的照明功率、调整投射光的方向或焦点、或配置的任何组合来配置单个照明元件。通过修改前照灯150的一个或更多个照明元件的配置,可以减轻由对象反射的眩光。例如,如果从标志检测到眩光,则照亮标志的照明元件可以被停用或投射远离标志(例如,同时保持标志或其他对象周围的照明)。
作为非限制性示例,并且关于图2A-2B,图2A-2B用于说明根据本公开的至少一些实施例的示例眩光减轻。例如,图2A图示了从诸如车辆700之类的车辆的角度(例如,其相机的视角)看的示例图像200A,并且图2B示出了根据本公开的一些实施例的在眩光减轻之后从车辆700的角度看的示例图像200B。
作为示例,车辆700可以在道路204上,道路204包括诸如路面标记、车辆、行人、障碍物、视觉指示器和/或诸如道路标志206之类的标志的对象。道路204可以是由一个或更多个照明源(例如可对应于图1的一个或更多个前照灯150的前照灯240)完全或部分地照明。照明源可以被划分和/或分组为可以单独和/或集体控制的照明元件。例如,前照灯240可以包括多个照明元件中的任何一个,例如照明元件242A-242H。尽管前照灯240被描绘为具有8个元件,但这并不意在限制并且本文设想了照明元件的任何数量和/或定位布置。
照明源可以使照明覆盖区210与道路204相关联地投射或投影,使得道路204可以被至少部分地照明。照明覆盖区210的部分可以对应于照明源的至少一个发光元件。例如,光束段212的每个光束段可以对应于诸如光元件242A-242H的光元件。在一些示例中,降低功率和/或停用特定的光元件可能导致相关的光束段在道路204上具有降低的照明效果。例如,如图2B所示并由图像200B反射,光元件242A和242B已被停用,导致光束段212的一部分停止照亮道路标志206。在该示例中,由于与光束段212的对应于道路标志206的该部分相关联的光元件242A和242B已经被停用,则由投射在道路标志206上的前照灯240引起的眩光对于车辆700的传感器和/或乘员可以被减少或消除。
现在参考图3,图3图示了根据本公开的一些实施例的用于确定与检测到的对象相关联的像素的局部对比度值的示例图像300的可视化。图像300包括可以使用图1的对象检测器120检测的检测到的对象310(例如,标志)。如本文所述,对象检测器120可以指示与检测到的对象310相关联的边界形状(例如边界框330)的尺寸和/或位置中的一个或更多个。边界框330可以定义包括与图像300相关联的一个或更多个像素的图像300的区域。图像300还可以包括局部对比区域320,该局部对比区域320可以与边界框330相关联地定位或定义。局部对比区域320可以包括可用于计算参考亮度的图像300的一个或更多个像素,该参考亮度用于确定边界框330内的一个或更多个像素(例如,每个像素)的局部对比度值(如本文所述)。
可以将边界框330的一个或更多个尺寸与一个或更多个大小阈值进行比较以确定是否触发眩光减轻或其他照明操作。例如,图1的去眩光管理器130,可以将大小阈值应用于边界框330的尺寸。大小阈值(例如,指示最小大小或尺寸)可以应用于边界框330的水平和/或垂直分量。例如,水平大小阈值350A可应用于水平对象大小340A和/或垂直大小阈值350B可应用于垂直对象大小340B。在一些实施例中,如果水平对象大小340A超过水平大小阈值350A并且如果垂直对象大小340B超过垂直大小阈值350B,则可以触发眩光减轻操作。在一些实施例中,如果水平对象大小340A超过水平大小阈值350A或垂直对象大小340B超过垂直大小阈值350B,则可以触发眩光减轻操作。在一些实施例中,垂直对象大小340B和水平对象大小340A可用于确定可与阈值面积(例如,触发眩光减轻操作所需的最小面积)进行比较的。例如,可以将垂直对象大小340B和水平对象大小340A相乘以确定可以与通过将垂直大小阈值350B和水平大小阈值350A相乘而计算的面积进行比较的对象面积。
现在参考图4A-4C,图4A-4C图示了根据本公开的至少一些实施例的对与检测到的对象310相对应的像素应用图1的照明分析器104的示例。图4A图示了图2A的图像200A的可以对应于图1的传感器数据102的区域410。例如,区域410可以包括由传感器数据102表示的像素的一部分。在一些实施例中,区域410包括与在传感器数据102中检测到的对象310相关联的一个或更多个像素。例如,对象检测器图120可以提供与检测到的对象相关联的像素的尺寸、位置和/或其他指示。例如,对象检测器120可以生成对应于检测到的对象(例如,道路标志、车辆、行人等)的边界形状并确定边界形状内的一组像素。可以将该组像素提供给照明分析器104。使用亮度分析器106,可以确定亮度值的确定(例如,单独地针对每个像素)。例如,图4A中的区域410可以对应于检测到的标志的边界框330,该检测到的标志包括一组像素,每个像素具有对应的亮度值,如亮度值420A所指示的(例如,每平方米10K坎德拉“cd/m2”)。使用区域410的亮度值420A,对比度分析器108可以通过将对应的亮度值与参考亮度进行比较来计算每个对比度值。
图4B图示了可以使用亮度值420A计算的对比度值420B的示例。在至少一个实施例中,特定像素的对比度值420B的对比度值可以通过计算该特定像素的亮度值与所确定的一组像素的参考亮度(例如,均值)之间的比率来确定,如本文所述。例如,确定参考亮度可以基于选择图像200A的区域。可选择图像200A的区域以捕捉与图像200A内的一个或更多个对象相关联的相对对比度的细节。例如,可以使用各种大小的半径(例如,小半径、小到中等半径、中等半径、大半径等)来确定用于通过平均和/或计算集中趋势来确定参考亮度的该组像素。例如,图3的局部对比区域320可用于根据对应区域内的像素确定参考亮度。如图4B所示,可以为区域410的每个像素确定对比度值。例如,在如图4B所示的示例中,在该非限制性示例中,像素集合中的每个像素与通过确定对应亮度值420A与参考亮度75cd/m2的比率而计算的对比度值相关联。
图4C示出了阈值420V的示例,其可以通过将阈值操作应用于对比度值420C而得到。阈值化操作可以由图1的对比度阈值器110执行。在图4C所示的非限制性示例中,阈值100被应用于对比度值420C的每个对比度值。在一个或更多个实施例中,仅具有满足阈值100的对比度值的区域410的像素将被保留或以其他方式识别为满足对比度阈值。作为示例,可以为具有满足阈值的对比度值420C的像素分配值1,而可以为具有不满足阈值的对比度值420C的像素分配值0,或者以其他方式否定或指示。区域410中满足阈值的像素数量可以被确定并且可以用于眩光减轻操作,例如由图1的去眩光管理器130、控制组件140和/或前照灯150用于眩光减轻操作。
现在参考图5,本文描述的方法500的每个块包括可以使用硬件、固件和/或软件的任何组合来执行的计算过程。例如,可以通过处理器执行存储在存储器中的指令来执行各种功能。该方法还可以体现为存储在计算机存储介质上的计算机可用指令。这些方法可以由独立应用程序、服务或托管服务(独立或与另一个托管服务组合)或另一个产品的插件提供,仅举几例。此外,通过示例的方式,关于图1的对比度分析***描述了方法500。然而,这些方法可以附加地或替代地由任何一个***或***的任何组合执行,包括但不限于本文所述的那些。
图5是示出根据本公开的一些实施例的用于减少眩光的图像对比度分析的方法500的流程图。在框B502,方法500包括接收表示描绘一个或更多个对象的一个或更多个图像的图像数据。例如,传感器数据102可以由照明分析器104和对象检测器120接收。
在框B504,方法500包括使用图像数据计算对应于一个或更多个对象的一个或更多个像素的一个或更多个对比度值。例如,对比度分析器108可以确定使用传感器数据102表示的像素的对比度值,该像素对应于可以由对象检测器120检测到的一个或更多个对象。
在框B506,方法500包括传输数据以使机器至少基于对对比度值集合的分析来执行一个或更多个操作。例如,基于由照明分析器104确定的对比度值,一个或更多个控制组件140可以执行操作,例如调整、修改或控制前照灯150。
现在参考图6,本文描述的方法600的每个块包括可以使用硬件、固件和/或软件的任何组合来执行的计算过程。例如,可以通过处理器执行存储在存储器中的指令来执行各种功能。该方法还可以体现为存储在计算机存储介质上的计算机可用指令。这些方法可以由独立应用程序、服务或托管服务(独立或与另一个托管服务组合)或另一个产品的插件提供,仅举几例。此外,作为示例,相对于图1的对比度分析***描述了方法600。然而,这些方法可以附加地或替代地由任何一个***或***的任何组合执行,包括但不限于本文所述的那些。
图6是示出根据本公开的一些实施例的用于基于对象检测的眩光减轻的图像对比度分析的方法600的流程图。在框B602,方法600包括接收表示一个或更多个图像的图像数据。例如,照明分析器104可以接收传感器数据102。
在框B604,方法600包括检测一个或更多个对象。例如,使用传感器数据102,对象检测器120可以检测传感器数据102中表示的一个或更多个对象。
在框B606,方法600包括在一个或更多个图像中确定对应于一个或更多个对象的感兴趣区域。例如,对象检测器120可以确定感兴趣区域,该感兴趣区域指示对应于在传感器数据102中检测到的一个或更多个对象的像素。
在框B608,方法600包括使用图像数据计算一个或更多个图像中的一个或更多个像素的一个或更多个对比度值。例如,照明分析器104的对比度分析器108可以确定由传感器数据102表示的像素的对比度值。在一个或更多个实施例中,对比度值的计算可以限于或以其他方式至少基于感兴趣区域或检测到的感兴趣对象的区域(例如,标志)。例如,计算局部对比度值可能需要大量计算(因为每个像素可能取决于所有周围的像素),并且限制所分析的像素可以节省计算资源。
在框B610,方法600包括从对应于感兴趣区域的一个或更多个对比度值分析对比度值集合。例如,对比度阈值器110可以分析对应于由对象检测器120确定的感兴趣区域的一个或更多个像素的一个或更多个对比度值。
在框B612,方法600包括传输数据以使机器至少基于对对比度值集合的分析来执行一个或更多个操作。例如,基于从照明分析器104分析的对比度值,控制组件140可以执行诸如控制前照灯150的一个或更多个元件的配置的操作。
示例自主车辆
图7A是根据本公开的一些实施例的示例自主车辆700的图示。自主车辆700(可替代地,在本文称为“车辆700”)可以包括但不限于,客运车辆,如小汽车、卡车、公共汽车、第一响应车辆、摆渡车、电动或机动自行车、摩托车、消防车、警用车辆,救护车、船、施工车辆、水下船只、无人机、与拖车相连的车辆和/或另一类型的车辆(例如,无人驾驶的和/或容纳一个或更多个乘客的车辆)。自主车辆通常按照美国运输部的一个部门——国家公路交通安全管理局(NHTSA)以及汽车工程师协会(SAE)“Taxonomy and Definitions for TermsRelated to Driving Automation Systems for On-Road Motor Vehicles”(2018年6月15日发布的标准No.J3016-201806,2016年9月30日发布的标准No.J3016-201609,以及该标准的先前和未来的版本)定义的自动化级别进行描述。车辆700可能够实现符合自主驾驶级别的3级-5级中的一个或更多个的功能。车辆700可以能够根据自动驾驶级别的1级-5级中的一个或更多个来发挥功能。例如,取决于实施例,车辆700可能能够提供驾驶员辅助(1级)、部分自动化(2级)、条件自动化(3级)、高自动化(4级)和/或全自动化(5级)。如本文所用,术语“自主”可包括车辆700或其他机器的任何和/或所有类型的自主,例如完全自主、高度自主、有条件自主、部分自主、提供辅助自主、是半自主的、主要是自主的或其他指定。
车辆700可以包括诸如底盘、车身、车轮(例如2个、4个、6个、8个、18个等)、轮胎、车轴之类的部件以及车辆的其他部件。车辆700可以包括推进***750,例如内燃机、混合动力发电厂、全电动发动机和/或另一种推进***类型。推进***750可以连接到可以包括变速器的车辆700的传动系以便实现车辆700的推进。可以响应于接收到来自油门/加速器752的信号而控制推进***750。
可以包括方向盘的转向(steering)***754可以用来在推进***750操作时(例如在车辆运动时)使车辆700转向(例如沿着希望的路径或路线)。转向***754可以接收来自转向致动器756的信号。对于全自动(5级)功能而言,方向盘可以是可选的。
制动传感器***746可以用来响应于接收到来自制动致动器748和/或制动传感器的信号而操作车辆制动器。
可以包括一个或更多个片上***(SoC)704(图7C)和/或一个或更多个GPU的一个或更多个控制器736可以向车辆700的一个或更多个部件和/或***提供(例如表示命令的)信号。例如,一个或更多个控制器可以发送经由一个或更多个制动致动器748操作车辆制动器、经由一个或更多个转向致动器756操作转向***754、经由一个或更多个油门/加速器752操作推进***750的信号。一个或更多个控制器736可以包括一个或更多个板载(例如集成)计算设备(例如超级计算机),所述计算设备处理传感器信号并且输出操作命令(例如表示命令的信号),以实现自主驾驶和/或辅助人类驾驶员驾驶车辆700。一个或更多个控制器736可以包括用于自主驾驶功能的第一控制器736、用于功能性安全功能的第二控制器736、用于人工智能功能(例如计算机视觉)的第三控制器736、用于信息娱乐功能的第四控制器736、用于紧急情况下的冗余的第五控制器736和/或其他控制器。在一些示例中,单个控制器736可以处理上述功能中的两个或更多,两个或更多控制器736可以处理单个功能,和/或其任意组合。
一个或更多个控制器736可以响应于接收自一个或更多个传感器的传感器数据(例如传感器输入),提供用于控制车辆700的一个或更多个部件和/或***的信号。传感器数据可以接收自例如且不限于全球导航卫星***传感器758(例如全球定位***传感器)、RADAR传感器760、超声传感器762、LIDAR传感器764、惯性测量单元(IMU)传感器766(例如加速度计、陀螺仪、磁罗盘、磁力计等)、麦克风796、立体相机768、广角相机770(例如鱼眼相机)、红外相机772、环绕相机774(例如360度相机)、远程和/或中程相机798、速度传感器744(例如用于测量车辆700的速率)、振动传感器742、转向传感器740、制动传感器(例如作为制动传感器***746的部分)和/或其他传感器类型。
控制器736中的一个或更多个可以接收来自车辆700的仪表组732的输入(例如由输入数据表示),并且经由人机接口(HMI)显示器734、听觉信号器、扬声器和/或经由车辆700的其他部件提供输出(例如输出数据、显示数据等表示的)。这些输出可以包括诸如车辆速度、速率、时间、地图数据(例如图7C的HD地图722)、位置数据(例如,车辆700例如在地图上的位置)、方向、其他车辆的位置(例如占用网格)之类的信息,如控制器736所感知的关于对象和对象状态的信息等等。例如,HMI显示器734可以显示关于一个或更多个对象(例如街道指示牌、警示牌、交通灯变化等)的存在性的信息和/或关于车辆已经做出、正在做出或者将会做出的驾驶机动的信息(例如现在变道、两英里后离开34B,等等)。
车辆700还包括网络接口724,其可以使用一个或更多个无线天线726和/或调制解调器通过一个或更多个网络通信。例如,网络接口724可能够通过LTE、WCDMA、UMTS、GSM、CDMA2000等通信。一个或更多个无线天线726也可以使用诸如蓝牙、蓝牙LE、Z波、ZigBee等等之类的一个或更多个局域网和/或诸如LoRaWAN、SigFox等等之类的一个或更多个低功率广域网(LPWAN)实现环境中的对象(例如车辆、移动设备等等)之间的通信。
图7B为根据本公开一些实施例的用于图7A的示例自主车辆700的相机位置和视场的示例。相机和各自的视场是一个示例实施例,并不意图是限制性的。例如,可以包括附加的和/或可替换的相机,和/或这些相机可以位于车辆700上的不同位置。
用于相机的相机类型可以包括但不限于可以适于与车辆700的部件和/或***一起使用的数字相机。所述相机可以在汽车安全完整性级别(ASIL)B下和/或在另一个ASIL下操作。相机类型可以具有任何图像捕获率,例如60帧每秒(fps)、120fps、240fps等等,这取决于实施例。相机可能够使用滚动快门、全局快门、另一种类型的快门或者其组合。在一些示例中,滤色器阵列可以包括红白白白(RCCC)滤色器阵列、红白白蓝(RCCB)滤色器阵列、红蓝绿白(RBGC)滤色器阵列、Foveon X3滤色器阵列、拜耳传感器(RGGB)滤色器阵列、单色传感器滤色器阵列和/或另一种类型的滤色器阵列。在一些实施例中,诸如具有RCCC、RCCB和/或RBGC滤色器阵列的相机之类的清晰像素相机可以用在提高光敏感度的努力中。
在一些示例中,所述相机中的一个或更多个可以用来执行高级驾驶员辅助***(ADAS)功能(例如作为冗余或故障安全设计的部分)。例如,可以安装多功能单目相机以提供包括车道偏离警告、交通指示牌辅助和智能前照灯控制在内的功能。所述相机中的一个或更多个(例如全部相机)可以同时记录和提供图像数据(例如视频)。
所述相机中的一个或更多个可以安装在诸如定制设计的(3-D打印的)组件之类的安装组件中,以便切断可能干扰相机的图像数据捕获能力的杂散光和来自汽车内的反射(例如挡风玻璃镜中反射的来自仪表板的反射)。关于翼镜安装组件,翼镜组件可以是定制3-D打印的,使得相机安装板匹配翼镜的形状。在一些示例中,一个或更多个相机可以集成到翼镜中。对于侧视相机而言,一个或更多个相机也可以集成到驾驶室每个拐角的四根柱子内。
具有包括车辆700前面的环境部分的视场的相机(例如前置相机)可以用于环视,以帮助识别前向路径和障碍,以及在一个或更多个控制器736和/或控制SoC的帮助下辅助提供对于生成占用网格和/或确定优选车辆路径至关重要的信息。前置相机可以用来执行许多与LIDAR相同的ADAS功能,包括紧急制动、行人检测和碰撞避免。前置相机也可以用于ADAS功能和***,包括车道偏离警告(“LDW”)、自主巡航控制(“ACC”),和/或诸如交通指示牌识别之类的其他功能。
各种各样的相机可以用于前置配置中,包括例如包括CMOS(互补金属氧化物半导体)彩色成像仪在内的单目相机平台。另一个示例可以是广角相机770,其可以用来感知从周边进入视场的对象(例如行人、十字路***通或者自行车)。尽管图7B中图示出仅仅一个广角相机,但是在车辆700上可以存在任意数量的广角相机770。此外,远程相机798(例如长视立体相机对)可以用于基于深度的对象检测,尤其是用于尚未针对其训练神经网络的对象。远程相机798也可以用于对象检测和分类以及基本的对象追踪。
一个或更多个立体相机768也可以包括在前置配置中。立体相机768可以包括集成控制单元,该单元包括可扩展处理单元,其可以提供在单个芯片上具有集成的CAN或以太网接口的多核微处理器和可编程逻辑(FPGA)。这样的单元可以用来生成车辆环境的3-D地图,包括针对图像中的所有点的距离估计。可替代的立体相机768可以包括紧凑型立体视觉传感器,其可以包括两个相机镜头(左右各一个)以及可以测量从车辆到目标对象的距离并且使用生成的信息(例如元数据)激活自主紧急制动和车道偏离警告功能的图像处理芯片。除了本文所描述的那些之外或者可替代地,可以使用其他类型的立体相机768。
具有包括车辆700的侧面的环境部分的视场的相机(例如侧视相机)可以用于环视,提供用来创建和更新占用网格以及生成侧撞击碰撞警告的信息。例如,环绕相机774(例如如图7B中所示的四个环绕相机774)可以置于车辆700上。环绕相机774可以包括广角相机770、鱼眼相机、360度相机和/或类似物。四个示例,四个鱼眼相机可以置于车辆的前面、后面和侧面。在一种可替代的布置中,车辆可以使用三个环绕相机774(例如左边、右边和后面),并且可以利用一个或更多个其他相机(例如前向相机)作为第四环视相机。
具有包括车辆700的后面的环境部分的视场的相机(例如后视相机)可以用于辅助停车、环视、后面碰撞警告以及创建和更新占用网格。可以使用各种各样的相机,包括但不限于也适合作为如本文所描述的前置相机(例如远程和/或中程相机798、立体相机768、红外相机772等等)的相机。
图7C为根据本公开一些实施例的用于图7A的示例自主车辆700的示例***架构的框图。应当理解,这种布置和本文描述的其他布置仅仅作为示例而被阐述。除了所示的那些之外或者代替它们的是,可以使用其他的布置和元素(例如机器、接口、功能、顺序、功能分组等等),并且一些元素可以完全省略。进一步,许多本文描述的元素是功能实体,其可以实现为分立的或分布式部件或者结合其他部件实现,以及以任何适当的组合和位置实现。本文描述为由实体执行的各个功能可以通过硬件、固件和/或软件实现。例如,各个功能可以通过处理器执行存储在内存中的指令而实现。
图7C中车辆700的部件、特征和***中的每一个被图示为经由总线702连接。总线702可以包括控制器区域网络(CAN)数据接口(可替代地,本文称为“CAN总线”)。CAN可以是车辆700内部的网络,用来辅助控制车辆700的各种特征和功能,例如制动器、加速、制动、转向、挡风玻璃雨刷等等的驱动。CAN总线可以被配置为具有数十或者甚至数百个节点,每个节点具有其自己的唯一标识符(例如CAN ID)。可以读取CAN总线以找到方向盘角度、地速、每分钟发动机转速(RPM)、按钮位置和/或其他车辆状态指示符。CAN总线可以是ASIL B兼容的。
尽管这里将总线702描述为CAN总线,但是这并不意图是限制性的。例如,除了CAN总线之外或者可替代地,可以使用FlexRay和/或以太网。此外,尽管用单条线来表示总线702,但是这并不意图是限制性的。例如,可以存在任意数量的总线702,其可以包括一条或更多条CAN总线、一条或更多条FlexRay总线、一条或更多条以太网总线和/或一条或更多条使用不同协议的其他类型的总线。在一些示例中,两条或更多总线702可以用来执行不同的功能,和/或可以用于冗余。例如,第一总线702可以用于碰撞避免功能,并且第二总线702可以用于驱动控制。在任何示例中,每条总线702可以与车辆700的任何部件通信,并且两条或更多总线702可以与相同的部件通信。在一些示例中,车辆内的每个SoC 704、每个控制器736和/或每个计算机可以有权访问相同的输入数据(例如来自车辆700的传感器的输入),并且可以连接到诸如CAN总线之类的公共总线。
车辆700可以包括一个或更多个控制器736,例如本文关于图7A所描述的那些控制器。控制器736可以用于各种各样的功能。控制器736可以耦合到车辆700的任何其他不同的部件和***,并且可以用于车辆700的控制、车辆700的人工智能、用于车辆700的信息娱乐和/或类似物。
车辆700可以包括一个或更多个片上***(SoC)704。SoC 704可以包括CPU 706、GPU 708、处理器710、高速缓存712、加速器714、数据存储716和/或未图示出的其他部件和特征。在各种各样的平台和***中,SoC 704可以用来控制车辆700。例如,一个或更多个SoC704可以在***(例如车辆700的***)中与HD地图722结合,所述HD地图可以经由网络接口724从一个或更多个服务器(例如图7D的一个或更多个服务器778)获得地图刷新和/或更新。
CPU 706可以包括CPU簇或者CPU复合体(可替代地,本文称为“CCPLEX”)。CPU 706可以包括多个核和/或L2高速缓存。例如,在一些实施例中,CPU 706在一致性多处理器配置中可以包括八个核。在一些实施例中,CPU 706可以包括四个双核簇,其中每个簇具有专用的L2高速缓存(例如2MB L2高速缓存)。CPU 706(例如CCPLEX)可以被配置为支持同时簇操作,使得CPU 706的簇的任意组合能够在任何给定时间是活动的。
CPU 706可以实现包括以下特征中的一个或更多个的功率管理能力:各硬件块在空闲时可以自动进行时钟门控以节省动态功率;由于WFI/WFE指令的执行,每个核时钟可以在该核不主动地执行指令时进行门控;每个核可以独立地进行功率门控;当所有核都进行时钟门控或者功率门控时,可以独立地对每个核簇进行时钟门控;和/或当所有核都进行功率门控时,可以独立地对每个核簇进行功率门控。CPU 706可以进一步实现用于管理功率状态的增强算法,其中指定允许的功率状态和期望的唤醒时间,并且硬件/微代码为所述核、簇和CCPLEX确定要进入的最佳的功率状态。处理核可以在软件中支持简化的功率状态进入序列,该工作被卸载到微代码。
GPU 708可以包括集成的GPU(可替代地,本文称为“iGPU”)。GPU 708可以是可编程的,并且对于并行工作负载而言是高效的。在一些示例中,GPU 708可以使用增强张量指令集。GPU 708可以包括一个或更多个流式微处理器,其中每个流式微处理器可以包括L1高速缓存(例如具有至少96KB存储能力的L1高速缓存),并且这些流式微处理器中的两个或更多可以共享L2高速缓存(例如具有512KB存储能力的L2高速缓存)。在一些实施例中,GPU 708可以包括至少八个流式微处理器。GPU 708可以使用计算应用编程接口(API)。此外,GPU708可以使用一个或更多个并行计算平台和/或编程模型(例如NVIDIA的CUDA)。
在汽车和嵌入式使用的情况下,可以对GPU 708进行功率优化以实现最佳性能。例如,可以在鳍式场效应晶体管(FinFET)上制造GPU 708。然而,这并不意图是限制性的,并且GPU 708可以使用其他半导体制造工艺来制造。每个流式微处理器可以合并划分成多个块的若干混合精度处理核。例如且非限制性地,可以将64个PF32核和32个PF64核划分成四个处理块。在这样的示例中,每个处理块可以分配16个FP32核、8个FP64核、16个INT32核、用于深层学习矩阵算术的两个混合精度NVIDIA张量核、L0指令高速缓存、线程束(warp)调度器、分派单元和/或64KB寄存器文件。此外,流式微处理器可以包括独立的并行整数和浮点数据路径,以利用计算和寻址计算的混合提供工作负载的高效执行。流式微处理器可以包括独立线程调度能力,以允许实现并行线程之间的更细粒度的同步和协作。流式微处理器可以包括组合的L1数据高速缓存和共享内存单元,以便在简化编程的同时提高性能。
GPU 708可以包括在一些示例中提供大约900GB/s的峰值内存带宽的高带宽内存(HBM)和/或16GB HBM2内存子***。在一些示例中,除了HBM内存之外或者可替代地,可以使用同步图形随机存取存储器(SGRAM),例如第五代图形双倍数据速率同步随机存取存储器(GDDR5)。
GPU 708可以包括统一内存技术,其包括访问计数器以允许内存页面更精确地迁移到最频繁地访问它们的处理器,从而提高处理器之间共享的内存范围的效率。在一些示例中,地址转换服务(ATS)支持可以用来允许GPU 708直接访问CPU 706页表。在这样的示例中,当GPU 708内存管理单元(MMU)经历遗漏时,可以将地址转换请求传输至CPU 706。作为响应,CPU 706可以在其页表中寻找用于地址的虚拟-物理映射,并且将转换传输回GPU708。这样,统一内存技术可以允许单个统一虚拟地址空间用于CPU 706和GPU 708二者的内存,从而简化了GPU 708编程和将应用程序移(port)到GPU 708。
此外,GPU 708可以包括访问计数器,其可以追踪GPU 708访问其他处理器的内存的频率。访问计数器可以帮助确保内存页面移至最频繁地访问这些页面的处理器的物理内存。
SoC 704可以包括任意数量的高速缓存712,包括本文描述的那些高速缓存。例如,高速缓存712可以包括CPU 706和GPU 708二者可用的L3高速缓存(例如,其连接到CPU 706和GPU 708二者)。高速缓存712可以包括回写高速缓存,其可以例如通过使用高速缓存一致性协议(例如MEI、MESI、MSI等)追踪行的状态。取决于实施例,L3高速缓存可以包括4MB或者更多,但是也可以使用更小的高速缓存大小。
SoC 704可以包括算术逻辑单元(ALU),所述算术逻辑单元可以在执行关于车辆700的各种任务或操作中的任何任务或操作(如处理DNN)的处理中被利用。此外,SoC 704可以包括用于在***内执行数学运算的浮点单元(FPU)(或其他数学协处理器或数字协处理器类型)。例如,SoC 104可以包括集成为CPU 706和/或GPU 708内的执行单元的一个或更多个FPU。
SoC 704可以包括一个或更多个加速器714(例如硬件加速器、软件加速器或者其组合)。例如,SoC 704可以包括硬件加速器簇,其可以包括优化的硬件加速器和/或大型片上内存。该大型片上内存(例如4MB SRAM)可以使得硬件加速器簇能够加速神经网络和其他计算。硬件加速器簇可以用来补充GPU 708,并且卸载GPU 708的一些任务(例如释放GPU708的更多周期以用于执行其他任务)。作为一个示例,加速器714可以用于足够稳定以易于控制加速的有针对性的工作负载(例如感知、卷积神经网络(CNN)等等)。当在本文中使用时,术语“CNN”可以包括所有类型的CNN,包括基于区域的或者区域卷积神经网络(RCNN)和快速RCNN(例如用于对象检测)。
加速器714(例如硬件加速器簇)可以包括深度学习加速器(DLA)。DLA可以包括可以被配置成为深度学习应用和推理提供额外的每秒10万亿次操作的一个或更多个张量处理单元(TPU)。TPU可以是被配置为执行图像处理功能(例如用于CNN、RCNN等)且针对执行图像处理功能而优化的加速器。DLA可以进一步针对特定的一组神经网络类型和浮点运算以及推理进行优化。DLA的设计可以比通用GPU提供每毫米更高的性能,并且远远超过CPU的性能。TPU可以执行若干功能,包括单实例卷积函数,支持例如用于特征和权重二者的INT8、INT16和FP16数据类型,以及后处理器功能。
DLA可以在处理的或者未处理的数据上针对各种各样的功能中的任何功能快速且高效地执行神经网络,尤其是CNN,例如且不限于:用于使用来自相机传感器的数据进行对象识别和检测的CNN;用于使用来自相机传感器的数据进行距离估计的CNN;用于使用来自麦克风的数据进行应急车辆检测和识别与检测的CNN;用于使用来自相机传感器的数据进行面部识别和车主识别的CNN;和/或用于安全和/或安全相关事件的CNN。
DLA可以执行GPU 708的任何功能,并且通过使用推理加速器,例如,设计者可以使DLA或GPU 708针对任何功能。例如,设计者可以将CNN的处理和浮点运算聚焦在DLA上,并且将其他功能留给GPU 708和/或其他加速器714。
加速器714(例如硬件加速器簇)可以包括可编程视觉加速器(PVA),其在本文中可以可替代地称为计算机视觉加速器。PVA可以被设计和配置为加速用于高级驾驶员辅助***(ADAS)、自主驾驶和/或增强现实(AR)和/或虚拟现实(VR)应用的计算机视觉算法。PVA可以提供性能与灵活性之间的平衡。例如,每个PVA可以包括例如且不限于任意数量的精简指令集计算机(RISC)核、直接内存访问(DMA)和/或任意数量的向量处理器。
RISC核可以与图像传感器(例如本文描述的任何相机的图像传感器)、图像信号处理器和/或类似物交互。这些RISC核中的每一个可以包括任意数量的内存。取决于实施例,RISC核可以使用若干协议中的任何协议。在一些示例中,RISC核可以执行实时操作***(RTOS)。RISC核可以使用一个或更多个集成电路设备、专用集成电路(ASIC)和/或存储设备实现。例如,RISC核可以包括指令高速缓存和/或紧密耦合的RAM。
DMA可以使得PVA的部件能够独立于CPU 706访问***内存。DMA可以支持用来向PVA提供优化的任意数量的特征,包括但不限于支持多维寻址和/或循环寻址。在一些示例中,DMA可以支持高达六个或更多维度的寻址,其可以包括块宽度、块高度、块深度、水平块步进、竖直块步进和/或深度步进。
向量处理器可以是可编程处理器,其可以被设计为高效且灵活地执行用于计算机视觉算法的编程并且提供信号处理能力。在一些示例中,PVA可以包括PVA核和两个向量处理子***分区。PVA核可以包括处理器子***、一个或更多个DMA引擎(例如两个DMA引擎)和/或其他***设备。向量处理子***可以作为PVA的主处理引擎而操作,并且可以包括向量处理单元(VPU)、指令高速缓存和/或向量内存(例如VMEM)。VPU核可以包括数字信号处理器,诸如例如单指令多数据(SIMD)、超长指令字(VLIW)数字信号处理器。SIMD和VLIW的组合可以增强吞吐量和速率。
向量处理器中的每一个可以包括指令高速缓存并且可以耦合到专用内存。结果,在一些示例中,向量处理器中的每一个可以被配置为独立于其他向量处理器执行。在其他示例中,包括在特定PVA中的向量处理器可以被配置为采用数据并行化。例如,在一些实施例中,包括在单个PVA中的多个向量处理器可以执行相同的计算机视觉算法,但是在图像的不同区域上执行。在其他示例中,包括在特定PVA中的向量处理器可以在相同的图像上同时执行不同的计算机视觉算法,或者甚至在序列图像或者图像的部分上执行不同的算法。除其他的以外,任意数量的PVA可以包括在硬件加速器簇中,并且任意数量的向量处理器可以包括在这些PVA中的每一个中。此外,PVA可以包括附加的纠错码(ECC)内存,以增强总体***安全性。
加速器714(例如硬件加速器簇)可以包括片上计算机视觉网络和SRAM,以提供用于加速器714的高带宽、低延迟SRAM。在一些示例中,片上内存可以包括由例如且不限于八个现场可配置的内存块组成的至少4MB SRAM,其可以由PVA和DLA二者访问。每对内存块可以包括高级***总线(APB)接口、配置电路***、控制器和复用器。可以使用任何类型的内存。PVA和DLA可以经由向PVA和DLA提供高速内存访问的主干(backbone)访问内存。主干可以包括(例如使用APB)将PVA和DLA互连到内存的片上计算机视觉网络。
片上计算机视觉网络可以包括在传输任何控制信号/地址/数据之前确定PVA和DLA二者都提供就绪且有效的信号的接口。这样的接口可以提供用于传输控制信号/地址/数据的单独相位和单独信道,以及用于连续数据传输的突发式通信。这种类型的接口可以符合ISO 26262或者IEC 61508标准,但是也可以使用其他标准和协议。
在一些示例中,SoC 704可以包括例如在2018年8月10日提交的美国专利申请No.16/101,232中描述的实时光线追踪硬件加速器。该实时光线追踪硬件加速器可以用来快速且高效地确定(例如世界模型内的)对象的位置和范围,以便生成实时可视化仿真,以用于RADAR信号解释、用于声音传播合成和/或分析、用于SONAR***仿真、用于一般波传播仿真、用于为了定位和/或其他功能的目的与LIDAR数据相比较和/或用于其他用途。在一些实施例中,一个或更多个树遍历单元(TTU)可以用于执行一个或更多个光线跟踪相关操作。
加速器714(例如硬件加速器簇)具有广泛的自主驾驶用途。PVA可以是可编程视觉加速器,其可以用于ADAS和自主车辆中的关键处理阶段。PVA的能力是需要可预测处理、低功率和低延迟的算法域的良好匹配。换言之,PVA在半密集或者密集规则计算上,甚至在需要具有低延迟和低功率的可预测运行时间的小数据集上都表现良好。因此,在用于自主车辆的平台的背景下,PVA被设计为运行经典计算机视觉算法,因为它们在对象检测和整数数学运算方面很有效。
例如,根据该技术的一个实施例,PVA用来执行计算机立体视觉。在一些示例中,可以使用基于半全局匹配的算法,但是这并不意图是限制性的。许多用于3-5级自主驾驶的应用都需要即时运动估计/立体匹配(例如来自运动的结构、行人识别、车道检测等等)。PVA可以在来自两个单目相机的输入上执行计算机立体视觉功能。
在一些示例中,PVA可以用来执行密集的光流。根据过程原始RADAR数据(例如使用4D快速傅立叶变换)以提供经处理的RADAR。在其他示例中,PVA用于飞行时间深度处理,其例如通过处理原始飞行时间数据以提供经处理的飞行时间数据。
DLA可以用来运行任何类型的网络以增强控制和驾驶安全性,包括例如输出用于每个对象检测的置信度度量的神经网络。这样的置信度值可以解释为概率,或者解释为提供每个检测与其他检测相比的相对“权重”。该置信度值使得***能够做出关于哪些检测应当被认为是真阳性检测而不是假阳性检测的进一步决定。例如,***可以为置信度设置阈值,并且仅仅将超过阈值的检测看作真阳性检测。在自动紧急制动(AEB)***中,假阳性检测会使得车辆自动地执行紧急制动,这显然是不希望的。因此,只有最确信的检测才应当被认为是AEB的触发因素。DLA可以运行用于回归置信度值的神经网络。该神经网络可以将至少一些参数子集作为其输入,例如边界框维度,(例如从另一个子***)获得的地平面估计,与车辆700取向、距离相关的惯性测量单元(IMU)传感器766输出,从神经网络和/或其他传感器(例如LIDAR传感器764或RADAR传感器760)获得的对象的3D位置估计等。
SoC 704可以包括一个或更多个数据存储716(例如内存)。数据存储716可以是SoC704的片上内存,其可以存储要在GPU和/或DLA上执行的神经网络。在一些示例中,为了冗余和安全,数据存储716可以容量足够大以存储神经网络的多个实例。数据存储712可以包括L2或L3高速缓存712。对数据存储716的引用可以包括对与如本文所描述的PVA、DLA和/或其他加速器714关联的内存的引用。
SoC 704可以包括一个或更多个处理器710(例如嵌入式处理器)。处理器710可以包括启动和功率管理处理器,其可以是用于处理启动功率和管理功能以及有关安全实施的专用处理器和子***。启动和功率管理处理器可以是SoC 704启动序列的一部分,并且可以提供运行时间功率管理服务。启动功率和管理处理器可以提供时钟和电压编程、辅助***低功率状态转换、SoC 704热和温度传感器管理和/或SoC 704功率状态管理。每个温度传感器可以实现为环形振荡器,其输出频率与温度成比例,并且SoC 704可以使用环形振荡器检测CPU 706、GPU 708和/或加速器714的温度。如果确定温度超过阈值,那么启动和功率管理处理器可以进入温度故障例程并且将SoC 704置于较低功率状态和/或将车辆700置于司机安全停车模式(例如使车辆700安全停车)。
处理器710可以还包括可以用作音频处理引擎的一组嵌入式处理器。音频处理引擎可以是一种音频子***,其允许实现对于通过多个接口的多声道音频的完全硬件支持以及一系列广泛而灵活的音频I/O接口。在一些示例中,音频处理引擎是具有带有专用RAM的数字信号处理器的专用处理器核。
处理器710可以还包括始终在处理器上的引擎,其可以提供必要的硬件特征以支持低功率传感器管理和唤醒用例。该始终在处理器上的引擎可以包括处理器核、紧密耦合的RAM、支持***设备(例如定时器和中断控制器)、各种I/O控制器***设备和路由逻辑。
处理器710可以还包括安全簇引擎,其包括处理汽车应用的安全管理的专用处理器子***。安全簇引擎可以包括两个或更多处理器核、紧密耦合的RAM、支持***设备(例如定时器、中断控制器等等)和/或路由逻辑。在安全模式下,所述两个或更多核可以操作于锁步模式下,并且用作具有检测它们的操作之间的任何差异的比较逻辑的单核。
处理器710可以还包括实时相机引擎,其可以包括用于处理实时相机管理的专用处理器子***。
处理器710可以还包括高动态范围信号处理器,其可以包括图像信号处理器,该图像信号处理器是一种硬件引擎,该硬件引擎是相机处理管线的部分。
处理器710可以包括可以是(例如微处理器上实现的)处理块的视频图像复合器,其实现视频回放应用程序产生用于播放器窗口的最终图像所需的视频后处理功能。视频图像复合器可以对广角相机770、环绕相机774和/或对驾驶室内监控相机传感器执行镜头畸变校正。驾驶室内监控相机传感器优选地由运行在高级SoC的另一个实例上的神经网络监控,被配置为识别驾驶室内事件并且相对应地做出响应。驾驶室内***可以执行唇读,以激活移动电话服务并拨打电话、口述电子邮件、改变车辆目的地、激活或改变车辆的信息娱乐***和设置或者提供语音激活的网上冲浪。某些功能仅在车辆操作于自主模式下时对于驾驶员可用,并且在其他情况下被禁用。
视频图像复合器可以包括用于空间和时间降噪的增强时间降噪。例如,在视频中出现运动的情况下,降噪适当地对空间信息加权,降低邻近帧提供的信息的权重。在图像或者图像的部分不包括运动的情况下,视频图像复合器执行的时间降噪可以使用来自先前的图像的信息以降低当前图像中的噪声。
视频图像复合器也可以被配置为对输入立体镜头帧执行立体校正。当操作***桌面正在使用并且GPU 708无需连续地渲染(render)新的表面时,视频图像复合器可以进一步用于用户接口组成。甚至在GPU 708上电并且激活,进行3D渲染时,视频图像复合器可以用来减轻GPU 708的负担以提高性能和响应能力。
SoC 704可以还包括用于从相机接收视频和输入的移动行业处理器接口(MIPI)相机串行接口、高速接口和/或可以用于相机和有关像素输入功能的视频输入块。SoC 704可以还包括可以由软件控制并且可以用于接收未提交到特定角色的I/O信号的输入/输出控制器。
SoC 704可以还包括大范围的***设备接口,以使能与***设备、音频编解码器、功率管理和/或其他设备通信。SoC 704可以用来处理来自(通过千兆多媒体串行链路和以太网连接的)相机、传感器(例如可以通过以太网连接的LIDAR传感器764、RADAR传感器760等等)的数据,来自总线702的数据(例如车辆700的速率、方向盘位置等等),来自(通过以太网或CAN总线连接的)GNSS传感器758的数据。SoC 704可以还包括专用高性能大容量存储控制器,其可以包括它们自己的DMA引擎,并且其可以用来从日常数据管理任务中释放CPU706。
SoC 704可以是具有灵活架构的端到端平台,该架构跨越自动化3-5级,从而提供利用和高效使用计算机视觉和ADAS技术以实现多样性和冗余、连同深度学***台的综合功能安全架构。SoC 704可以比常规的***更快、更可靠,甚至更加能量高效和空间高效。例如,当与CPU 706、GPU 708和数据存储716结合时,加速器714可以提供用于3-5级自主车辆的快速高效平台。
因此该技术提供了不能通过常规***实现的能力和功能。例如,计算机视觉算法可以在CPU上执行,这些CPU可以使用诸如C编程语言之类的高级编程语言配置为跨各种各样的视觉数据执行各种各样的处理算法。然而,CPU常常不能满足许多计算机视觉应用的性能要求,诸如与例如执行时间和功耗有关的那些要求。特别地,许多CPU不能实时地执行复杂的对象检测算法,这是车载ADAS应用的要求和实用3-5级自主车辆的要求。
与常规***形成对比的是,通过提供CPU复合体、GPU复合体和硬件加速器簇,本文描述的技术允许同时和/或顺序地执行多个神经网络,并且将结果组合在一起以实现3-5级自主驾驶功能。例如,在DLA或dGPU(例如GPU 720)上执行的CNN可以包括文本和单词识别,允许超级计算机读取和理解交通指示牌,包括尚未针对其特别地训练神经网络的指示牌。DLA可以还包括能够识别、解释和提供对指示牌的语义理解,并且将该语义理解传递给运行在CPU复合体上的路径规划模块的神经网络。
作为另一个示例,如3、4或5级驾驶所需的,多个神经网络可以同时运行。例如,由“注意:闪烁的灯指示结冰条件”组成的警告指示牌连同电灯可以由若干神经网络独立地或者共同地进行解释。指示牌本身可以由部署的第一神经网络(例如经过训练的神经网络)识别为交通指示牌,文本“闪烁的灯指示结冰条件”可以由部署的第二神经网络解释,该部署的第二神经网络告知车辆的路径规划软件(优选地在CPU复合体上执行)当检测到闪烁的灯时,存在结冰条件。闪烁的灯可以通过在多个帧上操作部署的第三神经网络而识别,该神经网络告知车辆的路径规划软件闪烁的灯的存在(或不存在)。所有三个神经网络可以例如在DLA内和/或在GPU 708上同时运行。
在一些示例中,用于面部识别和车主识别的CNN可以使用来自相机传感器的数据识别车辆700的授权的驾驶员和/或车主的存在。始终在传感器上的处理引擎可以用来在车主接近驾驶员车门时解锁车辆并且打开灯,并且在安全模式下,在车主离开车辆时禁用车辆。按照这种方式,SoC 704提供了防范盗窃和/或劫车的安全性。
在另一个示例中,用于应急车辆检测和识别的CNN可以使用来自麦克风796的数据来检测并且识别应急车辆警报(siren)。与使用通用分类器检测警报并且手动地提取特征的常规***形成对比的是,SoC 704使用CNN以对环境和城市声音分类以及对视觉数据分类。在优选的实施例中,运行在DLA上的CNN被训练为识别应急车辆的相对关闭速率(例如通过使用多普勒效应)。CNN也可以被训练为识别如GNSS传感器758所识别的特定于车辆在其中操作的局部区域的应急车辆。因此,例如,当在欧洲操作时,CNN将寻求检测欧洲警报,并且当在美国时,CNN将寻求识别仅仅北美的警报。一旦检测到应急车辆,在超声传感器762的辅助下,控制程序可以用来执行应急车辆安全例程,使车辆放慢速度,开到路边,停下车辆,和/或使车辆空转,直到应急车辆通过。
车辆可以包括可以经由高速互连(例如PCIe)耦合到SoC 704的CPU 718(例如分立的CPU或dCPU)。CPU 718可以包括例如X86处理器。CPU 718可以用来执行各种各样的功能中的任何功能,包括例如仲裁ADAS传感器与SoC 704之间潜在地不一致的结果,和/或监控控制器736和/或信息娱乐SoC 730的状态和健康状况。
车辆700可以包括可以经由高速互连(例如NVIDIA的NVLINK)耦合到SoC 704的GPU720(例如分立的GPU或dGPU)。GPU 720可以例如通过执行冗余的和/或不同的神经网络而提供附加的人工智能功能,并且可以用来至少部分地基于来自车辆700的传感器的输入(例如传感器数据)来训练和/或更新神经网络。
车辆700可以还包括网络接口724,该网络接口可以包括一个或更多个无线天线726(例如用于不同通信协议的一个或更多个无线天线,例如蜂窝天线、蓝牙天线等等)。网络接口724可以用来使能通过因特网与云(例如与服务器778和/或其他网络设备)、与其他车辆和/或与计算设备(例如乘客的客户端设备)的无线连接。为了与其他车辆通信,可以在这两辆车之间建立直接链接,和/或可以建立间接链接(例如跨网络以及通过因特网)。直接链接可以使用车对车通信链路提供。车对车通信链路可以向车辆700提供关于接近车辆700的车辆(例如车辆700前面、侧面和/或后面的车辆)的信息。该功能可以是车辆700的协作自适应巡航控制功能的部分。
网络接口724可以包括提供调制和解调功能并且使得控制器736能够通过无线网络通信的SoC。网络接口724可以包括用于从基带到射频的上转换以及从射频到基带的下转换的射频前端。频率转换可以通过公知的过程执行,和/或可以使用超外差(super-heterodyne)过程执行。在一些示例中,射频前端功能可以由单独的芯片提供。网络接口可以包括用于通过LTE、WCDMA、UMTS、GSM、CDMA2000、蓝牙、蓝牙LE、Wi-Fi、Z波、ZigBee、LoRaWAN和/或其他无线协议通信的无线功能。
车辆700可以还包括可包括片外(例如SoC 704外)存储装置的数据存储728。数据存储728可以包括一个或更多个存储元件,包括RAM、SRAM、DRAM、VRAM、闪存、硬盘和/或可以存储至少一个比特的数据的其他部件和/或设备。
车辆700可以还包括GNSS传感器758。GNSS传感器758(例如GPS、辅助GPS传感器、差分GPS(DGPS)传感器等)用于辅助映射、感知、占用网格生成和/或路径规划功能。可以使用任意数量的GNSS传感器758,包括例如且不限于使用带有以太网到串行(RS-232)网桥的USB连接器的GPS。
车辆700可以还包括RADAR传感器760。RADAR传感器760可以甚至在黑暗和/或恶劣天气条件下也由车辆700用于远程车辆检测。RADAR功能安全级别可以是ASIL B。RADAR传感器760可以使用CAN和/或总线702(例如以传输RADAR传感器760生成的数据)以用于控制以及访问对象追踪数据,在一些示例中接入以太网以访问原始数据。可以使用各种各样的RADAR传感器类型。例如且非限制性地,RADAR传感器760可以适合前面、后面和侧面RADAR使用。在一些示例中,使用脉冲多普勒RADAR传感器。
RADAR传感器760可以包括不同的配置,例如具有窄视场的远程、具有宽视场的短程、短程侧覆盖等等。在一些示例中,远程RADAR可以用于自适应巡航控制功能。远程RADAR***可以提供通过两个或更多独立扫描实现的广阔视场(例如250m范围内)。RADAR传感器760可以帮助区分静态对象和运动对象,并且可以由ADAS***用于紧急制动辅助和前方碰撞警告。远程RADAR传感器可以包括具有多根(例如六根或更多)固定RADAR天线以及高速CAN和FlexRay接口的单站多模RADAR。在具有六根天线的示例中,中央四根天线可以创建聚焦的波束图案,其被设计为在更高速率下以来自邻近车道的最小交通干扰记录车辆700的周围环境。其他两根天线可以扩展视场,使得快速地检测进入或离开车辆700的车道的车辆成为可能。
作为一个示例,中程RADAR***可以包括高达760m(前面)或80m(后面)的范围以及高达42度(前面)或750度(后面)的视场。短程RADAR***可以包括但不限于被设计为安装在后保险杠两端的RADAR传感器。当安装在后保险杠两端时,这样的RADAR传感器***可以创建持续地监控后方和车辆旁边的视盲点的两个波束。
短程RADAR***可以在ADAS***中用于视盲点检测和/或变道辅助。
车辆700可以还包括超声传感器762。可以置于车辆700的前面、后面和/或侧面的超声传感器762可以用于停车辅助和/或创建和更新占用网格。可以使用各种各样的超声传感器762,并且不同的超声传感器762可以用于不同的检测范围(例如2.5m、4m)。超声传感器762可以操作于功能安全级别的ASILB。
车辆700可以包括LIDAR传感器764。LIDAR传感器764可以用于对象和行人检测、紧急制动、碰撞避免和/或其他功能。LIDAR传感器764可以为功能安全级别的ASIL B。在一些示例中,车辆700可以包括可以使用以太网(例如以将数据提供给千兆以太网交换机)的多个LIDAR传感器764(例如两个、四个、六个等等)。
在一些示例中,LIDAR传感器764可能够对360度视场提供对象列表及其距离。商业上可用的LIDAR传感器764可以具有例如近似700m的广告范围,精度为2cm-3cm,支持700Mbps以太网连接。在一些示例中,可以使用一个或更多个非突出的LIDAR传感器764。在这样的示例中,LIDAR传感器764可以实现为可以嵌入到车辆700的前面、后面、侧面和/或拐角的小设备。在这样的示例中,LIDAR传感器764可以甚至对于低反射率对象提供高达120度水平的和35度竖直的视场,具有200m的范围。前面安装的LIDAR传感器764可以被配置用于45度与135度之间的水平视场。
在一些示例中,也可以使用诸如3D闪光LIDAR之类的LIDAR技术。3D闪光LIDAR使用激光的闪光作为发射源,以照亮高达约200m的车辆周围环境。闪光LIDAR单元包括接受器,该接受器将激光脉冲传输时间和反射光记录在每个像素上,其进而与从车辆到对象的范围相对应。闪光LIDAR可以允许利用每个激光闪光生成周围环境的高度精确且无失真的图像。在一些示例中,可以部署四个闪光LIDAR传感器,车辆700的每一侧一个。可用的3D闪光LIDAR***包括没有风扇以外的运动部件(moving part)的固态3D凝视阵列LIDAR相机(例如非扫描LIDAR设备)。闪光LIDAR设备可以使用每帧5纳秒I类(眼睛安全)激光脉冲,并且可以以3D范围点云和共同寄存的强度数据的形式捕获反射的激光。通过使用闪光LIDAR,并且因为闪光LIDAR是没有运动部件的固态设备,LIDAR传感器764可以不太容易受到运动模糊、振动和/或震动的影响。
该车辆可以还包括IMU传感器766。在一些示例中,IMU传感器766可以位于车辆700的后轴的中心。IMU传感器766可以包括例如且不限于加速度计、磁力计、陀螺仪、磁罗盘和/或其他传感器类型。在一些示例中,例如在六轴应用中,IMU传感器766可以包括加速度计和陀螺仪,而在九轴应用中,IMU传感器766可以包括加速度计、陀螺仪和磁力计。
在一些实施例中,IMU传感器766可以实现为微型高性能GPS辅助惯性导航***(GPS/INS),其结合微机电***(MEMS)惯性传感器、高灵敏度GPS接收器和高级卡尔曼滤波算法以提供位置、速度和姿态的估计。这样,在一些示例中,IMU传感器766可以使得车辆700能够在无需来自磁传感器的输入的情况下通过直接观察从GPS到IMU传感器766的速度变化并且将其相关来估计方向(heading)。在一些示例中,IMU传感器766和GNSS传感器758可以结合到单个集成单元中。
该车辆可以包括置于车辆700中和/或车辆700周围的麦克风796。除别的以外,麦克风796可以用于应急车辆检测和识别。
该车辆可以还包括任意数量的相机类型,包括立体相机768、广角相机770、红外相机772、环绕相机774、远程和/或中程相机798和/或其他相机类型。这些相机可以用来捕获车辆700整个***周围的图像数据。使用的相机类型取决于实施例和车辆700的要求,并且相机类型的任意组合可以用来提供车辆700周围的必要覆盖。此外,相机的数量可以根据实施例而不同。例如,该车辆可以包括六个相机、七个相机、十个相机、十二个相机和/或另一数量的相机。作为一个示例且非限制性地,这些相机可以支持千兆多媒体串行链路(GMSL)和/或千兆以太网。所述相机中的每一个在本文关于图7A和图7B更详细地进行了描述。
车辆700可以还包括振动传感器742。振动传感器742可以测量车辆的诸如车轴之类的部件的振动。例如,振动的变化可以指示道路表面的变化。在另一个示例中,当使用两个或更多振动传感器742时,振动之间的差异可以用来确定道路表面的摩擦或滑移(例如当动力驱动轴与自由旋转轴之间存在振动差异时)。
车辆700可以包括ADAS***738。在一些示例中,ADAS***738可以包括SoC。ADAS***738可以包括自主/自适应/自动巡航控制(ACC)、协作自适应巡航控制(CACC)、前方撞车警告(FCW)、自动紧急制动(AEB)、车道偏离警告(LDW)、车道保持辅助(LKA)、视盲点警告(BSW)、后方穿越交通警告(RCTW)、碰撞警告***(CWS)、车道居中(LC)和/或其他特征和功能。
ACC***可以使用RADAR传感器760、LIDAR传感器764和/或相机。ACC***可以包括纵向ACC和/或横向ACC。纵向ACC监控并控制到紧接在车辆700前方的车辆的距离,并且自动地调节车速以维持离前方车辆的安全距离。横向ACC执行距离保持,并且在必要时建议车辆700改变车道。横向ACC与诸如LCA和CWS之类的其他ADAS应用程序有关。
CACC使用来自其他车辆的信息,该信息可以经由网络接口724和/或无线天线726经由无线链路或者通过网络连接(例如通过因特网)间接地从其他车辆接收。直接链接可以由车对车(V2V)通信链路提供,而间接链接可以是基础设施到车辆(I2V)的通信链路。通常,V2V通信概念提供关于紧接在前的车辆(例如紧接在车辆700前方且与其处于相同车道的车辆)的信息,而I2V通信概念提供关于前方更远处的交通的信息。CACC***可以包括I2V和V2V信息源中的任一个或者二者。给定车辆700前方车辆的信息,CACC可以更加可靠,并且它有可能提高交通流的畅通性且降低道路拥堵。
FCW***被设计为提醒驾驶员注意危险,使得驾驶员可以采取纠正措施。FCW***使用耦合到专用处理器、DSP、FPGA和/或ASIC的前置相机和/或RADAR传感器760,该专用处理器、DSP、FPGA和/或ASIC电耦合至诸如显示器、扬声器和/或振动部件之类的驾驶员反馈。FCW***可以提供例如声音、视觉警告、振动和/或快速制动脉冲形式的警告。
AEB***检测即将发生的与另一车辆或其他对象的前方碰撞,并且可以在驾驶员在指定的时间或距离参数内没有采取纠正措施的情况下自动地应用制动器。AEB***可以使用耦合到专用处理器、DSP、FPGA和/或ASIC的前置相机和/或RADAR传感器760。当AEB***检测到危险时,它典型地首先提醒(alert)驾驶员采取纠正措施以避免碰撞,并且如果驾驶员没有采取纠正措施,那么AEB***可以自动地应用制动器以努力防止或者至少减轻预测的碰撞的影响。AEB***可以包括诸如动态制动支持和/或碰撞迫近制动之类的技术。
LDW***提供了诸如方向盘或座位振动之类的视觉、听觉和/或触觉警告,以在车辆700穿过车道标记时提醒驾驶员。当驾驶员指示有意偏离车道时,通过激活转弯信号,不激活LDW***。LDW***可以使用耦合到专用处理器、DSP、FPGA和/或ASIC的前侧朝向相机,该专用处理器、DSP、FPGA和/或ASIC电耦合至诸如显示器、扬声器和/或振动部件之类的驾驶员反馈。
LKA***是LDW***的变型。如果车辆700开始离开车道,那么LKA***提供纠正车辆700的转向输入或制动。
BSW***检测并向驾驶员警告汽车视盲点中的车辆。BSW***可以提供视觉、听觉和/或触觉警报以指示合并或改变车道是不安全的。***可以在驾驶员使用转弯信号时提供附加的警告。BSW***可以使用耦合到专用处理器、DSP、FPGA和/或ASIC的后侧朝向相机和/或RADAR传感器760,该专用处理器、DSP、FPGA和/或ASIC电耦合至诸如显示器、扬声器和/或振动部件之类的驾驶员反馈。
RCTW***可以在车辆700倒车时在后置相机范围之外检测到对象时提供视觉、听觉和/或触觉通知。一些RCTW***包括AEB以确保应用车辆制动器以避免撞车。RCTW***可以使用耦合到专用处理器、DSP、FPGA和/或ASIC的一个或更多个后置RADAR传感器760,该专用处理器、DSP、FPGA和/或ASIC电耦合至诸如显示器、扬声器和/或振动部件之类的驾驶员反馈。
常规的ADAS***可能易于出现假阳性结果,这可能会让驾驶员烦恼并分散注意力,但是典型地不是灾难性的,因为ADAS***提醒驾驶员并且允许驾驶员决定安全条件是否真正存在并且相对应地采取行动。然而,在自主车辆700中,在冲突结果的情况下,车辆700本身必须决定是否注意(heed)来自主计算机或者辅助计算机(例如第一控制器736或第二控制器736)的结果。例如,在一些实施例中,ADAS***738可以是用于向备用计算机合理性模块提供感知信息的备用和/或辅助计算机。备用计算机合理性监视器可以在硬件部件上运行冗余多样的软件,以检测感知和动态驾驶任务中的故障。来自ADAS***738的输出可以提供给监督MCU。如果来自主计算机和辅助计算机的输出冲突,那么监督MCU必须确定如何协调该冲突以确保安全操作。
在一些示例中,主计算机可以被配置为向监督MCU提供置信度评分,指示主计算机对所选结果的置信度。如果置信度评分超过阈值,那么监督MCU可以遵循主计算机的方向,而不管辅助计算机是否提供冲突或不一致的结果。在置信度评分不满足阈值的情况下并且在主计算机和辅助计算机指示不同的结果(例如冲突)的情况下,监督MCU可以在这些计算机之间进行仲裁以确定适当的结果。
监督MCU可以被配置为运行神经网络,所述神经网络被训练并且被配置为至少部分地基于来自主计算机和辅助计算机的输出,确定辅助计算机提供假警报的条件。因此,监督MCU中的神经网络可以了解何时可以信任辅助计算机的输出以及何时不能。例如,当辅助计算机为基于RADAR的FCW***时,监督MCU中的神经网络可以了解FCW***何时正在识别事实上不是危险的金属对象,例如触发警报的排水栅格或井盖。类似地,当辅助计算机是基于相机的LDW***时,监督MCU中的神经网络可以学习在骑车者或行人在场并且车道偏离实际上是最安全的策略时无视该LDW。在包括运行在监督MCU上的神经网络的实施例中,监督MCU可以包括适合于利用关联的内存运行神经网络的DLA或GPU中的至少一个。在优选的实施例中,监督MCU可以包括SoC 704的部件和/或作为SoC 704的部件而被包括。
在其他示例中,ADAS***738可以包括使用传统计算机视觉规则执行ADAS功能的辅助计算机。这样,辅助计算机可以使用经典的计算机视觉规则(如果-那么),并且在监督MCU中存在神经网络可以提高可靠性、安全性和性能。例如,多样化的实现方式和有意的非完全相同(non-identity)使得整个***更加容错,对于软件(或者软件-硬件接口)功能造成的故障而言尤其如此。例如,如果在主计算机上运行的软件中存在软件漏洞或错误并且运行在辅助计算机上的非完全相同的软件代码提供相同的总体结果,那么监督MCU可以更加确信总体结果是正确的,并且主计算机上的软件或硬件中的漏洞不造成实质性的错误。
在一些示例中,ADAS***738的输出可以馈送至主计算机的感知块和/或主计算机的动态驾驶任务块。例如,如果ADAS***738由于对象紧接在前的原因而指示前方碰撞警告,那么感知块可以在识别对象时使用该信息。在其他示例中,辅助计算机可以具有它自己的神经网络,其被训练并且因此如本文所描述的降低假阳性的风险。
车辆700可以还包括信息娱乐SoC 730(例如车载信息娱乐***(IVI))。尽管被图示和描述为SoC,但是信息娱乐***可以不是SoC,并且可以包括两个或更多分立的部件。信息娱乐SoC 730可以包括可以用来向车辆700提供音频(例如音乐、个人数字助理、导航指令、新闻、广播等等)、视频(例如TV、电影、流媒体等等)、电话(例如免提呼叫)、网络连接(例如LTE、WiFi等等)和/或信息服务(例如导航***,后停车援助,无线电数据***,诸如燃油水平、覆盖的总距离、制动燃油水平、油位、车门开/关、空气过滤器信息之类的车辆有关信息,等等)的硬件和软件的组合。例如,信息娱乐SoC 730可以包括收音机、盘播放器、导航***、视频播放器、USB和蓝牙连接、车载电脑、车载娱乐、WiFi、方向盘音频控件、免提语音控件、平视显示器(HUD)、HMI显示器734、远程信息处理设备、控制面板(例如用于控制各种部件、特征和/或***,和/或与其交互)和/或其他部件。信息娱乐SoC 730可以进一步用来向车辆的用户提供信息(例如视觉的和/或听觉的),例如来自ADAS***738的信息,诸如规划的车辆机动、轨迹、周围环境信息(例如交叉路口信息、车辆信息、道路信息等等)之类的自主驾驶信息,和/或其他信息。
信息娱乐SoC 730可以包括GPU功能。信息娱乐SoC 730可以通过总线702(例如CAN总线、以太网等)与车辆700的其他设备、***和/或部件通信。在一些示例中,信息娱乐SoC730可以耦合至监督MCU,使得在主控制器736(例如车辆700的主计算机和/或备用计算机)出现故障的情况下,信息娱乐***的GPU可以执行一些自驾驶功能。在这样的示例中,信息娱乐SoC 730可以如本文所描述的将车辆700置于司机安全停车模式。
车辆700可以还包括仪表组732(例如数字仪表板、电子仪表组、数字仪表面板等等)。仪表组732可以包括控制器和/或超级计算机(例如分立的控制器或超级计算机)。仪表组732可以包括一套仪器,例如车速表、燃油水平、油压、转速表、里程表、转弯指示器、换档位置指示器、安全带警告灯、停车制动警告灯、发动机故障灯、安全气囊(SRS)***信息、照明控件、安全***控件、导航信息等等。在一些示例中,信息可以被显示和/或在信息娱乐SoC 730和仪表组732之间共享。换言之,仪表组732可以作为信息娱乐SoC 730的部分而被包括,或者反之亦然。
图7D为根据本公开一些实施例的基于云的服务器与图7A的示例自主车辆700之间的通信的***示意图。***776可以包括服务器778、网络790以及包括车辆700在内的车辆。服务器778可以包括多个GPU 784(A)-784(H)(这里统称为GPU 784)、PCIe交换机782(A)-782(H)(这里统称为PCIe交换机782)和/或CPU 780(A)-780(B)(这里统称为CPU 780)。GPU784、CPU 780和PCIe交换机可以与诸如例如且不限于NVIDIA开发的NVLink接口788之类的高速互连和/或PCIe连接786互连。在一些示例中,GPU 784经由NVLink和/或NVSwitch SoC连接,并且GPU 784和PCIe交换机782经由PCIe互连连接。尽管图示出八个GPU 784、两个CPU780和两个PCIe交换机,但是这并不意图是限制性的。取决于实施例,服务器778中的每一个可以包括任意数量的GPU 784、CPU 780和/或PCIe交换机。例如,服务器778中的每一个可以包括八个、十六个、三十二个和/或更多GPU 784。
服务器778可以通过网络790并且从车辆接收图像数据,该图像数据表示示出诸如最近开始的道路工程之类的意外或改变的道路状况的图像。服务器778可以通过网络790并且向车辆传输神经网络792、更新的神经网络792和/或地图信息794,包括关于交通和道路状况的信息。对地图信息794的更新可以包括对于HD地图722的更新,例如关于建筑工地、坑洼、弯道、洪水或其他障碍物的信息。在一些示例中,神经网络792、更新的神经网络792和/或地图信息794可以已从新的训练和/或从环境中的任意数量的车辆接收的数据中表示和/或基于数据中心处执行的训练(例如使用服务器778和/或其他服务器)的经验产生。
服务器778可以用来基于训练数据训练机器学习模型(例如神经网络)。训练数据可以由车辆生成,和/或可以在仿真中生成(例如使用游戏引擎)。在一些示例中,训练数据被标记(例如在神经网络受益于有监督学习的情况下)和/或经历其他预处理,而在其他示例中,训练数据不被标记和/或预处理(例如在神经网络无需有监督学习的情况下)。可以根据任何一类或更多类别的机器学习技术来执行训练,包括但不限于诸如以下类别:监督训练、半监督训练、非监督训练、自学习、强化学习、联合学习、转移学习、特征学习(包括主要组成和聚类分析)、多线性子空间学习、流形学习、表示学习(包括备用字典学习)、基于规则的机器学习、异常检测及其任何变体或组合。一旦机器学习模型被训练,机器学习模型可以由车辆使用(例如通过网络790传输至车辆),和/或机器学习模型可以由服务器778用来远程地监控车辆。
在一些示例中,服务器778可以接收来自车辆的数据,并且将该数据应用到最新的实时神经网络以用于实时智能推理。服务器778可以包括由GPU 784供电的深度学习超级计算机和/或专用AI计算机,例如NVIDIA开发的DGX和DGX站机器。然而,在一些示例中,服务器778可以包括仅使用CPU供电的数据中心的深度学习基础设施。
服务器778的深度学习基础设施可能够快速实时推理,并且可以使用该能力来评估并验证车辆700中的处理器、软件和/或关联硬件的健康状况。例如,深度学习基础设施可以接收来自车辆700的定期更新,例如图像序列和/或车辆700已经定位的位于该图像序列中的对象(例如经由计算机视觉和/或其他机器学习对象分类技术)。深度学习基础设施可以运行它自己的神经网络以识别对象并且将它们与车辆700识别的对象相比较,如果结果不匹配并且该基础设施得出车辆700中的AI发生故障的结论,那么服务器778可以向车辆700传输信号,指示车辆700的故障保护计算机进行控制,通知乘客,并且完成安全停车操作。
为了推理,服务器778可以包括GPU 784和一个或更多个可编程推理加速器(例如NVIDIA的TensorRT)。GPU供电的服务器和推理加速的组合可以使得实时响应成为可能。在其他示例中,例如在性能不那么重要的情况下,CPU、FPGA和其他处理器供电的服务器可以用于推理。
示例计算设备
图8是适合用于实现本公开的一些实施例的示例计算设备800的框图。计算设备800可以包括直接或间接耦合以下设备的互连***802:存储器804、一个或更多个中央处理单元(CPU)806、一个或更多个图形处理单元(GPU)808、通信接口810、输入/输出(I/O)端口812、输入/输出组件814、电源816,一个或更多个呈现组件818(例如,(一个或更多个)显示器)和一个或更多个逻辑单元820。在至少一个实施例中,(一个或更多个)计算设备800可以包括一个或更多个虚拟机(VM),和/或其任何组件可以包括虚拟组件(例如,虚拟硬件组件)。对于非限制性示例,GPU 808中的一个或更多个可以包括一个或更多个vGPU,CPU 806中的一个或更多个可以包括一个或更多个vCPU,和/或逻辑单元820中的一个或更多个可以包括一个或更多个虚拟逻辑单元。这样,(一个或更多个)计算设备800可以包括分立组件(例如,专用于计算设备800的全GPU)、虚拟组件(例如,专用于计算设备800的GPU的一部分)、或其组合。
尽管图8的各个方框被示出为利用线路经由互连***802连接,但这并不旨在是限制性的并且仅是为了清楚起见。例如,在一些实施例中,呈现组件818(诸如显示设备)可被认为是I/O组件814(例如,如果显示器是触摸屏)。作为另一个示例,CPU 806和/或GPU 808可以包括存储器(例如,存储器804可以表示除了GPU 808的存储器、CPU 806和/或其他组件之外的存储设备)。换言之,图8的计算设备仅是说明性的。在如“工作站”、“服务器”、“膝上型计算机”、“桌面型计算机”、“平板计算机”、“客户端设备”、“移动设备”、“手持式设备”、“游戏控制台”、“电子控制单元(ECU)”、“虚拟现实***”和/或其他设备或***类型的此类类别之间不做区分,因为所有都被考虑在图8的计算设备的范围内。
互连***802可表示一个或更多个链路或总线,诸如地址总线、数据总线、控制总线或其组合。互连***802可以包括一个或更多个总线或链路类型,诸如工业标准架构(ISA)总线、扩展工业标准架构(EISA)总线、视频电子标准协会(VESA)总线、***组件互连(PCI)总线、快速***组件互连(PCIe)总线和/或另一类型的总线或链路。在一些实施例中,组件之间存在直接连接。作为示例,CPU 806可直接连接到存储器804。进一步,CPU 806可直接连接到GPU 808。在组件之间存在直接或点对点连接的情况下,互连***802可包括PCIe链路以执行连接。在这些示例中,PCI总线不需要被包括在计算设备800中。
存储器804可以包括各种计算机可读介质中的任何计算机可读介质。计算机可读介质可以是可由计算设备800访问的任何可用介质。计算机可读介质可以包括易失性和非易失性介质,以及可移除和不可移除介质。作为示例而非限制,计算机可读介质可包括计算机存储介质和通信介质。
计算机存储介质可以包括以用于存储诸如计算机可读指令、数据结构、程序模块和/或其他数据类型的信息的任何方法或技术实现的易失性和非易失性介质和/或可移动和不可移动介质。例如,存储器804可以存储计算机可读指令(例如,表示(一个或更多个)程序和/或(一个或更多个)程序元件,诸如操作***)。计算机存储介质可以包括但不限于RAM、ROM、EEPROM、闪存或其他存储器技术,CD-ROM、数字通用盘(DVD)或其他光盘存储、磁带盒、磁带、磁盘存储装置或其他磁性存储装置,或可用于存储所要信息且可由计算设备800存取的任何其他介质。如本文所使用的,计算机存储介质不包括信号本身。
计算机存储介质可将计算机可读指令、数据结构、程序模块和/或其他数据类型体现在诸如载波或其他传输机制之类的已调制数据信号中,并且包括任何信息传递介质。术语“调制数据信号”可以指代以编码信号中的信息的方式设置或改变其一个或更多个特性的信号。作为示例而非限制,计算机存储介质可包括有线介质(诸如有线网络或直接有线连接)和无线介质(诸如声学、RF、红外和其他无线介质)。以上任何内容的组合也应包含在计算机可读介质的范围内。
CPU 806可经配置以执行计算机可读指令中的至少一些以控制计算设备800的一个或更多个组件执行本文中所描述的方法和/或过程中的一个或更多个。CPU 806可各自包含能够同时处置众多软件线程的一个或更多个核心(例如,一个、两个、四个、八个、二十八个、七十二个等)。CPU 806可包含任何类型的处理器,且可取决于所实施的计算设备800的类型而包含不同类型的处理器(例如,针对移动装置具有较少核心的处理器和针对服务器具有较多核心的处理器)。例如,取决于计算设备800的类型,处理器可以是使用精简指令集计算(RISC)实现的高级RISC机器(ARM)处理器或使用复杂指令集计算(CISC)实现的x86处理器。除了一个或更多个微处理器或补充协处理器(诸如数学协处理器)之外,计算设备800还可包括一个或更多个CPU 806。
除(一个或更多个)CPU 806以外或替代(一个或更多个)CPU 806,(一个或更多个)GPU 808可被配置成执行计算机可读指令中的至少一些以控制计算设备800的一个或更多个组件执行本文所描述的方法和/或过程中的一个或更多个。GPU 808中的一个或更多个可为集成GPU(例如,有CPU 806中的一个或更多个)和/或GPU 808中的一个或更多个可为离散GPU。在实施例中,GPU 808中的一个或更多个可以是CPU 806中的一个或更多个的协处理器。GPU 808可由计算设备800使用以渲染图形(例如,3D图形)或执行通用计算。例如,GPU808可用于GPU上的通用计算(GPGPU)。GPU 808可包含能够同时处置数百或数千软件线程的数百或数千核心。GPU 808可响应于渲染命令(例如,经由主机接口从CPU 806接收的渲染命令)而产生输出图像的像素数据。GPU 808可包含用于存储像素数据或任何其他合适数据(例如,GPGPU数据)的图形存储器(例如,显示存储器)。显示存储器可作为存储器804的一部分被包括。GPU 808可包含并行操作(例如,经由链路)的两个或两个以上GPU。链路可以直接连接GPU(例如,使用NVLINK)或可以通过交换机(例如,使用NVSwitch)连接GPU。当组合在一起时,每一GPU 808可产生用于输出的不同部分或用于不同输出的像素数据或GPGPU数据(例如,用于第一图像的第一GPU和用于第二图像的第二GPU)。每一GPU可包含其自己的存储器,或可与其他GPU共享存储器。
除CPU 806和/或GPU 808之外或替代CPU 806和/或GPU 808,逻辑单元820可经配置以执行计算机可读指令中的至少一些以控制计算设备800的一个或更多个组件执行本文中所描述的方法和/或过程中的一个或更多个。在实施例中,(一个或更多个)CPU 806、(一个或更多个)GPU 808、和/或(一个或更多个)逻辑单元820可以离散地或联合地执行方法、过程和/或其部分的任何组合。逻辑单元820中的一个或更多个可为CPU 806和/或GPU 808中的一个或更多个中的一部分和/或集成于CPU 806和/或GPU 808中的一个或更多个和/或逻辑单元820中的一个或更多个可为离散组件或以其他方式在CPU 806和/或GPU 808外部。在实施例中,逻辑单元820中的一个或更多个可以是CPU 806中的一个或更多个和/或GPU808中的一个或更多个的协处理器。
逻辑单元820的示例包括一个或更多个处理核心和/或其组件,诸如数据处理单元(DPU)、张量核心(TC)、张量处理单元(TPU)、像素视觉核心(PVC)、视觉处理单元(VPU)、图形处理群集(GPC)、纹理处理群集(TPC)、流多处理器(SM)、树横向单元(TTU)、人工智能加速器(AIA)、深度学习加速器(DLA)、算术逻辑单元(ALU)、专用集成电路(ASIC)、浮点单元(FPU)、输入/输出(I/O)元件、***组件互连(PCI)或快速***组件互连(PCIe)元件等。
通信接口810可以包括使计算设备800能够经由电子通信网络(包括有线和/或无线通信)与其他计算设备通信的一个或更多个接收机、发射机和/或收发机。通信接口810可包括实现通过多个不同网络中的任一个进行通信的组件和功能,诸如无线网络(例如,Wi-Fi、Z-Wave、蓝牙、蓝牙LE、ZigBee等)、有线网络(例如,通过以太网或无限带通信)、低功率广域网(例如,LoRaWAN、SigFox等)和/或互联网。在一个或更多个实施例中,一个或更多个逻辑单元820和/或通信接口810可以包括一个或更多个数据处理单元(DPU)以将通过网络和/或通过互连***802接收的数据直接传输到一个或更多个GPU 808(例如,一个或更多个GPU 808的存储器)。
I/O端口812可以使得计算设备800能够逻辑地耦合到包括I/O组件814、(一个或更多个)呈现组件818和/或其他组件的其他设备,其中一些可以被内置到(例如,集成在)计算设备800中。说明性I/O组件814包括麦克风、鼠标、键盘、操纵杆、游戏垫、游戏控制器、碟形卫星天线、扫描仪、打印机、无线设备等。I/O组件814可以提供处理空中姿势、语音或由用户生成的其他生理输入的自然用户界面(NUI)。在一些情况下,可将输入发射到适当的网络元件以供进一步处理。NUI可实现与计算设备800的显示器相关联的语音识别、指示笔识别、面部识别、生物特征识别、屏幕上和屏幕附近的姿势识别、空中姿势、头部和眼睛跟踪、以及触摸识别(如以下更详细地描述的)的任何组合。计算设备800可以包括用于手势检测和识别的深度相机,诸如立体相机***、红外相机***、RGB相机***、触摸屏技术和这些的组合。另外,计算设备800可包含使得能够检测运动的加速度计或陀螺仪(例如,作为惯性测量单元(IMU)的部分)。在一些示例中,计算设备800可以使用加速度计或陀螺仪的输出来渲染沉浸式增强现实或虚拟现实。
电源816可包括硬连线电源、电池电源或其组合。电源816可向计算设备800提供电力以使得计算设备800的组件能够操作。
呈现组件818可包括显示器(例如,监视器、触摸屏、电视屏幕、平视显示器(HUD)、其他显示器类型或其组合)、扬声器和/或其他呈现组件。呈现组件818可从其他组件(例如,GPU 808、CPU 806、DPU等)接收数据,且输出所述数据(例如,作为图像、视频、声音等)。
示例数据中心
图9示出了可在本公开的至少一个实施例中使用的示例数据中心900。数据中心900可包括数据中心基础设施层910、框架层920、软件层930和/或应用层940。
如图9所示,数据中心基础设施层910可以包括资源协调器912、分组的计算资源914和节点计算资源(“节点C.R.s”)916(1)-916(N),其中“N”表示任何完整的正整数。在至少一个实施例中,节点C.R.s 916(1)-916(N)可包括,但不限于任何数量的中央处理单元(“CPU”)或其他处理器(包括DPU、加速器、现场可编程门阵列(FPGA)、图形处理器或图形处理单元(GPU)等),存储器设备(例如,动态只读存储器),存储设备(例如,固态或磁盘驱动器),网络输入/输出(“NW I/O”)装置、网络交换机、虚拟机(“VM”)、功率模块和/或冷却模块,等等。在一些实施例中,来自节点C.R.s 916(1)-916(N)中的一个或更多个节点C.R.s可对应于具有上述计算资源中的一个或更多个的服务器。此外,在一些实施例中,节点C.R.s916(1)-9161(N)可包括一个或更多个虚拟组件,诸如vGPU、vCPU等,和/或节点C.R.s 916(1)-916(N)中的一个或更多个可对应于虚拟机(VM)。
在至少一个实施例中,分组的计算资源914可包括容纳在一个或更多个机架(未示出)内的节点C.R.s 916的单独分组,或容纳在不同地理位置(也未示出)处的数据中心内的许多机架。分组的计算资源914内的节点C.R.s 916的单独分组可包括可被配置或分配来支持一个或更多个工作负荷的分组计算、网络、存储器或存储资源。在至少一个实施例中,包括CPU、GPU、DPU和/或其他处理器的若干节点C.R.s 916可以分组在一个或更多个机架内以提供计算资源来支持一个或更多个工作负荷。一个或更多个机架还可包括任意组合的任意数量的功率模块、冷却模块和/或网络交换机。
资源协调器912可配置或以其他方式控制一个或更多个节点C.R.s916(1)-916(N)和/或分组的计算资源914。在至少一个实施例中,资源协调器912可以包括用于数据中心900的软件设计基础设施(“SDI”)管理实体。资源协调器912可以包括硬件、软件或其某种组合。
在至少一个实施例中,如图9所示,框架层920可以包括作业调度器932、配置管理器934、资源管理器936和/或分布式文件***938。框架层920可以包括支持软件层930的软件932和/或应用层940的一个或更多个应用942的框架。软件932或应用942可分别包含基于网络的服务软件或应用,例如由Amazon(亚马逊)网络服务、Google Cloud(谷歌云)和Microsoft Azure提供的那些。框架层920可以是但不限于可以利用分布式文件***938进行大规模数据处理(例如,“大数据”)的免费和开源的软件网络应用框架(如Apache SparkTM(下文称为“Spark”))的类型。在至少一个实施例中,作业调度器932可以包括Spark驱动器以促进调度由数据中心900的不同层支持的工作负荷。配置管理器934可以能够配置不同层,诸如软件层930和框架层920(其包括用于支持大规模数据处理的Spark和分布式文件***938)。资源管理器936可以能够管理被映射到分布式文件***938和作业调度器932或被分配用于支持分布式文件***938和作业调度器933的集群的或分组的计算资源。在至少一个实施例中,集群的或分组的计算资源可包括在数据中心基础设施层910的分组的计算资源914。资源管理器936可与资源协调器912协调以管理这些被映射或分配的计算资源。
在至少一个实施例中,在软件层930中包括的软件932可包括由节点C.R.s 916(1)-916(N)、分组的计算资源914和/或框架层920的分布式文件***938中的至少部分使用的软件。一种或更多种类型的软件可以包括但不限于互联网网页搜索软件、电子邮件病毒扫描软件、数据库软件和流式视频内容软件。
在至少一个实施例中,在应用层940中包括的应用942可包括由节点C.R.s 916(1)-916(N)、分组的计算资源914和/或框架层920的分布式文件***938中的至少部分使用的一个或更多个类型的应用。一种或更多种类型的应用可以包括但不限于任何数量的基因组应用、认知计算和机器学习应用,包括训练或推断软件、机器学习框架软件(例如,PyTorch、TensorFlow、Caffe等)和/或结合一个或更多个实施例使用的其他机器学习应用。
在至少一个实施例中,配置管理器934、资源管理器936和资源协调器912中的任一个可基于在任何技术上可行的方式中获取的任何量和类型的数据来实现任何数量和类型的自修改动作。自修改动作可使数据中心900的数据中心操作者免于做出可能较差的配置决策和可能避免数据中心的未充分利用和/或较差执行部分。
根据本文描述的一个或更多个实施例,数据中心900可包括工具、服务、软件或其他资源来训练一个或更多个机器学习模型或使用一个或更多个机器学习模型来预测或推断信息。例如,可以通过使用以上相对于数据中心900描述的软件和/或计算资源根据神经网络架构来计算权重参数来训练(一个或更多个)机器学习模型。在至少一个实施例中,对应于一个或更多个神经网络的经训练或部署的机器学习模型可用于通过使用通过一种或多种训练技术(诸如但不限于本文中描述的那些训练技术)计算的权重参数,使用上文相对于数据中心900描述的资源来推断或预测信息。
在至少一个实施例中,数据中心900可使用CPU、专用集成电路(ASIC)、GPU、FPGA和/或其他硬件(或与其对应的虚拟计算资源)来使用上述资源执行训练和/或推断。此外,上文所描述的一或更多个软件和/或硬件资源可被配置为允许用户训练或执行对信息的推断的服务,例如图像识别、语音识别或其他人工智能服务。
示例网络环境
适合用于实现本公开的实施例的网络环境可以包括一个或更多个客户端设备、服务器、网络附加存储(NAS)、其他后端设备和/或其他设备类型。客户端设备、服务器和/或其他设备类型(例如,每个设备)可以在图8的(一个或更多个)计算设备800的一个或更多个实例上实现——例如,每个设备可以包括(一个或更多个)计算设备800的类似部件、特征和/或功能。此外,在实现后端设备(例如,服务器、NAS等)的情况下,后端设备可被包括作为数据中心900的一部分,数据中心900的示例在本文中关于图9更详细地描述。
网络环境的组件可经由网络彼此通信,所述网络可为有线的、无线的或为两者。网络可以包括多个网络或多个网络中的一个网络。例如,网络可包括一个或更多个广域网(WAN)、一个或更多个局域网(LAN)、一个或更多个公共网络(诸如互联网和/或公共交换电话网(PSTN))和/或一个或更多个私有网络。在网络包括无线电信网络的情况下,诸如基站、通信塔或者甚至接入点(以及其他组件)的组件可以提供无线连接。
兼容的网络环境可以包括一个或更多个对等网络环境(在这种情况下,服务器可以不被包括在网络环境中)和一个或更多个客户端-服务器网络环境(在这种情况下,一个或更多个服务器可以被包括在网络环境中)。在对等网络环境中,本文针对服务器所描述的功能可在任何数量的客户端设备上实现。
在至少一个实施例中,网络环境可包括一个或更多个基于云的网络环境、分布式计算环境、其组合等。基于云的网络环境可包括框架层、作业调度器、资源管理器和在一个或更多个服务器上实现的分布式文件***,所述服务器可包括一个或更多个核心网服务器和/或边缘服务器。框架层可包括支持软件层的软件和/或应用层的一个或更多个应用的框架。软件或应用可分别包含基于网络的服务软件或应用。在实施例中,一个或更多个客户端设备可以使用基于网络的服务软件或应用(例如,通过经由一个或更多个应用编程接口(API)访问服务软件和/或应用)。框架层可以是但不限于如可以使用分布式文件***进行大规模数据处理(例如,“大数据”)的一种免费和开源软件网络应用框架。
基于云的网络环境可提供执行本文描述的计算和/或数据存储功能(或其一个或更多个部分)的任何组合的云计算和/或云存储。这些不同功能中的任何功能可以分布在来自(例如,可以分布在州、地区、国家、全球等的一个或更多个数据中心的)中央或核心服务器的多个位置上。如果与用户(例如,客户端设备)的连接相对靠近边缘服务器,则核心服务器可以将功能的至少一部分指定给边缘服务器。基于云的网络环境可以是私有的(例如,限于单个组织),可以是公共的(例如,对许多组织可用),和/或其组合(例如,混合云环境)。
(一个或更多个)客户端设备可以包括本文关于图8所描述的(一个或更多个)示例计算设备800的组件、特征和功能中的至少一些。作为示例而非限制,客户端设备可被实现为个人计算机(PC),膝上型计算机、移动设备、智能电话、平板计算机、智能手表、可穿戴计算机、个人数字助理(PDA)、MP3播放器、虚拟现实耳机、全球定位***(GPS)或设备、视频播放器、相机、监视设备或***、车辆、船、飞船、虚拟机、无人机、机器人、手持式通信设备、医院设备、游戏设备或***、娱乐***、车辆计算机***、嵌入式***控制器、遥控器、电器、消费电子设备、工作站、边缘设备、这些描绘的设备的任何组合或任何其他合适的设备。
本公开可以在由计算机或者诸如个人数字助理或其他手持式设备之类的其他机器执行的、包括诸如程序模块之类的计算机可执行指令的机器可使用指令或者计算机代码的一般背景下进行描述。通常,包括例程、程序、对象、组件、数据结构等等的程序模块指的是执行特定任务或者实现特定抽象数据类型的代码。本公开可以在各种各样的***配置中实践,这些配置包括手持式设备、消费电子器件、通用计算机、更专业的计算设备等等。本公开也可以在其中任务由通过通信网络链接的远程处理设备执行的分布式计算环境中实践。
如在本文中使用的,“和/或”关于两个或更多元件的叙述应当解释为仅指一个元件或者元件组合。例如,“元件A、元件B和/或元件C”可以包括仅仅元件A,仅仅元件B,仅仅元件C,元件A和元件B,元件A和元件C,元件B和元件C,或者元件A、B和C。此外,“元件A或元件B中的至少一个”可以包括元件A中的至少一个,元件B中的至少一个,或者元件A中的至少一个和元件B中的至少一个。进一步,“元件A和元件B中的至少一个”可以包括元件A中的至少一个,元件B中的至少一个,或者元件A中的至少一个和元件B中的至少一个。
本文详细地描述了本公开的主题以满足法定要求。然而,描述本身并非意在限制本公开的范围。相反地,本公开人已经设想到,要求保护的主题也可以以其他的方式具体化,以包括与本文中结合其他当前或未来技术描述的步骤不同的步骤或者相似的步骤的组合。而且,尽管术语“步骤”和/或“块”在本文中可以用来隐含采用的方法的不同元件,但是这些术语不应当被解释为暗示本文公开的各个步骤之中或之间的任何特定顺序,除非明确描述了各步骤的顺序。

Claims (20)

1.一种***,包括:
一个或更多个处理单元,用于执行操作,所述操作包括:
接收使用一个或更多个相机生成的图像数据,所述图像数据表示描绘由车辆的一个或更多个前照灯照亮的一个或更多个对象的一个或更多个图像;
使用所述图像数据计算与所述一个或更多个图像中描绘的所述一个或更多个对象相对应的一个或更多个像素的一个或更多个对比度值;以及
发送数据以使所述车辆至少基于与所述一个或更多个对象相对应的像素的对比度值来调整所述一个或更多个前照灯的一个或更多个参数。
2.根据权利要求1所述的***,其中所述一个或更多个前照灯中的前照灯包括多个照明元件,并且其中所述发送数据导致对所述多个照明元件中的至少一个照明元件的调整。
3.根据权利要求1所述的***,其中与所述一个或更多个对象相对应的所述一个或更多个像素的所述一个或更多个对比度值是相对于全局参考亮度值计算的。
4.根据权利要求1所述的***,其中与所述一个或更多个对象相对应的所述一个或更多个像素的所述一个或更多个对比度值是相对于至少基于与对应于所述一个或更多个对象的所述像素中的一个或更多个像素的接近度而选择的一组像素计算的。
5.根据权利要求1所述的***,其中与所述一个或更多个对象相对应的所述一个或更多个像素的所述一个或更多个对比度值存储在至少一个图像的一个或更多个通道中。
6.根据权利要求1所述的***,还包括确定与所述一个或更多个对象相对应的所述一个或更多个像素的数量,所述一个或更多个像素具有满足阈值的对比度值,其中所述发送数据以使所述车辆至少基于所述像素的数量调整所述一个或更多个前照灯的一个或更多个参数。
7.根据权利要求1所述的***,其中所述发送数据以使所述车辆至少基于将所述一个或更多个对比度值与对应于用于计算所述对比度值的参考亮度值的阈值进行比较调整所述一个或更多个前照灯的所述一个或更多个参数。
8.根据权利要求1所述的***,还包括将所述一个或更多个像素与最小大小阈值进行比较,其中所述发送数据以使所述车辆至少基于所述像素超过最小大小阈值调整所述一个或更多个前照灯的所述一个或更多个参数。
9.根据权利要求1所述的***,还包括确定由所述一个或更多个像素占据的图像区域的一个或更多个尺寸超过最小大小阈值,其中所述发送数据以使所述车辆至少基于所述一个或更多个尺寸超过所述最小大小阈值调整所述一个或更多个前照灯的所述一个或更多个参数,所述最小大小阈值被计算为所述图像的一个或更多个尺寸的百分比。
10.一种方法,包括:
接收使用一个或更多个相机生成的图像数据,所述图像数据表示描绘与环境中的机器相关联的一个或更多个视场的一个或更多个图像;
检测所述一个或更多个视场中的一个或更多个对象;
至少基于所述检测所述一个或更多个对象,在所述一个或更多个图像中确定与所述一个或更多个对象相对应的感兴趣区域;
使用所述图像数据计算所述一个或更多个图像中的一个或更多个像素的一个或更多个对比度值;
从对应于所述感兴趣区域的所述一个或更多个对比度值分析一组对比度值;以及
发送数据以使所述机器至少基于分析所述一组对比度值来执行一个或更多个操作。
11.根据权利要求10所述的方法,其中检测所述一个或更多个视场中的所述一个或更多个对象包括识别所述一个或更多个图像中的感兴趣区域。
12.根据权利要求10所述的方法,其中检测所述一个或更多个视场中的所述一个或更多个对象包括将所述一个或更多个图像应用于机器学习模型,所述机器学习模型经训练以推理所述一个或更多个对象的一个或更多个位置以及对应于所述一个或更多个位置的所述区域。
13.根据权利要求10所述的方法,其中发送所述数据导致对使用所述机器操作的多个照明元件中的照明元件的修改。
14.根据权利要求10所述的方法,其中分析所述一组对比度值包括确定所述感兴趣区域中具有满足阈值的对比度值的像素的数量。
15.一种处理器,包括:
一个或更多个电路,用于接收使用机器的一个或更多个相机生成的图像数据,计算由所述图像数据表示的一个或更多个图像中的像素的对比度值,并发送数据以使所述机器至少基于分析与在所述一个或更多个图像中检测到的一个或更多个对象相对应的一组对比度值执行一个或更多个操作。
16.根据权利要求15所述的处理器,其中,所述一组对比度值对应于所述一个或更多个图像中的一个或更多个对象的一个或更多个边界形状。
17.根据权利要求15所述的处理器,其中所述一个或更多个操作包括修改所述机器的一个或更多个前照灯的多个照明元件中的照明元件。
18.根据权利要求15所述的处理器,其中所述分析包括确定满足阈值的所述一组对比度值的数量,其中使所述机器至少基于所述数量执行所述一个或更多个操作。
19.根据权利要求15所述的处理器,其中所述一组对比度值中的所述对比度值是相对于至少基于与对应于所述一组对比度值的一个或更多个像素的接近度而选择的一组像素计算的。
20.根据权利要求15所述的处理器,其中,所述处理器包括在以下至少一项中:
用于自主或半自主机器的控制***;
用于自主或半自主机器的感知***;
用于执行模拟操作的***;
用于执行深度学习操作的***;
使用边缘设备实现的***;
使用机器人实现的***;
包含一个或更多个虚拟机VM的***;
至少部分在数据中心中实现的***;或者
至少部分使用云计算资源实现的***。
CN202211193096.9A 2021-12-13 2022-09-28 针对自主***和应用程序使用图像对比度分析的眩光减轻 Pending CN116263944A (zh)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
US17/549,418 2021-12-13
US17/549,418 US20230186593A1 (en) 2021-12-13 2021-12-13 Glare mitigation using image contrast analysis for autonomous systems and applications

Publications (1)

Publication Number Publication Date
CN116263944A true CN116263944A (zh) 2023-06-16

Family

ID=86498848

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202211193096.9A Pending CN116263944A (zh) 2021-12-13 2022-09-28 针对自主***和应用程序使用图像对比度分析的眩光减轻

Country Status (4)

Country Link
US (1) US20230186593A1 (zh)
JP (1) JP2023087616A (zh)
CN (1) CN116263944A (zh)
DE (1) DE102022132478A1 (zh)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR102584501B1 (ko) * 2018-10-05 2023-10-04 삼성전자주식회사 자율 주행 장치의 객체 인식 방법 및 자율 주행 장치

Family Cites Families (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US10380451B2 (en) * 2014-11-06 2019-08-13 Gentex Corporation System and method for visibility range detection
JP6552979B2 (ja) * 2016-02-16 2019-07-31 株式会社日立製作所 画像処理装置、警告装置、画像処理システム、画像処理方法
TWI647828B (zh) * 2017-07-10 2019-01-11 海華科技股份有限公司 可攜式電子裝置及其影像擷取模組與影像感測組件

Also Published As

Publication number Publication date
DE102022132478A1 (de) 2023-06-15
JP2023087616A (ja) 2023-06-23
US20230186593A1 (en) 2023-06-15

Similar Documents

Publication Publication Date Title
US11508049B2 (en) Deep neural network processing for sensor blindness detection in autonomous machine applications
US11941819B2 (en) Object detection using skewed polygons suitable for parking space detection
US11841458B2 (en) Domain restriction of neural networks through synthetic data pre-training
CN113139642B (zh) 在自主驾驶应用中使用神经网络执行故障检测
CN112989914B (zh) 具有自适应加权输入的注视确定机器学习***
US11841987B2 (en) Gaze determination using glare as input
CN111133448A (zh) 使用安全到达时间控制自动驾驶车辆
US20230054759A1 (en) Object tracking using lidar data for autonomous machine applications
US20240059295A1 (en) Multi-view geometry-based hazard detection for autonomous systems and applications
US20230341235A1 (en) Automatic graphical content recognition for vehicle applications
CN118119981A (zh) 用于自主***和应用的使用机器学习的自由空间检测
US20230360255A1 (en) Joint 2d and 3d object tracking for autonomous systems and applications
CN116263944A (zh) 针对自主***和应用程序使用图像对比度分析的眩光减轻
US20230298268A1 (en) Environment reconstruction and path planning for autonomous systems and applications
CN116772874A (zh) 用于自主***和应用的使用占用网格进行危险检测
CN116500619A (zh) 用于汽车雷达感知的雷达信号采样
CN116263688A (zh) 在自主***和应用程序中使用特征描述符绘图进行单个和跨传感器对象追踪
CN116106934A (zh) 用于自主机器应用的基于粒子的危险检测
EP3850539B1 (en) Deep neural network processing for sensor blindness detection in autonomous machine applications
US20240022601A1 (en) Detecting identity spoofing attacks in multi-sensor systems and applications
US20230360232A1 (en) Object tracking and time-to-collision estimation for autonomous systems and applications
CN117011329A (zh) 用于自主***和应用的对象追踪和碰撞时间估计
JP2023082647A (ja) 自律システム及びアプリケーションのためのカメラベースの入力を使用した深層学習ベースの動作領域検証
CN118154639A (zh) 用于自主***及应用的对象跟踪管理
CN117516565A (zh) 用于在自主***和应用中导航的车道偏置

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination