CN117734713A - 推定装置、推定方法以及存储介质 - Google Patents

推定装置、推定方法以及存储介质 Download PDF

Info

Publication number
CN117734713A
CN117734713A CN202311207733.8A CN202311207733A CN117734713A CN 117734713 A CN117734713 A CN 117734713A CN 202311207733 A CN202311207733 A CN 202311207733A CN 117734713 A CN117734713 A CN 117734713A
Authority
CN
China
Prior art keywords
parameter
mobile body
learning
vehicle
learned model
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202311207733.8A
Other languages
English (en)
Inventor
后藤建
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Honda Motor Co Ltd
Original Assignee
Honda Motor Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Honda Motor Co Ltd filed Critical Honda Motor Co Ltd
Publication of CN117734713A publication Critical patent/CN117734713A/zh
Pending legal-status Critical Current

Links

Classifications

    • BPERFORMING OPERATIONS; TRANSPORTING
    • B60VEHICLES IN GENERAL
    • B60WCONJOINT CONTROL OF VEHICLE SUB-UNITS OF DIFFERENT TYPE OR DIFFERENT FUNCTION; CONTROL SYSTEMS SPECIALLY ADAPTED FOR HYBRID VEHICLES; ROAD VEHICLE DRIVE CONTROL SYSTEMS FOR PURPOSES NOT RELATED TO THE CONTROL OF A PARTICULAR SUB-UNIT
    • B60W40/00Estimation or calculation of non-directly measurable driving parameters for road vehicle drive control systems not related to the control of a particular sub unit, e.g. by using mathematical models
    • B60W40/02Estimation or calculation of non-directly measurable driving parameters for road vehicle drive control systems not related to the control of a particular sub unit, e.g. by using mathematical models related to ambient conditions
    • B60W40/04Traffic conditions
    • GPHYSICS
    • G08SIGNALLING
    • G08GTRAFFIC CONTROL SYSTEMS
    • G08G1/00Traffic control systems for road vehicles
    • G08G1/16Anti-collision systems
    • G08G1/167Driving aids for lane monitoring, lane changing, e.g. blind spot detection
    • BPERFORMING OPERATIONS; TRANSPORTING
    • B60VEHICLES IN GENERAL
    • B60WCONJOINT CONTROL OF VEHICLE SUB-UNITS OF DIFFERENT TYPE OR DIFFERENT FUNCTION; CONTROL SYSTEMS SPECIALLY ADAPTED FOR HYBRID VEHICLES; ROAD VEHICLE DRIVE CONTROL SYSTEMS FOR PURPOSES NOT RELATED TO THE CONTROL OF A PARTICULAR SUB-UNIT
    • B60W2552/00Input parameters relating to infrastructure
    • B60W2552/10Number of lanes
    • BPERFORMING OPERATIONS; TRANSPORTING
    • B60VEHICLES IN GENERAL
    • B60WCONJOINT CONTROL OF VEHICLE SUB-UNITS OF DIFFERENT TYPE OR DIFFERENT FUNCTION; CONTROL SYSTEMS SPECIALLY ADAPTED FOR HYBRID VEHICLES; ROAD VEHICLE DRIVE CONTROL SYSTEMS FOR PURPOSES NOT RELATED TO THE CONTROL OF A PARTICULAR SUB-UNIT
    • B60W2554/00Input parameters relating to objects
    • B60W2554/40Dynamic objects, e.g. animals, windblown objects
    • B60W2554/404Characteristics
    • B60W2554/4041Position
    • BPERFORMING OPERATIONS; TRANSPORTING
    • B60VEHICLES IN GENERAL
    • B60WCONJOINT CONTROL OF VEHICLE SUB-UNITS OF DIFFERENT TYPE OR DIFFERENT FUNCTION; CONTROL SYSTEMS SPECIALLY ADAPTED FOR HYBRID VEHICLES; ROAD VEHICLE DRIVE CONTROL SYSTEMS FOR PURPOSES NOT RELATED TO THE CONTROL OF A PARTICULAR SUB-UNIT
    • B60W2554/00Input parameters relating to objects
    • B60W2554/40Dynamic objects, e.g. animals, windblown objects
    • B60W2554/404Characteristics
    • B60W2554/4045Intention, e.g. lane change or imminent movement
    • BPERFORMING OPERATIONS; TRANSPORTING
    • B60VEHICLES IN GENERAL
    • B60WCONJOINT CONTROL OF VEHICLE SUB-UNITS OF DIFFERENT TYPE OR DIFFERENT FUNCTION; CONTROL SYSTEMS SPECIALLY ADAPTED FOR HYBRID VEHICLES; ROAD VEHICLE DRIVE CONTROL SYSTEMS FOR PURPOSES NOT RELATED TO THE CONTROL OF A PARTICULAR SUB-UNIT
    • B60W2554/00Input parameters relating to objects
    • B60W2554/80Spatial relation or speed relative to objects
    • B60W2554/802Longitudinal distance
    • BPERFORMING OPERATIONS; TRANSPORTING
    • B60VEHICLES IN GENERAL
    • B60WCONJOINT CONTROL OF VEHICLE SUB-UNITS OF DIFFERENT TYPE OR DIFFERENT FUNCTION; CONTROL SYSTEMS SPECIALLY ADAPTED FOR HYBRID VEHICLES; ROAD VEHICLE DRIVE CONTROL SYSTEMS FOR PURPOSES NOT RELATED TO THE CONTROL OF A PARTICULAR SUB-UNIT
    • B60W2554/00Input parameters relating to objects
    • B60W2554/80Spatial relation or speed relative to objects
    • B60W2554/804Relative longitudinal speed
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V20/00Scenes; Scene-specific elements
    • G06V20/50Context or environment of the image
    • G06V20/56Context or environment of the image exterior to a vehicle by using sensors mounted on the vehicle
    • G06V20/58Recognition of moving objects or obstacles, e.g. vehicles or pedestrians; Recognition of traffic objects, e.g. traffic signs, traffic lights or roads

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Automation & Control Theory (AREA)
  • Mathematical Physics (AREA)
  • Transportation (AREA)
  • Mechanical Engineering (AREA)
  • General Physics & Mathematics (AREA)
  • Traffic Control Systems (AREA)
  • Control Of Driving Devices And Active Controlling Of Vehicle (AREA)

Abstract

本发明提供能够高精度地推定移动体的汇合时的其他移动体的行为的推定装置、推定方法以及存储介质。一种推定装置,其推定其他移动体针对移动体的行动,其中,具备:取得部,其通过向第一学习完毕模型以及第二学习完毕模型输入作为实际参数,从而取得预测参数;以及推定部,其通过对预测参数以及预测参数的对象时间点的实际参数进行比较,从而推定其他移动体是否进行规定行动。

Description

推定装置、推定方法以及存储介质
技术领域
本发明涉及推定装置、推定方法以及存储介质。
背景技术
以往,已知有在移动体从行驶车道向相邻车道进行车道变更时控制该移动体的行驶的技术。例如,在日本特开2019-31268号公报中记载了,按照基于与车辆的操作关联的被动地收集到的数据进行学习得到的控制策略而使该车辆向第二车辆与第三车辆之间汇合的技术。
专利文献1所记载的技术是通过对与车辆的操作关联的被动地收集到的数据应用被动的演员-评论家(actor-critic)强化学习方法从而学习控制策略的技术。然而,在以往技术中,存在成为移动体汇合的对象的其他移动体的数据未被有效地活用的情况。其结果是,存在无法高精度地推定移动体的汇合时的其他移动体的行为的情况。
发明内容
本发明是考虑这样的情况而完成的,目的之一在于提供通过有效地活用成为移动体汇合的对象的其他移动体的数据从而能够高精度地推定移动体的汇合时的其他移动体的行为的推定装置、推定方法以及存储介质。
本发明的推定装置、推定方法以及程序采用了以下的结构。
(1):本发明的一方案的推定装置推定其他移动体针对移动体的行动,其中,所述推定装置具备:取得部,其通过向第一学习完毕模型以及第二学习完毕模型输入实际参数,从而取得预测参数,所述第一学习完毕模型通过将所述其他移动体进行了规定行动的第一场景中的表示所述移动体与所述其他移动体的关系的时间序列的第一参数作为学习数据、并将所述第一场景中的表示所述其他移动体的状态的第二参数作为正解数据且以当输入所述第一参数时输出所述第二参数的分布信息的方式进行学习而得到,所述第二学习完毕模型通过将所述其他移动体未进行所述规定行动的第二场景中的所述第一参数作为学习数据、并将所述第二场景中的所述第二参数作为正解数据且以当输入所述第一参数时输出所述第二参数的分布信息的方式进行学习而得到,所述实际参数为所述第一参数,所述预测参数为所述第二参数;以及推定部,其通过对所述预测参数与所述预测参数的对象时间点的实际参数进行比较,从而推定所述其他移动体是否进行所述规定行动。
(2):在上述(1)的方案的基础上,所述第一参数至少包括所述其他移动体与所述移动体的相对速度、所述其他移动体与所述移动体的相对位置以及所述移动体的速度。
(3):在上述(1)的方案的基础上,从所述第一学习完毕模型输出的所述第二参数的分布信息是和在所述其他移动体进行了所述规定行动的情况下预测的所述其他移动体与所述移动体的相对速度以及相对位置相关的第一分布信息,从所述第二学习完毕模型输出的所述第二参数的分布信息是和在所述其他移动体未进行所述规定行动的情况下预测的所述其他移动体与所述移动体的相对速度以及相对位置相关的第二分布信息。
(4):在上述(3)的方案的基础上,所述推定部将所述其他移动体是否进行所述规定行动作为概率值而反复推定,所述推定部基于进行了所述推定的上次时间点的所述概率值、进行所述推定的本次时间点的所述第一分布信息以及进行所述推定的本次时间点的所述第二分布信息,推定所述本次时间点的所述概率值。
(5):在上述(4)的方案的基础上,所述推定部使用以当输入表示所述移动体与所述其他移动体的关系的参数时将所述其他移动体是否进行所述规定行动作为概率值输出的方式进行学习而得到的第三学习完毕模型,推定所述反复推定中的初次时间点的所述概率值。
(6):在上述(4)的方案的基础上,所述推定装置还具备基于所述概率值支援所述移动体的驾驶的驾驶支援部。
(7):在上述(1)至(6)的方案的基础上,所述规定行动是表示在所述移动体从行驶车道向相邻车道进行车道变更时在所述相邻车道行驶的所述其他移动体许可所述移动体先行的行动。
(8):本发明的另一方案的推定方法由推定其他移动体针对移动体的行动的计算机执行,其中,所述推定方法使所述计算机进行如下处理:通过向第一学习完毕模型以及第二学习完毕模型输入实际参数,从而取得预测参数,所述第一学习完毕模型通过将所述其他移动体进行了规定行动的第一场景中的表示所述移动体与所述其他移动体的关系的时间序列的第一参数作为学习数据、并将所述第一场景中的表示所述其他移动体的状态的第二参数作为正解数据且以当输入所述第一参数时输出所述第二参数的分布信息的方式进行学习而得到,所述第二学习完毕模型通过将所述其他移动体未进行所述规定行动的第二场景中的所述第一参数作为学习数据、并将所述第二场景中的所述第二参数作为正解数据且以当输入所述第一参数时输出所述第二参数的分布信息的方式进行学习而得到,所述实际参数为所述第一参数,所述预测参数为所述第二参数,通过对所述预测参数与所述预测参数的对象时间点的实际参数进行比较,从而推定所述其他移动体是否进行所述规定行动。
(9):本发明的又一方案的存储介质,其存储有程序,所述程序由推定其他移动体针对移动体的行动的计算机执行,其中,所述程序使所述计算机进行如下处理:通过向第一学习完毕模型以及第二学习完毕模型输入实际参数,从而取得预测参数,所述第一学习完毕模型通过将所述其他移动体进行了规定行动的第一场景中的表示所述移动体与所述其他移动体的关系的时间序列的第一参数作为学习数据、并将所述第一场景中的表示所述其他移动体的状态的第二参数作为正解数据且以当输入所述第一参数时输出所述第二参数的分布信息的方式进行学习而得到,所述第二学习完毕模型通过将所述其他移动体未进行所述规定行动的第二场景中的所述第一参数作为学习数据、并将所述第二场景中的所述第二参数作为正解数据且以当输入所述第一参数时输出所述第二参数的分布信息的方式进行学习而得到,所述实际参数为所述第一参数,所述预测参数为所述第二参数,通过对所述预测参数与所述预测参数的对象时间点的实际参数进行比较,从而推定所述其他移动体是否进行所述规定行动。
根据(1)~(9)的方案,通过有效地活用成为移动体汇合的对象的其他移动体的数据,从而能够高精度地推定移动体的汇合时的其他移动体的行为。
附图说明
图1是搭载实施方式的驾驶支援装置的车辆的结构图。
图2是示出由汇合识别部识别的汇合车道的一例的图。
图3是示出为了生成第一学习完毕模型以及第二学习完毕模型而使用的学习数据与正解数据的结构的一例的图。
图4是示出基于由学习生成的第一学习完毕模型以及第二学习完毕模型的输入输出的结构的一例的图。
图5是示出由参数取得部取得的预测参数的分布信息的一例的图。
图6是示出由本实施方式的推定装置执行的处理的流程的一例的流程图。
具体实施方式
以下,参照附图对本发明的推定装置、推定方法以及程序的实施方式进行说明。本实施方式的推定装置通过对由基于以其他车辆进行了规定行动为前提收集到的学习数据而生成的第一学习完毕模型以及基于以其他车辆未进行规定行动为前提收集到的学习数据而生成的第二学习完毕模型输出的其他车辆的状态的预测分布与其他车辆的实际参数进行比较,从而推定该其他车辆是否进行规定行动。以下,作为一例,在车辆的汇合时,设为为了推定在被汇合车道行驶的其他车辆作为规定行动是否让道而应用本实施方式的推定装置的例子进行说明。
[整体结构]
图1是搭载实施方式的驾驶支援装置100的车辆M的结构图。车辆M例如是二轮、三轮、四轮等车辆,其驱动源是柴油发动机、汽油发动机等内燃机、电动机或者它们的组合。电动机使用由与内燃机连结的发电机发出的发电电力、或者二次电池、燃料电池的放电电力而动作。车辆M是“移动体”的一例。
在车辆M例如搭载相机10、雷达装置12、LIDAR(Light Detection and Ranging)14、物体识别装置16、HMI(Human Machine Interface)30、车辆传感器40、导航装置50、驾驶员监视相机60、驾驶操作件70、驾驶支援装置100、行驶驱动力输出装置200、制动装置210以及转向装置220。这些装置、设备通过CAN(Controller Area Network)通信线等多路通信线、串行通信线、无线通信网等而相互连接。需要说明的是,图1所示的结构只是一例,可以省略结构的一部分,也可以还追加别的结构。
相机10例如是利用了CCD(Charge Coupled Device)、CMOS(Complementary MetalOxide Semiconductor)等固体摄像元件的数码相机。相机10安装于搭载车辆***1的车辆(以下,称作本车辆M)的任意部位。在对前方进行拍摄的情况下,相机10安装于前风窗玻璃上部、车室内后视镜背面等。相机10例如周期性地反复拍摄本车辆M的周边。相机10也可以是立体相机。
雷达装置12向本车辆M的周边放射毫米波等电波,并且检测由物体反射的电波(反射波)而至少检测物体的位置(距离以及方位)。雷达装置12安装于本车辆M的任意部位。雷达装置12也可以通过FM-CW(Frequency Modulated Continuous Wave)方式来检测物体的位置以及速度。
LIDAR14向本车辆M的周边照射光(或者接近光的波长的电磁波),并测定散射光。LIDAR14基于从发光到受光的时间,检测到对象的距离。所照射的光例如是脉冲状的激光。LIDAR14安装于本车辆M的任意部位。
物体识别装置16对由相机10、雷达装置12以及LIDAR14中的一部分或全部检测的检测结果进行传感器融合处理,而识别物体的位置、种类、速度等。物体识别装置16将识别结果向驾驶支援装置100输出。物体识别装置16也可以将相机10、雷达装置12以及LIDAR14的检测结果原样向驾驶支援装置100输出。也可以从车辆***1中省略物体识别装置16。
HMI30对本车辆M的乘员提示各种信息,并且接受由乘员进行的输入操作。HMI30包括各种显示装置、扬声器、蜂鸣器、振动产生装置(振动器)、触摸面板、开关、按键等。
车辆传感器40包括检测本车辆M的速度的车速传感器、检测加速度的加速度传感器、检测绕铅垂轴的角速度的横摆角速度传感器、检测本车辆M的朝向的方位传感器等。
导航装置50例如具有GNSS(Global Navigation Satellite System)接收机、引导控制部、存储有地图信息的存储部等。GNSS接收机基于从GNSS卫星接收到的信号,确定本车辆M的位置。本车辆M的位置也可以通过利用车辆传感器40的输出的INS(InertialNavigation System)来确定或补充。引导控制部例如参照地图信息来决定从由GNSS接收机确定的本车辆M的位置(或者输入的任意的位置)到由乘员输入的目的地的路径,并以使本车辆M沿着路径行驶的方式向HMI30输出引导信息。地图信息例如是通过表示道路的路段与由路段连接的节点来表现道路形状的信息。地图信息也可以包括道路的曲率、POI(PointOfInterest)信息等。导航装置50也可以经由通信装置向导航服务器发送本车辆M的当前位置以及目的地,并从导航服务器取得路径。
驾驶员监视相机60例如是利用了CCD、CMOS等固体摄像元件的数码相机。驾驶员监视相机60以能够从正面拍摄就座于本车辆M的驾驶员座的乘员的头部的位置以及朝向安装于本车辆M中的任意部位。驾驶员监视相机60将从所配置的位置对包括本车辆M的驾驶员的车室内进行拍摄得到的图像向驾驶支援装置100输出。
驾驶操作件70例如包括油门踏板、制动踏板、转向盘、换挡杆、其他操作件。在驾驶操作件70安装有检测操作量或者操作的有无的传感器,其检测结果向行驶驱动力输出装置200、制动装置210以及转向装置220中的一部分或全部输出。
行驶驱动力输出装置200将用于车辆行驶的行驶驱动力(转矩)向驱动轮输出。行驶驱动力输出装置200例如具备内燃机、电动机及变速器等的组合以及控制它们的ECU(Electronic Control Unit)。ECU按照从驾驶支援装置100输入的信息或者从驾驶操作件70输入的信息,控制上述的结构。
制动装置210例如具备制动钳、向制动钳传递液压的液压缸、使液压缸产生液压的电动马达以及ECU。ECU按照从驾驶支援装置100输入的信息、或者从驾驶操作件70输入的信息来控制电动马达,以使与制动操作相应的制动转矩向各车轮输出。制动装置210可以具备将通过驾驶操作件70所包括的制动踏板的操作而产生的液压经由主液压缸向液压缸传递的机构来作为备用。需要说明的是,制动装置210并不限于上述说明了的结构,也可以是按照从驾驶支援装置100输入的信息来控制致动器并将主液压缸的液压向液压缸传递的电子控制式液压制动装置。
转向装置220例如具备转向ECU以及电动马达。电动马达例如向齿条-小齿轮机构作用力而变更转向轮的朝向。转向ECU按照从驾驶支援装置100输入的信息或者从驾驶操作件70输入的信息,驱动电动马达,使转向轮的朝向变更。
[驾驶支援装置]
驾驶支援装置100例如具备汇合识别部110、参数取得部120、汇合推定部130、驾驶支援部140以及存储部150。汇合识别部110、参数取得部120、汇合推定部130、驾驶支援部140例如通过CPU(Central Processing Unit)等硬件处理器执行程序(软件)而实现。另外,这些构成要素中的一部分或全部可以通过LSI(Large Scale Integration)、ASIC(Application Specific Integrated Circuit)、FPGA(Field-Programmable GateArray)、GPU(Graphics Processing Unit)等硬件(包括电路部:circuitry)而实现,也可以通过软件与硬件的协同配合而实现。程序可以预先保存于驾驶支援装置100的HDD、闪存器等存储装置(具备非暂时性的存储介质的存储装置),也可以保存于DVD、CD-ROM等能够装卸的存储介质,并通过存储介质(非暂时性的存储介质)装配于驱动装置而安装于驾驶支援装置100的HDD、闪存器。
存储部150例如通过ROM(Read Only Memory)、闪存器、SD卡、RAM(Random AccessMemory)、HDD(Hard Disk Drive)、寄存器等而实现。存储部150例如存储第一学习完毕模型152、第二学习完毕模型154以及第三学习完毕模型156。至少包括参数取得部120、汇合推定部130以及存储于存储部150的第一学习完毕模型152及第二学习完毕模型154的装置是“推定装置”的一例。另外,在本实施方式中,第一学习完毕模型152、第二学习完毕模型154以及第三学习完毕模型156存储于存储部150,并被驾驶支援装置100的功能部利用,但也可以代替于此,这些学习完毕模型的一部分或全部例如存储于驾驶支援装置100的外部的云上,并经由网络被驾驶支援装置100利用。
汇合识别部110识别本车辆M的行驶车道是需要进行向相邻车道的车道变更的汇合车道。图2是示出由汇合识别部110识别的汇合车道的一例的图。图2表示本车辆M的行驶车道L1是需要进行向相邻车道L2的车道变更的汇合车道。例如,汇合识别部110能够在基于由相机10识别出的道路划分线信息识别出本车辆M的行驶车道的宽度在行进方向上减小到零并且能够进行向相邻车道的车道变更的情况下,识别出本车辆M的行驶车道为汇合车道。另外,例如,汇合识别部110通过对使用导航装置50由GNSS接收机确定的本车辆M的当前位置与地图信息进行对照,从而能够识别出本车辆M的行驶车道为汇合车道。
汇合识别部110当识别出本车辆M的行驶车道为汇合车道时,接着,判定在成为本车辆M汇合的对象的相邻车道(即,被汇合车道)是否存在其他车辆。更具体而言,例如,汇合识别部110基于由物体识别装置16识别出的信息,判定以本车辆M的重心C为基准在相邻车道的延伸方向上规定距离d以内(即,规定范围内)是否存在其他车辆。在判定为在规定距离d以内不存在其他车辆的情况下,驾驶支援部140例如使HMI30显示推荐本车辆M进行从行驶车道向相邻车道的车道变更的推荐信息。另一方面,在判定为在规定距离d以内存在其他车辆的情况下,汇合识别部110将该其他车辆识别为被以下说明的参数取得部120以及汇合推定部130执行处理的处理对象。在图2所示的场景的情况下,汇合识别部110将其他车辆M1识别为被参数取得部120以及汇合推定部130执行处理的处理对象。
参数取得部120针对由汇合识别部110识别为处理对象的其他车辆,以时间序列(以规定的控制循环)取得表示本车辆M与其他车辆的关系的第一参数。第一参数例如至少包括其他车辆与本车辆M的相对速度、其他车辆与本车辆M的相对位置以及本车辆M的速度。例如,参数取得部120能够基于由相机10以时间序列拍摄到的其他车辆的图像,算出其他车辆与本车辆M的相对速度以及相对位置。另外,例如,参数取得部120能够从车辆传感器40取得本车辆M的速度。在图2所示的场景的情况下,汇合识别部110针对其他车辆M1,取得其他车辆M1与本车辆M的相对速度、其他车辆M1与本车辆M的相对位置以及本车辆M的速度。以下,存在将其他车辆与本车辆M的相对速度以及其他车辆与本车辆M的相对位置分别称为“其他车辆的相对速度”以及“其他车辆的相对位置”的情况。
参数取得部120当针对由汇合识别部110识别为处理对象的其他车辆取得第一参数时,将所取得的第一参数向第一学习完毕模型152以及第二学习完毕模型154输入,从而取得表示该其他车辆的状态的第二参数的分布信息。在此,表示其他车辆的状态的第二参数例如表示上述控制循环的下一步骤中的其他车辆的相对速度以及相对位置。以下,对第一学习完毕模型152以及第二学习完毕模型154的详细情况进行说明。
图3是示出为了生成第一学习完毕模型152以及第二学习完毕模型154而使用的学习数据与正解数据的结构的一例的图。在图3所示的表中,输入与学习数据对应,输出与正解数据对应。符号s表示其他车辆的状态。更具体而言,输入的学习数据的状态s表示其他车辆的相对速度及相对位置以及本车辆M的速度,输出的正解数据的状态s表示其他车辆的相对速度以及相对位置。符号t表示控制循环中的时间点。例如,图3所示的表的t=5的记录示出表示控制循环中的时间点5的其他车辆的状态s5的数据相对于表示控制循环中的从时间点0到时间点4的其他车辆的状态s0至s4的数据建立了对应关系。
为了基于上述的数据结构生成第一学习完毕模型152而使用的学习数据与正解数据是以在本车辆M从行驶车道向相邻车道进行车道变更时在该相邻车道行驶的其他车辆有意地进行了表示许可本车辆M先行的行动(即,让道的行动)为前提而收集的数据。例如,在图2所示的场景中,驾驶其他车辆M1的被实验者与由本车辆M进行的向相邻车道的接近相应地进行有意地让道的行动,且在进行了有意地让道的行动时取得的其他车辆的状态数据被存储为学习数据以及正解数据。在此,有意地让道的行动例如是指与由本车辆M进行的向相邻车道的接近相应地被实验者使其他车辆M1减速而在与先行车辆M2之间隔开空间的行动。让道的行动是“规定行动”的一例。
另一方面,为了生成第二学习完毕模型154而使用的学习数据与正解数据是以在本车辆M从行驶车道向相邻车道进行车道变更时在该相邻车道行驶的其他车辆进行了表示不许可本车辆M先行的行动(即,不让道的行动)为前提而收集的数据。例如,在图2所示的场景中,驾驶其他车辆M1的被实验者与由本车辆M进行的向相邻车道的接近相应地进行有意地不让道的行动,且在进行了有意地不让道的行动时取得的其他车辆的状态数据被存储为学习数据以及正解数据。在此,有意地不让道的行动例如是指与由本车辆M进行的向相邻车道的接近相应地被实验者使其他车辆M1加速(或不减速)而压缩与先行车辆M2之间的空间的行动。
这样,第一学习完毕模型152是基于存储有通过被实验者进行有意地让道的行动从而取得的其他车辆的状态数据的学习数据与正解数据而生成的学习完毕模型,第二学习完毕模型154是基于存储有通过被实验者进行有意地不让道的行动从而取得的其他车辆的状态数据的学习数据与正解数据而生成的学习完毕模型。使用这些学习数据与正解数据,例如利用作为考虑时间序列的RNN(Recurrent Neural Network)的一种的LSTM(LongShort Term Memory)等方法,进行学习,并生成第一学习完毕模型152以及第二学习完毕模型154。
图4是示出基于由学习生成的第一学习完毕模型152以及第二学习完毕模型154的输入输出的结构的一例的图。如图4所示那样,第一学习完毕模型152以及第二学习完毕模型154与控制循环中的本次步骤的其他车辆的相对速度及相对位置以及本车辆M的速度的输入相应地输出与下一步骤的其他车辆的相对速度以及相对位置相关的预测分布。更具体而言,在本实施方式中,下一步骤中的其他车辆的相对速度以及相对位置假定为依照正态分布,第一学习完毕模型152以及第二学习完毕模型154以输出表示下一步骤中的其他车辆的相对速度以及相对位置的正态分布的期望值以及方差的方式进行学习。
换言之,第一学习完毕模型152是表示如果其他车辆对本车辆M让道,则在下一步骤中该其他车辆采取何种相对速度以及相对位置的概率高的分布信息。另一方面,第二学习完毕模型154是表示如果其他车辆对本车辆M不让道,则在下一步骤中该其他车辆采取何种相对速度以及相对位置的概率高的分布信息。向第一学习完毕模型152以及第二学习完毕模型154输入的控制循环中的本次步骤的其他车辆的相对速度及相对位置以及本车辆M的速度是“实际参数”的一例,从第一学习完毕模型152以及第二学习完毕模型154输出的表示下一步骤中的其他车辆的相对速度以及相对位置的正态分布的期望值以及方差是“预测参数”的一例。
图5是示出由参数取得部120取得的预测参数的分布信息的一例的图。图5作为一例,表示第一学习完毕模型152以及第二学习完毕模型154分别将预测参数中的与相对位置相关的分布信息作为正态分布而输出的例子。此时输出的正态分布的期望值表示其他车辆的移动目的地的期望值,方差表示与其他车辆的移动相关的个体差异以及传感器误差(即,包括相机10的误差以及车辆传感器40的误差)。汇合推定部130通过对由参数取得部120取得的预测参数与在预测参数的对象时间点计测出的实际参数(即,在下一步骤中计测出的实际参数)进行比较,从而推定其他车辆是否让道。以下,对由汇合推定部130执行的推定处理详细进行说明。
首先,汇合推定部130针对被汇合识别部110识别为处理对象的其他车辆是否让道,使用第三学习完毕模型156,推定初始时间点的概率(即,初始概率)。第三学习完毕模型156是以当输入表示本车辆M与其他车辆的关系的第一参数时将该其他车辆是否让道作为概率值输出的方式进行学习而得到的学习完毕模型。为了生成第三学习完毕模型156而使用的学习数据是规定时间点的(即,非时间序列的)第一参数的数据,正解数据是表示以该规定时间点的第一参数的状态为前提其他车辆是否让了道的信息(例如,在让了的情况下为1,在未让的情况下为0)。为了生成第三学习完毕模型156而使用的学习数据和正解数据与第一学习完毕模型152以及第二学习完毕模型154不同,是通过被实验者基于自身的判断以让道/不让道的方式驾驶其他车辆从而收集到的数据。以下,P(让=1|s0)表示与初始时间点0的第一参数s0的输入相应地由第三学习完毕模型156输出的其他车辆让道这样的初始概率,P(让=0|s0)表示与初始时间点0的第一参数s0的输入相应地由第三学习完毕模型156输出的其他车辆不让道这样的初始概率。
此时,也可以是,在由第三学习完毕模型156输出的初始概率为阈值(例如,0.8)以上的情况下,汇合推定部130不执行使用第一学习完毕模型152以及第二学习完毕模型154的处理,驾驶支援部140例如使HMI30显示推荐本车辆M进行从行驶车道向相邻车道的车道变更的推荐信息。另外,例如也可以是,在由第三学习完毕模型156输出的初始概率小于另一阈值(例如,0.2)的情况下,汇合推定部130不执行使用第一学习完毕模型152以及第二学习完毕模型154的处理,驾驶支援部140例如使HMI30显示推荐本车辆M不进行从行驶车道向相邻车道的车道变更的推荐信息。
接着,汇合推定部130当针对其他车辆算出初始概率时,按照以下的顺序,利用贝叶斯推定,以时间序列(即,关于时间点k(k=1,2,…))更新该其他车辆让道的概率。更具体而言,汇合推定部130将时间点0的第一参数s0向第一学习完毕模型152以及第二学习完毕模型154输入,取得时间点1的预测分布p(s1|让=1,s0)以及p(s1|让=0,s0)。汇合推定部130接着对所取得的预测分布p(s1|让=1,s0)以及p(s1|让=0,s0)代入在时间点1计测出的实际参数(即,其他车辆的相对位置以及相对速度),从而取得实际的概率值。图5表示通过代入时间点1的其他车辆M1的相对位置而得到的概率值,在图5的情况下,作为一例,表示p(s1|让=1,s0)>p(s1|让=0,s0)成立的状况。这样,上述的预测参数与实际参数的“比较”是指通过将在下一步骤中实际计测出的实际参数代入由预测参数定义的预测分布而取得概率值。
接着,汇合推定部130通过对其他车辆让道的上次的概率值P(让=1|s0)乘以其他车辆让道的本次步骤的概率值p(s1|让=1,s0),从而作为α=p(s1|让=1,s0)P(让=1|s0)算出,并通过对其他车辆不让道的上次的概率值P(让=0|s0)乘以其他车辆不让道的本次步骤的概率值p(s1|让=0,s0),从而算出β=p(s1|让=1,s0)P(让=0|s0)。α以及β的值意味着考虑了上次的概率值的本次步骤的概率值。接着,汇合推定部130将α以及β的值作为概率值而归一化,并得到考虑了时间点0的状态s0的时间点1的概率值P(让=1|s0:1)=α/(α+β)以及P(让=0|s0:1)=β/(α+β)。汇合推定部130将得到的概率值P(让=1|s0:1)以及P(让=0|s0:1)用作推定时间点2的概率值方面的上次值。
当将如以上那样说明了的概率值的计算处理一般化时,汇合推定部130基于考虑了从时间点0到时间点t-1的状态s0:t-1的其他车辆让道的上次的概率值P(让=1|s0:t-1)以及其他车辆不让道的上次的概率值P(让=0|s0:t-1)与时间点t-1的状态st-1,如果其他车辆让道,则算出表示在时间点t该其他车辆取得何种相对速度以及相对位置的预测分布p(st|让=1,st-1),并且如果其他车辆不让道,则算出表示在时间点t该其他车辆取得何种相对速度以及相对位置的预测分布p(st|让=0,st-1)。接着,汇合推定部130算出α=p(st|让=1,st-1)P(让=1|s0:t-1)以及β=p(st|让=1,st-1)P(让=1|s0:t-1),并将α以及β的值归一化,从而算出其他车辆让道的本次步骤的概率值P(让=1|s0:t)=α/(α+β)以及其他车辆不让道的本次步骤的概率值P(让=0|s0:t)=β/(α+β)。由此,能够考虑其他车辆的时间序列状态而准确地推定该其他车辆让道还是不让道。
驾驶支援部140判定由汇合推定部130以时间序列更新的其他车辆让道的本次步骤的概率值P(让=1|s0:t)是否为阈值以上,并在判定为本次步骤的概率值P(让=1|s0:t)为阈值以上的情况下,使HMI30显示推荐本车辆M进行从行驶车道向相邻车道的车道变更的推荐信息。另外,例如也可以是,驾驶支援部140判定由汇合推定部130以时间序列更新的其他车辆不让道的本次步骤的概率值P(让=0|s0:t)是否为阈值以上,并在判定为本次步骤的概率值P(让=0|s0:t)为阈值以上的情况下,使HMI30显示推荐本车辆M不进行从行驶车道向相邻车道的车道变更的推荐信息。
接着,参照图6对由本实施方式的推定装置执行的处理的流程进行说明。图6是示出由本实施方式的推定装置执行的处理的流程的一例的流程图。图6所示的流程图的处理在本车辆M行驶中反复执行。
首先,汇合识别部110例如基于由相机10识别出的道路划分线信息,判定是否识别出本车辆M的行驶车道为汇合车道(步骤S100)。在判定为未识别出本车辆M的行驶车道为汇合车道的情况下,汇合识别部110使处理返回步骤S100。另一方面,在判定为识别出本车辆M的行驶车道为汇合车道的情况下,汇合识别部110判定在被汇合车道的规定范围内是否识别出其他车辆(步骤S102)。在判定为在被汇合车道的规定范围内未识别出其他车辆的情况下,汇合识别部110使处理向后述的步骤S114前进。
另一方面,在判定为在被汇合车道的规定范围内识别出其他车辆的情况下,参数取得部120取得识别出的其他车辆的第一参数(即,其他车辆与本车辆M的相对速度、其他车辆与本车辆M的相对位置以及本车辆M的速度)(步骤S104)。接着,汇合推定部130将所取得的第一参数向第三学习完毕模型156输入,而取得其他车辆让道的初始概率(步骤S106)。
接着,驾驶支援部140判定所取得的初始概率是否为阈值以上(步骤S108)。在判定为所取得的初始概率为阈值以上的情况下,驾驶支援部140使处理向步骤S114前进。另一方面,在判定为所取得的初始概率小于阈值的情况下,汇合推定部130使用第一学习完毕模型152、第二学习完毕模型154以及上次步骤的概率值(在初次的情况下为初始概率),算出其他车辆让道的本次步骤的概率值(步骤S110)。
接着,驾驶支援部140判定所算出的本次步骤的概率值是否为阈值以上(步骤S112)。在判定为所算出的本次步骤的概率值为阈值以上的情况下,驾驶支援部140使HMI30显示推荐本车辆M进行从行驶车道向相邻车道的车道变更的推荐信息(步骤S114)。另一方面,在判定为所算出的本次步骤的概率值小于阈值的情况下,汇合推定部130将所算出的本次步骤的概率值设定为上次步骤的概率值,而再次执行步骤S110的处理。由此,本流程图的处理结束。
需要说明的是,在上述的实施方式中,驾驶支援部140基于由汇合推定部130以时间序列推定的概率值,支援本车辆M的驾驶。然而,本发明并不限定于那样的结构,本发明也能够应用于本车辆M的自动驾驶。例如,也可以是,驾驶支援装置100代替驾驶支援部140而具备行驶控制部,行驶控制部例如在所推定的概率值为阈值以上的情况下,以使本车辆M进行车道变更的方式进行转向的控制。
并且,在上述的实施方式中,作为规定行动,对在由本车辆M进行的汇合时其他车辆是否让道进行推定。然而,本发明并不限定于那样的结构,本发明也能够应用于汇合时以外的控制。例如,本发明也能够应用于与作为规定行动而在由本车辆M进行的交叉路口处的左右转时作为相向车的其他车辆是否让道相关的推定。在该情况下,第一学习完毕模型152基于以相向车辆让了道为前提收集到的学习数据以及正解数据而生成,第二学习完毕模型154基于以相向车辆未让道为前提收集到的学习数据以及正解数据而生成。另外,例如,本发明也能够应用于与作为规定行动而在由本车辆M进行的驻车场中的停车时相向车辆是否让出驻车空间相关的推定。在该情况下,第一学习完毕模型152基于以相向车辆让出驻车空间为前提收集到的学习数据以及正解数据而生成,第二学习完毕模型154基于以相向车辆未让出驻车空间为前提收集到的学习数据以及正解数据而生成。
并且,在上述的实施方式中,推定装置搭载于本车辆M。然而,本发明并不限定于那样的结构,例如,推定装置的功能也可以搭载于设置在汇合道路并监视车辆的基础设施相机。在该情况下,在图6的流程图中,步骤S100省略,在步骤S102的处理中,在汇合车道行驶的某车辆与在被汇合车道行驶的其他车辆之间的距离成为规定范围内的情况下,执行从步骤S104到步骤S112的处理。在步骤S112中,也可以是,在判定为其他车辆让道的概率为阈值以上的情况下,基础设施相机通过无线通信向在汇合车道行驶的车辆发送推荐车道变更的信息。
根据如以上那样说明了的本实施方式,在车辆的汇合时,通过对由基于以其他车辆让了道为前提收集到的学习数据而生成的第一学习完毕模型以及基于以其他车辆让了道为前提收集到的学习数据而生成的第二学习完毕模型输出的其他车辆的状态的预测分布与其他车辆的实际参数进行比较,从而推定该其他车辆是否让道。由此,通过有效地活用成为移动体汇合的对象的其他移动体的数据,从而能够高精度地推定移动体的汇合时的其他移动体的行为。
上述说明的实施方式能够如以下这样表现。
一种推定装置,其构成为,具备:
存储介质(storage medium),其保存能够由推定其他移动体针对移动体的行动的计算机读入的命令(computer-readable instructions);以及
处理器,其连接于所述存储介质,
所述处理器通过执行能够由所述计算机读入的命令(the processor executingthe computer-readable instructions to:),从而进行如下处理:
通过向第一学习完毕模型以及第二学习完毕模型输入实际参数,从而取得预测参数,所述第一学习完毕模型通过将所述其他移动体进行了规定行动的第一场景中的表示所述移动体与所述其他移动体的关系的时间序列的第一参数作为学习数据、并将所述第一场景中的表示所述其他移动体的状态的第二参数作为正解数据且以当输入所述第一参数时输出所述第二参数的方式进行学习而得到,所述第二学习完毕模型通过将所述其他移动体未进行所述规定行动的第二场景中的所述第一参数作为学习数据、并将所述第二场景中的所述第二参数作为正解数据且以当输入所述第一参数时输出所述第二参数的方式进行学习而得到,所述实际参数为所述第一参数,所述预测参数为所述第二参数的分布信息,
通过对所述预测参数与所述其他移动体的所述预测参数输出时的实际参数进行比较,从而推定所述其他移动体是否进行所述规定行动。
以上使用实施方式说明了本发明的具体实施方式,但本发明丝毫不被这样的实施方式限定,在不脱离本发明的主旨的范围内能够施加各种变形以及替换。

Claims (9)

1.一种推定装置,其推定其他移动体针对移动体的行动,其中,
所述推定装置具备:
取得部,其通过向第一学习完毕模型以及第二学习完毕模型输入实际参数,从而取得预测参数,所述第一学习完毕模型通过将所述其他移动体进行了规定行动的第一场景中的表示所述移动体与所述其他移动体的关系的时间序列的第一参数作为学习数据、并将所述第一场景中的表示所述其他移动体的状态的第二参数作为正解数据且以当输入所述第一参数时输出所述第二参数的分布信息的方式进行学习而得到,所述第二学习完毕模型通过将所述其他移动体未进行所述规定行动的第二场景中的所述第一参数作为学习数据、并将所述第二场景中的所述第二参数作为正解数据且以当输入所述第一参数时输出所述第二参数的分布信息的方式进行学习而得到,所述实际参数为所述第一参数,所述预测参数为所述第二参数的分布信息;以及
推定部,其通过对所述预测参数与所述预测参数的对象时间点的实际参数进行比较,从而推定所述其他移动体是否进行所述规定行动。
2.根据权利要求1所述的推定装置,其中,
所述第一参数至少包括所述其他移动体与所述移动体的相对速度、所述其他移动体与所述移动体的相对位置以及所述移动体的速度。
3.根据权利要求1所述的推定装置,其中,
从所述第一学习完毕模型输出的所述第二参数的分布信息是和在所述其他移动体进行了所述规定行动的情况下预测的所述其他移动体与所述移动体的相对速度以及相对位置相关的第一分布信息,从所述第二学习完毕模型输出的所述第二参数的分布信息是和在所述其他移动体未进行所述规定行动的情况下预测的所述其他移动体与所述移动体的相对速度以及相对位置相关的第二分布信息。
4.根据权利要求3所述的推定装置,其中,
所述推定部将所述其他移动体是否进行所述规定行动作为概率值而反复推定,
所述推定部基于进行了所述推定的上次时间点的所述概率值、进行所述推定的本次时间点的所述第一分布信息以及进行所述推定的本次时间点的所述第二分布信息,推定所述本次时间点的所述概率值。
5.根据权利要求4所述的推定装置,其中,
所述推定部使用以当输入表示所述移动体与所述其他移动体的关系的参数时将所述其他移动体是否进行所述规定行动作为概率值输出的方式进行学习而得到的第三学习完毕模型,推定所述反复推定中的初次时间点的所述概率值。
6.根据权利要求4所述的推定装置,其中,
所述推定装置还具备基于所述概率值支援所述移动体的驾驶的驾驶支援部。
7.根据权利要求1至6中任一项所述的推定装置,其中,
所述规定行动是表示在所述移动体从行驶车道向相邻车道进行车道变更时在所述相邻车道行驶的所述其他移动体许可所述移动体先行的行动。
8.一种推定方法,其由推定其他移动体针对移动体的行动的计算机执行,其中,
所述推定方法使所述计算机进行如下处理:
通过向第一学习完毕模型以及第二学习完毕模型输入实际参数,从而取得预测参数,所述第一学习完毕模型通过将所述其他移动体进行了规定行动的第一场景中的表示所述移动体与所述其他移动体的关系的时间序列的第一参数作为学习数据、并将所述第一场景中的表示所述其他移动体的状态的第二参数作为正解数据且以当输入所述第一参数时输出所述第二参数的分布信息的方式进行学习而得到,所述第二学习完毕模型通过将所述其他移动体未进行所述规定行动的第二场景中的所述第一参数作为学习数据、并将所述第二场景中的所述第二参数作为正解数据且以当输入所述第一参数时输出所述第二参数的分布信息的方式进行学习而得到,所述实际参数为所述第一参数,所述预测参数为所述第二参数的分布信息,
通过对所述预测参数与所述预测参数的对象时间点的实际参数进行比较,从而推定所述其他移动体是否进行所述规定行动。
9.一种存储介质,其存储有程序,所述程序由推定其他移动体针对移动体的行动的计算机执行,其中,
所述程序使所述计算机进行如下处理:
通过向第一学习完毕模型以及第二学习完毕模型输入实际参数,从而取得预测参数,所述第一学习完毕模型通过将所述其他移动体进行了规定行动的第一场景中的表示所述移动体与所述其他移动体的关系的时间序列的第一参数作为学习数据、并将所述第一场景中的表示所述其他移动体的状态的第二参数作为正解数据且以当输入所述第一参数时输出所述第二参数的分布信息的方式进行学习而得到,所述第二学习完毕模型通过将所述其他移动体未进行所述规定行动的第二场景中的所述第一参数作为学习数据、并将所述第二场景中的所述第二参数作为正解数据且以当输入所述第一参数时输出所述第二参数的分布信息的方式进行学习而得到,所述实际参数为所述第一参数,所述预测参数为所述第二参数的分布信息,
通过对所述预测参数与所述预测参数的对象时间点的实际参数进行比较,从而推定所述其他移动体是否进行所述规定行动。
CN202311207733.8A 2022-09-21 2023-09-19 推定装置、推定方法以及存储介质 Pending CN117734713A (zh)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
JP2022150240A JP2024044611A (ja) 2022-09-21 2022-09-21 推定装置、推定方法、およびプログラム
JP2022-150240 2022-09-21

Publications (1)

Publication Number Publication Date
CN117734713A true CN117734713A (zh) 2024-03-22

Family

ID=90245178

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202311207733.8A Pending CN117734713A (zh) 2022-09-21 2023-09-19 推定装置、推定方法以及存储介质

Country Status (3)

Country Link
US (1) US20240092365A1 (zh)
JP (1) JP2024044611A (zh)
CN (1) CN117734713A (zh)

Also Published As

Publication number Publication date
US20240092365A1 (en) 2024-03-21
JP2024044611A (ja) 2024-04-02

Similar Documents

Publication Publication Date Title
CN112208533B (zh) 车辆控制***、车辆控制方法及存储介质
CN110949390B (zh) 车辆控制装置、车辆控制方法及存储介质
CN113460081A (zh) 车辆控制装置、车辆控制方法及存储介质
CN111762169A (zh) 车辆控制装置和车辆
CN114475646B (zh) 车辆控制装置、车辆控制方法及存储介质
CN115140086A (zh) 车辆控制装置、车辆控制方法及存储介质
US20240067229A1 (en) Vehicle control device, vehicle control method, and storage medium
CN110816524B (zh) 车辆控制装置、车辆控制方法及存储介质
CN115443236A (zh) 车辆控制装置、车辆***、车辆控制方法及程序
US11908200B2 (en) System and method in the prediction of target vehicle behavior based on image frame and normalization
CN113479204B (zh) 车辆控制装置、车辆控制方法及存储介质
CN115158347A (zh) 移动体控制装置、移动体控制方法及存储介质
CN114954511A (zh) 车辆控制装置、车辆控制方法以及存储介质
CN117734713A (zh) 推定装置、推定方法以及存储介质
CN114684190A (zh) 车辆控制装置、车辆控制方法及存储介质
CN113899307A (zh) 处理装置、处理方法及存储介质
CN113492844A (zh) 车辆控制装置、车辆控制方法及存储介质
US20230382396A1 (en) Driving assistance device, driving assistance method, and storage medium
CN112172804B (zh) 车辆控制装置、车辆控制方法及存储介质
US20230382413A1 (en) Driving assistance device, driving assistance method, and storage medium
CN115147689B (zh) 识别装置、车辆***、识别方法以及存储介质
US20240174258A1 (en) Vehicle control device, vehicle control method, and storage medium
US20230286503A1 (en) Driving assistance device, driving assistance method, and storage medium
US20230242148A1 (en) Vehicle controller and vehicle control method
US20240051530A1 (en) Vehicle control device, vehicle control method, and storage medium

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination