CN109670597A - 一种自动驾驶的机器学习多目的控制方法 - Google Patents

一种自动驾驶的机器学习多目的控制方法 Download PDF

Info

Publication number
CN109670597A
CN109670597A CN201710905331.3A CN201710905331A CN109670597A CN 109670597 A CN109670597 A CN 109670597A CN 201710905331 A CN201710905331 A CN 201710905331A CN 109670597 A CN109670597 A CN 109670597A
Authority
CN
China
Prior art keywords
probability
machine learning
image
automatic pilot
space
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201710905331.3A
Other languages
English (en)
Inventor
顾泽苍
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Individual
Original Assignee
Individual
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Individual filed Critical Individual
Priority to CN201710905331.3A priority Critical patent/CN109670597A/zh
Publication of CN109670597A publication Critical patent/CN109670597A/zh
Pending legal-status Critical Current

Links

Landscapes

  • Image Analysis (AREA)

Abstract

本发明涉及信息处理领域中的一种自动驾驶的机器学习多目的控制方法,其特征在于:将不同空间的多目的的目标函数映射到同一个空间,通过机器学习实现优良驾驶员的“知识获得”,进行多目的最佳控制的机器学习调节。本发明实施效果是:利用各个多目的函数的模糊关系,以及通过机器学习获得的优良驾驶员的自动驾驶知识,可实现自动驾驶的多目的最佳控制,解决了自动控制问题上的难题,其效果超越模糊推论的控制方法。

Description

一种自动驾驶的机器学习多目的控制方法
【技术领域】
本发明属于人工智能领域中的一种自动驾驶的机器学习多目的控制方法。
【背景技术】
自动驾驶是人工智能的主战场,但是遗憾的是针对自动驾驶应用的专用的机器学习的研究成果甚少,至今仍没有引起广泛的注意。
日本著名的丰田公司发表了“驾驶指向推定装置”的专利(专利文献1),该专利提出根据汽车自动驾驶过程中,针对突发的情况,即使驾驶员没有反映的情况下,通过人工智能的逆传递神经网络的机器学习算法,自动的选择驾驶状态,以避免行车事故的发生等。
2016年10月9日日本NHK由解说委员室山哲也所讲解的“如何跨越自动驾驶的壁垒”(非专利文献1)。在这个专题上,室山哲也提出了在自动驾驶***中目前还解决不了的几个问题:
人机判断冲突疑难:今年2月在谷歌进行自动驾驶的实验,当谷歌车右拐时,前面有一沙堆的障碍物,谷歌车急向右车道闪去,正好这时右车道后面来了一辆大巴,大巴的驾驶员认为谷歌车会迅速刹车,没想到会往右车道躲闪,因此出现了撞车的严重事故。
车距选择的人机感觉融合的疑难:按某公司的调查,路上遇车时,有41%的驾驶员是认为离这车越远越好,但是也有人认为跟着固定距离比较好,或认为接近一点好,还有人抱有好奇心要追上前面的车。这是作为自动驾驶汽车如何解决人机感觉融合问题,以及如何选择最接近于人的驾驶问题,这成为了复杂的自动控制疑难。
人机权限转让问题:在人机操作的转换阶段,人机之间的意识是不能传递的。例如在紧急情况下,需由自动驾驶马上切换到人工驾驶的瞬间,自动驾驶当时所选的应急方案与人工驾驶不同,容易造成事故,或贻误时机。
Trolley问题:在遇到紧急时刻,如何使牺牲者的数量降至最少?这是有名的Trolley问题,既涉及复杂的伦理疑难,也是技术难点。在机器学习的自动驾驶理论中,目前尚没有人提出过有价值的解决方案。
由日立大岛弘安发表的“用模糊预测控制实现列车自动驾驶”的论文(非专利文献2),该论文提出通过模糊推论的规则库可以实现列车的自动驾驶。
由筑波大学安信诚二发表的“采用预测模糊控制的列车自动驾驶***”(非专利文献3),提出传统的PID调节虽然可以准确的控制列车自动驾驶的走行,但圆滑的行走是自动驾驶的关键,也是乘者感到舒适的关键。以及自动驾驶的核心问题是一个需要考虑安全性,走行速度,车站间的走行时间,舒适感,消耗电力,以及停止精度的多目的控制问题。
【专利文献】
【专利文献1】(特开2008-225923)
【非专利文献1】http://www.nhk.or.jp/kaisetsu-blog/100/255089.html
【非专利文献2】
https://www.jstage.jst.go.jp/article/ieejeiss1987/109/5/109_5_337/_pdf
【非专利文献3】
http://ttt.akiba.coocan.jp/yasunobu/edu/intconthtms/text/Sic07a_trainATO.pdf#search=%27予見ファジィ一制御列車自動運転システム%27
上述(专利文献1),采用人工智能的神经网络算法,但是,神经网络算法中主要是通过“训练”将目标函数的信息承载在海量的加权值的参数上,加权值W,与阀值T在学***差距甚大。如今进入深度学习的阶段,同传统的神经网络相比只增加了隐藏层的数量,这更加使计算的复杂度加大,传统神经网络的致命黑箱问题得不到解决,在自动驾驶中就存在着安全隐患,应用的前景很难期待。
上述(非专利文献1)所提出的“人机判断冲突疑难”,“车距选择的人机感觉融合的疑难”,“人机权限转让问题”以及“Trolley问题”应该成为人工智能自动驾驶中必须要解决的问题,应成为人工智能的核心问题,然而目前却没有引起广泛的重视。
上述(非专利文献2)主要解决的是列车的自动驾驶问题,所提出的利用模糊推论的规则库实现列车的自动驾驶,庞大的知识库的建立需要大数据的学习,只能解决两三个以内的目标函数,在汽车自动驾驶中的应用比较困难。
上述(非专利文献3)虽然提出了多目的的模糊控制,也是因为所采用的模糊控制在对应较多的目标函数的控制上比较勉强,因此仍然停留在针对每一个具体的目标函数的单独控制。特别是在自动驾驶中的人机感觉的融合及安全性,节能,舒适等目标函数,多目标的同时控制,由于不同的目标函数不在同一空间,无法找到一个共同的最佳化的控制点,即使映射到同一空间,不同的目标函数用传统的方法不可能得到一个共同的最佳交点,为此,必须寻找多目的最佳控制之间的冗余,真正实现在最佳的范围内实现多目的的最佳的控制,因此,需要解决多目的控制的机器学习模型的建立。
下面先对本专利申请所涉及到的专业术语进行定义,以下定义中包含本发明内容。
概率空间(Probability Space):
基于苏联数学家Andrey Kolmogorov的“概率论是以测度论为基础的”理论,所谓的概率空间就是一个总的测度为“1”的可测空间。
根据概率空间的定义可以产生引理:概率空间中只存在一个概率分布,概率空间距离一定是跨越欧几里德空间的复数概率空间之间的距离。
概率分布(Probability Distribution):
所谓的概率分布是针对概率函数,按其发生可能性的大小的排列。
概率尺度(Probability Scale):
在概率空间中的任意一个概率分布必然存在一个概率尺度,可标定概率分布的程度。
根据概率空间的定义可以产生引理:通过概率尺度,必然可以得到概率空间的所有概率分布信息。
概率密度(Probability Density):
事件在给定面积上的概率值。
模糊事件概率的测度(Probability Measure of Fazzy Event)
在包括概率空间在内的欧几里德空间S,如果p(x)满足概率测度的可加性,μA(x)是一个隶属函数(Membership Function)同时也满足模糊测度的可加性,则模糊事件概率的集合A的测度P(A)为:
公式1
P(A)=∫SμA(x)p(x)dx
其离散表达公式为:
公式2
智能***(Intelligent System):
智能***是依据确定性的算法所实现的***,是按照一种算法实现某种目标函数的处理,其处理结果是确定性的***。
人工智能(Artificial Intelligence):
什么是人工智能?简单讲就是用计算机实现人的头脑功能,即通过计算机实现人的头脑思维所产生的效果,所要解决的问题,其处理结果往往是不确定性的,或者说是事先不可预知的。
也可以说,人工智能是将人为介入所产生的效果模型化,定式化,更具体的定义,人工智能是通过机器学习的算法实现概率模型的最深入的应用。
聚类(Clustering):
在固定的领域内,按照一种尺度聚集数据的算法,是静态的处理过程。
自组织(Self-organization):
自律的获得目标函数,即可让数据自律的向高概率的方向迁移的算法,是动态的处理过程。
机器学习(Machine Learning)的定义:
计算机自律的从数据中获得规律的模型。
概率尺度自组织(Self-organizing based on a Probability Scale):
设概率空间存在着如下的一个概率分布的集合G,集合中含有ζ个数据:
公式3
gf∈G (f=1,2,…,ζ)
在概率空间的这个概率分布gf(f=1,2,…,ζ)中,必然存在一个在特征值A(G),由于概率空间是测度空间,因此针对特征值A(G)必然存在一个概率尺度M[G,A(G)],满足如下概率尺度自组织的条件时,可以概率尺度为基准,让集合G(n)朝着最大概率方向迁移。
公式4
A(n)=A(G(n))
M(n)=M[G(n),A(G(n))]
G(n)=G{[A(G(n-1)),M[G(n-1),A(G(n-1))]]
当n≥β(β是一个大于4的数值)时,可以设定A(G(n))为最大概率特征值,M[G(n),A(G(n))]是以最大概率特征值为中心的最大概率尺度。
高阶最大几率(Higher Order Maximum Probability):
超越传统统计学所计算出的平均值,以及方差值,即最为接近母体所预测出的平均值,以及方差值。
概率空间距离(Probabilistic Spatial Distance)
设欧几里德空间E中所包含的一个概率空间的概率分布W中的中心点w,以及在欧几里德空间E中所包含的另一个概率空间的概率分布V中的中心点v之间是一个穿越欧几里德空间与概率空间的两个位置,其从w到达v的距离:
公式5
这里,Δ(v)为由w到v的方向,当从欧几里德空间进入概率分布V的概率空间后,在概率空间内所产生的距离误差,Δ(v)中的(V)表示从w的位置开始穿越欧几里德空间进入概率空间所经过的概率分布V的概率值所产生的距离误差,也就是说Δ(v)是与w经过概率分布V的概率值有关的误差值,而与从概率分布W的中心w开始穿越概率分布W时所经过的概率分布W的概率值无关。
超深度学习(Super Deep Learning):
由感知层,神经层以及脑皮层构成的,并由层与层之间的节点之间用概率尺度自组织的机器学习所连接的分散型机器学习的新型神经网络模型。
【发明内容】
本发明的第一个目的是:提出一种适于自动驾驶的汽车环境图像识别算法,通过空间映射将汽车环境图像映射到若干个适于自动驾驶的汽车环境图像识别的映射图像,通过对每一个映射图像的最大概率区域的识别,将非结构化的汽车环境图像的结构信息抽出,从而达到对汽车环境图像的理解。
本发明的第二个目的是:提出一种适于自动驾驶的多目的最佳控制机器学习模型以及***装置,可将安全驾驶,车间距离,准确停车,快速到达,舒适乘车,节约能耗等多目的的目标函数进行最佳的机器学习模型的控制。
本发明的第三个目的是:让自动驾驶可以模仿优良驾驶员的驾驶方法,提高自动驾驶的水平。
本发明的第四个目的是:解决黑箱问题,以及单芯片离线方式也可以正常进行的自动驾驶***,
为实现上述至少一种目的,提出一种自动驾驶的机器学习多目的控制方法,本发明提出如下技术方案:
一种自动驾驶的机器学习多目的控制方法,其特征在于:
(1)将不同空间的多目的的目标函数映射到同一个空间;
(2)通过机器学习实现优良驾驶员的“知识获得”;
(3)进行多目的最佳控制的机器学习调节。
而且,所述将将不同空间的多目的的目标函数映射到同一个空间,是指将各个目标函数按照最好为100最坏为0通过隶属函数(Membership Function)进行定式。
而且,所述通过机器学习实现优良驾驶员的“知识获得”,是指通过优秀驾驶员进行多次的驾驶的机器学习,在自动驾驶的各个状态下,产生各个目标函数所对应的一个“高阶最大几率”的概率分布。
而且,所述进行多目的最佳控制的机器学习调节,是指针对自动驾驶的一个状态所产生一组多目的的复数个目标函数值,与相对应的状态的各个目标函数的学习结果,进行欧几里德空间的一点到概率空间的概率分布中心的距离的计算,通过机器学习得到所要调节的目标函数的方法。
本发明提出的一种自动驾驶的机器学习多目的控制方法,其特点是:利用各个多目的函数的模糊关系,以及通过机器学习实现优良驾驶员的“知识获得”,可实现自动驾驶的多目的最佳控制,解决了自动控制问题上的难题,其效果超越模糊推论的控制方法。
附图说明
图1解决复杂系问题的两种空间映射方法示意图
图2适于自动驾驶的汽车环境图像放射形映射的方法示意图
图3通过无监督机器学习实现道路车线的识别方法示意图
图4通过无监督机器学习实现道路车线的识别的流程图
图5从汽车环境图像中进行突发图像的映射方法的示意图
图6从汽车环境图像中进行突发图像的映射方法的流程图
图7是适于自动驾驶的汽车环境图像理解的处理方法的示意图
图8是将非结构化图像数据的结构信息抽出方法示意图
图9是穿越包括概率空间在内的不同空间的距离的定义示意图
图10是多目的最佳控制的机器学习模型的示意图
图11是通过机器学习实现优良驾驶员的“知识获得”的示意图
符号说明
201 是汽车环境图像的原图像
202 是汽车环境图像的原图的一个映射图像
203 是汽车环境图像的原图的另一个映射图像
204 是通过无监督学习将映射图像的特征值抽出
205 是神经网络感知层
206 是神经网络感知层的一个节点
300 是在边缘图像上车线位置附近的离散点阵
301 是位于车线位置附近的离散点阵的中心线
302 与303是在中心线301的两边的直线
700 是汽车环境图像的一个映射图像
701 是一个最大概率密度的区域
702 是另一个最大概率密度的区域
703 是另一个最大概率密度的区域
704 是最后得到一个最大概率密度的区域
801 是映射图像中概率密度与面积最大的一个特征点
802 是特征点801的最大概率密度的半径
803 是特征点801转向下一个特征点805的向量值
804 是801转向下一个特征点805的向量值所经过的概率空间
805 是下一个特征点
806 是第二个特征点805的最大概率密度的半径
807 是特征点805将转向下一个特征点的向量值
808 是第二个特征点805将转向下一个特征点的向量值所必需经过的概率空间
809 是上一个特征点即将达到的最终的特征点811的向量值810所经过的概率空间
810 是最终的特征点811的向量值
811 是最终的特征点
812 是最终的特征点811的最大概率密度的半径
901 是一个涵盖概率空间的一个欧几里德空间
902 是概率空间的一个概率分布的中心点wj
903 是概率空间的一个概率分布的多概率尺度的第一个刻度M1
904 是概率空间的一个概率分布的多概率尺度的第二个刻度M2
905 是概率空间的一个概率分布的多概率尺度的第三个刻度M3
909 是欧几里德空间一个点vj
具体实施方式
以下结合附图对本发明实施例做进一步详述,但本发明所述的实施例是说明性的,而不是限定性的。
图1是解决复杂系问题的两种空间映射方法示意图。
如图1的(a)是将一个复杂系的问题映射到n个空间的示意图,可称为放射形映射。例如针对图像的识别,可以借助物理学的模型,将一个汽车环境图像映射成若干个映射图像,以便于将图像深层信息抽出。
如图1的(b)是将若干个不同空间的复杂系问题,映射到同一个空间的示意图,可称为收束形映射。例如用于多目的的最佳控制问题,有多个目标函数,分别不在一个空间,很难建立一个最佳的控制点,通过收束形空间映射,就可以将多目的的目标函数映射到一个MemberShip模糊空间,因此可以寻求多目的的最佳控制的方法。
图2是适于自动驾驶的汽车环境图像放射形映射的方法示意图。
图像识别的准确性关键就是注意两个环节的处理,一个是图像信息抽出环节,一个是图像的模式识别环节。这里主要提出适于自动驾驶中的图像识别的图像信息抽出方法。
如图2所示:201是汽车环境图像的原图像,202是汽车环境图像的原图的一个映射图像,203是汽车环境图像的原图的另一个映射图像,为了将汽车环境图像的深层信息抽出,可以通过映射将汽车环境图像,展开成若干个映射图像。
204是通过无监督学习将映射图像的特征值抽出,205是神经网络感知层,206是神经网络感知层的一个节点。
在模式识别中,信息抽出的质量的重要性要远高于机器学习的分类算法,基于空间映射理论,将汽车环境图像通过物理模型映射出若干个图像,可以将汽车环境图像的深层信息直接抽出,每一个特征信息区域对应着一个机器学习,可以把所对应的图像区域中的“高阶最大几率”的值抽出,而且每一个特征区域都对应一个无监督学习。
本专利申请将非结构化的图像按图像的结构进行信息抽出,利用无监督学习可以自动的迁移到图像的最大概率分布的区域,将图像中的若干个最大概率分布区域作为图像的结构特征进行信息抽出,从而获得了图像的结构信息,只要图像一部分进入识别的视野中就可以正确的识别该图像,从而达到图像理解的效果。
为了能准确的识别道路的车道线,需要将汽车环境图像的原图像进行边缘图像的映射。针对边缘图像映射,需要对原图像的相邻像素进行导数值的计算,传统的方法一般采用差分法,但是作为自动驾驶领域中的图像识别,需要考虑汽车周围的图像在恶劣天气中的图像质量很差,因此尽可能采用高可靠性的,可以抵消噪声干扰的算法。在解决针对被识别的汽车环境图像进行边缘图像的映射问题上,本专利申请提出用多个相邻像素的导数值的平均的算法获得可以通过多个相邻像素获得更高精度的图像导数值的方法,例如用两个相邻的导数值,即相邻的三个像素获得边缘图像的算法的具体公式如下:
【公式1】
这里,Xi-1-xi=1,Xi-2-xi=2,i=1,2,…,n,j=1,2,…,m,这样就可以通过相邻的x方向的三个像素获得精度更高的图像的x方向的导数值。同样:
【公式2】
这里yi-1-yi=1,yi-2-yi=2,i=1,2,…,n,j=1,2,…,m。同样通过相邻的y方向的三个像素获得精度更高的图像的y方向的导数值。同理还可以通过3个导数,或更多的相邻x方向,或y方向的图像像素的导数值得到该区域的高精度的导数值。
经过求导之后的图像数据并不是理想的数据,其中各个求导值是离散的,而且还存在着大量的噪声,本专利申请提出下述利用无监督机器学习,实现车线识别的方法。
图3是通过无监督机器学习实现道路车线的识别方法示意图。
如图3所示:300是在边缘图像上车线位置附近的离散点阵,301是位于车线位置附近的离散点阵的中心线,这条线在初始状态时可以是任意的大约在离散点阵中心位置的一条由两个点所连接的一条直线,这条直线在下述的概率尺度自组织的过程中可以获得“高阶最大几率”的中心直线,302与303是在中心线301的两边的直线,同样在下述的概率尺度自组织的过程中,这两条线与中心线的距离就是一个“高阶最大几率”的尺度的距离,即在概率尺度自组织过程中最终获得的一个最大概率的尺度。
图4是通过无监督机器学习实现道路车线的识别的流程图。
如图3,图4所示:采用无监督机器学习进行车线识别的处理步骤如下:
S1是初始化步骤,主要给出车线所存在的大略的初始范围,例如图3的302以及303。
S2是也是初始化步骤的内容,在S1初始化步骤中产生出的车线所存在的范围内可以随便从范围内两端中找出两个点构成中心线,如图3的301。
S3进入无监督学习的迭代步骤,求出给定的范围内所有的点阵到中心线的距离。
S4是求解无监督机器学习的概率尺度步骤,即求解给定的范围内所有的点阵到中心线的距离的最大概率尺度以及中心值。求解概率尺度的方法有:正态分布,多变量正态分布,对数正态分布,指数分布,t分布,F分布,X2分布,二项分布,负的二项分布,多项分布,泊松分布,爱尔朗分布(Erlang Distribution),超几何分布,几何分布,通信量分布,韦伯分布(Weibull Distribution),三角分布,贝塔分布(Bete Distribution),伽马分布(GammaDistribution)中至少一种概率分布中求解概率分布的尺度以及中心值。
S5是点阵处理步骤,即以S4求解出的无监督机器学习的概率尺度为基准,将概率尺度以内的点阵保留,概率尺度以外的点阵剔除。
S6是构成新的中心线以及范围步骤,将S4求解无监督机器学***均值作为新的范围如图3的302,303以及中心线如图3的301。
S7是判别迭代是否收敛步骤,“否”就跳到S3继续进行无监督学习的迭代处理,“是”就进入S8的迭代结束的处理步骤。
经过这样的无监督机器学***均值如图3的301,而且也超越通过线性规划所计算出的车线的结果的精确性。
本专利申请还提出如何从汽车环境图像中进行突发图像的映射方法。
图5是从汽车环境图像中进行突发图像的映射方法的示意图。
如图5所示:图5(a)是正常情况下的汽车环境图像的示意图,这是一个安全的环境图像,汽车可以放心的驾驶。图5(b)是汽车环境图像即将遇到危险前的环境图像,但是作为环境图像的视野仍然是属于安全状态的图像,图5(c)是汽车环境图像突然进入了一个危险状态的图像,如何把危险图像单独分离开,映射成一个突发图像?这是自动驾驶图像识别一定要解决的一个重要的问题。
解决这一问题可以从两个方面进行。一是参照边缘图像映射的方法,利用公式1与公式2将图5中的(b)图像与(c)图像之间的一个图像,以及(c)图像相邻的三幅图像,或更多幅的图像的像素间进行求导,得到一个变化的图像像素的集合。然后再参照上述概率尺度自组织的算法所示的无监督机器学习,求出一个点与一个半径所构成的最大概率尺度所涵盖的领域,当这个领域超过可能产生危险的尺度时即可认为是突发图像。
图6是从汽车环境图像中进行突发图像的映射方法的流程图。
如图6所示:从汽车环境图像中进行突发图像的映射方法分为8个步骤,具体操作如下:
S1是读取相邻画面步骤,在这个步骤里根据公式1与公式2的导数公式的要求,读取汽车环境视频图像的相邻的3个画面或更多的画面。
S2是求解导数图像的步骤,针对汽车环境视频图像的相邻的3个画面或更多的画面进行画面间的对应着的各个像素,进行公式1与公式2那样的求导数的计算,从而产生突发图像的映射图像。
S3是设定搜索导数图像半径与中心值步骤,为了判断产生突发危险的图像还是扰动图像,需要通过无监督机器学习求出最大概率尺度所涵盖的领域,当这个领域超过可能产生危险的尺度时即可认为是突发图像,为此对导数图像设定初始的搜索范围,对导数图像可以整个进行搜索,也可以分成若干个区域分别搜索。
S4是求解半径内最大概率尺度步骤,即针对半径内的点阵分布计算各个点阵与中心点的距离的概率分布,求出距离的概率分布的尺度。这里计算概率分布的尺度可以通过:正态分布,多变量正态分布,对数正态分布,指数分布,t分布,F分布,X2分布,二项分布,负的二项分布,多项分布,泊松分布,爱尔朗分布(Erlang Distribution),超几何分布,几何分布,通信量分布,韦伯分布(Weibull Distribution),三角分布,贝塔分布(BeteDistribution),伽马分布(Gamma Distribution)中至少一种概率分布中求解最大概率分布的尺度以及中心值。
S5是以最大概率尺度为基准筛选点阵步骤,属于范围内的点阵保留,范围以外的点阵剔除。被剔除的点阵在无监督机器学习所进行的迁移过程中,被剔除的点阵仍然有可能进入最大概率尺度范围内,参与概率尺度自组织的运算。
S6是形成新的导数图像的中心与半径步骤,将被筛选出的点阵重新计算中心值,把S4是求解半径内最大概率尺度作为新的半径。
S7是判断迭代是否收敛步骤,可以判断最大概率尺度是否已经稳定不再改变,或改变的很小时即可认为迭代已经收敛,“是”则转下一步的操作,“否”则跳往S4求解半径内最大概率尺度步骤继续进行迭代处理。
S8是判断是否最大概率尺度M≥δ步骤,这里δ为指定的一个常数,“是”则进入下一步骤S9,“否”则认为没有出现突发事件的图像,跳往S3的设定搜索导数图像半径与中心值步骤,继续监视突发事件的图像的出现。
S9是返回主程序,或将突发事件的映射图像进行显示,并通知自动驾驶的中心控制单元采取紧急措施等的操作。
为了适应自动驾驶在恶劣的天气的图像识别,需要在仅获得图像的一部分就可对图像进行正确识别,为满足这一要求,以下本专利提出适于自动驾驶的,将非结构化的图像数据,进行结构化的信息抽出,从而获得图像理解的效果,具体方法如下:
图7是适于自动驾驶的汽车环境图像理解的处理方法的示意图。
如图7所示:这是一个将非结构化的图像数据,进行结构化的信息抽出的方法。设L1,L2,…,Li,…,Ln是无监督机器学习,700是汽车环境图像的一个映射图像,首先使用L1在整个映射图像700范围内进行自组织的无监督机器学习,得到一个最大概率密度的区域701保存这个结果,再使用L2在整个映射图像700范围内再进行自组织的无监督机器学习,又得到另一个最大概率密度的区域702同样保存这个结果,同样的处理方法,再使用Li自组织的无监督机器学习,又得到另一个最大概率密度的区域703同样保存这个结果,最后再使用Ln自组织的无监督机器学习,最后得到一个最大概率密度的区域704同样保存这个结果。相同图像上面的最大概率密度的区域是可以稳定识别的区域具有最大概率的重复性,作为被识别图像的特征点,可将非结构化的图像数据的结构信息抽出,可以实现图像的理解。
这里具有结构化的信息的特征点的顺序是无监督机器学习第一次通过概率尺度自组织获得的最大概率密度的最大区域的特征点,以此类推越往后学习到的特征点区域就越小。
图8是将非结构化图像数据的结构信息抽出方法示意图。
如图8所示:801是映射图像中概率密度与面积最大的一个特征点,802是特征点801的最大概率密度的半径,这里最大概率密度的半径,既概率尺度自组织的无监督学习的最大概率尺度,以下相同不在复述。803是特征点801转向下一个特征点805的向量值,804是801转向下一个特征点805的向量值所经过的概率空间,概率空间的信息是通过多次对图像的学习获得的,以下同样不在复述,806是第二个特征点805的最大概率密度的半径,807是特征点805将转向下一个特征点的向量值,808是第二个特征点805将转向下一个特征点的向量值所必需经过的概率空间,经过若干个特征点最终达到的特征点为811,809是上一个特征点即将达到的最终的特征点811的向量值810所经过的概率空间,812是最终的特征点811的最大概率密度的半径。
这里每一个特征值都承载着如下的信息:
(1)特征点的最大概率尺度,以及与最大概率尺度大小有关的概率分布。
(2)特征点为第k个的概率分布,这个指标可以评价特征点的稳定情况。
(3)第k个特征点到第k+1个特征点的向量值(长短),以及概率分布。
(4)第k个特征点到第k+1个特征点的向量值(方向),以及概率分布。
在图像识别时,样本图像的每一个特征点需要通过上述4个方面的数据,求出样本图像的每一个特征点与登录的经过机器学习所获得的各个图像的各个特征点的概率分布数据之间的跨越欧几里德空间与概率空间的距离,以及以这个距离为依据,按照上述的模糊事件概率测度的定义,求出模糊概率测度值,用这个尺度作为依据,与相似的其他特征点进行对抗学习,以对抗学习结果,最为接近的图像为最终的识别结果,从而实现对图像的理解。
即所述按照结构化的特征进行识别,是指在图像识别时,样本图像的每一个特征点的结构化信息与通过机器学习所获得的各个图像的结构化信息的概率分布数据,进行求解跨越欧几里德空间与概率空间的距离,以及以这个距离为依据的模糊事件概率测度,用这个尺度作为依据,在各个图像的登录数据之间进行对抗学习,得到一个最为接近的数据,该数据所对应的图像就是识别结果。
这里,考虑图像的一部分进入图像识别的视野就可以得到正确的识别结果,需要样本图像的每一个特征点i,i=1,2,…k,要同照和的每一个学习后的已登录的g个图像数据中的每一个图像数据的h个特征点进行全组合的对比,最终得出一个模糊事件概率尺度最大的图像作为识别结果。
图9是穿越包括概率空间在内的不同空间的距离的定义示意图。
如图9所示:901是一个涵盖概率空间的一个欧几里德空间,902是概率空间的一个概率分布的中心点wj,903是概率空间的一个概率分布的多概率尺度的第一个刻度M1,904是概率空间的一个概率分布的多概率尺度的第二个刻度M2,905是概率空间的一个概率分布的多概率尺度的第三个刻度M3,909是欧几里德空间一个点vj,求vj到wj的距离。
在实际模式识别当中,每一个特征值都要在不同的条件下,经过复数次的学习,其学习结果形成了一个概率分布,由n个特征值构成一个特征向量,所以需要计算向量之间的距离,这里,设在集合W中有一个点902为wj∈W,集合V中有一个点909为vj∈V,在第j=1,2,…,n个向量要素中设902与903之间的尺度的刻度间距为D1j=M1j,属于wj的概率分布的概率值为P1j (wj),903与904之间的尺度间距为D2j=M2j-M1j,属于wj的概率分布的概率值为P2j (wj),904与905之间的尺度间距为D3j=M3j-M2j属于wj的概率分布的概率值为P3j (wj),从图9可以看出由vj到wj经过了属于wj的概率分布的3个刻度区域,因此mj (wj)=3,则909到902之间的概率空间距离为:
【公式3】
这里令,
Δj (wj)为由vj到wj的方向,当数据从欧几里德空间进入概率空间后,在概率空间内欧几里德空间所表示的距离与实际概率空间的距离之间的距离误差,用调整Δj (wj)方法就可把欧几里德空间距离与概率空间的距离统一,解决机器学习数据在穿越两个空间中的严格的距离关系的定义。
总结图9所提出的一种穿越欧几里德空间与概率空间的距离的获得方法,其特征是在欧几里德空间中至少存在这一个概率空间,在穿越概率空间的一个区域时,该区间的概率距离与所经过的区域的概率值有关。
上述欧几里德空间可以延伸到:包括曼哈顿空间(Manhattan Space);切比雪夫空间(Chebyshev Space);闵可夫斯基空(Minkowski Space);马氏空间(MahalanobisSpace);夹角余弦空间(Cosine Space)中的一种。
再有,概率空间的距离尺度是与在概率空间穿过时,所经过的概率分布值有关,是一定要有方向性的,不满足普通距离尺度的对称性条件。例如在考察由vj到wj的距离时,其概率空间的距离是与vj所在的位置到达wj的位置过程中,所经过的概率分布的概率的变化过程有关,这个概率分布是所要到达的终点位置的wj概率分布的概率变化过程,而与起点位置vj无关,即使vj也是一个概率分布,也与vj的概率分布无关。
在自动驾驶中需要考虑“节省油耗”,“快速行驶”,“安全行驶”,“行驶间隔”,“舒适行驶”以及“停车位置”等等的若干方面的最佳化控制问题,因此自动驾驶的核心问题是多目的最佳控制的机器学习模型应该是被关注的问题。
图10是多目的最佳控制的机器学习模型的示意图。
如图10所示:在自动驾驶中的“节省油耗”,“快速行驶”,“安全行驶”,“行驶间隔”,“舒适行驶”以及“停车位置”等等是不同空间的问题,解决多目的最佳控制的机器学习模型的构建,需要解决两个问题,一是要将不同空间的多目的的目标函数映射到同一个空间,二是多目的目标函数之间应是柔性的,硬直性的最佳化的交点是很难存在的。
本专利申请解决将不同空间的多目的的目标函数映射到同一个空间的问题,提出将各个目标函数按照最好为100最坏为0通过Membership Function进行定式。
例如节省能耗的Membership Function:
与节省油耗有关的参数有加速度不易过大,驾驶速度越慢越节省油耗,减速停止的距离越长越好,制动的力量与时间越小越好等,建立这样的Membership Function的方法是:设汽车加速度值为ac,速度为sp,减速停止距离为ds,制动的力量与时间参数为bt则关于节省油耗的定式为:
【公式4】
这里,w11,w12,w13以及w14为调整各个目标函相互作用的权值,ε为制动限制参数。
与快速行驶FT有关的的参数是行车速度为sp,则关于快速行驶的定式为:
【公式5】
这里,w21为调整各个目标函相互作用的权值。
与安全驾驶有关的参数有汽车速度sp不宜过快,单位时间内车线变更次数lc不宜过多,单位时间内超车次数ot不宜过多等,则关于安全驾驶的定式为:
【公式6】
这里,w31,w32以及w33为调整各个目标函相互作用的权值。
与车间距离有关的参数wd是与行车距离有关,则关于车间距离的定式为:
【公式7】
这里,w41为调整目标函相互作用的权值。
与停车距离TD在什么情况下为好需要设定一个停车系数δ,与停车系数有,这里定义停车距离为希望停车到实际停车的距离,因此停车距离参数为sc
【公式8】
这里,w51为调整目标函相互作用的权值。
与舒适行驶CD有关的参数有加速度值为ac不能过大,制动的力量与时间bt越小越好。
【公式9】
这里,w61以及w62为调整各个目标函相互作用的权值。
如上所述Membership Function的定式并不是严密的数学推导,而是根据人为的经验所拼凑出的公式,例如有关节约能耗的速度的定式,就是以w12=150时,每小时30公里的速度比较好,模糊值为100,每小时60公里时为50。因此上述的定式方法可以有各种各样,不管是用哪种方法,或依据哪些理论进行定式,将不同空间的目标函数映射到一个统一的空间里,进行多目的的评价与控制是本申请的发明内容与技术境界的范畴。
根据优秀驾驶员进行多次的驾驶的机器学习,由“节省能耗”,“快速行驶”,“安全行驶”,“车间距离”,“停车距离”以及“舒适行驶”等的定式所反映的数值形成一个概率分布函数,通过所对应的无监督机器学习ML1产生一个高阶最大几率的概率分布数据,这一数据存入数据库DB1
自动汽车驾驶会有若干的驾驶状态,例如:
状态1:汽车向前行驶,汽车前后左右都没有任何障碍物,或同行汽车。
状态2:汽车向前行驶,左后面有车。
状态3:汽车向前行驶,左前面有车。
状态4:汽车向前行驶,左面有车。
状态5:汽车向前行驶,右后面有车。
状态6:汽车向前行驶,右前面有车。
状态7:汽车向前行驶,右面有车。
状态8:汽车向前行驶,后面有车。
状态9:汽车向前行驶,前前面有车。
……
状态n:…
每一个状态,对应的多目的控制的机器学习的结果是不同的,所以无监督机器学习在学习前应先确定驾驶状态,每一个多目的学习都对应这一个状态,也就是说,自动驾驶的多目的最佳控制机器学习的任务是将优良驾驶员的驾驶结果通过机器学习,按照每一个驾驶状态,对应一组多目的最佳控制的模糊值,所获得的概率分布值。这就是自动驾驶多目的最佳控制的“知识获得”的方法。
图11是通过机器学习实现优良驾驶员的“知识获得”的示意图。
如图11所示:通过机器学习获得的优良驾驶员的驾驶知识,实现“知识获得”是按照自动驾驶的各个状态,将优良驾驶员的复数次驾驶过程中,通过机器学习获得的各个状态下的,各个目标函数的概率分布,分别从状态1到状态n所对应的各个多目标最佳控制的机器学习结果。
其中(a)是节省油耗目标函数所经过的优良驾驶员的复数次驾驶所进行的机器学习后的结果,这个结果反映了节省油耗的概率分布。
其中(b)是快速行驶目标函数所经过的优良驾驶员的复数次驾驶所进行的机器学习后的结果,这个结果反映了快速行驶的概率分布。
其中(c)是安全行驶目标函数所经过的优良驾驶员的复数次驾驶所进行的机器学习后的结果,这个结果反映了安全行驶的概率分布。
其中(d)是行车间距目标函数所经过的优良驾驶员的复数次驾驶所进行的机器学习后的结果,这个结果反映了行车间距的概率分布。
其中(e)是舒适行驶目标函数所经过的优良驾驶员的复数次驾驶所进行的机器学习后的结果,这个结果反映了舒适行驶的概率分布。
其中(f)是节停车位置目标函数所经过的优良驾驶员的复数次驾驶所进行的机器学习后的结果,这个结果反映了停车位置的概率分布。
概率分散得越大说明针对这个状态的这个目标函数的控制要求不严格,反之概率分布的分散越小,说明针对这个状态的这个目标函数的要求越高。
自动驾驶也不只是这9个状态,本方法涵盖自动驾驶的所有状态,直到状态n,目标函数也不只从(a)到(f)这6个,本方法涵盖自动驾驶的所有的目标函数。
在正常的自动驾驶过程中,针对一个状态必然会产生一组多目的的复数个目标函数值,各个目标函数值是送到图10的感知层(P1)的各个节点(N1)上的,将上述状态所对应的各个目标函数的机器学习结果,即图11中的(a)-(f)所表示的各个目标函数的各个通过图10的机器学习(ML1)后所得到的概率分布,再参照图9跨越欧几里德空间与概率空间的距离公式,进行欧几里德空间的一点到概率空间的概率分布中心的距离的计算,其结果送到图10的神经层(P2)的各个节点(N2)上。
图10的机器学习(ML2)对神经层(P2)上的各个节点(N2)上进行最大概率尺度的自组织的机器学习,以最终学习结果的概率尺度为基准,判断各个目标函数的实际自动驾驶的结果中,具有最大概率值的需要调解的目标函数是哪个,同时还要人为的设定一个调节最佳范围的阀值ζ,判断机器学习(ML2)的学习结果的距离值是否是超出这一个阀值,如果超出阀值的目标函数是单数个,就对这个目标函数进行调节,如果超出阀值的目标函数是复数个,就针对距离值最大的目标函数进行调解,也可以同时针对复数个超出阀值的目标函数进行调解,所要调节的信息送往脑皮层(P3)节点(N3)上。
来自图10的脑皮层(P3)的节点(N3)的调解信息值,是按一个调节单位值给出的,可以导入包括线性***控制,非线性***控制,最优控制,随机控制,自适应控制,模糊控制,定性控制,预测控制,时事专家控制等控制方法中的一种进行刹车机构,或油门机构的控制。
但是,刹车机构所给予的刹车的力量,与汽车的速度有关,不同的速度,所要调节的刹车机构的力量是不同的,传统的自适应控制每次都要反复对刹车机构一开始进行自适应的调节,占用了一些时间,使汽车的应急特性下降,将刹车的调节自适应控制的参数作为机器学习的数据,每次控制刹车机构之前,根据汽车速度先调用刹车自适应机器学习的相应数据,就可以快速的使要刹车调节的数值达到要求。
油门控制也是如此,根据车速的不同,调节油门机构的量也是不同的,将油门调节的自适应控制的参数作为机器学习的数据,每次控制之前先根据汽车速度调用油门调节的自适应机器学习的相应数据,就可以快速的使要调节油门的数值达到要求。上述的操作都是在“多目的机器学习自适应调节中心”实现的。
上述每调节一次,还要返回机器学习(ML1)与(ML2)的学习结果是否有效?这样反复学习反复调节,很可能需要若干次的机器学习与调节才能达到优良驾驶员的驾驶效果。
“多目的机器学习自适应调节中心”同时还可以针对车线识别的结果,以及GPS地图所表示的行车路线,对驾驶方向盘进行控制。

Claims (4)

1.一种自动驾驶的机器学习多目的控制方法,其特征在于:
(1)将不同空间的多目的的目标函数映射到同一个空间;
(2)通过机器学习实现优良驾驶员的“知识获得”;
(3)进行多目的最佳控制的机器学习调节。
2.根据权利要求1所述的一种自动驾驶的机器学习多目的控制方法,其特征在于:所述将将不同空间的多目的的目标函数映射到同一个空间,是指将各个目标函数按照最好为100最坏为0通过隶属函数(Membership Function)进行定式。
3.根据权利要求1所述的一种自动驾驶的机器学习多目的控制方法,其特征在于:所述通过机器学习实现优良驾驶员的“知识获得”,是指通过优秀驾驶员进行多次的驾驶的机器学习,在自动驾驶的各个状态下,产生各个目标函数所对应的一个“高阶最大几率”的概率分布。
4.根据权利要求1所述的一种自动驾驶的机器学习多目的控制方法,其特征在于:所述进行多目的最佳控制的机器学习调节,是指针对自动驾驶的一个状态所产生一组多目的的复数个目标函数值,与相对应的状态的各个目标函数的学习结果,进行欧几里德空间的一点到概率空间的概率分布中心的距离的计算,通过机器学习得到所要调节的目标函数的方法。
CN201710905331.3A 2017-09-20 2017-09-20 一种自动驾驶的机器学习多目的控制方法 Pending CN109670597A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201710905331.3A CN109670597A (zh) 2017-09-20 2017-09-20 一种自动驾驶的机器学习多目的控制方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201710905331.3A CN109670597A (zh) 2017-09-20 2017-09-20 一种自动驾驶的机器学习多目的控制方法

Publications (1)

Publication Number Publication Date
CN109670597A true CN109670597A (zh) 2019-04-23

Family

ID=66138533

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201710905331.3A Pending CN109670597A (zh) 2017-09-20 2017-09-20 一种自动驾驶的机器学习多目的控制方法

Country Status (1)

Country Link
CN (1) CN109670597A (zh)

Citations (14)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH0979362A (ja) * 1995-09-12 1997-03-25 Mitsubishi Motors Corp 車両用自動変速機の変速段制御装置
US20020128751A1 (en) * 2001-01-21 2002-09-12 Johan Engstrom System and method for real-time recognition of driving patters
JP2005263100A (ja) * 2004-03-19 2005-09-29 Mitsubishi Fuso Truck & Bus Corp 車両制御装置
US20130110349A1 (en) * 2010-07-29 2013-05-02 Ford Global Technologies, Llc Systems and methods for scheduling driver interface tasks based on driver workload
CN103605285A (zh) * 2013-11-21 2014-02-26 南京理工大学 汽车驾驶机器人***的模糊神经网络控制方法
CN105136469A (zh) * 2015-07-23 2015-12-09 江苏大学 一种基于pso和rbf神经网络的无人驾驶车辆车速控制方法
US20160034305A1 (en) * 2013-03-15 2016-02-04 Advanced Elemental Technologies, Inc. Methods and systems for purposeful computing
US20160091609A1 (en) * 2014-09-30 2016-03-31 Umm-Al-Qura University Method and system for an accurate and energy efficient vehicle lane detection
US20160129787A1 (en) * 2014-11-10 2016-05-12 Streetsmart Ltd. Methods, Circuits, Devices, Systems & Associated Computer Executable Code for Driver Decision Support
CN105892471A (zh) * 2016-07-01 2016-08-24 北京智行者科技有限公司 汽车自动驾驶方法和装置
CN105930625A (zh) * 2016-06-13 2016-09-07 天津工业大学 Q学习结合神经网络的智能驾驶行为决策***的设计方法
CN106428000A (zh) * 2016-09-07 2017-02-22 清华大学 一种车辆速度控制装置和方法
CN106875511A (zh) * 2017-03-03 2017-06-20 深圳市唯特视科技有限公司 一种基于自编码正则化网络学习驾驶风格的方法
US20170262790A1 (en) * 2016-03-11 2017-09-14 Route4Me, Inc. Complex dynamic route sequencing for multi-vehicle fleets using traffic and real-world constraints

Patent Citations (14)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH0979362A (ja) * 1995-09-12 1997-03-25 Mitsubishi Motors Corp 車両用自動変速機の変速段制御装置
US20020128751A1 (en) * 2001-01-21 2002-09-12 Johan Engstrom System and method for real-time recognition of driving patters
JP2005263100A (ja) * 2004-03-19 2005-09-29 Mitsubishi Fuso Truck & Bus Corp 車両制御装置
US20130110349A1 (en) * 2010-07-29 2013-05-02 Ford Global Technologies, Llc Systems and methods for scheduling driver interface tasks based on driver workload
US20160034305A1 (en) * 2013-03-15 2016-02-04 Advanced Elemental Technologies, Inc. Methods and systems for purposeful computing
CN103605285A (zh) * 2013-11-21 2014-02-26 南京理工大学 汽车驾驶机器人***的模糊神经网络控制方法
US20160091609A1 (en) * 2014-09-30 2016-03-31 Umm-Al-Qura University Method and system for an accurate and energy efficient vehicle lane detection
US20160129787A1 (en) * 2014-11-10 2016-05-12 Streetsmart Ltd. Methods, Circuits, Devices, Systems & Associated Computer Executable Code for Driver Decision Support
CN105136469A (zh) * 2015-07-23 2015-12-09 江苏大学 一种基于pso和rbf神经网络的无人驾驶车辆车速控制方法
US20170262790A1 (en) * 2016-03-11 2017-09-14 Route4Me, Inc. Complex dynamic route sequencing for multi-vehicle fleets using traffic and real-world constraints
CN105930625A (zh) * 2016-06-13 2016-09-07 天津工业大学 Q学习结合神经网络的智能驾驶行为决策***的设计方法
CN105892471A (zh) * 2016-07-01 2016-08-24 北京智行者科技有限公司 汽车自动驾驶方法和装置
CN106428000A (zh) * 2016-09-07 2017-02-22 清华大学 一种车辆速度控制装置和方法
CN106875511A (zh) * 2017-03-03 2017-06-20 深圳市唯特视科技有限公司 一种基于自编码正则化网络学习驾驶风格的方法

Non-Patent Citations (11)

* Cited by examiner, † Cited by third party
Title
冶金自动化: "独家揭秘|可将人工智能大规模产业化的新理论"超深度学习"", pages 1 - 10, Retrieved from the Internet <URL:https://www.sohu.com/a/124993967_465552> *
堂博士: "人工智能研究挑战究竟在哪里?株式会社日本首席科学家顾泽苍教授深度解读新型人工智能模型", pages 1 - 4, Retrieved from the Internet <URL:https://zhuanlan.zhihu.com/p/27298678?from=singlemessage> *
张文明等: "基于驾驶员行为的神经网络无人驾驶控制", 《华南理工大学学报(自然科学版)》 *
张文明等: "基于驾驶员行为的神经网络无人驾驶控制", 《华南理工大学学报(自然科学版)》, no. 12, 15 December 2016 (2016-12-15), pages 74 - 79 *
李德毅: "AI时代自动驾驶汽车的关键在于"驾驶脑"", 《网信军民融合》 *
李德毅: "AI时代自动驾驶汽车的关键在于"驾驶脑"", 《网信军民融合》, no. 03, 25 August 2017 (2017-08-25), pages 10 - 13 *
梁军等: "基于动态神经网络集成的驾驶员行为学习算法", 《计算机应用研究》 *
梁军等: "基于动态神经网络集成的驾驶员行为学习算法", 《计算机应用研究》, no. 11, 15 November 2009 (2009-11-15), pages 93 - 96 *
陈亮: "机器学习算法在无人驾驶中的应用", 《机器人产业》 *
陈亮: "机器学习算法在无人驾驶中的应用", 《机器人产业》, no. 04, 25 July 2017 (2017-07-25), pages 40 - 45 *
顾泽苍: "人工智能技术深度剖析", 《机器人技术与应用》, pages 23 - 28 *

Similar Documents

Publication Publication Date Title
US11720099B2 (en) Control method of automatic driving imported “smart gains” model, device and program
CN107229973B (zh) 一种用于车辆自动驾驶的策略网络模型的生成方法及装置
CN110796856B (zh) 车辆变道意图预测方法及变道意图预测网络的训练方法
CN110745136B (zh) 一种驾驶自适应控制方法
CN112099496B (zh) 一种自动驾驶训练方法、装置、设备及介质
Díaz-Álvarez et al. Modelling the human lane-change execution behaviour through multilayer perceptrons and convolutional neural networks
US11354915B2 (en) Image extraction method importing into SDL model
CN109726804B (zh) 一种基于行车预测场和bp神经网络的智能车辆驾驶行为拟人化决策方法
CN110103956A (zh) 一种无人车自动超车轨迹规划方法
CN105892471A (zh) 汽车自动驾驶方法和装置
CN114312830B (zh) 一种考虑危险驾驶工况的智能车耦合决策模型及方法
CN108944946A (zh) 一种基于车车通信的弯道风险预估计算方法
CN114170789B (zh) 基于时空图神经网络的智能网联车换道决策建模方法
CN111275249A (zh) 基于dqn神经网络和高精度定位的驾驶行为优化方法
US11550327B2 (en) Composition method of automatic driving machine consciousness model
CN110182217A (zh) 一种面向复杂超车场景的行驶任务复杂度量化评估方法
CN115257819A (zh) 城市低速环境下的大型营运车辆安全驾驶决策方法
CN113901718A (zh) 一种跟驰状态下基于深度强化学习的驾驶避撞优化方法
CN109543497A (zh) 一种适于自动驾驶的多目的控制机器学习模型的构建方法
CN114802306A (zh) 一种基于人机共驾理念的智能车辆集成式决策***
Li A hierarchical autonomous driving framework combining reinforcement learning and imitation learning
CN111046897A (zh) 一种跨越不同空间的模糊事件概率测度的定义方法
CN109670597A (zh) 一种自动驾驶的机器学习多目的控制方法
CN116729433A (zh) 一种结合元学习多任务优化的端到端自动驾驶决策规划方法及设备
CN109522778A (zh) 一种可达到图像理解水平的图像识别方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
TA01 Transfer of patent application right
TA01 Transfer of patent application right

Effective date of registration: 20190822

Address after: 510000 X1301-C4728, No. 106 Fengze East Road, Nansha District, Guangzhou City, Guangdong Province

Applicant after: Guangzhou Silicon-based Intelligent Control Technology Co., Ltd.

Address before: 300010 Junlin Building, No. 1 Boai Road, Hebei District, Tianjin, 2817

Applicant before: Gu Zecang

SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination