CN113715805A - 一种基于工况辨识的规则融合深度强化学习能量管理方法 - Google Patents
一种基于工况辨识的规则融合深度强化学习能量管理方法 Download PDFInfo
- Publication number
- CN113715805A CN113715805A CN202111177978.1A CN202111177978A CN113715805A CN 113715805 A CN113715805 A CN 113715805A CN 202111177978 A CN202111177978 A CN 202111177978A CN 113715805 A CN113715805 A CN 113715805A
- Authority
- CN
- China
- Prior art keywords
- vehicle
- port
- battery
- torque
- working condition
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000007726 management method Methods 0.000 title claims abstract description 29
- 230000002787 reinforcement Effects 0.000 title claims abstract description 21
- 230000004927 fusion Effects 0.000 title claims abstract description 14
- 238000012549 training Methods 0.000 claims abstract description 29
- 238000000034 method Methods 0.000 claims abstract description 23
- 230000008569 process Effects 0.000 claims abstract description 17
- 230000006870 function Effects 0.000 claims abstract description 16
- 230000009471 action Effects 0.000 claims abstract description 10
- 238000009826 distribution Methods 0.000 claims abstract description 8
- 230000011218 segmentation Effects 0.000 claims abstract description 3
- 230000005540 biological transmission Effects 0.000 claims description 21
- 239000011159 matrix material Substances 0.000 claims description 16
- 239000000446 fuel Substances 0.000 claims description 15
- 238000013528 artificial neural network Methods 0.000 claims description 14
- 230000001133 acceleration Effects 0.000 claims description 12
- 239000012634 fragment Substances 0.000 claims description 12
- 239000013598 vector Substances 0.000 claims description 8
- 238000007599 discharging Methods 0.000 claims description 6
- 238000005096 rolling process Methods 0.000 claims description 6
- 238000006243 chemical reaction Methods 0.000 claims description 5
- 239000003795 chemical substances by application Substances 0.000 claims description 5
- 230000001186 cumulative effect Effects 0.000 claims description 4
- 238000013461 design Methods 0.000 claims description 4
- 230000005484 gravity Effects 0.000 claims description 4
- 238000012795 verification Methods 0.000 claims description 4
- 230000000694 effects Effects 0.000 claims description 3
- 230000033001 locomotion Effects 0.000 claims description 3
- 238000000513 principal component analysis Methods 0.000 claims description 3
- 230000009467 reduction Effects 0.000 claims description 3
- 238000005070 sampling Methods 0.000 claims description 3
- 238000012360 testing method Methods 0.000 claims description 3
- 238000004458 analytical method Methods 0.000 claims description 2
- 230000006399 behavior Effects 0.000 claims description 2
- 230000002457 bidirectional effect Effects 0.000 claims description 2
- 238000004364 calculation method Methods 0.000 claims description 2
- 239000003638 chemical reducing agent Substances 0.000 claims description 2
- 238000000354 decomposition reaction Methods 0.000 claims description 2
- 238000004146 energy storage Methods 0.000 claims description 2
- 238000011156 evaluation Methods 0.000 claims description 2
- 238000013507 mapping Methods 0.000 claims description 2
- 210000005036 nerve Anatomy 0.000 claims description 2
- 239000011295 pitch Substances 0.000 claims 1
- 238000005457 optimization Methods 0.000 description 5
- 230000033228 biological regulation Effects 0.000 description 3
- 238000010586 diagram Methods 0.000 description 2
- 238000005516 engineering process Methods 0.000 description 2
- 238000009825 accumulation Methods 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 230000008859 change Effects 0.000 description 1
- 230000007547 defect Effects 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 230000018109 developmental process Effects 0.000 description 1
- 238000000605 extraction Methods 0.000 description 1
- 239000002828 fuel tank Substances 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 230000006798 recombination Effects 0.000 description 1
- 238000005215 recombination Methods 0.000 description 1
- 230000001502 supplementing effect Effects 0.000 description 1
- 230000007704 transition Effects 0.000 description 1
Images
Classifications
-
- B—PERFORMING OPERATIONS; TRANSPORTING
- B60—VEHICLES IN GENERAL
- B60W—CONJOINT CONTROL OF VEHICLE SUB-UNITS OF DIFFERENT TYPE OR DIFFERENT FUNCTION; CONTROL SYSTEMS SPECIALLY ADAPTED FOR HYBRID VEHICLES; ROAD VEHICLE DRIVE CONTROL SYSTEMS FOR PURPOSES NOT RELATED TO THE CONTROL OF A PARTICULAR SUB-UNIT
- B60W20/00—Control systems specially adapted for hybrid vehicles
- B60W20/20—Control strategies involving selection of hybrid configuration, e.g. selection between series or parallel configuration
-
- B—PERFORMING OPERATIONS; TRANSPORTING
- B60—VEHICLES IN GENERAL
- B60W—CONJOINT CONTROL OF VEHICLE SUB-UNITS OF DIFFERENT TYPE OR DIFFERENT FUNCTION; CONTROL SYSTEMS SPECIALLY ADAPTED FOR HYBRID VEHICLES; ROAD VEHICLE DRIVE CONTROL SYSTEMS FOR PURPOSES NOT RELATED TO THE CONTROL OF A PARTICULAR SUB-UNIT
- B60W10/00—Conjoint control of vehicle sub-units of different type or different function
- B60W10/04—Conjoint control of vehicle sub-units of different type or different function including control of propulsion units
- B60W10/06—Conjoint control of vehicle sub-units of different type or different function including control of propulsion units including control of combustion engines
-
- B—PERFORMING OPERATIONS; TRANSPORTING
- B60—VEHICLES IN GENERAL
- B60W—CONJOINT CONTROL OF VEHICLE SUB-UNITS OF DIFFERENT TYPE OR DIFFERENT FUNCTION; CONTROL SYSTEMS SPECIALLY ADAPTED FOR HYBRID VEHICLES; ROAD VEHICLE DRIVE CONTROL SYSTEMS FOR PURPOSES NOT RELATED TO THE CONTROL OF A PARTICULAR SUB-UNIT
- B60W10/00—Conjoint control of vehicle sub-units of different type or different function
- B60W10/04—Conjoint control of vehicle sub-units of different type or different function including control of propulsion units
- B60W10/08—Conjoint control of vehicle sub-units of different type or different function including control of propulsion units including control of electric propulsion units, e.g. motors or generators
-
- B—PERFORMING OPERATIONS; TRANSPORTING
- B60—VEHICLES IN GENERAL
- B60W—CONJOINT CONTROL OF VEHICLE SUB-UNITS OF DIFFERENT TYPE OR DIFFERENT FUNCTION; CONTROL SYSTEMS SPECIALLY ADAPTED FOR HYBRID VEHICLES; ROAD VEHICLE DRIVE CONTROL SYSTEMS FOR PURPOSES NOT RELATED TO THE CONTROL OF A PARTICULAR SUB-UNIT
- B60W20/00—Control systems specially adapted for hybrid vehicles
- B60W20/10—Controlling the power contribution of each of the prime movers to meet required power demand
- B60W20/11—Controlling the power contribution of each of the prime movers to meet required power demand using model predictive control [MPC] strategies, i.e. control methods based on models predicting performance
-
- B—PERFORMING OPERATIONS; TRANSPORTING
- B60—VEHICLES IN GENERAL
- B60W—CONJOINT CONTROL OF VEHICLE SUB-UNITS OF DIFFERENT TYPE OR DIFFERENT FUNCTION; CONTROL SYSTEMS SPECIALLY ADAPTED FOR HYBRID VEHICLES; ROAD VEHICLE DRIVE CONTROL SYSTEMS FOR PURPOSES NOT RELATED TO THE CONTROL OF A PARTICULAR SUB-UNIT
- B60W20/00—Control systems specially adapted for hybrid vehicles
- B60W20/10—Controlling the power contribution of each of the prime movers to meet required power demand
- B60W20/15—Control strategies specially adapted for achieving a particular effect
-
- B—PERFORMING OPERATIONS; TRANSPORTING
- B60—VEHICLES IN GENERAL
- B60W—CONJOINT CONTROL OF VEHICLE SUB-UNITS OF DIFFERENT TYPE OR DIFFERENT FUNCTION; CONTROL SYSTEMS SPECIALLY ADAPTED FOR HYBRID VEHICLES; ROAD VEHICLE DRIVE CONTROL SYSTEMS FOR PURPOSES NOT RELATED TO THE CONTROL OF A PARTICULAR SUB-UNIT
- B60W2710/00—Output or target parameters relating to a particular sub-units
- B60W2710/06—Combustion engines, Gas turbines
-
- B—PERFORMING OPERATIONS; TRANSPORTING
- B60—VEHICLES IN GENERAL
- B60W—CONJOINT CONTROL OF VEHICLE SUB-UNITS OF DIFFERENT TYPE OR DIFFERENT FUNCTION; CONTROL SYSTEMS SPECIALLY ADAPTED FOR HYBRID VEHICLES; ROAD VEHICLE DRIVE CONTROL SYSTEMS FOR PURPOSES NOT RELATED TO THE CONTROL OF A PARTICULAR SUB-UNIT
- B60W2710/00—Output or target parameters relating to a particular sub-units
- B60W2710/08—Electric propulsion units
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02T—CLIMATE CHANGE MITIGATION TECHNOLOGIES RELATED TO TRANSPORTATION
- Y02T10/00—Road transport of goods or passengers
- Y02T10/60—Other road transportation technologies with climate change mitigation effect
- Y02T10/62—Hybrid vehicles
Landscapes
- Engineering & Computer Science (AREA)
- Transportation (AREA)
- Mechanical Engineering (AREA)
- Chemical & Material Sciences (AREA)
- Combustion & Propulsion (AREA)
- Automation & Control Theory (AREA)
- Electric Propulsion And Braking For Vehicles (AREA)
Abstract
本发明公开了一种基于工况辨识的规则融合深度强化学习能量管理方法。本发明以插电式混合动力汽车为对象建立,采用并联式结构作为发动机和电动机的连接方式建立混合动力***模型,通过选取了8种标准工况建立了工况库,并对其进行了运动学分割,根据所分割的运动学片段对比9个代表性的参数对车辆工况进行分类与辨识,然后对深度Q学习算法中状态、动作、agent和惩罚函数进行设计,之后在三种不同训练工况下对所设计的规则融合的深度强化学习算法进行训练、分配,从而达到能量高效分配和利用的目的,并且算法在训练过程中存在较少的较差样本,训练效率高,混合动力***综合性能高。
Description
技术领域
本发明涉及混合动力***能量管理领域,尤其是涉及一种基于工况辨识的规则融合深度强化学习能量管理方法。
背景技术
在动力电池能量密度和充电速率没有取得重大突破的当下,混合动力技术被认为是是燃油车向纯电动车辆过渡期间内的一种的较为成熟的驱动方式,而插电式混合动力***作为一种较新的驱动形式随着电池技术的发展在近几年得到了较为广泛的应用,与普通混合动力形式不同的是,插电式混合动力***的动力电池不仅可以通过内燃机进行充电,还可以通过充电桩对其进行电能补充,同时兼顾了纯电动汽车低使用成本和燃油车长续驶里程的优势,而能量管理策略是决定混合动力***是否高效的关键部分,其已经成为当下的研究重点之一。
目前混合动力汽车的能量管理策略可大致分为三类:基于规则的能量管策略、基于优化的能量管理策略和基于学习的能量管理策略。其中基于规则的能量管理策略需要较多的实验结果和经验,偏向于组件级的局部优化,无法实现对插电式混合动力***的整体优化控制,并且所设计的规则往往只能针对于特定的工况,工况适应性较差。而基于优化的能量管理策略只能在已知的工况下求解出最优解,不能较好地适用于未知工况,并且全局优化容易产生维数灾难,算法实时性较差,瞬时优化师对模型依赖程度较大,无法保证长时间段的最优分配。基于学习的能量管理策略都没有考虑工况适应性问题,一般都是在标准工况下对算法进行训练,当工况特性产生变化时能量管理策略可能出现能量分配不合理、混合动力***运行效率较低等问题。同时智能算法在训练时将全部动作空间交由机器去探索,并没有融合专家经验所带来的优势,由此导致算法在训练过程中存在较多的较差样本,训练效率较低,并且会导致训练后的能量管理策略在某些情况下控制效果不理想,混合动力***综合性能较低等问题。所以针对上述问题,本发明提出了一种基于工况辨识的规则融合深度强化学习能量管理方法已达到合理分配混合动***能量的目的。
发明内容
本发明所要解决的技术问题是针对背景技术的缺陷,提供一种基于工况辨识的规则融合深度强化学习能量管理方法。解决算法在训练过程中存在较多的较差样本,训练效率较低,并且会导致训练后的能量管理策略在某些情况下控制效果不理想,混合动力***综合性能较低的问题。
本发明为解决上述技术问题采用以下技术方案:
一种基于工况辨识的规则融合深度强化学习能量管理方法,具体包括以下步骤:
步骤1、混合动力***模型建立;
步骤2、工况分类及辨识;
步骤3、规则融合的深度强化学习能量管理策略设计。
进一步的,所述步骤1以插电式混合动力汽车为对象建立,采用并联式结构作为发动机和电动机的连接方式建立混合动力***模型。其中插电式混合动力***由燃油发动机、电动机、车载动力电池、油箱、转矩耦合器、离合器和5档变速箱组成。燃油发动机与转矩耦合器相连接,电动机直接与转矩耦合器一端相连接,转矩耦合器输出端与离合器连接,离合器另一端与5挡变速器连接,之后将动力传输给前桥驱动车辆行驶;
动力电池采用Rint等效电路模型:
式中,I为电池,放电时为正,电流充电时为负;Uocv为电池的开路电压,可由开路电压试验获得;R为电池内阻,其值随SOC而变化,可通过查表获得;Pbat为电池的功率,当电机转矩Tm为正时,电池处于放电状态,电机转矩Tm为负时,电池处于充电状态;nm为电机转速;ηbat-d为电池放电效率;ηbat-c为电池充电效率;ηm为电机当前转速转矩下的效率;SOC为电池的荷电状态;△t为采样间隔;Q为电池容量;
不考虑车辆的垂向运动和操作稳定性时,车辆纵向行驶方程为:
式中,Tcon为当前工况所需转矩;ig为当前档位变速器传动比;i0为主减速器传动比;ηT为总传动效率;r为车轮半径;m为整车质量;g为重力加速度;f为滚动阻力系数;θ为道坡道角度;CD为空气阻力系数;A为车辆迎风面积;u为车速;δ为旋转质量换算系数。
车辆转矩耦合器采用三端口两自由度的机械配置,端口1为单向功率输入,端口2和端口3为双向功率输入或输出,端口1连接发动机曲轴,端口2连接电动机输出轴,端口3连接离合器输入端;
矩耦合器各端口转矩与转速的关系为:
式中,Te为发动机转矩;ne为发动机转速;T3为耦合器输出转矩;n3为耦合器输出转速;ie为端口1连接发动机曲轴处的传动比,本文取ie=1;im为端口2的连接电动机输出轴的传动比,一般电机转速较高,需要对其进行减速,本发明im取为1.7368;
根据转矩耦合器中发动机和电机的能量流方向可分为3种驱动模式:
(1)联合驱动模式:在此模式下,端口1和端口2为功率输入端,端口3为功率输出端,发动机和电动机共同提供动力驱动车辆行驶,此时电机转矩Tm为正,电池处于放电状态;
(2)纯电驱动模式:在此模式下,端口1无功率输入,端口2为功率输入端,电动机单独驱动车辆,此时电机转矩Tm为正,电池处于放电状态,发动机停机,因为端口1为单向功率输入,所以可实现发动机在动力***上的解耦,从而减小机械损耗;
(3)电机充电模式:在此模式下,车辆的电动机变为发电机,电机转矩Tm为负;并且可根据车辆行驶状态分为驱动状态下充电和非驱动状态下充电。驱动状态下充电时,离合器结合,端口1为功率输入端,端口2和端口3为功率输出端,发动机在提供动力驱动车辆行驶的同时,驱动发电机转动,电池处于充电状态。停车状态下充电时,端口1为功率输入端,端口2为功率输出端,端口3无功率输出,离合器分离,减少变速箱和前桥带来的机械损耗,发动机只提供动力给发电机,对电池进行充电。
进一步的,所述步骤2中车辆工况的运动学片段表示从一次怠速开始到下一次怠速开始这段时间内的汽车行驶状态,其包含一个怠速过程和一个行驶过程,怠速过程中车辆为静止状态,而行驶过程包含了车辆的多次加速、匀速和减速行为。本发明为较为全面建立深度强化学***均车速、平均行驶车速、最高车速、平均加速度、加速占比、减速占比、匀速占比、最大加速度、最大减速度;
各运动学片段中的特征参数可以表征运动学片段的特点,但是每个特征参数并不是独立的,相互之间存在着一定的关系,所以本发明之后利用主成分分析,对运动学片段的特征参数进行降维的同时,尽可能全面地涵盖所有工况特征,降低分类难度的同时提高可信度。具体实现过程如下:
(1)对数据进行标准化:
(2)计算Z矩阵的协方差矩阵C
(3)对协方差矩阵C做特征值分解
C=Q∑Q-1 (6)
其中,Q为特征值向量组成的矩阵,∑为一个对角阵,对角线上元素为特征值λ1、λ2、…、λm。
(4)计算各特征向量的贡献率p1、p2、…pm和累计贡献率。
累计贡献率Pj为前k个主成分贡献率的累加。
(5)将主成分对应的特征向量作为转换矩阵,用数据矩阵乘以转换矩阵,实现主成分映射,得到降维后的对应运动学片段特征参数;
之后使用模糊聚类中的模糊C均值聚类,根据所得的主成分结果对运动学片段进行聚类分析,其流程如下:
(1)设定聚类数目nc和加权指数b;
(2)初始化各聚类中心mj
(3)计算当前聚类中心下各样本的隶属度函数:
其中μj(xi)表示为第i个样本对应第j类的隶属度函数。
(4)计算当前隶属度函数下的各类聚类中心:
(5)直至算法收敛或达到最大迭代次数,否则重复(3)、(4)两步。
为确定聚类数目nc,本文使用L(nc)函数作为评价指标,其公式如下:
式中,分子表示类间距离之和,分母表示类内间距之和,所以L(nc)值越大表示分类效果越好。
根据模糊聚类结果,将不同类别的运动学片段组成了3类运动学片段库,之后在3类运动学片段库中各随机抽取出一定数量的运动学片段,并对各类运动学片段进行随机排列,得到训练用的3种工况。
最后使用LVQ神经网络在3中训练工况下对工况类别进行训练辨识,具体步骤如下所示:
(1)对训练用工况1、2、3进行组合,并使用滑窗算法,计算出窗口数据中对应的9种特征参数作为LVQ神经网络的输入,并以工况类别的向量形式作为标签进行训练。
(2)其中窗口数量过长的话,会导致窗口数据中可能包含一种以上的工况数据,从而增加辨识难度。窗口数量过短的话,则工况特征信息不全面,会导致辨识精度下降,从而降低整车的燃油经济性。综合考虑,本文以35s为窗口长度进行滚动提取工况特征参数。
(3)对LVQ神经网络进行训练。所选用的超参数为:LVQ神经竞争层节点数选取为500个,学习率为0.0005,学习函数类型为learnlv1,迭代周期为50次。
(4)验证LVQ神经网络准确性。将验证工况进行长度为35s的滑窗操作,滚动提取出的特征参数作为训练后的LVQ神经网络的输入,并将输出进行索引化操作,得到的验证工况辨识结果。
4、根据权利要求1所述的一种基于工况辨识的规则融合深度强化学习能量管理方法,其特征在于,所述步骤3设计包含状态、动作、agent和惩罚函数,状态空间选取为需求转矩Tr、电池SOC和变速器当前传动比,动作变量选取为发动机输出转矩Te和换挡动作Ag,融合规则的agent设计借鉴了规则类算法进行能量分配的思路,将规则融入深度Q学习的机器中,得到了一种融合规则的深度Q学习算法,提高样本池中有效样本数量,插电式混合动力汽车一般将电池SOC工作区间控制在一定的范围内以保证电池的循环寿命和少量电能储备用于特殊情况,将SOC作为规则控制量,且SOC高效工作范围设置为0.2-0.8;并且将动力***的转矩作为规则控制量;
惩罚函数计算方法为:
其中,b是燃油消耗率,可根据发动机当前转矩和转速从万有特性曲线图中得出;ρ是燃油密度;g是重力加速度;Cf是每升燃油价格;Ce是每kwh电能价格;λA是换挡动作值加权系数;λp1是较差换挡策略下的惩罚系数;λp2是SOC超出使用上下限时的惩罚系数。
本发明采用以上技术方案与现有技术相比,具有以下有益效果:
1.在三种不同训练工况下对所设计的规则融合的深度强化学习算法进行训练,得到三种适用于不同工况类别下的深度神经网络net1、net2、net3,以用于混合动力***的能量分配;
2.在实际使用过程中先使用滑窗算法,计算出窗口数据中对应的9种特征参数作为训练好的LVQ神经网络的输入,得到当前的工况类别,再使用对应工况类别训练下的规则融合的深度强化学习算法对混合动力***的能量进行分配,从而达到能量高效分配和利用的目的。
附图说明
图1是插电式混合动力***结构图;
图2是电池Rint等效电路模型;
图3是能量管理策略算法流程图。
具体实施方式
下面结合附图对本发明的技术方案做进一步的详细说明:
本发明可以以许多不同的形式实现,而不应当认为限于这里所述的实施例。相反,提供这些实施例以便使本公开透彻且完整,并且将向本领域技术人员充分表达本发明的范围。
如图1所示为插电式混合动力***结构图,由燃油发动机、电动机、车载动力电池、油箱、转矩耦合器、离合器和5档变速箱组成。燃油发动机与转矩耦合器相连接,电动机直接与转矩耦合器一端相连接,转矩耦合器输出端与离合器连接,离合器另一端与5挡变速器连接,之后将动力传输给前桥驱动车辆行驶。车型包含了五档变速器,而档位直接涉及到动力***所需转矩,从而影响车辆的动力储备能力,所以本文也将动力***的转矩作为规则控制量。
其中,插电式混合动力汽车发动机是驱动车辆行驶和补充电池电量的动力来源,其重要性是高于电动机的,所以以发动机转矩作为第一级规则控制量,其次以电池的SOC作为第二级规则控制,因为电机转矩较大,动力储备能力较强,所以以电机转矩作为第三级规则控制量。
如图2所示为电池Rint等效电路模型,可得:
式中,I为电池,放电时为正,电流充电时为负;Uocv为电池的开路电压,可由开路电压试验获得;R为电池内阻,其值随SOC而变化,可通过查表获得;Pbat为电池的功率,当电机转矩Tm为正时,电池处于放电状态,电机转矩Tm为负时,电池处于充电状态;nm为电机转速;ηbat-d为电池放电效率;ηbat-c为电池充电效率;ηm为电机当前转速转矩下的效率;SOC为电池的荷电状态;△t为采样间隔;Q为电池容量。
如图3所示为能量管理策略算法流程图,
首先对工况中的速度学片段的特征值使用主成分分析进行了降维,并使用模糊聚类对运动学片段进行了分类,再根据分类结果进行工况重组,得到了低速、中速和高速训练工况,并使用LVQ神经网络对工况类型进行训练。之后建立了以发动机转矩、SOC、电机转矩为规则控制变量、驱动模式为输出量的规则,并将其融入深度强化学习的agent中,结合所设计的惩罚函数,在三种工况下分别对规则融合深度强化学习能量管理进行了训练。之后在实际使用过程中,首先对当前运行工况使用滑窗算法提取特征参数,再将其作为训练好的LVQ神经网络的输入,得到当前工况类别,之后根据工况类别选取相应工况训练后的规则融合深度强化学习能量管理策略进行混合动力***的能量分配。
以上所述的具体实施方式,对本发明的目的、技术方案和有益效果进行了进一步详细说明,所应理解的是,以上所述仅为本发明的具体实施方式而已,并不用于限制本发明,凡在本发明的精神和原则之内,所做的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。
Claims (4)
1.一种基于工况辨识的规则融合深度强化学习能量管理方法,其特征在于,具体包括以下步骤:
步骤1、混合动力***模型建立;
步骤2、工况分类及辨识;
步骤3、规则融合的深度强化学习能量管理策略设计。
2.根据权利要求1所述的一种基于工况辨识的规则融合深度强化学习能量管理方法,其特征在于,所述步骤1以插电式混合动力汽车为对象建立,采用并联式结构作为发动机和电动机的连接方式建立混合动力***模型;其中插电式混合动力***由燃油发动机、电动机、车载动力电池、油箱、转矩耦合器、离合器和5档变速箱组成;燃油发动机与转矩耦合器相连接,电动机直接与转矩耦合器一端相连接,转矩耦合器输出端与离合器连接,离合器另一端与5挡变速器连接,之后将动力传输给前桥驱动车辆行驶;
动力电池采用Rint等效电路模型:
式中,I为电池,放电时为正,电流充电时为负;Uocv为电池的开路电压,可由开路电压试验获得;R为电池内阻,其值随SOC而变化,可通过查表获得;Pbat为电池的功率,当电机转矩Tm为正时,电池处于放电状态,电机转矩Tm为负时,电池处于充电状态;nm为电机转速;ηbat-d为电池放电效率;ηbat-c为电池充电效率;ηm为电机当前转速转矩下的效率;SOC为电池的荷电状态;△t为采样间隔;Q为电池容量;
不考虑车辆的垂向运动和操作稳定性时,车辆纵向行驶方程为:
式中,Tcon为当前工况所需转矩;ig为当前档位变速器传动比;i0为主减速器传动比;ηT为总传动效率;r为车轮半径;m为整车质量;g为重力加速度;f为滚动阻力系数;θ为道坡道角度;CD为空气阻力系数;A为车辆迎风面积;u为车速;δ为旋转质量换算系数;
车辆转矩耦合器采用三端口两自由度的机械配置,端口1为单向功率输入,端口2和端口3为双向功率输入或输出,端口1连接发动机曲轴,端口2连接电动机输出轴,端口3连接离合器输入端;
矩耦合器各端口转矩与转速的关系为:
T3=ieTe+imTm
式中,Te为发动机转矩;ne为发动机转速;T3为耦合器输出转矩;n3为耦合器输出转速;ie为端口1连接发动机曲轴处的传动比,本文取ie=1;im为端口2的连接电动机输出轴的传动比,一般电机转速较高,需要对其进行减速,本发明im取为1.7368;
根据转矩耦合器中发动机和电机的能量流方向可分为3种驱动模式:
(1)联合驱动模式:在此模式下,端口1和端口2为功率输入端,端口3为功率输出端,发动机和电动机共同提供动力驱动车辆行驶,此时电机转矩Tm为正,电池处于放电状态;
(2)纯电驱动模式:在此模式下,端口1无功率输入,端口2为功率输入端,电动机单独驱动车辆,此时电机转矩Tm为正,电池处于放电状态,发动机停机,因为端口1为单向功率输入,所以可实现发动机在动力***上的解耦,从而减小机械损耗;
(3)电机充电模式:在此模式下,车辆的电动机变为发电机,电机转矩Tm为负;并且可根据车辆行驶状态分为驱动状态下充电和非驱动状态下充电;驱动状态下充电时,离合器结合,端口1为功率输入端,端口2和端口3为功率输出端,发动机在提供动力驱动车辆行驶的同时,驱动发电机转动,电池处于充电状态;停车状态下充电时,端口1为功率输入端,端口2为功率输出端,端口3无功率输出,离合器分离,减少变速箱和前桥带来的机械损耗,发动机只提供动力给发电机,对电池进行充电。
3.根据权利要求1所述的一种基于工况辨识的规则融合深度强化学***均车速、平均行驶车速、最高车速、平均加速度、加速占比、减速占比、匀速占比、最大加速度、最大减速度;
各运动学片段中的特征参数可以表征运动学片段的特点,但是每个特征参数并不是独立的,相互之间存在着一定的关系,所以本发明之后利用主成分分析,对运动学片段的特征参数进行降维的同时,尽可能全面地涵盖所有工况特征,降低分类难度的同时提高可信度;具体实现过程如下:
(1)对数据进行标准化:
(2)计算Z矩阵的协方差矩阵C
(3)对协方差矩阵C做特征值分解
C=Q∑Q-1
其中,Q为特征值向量组成的矩阵,∑为一个对角阵,对角线上元素为特征值λ1、λ2、…、λm;
(4)计算各特征向量的贡献率p1、p2、…pm和累计贡献率;
累计贡献率Pj为前k个主成分贡献率的累加;
(5)将主成分对应的特征向量作为转换矩阵,用数据矩阵乘以转换矩阵,实现主成分映射,得到降维后的对应运动学片段特征参数;
之后使用模糊聚类中的模糊C均值聚类,根据所得的主成分结果对运动学片段进行聚类分析,其流程如下:
(1)设定聚类数目nc和加权指数b;
(2)初始化各聚类中心mj
(3)计算当前聚类中心下各样本的隶属度函数:
其中μj(xi)表示为第i个样本对应第j类的隶属度函数;
(4)计算当前隶属度函数下的各类聚类中心:
(5)直至算法收敛或达到最大迭代次数,否则重复(3)、(4)两步;
为确定聚类数目nc,本文使用L(nc)函数作为评价指标,其公式如下:
式中,分子表示类间距离之和,分母表示类内间距之和,所以L(nc)值越大表示分类效果越好;
根据模糊聚类结果,将不同类别的运动学片段组成了3类运动学片段库,之后在3类运动学片段库中各随机抽取出一定数量的运动学片段,并对各类运动学片段进行随机排列,得到训练用的3种工况;
最后使用LVQ神经网络在3中训练工况下对工况类别进行训练辨识,具体步骤如下所示:
(1)对训练用工况1、2、3进行组合,并使用滑窗算法,计算出窗口数据中对应的9种特征参数作为LVQ神经网络的输入,并以工况类别的向量形式作为标签进行训练;
(2)其中窗口数量过长的话,会导致窗口数据中可能包含一种以上的工况数据,从而增加辨识难度;窗口数量过短的话,则工况特征信息不全面,会导致辨识精度下降,从而降低整车的燃油经济性;综合考虑,本文以35s为窗口长度进行滚动提取工况特征参数;
(3)对LVQ神经网络进行训练,所选用的超参数为:LVQ神经竞争层节点数选取为500个,学习率为0.0005,学习函数类型为learnlv1,迭代周期为50次;
(4)验证LVQ神经网络准确性;将验证工况进行长度为35s的滑窗操作,滚动提取出的特征参数作为训练后的LVQ神经网络的输入,并将输出进行索引化操作,得到的验证工况辨识结果。
4.根据权利要求1所述的一种基于工况辨识的规则融合深度强化学习能量管理方法,其特征在于,所述步骤3设计包含状态、动作、agent和惩罚函数,状态空间选取为需求转矩Tr、电池SOC和变速器当前传动比,动作变量选取为发动机输出转矩Te和换挡动作Ag,融合规则的agent设计借鉴了规则类算法进行能量分配的思路,将规则融入深度Q学习的机器中,得到了一种融合规则的深度Q学习算法,提高样本池中有效样本数量,插电式混合动力汽车一般将电池SOC工作区间控制在一定的范围内以保证电池的循环寿命和少量电能储备用于特殊情况,将SOC作为规则控制量,且SOC高效工作范围设置为0.2-0.8;并且将动力***的转矩作为规则控制量;
惩罚函数计算方法为:
其中,b是燃油消耗率,可根据发动机当前转矩和转速从万有特性曲线图中得出;ρ是燃油密度;g是重力加速度;Cf是每升燃油价格;Ce是每kwh电能价格;λA是换挡动作值加权系数;λp1是较差换挡策略下的惩罚系数;λp2是SOC超出使用上下限时的惩罚系数。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202111177978.1A CN113715805B (zh) | 2021-10-09 | 2021-10-09 | 一种基于工况辨识的规则融合深度强化学习能量管理方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202111177978.1A CN113715805B (zh) | 2021-10-09 | 2021-10-09 | 一种基于工况辨识的规则融合深度强化学习能量管理方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN113715805A true CN113715805A (zh) | 2021-11-30 |
CN113715805B CN113715805B (zh) | 2023-01-06 |
Family
ID=78685752
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202111177978.1A Active CN113715805B (zh) | 2021-10-09 | 2021-10-09 | 一种基于工况辨识的规则融合深度强化学习能量管理方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN113715805B (zh) |
Cited By (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN116821775A (zh) * | 2023-08-29 | 2023-09-29 | 陕西重型汽车有限公司 | 一种基于机器学习的载重估计方法 |
CN118092150A (zh) * | 2023-11-13 | 2024-05-28 | 重庆大学 | 深度强化学习型能量管理策略的无权重训练及测试方法 |
CN118386952A (zh) * | 2024-06-26 | 2024-07-26 | 合肥工业大学 | 一种基于工况识别的燃料电池汽车能量管理方法和*** |
CN118386952B (zh) * | 2024-06-26 | 2024-08-30 | 合肥工业大学 | 一种基于工况识别的燃料电池汽车能量管理方法和*** |
Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20090198396A1 (en) * | 2008-02-04 | 2009-08-06 | Fernando Rodriguez | Adaptive control strategy and method for optimizing hybrid electric vehicles |
CN104071161A (zh) * | 2014-04-29 | 2014-10-01 | 福州大学 | 一种插电式混合动力汽车工况识别及能量管控的方法 |
CN110929920A (zh) * | 2019-11-05 | 2020-03-27 | 中车戚墅堰机车有限公司 | 一种基于工况识别的混合动力列车能量管理方法 |
CN112035949A (zh) * | 2020-08-14 | 2020-12-04 | 浙大宁波理工学院 | 一种结合q增强学习的实时模糊能源管理方法 |
CN112116156A (zh) * | 2020-09-18 | 2020-12-22 | 中南大学 | 基于深度强化学习的混动列车的能量管理方法及*** |
-
2021
- 2021-10-09 CN CN202111177978.1A patent/CN113715805B/zh active Active
Patent Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20090198396A1 (en) * | 2008-02-04 | 2009-08-06 | Fernando Rodriguez | Adaptive control strategy and method for optimizing hybrid electric vehicles |
CN104071161A (zh) * | 2014-04-29 | 2014-10-01 | 福州大学 | 一种插电式混合动力汽车工况识别及能量管控的方法 |
CN110929920A (zh) * | 2019-11-05 | 2020-03-27 | 中车戚墅堰机车有限公司 | 一种基于工况识别的混合动力列车能量管理方法 |
CN112035949A (zh) * | 2020-08-14 | 2020-12-04 | 浙大宁波理工学院 | 一种结合q增强学习的实时模糊能源管理方法 |
CN112116156A (zh) * | 2020-09-18 | 2020-12-22 | 中南大学 | 基于深度强化学习的混动列车的能量管理方法及*** |
Cited By (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN116821775A (zh) * | 2023-08-29 | 2023-09-29 | 陕西重型汽车有限公司 | 一种基于机器学习的载重估计方法 |
CN118092150A (zh) * | 2023-11-13 | 2024-05-28 | 重庆大学 | 深度强化学习型能量管理策略的无权重训练及测试方法 |
CN118386952A (zh) * | 2024-06-26 | 2024-07-26 | 合肥工业大学 | 一种基于工况识别的燃料电池汽车能量管理方法和*** |
CN118386952B (zh) * | 2024-06-26 | 2024-08-30 | 合肥工业大学 | 一种基于工况识别的燃料电池汽车能量管理方法和*** |
Also Published As
Publication number | Publication date |
---|---|
CN113715805B (zh) | 2023-01-06 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Khayyam et al. | Adaptive intelligent energy management system of plug-in hybrid electric vehicle | |
CN112287463B (zh) | 一种基于深度强化学习算法的燃料电池汽车能量管理方法 | |
CN113715805B (zh) | 一种基于工况辨识的规则融合深度强化学习能量管理方法 | |
CN105868942B (zh) | 电动汽车的有序充电调度方法 | |
Lee et al. | A novel big data modeling method for improving driving range estimation of EVs | |
Kim et al. | Estimation of Li-ion battery state of health based on multilayer perceptron: As an EV application | |
Li et al. | Back-to-back competitive learning mechanism for fuzzy logic based supervisory control system of hybrid electric vehicles | |
CN112180280A (zh) | 一种考虑电池健康状态的混合动力汽车电池寿命优化方法 | |
CN113479186B (zh) | 一种混合动力汽车能量管理策略优化方法 | |
CN112327168A (zh) | 一种基于XGBoost的电动汽车电池消耗预测方法 | |
Khayyam et al. | Intelligent energy management in hybrid electric vehicles | |
CN111079230A (zh) | 一种基于nsga-ii的插电式混合动力汽车动力传动***参数多目标优化方法 | |
CN113815437B (zh) | 燃料电池混合动力汽车的预测性能量管理方法 | |
CN115759462A (zh) | 一种电动汽车用户的充电行为预测方法、装置及电子设备 | |
Lee et al. | Learning to recognize driving patterns for collectively characterizing electric vehicle driving behaviors | |
Chang et al. | A novel energy management strategy integrating deep reinforcement learning and rule based on condition identification | |
Peng et al. | Ecological Driving Framework of Hybrid Electric Vehicle Based on Heterogeneous Multi-Agent Deep Reinforcement Learning | |
CN114122466B (zh) | 燃料电池车电池优化管理方法、***、设备及介质 | |
Balch et al. | The affect of battery pack technology and size choices on hybrid electric vehicle performance and fuel economy | |
Chen et al. | A novel method of developing driving cycle for electric vehicles to evaluate the private driving habits | |
Zeng et al. | Cooperative optimization of speed planning and energy management for hybrid electric vehicles based on Nash equilibrium | |
Devie et al. | Real-world battery duty profile of a neighbourhood electric vehicle | |
Wang et al. | An enhanced hypotrochoid spiral optimization algorithm based intertwined optimal sizing and control strategy of a hybrid electric air-ground vehicle | |
Wimalendra et al. | Determination of maximum possible fuel economy of HEV for known drive cycle: genetic algorithm based approach | |
CN114670803A (zh) | 基于自我监督学习的并联式混合动力汽车能量管理方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |