CN109193075B - 基于强化学习的纯电动汽车动力电池冷却***控制方法 - Google Patents

基于强化学习的纯电动汽车动力电池冷却***控制方法 Download PDF

Info

Publication number
CN109193075B
CN109193075B CN201811135929.XA CN201811135929A CN109193075B CN 109193075 B CN109193075 B CN 109193075B CN 201811135929 A CN201811135929 A CN 201811135929A CN 109193075 B CN109193075 B CN 109193075B
Authority
CN
China
Prior art keywords
network
action
power battery
theta
online
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201811135929.XA
Other languages
English (en)
Other versions
CN109193075A (zh
Inventor
张炳力
高峰
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Hefei University of Technology
Original Assignee
Hefei University of Technology
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Hefei University of Technology filed Critical Hefei University of Technology
Priority to CN201811135929.XA priority Critical patent/CN109193075B/zh
Publication of CN109193075A publication Critical patent/CN109193075A/zh
Application granted granted Critical
Publication of CN109193075B publication Critical patent/CN109193075B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • HELECTRICITY
    • H01ELECTRIC ELEMENTS
    • H01MPROCESSES OR MEANS, e.g. BATTERIES, FOR THE DIRECT CONVERSION OF CHEMICAL ENERGY INTO ELECTRICAL ENERGY
    • H01M10/00Secondary cells; Manufacture thereof
    • H01M10/60Heating or cooling; Temperature control
    • H01M10/61Types of temperature control
    • H01M10/613Cooling or keeping cold
    • HELECTRICITY
    • H01ELECTRIC ELEMENTS
    • H01MPROCESSES OR MEANS, e.g. BATTERIES, FOR THE DIRECT CONVERSION OF CHEMICAL ENERGY INTO ELECTRICAL ENERGY
    • H01M10/00Secondary cells; Manufacture thereof
    • H01M10/60Heating or cooling; Temperature control
    • H01M10/62Heating or cooling; Temperature control specially adapted for specific applications
    • H01M10/625Vehicles
    • HELECTRICITY
    • H01ELECTRIC ELEMENTS
    • H01MPROCESSES OR MEANS, e.g. BATTERIES, FOR THE DIRECT CONVERSION OF CHEMICAL ENERGY INTO ELECTRICAL ENERGY
    • H01M10/00Secondary cells; Manufacture thereof
    • H01M10/60Heating or cooling; Temperature control
    • H01M10/63Control systems
    • H01M10/633Control systems characterised by algorithms, flow charts, software details or the like
    • HELECTRICITY
    • H01ELECTRIC ELEMENTS
    • H01MPROCESSES OR MEANS, e.g. BATTERIES, FOR THE DIRECT CONVERSION OF CHEMICAL ENERGY INTO ELECTRICAL ENERGY
    • H01M10/00Secondary cells; Manufacture thereof
    • H01M10/60Heating or cooling; Temperature control
    • H01M10/65Means for temperature control structurally associated with the cells
    • H01M10/656Means for temperature control structurally associated with the cells characterised by the type of heat-exchange fluid
    • H01M10/6567Liquids
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02EREDUCTION OF GREENHOUSE GAS [GHG] EMISSIONS, RELATED TO ENERGY GENERATION, TRANSMISSION OR DISTRIBUTION
    • Y02E60/00Enabling technologies; Technologies with a potential or indirect contribution to GHG emissions mitigation
    • Y02E60/10Energy storage using batteries

Landscapes

  • Engineering & Computer Science (AREA)
  • Manufacturing & Machinery (AREA)
  • Chemical & Material Sciences (AREA)
  • Chemical Kinetics & Catalysis (AREA)
  • Electrochemistry (AREA)
  • General Chemical & Material Sciences (AREA)
  • Automation & Control Theory (AREA)
  • Feedback Control In General (AREA)

Abstract

本发明涉及一种基于深度强化学习的纯电动汽车冷却***控制方法,包括:第一步获取纯电动汽车动力电池温度、动力电池工作电流,以及环境温度信息;构建DDPG算法模型,进行强化学习训练,得到一组最优电子水泵PID控制参数;通过PID输入量得出PID控制量,并基于该PID控制量控制电子水泵工作;电子水泵工作改变动力电池冷却***中冷却液的流量,达到动力电池降温的目的,同时将动力电池信息传递给环境感知模块,返回第一步,循环整个流程。本发明将深度强化学习引入PID控制算法中,深度强化学习能较好的跟环境交互,具有自学习功能,适应不确定***的动态特性,因此能适应纯电动汽车运行环境复杂多变的特性,在不同的实际场景下实现在线控制。

Description

基于强化学习的纯电动汽车动力电池冷却***控制方法
技术领域
本发明涉及纯电动汽车热管理技术领域,尤其是一种基于强化学习的纯电动汽车动力电池冷却***控制方法。
背景技术
目前电动汽车采用的冷却电子水泵大多利用开关式的控制方式,这种方法主要是根据目标值设定一个期望的温度值,然后根据这个目标值来设置控制温度的上限值。如果温度超过了这个范围值,电子水泵开启降温,否则不启动,让冷却液在冷却循环中自然冷却。除此之外,还有模糊控制、专家***以及集成智能控制等。
其中,开关式的控制方式主要存在的问题是:会在某些特定的环境中使得电子水泵频繁的开启,严重影响了电子水泵的使用寿命;同时由于电子水泵启动时以最大转速工作,造成大量的功率无效的消耗,运行的成本会大大增加。模糊控制对于难以建立精确模型而可根据经验控制的***的控制效果较好,但存在模糊规则的设计、过于依赖人工设计而无法运用于延时大的***。专家***能较好的利用专家经验知识,但存在知识获取依赖人工以及推理能力较弱的不足。集成智能控制算法根据不同智能控制算法的优点进行结合,但仍无法完全避免结合的智能控制算法本身的不足。
发明内容
本发明的首要目的在于提供一种能适应纯电动汽车运行环境复杂多变的特性,在不同的实际场景下实现在线控制,降低人工设计难度,减小能量损耗的基于强化学习的纯电动汽车动力电池冷却***控制方法。
为实现上述目的,本发明采用了以下技术方案:一种基于强化学习的纯电动汽车动力电池冷却***控制方法,该方法包括下列顺序的步骤:
(1)获取纯电动汽车动力电池温度、动力电池工作电流,以及环境温度信息;
(2)基于纯电动汽车动力电池温度、动力电池工作电流,以及环境温度信息确定状态空间,基于待优化的PID参数构建动作空间,基于动力电池温度与最佳工作温度的温度差以及电子水泵转速加速度的加权平方和确定回报函数,并基于所述状态空间、动作空间和回报函数构建DDPG算法模型;对所构建的DDPG算法模型进行强化学习训练,得到一组最优电子水泵PID控制参数;
(3)通过PID输入量得出PID控制量,并基于该PID控制量控制电子水泵工作;
(4)电子水泵工作改变动力电池冷却***中冷却液的流量,达到动力电池降温的目的,同时将动力电池信息传递给环境感知模块,返回步骤(1);
所述步骤(2)中构建DDPG算法模型具体是指:
确定DDPG算法状态空间、动作空间和回报函数;
状态空间包含3个元素:动力电池温度、动力电池工作电流和环境温度;
动作空间包含3个PID控制参数,分别为:比例参数KP、微分参数KI和积分参数KD
回报函数:单次动作的回报r定义为动力电池温度与最佳工作温度的温度差以及电子水泵转速加速度的加权平方和;到目前为止的所有动作的累积总回报定义为:
Figure GDA0002382380910000021
式中:γ为折扣因子;ri为单次动作的回报;
Figure GDA0002382380910000022
为数学期望。
所述步骤(2)中对所构建的DDPG算法模型进行强化学习训练,得到一组最优电子水泵PID控制参数具体是指:
构建评价网络和动作网络,其中评价网络进行Q函数计算得到Q值:Q(s,a|θQ),输入为状态s、动作a,输出为Q函数Q(s,a|θQ),包含3个隐藏层,都是FC全连接网络层;动作网络进行状态s到动作的映射得到a=μ(s|θμ),输入为状态s,输出为动作a,包含1个隐藏层,采用FC全连接网络层;
评价网络分为Online评价网络和Target评价网络,动作网络分为Online动作网络和Target动作网络;Target评价网络和Online评价网络结构相同,Target动作网络和Online动作网络结构相同;
对Online评价网络和Online动作网络的参数θQ、θμ进行随机初始化;通过这两个网络参数θQ和θμ来初始化Target评价网络和Target动作网络的网络参数θQ′和θμ′,同时开辟一个空间R作为Memory Replay经验回放的储存空间;
初始化完成后,开始进行迭代求解:
通过当前网络加上高斯扰动选择一个动作进行探索,动作at=μ(s|θμ)+Nt,其中Nt是一个高斯扰动;
在当前状态st下执行动作at,得到相应的奖励rt和下一个状态st+1,并且将这个过程形成的元组(st,at,rt,st+1)储存到Memory Replay空间R中;
从Memory Replay空间R随机选择一个小批量的元组数据,作为Online动作网络和Online评价网络的训练数据,用(si,ai,ri,si+1)表示单个数据;si为状态,ai为执行动作,ri为相应的奖励,si+1为下一个状态;
更新Online评价网络:
定义Online评价网络Loss函数:
Figure GDA0002382380910000031
其中,yi为标签:yi=ri+γQ′(si+1,μ′(si+1μ′Q′),N为元组数据个数;
求出Loss函数关于θQ的梯度:
Figure GDA0002382380910000032
通过最小化Loss函数来更新Online评价网络;
更新Online评价网络结束后,再进行Online动作网络的更新:
计算J(θμ)的梯度:
Figure GDA0002382380910000033
依据梯度下降的原则对Online动作网络进行更新;
最后利用更新的Online评价网络和Online动作网络的参数θQ和θμ对Target评价网络和Target动作网络的网络参数θQ′和θμ′进行更新:
Figure GDA0002382380910000034
式中:τ为更新率,τ<<1,由此构建一个收敛的神经网络;
计算当前PID控制参数KP、KI、KD下的总回报,当J(θμ)达到最小值时,当前的控制策略达到最优;当J(θμ)非最小值时,依据策略梯度更新策略,重新选择KP、KI、KD参数,实施控制;循环网络更新流程,即首先更新Online评价网络,再进行Online动作网络的更新,最后利用更新的Online评价网络和Online动作网络的参数θQ和θμ对Target评价网络和Target动作网络的网络参数θQ′和θμ′进行更新,使得不同状态下对应的控制策略的总回报J(θμ)达到最小值时,此时PID参数KP、KI、KD最优,PID的控制量逼近期望值。
在所述步骤(3)中,采用如下公式计算控制量:
Figure GDA0002382380910000041
其中KP,KI,KD分别表示比例、微分和积分参数;输入量e(t)为动力电池当前温度与期望温度的差值,控制量u(t)为电子水泵的转速。
由上述技术方案可知,本发明的优点在于:第一,本发明将深度强化学***稳,避免电子水泵频繁启停,延长电子水泵使用寿命,同时尽力避免高转速的情况发生,减小能量损耗。
附图说明
图1本发明的控制方法流程图;
图2管道水头损失特性曲线;
图3评价网络结构图;
图4动作网络结构图;
图5DDPG算法更新流程图。
具体实施方式
如图1所示,一种基于强化学习的纯电动汽车动力电池冷却***控制方法,该方法包括下列顺序的步骤:
(1)获取纯电动汽车动力电池温度、动力电池工作电流,以及环境温度信息;
(2)基于纯电动汽车动力电池温度、动力电池工作电流,以及环境温度信息确定状态空间,基于待优化的PID参数构建动作空间,基于动力电池温度与最佳工作温度的温度差以及电子水泵转速加速度的加权平方和确定回报函数,并基于所述状态空间、动作空间和回报函数构建DDPG算法模型;对所构建的DDPG算法模型进行强化学习训练,得到一组最优电子水泵PID控制参数;
(3)通过PID输入量得出PID控制量,并基于该PID控制量控制电子水泵工作;
(4)电子水泵工作改变动力电池冷却***中冷却液的流量,达到动力电池降温的目的,同时将动力电池信息传递给环境感知模块,返回步骤(1)。通过得到的PID控制量输入相应的PWM波,控制电子水泵工作,使动力电池冷却***中冷却液循环流动,给动力电池降温;同时电池管理***(BMS)采集动力电池的当前电流、温度信息,温度传感器采集空气温度信息。
如图1所示,控制算法模块就是控制电子水泵转速的控制算法即DDPG算法,根据不同的环境状态即动力电池温度、电流、环境温度等,得出一组最佳PID控制参数即KP,KI,KD。环境感知模块即电池管理***、空气温度传感器等,用来采集环境状态信息即动力电池温度、电流、环境温度等,传递给控制算法模块。
在水力学中,水流经过管道时,一定存在管道水头损失,其值为:
∑h=KQ2
式中:K——代表长度、直径已定的管道的沿程摩阻和局部阻力之和的系数。
如图2所示,纵坐标hA表示水泵输出流量为QA时管道中每单位重量液体所需消耗的能量值,可以看到管道***中,通过的流量增大时,每单位重量液体在整个管道中消耗的能量以平方倍增大。换句话说,当热管理***所需的冷却液相同时,电子水泵以短时间高转速的方式工作比以长时间低转速的方式工作消耗的能量大。本发明采用DDPG算法作为该动力电池冷却***控制算法,用以解决连续的动作空间中的问题。将电子水泵的加速度作为考量因素,在保证动力电池温度要求的同时,使电子水泵的转速趋于平稳,避免电子水泵频繁启停,延长电子水泵使用寿命;同时尽力避免高转速的情况发生,减小能量损耗。
所述步骤(2)中构建DDPG算法模型具体是指:
确定DDPG算法状态空间、动作空间和回报函数;
状态空间包含3个元素:动力电池温度、动力电池工作电流和环境温度;
动作空间包含3个PID控制参数,分别为:比例参数KP、微分参数KI和积分参数KD
回报函数:单次动作的回报r定义为动力电池温度与最佳工作温度的温度差以及电子水泵转速加速度的加权平方和;到目前为止的所有动作的累积总回报定义为:
Figure GDA0002382380910000061
式中:γ为折扣因子;ri为单次动作的回报;
Figure GDA0002382380910000062
为数学期望。
所述步骤(2)中对所构建的DDPG算法模型进行强化学习训练,得到一组最优电子水泵PID控制参数具体是指:
构建评价网络和动作网络,其中评价网络进行Q函数计算得到Q值:Q(s,a|θQ),输入为状态s、动作a,输出为Q函数Q(s,a|θQ),包含3个隐藏层,都是FC全连接网络层,如图3所示;;动作网络进行状态s到动作的映射得到a=μ(s|θμ),输入为状态s,输出为动作a,包含1个隐藏层,采用FC全连接网络层,如图4所示;
评价网络分为Online评价网络和Target评价网络,动作网络分为Online动作网络和Target动作网络;Target评价网络和Online评价网络结构相同,Target动作网络和Online动作网络结构相同;
对Online评价网络和Online动作网络的参数θQ、θμ进行随机初始化;通过这两个网络参数θQ和θμ来初始化Target评价网络和Target动作网络的网络参数θQ′和θμ′,同时开辟一个空间R作为Memory Replay经验回放的储存空间;
初始化完成后,开始进行迭代求解:
通过当前网络加上高斯扰动选择一个动作进行探索,动作at=μ(s|θμ)+Nt,其中Nt是一个高斯扰动;
在当前状态st下执行动作at,得到相应的奖励rt和下一个状态st+1,并且将这个过程形成的元组(st,at,rt,st+1)储存到Memory Replay空间R中;
从Memory Replay空间R随机选择一个小批量的元组数据,作为Online动作网络和Online评价网络的训练数据,用(si,ai,ri,si+1)表示单个数据;si为状态,ai为执行动作,ri为相应的奖励,si+1为下一个状态;
更新Online评价网络,如图5中①所示:
定义Online评价网络Loss函数:
Figure GDA0002382380910000071
其中,yi为标签:yi=ri+γQ′(si+1,μ′(si+1μ′Q′),N为元组数据个数;
求出Loss函数关于θQ的梯度:
Figure GDA0002382380910000072
通过最小化Loss函数来更新Online评价网络;
更新Online评价网络结束后,再进行Online动作网络的更新,如图5中②所示:
计算J(θμ)的梯度:
Figure GDA0002382380910000073
依据梯度下降的原则对Online动作网络进行更新;
最后利用更新的Online评价网络和Online动作网络的参数θQ和θμ对Target评价网络和Target动作网络的网络参数θQ′和θμ′进行更新,如图5中③所示:
Figure GDA0002382380910000074
式中:τ为更新率,τ<<1,由此构建一个收敛的神经网络;
计算当前PID控制参数KP、KI、KD下的总回报,当J(θμ)达到最小值时,当前的控制策略达到最优;当J(θμ)非最小值时,依据策略梯度更新策略,重新选择KP、KI、KD参数,实施控制;循环网络更新流程,即首先更新Online评价网络,再进行Online动作网络的更新,最后利用更新的Online评价网络和Online动作网络的参数θQ和θμ对Target评价网络和Target动作网络的网络参数θQ′和θμ′进行更新,使得不同状态下对应的控制策略的总回报J(θμ)达到最小值时,此时PID参数KP、KI、KD最优,PID的控制量逼近期望值。期望值是指能够保证动力电池维持在26℃,且转速趋向稳定的电子水泵的转速。所述J(θμ)最小值是计算机通过梯度求解的。
在所述步骤(3)中,采用如下公式计算控制量:
Figure GDA0002382380910000081
其中KP,KI,KD分别表示比例、微分和积分参数;输入量e(t)为动力电池当前温度与期望温度的差值,控制量u(t)为电子水泵的转速。
综上所述,本发明将深度强化学习引入PID控制算法中,深度强化学习能较好的跟环境交互,具有自学习功能,适应不确定***的动态特性,因此能适应纯电动汽车运行环境复杂多变的特性,在不同的实际场景下实现在线控制。

Claims (3)

1.一种基于深度强化学习的纯电动汽车冷却***控制方法,该方法包括下列顺序的步骤:
(1)获取纯电动汽车动力电池温度、动力电池工作电流,以及环境温度信息;
(2)基于纯电动汽车动力电池温度、动力电池工作电流,以及环境温度信息确定状态空间,基于待优化的PID参数构建动作空间,基于动力电池温度与最佳工作温度的温度差以及电子水泵转速加速度的加权平方和确定回报函数,并基于所述状态空间、动作空间和回报函数构建DDPG算法模型;对所构建的DDPG算法模型进行强化学习训练,得到一组最优电子水泵PID控制参数;
(3)通过PID输入量得出PID控制量,并基于该PID控制量控制电子水泵工作;
(4)电子水泵工作改变动力电池冷却***中冷却液的流量,达到动力电池降温的目的,同时将动力电池信息传递给环境感知模块,返回步骤(1);
所述步骤(2)中构建DDPG算法模型具体是指:
确定DDPG算法状态空间、动作空间和回报函数;
状态空间包含3个元素:动力电池温度、动力电池工作电流和环境温度;
动作空间包含3个PID控制参数,分别为:比例参数KP、微分参数KI和积分参数KD
回报函数:单次动作的回报r定义为动力电池温度与最佳工作温度的温度差以及电子水泵转速加速度的加权平方和;到目前为止的所有动作的累积总回报定义为:
Figure FDA0002382380900000011
式中:γ为折扣因子;ri为单次动作的回报;
Figure FDA0002382380900000012
为数学期望。
2.根据权利要求1所述的基于深度强化学习的纯电动汽车冷却***控制方法,其特征在于:所述步骤(2)中对所构建的DDPG算法模型进行强化学习训练,得到一组最优电子水泵PID控制参数具体是指:
构建评价网络和动作网络,其中评价网络进行Q函数计算得到Q值:Q(s,a|θQ),输入为状态s、动作a,输出为Q函数Q(s,a|θQ),包含3个隐藏层,都是FC全连接网络层;动作网络进行状态s到动作的映射得到a=μ(s|θμ),输入为状态s,输出为动作a,包含1个隐藏层,采用FC全连接网络层;
评价网络分为Online评价网络和Target评价网络,动作网络分为Online动作网络和Target动作网络;Target评价网络和Online评价网络结构相同,Target动作网络和Online动作网络结构相同;
对Online评价网络和Online动作网络的参数θQ、θμ进行随机初始化;通过这两个网络参数θQ和θμ来初始化Target评价网络和Target动作网络的网络参数θQ′和θμ′,同时开辟一个空间R作为Memory Replay经验回放的储存空间;
初始化完成后,开始进行迭代求解:
通过当前网络加上高斯扰动选择一个动作进行探索,动作at=μ(s|θμ)+Nt,其中Nt是一个高斯扰动;
在当前状态st下执行动作at,得到相应的奖励rt和下一个状态st+1,并且将这个过程形成的元组(st,at,rt,st+1)储存到Memory Replay空间R中;
从Memory Replay空间R随机选择一个小批量的元组数据,作为Online动作网络和Online评价网络的训练数据,用(si,ai,ri,si+1)表示单个数据;si为状态,ai为执行动作,ri为相应的奖励,si+1为下一个状态;
更新Online评价网络:
定义Online评价网络Loss函数:
Figure FDA0002382380900000021
其中,yi为标签:yi=ri+γQ′(si+1,μ′(si+1μ′)|θQ′),N为元组数据个数;
求出Loss函数关于θQ的梯度:
Figure FDA0002382380900000022
通过最小化Loss函数来更新Online评价网络;
更新Online评价网络结束后,再进行Online动作网络的更新:
计算J(θμ)的梯度:
Figure FDA0002382380900000031
依据梯度下降的原则对Online动作网络进行更新;
最后利用更新的Online评价网络和Online动作网络的参数θQ和θμ对Target评价网络和Target动作网络的网络参数θQ′和θμ′进行更新:
Figure FDA0002382380900000032
式中:τ为更新率,τ<<1,由此构建一个收敛的神经网络;
计算当前PID控制参数KP、KI、KD下的总回报,当J(θμ)达到最小值时,当前的控制策略达到最优;当J(θμ)非最小值时,依据策略梯度更新策略,重新选择KP、KI、KD参数,实施控制;循环网络更新流程,即首先更新Online评价网络,再进行Online动作网络的更新,最后利用更新的Online评价网络和Online动作网络的参数θQ和θμ对Target评价网络和Target动作网络的网络参数θQ′和θμ′进行更新,使得不同状态下对应的控制策略的总回报J(θμ)达到最小值时,此时PID参数KP、KI、KD最优,PID的控制量逼近期望值。
3.根据权利要求1所述的基于深度强化学习的纯电动汽车冷却***控制方法,其特征在于:在所述步骤(3)中,采用如下公式计算PID控制量:
Figure FDA0002382380900000033
其中KP,KI,KD分别表示比例、微分和积分参数;输入量e(t)为动力电池当前温度与期望温度的差值,控制量u(t)为电子水泵的转速。
CN201811135929.XA 2018-09-28 2018-09-28 基于强化学习的纯电动汽车动力电池冷却***控制方法 Active CN109193075B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201811135929.XA CN109193075B (zh) 2018-09-28 2018-09-28 基于强化学习的纯电动汽车动力电池冷却***控制方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201811135929.XA CN109193075B (zh) 2018-09-28 2018-09-28 基于强化学习的纯电动汽车动力电池冷却***控制方法

Publications (2)

Publication Number Publication Date
CN109193075A CN109193075A (zh) 2019-01-11
CN109193075B true CN109193075B (zh) 2020-06-05

Family

ID=64907543

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201811135929.XA Active CN109193075B (zh) 2018-09-28 2018-09-28 基于强化学习的纯电动汽车动力电池冷却***控制方法

Country Status (1)

Country Link
CN (1) CN109193075B (zh)

Families Citing this family (25)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109686050A (zh) * 2019-01-18 2019-04-26 桂林电子科技大学 基于云服务与深度神经网络的车内环境监测预警方法
CN110134165B (zh) * 2019-05-13 2020-12-25 北京鹏通高科科技有限公司 一种用于环境监测与控制的强化学习方法及***
CN112103593A (zh) * 2019-06-17 2020-12-18 比亚迪股份有限公司 车辆热管理方法、装置、车辆及存储介质
CN110308655B (zh) * 2019-07-02 2020-10-23 西安交通大学 一种基于a3c算法的伺服***补偿方法
CN110531617B (zh) * 2019-07-30 2021-01-08 北京邮电大学 多无人机3d悬停位置联合优化方法、装置和无人机基站
CN110515411B (zh) * 2019-09-05 2020-06-30 江苏环保产业技术研究院股份公司 一种水处理加药量控制方法及***
CN110649281B (zh) * 2019-09-30 2022-05-06 西安新衡科测控技术有限责任公司 一种ht-pem甲醇水燃料电池冷却液循环控制***及控制方法
JP7331660B2 (ja) * 2019-11-26 2023-08-23 横河電機株式会社 装置、方法およびプログラム
CN111082107B (zh) * 2019-12-31 2021-08-20 潍柴动力股份有限公司 一种热管理方法及相关装置
CN111224195A (zh) * 2020-01-14 2020-06-02 合肥工业大学 电池组散热***及其散热方法
JP7484382B2 (ja) 2020-04-24 2024-05-16 横河電機株式会社 制御装置、制御方法および制御プログラム
CN111976540B (zh) * 2020-09-14 2021-08-31 东方醒狮(福建)储能科技有限公司 一种锂离子动力储能电池热管理方法及***
CN112947627B (zh) * 2021-02-24 2021-11-23 金陵科技学院 一种基于ddpg-模糊pid的温度控制方法
CN113050430B (zh) * 2021-03-29 2023-05-02 浙江大学 一种基于鲁棒强化学习的排水***控制方法
CN113224412B (zh) * 2021-03-31 2023-01-06 联合汽车电子有限公司 动力电池的控温方法、ampc控制器、热管理***及介质
CN113034210B (zh) * 2021-04-28 2022-02-01 重庆大学 一种基于数据驱动场景下车辆行驶成本评价方法
CN113419419A (zh) * 2021-06-24 2021-09-21 上海电机学院 一种新能源汽车的热管理***
CN113685258B (zh) * 2021-07-15 2022-06-28 东风汽车集团股份有限公司 发动机电子水泵的控制方法及终端设备
CN114156567B (zh) * 2021-11-19 2024-03-26 同济大学 一种基于机器学习的动力电池热管理***
FR3131660A1 (fr) * 2022-01-04 2023-07-07 Psa Automobiles Sa Systeme de contrôle thermique a intelligence artificielle, procede et vehicule sur la base d’un tel systeme
CN115832532B (zh) * 2023-02-14 2023-05-23 广东采日能源科技有限公司 液冷储能***的控制方法、装置及***
CN116565383B (zh) * 2023-05-30 2024-03-01 重庆赛力斯凤凰智创科技有限公司 一种电池冷却方法、装置及车辆
CN117097227B (zh) * 2023-10-17 2024-01-26 深圳市华科科技有限公司 电机的调速控制方法及相关装置
CN117231599B (zh) * 2023-11-14 2024-02-02 上海海维工业控制有限公司 基于pid的液压执行机构驱动力控制方法
CN117409557B (zh) * 2023-12-14 2024-02-20 成都格理特电子技术有限公司 基于动态分析的检测高温报警方法

Family Cites Families (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP5033327B2 (ja) * 2005-12-16 2012-09-26 株式会社Eneosセルテック 燃料電池熱電併給装置
CN101000972B (zh) * 2006-12-28 2011-05-11 奇瑞汽车有限公司 用于混合动力汽车的电池热控制装置
CN202965937U (zh) * 2012-12-18 2013-06-05 潍柴动力股份有限公司 一种电动汽车高压部件的冷却装置
CN107479368B (zh) * 2017-06-30 2021-09-21 北京百度网讯科技有限公司 一种基于人工智能的训练无人机控制模型的方法及***
CN107943022B (zh) * 2017-10-23 2021-07-16 清华大学 一种基于强化学习的pid机车自动驾驶优化控制方法
CN108051999B (zh) * 2017-10-31 2020-08-25 中国科学技术大学 基于深度强化学习的加速器束流轨道控制方法及***

Also Published As

Publication number Publication date
CN109193075A (zh) 2019-01-11

Similar Documents

Publication Publication Date Title
CN109193075B (zh) 基于强化学习的纯电动汽车动力电池冷却***控制方法
CN111884213B (zh) 一种基于深度强化学习算法的配电网电压调节方法
CN111267831B (zh) 一种混合动力车辆智能变时域模型预测能量管理方法
Wu et al. Continuous reinforcement learning of energy management with deep Q network for a power split hybrid electric bus
Zhang et al. Ship motion attitude prediction based on an adaptive dynamic particle swarm optimization algorithm and bidirectional LSTM neural network
CN111126605B (zh) 一种基于强化学习算法的数据中心机房控制方法及装置
CN109591659B (zh) 一种智能学习的纯电动汽车能量管理控制方法
CN107704875A (zh) 基于改进ihcmac神经网络的建筑负荷预测方法和装置
CN110889085A (zh) 基于复杂网络多元在线回归的废水智能监控方法及***
CN111579993B (zh) 一种基于卷积神经网络的锂电池容量在线估计方法
CN107422272A (zh) 一种电动汽车动力电池soc智能化检测装置
CN112918330B (zh) 一种燃料电池车最优工作状态控制策略的计算方法
CN112181008B (zh) 高温化成柜热源功率智能控制方法、装置及介质
CN107367693A (zh) 一种电动汽车动力电池soc检测***
CN113224412B (zh) 动力电池的控温方法、ampc控制器、热管理***及介质
CN109910863B (zh) 一种基于插电式混合动力轿车专用变速器的控制方法
CN114279042B (zh) 一种基于多智能体深度强化学习的中央空调控制方法
WO2019006995A1 (zh) 一种电动汽车动力电池soc智能化预测***
CN111572407B (zh) 一种混动汽车热管理***及其控制方法
CN117131606A (zh) 一种可跨运动维度迁移的混合动力履带车辆能量管理方法
CN109548044B (zh) 一种基于ddpg的能量可收集通信的比特率优化方法
CN113479186A (zh) 一种混合动力汽车能量管理策略优化方法
CN115732810A (zh) 一种电动汽车电池包加温***控制方法
CN115130266A (zh) 用于车辆的热管理控制的方法和***
CN117784832A (zh) 一种测试车辆测试车速的控制方法、装置及电子设备

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant