CN112149909A - 船舶油耗预测方法、装置、计算机设备和存储介质 - Google Patents

船舶油耗预测方法、装置、计算机设备和存储介质 Download PDF

Info

Publication number
CN112149909A
CN112149909A CN202011041015.4A CN202011041015A CN112149909A CN 112149909 A CN112149909 A CN 112149909A CN 202011041015 A CN202011041015 A CN 202011041015A CN 112149909 A CN112149909 A CN 112149909A
Authority
CN
China
Prior art keywords
oil consumption
characteristic parameters
characteristic parameter
original
regression model
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202011041015.4A
Other languages
English (en)
Inventor
闫明胜
韩宝宏
李志�
郭标
孙成军
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Shenhua Zhonghai Shipping Co Ltd
Original Assignee
Shenhua Zhonghai Shipping Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Shenhua Zhonghai Shipping Co Ltd filed Critical Shenhua Zhonghai Shipping Co Ltd
Priority to CN202011041015.4A priority Critical patent/CN112149909A/zh
Publication of CN112149909A publication Critical patent/CN112149909A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/04Forecasting or optimisation specially adapted for administrative or management purposes, e.g. linear programming or "cutting stock problem"
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F17/00Digital computing or data processing equipment or methods, specially adapted for specific functions
    • G06F17/10Complex mathematical operations
    • G06F17/18Complex mathematical operations for evaluating statistical data, e.g. average values, frequency distributions, probability functions, regression analysis
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/21Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
    • G06F18/214Generating training patterns; Bootstrap methods, e.g. bagging or boosting
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/24Classification techniques
    • G06F18/243Classification techniques relating to the number of classes
    • G06F18/24323Tree-organised classifiers
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F30/00Computer-aided design [CAD]
    • G06F30/10Geometric CAD
    • G06F30/15Vehicle, aircraft or watercraft design
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F30/00Computer-aided design [CAD]
    • G06F30/20Design optimisation, verification or simulation
    • G06F30/27Design optimisation, verification or simulation using machine learning, e.g. artificial intelligence, neural networks, support vector machines [SVM] or training a model

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • Evolutionary Computation (AREA)
  • General Engineering & Computer Science (AREA)
  • Geometry (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Artificial Intelligence (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Computational Mathematics (AREA)
  • Mathematical Analysis (AREA)
  • Mathematical Optimization (AREA)
  • Evolutionary Biology (AREA)
  • Business, Economics & Management (AREA)
  • Pure & Applied Mathematics (AREA)
  • Mathematical Physics (AREA)
  • Human Resources & Organizations (AREA)
  • Computer Hardware Design (AREA)
  • Software Systems (AREA)
  • Operations Research (AREA)
  • Strategic Management (AREA)
  • Economics (AREA)
  • Marketing (AREA)
  • General Business, Economics & Management (AREA)
  • Development Economics (AREA)
  • Entrepreneurship & Innovation (AREA)
  • Algebra (AREA)
  • Quality & Reliability (AREA)
  • Tourism & Hospitality (AREA)
  • Game Theory and Decision Science (AREA)
  • Automation & Control Theory (AREA)
  • Aviation & Aerospace Engineering (AREA)
  • Probability & Statistics with Applications (AREA)
  • Databases & Information Systems (AREA)
  • Medical Informatics (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本申请涉及一种船舶油耗预测方法、装置、计算机设备和存储介质。其中,船舶油耗预测方法包括获取船舶的各油耗特征参数;采用随机森林算法对各油耗特征参数进行提取,得到预设数量的原始特征参数;对各原始特征参数进行预处理,得到目标特征参数;根据各目标特征参数,建立LASSO回归模型;获取当前特征参数,并采用LASSO回归模型处理当前特征参数,得到油耗预测值。通过随机森林算法缩减建立模型时所需要的特征参数的数量,其可以处理特征较多的数据集,并且在使用随机森林算法进行特征提取前,无需对特征参数对应的数据进行标准化处理。通过LASSO回归模型可以提高模型的可解释性以及进一步提高预测的准确度。

Description

船舶油耗预测方法、装置、计算机设备和存储介质
技术领域
本申请涉及船舶技术领域,特别是涉及一种船舶油耗预测方法、装置、计算机设备和存储介质。
背景技术
在国际航运市场中,如何降低航运的成本提高利润一直为国际航运市场普遍关心的话题,而降低主机燃油消耗则是其中关键的一环。与此同时,随着生产力的发展,人民生活水平的提高,越来越多地国家开始关注环境问题,要求航运船舶更低地排放量。这些均促使着航运公司追求更低的主机燃油消耗。
在实现过程中,发明人发现传统技术中至少存在如下问题:当前油耗预测方法存在可解释性差等问题。
发明内容
基于此,有必要针对上述技术问题,提供一种能够提高油耗预测方法的可解释性的船舶油耗预测方法、装置、计算机设备和存储介质。
为了实现上述目的,一方面,本发明实施例提供了一种船舶油耗预测方法,包括步骤:
获取船舶的各油耗特征参数;
采用随机森林算法对各油耗特征参数进行提取,得到预设数量的原始特征参数;
对各原始特征参数进行预处理,得到目标特征参数;
根据各目标特征参数,建立LASSO回归模型;
获取当前特征参数,并采用LASSO回归模型处理当前特征参数,得到油耗预测值。
在其中一个实施例中,采用随机森林算法对各油耗特征参数进行提取,得到预设数量的原始特征参数的步骤包括:
采用随机森林算法处理各油耗特征参数,得到特征的重要性值;
根据重要性值对各油耗特征参数进行提取,得到预设数量的原始特征参数。
在其中一个实施例中,根据重要性值对各特征参数进行提取,得到预设数量的原始特征参数的步骤包括:
提取重要性值最高的前K个特征参数;其中,K为自然数;
将重要性值最高的前K个特征参数作为预设数量的原始特征参数。
在其中一个实施例中,还包括步骤:
获取各船舶对应的LASSO回归模型的一致性;
在一致性小于预设值的情况下,则输出各LASSO回归模型;
获取当前特征参数,并采用LASSO回归模型处理当前特征参数,得到油耗预测值的步骤包括:
获取当前特征参数对应的LASSO回归模型,采用对应的LASSO回归模型处理当前特征参数,得到油耗预测值。
在其中一个实施例中,还包括步骤:
在一致性大于预设值的情况下,则根据一致性输出统一LASSO回归模型;
获取当前特征参数,并采用LASSO回归模型处理当前特征参数,得到油耗预测值的步骤包括:
获取当前特征参数,并采用统一LASSO回归模型处理当前特征参数,得到油耗预测值。
在其中一个实施例中,对各原始特征参数进行预处理,得到目标特征参数的步骤包括:
对各原始特征参数进行标准化处理,得到目标特征参数。
在其中一个实施例中,对各原始特征参数进行标准化处理,得到目标特征参数的步骤中,基于以下公式得到目标特征参数:
Figure BDA0002706650420000031
其中,Xnorm为目标特征参数;X为原始特征参数;μ为原始特征参数的均值;σ为原始特征参数的标准差。
一方面,本发明实施例还提供了一种船舶油耗预测装置,包括:
获取模块,用于获取船舶的各油耗特征参数;
特征提取模块,用于采用随机森林算法对各油耗特征参数进行提取,得到预设数量的原始特征参数;
预处理模块,用于对各原始特征参数进行预处理,得到目标特征参数;
模型构建模块,用于根据各目标特征参数,建立LASSO回归模型;
油耗预测模块,用于获取当前特征参数,并采用LASSO回归模型处理当前特征参数,得到油耗预测值。
一方面,本发明实施例还提供了一种计算机设备,包括存储器和处理器,存储器存储有计算机程序,处理器执行计算机程序时实现上述方法的步骤。
另一方面,本发明实施例还提供了一种计算机可读存储介质,其上存储有计算机程序,计算机程序被处理器执行时实现上述方法的步骤。
上述技术方案中的一个技术方案具有如下优点和有益效果:
本申请提供的船舶油耗预测方法,通过随机森林算法缩减建立模型时所需要的特征参数的数量,其可以处理特征较多的数据集,并且在使用随机森林算法进行特征提取前,无需对特征参数对应的数据进行标准化处理。而LASSO回归模型可以在拟合广义线性模型的同时进行变量筛选和复杂度调整。通过LASSO回归模型可以提高模型的可解释性以及进一步提高预测的准确度。
附图说明
通过阅读参照以下附图所作的对非限制性实施例所作的详细描述,本申请的其它特征、目的和优点将会变得更明显:
图1为一个实施例中船舶油耗预测方法的第一示意性流程图;
图2为一个实施例中得到预设数量的原始特征参数的步骤的流程示意图;
图3为一个实施例中得到预设数量的原始特征参数的步骤的流程示意图;
图4为一个实施例中船舶油耗预测方法的第二示意性流程图;
图5为一个实施例中船舶油耗预测装置的结构框图;
图6为一个实施例中计算机设备的内部结构图;
图7为1号船舶预测值与真实值对比图;
图8为2号船舶预测值与真实值对比图。
具体实施方式
为了使本申请的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,对本申请进行进一步详细说明。应当理解,此处描述的具体实施例仅仅用以解释本申请,并不用于限定本申请。
在一个实施例中,如图1所示,提供了一种船舶油耗预测方法,包括步骤:
S110,获取船舶的各油耗特征参数;
其中,油耗特征参数为影响油耗的特征参数,可以包括主机功率、船速、吃水深度、主机转速、风速、风向、风速、水流速度等一系列可以影响到油耗的特征参数。
具体的,可以通过本领域任意一种技术手段获取船舶的各油耗特征参数。在一个具体示例中,可以通过样本采集获取船舶的运行中的各油耗特征参数。在另一个具体示例中,也可以直接获取包括上述特征参数的数据集,从而得到船舶的各油耗特征参数。
S120,采用随机森林算法对各油耗特征参数进行提取,得到预设数量的原始特征参数;
其中,随机森林是机器学习中的一种常用方法,是用随机的方式建立一个森林,森林里面有很多的决策树组成,随机森林的每一棵决策树之间是没有关联的。其中决策树是一个树结构(可以是二叉树或非二叉树),每个非叶节点表示一个特征属性上的测试,每个分支代表这个特征属性在某个值域上的输出,而每个叶节点存放一个类别。使用决策树进行决策的过程就是从根节点开始,测试待分类项中相应的特征属性,并按照其值选择输出分支,直到到达叶子节点,将叶子节点存放的类别作为决策结果。获得森林之后,当有一个新的输入样本进入时,森林中的每一棵决策树将分别进行判断样本的所属类别(对于分类算法),被选择最多的类别即为最终的分类结果。另外,随机森林还可以进行无监督学习聚类和异常点检测。
具体的,采用随机森林算法可以对各油耗特征参数进行重要性的评估,在本实施例中,可以根据各油耗特征参数的重要性剔除部分掉部分特征参数,从而得到预设数量的原始特征参数。在一个具体示例中,预设数量为5个。需要说明的是,在现实情况下,油耗特征参数一般包括有成百上千个特征参数。而本申请中通过随机森林算法从众多的油耗特征参数进行特征选择预设数量的特征参数,降低了后续构建模型的复杂度。例如:在包括主机功率、船速、吃水深度、主机转速、风速、风向、风速、水流速度等一系列可以影响到油耗的特征参数中,通过随机森林算法选取到主机功率、船速、吃水深度、主机转速共5个特征参数。
S130,对各原始特征参数进行预处理,得到目标特征参数;
具体的,可以采用本领域任意手段对原始特征参数进行预处理,例如:进行标准化处理、多项式转换等步骤,得到目标特征参数。需要说明的是,各特征参数对应的数据中,均拥有不同的量纲和量纲单位,因此,在后续决策模型训练使用前,需要对各原始特征参数进行预处理,以获得可以应用于模型训练的数据。
S140,根据各目标特征参数,建立LASSO回归模型;
其中,LASSO算法(Least Absolute Shrinkage and Selection Operator)是一种同时进行特征选择和正则化的回归分析方法,可以增强统计模型的预测准确性和可解释性。LASSO算法揭示了很多估计量的重要性质,例如:LASSO系数估计值和软阈值之间的联系,当协变量共线时,LASSO系数估计值不一定唯一。LASSO算法的特点是在拟合广义线性模型的同时进行变量筛选和复杂度调整。例如,假设模型有100个系数,但其中只有10个系数是非零系数,这实际上是说“其他90个变量对预测目标值没有用处”。LASSO回自动进行了“参数选择”,未被选中的特征变量对整体的权重为0。基于上述特点,采用了LASSO算法进行燃油消耗模型的构建,也即建立LASSO回归模型。
S150,获取当前特征参数,并采用LASSO回归模型处理当前特征参数,得到油耗预测值。
具体的,在得到LASSO回归模型的基础上,获取到当前特征参数,即可得到油耗预测值。
上述船舶油耗预测方法,通过随机森林算法缩减建立模型时所需要的特征参数的数量,其可以处理特征较多的数据集,并且在使用随机森林算法进行特征提取前,无需对特征参数对应的数据进行标准化处理。而LASSO回归模型可以在拟合广义线性模型的同时进行变量筛选和复杂度调整。通过LASSO回归模型可以提高模型的可解释性以及进一步提高预测的准确度。
在一个实施例中,如图2所示,采用随机森林算法对各油耗特征参数进行提取,得到预设数量的原始特征参数的步骤包括:
S210,采用随机森林算法处理各油耗特征参数,得到特征的重要性值;
具体的,可以采用sklearn开源模块库集成算法模块ensemble中的随机森林算法相关函数处理各油耗特征参数,其输出的即为各特征的重要性值。
需要说明的是,在处理过程中需要输入3各超参数:(1)n_estimators:它表示建立的树的数量。一般而言,树的数量越多,性能越好,预测也越稳定,但这也会减慢计算速度。在本实施例中取值100;(2)n_jobs:超参数表示引擎允许使用处理器的数量。若值为1,则只能使用一个处理器。值为-1则表示没有限制。设置n_jobs可以加快模型计算速度,在本实施例中取值-1;(3)oob_score:它是一种随机森林交叉验证方法,即是否采用袋外样本来评估模型的好坏。默认是False。本文设置为True,因为袋外分数反应了一个模型拟合后的泛化能力。
S220,根据重要性值对各油耗特征参数进行提取,得到预设数量的原始特征参数。
具体的,各个油耗特征参数均对应有一个重要性值。在本实施例中,可以根据实际需要参考重要性值提取各油耗特征参数。例如:在选取重要性值最高的前N个特征参数,再在其中剔除掉不易获取的特征参数,得到预设数量的原始特征参数。
在其中一个实施例中,如图3所示,根据重要性值对各特征参数进行提取,得到预设数量的原始特征参数的步骤包括:
S310,提取重要性值最高的前K个特征参数;其中,K为自然数;
S320,将重要性值最高的前K个特征参数作为预设数量的原始特征参数。
具体的,预设数量的值也即为K。根据重要性值进行从小到大排序,选取重要性值最高的前K各特征参数作为用于构建LASSO回归模型的特征参数。
在其中一个实施例中,如图4所示,还包括步骤:
S410,获取各船舶对应的LASSO回归模型的一致性;
具体的,通过以上实施例的方法可以得到各个船舶对应的LASSO回归模型。进一步的,可以采用本领域任意一种技术手段获取各船舶对应的LASSO回归模型的一致性。
S420,在一致性小于预设值的情况下,则输出各LASSO回归模型;
具体的,在一致性小于预设值的情况下,则代表着各船舶对应的LASSO回归模型不能统一使用,则针对于各船舶的油耗预测,需要采用与船舶对应的LASSO回归模型进行油耗预测。
获取当前特征参数,并采用LASSO回归模型处理当前特征参数,得到油耗预测值的步骤包括:
S430,获取当前特征参数对应的LASSO回归模型,采用对应的LASSO回归模型处理当前特征参数,得到油耗预测值。
在其中一个实施例中,还包括步骤:
在一致性大于预设值的情况下,则根据一致性输出统一LASSO回归模型;
具体的,在一致性大于预设值的情况下,则代表各船舶对应的LASSO回归模型可以由一个多船统一模型表示。在一个具体示例中,可以根据一致性在各个LASSO回归模型中选择其中一个LASSO回归模型作为统一LASSO回归模型。在另一个具体示例中,可以根据将各变量的系数的平均值作为新的变量系数,最后由新的变量系数组成统一LASSO回归模型。
获取当前特征参数,并采用LASSO回归模型处理当前特征参数,得到油耗预测值的步骤包括:
获取当前特征参数,并采用统一LASSO回归模型处理当前特征参数,得到油耗预测值。
具体的,在获得统一LASSO回归模型后,即可采用统一LASSO回归模型处于当前特征参数,即可得到油耗预测值。举例而言,在提取后的特征参数为主机功率、船速、吃水深度、主机转速时,获取当前主机功率、当前船速、当前吃水深度和当前主机转速,并采用统一LASSO回归模型处理当前主机功率、当前船速、当前吃水深度和当前主机转速,即可得到油耗预测值。
在其中一个实施例中,对各原始特征参数进行预处理,得到目标特征参数的步骤包括:
对各原始特征参数进行标准化处理,得到目标特征参数。
具体的,在船舶的特征参数中,各变量拥有不同的量纲和量纲单位,因此在后续决策模型(也即LASSO回归模型)训练使用前,同样需要对原始数据进行标准化处理。
在其中一个实施例中,对各原始特征参数进行标准化处理,得到目标特征参数的步骤中,基于以下公式得到目标特征参数:
Figure BDA0002706650420000101
其中,Xnorm为目标特征参数;X为原始特征参数;μ为原始特征参数的均值;σ为原始特征参数的标准差。
应该理解的是,虽然图1-4的流程图中的各个步骤按照箭头的指示依次显示,但是这些步骤并不是必然按照箭头指示的顺序依次执行。除非本文中有明确的说明,这些步骤的执行并没有严格的顺序限制,这些步骤可以以其它的顺序执行。而且,图1-4中的至少一部分步骤可以包括多个子步骤或者多个阶段,这些子步骤或者阶段并不必然是在同一时刻执行完成,而是可以在不同的时刻执行,这些子步骤或者阶段的执行顺序也不必然是依次进行,而是可以与其它步骤或者其它步骤的子步骤或者阶段的至少一部分轮流或者交替地执行。
在一个实施例中,如图5所示,提供了一种船舶油耗预测装置,包括:
获取模块,用于获取船舶的各油耗特征参数;
特征提取模块,用于采用随机森林算法对各油耗特征参数进行提取,得到预设数量的原始特征参数;
预处理模块,用于对各原始特征参数进行预处理,得到目标特征参数;
模型构建模块,用于根据各目标特征参数,建立LASSO回归模型;
油耗预测模块,用于获取当前特征参数,并采用LASSO回归模型处理当前特征参数,得到油耗预测值。
在其中一个实施例,特征提取模块包括:
重要性值获取模块,用于采用随机森林算法处理各油耗特征参数,得到特征的重要性值;
原始特征参数获取模块,用于根据重要性值对各油耗特征参数进行提取,得到预设数量的原始特征参数。
在其中一个实施例中,原始特征参数获取模块包括:
提取模块,用于提取重要性值最高的前K个特征参数;其中,K为自然数;
确认模块,用于将重要性值最高的前K个特征参数作为预设数量的原始特征参数。
在其中一个实施例中,油耗预测装置还包括:
一致性获取模块,用于获取各船舶对应的LASSO回归模型的一致性;
第一比对模块,用于在一致性小于预设值的情况下,则输出各LASSO回归模型;
油耗预测模块还用于获取当前特征参数对应的LASSO回归模型,采用对应的LASSO回归模型处理当前特征参数,得到油耗预测值。
在其中一个实施例中,油耗预测装置还包括:
第二比对模块,用于在一致性大于预设值的情况下,则根据一致性输出统一LASSO回归模型;
油耗预测模块还用于获取当前特征参数,并采用统一LASSO回归模型处理当前特征参数,得到油耗预测值。
关于油耗预测装置的具体限定可以参见上文中对于油耗预测方法的限定,在此不再赘述。上述油耗预测装置中的各个模块可全部或部分通过软件、硬件及其组合来实现。上述各模块可以硬件形式内嵌于或独立于计算机设备中的处理器中,也可以以软件形式存储于计算机设备中的存储器中,以便于处理器调用执行以上各个模块对应的操作。
在一个实施例中,提供了一种计算机设备,该计算机设备可以是终端,其内部结构图可以如图6所示。该计算机设备包括通过***总线连接的处理器、存储器、网络接口、显示屏和输入装置。其中,该计算机设备的处理器用于提供计算和控制能力。该计算机设备的存储器包括非易失性存储介质、内存储器。该非易失性存储介质存储有操作***和计算机程序。该内存储器为非易失性存储介质中的操作***和计算机程序的运行提供环境。该计算机设备的网络接口用于与外部的终端通过网络连接通信。该计算机程序被处理器执行时以实现一种油耗预测方法。该计算机设备的显示屏可以是液晶显示屏或者电子墨水显示屏,该计算机设备的输入装置可以是显示屏上覆盖的触摸层,也可以是计算机设备外壳上设置的按键、轨迹球或触控板,还可以是外接的键盘、触控板或鼠标等。
本领域技术人员可以理解,图6中示出的结构,仅仅是与本申请方案相关的部分结构的框图,并不构成对本申请方案所应用于其上的计算机设备的限定,具体的计算机设备可以包括比图中所示更多或更少的部件,或者组合某些部件,或者具有不同的部件布置。
为了进一步阐述本申请的技术方案,下面特结合一具体示例验证本申请提供的船舶油耗预测方法,以及本申请提供的随机森林算法的处理过程:
具体的,根据两艘船舶不同数据进行特征选择,步骤如下:
(1)用N来表示训练用例(样本)的个数,M表示特征数目。
(2)输入特征数目m,用于确定决策树上一个节点的决策结果;其中m应远小于M。
(3)从N个训练用例(样本)中以有放回抽样的方式,取样N次,形成一个训练集,并用未抽到的用例(样本)作预测,评估其误差。
(4)对于每一个节点,随机选择m个特征,决策树上每个节点的决定都是基于这些特征确定的。根据这m个特征,计算其最佳的***方式。
(5)每棵树都会完整成长而不会剪枝,这有可能在建完一棵正常树状分类器后会被采用。
本文采用sklearn开源模块库[8]集成算法模块ensemble中[9]的随机森林算法相关的函数进行实现,此过程共需要输入3个超参数:(1)n_estimators:它表示建立的树的数量。一般来说,树的数量越多,性能越好,预测也越稳定,但这也会减慢计算速度。基于经验,在实践中选择数百棵树是比较好的选择,故本次分析过程取值100;(2)n_jobs:超参数表示引擎允许使用处理器的数量。若值为1,则只能使用一个处理器。值为-1则表示没有限制。设置n_jobs可以加快模型计算速度,本次分析过程设置为-1;(3)oob_score:它是一种随机森林交叉验证方法,即是否采用袋外样本来评估模型的好坏。默认是False。本文设置为True,因为袋外分数反应了一个模型拟合后的泛化能力。
进一步的,对本申请提供的船舶油耗预测方法的实船验证如下所示:
1.1测试数据集信息
利用随机森林进行特征提取,最终选择出了与燃油消耗相关性排名较高的5个特征,表1.1为两船舶特征提取结果。
表3.1特征提取结果
Figure BDA0002706650420000131
Figure BDA0002706650420000141
根据上述特征选择结果,我们提取到了如表1.2所示的测试数据集。
表1.2测试数据
Figure BDA0002706650420000142
测试集数据同样需要进行数据标准化操作,需要注意的是在针对测试集进行标准化时应该与训练数据集的转化标准保持一致,如1号船舶测试集标准化过程应该按照1号船舶训练集的各变量均值及方差进行转化,1号船舶测试集速度变量标准化如式(2)所示:
Figure BDA0002706650420000143
μtrain是训练集中变量船速S的均值,σtrain是训练集中变量船速S的方差。
1.2、模型准确性衡量
经过LASSO回归模型训练,得到的1号船舶模型如公式(3)所示,2号船舶如公式(4)所示。
Eff1=-0.164S+0.067P-0.022D+0.022S2-0.009P×S+0.008D×S+0.004W+
0.005P2 (3)
Eff2=0.105P-0.127S+0.051R+0.026D+0.017S2+0.020R×D-0.018P×D-0.020P×S (4)
为了验证上述训练模型的准确性,我们一方面采用了R2来衡量模型预测值的准确性。决定系数(coefficient of determination)是反映模型拟合优度的重要的统计量,为回归平方和与总平方和之比。R2取值在0到1之间,且无单位,其数值大小反映了回归贡献的相对程度,即在因变量Y的总变异中回归关系所能解释的百分比。R2是最常用于评价回归模型优劣程度的指标,R2越大(接近于1),表示所拟合的回归方程效果越好。
另一方面通过计算MSE(Mean Square Error)来衡量线性模型的准确性[11]。该统计参数是预测数据和原始数据对应点误差的平方和的均值,计算公式如式(5)所示:
Figure BDA0002706650420000144
其中yi是真实数据,
Figure BDA0002706650420000145
是拟合的数据,其中n为样本的个数。
表1.3为模型测试结果。
表1.3模型测试结果
船舶模型 R^2值 MSE值
1号船舶空载模型 0.9368 65.9665
2号船舶空载模型 0.9127 73.6313
如图7和8所示为测试集目标参数真实值与模型预测值可视化对比,由于测试集数据较多,本次可视化过程只随机选取测试集中200个目标参数,及其对应的模型预测值进行展示,以方便观察。
图7与图8分别代表了两船舶模型测试结果,蓝色虚线代表模型预测值,绿色实线代表目标参数真实值。观察图7和8所示的预测值和真实值对比结果和表1.3所示的R2和MSE值,可以看出模型能够较好地通过筛选到的五个特征拟合海里油耗。
在一个实施例中,提供了一种计算机设备,包括存储器和处理器,存储器中存储有计算机程序,该处理器执行计算机程序时实现以下步骤:
获取船舶的各油耗特征参数;
采用随机森林算法对各油耗特征参数进行提取,得到预设数量的原始特征参数;
对各原始特征参数进行预处理,得到目标特征参数;
根据各目标特征参数,建立LASSO回归模型;
获取当前特征参数,并采用LASSO回归模型处理当前特征参数,得到油耗预测值。
在一个实施例中,处理器执行采用随机森林算法对各油耗特征参数进行提取,得到预设数量的原始特征参数的步骤时还实现以下步骤:
采用随机森林算法处理各油耗特征参数,得到特征的重要性值;
根据重要性值对各油耗特征参数进行提取,得到预设数量的原始特征参数。
在一个实施例中,处理器执行根据重要性值对各特征参数进行提取,得到预设数量的原始特征参数的步骤时还实现以下步骤:
提取重要性值最高的前K个特征参数;其中,K为自然数;
将重要性值最高的前K个特征参数作为预设数量的原始特征参数。
在一个实施例中,处理器执行计算机程序时还实现以下步骤:
获取各船舶对应的LASSO回归模型的一致性;
在一致性小于预设值的情况下,则输出各LASSO回归模型;
获取当前特征参数对应的LASSO回归模型,采用对应的LASSO回归模型处理当前特征参数,得到油耗预测值。
在一个实施例中,处理器执行计算机程序时还实现以下步骤:
在一致性大于预设值的情况下,则根据一致性输出统一LASSO回归模型;
获取当前特征参数,并采用统一LASSO回归模型处理当前特征参数,得到油耗预测值。
在一个实施例中,处理器执行对各原始特征参数进行预处理,得到目标特征参数的步骤时还实现以下步骤:
对各原始特征参数进行标准化处理,得到目标特征参数。
在一个实施例中,处理器执行对各原始特征参数进行标准化处理,得到目标特征参数的步骤中,基于以下公式得到目标特征参数:
Figure BDA0002706650420000161
其中,Xnorm为目标特征参数;X为原始特征参数;μ为原始特征参数的均值;σ为原始特征参数的标准差。
在一个实施例中,提供了一种计算机可读存储介质,其上存储有计算机程序,计算机程序被处理器执行时实现以下步骤:
获取船舶的各油耗特征参数;
采用随机森林算法对各油耗特征参数进行提取,得到预设数量的原始特征参数;
对各原始特征参数进行预处理,得到目标特征参数;
根据各目标特征参数,建立LASSO回归模型;
获取当前特征参数,并采用LASSO回归模型处理当前特征参数,得到油耗预测值。
在一个实施例中,采用随机森林算法对各油耗特征参数进行提取,得到预设数量的原始特征参数的步骤被处理器执行时还实现以下步骤:
采用随机森林算法处理各油耗特征参数,得到特征的重要性值;
根据重要性值对各油耗特征参数进行提取,得到预设数量的原始特征参数。
在一个实施例中,根据重要性值对各特征参数进行提取,得到预设数量的原始特征参数的步骤被处理器执行时还实现以下步骤:
提取重要性值最高的前K个特征参数;其中,K为自然数;
将重要性值最高的前K个特征参数作为预设数量的原始特征参数。
在一个实施例中,计算机程序被处理器执行时还实现以下步骤:
获取各船舶对应的LASSO回归模型的一致性;
在一致性小于预设值的情况下,则输出各LASSO回归模型;
获取当前特征参数对应的LASSO回归模型,采用对应的LASSO回归模型处理当前特征参数,得到油耗预测值。
在一个实施例中,计算机程序被处理器执行时还实现以下步骤:
在一致性大于预设值的情况下,则根据一致性输出统一LASSO回归模型;
获取当前特征参数,并采用统一LASSO回归模型处理当前特征参数,得到油耗预测值。
在一个实施例中,对各原始特征参数进行预处理,得到目标特征参数的步骤被处理器执行时还实现以下步骤:
对各原始特征参数进行标准化处理,得到目标特征参数。
在一个实施例中,对各原始特征参数进行标准化处理,得到目标特征参数,被处理器执行时还实现以下步骤:
Figure BDA0002706650420000181
其中,Xnorm为目标特征参数;X为原始特征参数;μ为原始特征参数的均值;σ为原始特征参数的标准差。
本领域普通技术人员可以理解实现上述实施例方法中的全部或部分流程,是可以通过计算机程序来指令相关的硬件来完成,所述的计算机程序可存储于一非易失性计算机可读取存储介质中,该计算机程序在执行时,可包括如上述各方法的实施例的流程。其中,本申请所提供的各实施例中所使用的对存储器、存储、数据库或其它介质的任何引用,均可包括非易失性和/或易失性存储器。非易失性存储器可包括只读存储器(ROM)、可编程ROM(PROM)、电可编程ROM(EPROM)、电可擦除可编程ROM(EEPROM)或闪存。易失性存储器可包括随机存取存储器(RAM)或者外部高速缓冲存储器。作为说明而非局限,RAM以多种形式可得,诸如静态RAM(SRAM)、动态RAM(DRAM)、同步DRAM(SDRAM)、双数据率SDRAM(DDRSDRAM)、增强型SDRAM(ESDRAM)、同步链路(Synchlink)DRAM(SLDRAM)、存储器总线式动态随机存储器(Rambus DRAM,简称RDRAM)、以及接口动态随机存储器(DRDRAM)等。
在本说明书的描述中,参考术语“有些实施例”、“其他实施例”、“理想实施例”等的描述意指结合该实施例或示例描述的具体特征、结构、材料或者特征包含于本发明的至少一个实施例或示例中。在本说明书中,对上述术语的示意性描述不一定指的是相同的实施例或示例。
以上所述实施例的各技术特征可以进行任意的组合,为使描述简洁,未对上述实施例中的各个技术特征所有可能的组合都进行描述,然而,只要这些技术特征的组合不存在矛盾,都应当认为是本说明书记载的范围。
以上所述实施例仅表达了本发明的几种实施方式,其描述较为具体和详细,但并不能因此而理解为对发明专利范围的限制。应当指出的是,对于本领域的普通技术人员来说,在不脱离本发明构思的前提下,还可以做出若干变形和改进,这些都属于本发明的保护范围。因此,本发明专利的保护范围应以所附权利要求为准。

Claims (10)

1.一种船舶油耗预测方法,其特征在于,包括步骤:
获取船舶的各油耗特征参数;
采用随机森林算法对各所述油耗特征参数进行提取,得到预设数量的原始特征参数;
对各所述原始特征参数进行预处理,得到目标特征参数;
根据各所述目标特征参数,建立LASSO回归模型;
获取当前特征参数,并采用所述LASSO回归模型处理所述当前特征参数,得到油耗预测值。
2.根据权利要求1所述的船舶油耗预测方法,其特征在于,采用随机森林算法对各所述油耗特征参数进行提取,得到预设数量的原始特征参数的步骤包括:
采用随机森林算法处理各所述油耗特征参数,得到特征的重要性值;
根据所述重要性值对各所述油耗特征参数进行提取,得到预设数量的所述原始特征参数。
3.根据权利要求2所述的船舶油耗预测方法,其特征在于,根据所述重要性值对各特征参数进行提取,得到预设数量的原始特征参数的步骤包括:
提取重要性值最高的前K个特征参数;其中,K为自然数;
将所述重要性值最高的前K个特征参数作为预设数量的原始特征参数。
4.根据权利要求1所述的船舶油耗预测方法,其特征在于,还包括步骤:
获取各船舶对应的LASSO回归模型的一致性;
在所述一致性小于预设值的情况下,则输出各LASSO回归模型;
获取当前特征参数,并采用所述LASSO回归模型处理所述当前特征参数,得到油耗预测值的步骤包括:
获取所述当前特征参数对应的LASSO回归模型,采用所述对应的LASSO回归模型处理所述当前特征参数,得到油耗预测值。
5.根据权利要求4所述的船舶油耗预测方法,其特征在于,还包括步骤:
在所述一致性大于预设值的情况下,则根据所述一致性输出统一LASSO回归模型;
获取当前特征参数,并采用所述LASSO回归模型处理所述当前特征参数,得到油耗预测值的步骤包括:
获取当前特征参数,并采用所述统一LASSO回归模型处理所述当前特征参数,得到油耗预测值。
6.根据权利要求1所述的船舶油耗预测方法,其特征在于,对各所述原始特征参数进行预处理,得到目标特征参数的步骤包括:
对各所述原始特征参数进行标准化处理,得到所述目标特征参数。
7.根据权利要求1所述的船舶油耗预测方法,其特征在于,对各所述原始特征参数进行标准化处理,得到所述目标特征参数的步骤中,基于以下公式得到所述目标特征参数:
Figure FDA0002706650410000021
其中,Xnorm为目标特征参数;X为原始特征参数;μ为原始特征参数的均值;σ为原始特征参数的标准差。
8.一种船舶油耗预测装置,其特征在于,包括:
获取模块,用于获取船舶的各油耗特征参数;
特征提取模块,用于采用随机森林算法对各所述油耗特征参数进行提取,得到预设数量的原始特征参数;
预处理模块,用于对各所述原始特征参数进行预处理,得到目标特征参数;
模型构建模块,用于根据各所述目标特征参数,建立LASSO回归模型;
油耗预测模块,用于获取当前特征参数,并采用所述LASSO回归模型处理所述当前特征参数,得到油耗预测值。
9.一种计算机设备,包括存储器和处理器,所述存储器存储有计算机程序,其特征在于,所述处理器执行所述计算机程序时实现权利要求1至7中任一项所述方法的步骤。
10.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现权利要求1至7中任一项所述的方法的步骤。
CN202011041015.4A 2020-09-28 2020-09-28 船舶油耗预测方法、装置、计算机设备和存储介质 Pending CN112149909A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202011041015.4A CN112149909A (zh) 2020-09-28 2020-09-28 船舶油耗预测方法、装置、计算机设备和存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202011041015.4A CN112149909A (zh) 2020-09-28 2020-09-28 船舶油耗预测方法、装置、计算机设备和存储介质

Publications (1)

Publication Number Publication Date
CN112149909A true CN112149909A (zh) 2020-12-29

Family

ID=73894930

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202011041015.4A Pending CN112149909A (zh) 2020-09-28 2020-09-28 船舶油耗预测方法、装置、计算机设备和存储介质

Country Status (1)

Country Link
CN (1) CN112149909A (zh)

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112836893A (zh) * 2021-02-26 2021-05-25 上海海事大学 一种基于海况条件和船舶航行状况预测恶劣海况下船舶油耗的方法
CN113673815A (zh) * 2021-07-08 2021-11-19 三一智矿科技有限公司 基于车辆数据处理的矿车调度方法及装置
CN113682443A (zh) * 2021-09-17 2021-11-23 中远海运科技(北京)有限公司 Vlcc船舶在指令航速下的理论日燃油消耗确定方法
CN115456451A (zh) * 2022-09-28 2022-12-09 中远海运科技股份有限公司 一种基于ais的船舶油耗估算方法及***
TWI792418B (zh) * 2021-07-14 2023-02-11 國立成功大學 預測船舶油耗的方法
WO2024121137A1 (en) * 2022-12-06 2024-06-13 Cetasol Ab A virtual fuel consumption sensor system

Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2004145727A (ja) * 2002-10-25 2004-05-20 Mazda Motor Corp 自動車エネルギ消費予測システム、自動車エネルギ消費予測サーバ、自動車エネルギ消費予測方法及び自動車エネルギ消費予測プログラム
US8738421B1 (en) * 2013-01-09 2014-05-27 Vehbi Koc Foundation Koc University Driver moderator method for retail sales prediction
CN106779137A (zh) * 2016-11-14 2017-05-31 上海海事大学 一种根据海况与操纵条件预测船舶油耗的方法
CN107944648A (zh) * 2018-01-08 2018-04-20 中国船舶工业***工程研究院 一种大型船舶航速油耗率精准预测方法
CN109615232A (zh) * 2018-12-12 2019-04-12 税友软件集团股份有限公司 一种信用积分预测的方法、***及相关装置
CN110298611A (zh) * 2019-05-16 2019-10-01 重庆瑞尔科技发展有限公司 基于随机森林与深度学习的船舶货运效率调控方法及***
CN110775065A (zh) * 2019-11-11 2020-02-11 吉林大学 一种基于工况识别的混合动力汽车电池寿命预测方法
CN110909907A (zh) * 2018-09-18 2020-03-24 西安四维图新信息技术有限公司 卡车的油耗预测方法、装置及存储介质

Patent Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2004145727A (ja) * 2002-10-25 2004-05-20 Mazda Motor Corp 自動車エネルギ消費予測システム、自動車エネルギ消費予測サーバ、自動車エネルギ消費予測方法及び自動車エネルギ消費予測プログラム
US8738421B1 (en) * 2013-01-09 2014-05-27 Vehbi Koc Foundation Koc University Driver moderator method for retail sales prediction
CN106779137A (zh) * 2016-11-14 2017-05-31 上海海事大学 一种根据海况与操纵条件预测船舶油耗的方法
CN107944648A (zh) * 2018-01-08 2018-04-20 中国船舶工业***工程研究院 一种大型船舶航速油耗率精准预测方法
CN110909907A (zh) * 2018-09-18 2020-03-24 西安四维图新信息技术有限公司 卡车的油耗预测方法、装置及存储介质
CN109615232A (zh) * 2018-12-12 2019-04-12 税友软件集团股份有限公司 一种信用积分预测的方法、***及相关装置
CN110298611A (zh) * 2019-05-16 2019-10-01 重庆瑞尔科技发展有限公司 基于随机森林与深度学习的船舶货运效率调控方法及***
CN110775065A (zh) * 2019-11-11 2020-02-11 吉林大学 一种基于工况识别的混合动力汽车电池寿命预测方法

Cited By (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112836893A (zh) * 2021-02-26 2021-05-25 上海海事大学 一种基于海况条件和船舶航行状况预测恶劣海况下船舶油耗的方法
CN112836893B (zh) * 2021-02-26 2024-05-14 上海海事大学 一种基于海况条件和船舶航行状况预测恶劣海况下船舶油耗的方法
CN113673815A (zh) * 2021-07-08 2021-11-19 三一智矿科技有限公司 基于车辆数据处理的矿车调度方法及装置
TWI792418B (zh) * 2021-07-14 2023-02-11 國立成功大學 預測船舶油耗的方法
CN113682443A (zh) * 2021-09-17 2021-11-23 中远海运科技(北京)有限公司 Vlcc船舶在指令航速下的理论日燃油消耗确定方法
CN113682443B (zh) * 2021-09-17 2022-05-31 中远海运科技(北京)有限公司 Vlcc船舶在指令航速下的理论日燃油消耗确定方法
CN115456451A (zh) * 2022-09-28 2022-12-09 中远海运科技股份有限公司 一种基于ais的船舶油耗估算方法及***
CN115456451B (zh) * 2022-09-28 2023-10-31 中远海运科技股份有限公司 一种基于ais的船舶油耗估算方法及***
WO2024121137A1 (en) * 2022-12-06 2024-06-13 Cetasol Ab A virtual fuel consumption sensor system

Similar Documents

Publication Publication Date Title
CN112149909A (zh) 船舶油耗预测方法、装置、计算机设备和存储介质
CN111210024B (zh) 模型训练方法、装置、计算机设备和存储介质
CN109408389B (zh) 一种基于深度学习的代码缺陷检测方法及装置
CN105677791B (zh) 用于分析风力发电机组的运行数据的方法和***
CN111240975B (zh) 人工智能***风险检测方法、装置、计算机设备与介质
CN112527604A (zh) 一种基于深度学习的运维检测方法、***、电子设备及介质
CN111401472B (zh) 基于深度卷积神经网络的红外目标分类方法和装置
CN114048468A (zh) 入侵检测的方法、入侵检测模型训练的方法、装置及介质
CN111338972A (zh) 基于机器学习的软件缺陷与复杂度关联关系分析方法
CN115656673A (zh) 变压器数据的处理及装置、设备存储介质
CN115936262B (zh) 基于大数据的环境干扰的产量预测方法、***和介质
CN115456107A (zh) 一种时间序列异常检测***及方法
CN109670549A (zh) 火电机组的数据筛选方法、装置以及计算机设备
CN117235565A (zh) 一种变压器故障诊断模型构建方法和装置
CN115269247A (zh) 基于深度森林的闪存坏块预测方法、***、介质及设备
CN113110961B (zh) 设备异常检测方法、装置、计算机设备及可读存储介质
CN114169460A (zh) 样本筛选方法、装置、计算机设备和存储介质
CN113935413A (zh) 一种基于卷积神经网的配网录波文件波形识别方法
CN113836806A (zh) 一种phm模型构建方法、***、存储介质及电子设备
CN111753907B (zh) 一种电量数据的处理方法、装置、设备和存储介质
CN113822336A (zh) 一种云硬盘故障预测方法、装置、***及可读存储介质
US20230161653A1 (en) Method of managing system health
CN115270861A (zh) 一种产品成分数据监测方法、装置、电子设备及存储介质
CN110865939B (zh) 应用程序质量监测方法、装置、计算机设备和存储介质
CN113722230A (zh) 针对模糊测试工具漏洞挖掘能力的集成化评估方法及装置

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination