CN109816236A - 一种生猪养殖的规划方法及规划*** - Google Patents

一种生猪养殖的规划方法及规划*** Download PDF

Info

Publication number
CN109816236A
CN109816236A CN201910048642.1A CN201910048642A CN109816236A CN 109816236 A CN109816236 A CN 109816236A CN 201910048642 A CN201910048642 A CN 201910048642A CN 109816236 A CN109816236 A CN 109816236A
Authority
CN
China
Prior art keywords
data
time series
factor
probability
price
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201910048642.1A
Other languages
English (en)
Inventor
李建政
许世卫
庄家煜
李干琼
张永恩
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Agricultural Information Institute of CAAS
Original Assignee
Agricultural Information Institute of CAAS
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Agricultural Information Institute of CAAS filed Critical Agricultural Information Institute of CAAS
Priority to CN201910048642.1A priority Critical patent/CN109816236A/zh
Publication of CN109816236A publication Critical patent/CN109816236A/zh
Pending legal-status Critical Current

Links

Landscapes

  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本发明公开一种生猪养殖的规划方法及规划***。本发明提供的生猪养殖的规划方法及规划***,通过聚类分析对猪肉价格波动区间及各关联输入因素的波动区间进行离散化分类处理,再利用离散化分类数据来训练好贝叶斯网络模型;之后,将时间序列模型与极限学习机相结合,进一步提高贝叶斯网络模型中输入因素的预测精度,最终基于网络内部变量之间直观的因果依赖关系,预测猪肉价格波动分别属于各猪肉价格波动区间的概率分布。生猪养殖企业或者养殖户可以根据未来价格波动概率分布规划生猪养殖中仔猪补栏数量和时间、人力和物资投入以及生猪出栏数量和时间,降低生猪养殖过程中人力和物资的浪费,保证生猪养殖效益。

Description

一种生猪养殖的规划方法及规划***
技术领域
本发明涉及数据分析技术领域,特别是涉及一种生猪养殖的规划方法及规划***。
背景技术
猪肉在我国肉类生产和消费中占主导地位。猪肉价格的跌涨,尤其是猪肉价格的“过山车”对社会经济的平稳发展有重大的影响,不仅对城乡居民的猪肉消费量存在很大影响,而且会影响生猪养殖者的积极性,给养殖企业和养猪户带来巨大影响。
传统条件下,养殖企业和养猪户将猪粮比价(生猪出场价格/玉米批发价格)作为猪肉市场价格变化的预警指标,对生猪养殖进行调整。但是猪肉价格变化受到很多因素的影响,如宏观因素(居民消费价格指数、人均可支配收入等)和微观因素(竞争品价格、豆粕价格、仔猪价格、屠宰量等),因此仅依赖猪粮比价来规划未来生猪养殖是不合理的。
发明内容
本发明的目的是提供一种生猪养殖的规划方法及规划***,将聚类分析、时间序列模型、极限学习机与贝叶斯网络相结合,基于变量之间直观的因果依赖关系,预测猪肉价格波动分别属于各猪肉价格波动区间的概率分布,根据概率分布规划生猪养殖中仔猪补栏数量和时间、人力和物资投入以及生猪出栏数量和时间,降低生猪养殖过程中人力和物资的浪费,保证生猪养殖效益。
为实现上述目的,本发明提供了如下方案:
一种生猪养殖的规划方法,所述规划方法包括:
获取历史数据,所述历史数据包括猪肉价格数据及关联因素数据,所述关联因素数据为猪肉价格的关联因素的历史数据;
采用时差相关性分析方法对所述猪肉价格数据及所述关联因素数据进行相关性分析,筛选出与猪肉价格的相关系数大于相关性阈值的关联因素数据作为关联输入数据;
对每个关联因素的相邻预测周期的所述关联输入数据依次进行差值处理,获得关联因素差值数据,并对相邻预测周期的所述猪肉价格数据进行差值处理,获得猪肉价格差值数据;
获取猪肉价格波动区间的数量K及各关联输入因素的波动区间的数量,所述关联输入因素为关联输入数据对应的关联因素;
采用K-means聚类分析方法对所述猪肉价格差值数据及各关联因素差值数据进行聚类划分,获得K个猪肉价格波动区间及第i个关联输入因素的Mi个波动区间,i表示关联输入因素的序号,1≤i≤I,I表示关联输入因素的数量;
利用所述K-means聚类划分后的猪肉价格差值数据和关联输入因素差值数据训练贝叶斯网络,获得贝叶斯网络模型;
获取时间序列训练数据及概率确定数据,所述时间序列训练数据和所述概率确定数据均为所述贝叶斯网络模型的输入变量对应的关联因素的历史数据;
根据所述时间序列训练数据建立时间序列模型;
将所述时间序列训练数据输入所述时间序列模型,获得时间序列模拟数据;
根据所述时间序列训练数据及所述时间序列模拟数据确定残差序列;
利用所述残差序列对极限学习机进行训练,获得极限学习机模型;
根据所述时间序列模型和所述极限学习机模型,确定概率确定数据的最终模拟序列;
根据所述概率确定数据及所述最终模拟序列确定未来关联输入因素预测值的发生概率;
根据各个预测值的发生概率、所述时间序列模型、所述极限学习机模型和所述贝叶斯网络模型预测猪肉价格波动分别属于各猪肉价格波动区间的概率分布;
根据所述概率分布规划生猪养殖中仔猪补栏数量和时间、人力和物资投入以及生猪出栏数量和时间。
可选的,所述采用时差相关性分析方法对所述猪肉价格数据及所述关联因素数据进行相关性分析之前,还包括:
对所述猪肉价格数据进行归一化处理,获得归一化处理后的猪肉价格数据;
对所述关联因素数据进行归一化处理,获得归一化处理后的关联因素数据。
可选的,所述对所述猪肉价格数据进行归一化处理之前,还包括:
通过线性插值法或曲线拟合法求出所述历史数据中的缺失数据,并将所述缺失数据补充到历史数据中,形成完整的历史数据;
根据预测周期对完整的历史数据进行统一化处理,获得统一化处理后的历史数据。
可选的,所述根据所述时间序列训练数据建立时间序列模型,具体包括:
对所述时间序列训练数据进行单位根检验,判断所述时间序列训练数据是否存在单位根,获得第一判断结果;
当所述第一判断结果表示所述时间序列训练数据拒绝存在单位根原假设时,计算所述时间序列训练数据的自相关函数和偏相关函数;
判断所述自相关函数和偏相关函数是否具有拖尾性,获得第二判断结果;
当所述第二判断结果表示所述自相关函数和所述偏相关函数均具有拖尾性时,则根据所述时间序列训练数据建立时间序列模型;
当所述第一判断结果表示所述时间序列训练数据存在单位根时,对所述时间序列训练数据进行差分处理,获得拒绝存在单位根原假设的时间序列训练数据,并返回所述“计算所述时间序列训练数据的自相关函数和偏相关函数”。
可选的,所述根据所述概率确定数据及所述最终模拟序列确定各个关联输入因素的概率,具体包括:
根据与所述概率确定数据对应的各个关联输入因素的波动区间对所述概率确定数据进行归类,获得概率计算分类结果;
根据与所述最终模拟序列对应的各个关联输入因素的波动区间对所述最终模拟序列进行归类,获得模拟序列分类结果;
根据所述概率计算分类结果及所述模拟序列分类结果确定各个关联输入因素的概率。
可选的,所述关联因素包括:鸡肉价格、牛肉价格、羊肉价格、人均可支配收入、居民消费价格指数、人民币/美元汇率、玉米价格、豆粕价格、仔猪价格、生猪存栏量、定点屠宰企业屠宰量、疫情突发事件数量中至少一者。
一种生猪养殖的规划***,所述规划***包括:
历史数据获取模块,用于获取历史数据,所述历史数据包括猪肉价格数据及关联因素数据,所述关联因素数据为猪肉价格的关联因素的历史数据;
时差相关性分析模块,用于采用时差相关性分析方法对所述猪肉价格数据及所述关联因素数据进行相关性分析,筛选出与猪肉价格的相关系数大于相关性阈值的关联因素数据作为关联输入数据;
差值处理模块,用于对每个关联因素的相邻预测周期的所述关联输入数据依次进行差值处理,获得关联因素差值数据,并对相邻预测周期的所述猪肉价格数据进行差值处理,获得猪肉价格差值数据;
波动区间数量获取模块,用于获取猪肉价格波动区间的数量K及各关联输入因素的波动区间的数量,所述关联输入因素为关联输入数据对应的关联因素;
聚类模块,用于采用K-means聚类分析方法对所述猪肉价格差值数据及各关联因素差值数据进行聚类划分,获得K个猪肉价格波动区间及第i个关联输入因素的Mi个波动区间,i表示关联输入因素的序号,1≤i≤I,I表示关联输入因素的数量;
贝叶斯网络模型确定模块,用于利用所述K-means聚类划分后的猪肉价格差值数据和关联输入因素差值数据训练贝叶斯网络,获得贝叶斯网络模型;
训练数据及概率确定数据获取模块,用于获取时间序列训练数据及概率确定数据,所述时间序列训练数据和所述概率确定数据均为所述贝叶斯网络模型的输入变量对应的关联因素的历史数据;
时间序列模型确定模块,用于根据所述时间序列训练数据建立时间序列模型;
时间序列预测模块,用于将所述时间序列训练数据输入所述时间序列模型,获得时间序列模拟数据;
残差确定模块,用于根据所述时间序列训练数据及所述时间序列模拟数据确定残差序列;
极限学习训练模块,用于利用所述残差序列对极限学习机进行训练,获得极限学习机模型;
最终模拟序列确定模块,用于根据所述时间序列模型和所述极限学习机模型,确定概率确定数据的最终模拟序列;
概率确定模块,用于根据所述概率确定数据及所述最终模拟序列确定未来关联输入因素预测值的发生概率;
概率分布预测模块,用于根据各个预测值的发生概率、所述时间序列模型、所述极限学习机模型和所述贝叶斯网络模型预测猪肉价格波动分别属于各猪肉价格波动区间的概率分布;
规划模块,用于根据所述概率分布规划生猪养殖中仔猪补栏数量和时间、人力和物资投入以及生猪出栏数量和时间。
可选的,所述规划***还包括:
猪肉价格归一化模块,用于对所述猪肉价格数据进行归一化处理,获得归一化处理后的猪肉价格数据;
关联因素归一化模块,用于对所述关联因素数据进行归一化处理,获得归一化处理后的关联因素数据。
可选的,所述规划***还包括:
数据补充模块,用于通过线性插值法或曲线拟合法求出所述历史数据中的缺失数据,并将所述缺失数据补充到所述历史数据中,形成完整的历史数据;
统一化处理模块,用于根据预测周期对完整的历史数据进行统一化处理,获得统一化处理后的历史数据。
可选的,所述时间序列模型确定模块具体包括:
单位根检验单元,用于对所述时间序列训练数据进行单位根检验,判断所述时间序列训练数据是否存在单位根,获得第一判断结果;
相关函数计算单元,用于当所述第一判断结果表示所述时间序列训练数据拒绝存在单位根原假设时,计算所述时间序列训练数据的自相关函数和偏相关函数;
拖尾性判断单元,用于判断所述自相关函数和偏相关函数是否具有拖尾性,获得第二判断结果;
时间序列模型建立单元,用于当所述第二判断结果表示所述自相关函数和所述偏相关函数均具有拖尾性时,则根据所述时间序列训练数据建立时间序列模型;
差分处理单元,用于当所述第一判断结果表示所述时间序列训练数据存在单位根时,对所述时间序列训练数据进行差分处理,获得拒绝存在单位根原假设的时间序列训练数据。
根据本发明提供的具体实施例,本发明公开了以下技术效果:
本发明提供的生猪养殖的规划方法及规划***,通过聚类分析对猪肉价格波动区间及各关联输入因素的波动区间进行离散化分类处理,再利用离散化分类数据来训练好贝叶斯网络模型;之后,将时间序列模型与极限学习机相结合,进一步提高贝叶斯网络模型中输入因素的预测精度,最终基于贝叶斯网络内部变量之间直观的因果依赖关系,预测猪肉价格波动分别属于各猪肉价格波动区间的概率分布。生猪养殖企业或者养殖户可以根据概率分布规划生猪养殖中仔猪补栏数量和时间、人力和物资投入以及生猪出栏数量和时间,降低生猪养殖过程中人力和物资的浪费,保证生猪养殖效益。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其它的附图。
图1为本发明实施例提供的一种生猪养殖的规划方法的流程图;
图2为本发明实施例提供的一种生猪养殖的规划***的结构框图;
图3为本发明实施例提供的与猪肉价格相关联的关联因素结构框图;
图4为本发明实施例提供的贝叶斯网络模型图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
本发明的目的是提供一种生猪养殖的规划方法及规划***,将聚类分析、时间序列模型、极限学习机与贝叶斯网络相结合,基于变量之间直观的因果依赖关系,预测猪肉价格波动分别属于各猪肉价格波动区间的概率分布,根据概率分布规划生猪养殖中仔猪补栏数量和时间、人力和物资投入以及生猪出栏数量和时间,降低生猪养殖过程中人力和物资的浪费,保证生猪养殖效益。
为使本发明的上述目的、特征和优点能够更加明显易懂,下面结合附图和具体实施方式对本发明作进一步详细的说明。
图1为本发明实施例提供的一种生猪养殖的规划方法的流程图。如图1所示,一种生猪养殖的规划方法,所述规划方法包括:
步骤101:获取历史数据,所述历史数据包括猪肉价格数据及关联因素数据,所述关联因素数据为猪肉价格的关联因素的历史数据。本实施例中,所述关联因素包括:鸡肉价格、牛肉价格、羊肉价格、人均可支配收入、居民消费价格指数、人民币/美元汇率、玉米价格、豆粕价格、仔猪价格、生猪存栏量、定点屠宰企业屠宰量、疫情突发事件数量中至少一者。
步骤102:采用时差相关性分析方法对所述猪肉价格数据及所述关联因素数据进行相关性分析,筛选出与猪肉价格的相关系数大于相关性阈值的关联因素数据作为关联输入数据。
步骤103:对每个关联因素的相邻预测周期的所述关联输入数据依次进行差值处理,获得关联因素差值数据,并对相邻预测周期的所述猪肉价格数据进行差值处理,获得猪肉价格差值数据。
步骤104:获取猪肉价格波动区间的数量K及各关联输入因素的波动区间的数量,所述关联输入因素为关联输入数据对应的关联因素。
步骤105:采用K-means聚类分析方法对所述猪肉价格差值数据及各关联因素差值数据进行聚类划分,获得K个猪肉价格波动区间及第i个关联输入因素的Mi个波动区间,i表示关联输入因素的序号,1≤i≤I,I表示关联输入因素的数量。
步骤106:利用所述K-means聚类划分后的猪肉价格差值数据和关联输入因素差值数据训练贝叶斯网络,获得贝叶斯网络模型。
步骤107:获取时间序列训练数据及概率确定数据,所述时间序列训练数据和所述概率确定数据均为所述贝叶斯网络模型的输入变量对应的关联因素的历史数据。
步骤108:根据所述时间序列训练数据建立时间序列模型。
步骤109:将所述时间序列训练数据输入所述时间序列模型,获得时间序列模拟数据,具体包括:
对所述时间序列训练数据进行单位根检验,判断所述时间序列训练数据是否存在单位根,获得第一判断结果;
当所述第一判断结果表示所述时间序列训练数据拒绝存在单位根原假设时,计算所述时间序列训练数据的自相关函数和偏相关函数;
判断所述自相关函数和偏相关函数是否具有拖尾性,获得第二判断结果;
当所述第二判断结果表示所述自相关函数和所述偏相关函数均具有拖尾性时,则根据所述时间序列训练数据建立时间序列模型;
当所述第一判断结果表示所述时间序列训练数据存在单位根时,对所述时间序列训练数据进行差分处理,获得拒绝存在单位根原假设的时间序列训练数据,并返回所述“计算所述时间序列训练数据的自相关函数和偏相关函数”。
步骤110:根据所述时间序列训练数据及所述时间序列模拟数据确定残差序列。
步骤111:利用所述残差序列对极限学习机进行训练,获得极限学习机模型。
步骤112:根据所述时间序列模型和所述极限学习机模型,确定概率确定数据的最终模拟序列。
步骤113:根据所述概率确定数据及所述最终模拟序列确定未来关联输入因素预测值的发生概率,具体包括:
根据与所述概率确定数据对应的各个关联输入因素的波动区间对所述概率确定数据进行归类,获得概率计算分类结果;
根据与所述最终模拟序列对应的各个关联输入因素的波动区间对所述最终模拟序列进行归类,获得模拟序列分类结果;
根据所述概率计算分类结果及所述模拟序列分类结果确定未来关联输入因素预测值的发生概率。
步骤114:根据各个预测值的发生概率、所述时间序列模型、所述极限学习机模型和所述贝叶斯网络模型预测猪肉价格波动分别属于各猪肉价格波动区间的概率分布;
步骤115:根据所述概率分布规划生猪养殖中仔猪补栏数量和时间、人力和物资投入以及生猪出栏数量和时间。
可选的,执行步骤102:采用时差相关性分析方法对所述猪肉价格数据及所述关联因素数据进行相关性分析之前,还包括:
对所述猪肉价格数据进行归一化处理,获得归一化处理后的猪肉价格数据;
对所述关联因素数据进行归一化处理,获得归一化处理后的关联因素数据。
进一步地,执行步骤“对所述猪肉价格数据进行归一化处理”之前,还包括:
通过线性插值法或曲线拟合法求出所述历史数据中的缺失数据,并将所述缺失数据补充到历史数据中,形成完整的历史数据;
根据预测周期对完整的历史数据进行统一化处理,获得统一化处理后的历史数据。
图2为本发明实施例提供的一种生猪养殖的规划***的结构框图。如图2所示,一种生猪养殖的规划***,所述规划***包括:
历史数据获取模块201,用于获取历史数据,所述历史数据包括猪肉价格数据及关联因素数据,所述关联因素数据为猪肉价格的关联因素的历史数据。
时差相关性分析模块202,用于采用时差相关性分析方法对所述猪肉价格数据及所述关联因素数据进行相关性分析,筛选出与猪肉价格的相关系数大于相关性阈值的关联因素数据作为关联输入数据。
差值处理模块203,用于对每个关联因素的相邻预测周期的所述关联输入数据依次进行差值处理,获得关联因素差值数据,并对相邻预测周期的所述猪肉价格数据进行差值处理,获得猪肉价格差值数据。
波动区间数量获取模块204,用于获取猪肉价格波动区间的数量K及各关联输入因素的波动区间的数量,所述关联输入因素为关联输入数据对应的关联因素。
聚类模块205,用于采用K-means聚类分析方法对所述猪肉价格差值数据及各关联因素差值数据进行聚类划分,获得K个猪肉价格波动区间及第i个关联输入因素的Mi个波动区间,i表示关联输入因素的序号,1≤i≤I,I表示关联输入因素的数量。
贝叶斯网络模型确定模块206,用于利用所述K个猪肉价格波动区间及各个关联输入因素的波动区间训练贝叶斯网络,获得贝叶斯网络模型。
训练数据及概率确定数据获取模块207,用于获取时间序列训练数据及概率确定数据,所述时间序列训练数据和所述概率确定数据均为所述贝叶斯网络模型的输入变量对应的关联因素的历史数据。
时间序列模型确定模块208,用于根据所述时间序列训练数据建立时间序列模型。所述时间序列模型确定模块208具体包括:
单位根检验单元,用于对所述时间序列训练数据进行单位根检验,判断所述时间序列训练数据是否存在单位根,获得第一判断结果;
相关函数计算单元,用于当所述第一判断结果表示所述时间序列训练数据拒绝存在单位根原假设时,计算所述时间序列训练数据的自相关函数和偏相关函数;
拖尾性判断单元,用于判断所述自相关函数和偏相关函数是否具有拖尾性,获得第二判断结果;
时间序列模型建立单元,用于当所述第二判断结果表示所述自相关函数和所述偏相关函数均具有拖尾性时,则根据所述时间序列训练数据建立时间序列模型;
差分处理单元,用于当所述第一判断结果表示所述时间序列训练数据存在单位根时,对所述时间序列训练数据进行差分处理,获得拒绝存在单位根原假设的时间序列训练数据。
时间序列预测模块209,用于将所述时间序列训练数据输入所述时间序列模型,获得时间序列模拟数据。
残差确定模块210,用于根据所述时间序列训练数据及所述时间序列模拟数据确定残差序列。
极限学习训练模块211,用于利用所述残差序列对极限学习机进行训练,获得极限学习机模型。
最终模拟序列确定模块212,用于根据所述时间序列模型和所述极限学习机模型,确定概率确定数据的最终模拟序列。
概率确定模块213,用于根据所述概率确定数据及所述最终模拟序列确定各个关联输入因素的概率。
概率分布预测模块214,用于根据各个所述概率、所述时间序列模型、所述极限学习机模型和所述贝叶斯网络模型预测猪肉价格波动分别属于各猪肉价格波动区间的概率分布。
规划模块215,用于根据所述概率分布规划生猪养殖中仔猪补栏数量和时间、人力和物资投入以及生猪出栏数量和时间。
可选的,所述规划***还包括:
猪肉价格归一化模块,用于对所述猪肉价格数据进行归一化处理,获得归一化处理后的猪肉价格数据;
关联因素归一化模块,用于对所述关联因素数据进行归一化处理,获得归一化处理后的关联因素数据。
进一步地,所述规划***还包括:
数据补充模块,用于通过线性插值法或曲线拟合法求出所述历史数据中的缺失数据,并将所述缺失数据补充到所述历史数据中,形成完整的历史数据;
统一化处理模块,用于根据预测周期对完整的历史数据进行统一化处理,获得统一化处理后的历史数据。
本发明提供的生猪养殖的规划***的实施流程如下:
步骤①获取历史数据:如图3所示,获取与猪肉价格相关联的关联因素数据及猪肉价格数据,关联因素数据包括鸡肉价格、牛肉价格、羊肉价格、人均可支配收入、居民消费价格指数、人民币/美元汇率、玉米价格、豆粕价格、仔猪价格、生猪存栏量、定点屠宰企业屠宰量、疫情突发事件数量共12个关联因素。
步骤②数据预处理:对步骤①中的猪肉价格数据及其关联因素数据开展数据预处理。对于原始数据中存在缺失的,可通过线性插值法或曲线拟合法求出缺失数据;同时,多源数据可能存在时间单位不一致的情况,需进行时间尺度统一化处理,如,年度、季度、月度等,若以月度为预测周期,可将年度和季度数据通过线性插值和外推法转换为月度数据。
步骤③数据归一化处理:根据公式(1)对步骤②中预处理后的所有数据开展归一化处理,使数据都映射到[0,1]之间;
其中,xmax为待归一化处理的数据的最大值,xmin为待归一化处理的数据的最小值,x*表示归一化处理后的数据。
步骤④数据时差相关分析及数据筛选:对步骤③处理的数据开展猪肉价格及其关联因素的时差相关性分析,根据公式(2)计算猪肉价格和在一定滞后期数下的关联因素的相关系数,筛选出与猪肉价格的相关系数大于相关性阈值的关联因素数据作为关联输入数据。
其中,E为期望,yt为第t期的猪肉价格,xt-i为滞后i期的关联因素,Ex和Ey分别为关联因素和猪肉价格的期望值(平均值)。当相关系数在1%水平下显著,则认为两者相关,并取t-i期的变量为输入变量。不相关的数据进行删除。其中,滞后期i的取值范围为1-5,基本处于生猪的生长周期内。
步骤⑤数据差值处理:对步骤④筛选后的变量数据进行差值处理,如,设猪肉价格为Y,则t期价格为Yt,t-1期的价格为Yt-1,进行差值处理,则YCt=Yt-Yt-1,YCt为猪肉价格差值数据。
步骤⑥数据离散化分类处理:对步骤⑤差值处理后的所述猪肉价格差值数据及各关联因素差值数据进行聚类划分。如步骤⑤差值处理后猪肉价格数据可通过K-means聚类分析进行分类,选取K个聚类中心点然后确定一个指示变量idnk,根据选择的数据与聚类中心点的距离最小来判断变量是否属于第个中心点的类。重复下面两个过程直到收敛:
第一,对于每一个猪肉价格数据yn,根据公式(3)和公式(4)计算其属于的类别,
第二,对于每一个类别根据公式(5)重新计算其中心点,
猪肉价格波动区间可根据实际情况确定,如猪肉价格波动区间可分成3类(i下跌,ii正常波动,iii上涨),也可以分为5类(i大幅度下跌,ii小幅度下跌,iii基本不变,iv小幅度上涨,v大幅度上涨),也可以分为10类。但是,分类的数量越多,***计算复杂度也随之增高,为了保证能够达到预警的效果,将猪肉价格及其关联因素(突发事件除外)的波动区间都分为5类,其中猪肉价格的5类不同波动区间对等于5类不同预警情景。突发事件主指疫情的发生与否,分为2类(i不发生,ii发生)。
步骤⑦贝叶斯网络结构和参数的确定:将步骤⑥中的数据作为贝叶斯网络结构和参数的训练数据。
贝叶斯网络结构和参数可以通过数据分析和机器学习来确定。如通过K2评分算法,对贝叶斯网络进行结构和参数学习,离散变量集D有n个离散变量(X1,X2,…,Xn),评分函数如下:
其中,D为离散变量集,Bs为包含离散变量集D的贝叶斯网络结构,P(Bs)为网络结构Bs的概率分布(如果无该概率,则可假设P(Bs)=C,C为常量),离散变量集之中的Xi共有ri个分类,离散变量Xi父节点状态为ΠXi,qi为离散变量Xi父节点的状态组合总数(qi=ΠXi∈Π Xiri),Wij为数据集D中父节点集为ΠXi的第j个组合,Nijk为数据集D中变量Xi的值取Xik(1<k≦ri)时,其父节点ΠXi取值为第Wij个组合时的个数。
贝叶斯网络参数主要为含有一个或多个父节点条件下的条件概率,参数θijk估算如下:
其中,E表示期望,ri为离散变量集之中的Xi的分类个数。
步骤⑧贝叶斯网络未来预测时输入变量的概率分析:
通过贝叶斯网络结构和参数的确定,也基本确定了输入变量,从步骤②预处理后的数据中选出与贝叶斯网络模型的输入变量对应的关联因素数据分为两部分,一部分数据用于时间序列建模的训练,表示为Ftr=(x1,x2,x3,…,xm),另一部分数据为概率确定数据,用于贝叶斯网络未来预测时,输入变量概率的确定,表示为Fpp=(xm+1,xm+2,…,xN)。
第一,单位根检验及差分:对训练数据Ftr进行0.05显著性水平下的单位根检验(Augmented Dickey-Fuller),当显著水平低于0.05时则拒绝存在单位根原假设,否则需要对训练数据进行d阶差分,使得差分序列Ftr-d拒绝存在单位根原假设。
第二,ARMA模型的确定:计算Ftr或Ftr-d的自相关函数和偏相关函数并得到自相关图和偏相关图,根据自相关图和偏相关图的衰减趋势确定自相关函数和偏相关函数是否具有拖尾性质。若二者均具有拖尾性,则认为相应的Ftr或Ftr-d服从混合时间序列模型(ARMA(p,q)),其中,p、q为AR(P)模型的阶数和MA(q)模型的阶数。根据赤池信息准则和施瓦兹准则即可确定p、q值。
第三,ARMA模型模拟后残差序列的极限学习机训练和预测:利用ARMA模型的拟合训练数据Ftr得到时间序列模拟数据序列F′tr,将训练数据Ftr减去模拟数据序列F′tr得到残差序列Ftr-r,并根据公式(8)转化为[-1,1]区间内的归一化残差序列Ftr-n
利用极限学习机进行学习,第1至第i个数据作为学习机的输入变量,第i+1个数据为极限学习机的输出变量(i取值一般为3-5),第2至第i+1个数据为输入变量,第i+2为输出变量,以此类推对学习机进行训练,并在训练后可逐步将预测数据作为输入变量得到归一化残差数据的预测序列,并按照公式(8)所示的归一化公式进行反归一化处理,可以得到极限学习机的残差序列预测数据。
第四,贝叶斯网络未来输入变量概率的确定:将ARMA模型和极限学习机相结合,形成组合时间序列模型,通过对ARMA模型的预测数据和极限学习机的残差序列预测数据的求和,可对另一部分数据Fpp进行模拟预测。将实际数据和模型预测数据按照步骤⑥中的离散化分类进行归类,统计出预测结果为“i下跌”时,实际结果分别为“i下跌,ii正常波动,iii上涨”的个数,并分别除以预测结果为“i下跌”的总数,来作为未来某个输入变量预测结果为“i下跌”时,实际结果分别为“i下跌,ii正常波动,iii上涨”的概率,并按此方法,分别计算出预测结果为“ii正常波动”和“iii上涨”时,实际结果分别为“i下跌,ii正常波动,iii上涨”的概率。计算出的这些概率可作为贝叶斯网络未来猪肉价格预测时的输入变量的概率。
第五,对于突发事件(主要指疫情),可根据近期1-5年的历史统计数据分类求和,来计算其概率分布,并作为未来猪肉价格预测时输入变量的概率。也可通过专家咨询获取未来一段时间内疫情发生的概率来作为突发时间的概率。
步骤⑨未来的猪肉价格变化的预警及概率分析。贝叶斯网络未来输入变量为离散数据,而步骤⑧中组合时间序列模型的未来输入变量预测值为连续数据,因此在未来预测时,需要将组合时间序列模型的预测值按照步骤⑤和步骤⑥进行归类,再作为贝叶斯网络未来预测时的输入变量。再与步骤⑧中输入变量概率和步骤⑦中贝叶斯网络相结合,形成贝叶斯网络模型,可实现对未来猪肉价格变化不同预警情景的概率分析,具体过程如下:
如图4所示,假设本实施例中的贝叶斯网络模型的网络结构为三层,输入元素(父节点)为(X1,…,XN),每个输入元素在步骤②中进行了ki个分类(除突发事件为2个分类外,其余元素皆为3个分类)。中间节点为(Y1,…,YJ),中间节点连接的父节点用到的输入变量总共为n个,剩余的输入变量(Xn+1,…,XN)可以直接作用于猪肉价格(Z)。Y1,1、Y1,2和Y1,3分别为中间节点Y1对应的三个分类,其中Y1,1的概率为:
其中,m为中间节点Y1对应的输入变量(父节点)的个数,为m个输入变量(父节点)各个分类的组合,总共有个组合,为各个分类的最大数目,为各种组合下Y1,1的条件概率,表示任意ki,可从步骤⑦中获取;为各个组合的概率,可从步骤⑧中获取,即步骤⑧确定的概率。
根据公式(9)可计算出P(Y1,2)和P(Y1,3),并且另外,可进一步按照此公式计算出(Y1,Y2,…,YJ)的各个分类的概率。
在此基础上,可根据中间节点(Y1,Y2,…,YJ)和剩余输入变量(Xn+1,…,XN)来估算猪肉价格Z的分类Z1的概率,如下:
其中,为(Y1,…,YJ)与(Xn+1,…,XN)各种组合下Z1的条件概率,总共有个组合,为各个组合的概率,可分别根据公式(9)和步骤⑦中的贝叶斯网络模型确定。
按照以上公式,可计算出P(Z2)、P(Z3)、P(Z4)和P(Z5),并且
最终实现未来猪肉价格变化不同预警情景(i大幅度下跌,ii小幅度下跌,iii基本不变,iv小幅度上涨,v大幅度上涨)的概率分析。
步骤⑩:根据概率分布规划生猪养殖中仔猪补栏数量和时间、人力和物资投入以及生猪出栏数量和时间。
若根据步骤⑨获得概率分布能够预测未来第4-6个月猪肉价格大幅度上涨的概率高于65%或小幅度上涨的概率高于80%,那么生猪养殖企业或养殖户可以按照生猪养殖周期提前规划生猪养殖的仔猪(2月龄)补栏时间和生猪出栏时间,适度增加仔猪补栏量、人力和物资投入,提高未来4-6个月的生猪出栏数量;若未来第4-6个月猪肉价格大幅度下跌的概率高于65%或小幅度下跌的概率高于80%,那么生猪养殖企业或养殖户可以提前生猪出栏时间,适度降低仔猪补栏数量,减少人力和物资投入;其他的概率分布,生猪养殖企业或养殖户可以根据其实际养殖情况进行轻微调整。
本说明书中各个实施例采用递进的方式描述,每个实施例重点说明的都是与其他实施例的不同之处,各个实施例之间相同相似部分互相参见即可。对于实施例公开的***而言,由于其与实施例公开的方法相对应,所以描述的比较简单,相关之处参见方法部分说明即可。
本文中应用了具体个例对本发明的原理及实施方式进行了阐述,以上实施例的说明只是用于帮助理解本发明的方法及其核心思想;同时,对于本领域的一般技术人员,依据本发明的思想,在具体实施方式及应用范围上均会有改变之处。综上所述,本说明书内容不应理解为对本发明的限制。

Claims (10)

1.一种生猪养殖的规划方法,其特征在于,所述规划方法包括:
获取历史数据,所述历史数据包括猪肉价格数据及关联因素数据,所述关联因素数据为猪肉价格的关联因素的历史数据;
采用时差相关性分析方法对所述猪肉价格数据及所述关联因素数据进行相关性分析,筛选出与猪肉价格的相关系数大于相关性阈值的关联因素数据作为关联输入数据;
对每个关联因素的相邻预测周期的所述关联输入数据依次进行差值处理,获得关联因素差值数据,并对相邻预测周期的所述猪肉价格数据进行差值处理,获得猪肉价格差值数据;
获取猪肉价格波动区间的数量K及各关联输入因素的波动区间的数量,所述关联输入因素为关联输入数据对应的关联因素;
采用K-means聚类分析方法对所述猪肉价格差值数据及各关联因素差值数据进行聚类划分,获得K个猪肉价格波动区间及第i个关联输入因素的Mi个波动区间,i表示关联输入因素的序号,1≤i≤I,I表示关联输入因素的数量;
利用所述K-means聚类划分后的猪肉价格差值数据和关联输入因素差值数据训练贝叶斯网络,获得贝叶斯网络模型;
获取时间序列训练数据及概率确定数据,所述时间序列训练数据和所述概率确定数据均为所述贝叶斯网络模型的输入变量对应的关联因素的历史数据;
根据所述时间序列训练数据建立时间序列模型;
将所述时间序列训练数据输入所述时间序列模型,获得时间序列模拟数据;
根据所述时间序列训练数据及所述时间序列模拟数据确定残差序列;
利用所述残差序列对极限学习机进行训练,获得极限学习机模型;
根据所述时间序列模型和所述极限学习机模型,确定概率确定数据的最终模拟序列;
根据所述概率确定数据及所述最终模拟序列确定未来关联输入因素预测值的发生概率;
根据各个预测值的发生概率、所述时间序列模型、所述极限学习机模型和所述贝叶斯网络模型预测猪肉价格波动分别属于各猪肉价格波动区间的概率分布;
根据所述概率分布规划生猪养殖中仔猪补栏数量和时间、人力和物资投入以及生猪出栏数量和时间。
2.根据权利要求1所述的规划方法,其特征在于,所述采用时差相关性分析方法对所述猪肉价格数据及所述关联因素数据进行相关性分析之前,还包括:
对所述猪肉价格数据进行归一化处理,获得归一化处理后的猪肉价格数据;
对所述关联因素数据进行归一化处理,获得归一化处理后的关联因素数据。
3.根据权利要求2所述的规划方法,其特征在于,所述对所述猪肉价格数据进行归一化处理之前,还包括:
通过线性插值法或曲线拟合法求出所述历史数据中的缺失数据,并将所述缺失数据补充到历史数据中,形成完整的历史数据;
根据预测周期对完整的历史数据进行统一化处理,获得统一化处理后的历史数据。
4.根据权利要求1所述的规划方法,其特征在于,所述根据所述时间序列训练数据建立时间序列模型,具体包括:
对所述时间序列训练数据进行单位根检验,判断所述时间序列训练数据是否存在单位根,获得第一判断结果;
当所述第一判断结果表示所述时间序列训练数据拒绝存在单位根原假设时,计算所述时间序列训练数据的自相关函数和偏相关函数;
判断所述自相关函数和偏相关函数是否具有拖尾性,获得第二判断结果;
当所述第二判断结果表示所述自相关函数和所述偏相关函数均具有拖尾性时,则根据所述时间序列训练数据建立时间序列模型;
当所述第一判断结果表示所述时间序列训练数据存在单位根时,对所述时间序列训练数据进行差分处理,获得拒绝存在单位根原假设的时间序列训练数据,并返回所述“计算所述时间序列训练数据的自相关函数和偏相关函数”。
5.根据权利要求1所述的规划方法,其特征在于,所述根据所述概率确定数据及所述最终模拟序列确定未来关联输入因素预测值的发生概率,具体包括:
根据与所述概率确定数据对应的各个关联输入因素的波动区间对所述概率确定数据进行归类,获得概率计算分类结果;
根据与所述最终模拟序列对应的各个关联输入因素的波动区间对所述最终模拟序列进行归类,获得模拟序列分类结果;
根据所述概率计算分类结果及所述模拟序列分类结果确定未来关联输入因素预测值的发生概率。
6.根据权利要求1所述的规划方法,其特征在于,所述关联因素包括:鸡肉价格、牛肉价格、羊肉价格、人均可支配收入、居民消费价格指数、人民币/美元汇率、玉米价格、豆粕价格、仔猪价格、生猪存栏量、定点屠宰企业屠宰量、疫情突发事件数量中至少一者。
7.一种生猪养殖的规划***,其特征在于,所述规划***包括:
历史数据获取模块,用于获取历史数据,所述历史数据包括猪肉价格数据及关联因素数据,所述关联因素数据为猪肉价格的关联因素的历史数据;
时差相关性分析模块,用于采用时差相关性分析方法对所述猪肉价格数据及所述关联因素数据进行相关性分析,筛选出与猪肉价格的相关系数大于相关性阈值的关联因素数据作为关联输入数据;
差值处理模块,用于对每个关联因素的相邻预测周期的所述关联输入数据依次进行差值处理,获得关联因素差值数据,并对相邻预测周期的所述猪肉价格数据进行差值处理,获得猪肉价格差值数据;
波动区间数量获取模块,用于获取猪肉价格波动区间的数量K及各关联输入因素的波动区间的数量,所述关联输入因素为关联输入数据对应的关联因素;
聚类模块,用于采用K-means聚类分析方法对所述猪肉价格差值数据及各关联因素差值数据进行聚类划分,获得K个猪肉价格波动区间及第i个关联输入因素的Mi个波动区间,i表示关联输入因素的序号,1≤i≤I,I表示关联输入因素的数量;
贝叶斯网络模型确定模块,用于利用所述K-means聚类划分后的猪肉价格差值数据和关联输入因素差值数据训练贝叶斯网络,获得贝叶斯网络模型;
训练数据及概率确定数据获取模块,用于获取时间序列训练数据及概率确定数据,所述时间序列训练数据和所述概率确定数据均为所述贝叶斯网络模型的输入变量对应的关联因素的历史数据;
时间序列模型确定模块,用于根据所述时间序列训练数据建立时间序列模型;
时间序列预测模块,用于将所述时间序列训练数据输入所述时间序列模型,获得时间序列模拟数据;
残差确定模块,用于根据所述时间序列训练数据及所述时间序列模拟数据确定残差序列;
极限学习训练模块,用于利用所述残差序列对极限学习机进行训练,获得极限学习机模型;
最终模拟序列确定模块,用于根据所述时间序列模型和所述极限学习机模型,确定概率确定数据的最终模拟序列;
概率确定模块,用于根据所述概率确定数据及所述最终模拟序列确定未来关联输入因素预测值的发生概率;
概率分布预测模块,用于根据各个预测值的发生概率、所述时间序列模型、所述极限学习机模型和所述贝叶斯网络模型预测猪肉价格波动分别属于各猪肉价格波动区间的概率分布;
规划模块,用于根据所述概率分布规划生猪养殖中仔猪补栏数量和时间、人力和物资投入以及生猪出栏数量和时间。
8.根据权利要求7所述的规划***,其特征在于,所述规划***还包括:
猪肉价格归一化模块,用于对所述猪肉价格数据进行归一化处理,获得归一化处理后的猪肉价格数据;
关联因素归一化模块,用于对所述关联因素数据进行归一化处理,获得归一化处理后的关联因素数据。
9.根据权利要求8所述的规划***,其特征在于,所述规划***还包括:
数据补充模块,用于通过线性插值法或曲线拟合法求出所述历史数据中的缺失数据,并将所述缺失数据补充到所述历史数据中,形成完整的历史数据;
统一化处理模块,用于根据预测周期对完整的历史数据进行统一化处理,获得统一化处理后的历史数据。
10.根据权利要求7所述的规划***,其特征在于,所述时间序列模型确定模块具体包括:
单位根检验单元,用于对所述时间序列训练数据进行单位根检验,判断所述时间序列训练数据是否存在单位根,获得第一判断结果;
相关函数计算单元,用于当所述第一判断结果表示所述时间序列训练数据拒绝存在单位根原假设时,计算所述时间序列训练数据的自相关函数和偏相关函数;
拖尾性判断单元,用于判断所述自相关函数和偏相关函数是否具有拖尾性,获得第二判断结果;
时间序列模型建立单元,用于当所述第二判断结果表示所述自相关函数和所述偏相关函数均具有拖尾性时,则根据所述时间序列训练数据建立时间序列模型;
差分处理单元,用于当所述第一判断结果表示所述时间序列训练数据存在单位根时,对所述时间序列训练数据进行差分处理,获得拒绝存在单位根原假设的时间序列训练数据。
CN201910048642.1A 2019-01-18 2019-01-18 一种生猪养殖的规划方法及规划*** Pending CN109816236A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201910048642.1A CN109816236A (zh) 2019-01-18 2019-01-18 一种生猪养殖的规划方法及规划***

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201910048642.1A CN109816236A (zh) 2019-01-18 2019-01-18 一种生猪养殖的规划方法及规划***

Publications (1)

Publication Number Publication Date
CN109816236A true CN109816236A (zh) 2019-05-28

Family

ID=66604397

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201910048642.1A Pending CN109816236A (zh) 2019-01-18 2019-01-18 一种生猪养殖的规划方法及规划***

Country Status (1)

Country Link
CN (1) CN109816236A (zh)

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110175425A (zh) * 2019-05-31 2019-08-27 重庆大学 一种基于mmalstm的齿轮剩余寿命的预测方法
CN112189622A (zh) * 2020-10-10 2021-01-08 四川厚全好鲜见信息科技有限公司 一种数据驱动型数字蛋鸡养殖***
CN112598335A (zh) * 2021-01-09 2021-04-02 西平金汇海蓝农业科技有限公司 一种基于互联网的畜牧养殖规划***
CN113011669A (zh) * 2021-03-30 2021-06-22 北京科技大学 一种生猪月度存栏量预测方法

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110175425A (zh) * 2019-05-31 2019-08-27 重庆大学 一种基于mmalstm的齿轮剩余寿命的预测方法
CN110175425B (zh) * 2019-05-31 2023-02-21 重庆大学 一种基于mmalstm的齿轮剩余寿命的预测方法
CN112189622A (zh) * 2020-10-10 2021-01-08 四川厚全好鲜见信息科技有限公司 一种数据驱动型数字蛋鸡养殖***
CN112598335A (zh) * 2021-01-09 2021-04-02 西平金汇海蓝农业科技有限公司 一种基于互联网的畜牧养殖规划***
CN113011669A (zh) * 2021-03-30 2021-06-22 北京科技大学 一种生猪月度存栏量预测方法
CN113011669B (zh) * 2021-03-30 2022-08-02 北京科技大学 一种生猪月度存栏量预测方法

Similar Documents

Publication Publication Date Title
CN109816236A (zh) 一种生猪养殖的规划方法及规划***
An Modeling human decisions in coupled human and natural systems: Review of agent-based models
CN107844901A (zh) 一种企业运营自动化分析的方法及其***
CN108647993A (zh) 一种识别招投标过程中投标者之间关系的方法
Geitzenauer et al. The implementation of Natura 2000 in Austria—A European policy in a federal system
CN110264007A (zh) 股票交易控制方法及装置
Sun et al. Multicriteria decision-making framework for supplier selection: A customer community-driven approach
Fearnside Stochastic Modeling in Human Carrying-Capacity Estimation: A Tool for Development Planning in Amazonia
Alig Modeling acreage changes in forest ownerships and cover types in the Southeast
Sharma et al. Integrated modeling for exploring sustainable agriculture futures
Myrzaliyev et al. Features of strategic planning in agricultural production in Kazakhstan
Kozhemiakina et al. New workplace forecasting in the industrial sector of the Ukrainian economy
Hrinchenko et al. Qualimetric approaches to assessing sustainable development indicators
Shih et al. Farm price prediction using case-based reasoning approach—A case of broiler industry in Taiwan
Buccola et al. Optimal market pools for agricultural cooperatives
Nguyen Two-Stage PLS-SEM and Fuzzy AHP Approach to Investigate Vietnamese SMEs' Export Competitiveness.
Armero et al. Decision Making in Uncertain Rural Scenarios by means of Fuzzy TOPSIS Method.
Kialashaki Evaluation and forecast of energy consumption in different sectors of the United States using artificial neural networks
Fauzie et al. Managing Future Meat Consumption Fulfilment in Indonesia
Hoop et al. On the dynamics of agricultural labour input and their impact on productivity and income: an empirical study of Swiss family farms
Lele et al. Environment, Development, and Poverty: A Report of the International Workshop on India's Forest Management and Ecological Revival
Baukó et al. Dilemmas in agricultural and rural development in Hungary: the EU accession partnership and the SAPARD programme
Wang-jing et al. Assessment on High-quality Development of Guizhou's Agricultural Economy Based on Hesitant Fuzzy Linguistic Term Sets
Li et al. Research on Used Car Price Prediction Based on Stacking Model Fusion
Gao et al. Food System Driven by Obstacle Degree Optimization Algorithm: System Design and Algorithm Analysis

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication

Application publication date: 20190528

RJ01 Rejection of invention patent application after publication