一、数据来源
数据来源于“中国统计局”和“中国气象数据网”。
从“中国统计局”中获取了河南省和四川省的第一产业增加值和财政支农支出;从“中国气象数据网”中获得了全国824个气象站点的日均气温、降水量、光照时长等月度数据。
由于第一产业对自然的依赖相比其他两个产业来说更显著一些,决定将研究对象定为对气象最为敏感的第一产业。
自然对生产的影响最普遍的就是通过气象来影响。所以本研究中用年均气温(℃),年均降水(mm),年均光照时长(h)来表示自然的数据。
人类活动数据使用该省份财政支农支出的数据。考虑到财政对农业的投入不能第一时间转化为实际的增加值,再加上所能获取到的支农支出的统计年份的限制,将滞后年份设置为4年,即现在的投入会对四年后的第一产业增加值产生最显著的影响。
二、数据处理
因为气象数据是月数据,所以我们首先需要将月数据转化成年数据。转化方式如下:首先找出研究省份内的所有气象点,因为气象点的数量可能会有波动,河南省内大约有11个气象点,四川省内大约有17个气象点。将这些气象点的数据提取出来,然后相加求和再除以气象点数量和月份的乘积,得到省份的年均气象数据。
(一)BP神经网络介绍
Back propagation神经网络是1986年被提出的,是一种按照误差逆向传播算法训练的多层前馈神经网络,也是目前应用最广泛的神经网络。
人工神经网络不需要事先确定输入输出映射关系的方程,而且通过随机数确定权矩阵,然后通过输入训练集,来训练网络,训练之后,使用时候,用事先确定好的预测集进行预测检验。基本思想就是梯度下降法,利用梯度搜索技术,是神经网络的实际输出值和期望输出值之间的误差均方差为最小。
我们把对Matlab中的输入的数据看成神经细胞的输入信号,然后每一个都会乘上一个权值w_ij,然后求和。但是以上这些只是线性变化,为了达到非线性的目的,我们将处理过的结果,又做为新的输入输给别的神经元,很多这样的神经元就构成了神经网络。
但是BP神经网络是具有一定缺陷的。首先就是存在麻痹现象,由于优化的目标函数很复杂,必然会在神经元输出接近0或者1的时候,出现一些平坦区,使得权值的变化极小,使训练过程停止。其次是BP算法是一种局部搜索的优化方法,很可能陷入局部极值导致训练失败。
(二)设计思路及代码解释
1、设计思路
使用matlab引用Excel表格中的数据。对引入数据进行处理,把月度数据转化成年度数据。
对所有数据进行归一化。创建神经网络。使用数据训练神经网络。检验神经网络,并且作图。检验分为三部,只用气象数据进行训练;只用支农支出数据进行训练;同时使用气象数据和支农支出数据训练。通过计算结果的均方差来判断拟合效果。
2、代码解释
xlsread(‘SiChuanData.xlsx’)引用名为‘SiChuangData’的Excel中的数据,切记目前matlab还不支持’.xls’后缀的Excel文件。
[inputn,inputs]=mapminmax(input)是归一化函数,input是原序列,然后inputn是归一化之后的数列,inputs是归一化的结构和方法。稍后可以利用inputs进行反归一化mapminmax(‘reverse’,归一化数据,归一化结构)。
newff(inputn,output,10)是创建只有一个有10个神经元的隐含层神经网络。
trainParam是可以更改创建的神经网络的属性的。‘.epochs’是迭代次数;‘.lr’是学习速率;’.goal’是目标误差;‘.max_fail’是连续进行了未能减少误差的迭代就终止训练的最大迭代次数。
train(net,inputn,outputn)是对net神经网络进行训练。
(三)运行结果及分析
1、运行结果
2、结果分析
(1)虽然每一次运行神经网络的结果都是不一样的(因为初始的权矩阵是随机的),但是经过20次的运行,可以发现无论是四川省还是河南省,都是支农支出加上气象数据得到的拟合效果最好,均方差也最小。然而稍微对比一下finance和meteorology的图像,不看看出,气象的变化对于第一产业增加值的影响远远小于支农支出的影响。但是可以在一定程度上,弥补支农支出的均方差,更好的解释一下第一产业增加值的在增长大趋势下的细微波动。
(2)财政支农支出与第一产业增加值呈现同步的持续增长,而且近年来财政支农支出占财政支出的比重不断增加,这也体现了人们对第一产业的重视和影响力的提升,这也意味着削弱了气象的随机性变化对第一产业的影响。
(3)基于刘宏杰2008年中国财政支农支出对第一产业增加值的影响的研究结论,中国财政支农支出对产业的贡献份额不断上升,而且两者之间存在稳定的协整关系和双向的格兰杰因果关系。
(4)近些年来,我国没有发生什么严重的气象灾害,所以气象对第一产业的影响一直处于一个正常的低水平的程度,但是随着环境的逐渐恶化,全球变暖的加剧,气候的波动会随之加剧,而这意味着气象对第一产业的影响会显著增加,气象也会成为不得不考虑的重要因素。
综上所属,本研究得到最终结论:人为因素(支农支出)是影响第一产业增加值的第一要素,气象的波动对增加值的影响极小。但是研究结果也表明了气象数据确实对预测第一产业增加值起到了正向的作用。基于气象数据和财政数据可以更精确的预测第一产业增加值。
作者单位:陈亦新 厦门大学
鄢冉 郑州大学