中国高校课件下载中心 》 教学资源 》 大学文库

《数学模型与数学实验》课程书籍文献(数学建模算法大全)第24章 时间序列模型

文档信息
资源类别:文库
文档格式:PDF
文档页数:29
文件大小:285.51KB
团购合买:点击进入团购
内容简介
《数学模型与数学实验》课程书籍文献(数学建模算法大全)第24章 时间序列模型
刷新页面文档预览

第二十四章时间序列模型 时间序列是按时间顺序排列的、随时间变化且相互关联的数据序列。分析时间序 列的方法构成数据分析的一个重要领域,即时间序列分析。 时间序列根据所研究的依据不同,可有不同的分类。 1.按所研究的对象的多少分,有一元时间序列和多元时间序列。 2.按时间的连续性可将时间序列分为离散时间序列和连续时间序列两种 的案分 的统计 特性 时间序列 阶矩 而且对任意时刻满足 (1)均值为常 (2)协方差为时间间隔x的函数。 则称该序列为宽平稳时间序列,也叫广义平稳时间序列。我们以后所研究的时间序列主 要是宽平稳时间序列。 4.按时间序列的分布规律来分,有高斯型时间序列和非高斯型时间序列。 概达 时间序列的处理,来研究其变化趋势 的。 (1)长期趋 某一水平上的面 它反了客观事 ())玉节恋动 (3)循环变动。通常是指周期为一年以上,由非季节因素引起的涨落起伏波形相 似的波动。 (4)不规则变动。通常它分为突然变动和随机变动。 通常用T表示长期趋势项,S,表示季节变动趋势项,C,表示循环变动趋势项,R 表示随机干扰项。常见的确定性时间序列模型有以下几种类型: (1)加法模型 2)融模=7+8+C+龙 =TSCR (3)混合模型 X=T;-S,+R y=S+TC·R 其中y,是观测目标的观测记录,E(R,)=0,E(R)=G2。 如果在预测时间范围以内,无突然变动且随机变动的方差σ二较小,并且有理由认 为过去和现在的演变趋势将继续发展到未来时,可用一些经验方法进行预测。 §2移动平均法 移动平均法是根据时间序列资料逐渐推移,依次计算包含一定项数的时序平均数 -280

-280- 第二十四章 时间序列模型 时间序列是按时间顺序排列的、随时间变化且相互关联的数据序列。分析时间序 列的方法构成数据分析的一个重要领域,即时间序列分析。 时间序列根据所研究的依据不同,可有不同的分类。 1.按所研究的对象的多少分,有一元时间序列和多元时间序列。 2.按时间的连续性可将时间序列分为离散时间序列和连续时间序列两种。 3.按序列的统计特性分,有平稳时间序列和非平稳时间序列。如果一个时间序列 的概率分布与时间t 无关,则称该序列为严格的(狭义的)平稳时间序列。如果序列的 一、二阶矩存在,而且对任意时刻t 满足: (1)均值为常数 (2)协方差为时间间隔τ 的函数。 则称该序列为宽平稳时间序列,也叫广义平稳时间序列。我们以后所研究的时间序列主 要是宽平稳时间序列。 4.按时间序列的分布规律来分,有高斯型时间序列和非高斯型时间序列。 §1 确定性时间序列分析方法概述 时间序列预测技术就是通过对预测目标自身时间序列的处理,来研究其变化趋势 的。一个时间序列往往是以下几类变化形式的叠加或耦合。 (1)长期趋势变动。它是指时间序列朝着一定的方向持续上升或下降,或停留在 某一水平上的倾向,它反映了客观事物的主要变化趋势。 (2)季节变动。 (3)循环变动。通常是指周期为一年以上,由非季节因素引起的涨落起伏波形相 似的波动。 (4)不规则变动。通常它分为突然变动和随机变动。 通常用Tt 表示长期趋势项,St 表示季节变动趋势项,Ct 表示循环变动趋势项,Rt 表示随机干扰项。常见的确定性时间序列模型有以下几种类型: (1)加法模型 t Tt St Ct Rt y = + + + (2)乘法模型 t Tt St Ct Rt y = ⋅ ⋅ ⋅ (3)混合模型 t Tt St Rt y = ⋅ + t St Tt Ct Rt y = + ⋅ ⋅ 其中 t y 是观测目标的观测记录, E(Rt ) = 0 , 2 2 E(Rt ) = σ 。 如果在预测时间范围以内,无突然变动且随机变动的方差 2 σ 较小,并且有理由认 为过去和现在的演变趋势将继续发展到未来时,可用一些经验方法进行预测。 §2 移动平均法 移动平均法是根据时间序列资料逐渐推移,依次计算包含一定项数的时序平均数, 以反映长期趋势的方法。当时间序列的数值由于受周期变动和不规则变动的影响,起伏 较大,不易显示出发展趋势时,可用移动平均法,消除这些因素的影响,分析、预测序

列的长期趋势 简单秘 设观测序列为片,少,取移动平均的项数N<T。一次简单移动平均值计算公 式为: M0=0y+++) =0+.+y-)+0y,-)=Mg+0y,-y) (1) 当预测目标的基本趋势是在某一水平上下波动时,可用一次简单移动平均方法建 立预测模型: )I-N.N+. (2) 其预测标准误差为: ∑(-y) S=1 (3 T-N 最近N期序列值的平均值作为未来各期的预测结果。一般N取值范围: 5≤N≤200。当历史序列的基本趋势变化不大且序列中随机变动成分较多时,N的 取值应较大一些 否则N的取值应小 在有确足的李节变动周期的贤甲,移 平均的项数应取周 期长度 选择最佳N值的一个有效方法是,比较若干模型的预测误 差。预测标湘 庆差最小者 月份的销售收入时间序列如表1示。试用一次简单滑动 均法预测第12月份的销售收入 表1企业销售收入 月份1 2 4 6 销售收入y,533.8574.6606.9 649.8 705.1772.0 月份 0 10 11 销售收入y816.4892.7963.9 1015.1 1102.7 解: 分别取N=4,N=5的预测公式 调=+y+y+,1=45.1 4 始=++:++,1=5. 当N=4时,预测值沿=993.6,预测的标准误差为 .=150.5 11-4 当N=5时,预测值=182.4,预测的标准误差为 -281

-281- 列的长期趋势。 移动平均法有简单移动平均法,加权移动平均法,趋势移动平均法等。 2.1 简单移动平均法 设观测序列为 T y , , y 1 L ,取移动平均的项数 N < T 。一次简单移动平均值计算公 式为: ( ) 1 1 1 (1) t = t + t− + + t−N+ y y y N M L ( ) 1 ( ) 1 ( ) 1 (1) t 1 t N t t N t 1 t t N y y N y y M N y y N = − +L+ − + − − = − + − − (1) 当预测目标的基本趋势是在某一水平上下波动时,可用一次简单移动平均方法建 立预测模型: ( ˆ ˆ ) 1 ˆ 1 (1) t+1 = t = t + + t−N+ y y N y M L ,t = N, N +1,L, (2) 其预测标准误差为: T N y y S T t N t t − − = ∑= +1 2 ( ˆ ) , (3) 最近 N 期序列值的平均值作为未来各期的预测结果。一般 N 取值范围: 5 ≤ N ≤ 200 。当历史序列的基本趋势变化不大且序列中随机变动成分较多时, N 的 取值应较大一些。否则 N 的取值应小一些。在有确定的季节变动周期的资料中,移动 平均的项数应取周期长度。选择最佳 N 值的一个有效方法是,比较若干模型的预测误 差。预测标准误差最小者为好。 例 1 某企业 1 月~11 月份的销售收入时间序列如表 1 示。试用一次简单滑动平 均法预测第 12 月份的销售收入。 表 1 企业销售收入 月份t 1 2 3 4 5 6 销售收入 t y 533.8 574.6 606.9 649.8 705.1 772.0 月份t 7 8 9 10 11 销售收入 t y 816.4 892.7 963.9 1015.1 1102.7 解: 分别取 N = 4, N = 5的预测公式 4 ˆ(1) 1 2 3 1 − − − + + + + = t t t t t y y y y y ,t = 4,5,L,11 5 ˆ(2) 1 2 3 4 1 − − − − + + + + + = t t t t t t y y y y y y ,t = 5,L,11 当 N = 4 时,预测值 ˆ 993.6 (1) y12 = ,预测的标准误差为 150.5 11 4 ( ˆ ) 11 5 (1) 2 1 = − − = ∑t= t t y y S 当 N = 5时,预测值 ˆ 182.4 (2) y12 = ,预测的标准误差为

S2=15 =958.2 11-5 计算结果表明,N=4时,预测的标准误差较小,所以选取N=4。预测第12月份的 销售收入为993.6。 计算的Maab程序如下: 110263.85746606.9649870517208164892796391015J1 -length(y) 。n为移动平均的顶数 %由于n的取值不同,yhat的长度不一致,下面使用了细胞数组 for j=1 ((-1V(i) a( s(i)-sqrt(mean((y(n(i)+l:m)-yhati(1:end-1)).2)) end y12.s 简单移动平均法只活合做近期预,而日是预测目标的发展趋热变化不大的情况, 如果目标的发展趋势存在其它的变化,采用简单移动平均法就会产生较大的预测偏差和 滞后。 22加权移动平均法 在简单移动平均公式中,每期数据在求平均时的作用是等同的。但是,每期数据 所包含的信息量不一样,近期数据包含着更多关于未来情况的信心。因此,把各期数据 等同看待是不尽合理的,应考虑各期数据的重要性,对近期数据给予较大的权重,这就 是加权移动平均法的基本思想。 设时间序列为,.,:加权移动平均公式为 (4) 1w1+1W2+.+1wy 式中M为1期加权移动平均数:w,为y的权数,它体现了相应的y,在加权平均数 中的重要性。 利用加权移动平均数来做预测,其预测公式为 y=M (5) 即以第1期加权移动平均数作为第1十1期的预测值 的广产2我国1979一198年原煤产量如表2所示,试用加权移动平均法预测1989年 年份 198519871988 原煤产量, 6.356.20626.66715789872 8.94 92898 三年如权移动平均预测值 62356.43676.83177.43838.18178.69179.0733 -282

-282- 958.2 11 5 ( ˆ ) 11 6 (2) 2 2 = − − = ∑t= t t y y S 计算结果表明, N = 4 时,预测的标准误差较小,所以选取 N = 4 。预测第 12 月份的 销售收入为 993.6。 计算的 Matlab 程序如下: clc,clear y=[533.8 574.6 606.9 649.8 705.1 772.0 816.4 892.7 963.9 1015.1 1102.7]; m=length(y); n=[4,5]; %n 为移动平均的项数 for i=1:length(n) %由于 n 的取值不同,yhat 的长度不一致,下面使用了细胞数组 for j=1:m-n(i)+1 yhat{i}(j)=sum(y(j:j+n(i)-1))/n(i); end y12(i)=yhat{i}(end); s(i)=sqrt(mean((y(n(i)+1:m)-yhat{i}(1:end-1)).^2)); end y12,s 简单移动平均法只适合做近期预测,而且是预测目标的发展趋势变化不大的情况。 如果目标的发展趋势存在其它的变化,采用简单移动平均法就会产生较大的预测偏差和 滞后。 2.2 加权移动平均法 在简单移动平均公式中,每期数据在求平均时的作用是等同的。但是,每期数据 所包含的信息量不一样,近期数据包含着更多关于未来情况的信心。因此,把各期数据 等同看待是不尽合理的,应考虑各期数据的重要性,对近期数据给予较大的权重,这就 是加权移动平均法的基本思想。 设时间序列为 y1, y2 ,L, yt ,L;加权移动平均公式为 N t N t N tw w w w w y w y w y M + + + + + + = − + L L 1 2 1 2 2 1 ,t ≥ N (4) 式中 Mtw 为t 期加权移动平均数;wi 为 t−i+1 y 的权数,它体现了相应的 t y 在加权平均数 中的重要性。 利用加权移动平均数来做预测,其预测公式为 t Mtw yˆ +1 = (5) 即以第t 期加权移动平均数作为第t +1期的预测值。 例 2 我国 1979~1988 年原煤产量如表 2 所示,试用加权移动平均法预测 1989 年 的产量。 表 2 我国原煤产量统计数据及加权移动平均预测值表 年份 1979 1980 1981 1982 1983 1984 1985 1986 1987 1988 原煤产量 t y 6.35 6.20 6.22 6.66 7.15 7.89 8.72 8.94 9.28 9.8 三年加权移动平均预测值 6.235 6.4367 6.8317 7.4383 8.1817 8.6917 9.0733

相对误差(%) 63899813414784w6474 解取州,=3,m2=2,3=1,按预测公式 =3y+2+2 m=3x98+2x928+894=948 这个预测值偏低,可以修正。其方法是:先计算各年预测值与实际值的相对误差,例如 1982年为 6.66-6235=638% 6.66 将相对误差列于表2中,再计算总的平均相对误差。 1-三x10%=-1-5282x10%=95% 58.44 95910478 7.157.898.728.94 9.28 abs (y(n)-yhat (1:end-1))/() (au(() 在加权移动平均法中,的选择,同样具有一定的经验性。一般的原则是:近期 数据的权数大,远期数据的权数小。至于大到什么程度和小到什么程度,则需要按照预 测者对序列的了解和分析来确定。 2.3趋势移动平均法 面单移 平 实际情况·但 和加权移动平均法在时间序列设有明显的趋粉变动时能够准 回序列 既肾R黑 习法 出 均法 是势移动 移动的平均数为 -283-

-283- 相对误差(%) 6.38 9.98 13.41 14.7 8.48 6.34 7.41 解 取 w1 = 3,w2 = 2,w3 = 1,按预测公式 3 2 1 3 2 ˆ 1 2 1 + + + + = − − + t t t t y y y y 计算三年加权移动平均预测值,其结果列于表 2 中。1989 年我国原煤产量的预测 值为(亿吨) 9.48 6 3 9.8 2 9.28 8.94 ˆ1989 = × + × + y = 这个预测值偏低,可以修正。其方法是:先计算各年预测值与实际值的相对误差,例如 1982 年为 6.38% 6.66 6.66 6.235 = − 将相对误差列于表 2 中,再计算总的平均相对误差。 ) 100% 9.5% 58.44 52.89 100% (1 ˆ 1 × = − × = ⎟ ⎟ ⎠ ⎞ ⎜ ⎜ ⎝ ⎛ − ∑ ∑ t t y y 由于总预测值的平均值比实际值低9.5%,所以可将 1989 年的预测值修正为 10.4788 1 9.5% 9.48 = − 计算的 MATLAB 程序如下: y=[6.35 6.20 6.22 6.66 7.15 7.89 8.72 8.94 9.28 9.8]; w=[1/6;2/6;3/6]; m=length(y);n=3; for i=1:m-n+1 yhat(i)=y(i:i+n-1)*w; end yhat err=abs(y(n+1:m)-yhat(1:end-1))./y(n+1:m) T_err=1-sum(yhat(1:end-1))/sum(y(n+1:m)) y1989=yhat(end)/(1-T_err) 在加权移动平均法中, wt 的选择,同样具有一定的经验性。一般的原则是:近期 数据的权数大,远期数据的权数小。至于大到什么程度和小到什么程度,则需要按照预 测者对序列的了解和分析来确定。 2.3 趋势移动平均法 简单移动平均法和加权移动平均法,在时间序列没有明显的趋势变动时,能够准确 反映实际情况。但当时间序列出现直线增加或减少的变动趋势时,用简单移动平均法和 加权移动平均法来预测就会出现滞后偏差。因此,需要进行修正,修正的方法是作二次 移动平均,利用移动平均滞后偏差的规律来建立直线趋势的预测模型。这就是趋势移动 平均法。 一次移动的平均数为

Mm=0+a++) 在一次移动平均的基础上再进行一次移动平均就是二次移动平均,其计算公式为 M,2=(M,"+.+M91)=M+(M"-M,8) (6) 下面讨论如何利用移动平均的滞后偏差建立直线趋势预测模型 设时间序列{,}从某时期开始具有直线趋势,且认为未来时期也按此直线趋势变 化,则可设此直线趋势预测模型为 r=a,+bT,T=1,2,. (7) 其中1为当前时期数:T为由1至预测期的时期数:,为截距:b,为斜率。两者又称为 平滑系数。 现在,我们根据移动平均值来确定平滑系数。由模型(7)可知 a,=y, y=y-b, -2=y-2b y-N1=y-(W-106 所以 M0=+++-u=+0-b)++y-W-16] N -2-业= N 因此 y.-M-N-16 (8) 2 由式(7),类似式(8)的推导,可得 -9-26 (9) 所以 .-y-=M-M=b (10) 类似式(8)的推导,可得 M-M)-N-1b (11) 于是,由式(8)和式(11)可得平滑系数的计算公式为 a,=2M-M,2 6-N-M"-M) 2 (12) 例3我国1965~1985年的发电总量如表3所示,试预测1986年和1987年的发 电总量 -284

-284- ( ) 1 1 1 (1) t = t + t− + + t−N+ y y y N M L 在一次移动平均的基础上再进行一次移动平均就是二次移动平均,其计算公式为 ( ) 1 ( ) 1 (2) (1) (1) 1 (1) 1 (2) (1) t t t N t Mt Mt N N M M M N M = +L+ − + = − + − − (6) 下面讨论如何利用移动平均的滞后偏差建立直线趋势预测模型。 设时间序列{ }t y 从某时期开始具有直线趋势,且认为未来时期也按此直线趋势变 化,则可设此直线趋势预测模型为 yˆt+T = at + bt T ,T = 1,2,L (7) 其中t 为当前时期数;T 为由t 至预测期的时期数;at 为截距;bt 为斜率。两者又称为 平滑系数。 现在,我们根据移动平均值来确定平滑系数。由模型(7)可知 t t a = y t t bt y −1 = y − t t bt y −2 = y − 2 . t N t N bt y y ( 1) − +1 = − − 所以 t t t t t t t N t t t t t t b N y N Ny N b N y y b y N b N y y y M 2 [1 2 ( 1)] 1 ( ) [ ( 1) ] (1) 1 1 − = − − + + + − = + − + + − − = + + + = − − + L L L 因此 t t bt N y M 2 (1) −1 − = (8) 由式(7),类似式(8)的推导,可得 t t bt N y M 2 (1) 1 1 1 − − − − = (9) 所以 t t Mt Mt bt y − y − = − − = (1) 1 (1) 1 (10) 类似式(8)的推导,可得 t t bt N M M 2 (1) (2) −1 − = (11) 于是,由式(8)和式(11)可得平滑系数的计算公式为 ⎪ ⎩ ⎪ ⎨ ⎧ − − = = − ( ) 1 2 2 (1) (2) (1) (2) t t t t t t M M N b a M M (12) 例 3 我国 1965~1985 年的发电总量如表 3 所示,试预测 1986 年和 1987 年的发 电总量

表}我国发电量及 平1 二次移动平均,N=6 231.8 1181. 216 0 214 230 4612 27 解由散点图1可以看出,发电总量基本呈直线上升趋势,可用趋势移动平均法 来预测 图1原始数据散点图 取N=6,分别计算一次和二次移动平均值并列于表3中。 M"=3461.2,M=2941.2 再由公式(12),得 a21=2M-M2=3981.1 6=6M-M)=208 2 于是,得1=21时直线趋势预测模型为 y4=y2=y2=4192. =2:=2=4397.1 计算的MATLAB程序如下: -285

-285- 表 3 我国发电量及一、二次移动平均值计算表 年份 t 发电总量 yt 一次移动平均,N=6 二次移动平均,N=6 1965 1 676 1966 2 825 1967 3 774 1968 4 716 1969 5 940 1970 6 1159 848.3 1971 7 1384 966.3 1972 8 1524 1082.8 1973 9 1668 1231.8 1974 10 1688 1393.8 1975 11 1958 1563.5 1181.1 1976 12 2031 1708.8 1324.5 1977 13 2234 1850.5 1471.9 1978 14 2566 2024.2 1628.8 1979 15 2820 2216.2 1792.8 1980 16 3006 2435.8 1966.5 1981 17 3093 2625 2143.4 1982 18 3277 2832.7 2330.7 1983 19 3514 3046 2530 1984 20 3770 3246.7 2733.7 1985 21 4107 3461.2 2941.2 解 由散点图 1 可以看出,发电总量基本呈直线上升趋势,可用趋势移动平均法 来预测。 0 5 10 15 20 25 500 1000 1500 2000 2500 3000 3500 4000 4500 图 1 原始数据散点图 取 N = 6 ,分别计算一次和二次移动平均值并列于表 3 中。 3461.2 (1) M21 = , 2941.2 (2) M21 = 再由公式(12),得 2 3981.1 (2) 21 (1) a21 = M21 − M = ( ) 208 6 1 2 (2) 21 (1) 21 21 − = − b = M M 于是,得t = 21时直线趋势预测模型为 yˆ21+T = 3981.1+ 208T 预测 1986 年和 1987 年的发电总量为 yˆ1986 = yˆ22 = yˆ21+1 = 4192.1 yˆ1987 = yˆ23 = yˆ21+2 = 4397.1 计算的 MATLAB 程序如下:

clc.clear %把原始数据保存在纯文本文件y.t中 h %n为移动平均的项数 for i=1:ml-n+l yhatl(i)=sum(y(i:i+n-1))/n, end yhatl f-engh6yha1方 yhat2(i)=sum(yhat1(i:i+n-1)//n; end plot(1:21.y*) a21yhatl(end)-yhat2(end) 19nd-yhat2(end)/(n-1) y1987=a21+2*b21 趋势移动平均法对于同时存在直线趋势与周期波动的序列,是一种既能反映趋势变 化,又可以有效地分离出来周期变动的方法 §3指数平滑法 一次移动平均实际上认为最近N期数据对未来值影响相同,都加权:而N期 以前的数据对未来值没有影响,加权为0。但是,二次及更高次移动平均数的权数却不 是,且次数越高,权数的结构越复杂,但水远保持对称的权数,即两端项权数小, 一般系统的动态性 般说来历史数据对 平均作 去根据 的又商的次指敌平尚法和 3,1一次指数平滑法 L,预测模型 设时间序列为片,少,a为加权系数,0<口<1,一次指数平滑公式为 S,"=y,+(1-a)S9=Sg+ay,-S9) (13 式(13)是由移动平均公式改进而来的。由式(1)知,移动平均数的递推公式为 MM+ 以M四作为乃-w的最佳估计,则有 w-Mg+-为+-} 286

-286- clc,clear load y.txt %把原始数据保存在纯文本文件 y.txt 中 m1=length(y); n=6; %n 为移动平均的项数 for i=1:m1-n+1 yhat1(i)=sum(y(i:i+n-1))/n; end yhat1 m2=length(yhat1); for i=1:m2-n+1 yhat2(i)=sum(yhat1(i:i+n-1))/n; end yhat2 plot(1:21,y,'*') a21=2*yhat1(end)-yhat2(end) b21=2*(yhat1(end)-yhat2(end))/(n-1) y1986=a21+b21 y1987=a21+2*b21 趋势移动平均法对于同时存在直线趋势与周期波动的序列,是一种既能反映趋势变 化,又可以有效地分离出来周期变动的方法。 §3 指数平滑法 一次移动平均实际上认为最近 N 期数据对未来值影响相同,都加权 N 1 ;而 N 期 以前的数据对未来值没有影响,加权为 0。但是,二次及更高次移动平均数的权数却不 是 N 1 ,且次数越高,权数的结构越复杂,但永远保持对称的权数,即两端项权数小, 中间项权数大,不符合一般系统的动态性。一般说来历史数据对未来值的影响是随时间 间隔的增长而递减的。所以,更切合实际的方法应是对各期观测值依时间顺序进行加权 平均作为预测值。指数平滑法可满足这一要求,而且具有简单的递推形式。 指数平滑法根据平滑次数的不同,又分为一次指数平滑法、二次指数平滑法和三 次指数平滑法等,分别介绍如下。 3.1 一次指数平滑法 1.预测模型 设时间序列为 y1, y2 ,L, yt ,L,α 为加权系数,0 < α < 1,一次指数平滑公式为: (1 ) ( ) (1) 1 (1) 1 (1) 1 (1) t = t + − t− = t− + t − St− S αy α S S α y (13) 式(13)是由移动平均公式改进而来的。由式(1)知,移动平均数的递推公式为 N y y M M t t N t t − − − = + (1) 1 (1) 以 (1) Mt−1作为 t N y − 的最佳估计,则有 (1) 1 (1) (1) 1 1 (1) 1 1 − − − ⎟ ⎠ ⎞ ⎜ ⎝ ⎛ = + − − = + t t t t t t M N N y N y M M M

令a=,以S代替M”,即得式13) S"=+1-a)Sg 为进一步理解指数平滑的实质,把式(13)依次展开,有 S"=a,+(1-a)[gy,a+(1-a)S8]=.=a∑1-a)/y,- (14) (14)式表明S四是全部历史数据的加权平均,加权系数分别为 a,a(1-a),a1-a)2,.;显然有 a1-ay=1-0-a =1 =S9 y,+(1-a) (15) 也就是以第 折数平滑值作为1+1期预测值。 加权系数的选择是很重要的 的 就愈大,原预测值所古的比重就愈小,反之亦然。若把式(15)改写为 (16) 则从上式可看出,新预测值 根据预测误差对原预测值进行修正而得到的。α的大小 则体现了修正的幅度,α值愈大,修正幅度愈大:口值愈小,修正幅度也愈小。 若选取α=0,则立=乃,即下期预测值就等于本期预测值,在预测过程中不考 虑任何新信息;若选取=1,则乃1=y,即下期预测值就等于本期观测值,完全不 去的1 角的 的具何 应根 能包今较长 h 则a应取 在实用上,类似移动平均法,多取几个α值进行试算,看哪个预测误差小,就采 用哪个。 3.初始值的确定 用一次指数平滑法讲行预测,除了选择合话的仪外。还要确定初始值s。初始作 测者估计或指定的 时间序列的 刃始值对 的 选 据较多比如在20个以上时 果时 时以后 就必须认 确定初 一般以最初几期实际值的平均值作为初始值 例4某市1976~1987年某种电器销售额如表4所示。试预测1988年该电器销售 -287

-287- 令 N 1 α = ,以 St 代替 (1) Mt ,即得式(13) (1) 1 (1) (1 ) t = t + − St− S αy α 为进一步理解指数平滑的实质,把式(13)依次展开,有 ∑ ∞ = = + − − + − − = = − − 0 (1) 1 2 (1) (1 )[ (1 ) ] (1 ) j t j j t t t t S αy α αy α S L α α y (14) ( 14 )式表明 (1) St 是全部历史数据的加权平均,加权系数分别为 α,α(1−α),α(1−α) 2 ,L;显然有 ∑ ∞ = = − − − = 0 1 1 (1 ) (1 ) j j α α α α 由于加权系数符合指数规律,又具有平滑数据的功能,故称为指数平滑。 以这种平滑值进行预测,就是一次指数平滑法。预测模型为 (1) 1 ˆt St y + = 即 t t t yˆ y (1 ) yˆ +1 = α + −α (15) 也就是以第t 期指数平滑值作为t +1期预测值。 2.加权系数的选择 在进行指数平滑时,加权系数的选择是很重要的。由式(15)可以看出,α 的大 小规定了在新预测值中新数据和原预测值所占的比重。α 值越大,新数据所占的比重 就愈大,原预测值所占的比重就愈小,反之亦然。若把式(15)改写为 ˆ ˆ ( ˆ ) t 1 t t t y = y + y − y + α (16) 则从上式可看出,新预测值是根据预测误差对原预测值进行修正而得到的。α 的大小 则体现了修正的幅度,α 值愈大,修正幅度愈大;α 值愈小,修正幅度也愈小。 若选取α = 0 ,则 t t yˆ yˆ +1 = ,即下期预测值就等于本期预测值,在预测过程中不考 虑任何新信息;若选取α = 1,则 t t y = y +1 ˆ ,即下期预测值就等于本期观测值,完全不 相信过去的信息。这两种极端情况很难做出正确的预测。因此,α 值应根据时间序列 的具体性质在 0~1 之间选择。具体如何选择一般可遵循下列原则:①如果时间序列波 动不大,比较平稳,则α 应取小一点,如(0.1~0.5)。以减少修正幅度,使预测模型 能包含较长时间序列的信息;②如果时间序列具有迅速且明显的变动倾向,则α 应取 大一点,如(0.6~0.8)。使预测模型灵敏度高一些,以便迅速跟上数据的变化。 在实用上,类似移动平均法,多取几个α 值进行试算,看哪个预测误差小,就采 用哪个。 3.初始值的确定 用一次指数平滑法进行预测,除了选择合适的α 外,还要确定初始值 (1) 0 s 。初始值 是由预测者估计或指定的。当时间序列的数据较多,比如在 20 个以上时,初始值对以 后的预测值影响很少,可选用第一期数据为初始值。如果时间序列的数据较少,在 20 个以下时,初始值对以后的预测值影响很大,这时,就必须认真研究如何正确确定初始 值。一般以最初几期实际值的平均值作为初始值。 例 4 某市 1976~1987 年某种电器销售额如表 4 所示。试预测 1988 年该电器销售 额

解采用指数平滑法,并分别取a=0.2,0.5和0.8进行计算,初始值 ”=51 即 =0=51 按预测模型 y.=ay.+(1-)y 计算各期预测值,列于表4中。 表4某种电器销售额及指数平滑预测值计算表(单位:万元) 年份 实际销售额y 预测值 预测值), 预测值, a=02 a=0.5 =0.8 50 303 198 0 4 68 01 从表4可以看出,《=0.2,0.5和0.8时,预测值是很不相同的。究竟《取何值为好, 可通过计算它们的预测标准误差S,选取使S较小的那个α值.预测的标准误差见表5。 表;预测的标准误差 45029 45908 计算结果表明:α=0.2时,S较小,故选取位=0.2,预测1988年该电器销售额 为,=51.1754 计算的MATLAB程序如下: clc.cle load dianqitxt%原始数据以列向量的方式存放在纯文本文件中 yha((((alpha) for i=2:n yhat(,i.片-alpha*y-IHl-alpha).yhat(-il,方 end vhat .1m-yha,2 yhat1988=alpha*yt(n)+(1-apha)*yhat(n.) -288-

-288- 解 采用指数平滑法,并分别取α = 0.2,0.5和0.8进行计算,初始值 (1) 1 2 0 51 2 y y S + = = 即 (1) 1 0 y S ˆ = = 51 按预测模型 1 ˆ ˆ (1 ) tt t y + =α y y + −α 计算各期预测值,列于表 4 中。 表 4 某种电器销售额及指数平滑预测值计算表 (单位:万元) 年份 t 实际销售额 t y 预测值 ˆ t y α = 0.2 预测值 ˆ t y α = 0.5 预测值 ˆ t y α = 0.8 1976 1 50 51 51 51 1977 2 52 50.8 50.5 50.2 1978 3 47 51.04 51.25 51.64 1979 4 51 50.23 49.13 47.93 1980 5 49 50.39 50.06 50.39 1981 6 48 50.11 49.53 49.28 1982 7 51 49.69 48.77 48.26 1983 8 40 49.95 49.88 50.45 1984 9 48 47.96 44.94 42.09 1985 10 52 47.97 46.47 46.82 1986 11 51 48.77 49.24 50.96 1987 12 59 49.22 50.12 50.99 从表 4 可以看出,α = 0.2,0.5和0.8时,预测值是很不相同的。究竟α 取何值为好, 可通过计算它们的预测标准误差 S ,选取使 S 较小的那个α 值。预测的标准误差见表 5。 表 5 预测的标准误差 α 0.2 0.5 0.8 S 4.5029 4.5908 4.8426 计算结果表明:α = 0.2 时,S 较小,故选取α = 0.2 ,预测 1988 年该电器销售额 为 yˆ1988 = 51.1754。 计算的 MATLAB 程序如下: clc,clear load dianqi.txt %原始数据以列向量的方式存放在纯文本文件中 yt=dianqi; n=length(yt); alpha=[0.2 0.5 0.8];m=length(alpha); yhat(1,1:m)=(yt(1)+yt(2))/2; for i=2:n yhat(i,:)=alpha*yt(i-1)+(1-alpha).*yhat(i-1,:); end yhat err=sqrt(mean((repmat(yt,1,m)-yhat).^2)) xlswrite('dianqi.xls',yhat) yhat1988=alpha*yt(n)+(1-alpha).*yhat(n,:)

32 当 间序 列的变动出现直线趋 势时, 法 后 线趋热植 势移动平均 滑,利用带后偏的规律建 滑法 S0=%,+1-a)S S2=aS0+(1-a)S (17) 式中S,为一次指数的平滑值:S,2为二次指数的平滑值。当时间序列y,},从某时 期开始具有直线趋势时,类似趋势移动平均法,可用直线趋势模型 iur =a,+bT,T=12 (18) 4=2S0-5,2 (5-) (19) 进行预测。 例5仍以例3我国1965~1985年的发电总量资料为例,试用二次指数平滑法预 则1986年和1987年的发电总量。 表6 我国发电总量及 二次指数平滑值计算去 (单位:亿度 年份 发电总量 一次平滑值 三次平滑值 的估计值 56 720 784.0 197 1150 786 8757 1972 967 13084 10 072 0 307 223 51 4107 036 3916.6 解取a=0.3,初始值S和S2都取序列的首项数值,即S=S=676。 计算S,S2,列于表6。得到 S"=3523.1,S2=3032.6 由公式(19),可得1=21时 -289

-289- 3.2 二次指数平滑法 一次指数平滑法虽然克服了移动平均法的缺点。但当时间序列的变动出现直线趋 势时,用一次指数平滑法进行预测,仍存在明显的滞后偏差。因此,也必须加以修正。 修正的方法与趋势移动平均法相同,即再作二次指数平滑,利用滞后偏差的规律建立直 线趋势模型。这就是二次指数平滑法。其计算公式为 (1) 1 (1) (1 ) t = t + − St− S αy α (2) 1 (2) (1) (1 ) St = αSt + −α St− (17) 式中 (1) St 为一次指数的平滑值; (2) St 为二次指数的平滑值。当时间序列{ }t y ,从某时 期开始具有直线趋势时,类似趋势移动平均法,可用直线趋势模型 yˆt+T = at + bt T ,T = 1,2,L (18) ⎪ ⎩ ⎪ ⎨ ⎧ − − = = − ( ) 1 2 (1) (2) (1) (2) t t t t t t b S S a S S α α (19) 进行预测。 例 5 仍以例 3 我国 1965~1985 年的发电总量资料为例,试用二次指数平滑法预 测 1986 年和 1987 年的发电总量。 表 6 我国发电总量及一、二次指数平滑值计算表 (单位:亿度) 年份 t 发电总量 yt 一次平滑值 二次平滑值 yt+1的估计值 1965 1 676 676 676 1966 2 825 720.7 689.4 676 1967 3 774 736.7 703.6 765.4 1968 4 716 730.5 711.7 784.0 1969 5 940 793.3 736.2 757.4 1970 6 1159 903.0 786.2 875.0 1971 7 1384 1047.3 864.6 1069.9 1972 8 1524 1190.3 962.3 1308.4 1973 9 1668 1333.6 1073.7 1516.1 1974 10 1688 1439.9 1183.6 1705.0 1975 11 1958 1595.4 1307.1 1806.1 1976 12 2031 1726.1 1432.8 2007.2 1977 13 2234 1878.4 1566.5 2145.0 1978 14 2566 2084.7 1722.0 2324.1 1979 15 2820 2305.3 1897.0 2602.9 1980 16 3006 2515.5 2082.5 2888.6 1981 17 3093 2688.8 2264.4 3134.1 1982 18 3277 2865.2 2444.6 3295.0 1983 19 3514 3059.9 2629.2 3466.1 1984 20 3770 3272.9 2822.3 3675.1 1985 21 4107 3523.1 3032.6 3916.6 解 取α = 0.3 ,初始值 (1) S0 和 (2) S0 都取序列的首项数值,即 676 (0) 0 (1) S0 = S = 。 计算 (1) (2) , St St ,列于表 6。得到 3523.1 (1) S21 = , 3032.6 (2) S21 = 由公式(19),可得t = 21时

共29页,试读已结束,阅读完整版请下载
刷新页面下载完整文档
VIP每日下载上限内不扣除下载券和下载次数;
按次数下载不扣除下载券;
注册用户24小时内重复下载只扣除一次;
顺序:VIP每日次数-->可用次数-->下载券;
相关文档