电脑桌面
添加盘古文库-分享文档发现价值到电脑桌面
安装后可以在桌面快捷访问

多元线性回归法

来源:文库作者:开心麻花2025-11-191

多元线性回归法(精选12篇)

多元线性回归法 第1篇

精确的定量预报历来是水文预报工作当中一项比较困难的课题[1]。在中长期水文预报中,数理统计方法占有显著地位[2]。多元线性回归分析法为其常用方法。这种方法是处理变量与变量之间统计相关关系的数理统计方法,影响因子越多越能体现它的优势。其特点是:方法简单,精度较高。

1 多元线性回归分析法的预报原理[3]

多元线性回归是研究一个随机变量与多个变量之间相关关系的方法,它的数学模型为:

y=b0+b1x1+b2x2+…+bmxm (1)

其中,b0,b1,…,bm为回归系数。根据y与各个x的实测资料序列,把b0,b1,…,bm确定后,方程也就确定了。多元线性回归方程的回归系数一般是采用最小二乘法来确定的。

1.1 预报因子的选取

本文用史比曼等级相关系数进行预报因子的选取。随机变量之间的相关程度用等级相关系数表示。史比曼等级相关系数的计算公式为:

R=1-6n(n2-1)t=1n(yt-xt)2

其中,R为史比曼等级相关系数;n为资料年限;yt为预报对象第t年的排列序数;xt为预报因子第t年的排列序数。

等级相关系数的显著性检验可应用级差平方和检验。实际工作中有计算的表格可查。在给定信度下,若根据实际资料计算得到的R大于表中相应的Ra,则这一因子可以挑选,否则舍弃。

1.2 系数的最小二乘估计法

对式(1)应用最小二乘法可导出如下方程组:

nb0+b1i=1nx1i+b2i=1nx2i++bmi=1nxmi=i=1nyib0i=1nx1i+b1i=1nx1i2+b2i=1nx1ix2i++bmi=1nx1ixmi=i=1nx1iyib0i=1nx2i+b1i=1nx1ix2i+b2i=1nx2i2++bmi=1nx2ixmi=i=1nx2iyib0i=1nxmi+b1i=1nx1ixmi+b2i=1nx2ixmi++bmi=1nxmi2=i=1nxmiyi

其中,xj,i为第j个预报因子的第i次观测值,j=1,2,…,m,i=1,2,…,n;yi为预报对象的第i次观测值。

1.3 回归效果的检验

回归方程求得之后,必须对它的回归效果进行检验。

Syy=i=1n(yi-y¯)2=i=1n[(yi-yi)+(yi-y¯)]2=i=1n(yi-yi)2+i=1n(yi-y¯i)2+2i=1n(yi-y)(yi-y¯)

上式中右端最后一项为0,由此Syy可分解为:

其中,右端第一项为观测值yi与估计值yi之差的平方和,称为残差平方和(记为Q),它反映排除自变量x作用之外的其他因素对y的影响;右端第二项为估计值y∧i与均值y之差的平方和,称为回归平方和(记为U),它反映出由于因子x的变化部分。故可记为:

复相关系数:,可用复相关系数r复值的大小来衡量回归效果的显著程度。r复的取值范围为0≤r复≤1,显然复相关系数愈接近1,回归的效果就愈好。

2 实例运用

某水文站1961年~1989年2月最低水位数据参数见表1,多元回归预报因子预报检验见表2。

由表2得出3个等级相关系数分别为:R1=0.726 96,R2=0.746 6,R3=0.903 957,均大于Rα=0.244(α=0.05);复相关系数为r复=0.576 613,查表得rα′=0.394<R(α=0.05),说明回归效果显著。

对1990年~1999年最低水位进行预报成果见表3。

3 结语

1)利用多元线性回归分析法对水位的预报,能比较客观的选取预报因子,评价结果可靠、全面。2)多元线性回归分析方法简单,预测结果误差不大,精度高。Matlab软件的使用大大减少了其工作量,使预报工作更方便。3)本文应用的预报方程为线性回归方程,预测结果相距不大。虽对于大量波峰、波谷数据有较大误差,但在这种类似水位预报情况下适用。

摘要:分析了水文预报的主要影响因子,通过系数的最小二乘法建立方程组,采用了Matlab软件对其方程组进行求解,得出其多元回归方程,应用复相关系数对其回归效果进行了检验,结果表明,多元线性回归分析方法简单、误差较小、预报结果有效。

关键词:多元线性回归分析,复相关性,多元回归方程

参考文献

[1]宏伟.Matlab软件在中长期水文预报中的应用[J].东北水利水电,2005(4):40-41.

[2]王钦钊,向奇志.中长期水文预报方法的探讨[J].江西水利科技,2006,32(2):88-89.

多元线性回归法 第2篇

课程名称金融计量学 实验项目名称多元线性回归模型

班级与班级代码 实验室名称(或课室)

专业

任课教师 xxx

学号 :xxx

姓名 :xxx 实验日期:2012 年 5 月 3 日

广东商学院教务处制 姓名 xxx 实验报告成绩 评语 :

指导教师(签名)

年月日

说明:指导教师评分后,实验报告交院(系)办公室保存

多 元线性回归模型

一、实验目的 通过上机实验,使学生能够使用 Eviews 软件估计可化为线性回归模型的非线性模型,并对线性回归模型的参数线性约束条件进行检验。

二、实验内容 (一)根据中国某年按行业分的全部制造业国有企业及规模以上制造业非国有企业的工业总产值 Y,资产合计 K 及职工人数 L 进行回归分析。

(二)掌握可化为线性多元非线性回归模型的估计和多元线性回归模型的线性约束条件的检验方法 (三)根据实验结果判断中国该年制造业总体的规模报酬状态如何? 三、实验步骤(一)收集数据 下表列示出来中国某年按行业分的全部制造业国有企业及规模以上制造业非国有企业的工业总产值 Y,资产合计 K 及职工人数 L。

序号 工业总产值 Y(亿元)

资产合计 K(亿元)

职工人数 L(万人)

序号 工业总产值 Y(亿元)

资产合计 K(亿元)

职工人数 L(万人)3722.7 3078.22 113 17 812.7 1118.81 43 2 1442.52 1684.43 67 18 1899.7 2052.16 61 3 1752.37 2742.77 84 19 3692.85 6113.11 240 4 1451.29 1973.82 27 20 4732.9 9228.25 222 5 5149.3 5917.01 327 21 2180.23 2866.65 80 6 2291.16 1758.77 120 22 2539.76 2545.63 96 7 1345.17 939.1 58 23 3046.95 4787.9 222 8 656.77 694.94 31 24 2192.63 3255.29 163 9 370.18 363.48 16 25 5364.83 8129.68 244 10 1590.36 2511.99 66 26 4834.68 5260.2 145 11 616.71 973.73 58 27 7549.58 7518.79 138 12 617.94 516.01 28 28 867.91 984.52 46 13 4429.19 3785.91 61 29 4611.39 18626.94 218 14 5749.02 8688.03 254 30 170.3 610.91 19 15 1781.37 2798.9 83 31 325.53 1523.19 45 16 1243.07 1808.44 33 表 1(二)创建工作文件(Workfile)。

1、启动Eviews5,在主菜单上依次点击FileNewWorkfile(如图),按确定。

2、在弹出的对话框中选择数据的时间频率(本实验为序列数据),输入数据数为31(如图1),然后点击OK(如图2)。

(图 1)(图 2)、(三)输入数据 1、在 Eviews 软件的命令窗口中键入数据输入/编辑命令:DATAYKL,按 Enter,则显示一个数组窗口(如图)。

2、分别在Y、K、L列输入相应的数据并以group01命名保存(如图):

(四)、回归分析 1、在经济理论指导下,设定如下的理论模型:

2、运用OLS估计模型 经对数转换,式  e L AK Y 可变换对数形式如下:

3、对表1的Y、K、L的数据进行对数转换,得新的数据如表2所示:

序号

序号

18.222204 8.032107 4.727388 27.274147 7.429183 4.204693 37.468724 7.916724 4.430817 47.280208 7.587726 3.295837 58.546616 8.685587 5.78996 67.736814 7.47237 4.787492 77.204276 6.844922 4.060443 86.487334 6.543826 3.433987 95.913989 5.895724 2.772589 107.371716 7.828831 4.189655 116.424399 6.881134 4.060443 126.426391 6.246126 3.332205 138.395972 8.239042 4.110874 148.656785 9.069701 5.537334 15

7.485138 7.936982 4.418841 16

表2 4、对表2经对数转化后的数据进行相关性分析 ①重复数据输入步骤,输入取对数后的数据如图:

②在弹出的窗口中选择ViewGraphScatterSimpleScatter按确定,得取对数后的Y、K、L三者之间关系的散点图,结果如下:

③通过对以上散点图的观察可以看出,取对数后的K、L的联合值对取对数后的Y的值有着显着的线性影响。

5、在 Eviews 主窗口中点击 QuickEstimateEquation,在弹出的方程设定框内输入模型:log(y)clog(k)log(l)(如图):

再点击确定,系统将弹出一个窗口来显示有关估计结果(如图)。

由图显示的结果可知,样本回归方程为:

Y ln =1.154+0.609 K ln +0.361 L ln

(1.59)(3.45)(1.75)其中 8099.02 R,2R =0.7963,F=59.66 4、对以上实验结果做 t 检验分析:

给定显着性水平5%,自由度为(2,28)的 F 分布的临界值为34.3 28 2(05.0),F,因此总体上看,K ln , L ln 联合起来对 Y ln 有着显着的线性影响。在 5%的显着性水平下,自由度为 28 的 t 分布的临界值为048.2)28(05.0 t,因此,K ln 的参数通过了该显着性水平下的 t 检验,但L ln 未通过检验。如果设定显着性水平为 10%,t 分布的临界值为701.1)28(05.0 t,这时 L ln 的参数通过了显着性水平的检验。

2R =0.7963 表明,工业总产值对数值的 79.6%的变化可以由资产合计的对数与职工的对数的变化来解释,但仍有 20.4%的变化是由其他因素的变化影响的。

(五)参数的约束检验 由以上的实验结果可以看出,1 97.0     ,即资产与劳动的产出弹性之和近似为1,表明中国制造业在2000年基本呈现规模报酬不变的状态。因此,进行参数的约束检验时,提出零假设为0H :1    。

如果原假设为真,则可估计如下模型:

1、在 Equation 窗口选择 proc/Specify/Estimate 在弹出的窗口中输入 log(y/l)clog(k/l)如图所示:按确定,所得结果如下:

容易看出,该估计方程通过了 F 检验与参数的 t 检验。

2、对规模报酬是否变化进行的分析 由上面两个实验可以得到 0703.5 URSS,0886.5 RRSS。在原假设为真的条件下有:

 )1 2 31(1)(UU RRSSRSS RSSF28 0703.50703.5 0886.5 =0.1011 在 5%的显着性水平下,自由度为(1,28)的 F 分布的临界值为 4.20。因为 0.1011<4.20,所以不拒绝原假设,表明 2000 年中国制造业呈现规模报酬不变的状态。

3、运用参数约束条件 12 1    对上面假设模型进行检验 打 开 eq01 方 程 对 象 窗 , 点 击ViewCoefficientTestsWaldCoefficientRestrictions…,在 Waldtests窗口设定参数约束条件:c(2)+c(3)=1。再按 OK,结果如下图:

由以上实验结果可知,我们仍然不拒绝原假设,原假设为真,即中国该年的制造业总体呈现规模报酬不变状态。

多元线性回归法 第3篇

关键词:多元线性回归;模型;EVIEWS;软件;工具

中图分类号:G632 文献标识码:B 文章编号:1002-7661(2014)14-327-02

一、与EVIEWS相关的多元线性回归模型的介绍

在理论学习中,学者们可能会为了操作的便捷而采用理性化的模型,这里理想化的模型是指单纯地将所要求的问题作为中心,忽略了其他任何可能存在的外界因素,纯粹地从理论角度解释问题。而在现实问题中,影响整个大局的因素是多样的,每一个因素都不可忽略。考虑到因变量的因子多样化,就要采用多元线性回归模型,使得整体的关系清晰,便于后期的计算统计。

将多元线性回归模型用数学式表达,则可以表示为:

Yi=β0+β2X2+β3X3+β4X4+•••+ε,

也可以笼统地写为:y=Xβ+ε。

在这个数学式中,X代表的是设计矩阵,由实践中实际测得的X的数值所构成;β代表的是参数变量,不同的待测物所具备的参数不同,因此β由实际操作中所需要估计的对象的参数所构成;ε在式中代表的是向量,表示实际操作中的随机误差。

二、建立EVIEWS相关的多元线性回归模型的过程介绍

1、利用所得数据创建图表

建模过程需要相关的测量数据的参与,为了更好的展现EVIEWS软件在数据操纵上的优越性,本文采用部分居民日常生活消费调查数据作为基础进行回归分析,这一数据内容简单,且数据和实际生活联系巨大,是一个贴合日常数据的操作类型。在得到数据后,根据相关规则进行归纳整理并创建相关的影响因子:针对该商品的花销费用(y),商品所标明的价格(x1),家庭平均月收入(x2):

部分居民日常生活消费调查

序号商品所标明的价格x1家庭平均月收入x2针对该商品的花销费用y

115.264500519.20

222.517826566.98

330.059928534.88

435.7310680698.00

535.9912000653.66

638.1012896677.35

739.4613453655.24

849.6716400799.00

955.3218920745.66

1056.8519804726.92

2、利用步骤1的数据图表做出散点图

由于本例子中,变量间的关联性密切,因此可以用绘制散点图的方法来表现自变量和因变量的相关因子间是否有显著的线性关系。由于这个缘故,当所有的数据完备后,就可以根据表中的相关数据画出散点图,根据本例子中的和针对该商品的花销费用有关y相关的因子有商品所标明的价格x1和家庭平均月收入x2两种,由此画出的散点图也因此包含两个,具体操作过程为:将序列y和第一个自变量x1组成一个相关联的群,打开这个群的对话联系界面,在界面上进行点击菜单View/Group/Scatter的操作。这个时候可供选择的图表类型很多,主要有三种,即简单的图表(simple scatter),带回归线的图表(scatter with regression)和带折现的三点图表(scatter with nearest neighbor fit和scatter with kernel fit)。这三种方式得到散点图的过程和方法是不同的,但是最终获得的图像都是相同的,结果如下所示:

由着两个图表可以看出,商品所标明的价格和该类商品的花销费用是成正比的,商品所标明的价格越高,对于这类商品的花销也就越多;而家庭的月收入水平也对该商品的影响巨大,也是成正比关系,家庭的平均月收入越高,该类商品的花销上就越大。这两个图表说明自变量因子商品所标明的价格x1和家庭平均月收入x2和因变量因子针对该商品的花销费用y成线性关系。

3、在变量间成线性关系的前提下建立模型

当散点图中的各个便利之间有着明显的线性关系时,就可以根据这些数据通过估测参数的方式来建立模型。建立模型的方式是多样的,一般采用的有两种快捷菜单执行的方式:一是在界面的主菜单上点击objects/new objects这一命令,执行后就会弹出新的界面,在这个全新的界面上择定目标equation,同时为其重新取名,最后点击ok按钮即可完成。另一种方式点击的命令和方式一不同,这一方式在界面上点击quick/estimate equation命令,然后根据弹出的窗口进一步进行操作,最后得出结果。两者的操作方式是截然不同的,但是原理都类似,主要结合EVIEWS软件的灵活性和指导性,一步步将数据输入并且得到最后的结果。由于操作的数据是相同的,因此最终的结果也是一样的。

在相关的操作完成后就可以得到和上述的数据有关的参数,尽管为预估形式,其数值仍然可以作为线性关系的指标,在后期的预测中可以将其中的预测结果和实际操作最终的数值再进行比对,得到更加合理的结果,为走向的预测得到更准确的数据。根据这一手段,本数据中的参数如下图所示:根据样本的相关阵可以得出,针对该商品的花销费用与家庭的平均月收入和商品所表明的价格的相关系数十分密切,分别高达0.8967304和0.9377928,这也证明了和上图的散点图中同样的道理,即家庭平均月收入水平、商品所标明的价格和针对该商品的花销费用都是成线性相关的,他们的正比系数十分高。由此,可以考虑在此基础上创建二元线性回归模型。

4、在确定数据的高度线性关系的前提下创建OLS图表

为了得到OLS图表,可以对数据进行估计,一般采用的是普通的最小二乘估计方法,可以得到如下所示的图表:

5、当OLS图表创建成功后,可以通过图表中的数值得到估算方程,根据前面的公式,带入相关数据可以得出:

Y=626.5093-9.790570x1+0.28618x2

(40.13010)(3.197843)(0.05838)

t=(15.611195) (-3.061617)(4.902030)

R^2=0.902218r^2=0.874281

6、根据相关数据进行预测

在之前建立多元线性回归模型后,就需要进行观测,而预测相关的趋势和发展也是建立模型的目的之一。所创立的多元线性回归模型是需要判断其优劣程度的,预测的结果的准确与否正是判断模型是否符合标准的方式之一。针对不同的模型,原理仍然是类似的,可以根据创建的模型直接预估各个对象的拟合状况,这一过程仍然可以在界面上得到实现。具体的操作过程是:在界面上点击procs/forecast按键,或者直接在菜单的工具栏一项中选择forecast命令,选择完成后,界面会弹出一个新的对话框,然后可以生成一个名字叫做原自变量名加上f的全新序列形式,如果觉得这类名字不符合要求,操作者也一自行更换名称,方便快捷。除了会生成一个新的序列,在操作过程中,还会产生一个预测图,在预测图中将会和实际操作中的数值进行比较,从而得出该建立的模型的好坏与否。

运用EVIEWS的全部优势都在简单的例子中展现出来,一切数据都由EVIEWS软件操作完成,简便快捷,为繁重的人力计算减轻了压力也提高了准确程度。EVIEWS在实际运用中,避免了繁杂的操作步骤,内容人性化,让初学者在操作中也可以得心应手。它在计量经济中的作用是巨大的,方便了许多学者的操作研究,为学术界的发展做出了贡献。EVIEWS的运用十分广泛,对于经济走势的判断也影响着实际过程中的操作运营,简单的界面展示让一切过程不再枯燥无力,变得形象化而易读化。

参考文献:

[1] 易丹辉.数据分析与EVIEWS应用[M].北京:中国统计出版社,2002.

[2] 宁宝权 甄晓云 占鹤彪.灌木植物在高等级高速公路边坡防护中的重要作用[J].交通建设与管理,2008(10):73-75.

[3] 宁宝权《六盘水师范高等专科学校学报》,2011:3

[4] 陈俊金 陈月娜《中国集体经济》,2009:24

[5] 陈祺琪 李君 梁保松.河南农业大学学报ISTIC PKU,2012:46(4)

[6] 毛敏芳 魏晓平.《沿海企业与科技》,2006:03

多元线性回归法 第4篇

SPSS(Statistical Product and Service Solutions)即统计产品与服务解决方案,是世界上最早的统计分析软件,比Excel的统计分析功能全面,比Matlab简单易用,不需要编程,操作界面友好,输出结果简洁美观。基于以上考虑,根据收集到的瓦斯基础数据,建立多元线性回归模型,利用SPSS软件,计算检验多元线性回归方程,通过预测与实测值相比较,检验该方法的可行性。

1 瓦斯含量影响因素分析

煤层瓦斯含量受瓦斯赋存条件影响,与地质构造、煤层埋深、煤层及其围岩的透气性、煤层厚度、煤层露头、煤层倾角、煤化程度等有关。分析某矿11-2煤层,已知该煤层的瓦斯含量分布不仅与煤层埋深有关,而且与区域地质构造、煤层顶板岩性、煤厚和煤层倾角有密切关系[7]。根据已知井田各钻孔数据资料,在对各定性因素进行量化的基础上,建立多元线性回归预测瓦斯含量模型,采用SPSS逐步法对数据进行分析,排除了相关性差的干扰因素,得到煤层瓦斯含量的最优预测回归方程。瓦斯含量及影响因素统计值见表1。

2 模型建立及分析

逐步回归分析方法是根据自变量对因变量作用的大小逐个引进回归方程,通过反复筛选替代寻找对因变量影响最显著的变量,并将没有影响或者影响很小的变量排除在模型之外,同时建立最优回归方程。

2.1 多元线性回归模型建立

(1)建立数学模型。

在回归分析中,如果有2个或2个以上的自变量,就称为多元回归。事实上,一种现象常常是与多个因素相联系的,由多个自变量的最优组合共同来预测或估计因变量,比只用一个自变量进行预测或估计更有效,更符合实际。因此多元线性回归比一元线性回归的实用意义更大[8]。

多元回归方程的一般形式

undefined

式中,undefined为因变量;xj为自变量(j=1,2,,J);b0为截距(各因变量都为0时);bj为偏回归系数(j=1,2,,J);J为自变量个数。

(2)回归函数检验。

回归函数建立后,需要通过对回归函数的整体检验和对回归系数的逐个检验来判断回归函数作为反映现实的模型是否适用。用于检验回归函数的整体评价指标有决定系数R2、F统计量和标准误差;用于回归系数检验的有t检验和β检验。

2.2 输出结果

用SPSS软件对表1中数据进行线性逐步分析,得到表2表4。

2.3 输出结果分析

由表2表4可看出,用SPSS逐步法建立了2个模型。表2显示,模型2的相关系数为0.957,模型1的相关系数为0.936,相关性都很好;表3列出了已排除的变量,模型1仅底板标高一个因素与瓦斯含量关系显著,模型2中底板标高和主断层距离与煤层瓦斯含量的关系显著;表4显示F统计量分别为113.981和81.413,远大于查表所得的8.53和6.36(置信度0.99),P值均为0,显著性很好。综上可知,建立的模型1和2均可以预测煤层瓦斯含量,且底板标高是11-2煤层瓦斯含量的主控因素。

经SPSS逐步法回归分析得到模型1的回归方程为

Q=-7.265-0.02X1 (2)

模型2的回归方程为

Q=-3.373-0.011X1+0.003X2 (3)

2.4 预测结果分析

将检验数据(表1)代入回归方程(2)和(3)进行检验,将预测的瓦斯含量和实测的瓦斯含量进行对比(图1)可知:模型1计算结果的最大误差为11.58%,平均误差为5.71%;模型2计算结果最大误差为5.33%,平均误差为3.76%,说明经逐步法得到的模型2更接近真实测定值,即与主断层距离也是影响瓦斯含量的重要因素。

3 结论

(1)用SPSS软件逐步法分析勘探阶段或者矿井生产中收集测定的地质及瓦斯资料,可以建立反映瓦斯含量实际情况的多元线性方程,通过计算多元线性方程可以预测瓦斯含量,为瓦斯涌出量预测及煤与瓦斯突出危险区预测提供基础数据。

(2)SPSS逐步法分析实测数据结果显示,11-2煤层瓦斯含量的主控因素是底板标高,同时与主断层距离也是影响瓦斯含量的重要因素。模型2得到的预测值与检验值相差较小,验证了预测方法的正确可靠,具有一定的实用价值。

摘要:通过对某矿11-2煤层瓦斯含量实测数据的整理、分析,建立多元线性回归模型,利用SPSS工具计算多元线性回归方程来预测煤层瓦斯含量。结果显示11-2煤层的瓦斯含量主控因素为底板标高,其与主断层距离也是影响瓦斯含量的重要因素,多元线性回归方程预测值与实测值相近,准确性较高。该方法可为煤层瓦斯含量预测提供一种新途径。

关键词:瓦斯含量预测,多元线性回归,SPSS,主控因素

参考文献

[1]赵继展,韩保山,陈志胜,等.煤层瓦斯含量计算方法探讨[J].中国煤田地质,2006,18(5):22-24.

[2]闫海丰.影响煤层瓦斯含量的多地质因素线性回归分析[J].中州煤炭,2010(7):6-8.

[3]杨德智.回归分析在未开采煤层瓦斯含量预测中的应用[J].能源技术与管理,2008(6):25-26.

[4]王生会.煤层瓦斯含量的主要控制因素分析及回归预测[J].煤炭科学技术,1997,25(9):45-47.

[5]龙威成.线性回归确定煤层瓦斯含量主控因素的方法探讨[J].煤炭工程,2009(3):85-87.

[6]郑飞,王来斌,沈金山,等.基于逐回归分析的瓦斯含量预测研究[J].安徽理工大学学报:自然科学版,2011,31(3):22-26.

[7]吴观茂,吴文金,黄明,等.影响煤层瓦斯赋存规律的多地质因素回归分析研究[J].煤炭工程,2007(11):79-80.

多元线性回归法 第5篇

练习题

3.1为研究中国各地区入境旅游状况,建立了各省市旅游外汇收入(Y,百万美元)、旅行社职工人数(X1,人)、国际旅游人数(X2,万人次)的模型,用某年31个省市的截面数据估计结果如下:

t=(-3.066806)

(6.652983)

(3.378064)

R2=0.934331

F=191.1894

n=31

(1)

从经济意义上考察估计模型的合理性。

(2)

在5%显著性水平上,分别检验参数的显著性。

(3)

在5%显著性水平上,检验模型的整体显著性。

3.2根据下列数据试估计偏回归系数、标准误差,以及可决系数与修正的可决系数:,,,,,3.3

经研究发现,家庭书刊消费受家庭收入几户主受教育年数的影响,表中为对某地区部分家庭抽样调查得到样本数据:

家庭书刊年消费支出(元)Y

家庭月平均收入

(元)X

户主受教育年数

(年)T

家庭书刊年消费支出(元)Y

家庭月平均收入

(元)X

户主受教育年数

(年)T

450

1027.2

793.2

1998.6

507.7

1045.2

660.8

2196

613.9

1225.8

792.7

2105.4

563.4

1312.2

580.8

2147.4

501.5

1316.4

612.7

2154

781.5

1442.4

890.8

2231.4

541.8

1641

1121

2611.8

611.1

1768.8

1094.2

3143.4

1222.1

1981.2

1253

3624.6

(1)

建立家庭书刊消费的计量经济模型;

(2)利用样本数据估计模型的参数;

(3)检验户主受教育年数对家庭书刊消费是否有显著影响;

(4)分析所估计模型的经济意义和作用

3.4

考虑以下“期望扩充菲利普斯曲线(Expectations-augmented

Phillips

curve)”模型:

其中:=实际通货膨胀率(%);=失业率(%);=预期的通货膨胀率(%)

下表为某国的有关数据,表1.1970-1982年某国实际通货膨胀率Y(%),失业率X2(%)和预期通货膨胀率X3(%)

年份

实际通货膨胀率Y

(%)

失业率X2

(%)

预期的通货膨胀率X3(%)

1970

1971

1972

1973

1974

1975

1976

1977

1978

1979

1980

1981

1982

5.92

4.30

3.30

6.23

10.97

9.14

5.77

6.45

7.60

11.47

13.46

10.24

5.99

4.90

5.90

5.60

4.90

5.60

8.50

7.70

7.10

6.10

5.80

7.10

7.60

9.70

4.78

3.84

3.31

3.44

6.84

9.47

6.51

5.92

6.08

8.09

10.01

10.81

8.00

(1)对此模型作估计,并作出经济学和计量经济学的说明。

(2)根据此模型所估计结果,作计量经济学的检验。

(3)计算修正的可决系数(写出详细计算过程)。

3.5某地区城镇居民人均全年耐用消费品支出、人均年可支配收入及耐用消费品价格指数的统计资料如表所示:

年份

人均耐用消费品支出

Y(元)

人均年可支配收入

X1(元)

耐用消费品价格指数

X2(1990年=100)

1991

1992

1993

1994

1995

1996

1997

1998

1999

2000

2001

137.16

124.56

107.91

102.96

125.24

162.45

217.43

253.42

251.07

285.85

327.26

1181.4

1375.7

1501.2

1700.6

2026.6

2577.4

3496.2

4283.0

4838.9

5160.3

5425.1

115.96

133.35

128.21

124.85

122.49

129.86

139.52

140.44

139.12

133.35

126.39

利用表中数据,建立该地区城镇居民人均全年耐用消费品支出关于人均年可支配收入和耐用消费品价格指数的回归模型,进行回归分析,并检验人均年可支配收入及耐用消费品价格指数对城镇居民人均全年耐用消费品支出是否有显著影响。

3.6下表给出的是1960—1982年间7个OECD国家的能源需求指数(Y)、实际GDP指数(X1)、能源价格指数(X2)的数据,所有指数均以1970年为基准(1970=100)

年份

能源需求指数Y

实际GDP指数X1

能源价格指数X2

年份

能源需求指数Y

实际GDP指数X1

能源价格指数X2

1960

1961

1962

1963

1964

1965

1966

1967

1968

1969

1970

1971

54.1

55.4

58.5

61.7

63.6

66.8

70.3

73.5

78.3

83.3

88.9

91.8

54.1

56.4

59.4

62.1

65.9

69.5

73.2

75.7

79.9

83.8

86.2

89.8

111.9

112.4

111.1

110.2

109.0

108.3

105.3

105.4

104.3

101.7

97.7

100.3

1972

1973

1974

1975

1976

1977

1978

1979

1980

1981

1982

97.2

100.0

97.3

93.5

99.1

100.9

103.9

106.9

101.2

98.1

95.6

94.3

100.0

101.4

100.5

105.3

109.9

114.4

118.3

119.6

121.1

120.6

98.6

100.0

120.1

131.0

129.6

137.7

133.7

144.5

179.0

189.4

190.9

(1)建立能源需求与收入和价格之间的对数需求函数,解释各回归系数的意义,用P值检验所估计回归系数是否显著。

(2)

再建立能源需求与收入和价格之间的线性回归模型,解释各回归系数的意义,用P值检验所估计回归系数是否显著。

(3)比较所建立的两个模型,如果两个模型结论不同,你将选择哪个模型,为什么?

练习题参考解答

练习题3.1参考解答

有模型估计结果可看出:旅行社职工人数和国际旅游人数均与旅游外汇收入正相关。平均说来,旅行社职工人数增加1人,旅游外汇收入将增加0.1179百万美元;国际旅游人数增加1万人次,旅游外汇收入增加1.5452百万美元。

取,查表得

因为3个参数t统计量的绝对值均大于,说明经t检验3个参数均显著不为0,即旅行社职工人数和国际旅游人数分别对旅游外汇收入都有显著影响。

取,查表得,由于,说明旅行社职工人数和国际旅游人数联合起来对旅游外汇收入有显著影响,线性回归方程显著成立。

练习题3.3参考解答

(1)建立家庭书刊消费的计量经济模型:

其中:Y为家庭书刊年消费支出、X为家庭月平均收入、T为户主受教育年数

(2)估计模型参数,结果为

(49.46026)(0.02936)

(5.20217)

t=

(-1.011244)

(2.944186)

(10.06702)

R2=0.951235

F=146.2974

(3)

检验户主受教育年数对家庭书刊消费是否有显著影响:

由估计检验结果,户主受教育年数参数对应的t

统计量为10.06702,明显大于t的临界值,同时户主受教育年数参数所对应的P值为0.0000,明显小于,均可判断户主受教育年数对家庭书刊消费支出确实有显著影响。

(4)本模型说明家庭月平均收入和户主受教育年数对家庭书刊消费支出有显著影响,家庭月平均收入增加1元,家庭书刊年消费支出将增加0.086元,户主受教育年数增加1年,家庭书刊年消费支出将增加52.37元。

练习题3.5参考解答

(1)

建立该地区城镇居民人均全年耐用消费品支出关于人均年可支配收入和耐用消费品价格指数的回归模型:

(2)估计参数结果

由估计和检验结果可看出,该地区人均年可支配收入的参数的t检验值为10.54786,其绝对值大于临界值;而且对应的P值为0.0000,也明显小于。说明人均年可支配收入对该地区城镇居民人均全年耐用消费品支出确实有显著影响。

多元线性回归法 第6篇

摘 要:多元线性回归模型是根据得到的若干有关变量的一组数据,寻找因变量与多个自变量之间的一个函数,使这个函数对那组数据拟合的最好。然后利用方差分析方法对模型误差进行分析,对拟合的优劣给出评价,本文利用此种方法对荒漠区不同干扰下植物地上生物量的变化趋势进行研究,对实际的生态环境提出一些合理建议。

关键词:多元线性回归;数据拟合;荒漠区植物;生物量

1 概述

生态研究与资源利用是分不开的,荒漠区是我国典型的温带荒漠和干旱脆弱生态系统,生态环境条件十分严酷,其中荒漠区的植物生物量在荒漠区域中扮演着重要的角色,荒漠区中的植物生物量不仅对于动物的生存有影响,对于荒漠区中的生态环境也有影响。荒漠植被类型和条件与植物量之间存在关系。植物的高度盖度密度是影响植物量的因子,在不同的干扰下,这种相关性与关系程度也存在一定的差异。因此对于荒漠区植物生物量的研究具有重要的意义。

本文通过对[1]中数据进行拟合分析,发现不同植物的植物量与其高度盖度密度的关系符合回归模型[2],由此可以通过回归分析建立相应的模型并引入相关系数[3]进行求解。在求出生物量对高盖密的回归模型后,必须考察一下是否真的能由所得的模型来较好的拟合生物量,用模型能否较好的反映或解释生物量的取值变化?对这些,都必须予以正确的评估和分析。判定系数在这里就是一个很好地指标:一方面它可以从数据变异的角度指出可解释的变异占总变异的百分比,从而说明回归直线拟合的优良程度;另一方面,它还可以从相关性的角度,说明原因变量生物量y与拟合变量的相关程度,从这个角度看,拟合变量与原因变量的相关度越大,拟合直线的优良度就越高。判定系数是指可解释的变异占总变异的百分比,用R表示,它的范围在0到1之间;当R2=1时,原数据的总变异完全可以由拟合直线的变异来解释,即拟合点与原数据完全拟合;当R2=0时,回归方程完全不能解释原数据的总变异,生物量的变异完全由与高盖密无关的因素引起。

2 多元线性回归模型的建立

[(1)]

式中β0,β1,β2,β3都是与x1,x2,x3无关的未知参数,其中β0,β1,β2,β3称为回归系数。

根据[1]中过牧区7月份草本植物的88个数,(y1,xi1,xi2,xi3)(i=1,2,...,22)

多元线性回归法 第7篇

关键词:多元线性回归,环保人才需求量预测,鄱阳湖生态经济区,SPSS 22.0

2012年12月12日, 鄱阳湖生态经济区经国务院批准上升为国家战略。在党的十八大精神的引领下, 江西省确定了鄱阳湖生态经济区生态文明、经济、政治、文化、社会“五位一体”的发展战略。“既要金山银山, 也要绿水青山”, 随着鄱阳湖生态经济区规模不断扩大和充实, 环保投入资金的持续增长, 环境法律法规的日益健全和严厉, 对环保专业人才的需求量也逐渐增大。鄱阳湖生态经济区要实现经济与环境保护协调发展, 制定适宜的环保科技人才计划是至关重要的。基于这一点, 对鄱阳湖生态经济区的环保人才需求量进行预测是很有必要的, 而其首要任务是建立适宜的预测指标因子集。

影响鄱阳湖生态经济区环保人才需求量的因素有很多, 包括区域经济的、社会的、科技的, 以及区域环保状况等。这些因素的重要性也各不相同, 因此, 必需采用适宜的方法对其进行筛选。然而, 筛选的方法很多, 常见的有Delphi法, 线性相关法和回归分析法和神经网络法等[1,2,3,4,5]。与其他筛选方法相比, 多元线性回归法具有模型结构简单, 样本量需求小, 泛化能力强, 便于获得全局最优解等优点, 且能有效避免神经网络法局部最优的问题[6,7,8,9]。因此, 我们选择运用多元线性回归法对鄱阳湖生态经济区环保人才需求量预测指标因子进行筛选。

1 鄱阳湖生态经济区环保人才需求预测指标体系的构建

影响鄱阳湖生态经济区环保人才需求量预测的因素很多, 不仅要考虑区域经济发展对新增环保人才的需求, 也要考虑社会发展和区域环境状况对环保人才的需要, 同时还要兼顾科技投入等。在综合分析的基础上, 我们选取鄱阳湖生态经济区经济发展、社会发展、科技发展和环境状况四个大类为一级指标, 在此基础上精心选取二级指标构成初始预测指标集合, 具体如图1所示。

2 鄱阳湖生态经济区环保人才需求预测指标体系的筛选

运用SPSS22.0, 先采用逐步回归法, 确定各指标体系的重要性, 剔除对预测因子影响显著性较小的指标, 然后将经过初步筛选后的指标全部导入, 进行回归分析, 在参数选项上, 回归系数选择估计 (E) , 残差选择Durbin-Watson和个案诊断, 并选择模型拟合度 (M) , R方变化 (S) 和共线性诊断, 运行结果如表1所示。

由表1可知, 相关系数最高的5项指标分别为:科技三项费用、科学支出、固定资产投资、城镇居民人均消费性支出、第二产业生产总值。对以上5项指标进一步回归分析, 结果如表2所示。

3 结果与讨论

结束语

采用多元回归分析法, 确定了鄱阳湖生态经济区环保人才数量相关系数最高的科技三项费用、科学支出、固定资产投资、城镇居民人均消费性支出、第二产业生产总值等5项指标, 适宜作为鄱阳湖环保人才需求的预测指标。同时, 研究发现, 与鄱阳湖环保人才需求相关性较强的污染治理资金使用额未能列入预测指标体系, 表明鄱阳湖生态经济区环保资金投入尚不能与当前经济发展规模相匹配, 未来应进一步加大鄱阳湖生态经济区环保资金的投入量。

参考文献

[1]楼英伟.高等教育人才供求结构预测研究——以某沿海省为分析对象[J].辽宁教育研究, 2005 (09) :29-31.

[2]孙林岩.地区人才需求的宏观预测[J].预测, 1988 (03) :45-47.

[3]朱树婷.区域科技人才需求预测模型研究[D].天津大学, 2008.

[4]国家教委教育规划研究室.地区人才需求预测和教育规划[J].辽宁高等教育研究, 1986 (S2) :1-7.

[5]田翔宇.产业集群区域人才需求预测的组合模型研究[D].中南大学, 2009.

[6]熊晓熙.人才需求与专业建设关系的研究[D].长沙理工大学, 2012.

[7]李波辉.2010-2020年珠三角制造业人才需求预测与广东高校学科建设的研究[D].华南理工大学, 2011.

[8]毛磊, 李成标.湖北省科技人才分析与预测[J].科技信息 (学术研究) , 2007 (23) :1-5.

多元线性回归法 第8篇

多元线性回归分析是一种重要和具有广泛应用价值的数据处理方法, 主要用来测度具有相关关系的变量之间数量变化的一般关系, 以便运用估计或者预测的统计方法。目前, 多元线性回归在很多领域, 比如经济、管理等领域得到了广泛的应用。但目前的一些实现方法, 在功能、可视性、易用性、系统性、稳健性、程序的适应性以及运行速度等方面都还有待探索。鉴于此, 笔者根据多元线性回归的原理和实现方法, 利用Delphi6.0和ADO数据引擎开发了一个多元线性回归数据处理系统, 用来对大型数据进行回归处理, 相比其他的软件, 该程序具有提高了数据处理的高效性、针对性和可操作性等特点, 并且操作简单明了, 上手容易。

二、系统设计

本系统包括以下四个模块:数据获取、数据及变量处理、回归分析、结果输出。主要的工作内容是通过数据库或者Excel获得基本数据, 然后对基本数据进行处理, 存放在数据库中, 接着利用最小二乘法进行线性回归, 最后将结果进行保存。

根据以上分析, 本系统的总体结构如图1所示。

根据回归计算的要求及本程序的特点可以得到具有二范式的数据库概念模型, 来满足系统开发所需要的性能, 达到设计要求。由于每次回归运算解释变量的数目不一定相同, 本系统采用动态建立数据表, 及动态增减变量的方法。

三、程序实现

1. 系统界面。

系统界面如图2所示, 为全中文图形用户界面。GUI集成度高, 将最重要的回归分析部分的数据处理、回归结果, 以及回归图形等用选项卡列在程序的主界面上。

2. 模块功能和程序实现。

(1) 数据输入。在进行多元线性回归之前, 首先要建立一个多元回归项目。可以通过点击文件菜单的新建回归项目菜单或者直接双击主界面上的表格直接输入数据来完成该操作。回归项目建立完成后, 可以在主界面的Spreadsheet里面输入数据。另外, 还可以通过点击“文件”菜单上的“获取外部数据”菜单项, 从Excel文件获取数据。 (2) 数据处理。在完成数据的输入之后, 可以在主界面上的Spreadsheet里面对不符合要求的样本进行剔除。通过点击主界面上右下角的“剔除”、“添加”按钮可以进行剔除和添加变量的操作。对变量进行计算是本系统的特色之一, 这样可以将部分非线性回归转化成线性回归。在表达式栏输入相应的公式, 就能对变量进行处理。目前, 本系统支持包括加减乘除、求余、指数运算、三角函数、对数运算、反三角函数及定积分等常用计算。 (3) 回归分析。本系统采用最小二乘法对模型参数进行估计。在“操作”菜单点击“开始回归”或者在工具栏点击“开始回归”按钮就能完成相应的操作。 (4) 结果输出。本程序产生的结果分成两个部分, 一部分是一般的回归结果, 将在下文详细说明;另一部分为图形结果, 输出的是各个自变量和因变量的关系图以及差方图, 这些图形可以帮助我们直观的理解线性回归的结果。 (5) 其他功能。本程序还能对现存的回归项目进行管理, 并对其数据库做相应的操作, 比如修改、删除等。另外, 本程序还可以将回归结果保存成Excel表格的形式, 以便于日后查看回归结果。

四、应用实例

下面用一个实例来说明本系统的使用过程、数据处理结果以及结果的解读。首先, 建立一个名为“TEST”回归项目, 来研究某省工业产值 () 、农业产值 () 、固定资产投资 () 对运输业产值 () 的影响。点击主界面上的“开始回归”按钮, 输出如下回归结果。

本软件的回归结果由回归统计、方差分析、回归参数、残差表和DW检验等五部分组成。回归统计部分给出了相关系数、测定系数、校正测定系数、标准误差和样本数目等。在表中与之对应的分别是Multiple R、R Square、标准误差和观测值。

在第二部分方差分析中, df、SS、MS和F格列分别代表自由度、误差平方和、均方差和F值。

第三部分回归参数表中包括回归模型的截距、斜率及其有关的检验参数。第一列对应的是回归模型的系数, 由此可以建立回归模型:;第二列为回归系数的标准误差, 误差值越小, 表明参数的精确度越高;第三列t Stat对应的是统计量t值用于对模型参数的检验。

第四部分为残差输出结果。残差输出中包括观测值序号 (第一列, 用i表示) , 因变量的预测值 (第二列, 用i表示) 以及残差 (第三列) 。由于该回归的样本较多, 限于篇幅上表仅列出三个样本点。

回归结果的最后一部分为DW检验, 用于检验随机误差项具有一阶自回归形式的序列相关问题。

五、结论

本文采用Delphi和ADO数据引擎开发了一个从数据的收集整理和处理, 到回归计算以及回归结果的输出和可视化结果的多元线性回归系统。该系统不仅能完成线性回归, 还能通过对变量进行运算, 完成一部分非线性回归。

摘要:根据多元线性回归的原理和实现方法, 采用Delphi和ADO数据引擎开发出了一个集数据采集、样本剔除、统计检验与预测功能于一体的多元线性回归系统。该系统操作简单、功能强大, 具有很强的鲁棒性和适应性, 可以方便地进行多元线性回归和一部分非线性回归, 具有广泛的应用价值。文章对系统的设计与构建作了详细的阐述, 并用一个实例对该系统的使用及回归结果的解读进行了详细说明。

关键词:多元线性回归,非线性回归,数据处理,系统设计

参考文献

[1]贾俊平:统计学[M].北京:清华大学出版社, 2004

多元线性回归法 第9篇

随着计算机技术尤其是多媒体技术和数字图像处理及分析理论的成熟,图像作为更直接更丰富的信息载体,正在成为越来越重要的研究对象。昆虫是生物类群中物种最丰富、数量最多的一类,尤其是一些农林害虫对农林业生产形成了很大威胁,因此,昆虫成为与人类密切相关的生物类群之一。研究昆虫图像的处理和分析对昆虫形态学、昆虫生态学以及昆虫测报所需的田间抽样调查都具有十分重要的意义。昆虫图像的处理和分析要解决的第一个问题就是数字图像的边缘检测和图像分割。因为数字图像通常是包含多个物体的结果,对昆虫图像的处理和识别来说,目标在于图像中的昆虫部分,即以昆虫部分作为前景,而将寄主植物作为背景。为了识别和分析目标,需要将这些有关区域分离出来,在此基础上才能对目标进一步地利用。这个过程即所谓的图像分割[1]。

灰度和二值化[2]、平均值分割算法[3]、迭代阈值分割算法[4]和中值滤波[5,6]等是早期科研人员采用的昆虫识别方法。近年来,国内外学者研究了基于机器视觉的昆虫识别方法,主要包括数学形态学方法[7,8]、二叉树方法[9]、人工神经网络方法[10,11]和变分水平集方法[12]等。其中,C-V模型是变分水平集的经典模型,也是目前应用广泛的图像分割模型,在医学图像分割中取得了良好的应用效果,但该模型应用于昆虫图像分割效果不太理想。为此本文提出一种基于RGB三色板的多元线性回归的昆虫图像分割方法,该方法能够有效地将目标与背景分割开来,达到理想的分割效果。

1线性回归算法概述

线性回归是利用数理统计中的回归分析,来确定两种或两种以上变量间相互依赖的定量关系的一种统计分析方法之一,它在生物、医学、工业、农业、经济以及物理和自然等领域运用十分广泛。 根据自变量的个数,可以把线性回归分为一元线性回归和多元线性回归。

一元线性回归是描述两个变量之间相互联系的最简单的回归模型,它只包括一个自变量和一个因变量,且二者的关系可用一条直线近似表示。一元线性回归的数学模型是:

Y=β0+β1X+ε (1)

式(1)中因变量Y由两个部分描述:一部分是由于X的变化引起Y线性变化的部分,即β0+β1X,其中β0和β1是未知参数,称为回归系数;另一部分表示其他随机因素的影响,记为ε

线性回归算法最初应用于图像处理中时通常选用灰度图像或彩色图像三色板中的一个色板的像素信息建立回归模型。然而,三色板像素信息更有利于表达图像的完整信息,这时采用一元线性回归就有较大的局限性,因此需要借助多元线性回归模型。

多元线性回归研究一个因变量和多个自变量之间数量上相互依存的线性关系。多元线性回归方程的模型是:

与一元线性回归相似,β0是常数项,β1,β2,,βm称为偏回归系数。βi(i=1,2,,m)表示在其他自变量保持不变的条件下,自变量Xi改变一个单位时因变量的平均改变量。ε为随机误差,又称残差,它表示Y的变化中不能由自变量解释的部分。

多元线性回归在实际应用中具有更重要的意义,本文提出的昆虫图像分割方法就是采用多元线性回归的数学模型,结合彩色图像三色板像素信息对图像进行分割,取得了良好的效果。

2基于RGB三色板的多元线性回归算法

2.1RGB三色板多元线性回归的数学模型

根据式(2)的多元线性回归的数学模型,结合彩色图像中的RGB三色板信息,建立彩色图像的RGB三色板多元线性回归模型如下:

其中,RGB分别表示彩色图像的红色板、绿色板和蓝色板像素信息。图像的RGB三色板信息及其线性拟合示意图如图1所示。

图1中星点表示实际RGB三色板像素值,非星点表示线性回归拟合后RGB三色板像素值。从图中可以看出,(a)中像素分布零散;(b)中则拟合效果良好。三色板像素的拟合效果与回归模型中参数β的设定有关。

2.2RGB三色板线性回归模型的参数设定

图像的像素信息通常采用二维坐标表示,即假设I(i , j)表示图像I的第(i , j)个像素,R(i , j)、G(i , j)、B(i , j)分别代表像素I(i , j)的红、绿、蓝三个分量。将这些像素信息代入式(3)中,RGB三色板的多元线性回归模型转换为:

为了计算方便,图像处理中通常将二维向量转换成一维向量, 即使用变换:

R(i,j)R(m(j-1)+i) i=1,,m j=1,,n

则式(4)再次转换为如下形式:

R(j)=β0+β1G(j)+β2B(j) (5)

其中R(j)、G(j)、B(j)分别代表红色板、绿色板和蓝色板像素的一维信息,与式(2)多元线性回归模型中的XY变量相对应,则式(5)的变量形式为:

X=[1G(1)B(1)1G(2)B(2)1G(mn)B(mn)]Y=[R(1)R(2)R(mn)]Τ

系数矩阵为:

β=[β0β1β2]Τ

根据矩阵理论相关知识可得线性回归参数的求解公式为:

β=(XTX)-1XTY (6)

由于图像的三色板信息已知,因此可根据所选取区域的RGB信息确定β参数,建立整幅图像的线性回归模型,从而将具有同样背景信息的图像分割出来,得到昆虫的目标图像。

以婪步甲成虫图像为例,说明通过选取背景区域确定线性回归参数的过程。

从经过预处理的婪步甲成虫图像的背景样本中任意采集一块5050的像素块,如图2所示,其中(a)为原图,(b)为从背景中选取的像素块样本。

根据选取的像素块,利用式(6)计算机回归模型的参数如下:

β=inv(XX-1e-10eye(u,v))XY (7)

其中β为所求的线性回归参数,

β=[β0β1β2]

;inv()是矩阵求逆函数;X是由1和所取像素块的GB值构成的矩阵;X′是X的转置矩阵;eye(u,v)是uv列矩阵,且主对角线为1,其它元素为0;Y是所取像素块的R值。

根据所选取像素块的像素信息计算出β参数值,将其应用于式(5),再实现对整个图像的分割,利用式(5)的分割结果如图3(a)所示。

实际应用中,像素块的选取依据具体图像的背景信息而定,背景颜色越单纯所需像素块数越少,反之则需要设置多个像素块,以包含更全面的图像信息。样本信息越多越有利于图像目标区域的分割,但同时也加大了工作量,对复杂背景图像选择合适数量的像素块不是容易的事,对此我们引入范数对式(4)的模型进行优化。

2.3RGB三色板线性回归模型的范数优化

式(4)的回归模型是取图像像素的RGB三色板信息建立线性关系,由于像素信息的取值范围较大,有可能导致回归模型的线性拟合发生较大偏差,对三色板信息进行取范数规范化处理可以解决这个问题。

R(i , j)、G(i , j)、B(i , j)的规范化形式如下:

则式(5)的多元回归模型转换为:

利用式(11)分割婪步甲成虫图像的效果如图3(b) 所示。

对比图3(b)和(a)可知,进行范数优化后的算法可以去掉多余的阴影,更好地实现目标提取。

3算法的实现

3.1算法实现步骤

综合以上分析,基于RGB三色板多元线性回归算法的图像分割具体步骤如下:

Step1 图像预处理 首先将昆虫图片进行统一的亮度处理,使图片不至于过亮或者过暗。

Step2 背景样本块选择 从图像的背景信息中选择有代表性的区域作为样本块,以求取回归参数。由于不同图像的背景信息不同,单纯一色的背景也可能由于色度深浅不均带来误差,因而提取1块像素块作为回归模型样本具有较大的局限性。实验证明,在昆虫图像分割中,选择4-7块如图2(b)所示的样本块效果较好。

Step3 建立回归模型 根据样本块信息按照式(6)计算回归参数,建立式(5)的图像RGB多元线性回归模型。

Step4 求取RGB像素范数 根据式(8)-式(10),计算三色板像素的范数,构建优化模型,见式(11)。

Step5 昆虫图像提取 利用优化模型,实现昆虫图像分割。

3.2算法程序设计

根据该算法的实现步骤,软件编程实现基于RGB三色板多元线性回归算法的图像分割的核心代码如下。

4实验效果分析

算法在Windows XP系统下,利用Matlab实现。Matlab是以复杂矩阵作为基本编程单元的一种程序设计语言,它提供了各种矩阵的运算与操作,并有较强的绘图功能。为了验证算法的有效性,选取3张经过预处理的昆虫图片,图片来源于课题组的科研数据库。这3张图片的大小分别为9.81MB、841KB、294KB,且它们的水平分辨率和垂直分辨率均为96dpi。分别采用本文提出的RGB多元线性回归算法和C-V模型算法对所选图片进行分割,效果如图4-图6所示。

图4显示两种算法的分割效果差不多,本文提出的算法计算速度比C-V模型更快;图5和图6显示本文算法分割效果优于C-V模型的分割,C-V模型分割的边界处理效果不是太好,本文算法在分割这两幅图像中分别选择了4块色板和7块色板做样板,取得了较好的分割效果。

表1为本文方法和C-V方法就分割结果的迭代次数和分割时间进行比较。从表中可以看出本文方法无论从速度方面还是迭代次数方面都具有一定的优越性。

5结语

本文介绍了基于RGB三色板的多元线性回归算法及其在昆虫图像分割中的应用,讨论了RGB三色板多元线性回归模型的参数设定方法,并利用范数对像素信息进行规范化处理,

优化了单纯依靠RGB色板信息的多元线性回归模型。实验和实例对比证明,本文提出的算法能较好地实现昆虫图像分割。

在实际的农林虫害防治中,运用本文算法能够很好地识别害虫,将其中的目标区域(害虫)分离出来,从而实现仅对害虫进行药剂喷洒,防止了由于化学药剂的大面积使用而造成的环境污染问题。

本文算法的不足是目前本算法更适合于背景颜色较少、背景色彩分布较均匀的昆虫图片,下一步将针对各种复杂背景图片进一步优化和完善算法,以扩大算法的应用范围。

参考文献

[1]于新文,沈佐锐.昆虫数字图像的分割技术研究[J].农业工程学报,2001,17(3):137-141.

[2]潘梅森,荣秋生.基于SOFM神经网络的图像融合的二值化方法[J].光学精密工程,2007,15(3):99-104.

[3]于新文,沈佐锐.几种图像分割算法在棉铃虫图像中的应用[J].中国农业大学学报,2001,6(5):69-75.

[4]付峰,应义斌.生物图像阈值分割方法的研究[J].浙江大学学报,2003,29(1):108-112.

[5]祁广利.农业机器视觉技术及其应用[J].陕西农业科学,2004(5):121-128.

[6]王建卫.彩色图像的中值滤波算法的改进与应用[J].哈尔滨商业大学大学报:自然科学版,2006,22(4):67-69.

[7]马骏,王建华.一种基于数学形态学的植物病虫识别方法[J].深圳大学学报:理工版,2004,21(1):72-75.

[8]黄小燕,郭勇,赵太飞.数学形态学的储粮害虫彩色数字图像分割[J].计算机测量与控制,2003,11(6):467-469.

[9]林开颜,吴军辉,徐立鸿.彩色图像分割方法综述[J].中国图象图形学报,2005,10(1):1-11.

[10]邱道尹,张红涛.基于机器视觉的储粮害虫智能检测系统软件设计[J].农业机械学报,2003,34(2):83-85.

[11]赵汗青,沈佐锐,于新文.数学形态特征应用于昆虫自动鉴别的研究[J].中国农业大学学报,2002,7(3):38-42.

多元线性回归法 第10篇

关键词:旅游消费,多元线性回归,实证分析

一、背景

20世纪30年代以来, 随着经济增长和居民收入水平的提高, 全球旅游业急剧扩张, 逐步成为世界上发展前景广阔, 产业规模庞大的新兴产业之一。根据世界旅游组织统计, 国际旅游业已经成为国际服务贸易中交易额最大的产业之一, 同时旅游业也成为世界上最大的产业, 为全球经济发展做出了不可忽视的贡献。

近年来, 随着我国经济的迅速发展和人们生活水平的不断提高, 我国旅游产业规模不断增大, 出游人数和旅游总收入都不断上升, 旅游业呈现出蓬勃发展趋势。旅游业是高度敏感型产业, 要受到包括政治、经济、文化等各方面因素的影响, 通过调整上述因素, 可以为发展旅游业提供更好的环境, 从而更好地促进我国旅游业持续健康发展。本文将根据旅游经济学的相关理论, 寻找影响我国旅游消费数量的因素, 收集我国历年旅游行业统计数据及其影响因素的统计数据, 再运用计量经济学方法, 对影响我国旅游业消费的因素进行分析, 最后找出影响我国旅游消费数量的显著因素。

从图1中我们可以发现1994年以来旅游人数和旅游收入不断上升, 尤其是2004年以来旅游业处于一个高速发展的时期。

二、模型设定及应用的数据

通过对国内旅游市场的分析, 我们认为有如下潜在因素会对旅游消费产生影响:旅游人数X1, 城镇居民人均旅游花费X2, 农村居民人均旅游花费X3, 国内生产总值X4, 居民消费价格指数 (1978=100) X5, 城乡居民人民币储蓄定期与活期存款总计的年底余额X6。设定计量模型为:

其中, Y为旅游消费 (即旅游收入) 。

模型采用的数据如表1所示。

三、模型数据分析

利用Eviews软件, 采用表1数据对该模型进行OLS回归, 结果如表2所示。

从表2的结果我们可以发现, 该模型的可决系数R2=0.998947、 =0.998045, 拟合程度很高;DW≈2通过检验, 方程不存在自相关;F检验值1107.152显著, 模型整体通过检验;X1、X2、X3、X5、的Prob (T-statistic) 均小于0.05, 通过t检验, 但X4 (GDP) 的Prob (T-statistic) =0.4244, 未通过t检验, GDP与旅游消费关系度不大, X6 (CX) 的Prob (T-statistic) =0.1229, t检验的效果也不是太显著。

注:LS:旅游收入 (亿元) , RS:国内旅游人数 (百万人次) , CZ:城镇居民人均旅游花费 (元) , NC:农村居民人均旅游花费 (元) , GDP:国内生产总值 (亿元) , ZS:居民消费价格指数 (1978=100) , CX:城乡居民人民币储蓄定期与活期存款总计的年底余额 (亿元)

因而在原有模型的基础上剔除X4 (GDP) , 再一次进行OLS回归, 结果如表3所示。

从表3的结果我们可以发现, 该模型的可决系数R2=0.998839、 =0.998114, 拟合程度很高;DW≈2通过检验, 方程不存在自相关;F检验值1376.757显著, 模型整体通过检验;X1、X2、X3、X5、的Prob (T-statistic) 均小于0.05, 通过t检验, X6 (CX) 的Prob (T-statistic) =0.0723, 也基本可以接受。

综上所述, 模型的结果为:

四、模型结论分析

从上面的测算的模型可以知道:国内旅游人数每增加1百万人次, 旅游消费就会增加5.217062亿元;城镇居民人均旅游花费每增加1元, 旅游消费就会相应增加4.857372亿元;农村居民人均旅游花费每增加1元, 旅游消费就会相应增加3.024277亿元;居民消费价格指数 (1978=100) 每增加1个指数, 旅游消费就会减少5.720355亿元;城乡居民人民币储蓄定期与活期存款总计的年底余额每增加1亿元, 旅游消费就会减少0.005887亿元。由此我们可以发现, 国内旅游人数、城镇居民人均旅游花费、农费价格指数对旅游消费的影响比较大, 而城乡居民人民币储蓄定期与活期存款总计的年底余额则相对影响较小, GDP对于旅游消费并没有很大的直接联系。在这之中城镇居民人均旅游花费比农村居民人均旅游花费对旅游消费影响要显著。

参考文献

[1]、达摩达尔.N.古扎拉蒂.计量经济学基础[M].中国人民大学出版社, 2005.

[2]、李子奈, 潘文卿.计量经济学[M].高等教育出版社, 2008.

[3]、于俊年.计量经济学软件:EViews的使用[M].对外经济贸易大学出版社, 2006.

[4]、蒋存虎.关于我国入境旅游收入的实证分析[J].商场现代化, 2006 (10) .

[5]、王占祥.我国国内旅游收入的影响因素分析[J].商场现代化, 2008 (12) .

[6]、牛利民, 杨开福, 朱道静.影响我国旅游消费的经济因素分析[J].资源开发与市场, 2008 (24) .

[7]、张玮.影响我国旅游收入因素的实证分析[J].太原城市职业技术学院学报, 2007 (5) .

多元线性回归法 第11篇

关键词 生活废水;非线性;预测

中图分类号 F224.0 文献标识码 A

Prediction of Domestic Waste Water Missions in Jiangsu

Province Based on the Nonlinear Prediction Model

LI Lei1,2,LIU Xue1,LIU Jie1

(1. School of Business, Jiangnan University,Wuxi,Jiangsu 214122,China;

2.Research Center for Jiangsu environment and Development,Nanjing,Jiangsu 210037,China)

Abstract This paper established a three-dimensional non-linear prediction model on domestic waste water discharge according to the per capita GDP, per capita domestic water consumption and the data of domestic wastewater discharge from 1999 to 2009 in Jiangsu Province.And the analysis proves the model has a high fitting precision. Based on the prediction data, the amount of domestic wastewater discharge of Jiangsu Province will reach 6.685 billion tons in 2020, more than two times the discharge in 2009, which imposes enormous pressure on urban environment. At last, some policy recommendations were offered as references to the relevant departments.

Key words domestic waste water; nonlinear; prediction

1 引言

水资源是人类社会可持续发展的基础,根据水利部的统计数据,按目前的正常需要和不超采地下水,正常年份我国缺水总量将近400×108 m3,有400余座城市供水不足,其中110座城市严重缺水.同时,从我国未来发展趋势看,由于城镇人口和城镇人均用水量的不断增加,未来城镇地区水资源供需矛盾将越来越突出,而且我国的生活废水排放量也在不断增长[1].日益严重的生活废水排放已经成为我国水污染加剧的主要原因之一,并在某种程度上造成了比工业更为严重的影响 [2].影响生活废水排放量的因素较多.往往很难从理论上找到预测的机理模型.近年来,国内外学者曾采用了一些预测方法,对生活废水排放量行了一些预测研究.如王亮等人应用的粒子群算法的预测模型[3]、阎伍玖等人应用的等维灰数递补动态模型[4]、Ahmed Gamal El-Din等人应用的神经元网络模型[5],以及Yoshiaki Tsuzuki等人应用的软干预预测模型 [6].这些研究成果为解决生活废水排放量的预测问题,提供了一些方法和手段,具有一定的参考价值.本文采用了多元统计分析方法,为了表明变量之间的交互作用,采用非线性的方式,并将经济增长和居民用水量作为影响生活废水排放量的主要因素,根据1999 -2009年中国统计年鉴数据,构建了非线性预测模型,为预测未来生活废水排放量提供了经验模型.

2 样本的选取

江苏位于长江、淮河下游,是长江三角洲地区的重要组成部分,是中国人口密度最高的省份之一,境内平原辽阔.土地肥沃,物产丰富,江河湖泊密布,五大淡水湖中的太湖、洪泽湖在此横卧,历史上素有“鱼米之乡”的美誉.在过去的11年中江苏省的经济高速发展,人年均GDP增长3 095元,几何增速13.9%,高于同期全国的平均水平12.27%.2010年地区生产总值(GDP)更是达到40 903亿元,人均地区生产总值达到7 700美元,同期生活废水排放量也从13.5亿吨上升为26.76亿吨,十年间翻了一番,每年新增生活废水排放量1.2亿多吨,年均几何增长率高达6.4%,高于同期全国的生活废水排放的增速5.17%.正是因为江苏省经济发达,河流广布加之人口密度大,生活废水排放量增长快,所以其在研究生活废水排放问题上十分具有代表性.

3 模型的建立与分析

3.1 变量的选取与数据处理

由于影响生活废水排放的因素较多,从预测生活废水排放量角度分析问题,不可能也不必要选取包罗万象的指标,必须进行优化选择.所以选择影响生活废水排放量因素的指标必须遵循以下原则:

1)代表性原则.选取的指标必须具有代表性,从众多指标中选择出的指标应当是能很好反应生活废水排放量的优质指标.

2)实用性原则.选取的指标必须是符合我国现阶段国情,各个指标也应当是在各类统计数据中较易找到,且对日后生产和生活能产生积极地影响.

3)动态性原则.随着社会和科学技术不断发展和进步,所选取的指标数值也应当是动态发展的.

鉴于以上原则,采用1999~2009年的人均生活用水量和人均GDP两个指标.其中:人均GDP反映一定时期内人们生活水平的能力与状态;人均日生活用水量以反映生活用水情况,具体如表1(资料来源于《我国统计年鉴》相关各期资料).

3.2 模型的建立

结合生活废水排放量、人均生活用水量和人均GDP构建了多元非线性的指数模型:

y=f(x1,x2)=c0exp(c1x1+c2x2). (1)

代入来自中国统计年鉴和江苏统计年鉴中1999~2009年的数据,并通过Eviews的非线性回归分析后,得到模型:

y=44.75exp-0.004 734x1+0.093 91x2.(2)

(3.155) (-3.840) (4.340)

R2=0.966 1 DW=1.535.

异方差检验:由表2知F-统计量的P值为0.015小于10%,所以可以判定回归方程具有异方差性.用加权最小二乘法来消除异方差性,权值取残差绝对值的倒数,得新的回归方程为:

y=39.65exp(-0.004 271x1+0.101 357x2) (3)

(5.403) (-6.152) (8.882)

R2=0.997 6 DW=1.771.

可以看出消除异方差后,回归方程的拟合程度有所提高.

自相关检验:消除异方差后的回归方程DW值为1.771,可以通过杜宾—瓦森检验的临界值,所以判定回归方程不具有自相关性.

拟合分析:消除异方差性后模型的决定系数为0.997 6.同时从图1可以明显看出实际值和预测值基本为同一条直线,残值绝对值的波动量很小,说明回归方程拟合精度很高.

3.3 方差分析

分别求出消除异方差后回归模型的总和平方和(SST)、残差平方和(SSE)、回归平方和(SSR)以及均方回归(MSR)和均方残差(MSE).

SSE=∑ni=1e2i=∑ni=1(yi-i)2,(4)

SSR=∑ni=1(i-)2,(5)

SST=∑ni=1(yi-)2,

=1n∑ni=1yi ,(6)

MSR=SSRk-1, (7)

MSE=SSEn-k-1.(8)

式中:ei为残差;yi为样本的观测值;i为样本的估计值;为样本的平均值;n为样本的数量;k为回归方程中自变量的个数

利用式(4)~式(8)得消除异方差后回归方程的方差分析见表3.可以看出残差平方和仅为0.525 4,,说明模型观测值和拟合值之间的偏差很小,再次印证了此回归模型就有良好的性能,可以用来对生活污水排放量进行预测分析.

3.4 模型结果的分析

通过图2可以清晰的看出三维非线性模型各个变量之间及其与因变量之间的关系.一般情况下生活废水量的排放随着人均GDP的上升而增多,却随着人均日生活用水量的增多而下降.在人均生活用水量较低的情况下,人均GDP略微升高就使得生活废水排放量显著增多,而在人均生活用水量较高的情况下,人均GDP对生活废水排放量的影响力显著下降.

图2 模型三维效果图

4 生活废水排放量预测

利用已建立的模型进行江苏省生活废水排放量的预测.为此分别根据中国统计年鉴和江苏省统计年鉴1999~2009年人均日生活用水量和人均GDP的数据建立:人均日生活用水量预测方程,如式(9);人均GDP的预测方程,如式(10).

y=109 95.01-5.377 754x+ar(1),(9)

ar(1)=0.614 347

R2=0.903 2, DW=1.646

y=-1 403.958+0.700 592x+ar(1), (10)

ar(1)=0.854 587,

R2=0.9968, DW=2.040

由式(9)和式(10)分别预测出2010年至2020年江苏省人均日生活用水量和人均GDP的值,之后代回式(3)得出生活废水排放量的预测值,如表4所示.

随着经济和社会的高速发展,江苏省人均日生活用水在过去11年间呈下降趋势.到2009年人均日生活用水量仅为192.7升,不足全国448升的一半.究其原因主要是随着经济社会的发展,人们的综合素质普遍提高,节水意识明显加强,生活用水的重复利用率明显提高;水费阶梯收费制度的实行,用经济杠杆的效应调节了人均用水量;输水管道的更新,检测技术的不断更新与应用,这些措施大量地减少了输水过程中不必要的渗漏情况.在未来十年间,随着水资源紧缺程度不断加深,人均用水量很可能如上文预测的数据所示继续呈现下降趋势.同时生活废水排放量将继续保持迅猛增长势头.根据预测数据可知到2020年,生活废水的排放量应该为2009年(26.76亿吨)的2倍以上,但2009年除无锡生活废水处理率达90.1%以外,其余地区均不足90%,镇江仅为77.7%,可见在未来10年江苏省在生活废水处理上面临很大压力.

5 政策建议

江苏承担着国家赋予的“两个率先”的责任,经济建设仍是当前要务,不太可能以牺牲经济社会的综合发展来解决污染问题.因此从系统角度来分析城市生活废水治理措施,本研究提出以下治理建议:

1)征收城市生活废水排放费.按照“谁污染谁治理谁付费”原则,对生活废水的排放征收排污费.我国工业废水排放长期以来都是征收排污费的,从而有效地遏制了工业废水排放量增长势头,并且提供了资金来治理排放的工业废水.城市生活废水的治理也应当借鉴此种模式.考虑到城市生活废水排放不像工业废水排放那样容易检测,可以改为通过生活用水量多少来间接收取排污费,以此来完成对消费者决策的直接和间接影响.

2)提高水价,更好地实行阶梯式水价.按照市场资源配置状况和真实供求关系,逐步提高水价,并使其达到合理的市场价格.一方面可以提高供水企业积极性,增大对整个市场自来水供应量,同时也可以减轻了政府财政压力;另一方面,水价提高和阶梯式水价的实施,必然能促使消费者更加注重自来水高效利用,减少其不必要浪费.按照奥地利学派的观点只有市场才是对资源进行优化配置的最好手段,在城市生活用水及其废水排放问题上应该充分借鉴此观点.

3)增加投资,促进科技进步.2010年我国已成为世界第二大经济体,国家综合实力大幅提高.在此情况下,应当加大对节水技术和污染治理技术上的研发投入,使得我国能更早的全面使用上更加清洁、高效的水资源利用和处理技术,达到水资源利用的可持续发展.

4)加大宣传和教育力度,培养节水护水意识.事物内因是影响事物发展最重要的因素,所以要解决城市生活废水排放不断增加的问题,必须充分认识到人主观能动性的重要性.因而政府需大力宣传教育,充分发挥非政府组织的引导鼓励作用,提高全民节约用水、保护水资源、合理利用水资源的意识,使全民参与到水环境保护工作中来.参考文献

[1] 钱正英,张光斗.中国可耻学发展水资源战略研究综合报告及各专题报告[M].北京:中国水利水电出版社,2001.

[2] 霍雨,王腊春,焦士兴等人.南方部分中小城市水污染驱动力及防治措施优先级序[J].中国环境科学, 2009,29(10):1052-1058.

[3] 王亮,汪震,岳琳. 基于粒子群优化算法的城市日用水量预测模型[J].中国给水排水,2007,23(7):89-93.

[4] 阎伍玖,桂拉旦,桂清波等人.等维灰数递补动态模型在废水排放量预测中的应用研究[J]. 环境科学与管理,2008,33(1):16-17.

[5] Ahmed Gamal El-DIN,W DANIEL SMITH. A neural net work model to predict the wastewater inflow incorporating rainfall events[J]. Water Research, 2002,36(5):1115–1126.

多元线性回归法 第12篇

在此我们选取国内生产总值来代表社会经济发展水平并将它作为影响教育经费的因素之一。从影响教育经费的内部因素看, 普通高校学生的在校学生数量成为影响学费杂费收入的主要因素。因此, 我们可以认为影响教育经费投入的因素主要有:国内生产总值、社会捐资和集资办学、社会团体和公民办学投入经费、普通高校在校学生人数。

一、提出因变量与自变量

y表示当年教育经费的投入量 (亿元) , 为因变量;四个自变量:x1表示当年国内生产总值 (亿元) , x2表示当年普通高校在校人数 (万人) , x3表示社会团体和公民个人办学投入经费 (亿元) , x4表示社会捐资和集资办学 (亿元) 。1993~2004年我国教育经费情况、国内生产总值、普通高校在校学生人数、社会团体和公民个人办学情况、社会捐资和集资办学情况的统计见表1:

数据来源:教育经费、普通高校在校学生人数、社会团体和公民歌人办学情况、社会捐资和集资办学情况来源于《中国教育年鉴 (2006) 》;国内生产总值数据来源于《中国统计年鉴 (2004) 》

二、作相关分析, 设定理论模型

用SPSS软件计算增广相关阵, 并通过变量间的相关性分析可以进行多元回归分析, 建立回归方程。用逐步筛选法作多元回归分析, 将回归系数显著性F检验的相伴概率值小于0.05的自变量引入回归方程, 大于0.1的自变量剔除回归方程。自变量进入回归方程的次序是:国内生产总值、普通高校在校学生人数、社会团体和公民办学。

三、计算结果

用SPSS软件计算, 其中y代表当年教育经费的投入量, x1代表当年国内生产总值, x2代表当年普通高校在校人数, x3代表社会团体和公民个人办学投入经费。输出结果如表4和表5所示:

注:a.Predictors: (Constant) , 国内生产总值 (亿元) b.Predictors: (Constant) , 国内生产总值 (亿元) , 普通高校在校学生人数 (万人) c.Predictors: (Constant) , 国内生产总值 (亿元) , 普通高校在校学生人数 (万人) , 社会团体和公民办学 (亿元) d.Dependent Variable:教育经费 (亿元)

注:a.Dependent Variable:教育经费 (亿元)

(一) 复相关系数R=0.999, 决定系数R2=0.997, 由此可得回归方程高度显著。

(二) 方差分析表, F=940.986, P值=0.000, 也说明回归方程高度显著, x1、x2、x3整体上对y有高度显著的线性影响。

(三) 回归方程为:

这里x3的系数为负, 显然不合理, 原因可能是由于自变量之间存在多重共线性。

四、多重共线性的诊断与处理

(一) 运用方差扩大因子法。

如表6, x2、x3的方差扩大因子远超过10, 说明回归方程存在。远超过说明回归方程存在严重的多重共线性。

注:a.Dependent Variable:教育经费 (亿元)

(二) 剔除一些解释变量。

x3的方差扩大因子最大, 剔除x3, 再用SPSS诊断

此时x1、x2的方差扩大因子分别为VIF1=6.945, VIF2=6.945。同时, 复相关系数R=0.997, 决定系数R2=0.997, F=875.944, 回归系数的显著性检验P值均小于0.05, 故可认为方程具有较强的拟合性, x1、x2整体上与y高度相关。

回归方程为:

标准化后得:

五、异方差的检验与处理

用等级相关系数法检验。令用SPSS计算与xi的等级相关系数。结果如表7, 在0.05显著性水平下异方差不明显。

六、自相关的诊断与处理

按照时间绘制回归残差项e的图形。由图示可知:变量间不存在自相关性。

七、结论

由此可建立了一个二元线性回归模型:

其中代表所需要的教育经费 (亿元) , x1代表当年国内生产总值 (亿元) , x2代表当年普通高校在校人数 (万人) 。

根据所建立的预测回归模型, 就可以对未来教育经费的投入量进行预测。由方程可以看出国民生产总值每增加1亿元, 教育经费的投入量就会增加0.039亿元, 国民生产总值每增加一个标准差, 教育经费的投入量会增加0.579个标准差;普通高校在校学生人数每增加1万人, 教育经费的投入量就会增加2.238亿元, 普通高校在校学生每增加一个标准差, 教育经费的投入量就会增加0.437个标准差。

国内生产总值是教育经费投入的一个决定和限制量, 教育经费的投入围绕着国内生产总值的变化而上下波动, 这是教育受经济因素决定和制约的最明显的体现。同时, 随着高等教育的普及和推广, 普通高校在校学生人数也影响到我国教育经费的投入量的多少。因此, 在制定教育经费投入计划时, 应综合考虑国内生产总值和教育规模两种因素的影响。要在社会经济发展水平可以承受的范围内, 根据教育规模, 决定教育经费的投入量。

注:**.Correlation is significant at the 0.01 level (2-tailed)

参考文献

【1】中国统计年鉴2004[C]北京人民教育出版社2004

【2】中国教育年鉴2006[C]北京人民教育出版社2006

【3】何晓群统计分析[M]北京中国人民大学出版社2001

【4】薛薇统计分析与SPSS的应用[M]北京中国人民大学出版社2001

多元线性回归法

多元线性回归法(精选12篇)多元线性回归法 第1篇精确的定量预报历来是水文预报工作当中一项比较困难的课题[1]。在中长期水文预报中,数理...
点击下载文档文档内容为doc格式

声明:除非特别标注,否则均为本站原创文章,转载时请以链接形式注明文章出处。如若本站内容侵犯了原著者的合法权益,可联系本站删除。

确认删除?
回到顶部