第20卷第6期
型!』
::!:垫;
文章编号:1008.0562(2001103.0838—02
辽宁工程技术大学学报(自然科学版)
!!!罂堂!!坚墼坐!g塞!坠丝型坚:堡!坚堕!些竺型!!丝!::!
2001年12月
:墼!
呈竺::
基于MATLAB的岭回归分析程序设计及其应用
曾繁会,吕渭济
f讧宁工程技术大学工商管理学脘,阜新123000)
摘 要:岭同归分析是多兀线性回归分析中的种方法,在实际应用中经常遇到.牟文通过设计姒TL^B中的Ridgel函数程序.介绍
如何利用砒TL^B进行岭回归分析.
关键词:峙回归;姒耻:峙回归分析;岭回归系靛:程序设训
中围号:o 212.4
文献标识码:A
O
引 言
岭回归亦称“脊回归估计”、“岭估计”,是一
种改进最小二乘估计的方法,适用于自变量
置,屯….^间相关性强时,或某些变量的变化范围
太小时,也即线性回归模型中正规方程的系数矩
阵x 7 x接近奇异时的情形。在这种情况下.用传
统的基于最小二乘法估计参数的多元线性回归、
逐步回归等方法往往不能得到令人满意的结果,
甚至有的结果与专业知识不一致,通常可以采用
岭回归分析方法。
M枷,AB(5.3版本)的数值计算功能强大,
又便于进行输出结果可视化的程序设计,它的统
计工具箱(st撕s6c 1’oolbox)中的功能函数有200
多个。MATLAB的操作简便、可扩充性等诸多优
点决定了它将在SAs等概率统计软件领域中占据
及其重要的地位。笔者发现其中用于岭回归分析
的函数程序md辨.m中有几处欠佳,如其中的标准
化处理、回归系数的求解。本文意在对其鼬dge.m
进行改进,并利用改进后的程序R^dgeI.m作基于
MAnAB的岭回归分析的应用。
1 岭回归程序(Ridgel.m)的设计
设有p个自变量而,屯,.,帆一个因变量y,进
行H次统计得到数据表xn印,yml。对于岭参数“t
∈【0,1】),估计岭回归系数的步骤如下:
(1)将原始数据J。尥,.即J作标准化变换,
变换后均值为O.标准差为1。墨',矩阵分别变为
Z.y。
(2)对于≈∈【o,1】,求小(n一1)。
(3)将标准化变换后的矩阵厶印,№J添加伪
样本数据变为勐f"如+曲xp,珞‰(n印)x1.
(4)利用MAl几AB中Regress函数拟合过原
点的多元线性回归方程,所估计出的回归系数即
为岭回归系数卢f(t)(仁1,2,.'p)。
(5)在应用程序中通过M棚.AB的画图语句
Plot绘出口ir女)随女变化的趋势,决定选择合适的
女对应的口i(幻作为晟后的岭回归系数。
岭回归函数Ridge.m程序清单如下
function【b,bint,LrinLsta叫=耐gel(r五”
【n,纠=sizc∞;
mx=me卸∞;my=mea|l(y);s列Lx=
std(砷;stdv=std(y);
idx=‰d(abs(stdx)
第6期
曾繁会等: 基于MAl几AB的岭回归分析程序设计及其应用
∥乜;coum=0;kvec=0.1:O.1:l:
f研k卸.1:0.1:l
coun仁:count+1:
[b,bim,Lrinkstatsl=ridgel(y'x,k);bb(:,count)=b;
statsl(count,:)=stats;
eⅡd
bb’,statsl
p10t啡vec’,bb),xlabel(1¨ylabel(’b’,下bntN啪e‘,’Symbo
1’)
运行的部分结果如下:(蚰矩阵各行分别为岭
系数脚.1,O.2,_o.9时的岭回归系数,s缸csl中各行分
别为各行岭系数对应的R2统计量和F以及P值。图1
显示了岭系数卢.(女)ff-1,2,.,6)随k的变化情况。)
bb=『,O.492 O
0.4557 .04636
_0.212
1 ,O.229 4 —0.408 5
.0.400
0.383 8
—0.172 7.0.270 2.0-37l 5
1
.0.3780
.O.34】9 ’o.153
5
-n272 8 一o.337 4
0_3294
—0.3344
.0.299 6
—0.14l
5
.0.266
3
.0.308 3
0.287 2.0t3049
-o.267 0 一O.132
8
.0.257
1
_0.283 6
0.253 6
—0.282 6
_o.240 9
·O.125
9
-O.247 3
.0.262 6
O.226 3
.O.2646
.0.219 5
田.120
2 .O.237 8
—0.244 6
O.460 9
0.437 5
0.416 6
1.538 8
1.399 8
1.285 2
0.270 3
0-311 O
O.3496】
图1.争回归蔷参数估计
me岸咖曲证e血rna6∞0fndgcIqp商如
Fig 1
从运行结果及图1可见,t≥0.7时每个变量相
应的岭回归系数变化较为稳定,因而可选脚.7,
建立岭回归方程
产-0.219缸l一0.120 2廿0.237‰一
O.2“6k+0.203 6岛-0.249瓴
0.203 6
,0.2494
—0.201 6
’0.115
2抑.228 6.o.228 9 2结论
0.1846
-0.2364
—0.186 5
m.110
9
.o.220 O .0.215 2
0.1684 .0.2249
.0.173 4
—0.107
O 一0.212 0 .0,203
l
0.154 5 —0.214 71
statsl=
【0.785 2
0.7054
0.643 9
0.594 2
0.552 8
0.517 7
0.4874
6.5792
O.007 6
4.3109
3.255l
2.635 5
2.225 2
1.9320
1.711 4
0.0280
0.059 3
0.097 9
0.140 3
0.1841
O.227 8
(1)溉(文盲、半文盲率)与婴儿死亡率之间
呈正相关,其它变量与婴儿死亡率呈负相关;(2)
对婴儿死亡率影响最大的是%(乡级妇儿保人员培
训比例),其次是五(年人均收入)、而(3岁以下
儿童生长发肓监测率)、而(从事乡妇儿保工作年
限2年以上的人员占乡妇儿保人员比重)。
参考文献:
[1] 田惶1999岭回归分析的s^S程序设计[JJ.数理统计与管理
2000.18(3):53 55.
【2] 车涛Mat】ab工具箱应用指南一应用散学篇【蝴北京:电子工
业出版社,2000.63—64
Pmgmm Design and the Use of硒dge Regressi伽Based伽MATLAB
ZENG F衄.hllL
LU、^fei_ji
(Li舯Ni赡砸咖i咖University,fll对n 1230∞,China)
Abstmn:Ridge reg陀ssion is a me山0d fbr mllld—v撕ety 1inear regression锄alysis柚d often appUed in pracdcal
data柚aIysis.1k pfesented papcr giVes a p咖廿cal呲thod t0 es廿mate c∞币cien侮of棚ge化gressi叩equ撕on
w油MAlLAB by dcsigning me progmm.
Key w钾ds:湖ge reg陀踮ion;MAlLAB;ddge reg∞ssion a11alysis;coe佑cients of ridge regression;program
desig“
万方数据
基于MATLAB的岭回归分析程序设计及其应用
作者:
曾繁会, 吕渭济
作者单位:
刊名:
辽宁工程技术大学工商管理学院,
辽宁工程技术大学学报(自然科学版)
英文刊名:
JOURNAL OF LIAONING TECHNICAL UNIVERSITY(NATURAL SCIENCE EDITION)
年,卷(期):
2001,20(6)
2次
引用次数:
参考文献(2条)
1.田俊 岭回归分析的SAS程序设计[期刊论文]-数理统计与管理 1999(3)
2.李涛 Matlab工具箱应用指南 2000
相似文献(0条)
引证文献(2条)
1.胡晔 MTF与图像要素的相关性研究及外景应用[学位论文]硕士 2006
2.张久军 中国农村居民家庭收入来源和消费支出的多元统计分析[学位论文]硕士 2005
本文链接:http://d.g.wanfangdata.com.cn/Periodical_lngcjsdxxb200106033.aspx
下载时间:2010年3月31日