服务粉丝

我们一直在努力
当前位置:首页 > 财经 >

方法|R语言回归分析——一元线性回归分析

日期: 来源:学研录收集编辑:李学研

一、一元线性回归基础概念

1、回归模型的数学方程:

Y=β0+β1*X1+β2*X2+…+βn*Xn+e

其中Y是因变量,也称为响应变量。X1,X2…,Xn,是自变量,也称为解释变量。β0是截距项,β1,β2.…,βn是自变量的系数,e是误差项。其中e~N(0,O2),且独立同分布。

2、回归系数的显著性检验

回归系数的显著性检验是检验变量Xj的系数是否为0,即假设检验为

Hj0:βj=0,Hj1:βj !=0,J=1,…,n

此时用t统计量检验,如果t统计量的P值<a(通常取0.05),则拒绝原假设,认为βj !=0。

3、回归方程的显著性检验

回归方程的显著性检验是检验是否可用线性方程来处理数据,也就是说,方程的系数是否全为0,即假设检验为:

H0:β0=β1=…=βn=0,H1:β0 , β1 , ……,βn不全为0。此时用F统计量检验,如果F统计量的P值<a,则拒绝原假设,即可以用线性方程来处理问题。

4、相关性检验

相关系数的平方定义为:R2=SSR/SST

用它来衡量Y与X1,X2 ,…,Xn,之间相关的密切程度,其中SST称为总体离差平方和,并且满足SST=SSE+SSR。当R2接近于0,可以认为Y与X1,X2 ,…,Xn之间不相关,接近于1表示相关。因此,可以使用R2作为衡量自变量与因变量是否相关的重要指标。

二、元线性回归分析

步骤:A.建立回归模型;B.求解回归模型中的参数;C.对回归模型进行检验。

R中,与线性模型有关的函数有:lm()、summary()、anova()和predict()。我们由例子入手,逐步学习这些函数。

例题:财政收入与税收有密切的依存依存关系。数据给出我们1978年改革开放以来到2000年共23年的税收(x,百亿元)和财政收入(y,百亿元)数据,试分析税收与财政收入之间的依存关系。

表1 1978—2000年共23年的税收数据
tyx
197811.32625.1928
197911.46385.3782
198011.59935.717
198111.75796.2989
198212.12337.0002
198318.66957.5559
198416.42869.4735
198520.048220.4079
198621.220120.9073
198721.993521.4036
198823.572423.9047
198926.64927.274
199029.37128.2187
199131.494829.9017
199234.833732.9691
199343.489542.553
199452.18151.2688
199562.42260.3804
199674.079969.0982
199786.511482.3404
199898.759592.628
1999114.4408106.8258
2000133.9523125.8151

1、读入数据

dat=read.table("clipboard",header=T) ##在Excel中选取B1:C24区域,然后拷贝.

2、拟合模型

fm=lm(y~x,data=dat)fm

于是得到回归方程:y=3.095+1.017x。

3、作回归直线

plot(dat$x, dat$y)abline(fm)

4、回归方程的假设检验

(1)模型的方差分析

anova(fm)

由于p<0.05,于是在0.05水平处拒绝原假设,即本例回归系数有统计学意义,x与y间存在直线回归关系。

(2)回归系数的显著性检验

summary(fm)

由于p<0.05,于是在0.05水平处拒绝原假设,即本例回归系数有统计学意义,x与y间存在回归关系。

5、预测值

当经过检验,回归方程是有意义时,可以用它作预测其他值。

new<-data.frame(x=700) ##输入新的点x=700,这里即时是一个点,也要采用数据框形式lm.pred<-predict(fm,new,interval="prediction",level=0.95)##给出预测值,interval="prediction"指给出预测区间,level=0.95表示相应概率为0.95。lm.pred ##fit为预测值,lwr是95%下限,upr是95%上限

—END—

欢迎关注学研录
细心 用心 恒心
声明:资料源于网络,仅供学习,禁止商用,如有侵权联系我们立即删除。

相关阅读

  • 文心一言:百度 AI 技术十年磨一剑

  • 作为“文心一言”首批内测用户,CSDN 编辑将其与“ChatGPT”在文学创作、商业文案创作、数理逻辑推算、中文理解和多模态生成这五个维度进行了对比,并在第一时间发布了测评体验
  • 全面了解大语言模型,这有一份阅读清单

  • 机器之心报道机器之心编辑部了解当代大型语言模型背后的设计、约束和演变,你可以遵循本文的阅读清单。大型语言模型已经引起了公众的注意,短短五年内,Transforme等模型几乎完全
  • 基于差分隐私的联邦学习数据隐私安全技术

  • 摘  要:联邦学习方法在大数据时代有效解决了“数据孤岛”问题,也在一定程度上保障了数据隐私安全。然而,联邦学习的许多方面仍面临隐私风险。首先归纳总结了联邦学习面临的常
  • 党建如何引领岗位价值创造?

  • 讲述人:辽河油田冷家公司采油作业二区党总支书记 王辉如何实现党员干部精准履职,将工作做细做精?如何通过结果正向激励员工干事创业?辽河油田冷家公司采油作业二区党总支创新实
  • 腾讯短文本对话专利获授权

  • 【环球网科技综合报道】3月20日消息,天眼查App显示,近日,腾讯科技(深圳)有限公司申请的“短文本对话方法、装置、设备及存储介质”专利获授权。摘要显示,该方法包括:获取查询文本;调

热门文章

  • “复活”半年后 京东拍拍二手杀入公益事业

  • 京东拍拍二手“复活”半年后,杀入公益事业,试图让企业捐的赠品、家庭闲置品变成实实在在的“爱心”。 把“闲置品”变爱心 6月12日,“益心一益·守护梦想每一步”2018年四

最新文章

  • 方法|R语言回归分析——一元线性回归分析

  • 一、一元线性回归基础概念1、回归模型的数学方程:Y=β0+β1*X1+β2*X2+…+βn*Xn+e其中Y是因变量,也称为响应变量。X1,X2…,Xn,是自变量,也称为解释变量。β0是截距项,β1,β2.…,βn
  • ONLY:通勤女装,拿下30亿

  • 2022年,天猫服饰展现出坚实的消费基础,高价值人群引领增长。据《2023天猫服饰春夏趋势白皮书》,从天猫服饰消费人群来看,品质时尚人群的服饰消费支出更加突出,占全年比例20%以上,