8.2 一元线性回归模型及其应用(精讲)
思维导图
常见考法
考点一 样本中心解小题
【例1】(2021·江西赣州市)某产品在某零售摊位上的零售价x(元)与每天的销售量y(个)统计如下表:
x 16 50 17 18 34 19 31 y m 据上表可得回归直线方程为y6.4x151,则上表中的m的值为( ) A.38
B.39
C.40
D.41
1 / 13
【答案】D 【解析】由题意x1617181950m3431115m17.5,y,
444所以
115m6.417.5151,解得m41.故选:D. 4【一隅三反】
1.(2021·江西景德镇市·景德镇一中)随机变量x与y的数据如表中所列,其中缺少了一个数值,已知yˆ0.9x3,则缺少的数值为( ) 关于x的线性回归方程为yx 2 5 B.6.6
3 6 C.7.5
4 ▲ D.8
5 7 6 9 y A.6 【答案】A
ˆ0.9x3过样本中心点x,y, 【解析】设缺少的数值为m,由于回归方程为y且x234565679m4,代入y0.9436.6,所以y6.6,解得m6.
55故选:A.
2.(2021·河南信阳市)根据如下样本数据:
x 2 4 3 2.5 4 5 6 y 0.5 2 3 得到的回归方程为ybxa,则( ) A.a0,b0 C.a0,b0 【答案】B
ˆ0 B.a0,bˆ0 D.a0,bˆ0, 【解析】由图表中的数据可得,变量y随着x的增大而减小,则bx23452.50.5234,y0.2,
55又回归方程ybxa经过点(4,0.2),可得a0,故选:B.
3.(2021·安徽六安市·六安一中)蟋蟀鸣叫可以说是大自然优美、和谐的音乐,殊不知蟋蟀鸣叫的频率x 2 / 13
(每分钟鸣叫的次数)与气温y(单位:C)存在着较强的线性相关关系.某地观测人员根据下表的观测数据,建立了y关于x的线性回归方程y0.25xk.
x(次数/分钟) 20 25 30 27.5 40 29 50 32.5 60 36 yC 则当蟋蟀每分钟鸣叫62次时,该地当时的气温预报值为( ) A.33C 【答案】D
【解析】由表格中的数据可得xB.34C
C.35C
D.35.5C
20304050602527.52932.53640,y30,
55由于回归直线过样本中心点x,y,可得300.2540k,解得k20.
所以,回归直线方程为y0.25x20.在回归直线方程中,令x62,可得y0.25622035.5.故选:D.
考点二 一元线性方程
【例2】(2021·兴义市第二高级中学)在2010年春节期间,某市物价部门,对本市五个商场销售的某商品一天的销售量及其价格进行调查,五个商场的售价x元和销售量y件之间的一组数据如下表所示: 价格x 销售量y 9 11 9.5 10 10 8 10.5 6 11 5 通过分析,发现销售量y对商品的价格x具有线性相关关系,求 (1)销售量y对商品的价格x的回归直线方程; (2)若使销售量为12,则价格应定为多少.
ˆˆaˆ中b附:在回归直线ybxxynxyiii1nnxi1ˆ ˆybx,a2inx2【答案】(1) y3.2x40 (2) 8.75 【解析】(1)由题意知x10,y8,
3 / 13
ˆb999580635551083.2,a8(3.2)1040,
8190.25100110.251215100线性回归方程是y3.2x40;
(2)令y3.2x4012,可得x8.75,
预测销售量为12件时的售价是8.75元.
【一隅三反】
1.(2020·河南开封市)配速是马拉松运动中常使用的一个概念,是速度的一种,是指每公里所需要的时间,相比配速,把心率控制在一个合理水平是安全理性跑马拉松的一个重要策略.图1是一个马拉松跑者的心率y(单位:次/分钟)和配速x(单位:分钟/公里)的散点图,图2是一次马拉松比赛(全程约42公里)前3000名跑者成绩(单位:分钟)的频率分布直方图.
(1)由散点图看出,可用线性回归模型拟合y与x的关系,求y与x的线性回归方程;
(2)该跑者如果参加本次比赛,将心率控制在160左右跑完全程,估计他跑完全程花费的时间,并估计他能获得的名次.
ˆˆaˆbxˆ中,b参考公式:线性回归方程y(xi1nnix)(yiy)i(xˆ ˆybx,ax)2参考数据:y135.
【答案】(1)y25x285;(2)210分钟,192名. 【解析】(1)由散点图中数据和参考数据得x4.55677.56,
5y100109130165171135,
5 4 / 13
ˆbxxyyiii15xixi1521.536(1)300(5)1(26)1.5(35)25,
(1.5)2(1)202121.52ˆ135(25)6285, ˆybxa所以y与x的线性回归方程为y25x285. (2)将y160代入回归方程得x5,
所以该跑者跑完马拉松全程所花的时间为425210分钟. 从马拉松比赛的频率分布直方图可知成绩好于210分钟的累积频率为
0.0008500.00242102000.0,有6.4%的跑者成绩超过该跑者,
则该跑者在本次比赛获得的名次大约是0.03000192名.
2.(2020·云南红河哈尼族彝族自治州)随着电商事业的快速发展,网络购物交易额也快速提升,特别是每年的“双十一”,天猫的交易额数目惊人.2020年天猫公司的工作人员为了迎接天猫“双十一”年度购物狂欢节,加班加点做了大量准备活动,截止2020年11月11日24时,2020年的天猫“双十一”交易额定格在3700多亿元,天猫总公司所有员工对于新的战绩皆大欢喜,同时又对2021年充满了憧憬,因此公司工作人员反思从2014年至2020年每年“双十一”总交易额(取近似值),进行分析统计如下表: 年份 年份代码(t) 总交易额y(单位:百亿) 2014 1 5.7 2015 2 9.1 2016 3 12.1 2017 4 16.8 2018 5 21.3 2019 6 26.8 2020 7 37 (1)通过分析,发现可用线性回归模型拟合总交易额y与年份代码t的关系,请用相关系数加以说明; (2)利用最小二乘法建立y关于t的回归方程(系数精确到0.1),预测2021年天猫“双十一”的总交易额. 参考数据:
(ti17it)(yiy)138.5,nyyii17226.7,72.6;
参考公式:相关系数rttyyiii1ttyy2iii1i1nn2;
5 / 13
回归方程ybta中,斜率和截距的最小二乘估计公式分别为:bti17itiyytynxyiiinti17t2i1nti12inx2,
a=ybt.
ˆ4.9t1.2,预测2021年天猫“双十一”的总交易额约为【答案】(1)答案见解析;(2)回归方程为y38百亿.
【解析】(1)t4,
7(ti17it)228,
7(tt)(yii1iy)138.5,yiyi1226.7
r所以
tt(yy)iii1n(ti1nnit)2(yiy)2i1nn138.50.98
22.626.7因为总交易额y与年份代码t的相关系数近似为0.98, 说明总交易额y与年份代码t的线性相关性很强,
从而可用线性回归模型拟合总交易额y与年份代码t的关系. (2)因为y18.4,
7(ti17it)228,
ˆ所以btt(yii17ii1iy)2tt138.54.9, 28ˆ,b18.44.941.2 ˆybaˆ4.9t1.2 所以y关于t的回归方程为yˆ4.981.238. 又将2021年对应的t8代入回归方程得:y所以预测2021年天猫“双十一”的总交易额约为38百亿.
3.(2021·湖北省武昌实验中学高二期末)根据统计,某蔬菜基地西红柿亩产量的增加量y(百千克)与某
6 / 13
种液体肥料每亩使用量x(千克)之间的对应数据的散点图,如图所示.
(1)依据数据的散点图可以看出,可用线性回归模型拟合y与x的关系,请计算相关系数r并加以说明(若
r0.75,则线性相关程度很高,可用线性回归模型拟合);
(2)求y关于x的回归方程,并预测当液体肥料每亩使用量为12千克时,西红柿亩产量的增加量约为多少?
附:相关系数公式rxxyyiii1nxxyy2iii1i1nn2xynxyiii1nxi1n2inx2yi1n.
2iny2参考数据:0.30.55,0.90.95.
回归方程ybxa中斜率和截距的最小二乘估计公式分别为bxxyyxynxyiiiii1nnxxii1n2i1nxi12inx2,
ayxb.
【答案】(1)0.95;答案见解析;(2)y0.3x2.5;610千克. 【解析】(1)由已知数据可得x524568344454, 5,y55所以
xxyy31100010316,
iii1i155xix231122202123225,
i1yiy2020202122,
7 / 13
所以相关系数rxxyyiii15i15xix2i15yiy2690.95.
10252因为r0.75,所以可用线性回归模型拟合y与x的关系.
(2)bxxyyiii15xxii15260.3,a450.32.5, 20所以回归方程为y0.3x2.5. 当x12时,y0.3122.56.1,
即当液体肥料每亩使用量为12千克时,西红柿亩产量的增加量约为610千克.
考点三 非一元线性方程
【例3】(2020·全国高二课时练习)在一次抽样调查中测得5个样本点,得到下表及散点图.
x 0.25 16 0.5 12 1 2 2 4 y 5 1
(1)根据散点图判断yabx与yckx哪一个适宜作为y关于x的回归方程;(给出判断即可,不
1必说明理由)
(2)根据(1)的判断结果试建立y与x的回归方程;(计算结果保留整数) (3)在(2)的条件下,设zyx且x4,,试求z的最小值.
8 / 13
nnxixyiyiiˆi1xynxy参考公式:回归方程ybxˆaˆ中,bˆ1,nx2i2aybx.
ixinx2i1nxi1【答案】(1)yckx1;(2)y4x1;(3)6. 【解析】(1)由题中散点图可以判断,yckx1适宜作为y关于x的回归方程; (2)令tx1,则yckt,原数据变为
t 4 2 1 0.5 0.25 y 16 12 5 2 1 由表可知y与t近似具有线性相关关系,计算得t4210.50.2551.55,
y161252157.2,
k416212150.520.25151.557.24222120.520.25251.55238.459.34,
所以,cykt7.241.551,则y4t1. 所以y关于x的回归方程是y4x1. (3)由(2)得zyx4xx1,x4,, 任取x1、x24,且x1x2,即x1x24,
可得z444x2x11z2xx11x1x1x244x1x21x22x1x2x1x2x1x2x1x24x,
1x2因为x1x24,则x1x20,x1x216,所以,z1z2,
9 / 13
所以,函数z【一隅三反】
44x1在区间4,上单调递增,则zmin416. x41.(2020·江苏省如皋中学高二月考)某种新产品投放市场一段时间后,经过调研获得了时间x(天数)与销售单价y(元)的一组数据,且做了一定的数据处理(如表),并作出了散点图(如图).
1110表中wi,wwi.
xi10i1(1)根据散点图判断yabx,与yc说明理由)
(2)根据判断结果和表中数据,建立y关于x的回归方程. (3)若该产品的日销售量gx(件)与时间x的函数关系为gx市场第几天的销售额最高?最高为多少元?
附:对于一组数据u1,v1,u2,v2,u3,v3,...,un,vn,其回归直线vu的斜率和截距的最小二乘法
d哪一个更适合作价格y关于时间x的回归方程类型?(不必x100120xN,求该产品投放x 10 / 13
估计分别为(vi1nniv)(uiu),vu.
2i(uu)i1【答案】(1)yc售额为2420元;
1d更适合作价格y关于时间x的回归方程;(2)y20(1);(3)第10天,最高销xx【解析】(1)根据散点图知yc(2)令w10d更适合作价格y关于时间x的回归方程类型; x1,则ycdw, xii而d(ww)(yi110ii1y)2(ww)18.420, 0.921cydw37.8200.20,即有y20(1);
x(3)由题意结合(2)知:
日销售额为f(x)yg(x)20(1)(1201x100), x∴f(x)20(1)(1201x10015)400(62), xxx若t1212112,令h(t)6t5t5(t), x1020112112112420元, 时,h(t)maxh(),即x10天,f(x)maxf(10)40010102020∴t所以该产品投放市场第10天的销售额最高,最高销售额为2420元.
2.(2021·江苏苏州市)我国为全面建设社会主义现代化国家,制定了从2021年到2025年的“十四五”规划.某企业为响应国家号召,汇聚科研力量,加强科技创新,准备增加研发资金.现该企业为了了解年研发资金投入额x(单位:亿元)对年盈利额y(单位:亿元)的影响,研究了“十二五”和“十三五”规划发展期间近10年年研发资金投入额xi和年盈利额yi的数据.通过对比分析,建立了两个函数模型:①
yx2,②yext,其中,,,t均为常数,e为自然对数的底数.令uixi,
2 11 / 13
vilnyii1,2,,10,经计算得如下数据:
x y xxii1102 yi110iy 2u v 26 10215 1065 2 10680 105.36 ui1iu 2uuyy iii1vvii12 xxvv iii111250 130 2.6 12 (1)请从相关系数的角度,分析哪一个模型拟合程度更好?
(2)(ⅰ)根据(1)的选择及表中数据,建立y关于x的回归方程;(系数精确到0.01)
(ⅱ)若希望2021年盈利额y为250亿元,请预测2021年的研发资金投入额x为多少亿元?(结果精确到0.01)
附:①相关系数r(xx)(yy)iii1n(xx)(yy)2iii1i1nnˆˆ中:bˆaˆbx,回归直线y2(xx)(yii1nii1niy),
2(xx)ˆ ˆybxa②参考数据:ln20.693,ln51.609. 【答案】(1)模型yextˆe的拟合程度更好;(2)(ⅰ)y0.18x0.56;(ⅱ)27.56.
【解析】(1)设ui和yi的相关系数为r1,xi和vi的相关系数为r2,由题意,
r1uuyyiii110uuyyiii1i1102102130130.87,
11250215r2xxvviii110xixvivi1i110210212120.92,
652.613xt则r1r2,因此从相关系数的角度,模型ye的拟合程度更好.
12 / 13
(2)(ⅰ)先建立v关于x的线性回归方程, 由yext,得lnytx,即vtx,
10xixvivˆi1121065, x2ixi1tˆvˆx5.361265260.56, 所以v关于x的线性回归方程为vˆ0.18x0.56, 所以lnyˆ0.18x0.56,则yˆe0.18x0.56.
(ⅱ)2021年盈利额y250(亿元), 所以250e0.18x0.56,则0.18x0.56ln250, 因为ln2503ln5ln231.6090.6935.52,所以x5.520.560.1827.56.
所以2021年的研发资金投入量约为27.56亿元.
13 / 13