• 578.50 KB
  • 2022-04-22 11:35:40 发布

《统计学》 课后习题答案.doc

  • 14页
  • 当前文档由用户上传发布,收益归属用户
  1. 1、本文档共5页,可阅读全部内容。
  2. 2、本文档内容版权归属内容提供方,所产生的收益全部归内容提供方所有。如果您对本文有版权争议,可选择认领,认领后既往收益都归您。
  3. 3、本文档由用户上传,本站不保证质量和数量令人满意,可能有诸多瑕疵,付费之前,请仔细先通过免费阅读内容等途径辨别内容交易风险。如存在严重挂羊头卖狗肉之情形,可联系本站下载客服投诉处理。
  4. 文档侵权举报电话:19940600175。
'附录:教材各章习题答案第1章统计与统计数据1.1(1)数值型数据;(2)分类数据;(3)数值型数据;(4)顺序数据;(5)分类数据。1.2(1)总体是“该城市所有的职工家庭”,样本是“抽取的2000个职工家庭”;(2)城市所有职工家庭的年人均收入,抽取的“2000个家庭计算出的年人均收入。1.3(1)所有IT从业者;(2)数值型变量;(3)分类变量;(4)观察数据。1.4(1)总体是“所有的网上购物者”;(2)分类变量;(3)所有的网上购物者的月平均花费;(4)统计量;(5)推断统计方法。1.5(略)。1.6(略)。第2章数据的图表展示2.1(1)属于顺序数据。(2)频数分布表如下服务质量等级评价的频数分布服务质量等级家庭数/频率频率/%A1414B2121C3232D1818E1515合计100100(3)条形图(略)(4)帕累托图(略)。2.2(1)频数分布表如下40个企业按产品销售收入分组表按销售收入分组/万元企业数/个频率/%向上累积向下累积企业数频率企业数频率100以下100~110110~120120~130130~140140以上591274312.522.530.017.510.07.55142633374012.535.065.082.592.5100.04035261473100.087.565.035.017.57.5合计40100.0————(2)某管理局下属40个企分组表14 按销售收入分组/万元企业数/个频率/%先进企业良好企业一般企业落后企业11119927.527.522.522.5合计40100.02.1频数分布表如下某百货公司日商品销售额分组表按销售额分组/万元频数/天频率/%25~3030~3535~4040~4545~5046159610.015.037.522.515.0合计40100.0直方图(略)。2.2茎叶图如下茎叶数据个数18893201133688899912313569541236676501274箱线图(略)。2.3(1)排序略。(2)频数分布表如下100只灯泡使用寿命非频数分布按使用寿命分组/小时灯泡个数/只频率/%650~66022660~67055670~68066680~6901414690~7002626700~7101818710~7201313720~7301010730~74033740~75033合计100100(3)直方图(略)。(4)茎叶图如下14 茎叶6518661456867134679681123334555889969001111222334455666778888997000112234566677888971002233567788972012256789973356741472.1(1)频数分布表如下按重量分组频率/包40~42242~44344~46746~481648~501752~521052~542054~56856~581058~60460~623合计100(2)直方图(略)。(3)食品重量的分布基本上是对称的。2.2(1)频数分布表如下按重量误差分组频数/个10~20020~30530~40740~50850~601360~70970~80680~902合计50(2)直方图(略)。2.3(1)属于数值型数据。(2)分组结果如下分组天数/天-25~-206-20~-15814 -15~-1010-10~-513-5~0120~545~107合计60(3)直方图(略)。2.1(1)直方图(略)。(2)自学考试人员年龄的分布为右偏。2.2(1)茎叶图如下A班树茎B班数据个数树叶树叶数据个数03592144044842975122456677789121197665332110601123468892398877766555554443332100700113449876655200812334566632220901145660100003(2)A班考试成绩的分布比较集中,且平均分数较高;B班考试成绩的分布比A班分散,且平均成绩较A班低。2.3(略)。2.4(略)。2.5(略)。2.6(略)。2.7箱线图如下:(特征请读者自己分析)第3章数据的概括性度量3.1(1);;。14 (2);。(3)。(4)左偏分布。3.1(1);。(2);。(3);。(4);。(5)略。3.2(1)略。(2);。(3);。(4)选方法一,因为离散程度小。3.3(1)=274.1(万元);Me=272.5。(2)QL=260.25;QU=291.25。(3)(万元)。3.4甲企业平均成本=19.41(元),乙企业平均成本=18.29(元);原因:尽管两个企业的单位成本相同,但单位成本较低的产品在乙企业的产量中所占比重较大,因此拉低了总平均成本。3.5(1)=426.67(万元);(万元)。(2);。3.6(1)(2)两位调查人员所得到的平均身高和标准差应该差不多相同,因为均值和标准差的大小基本上不受样本大小的影响。(3)具有较大样本的调查人员有更大的机会取到最高或最低者,因为样本越大,变化的范围就可能越大。3.7(1)女生的体重差异大,因为女生其中的离散系数为0.1大于男生体重的离散系数0.08。(2)男生:=27.27(磅),(磅);女生:=22.73(磅),(磅);(3)68%;(4)95%。3.8通过计算标准化值来判断,,,说明在A项测试中该应试者比平均分数高出1个标准差,而在B项测试中只高出平均分数0.5个标准差,由于A项测试的标准化值高于B项测试,所以A项测试比较理想。3.9通过标准化值来判断,各天的标准化值如下表日期周一周二周三周四周五周六周日标准化值Z3-0.6-0.20.4-1.8-2.2014 周一和周六两天失去了控制。3.1(1)离散系数,因为它消除了不同组数据水平高地的影响。(2)成年组身高的离散系数:;幼儿组身高的离散系数:;由于幼儿组身高的离散系数大于成年组身高的离散系数,说明幼儿组身高的离散程度相对较大。3.2下表给出了一些主要描述统计量,请读者自己分析。方法A方法B方法C平均165.6平均128.73平均125.53中位数165中位数129中位数126众数164众数128众数126标准偏差2.13标准偏差1.75标准偏差2.77极差8极差7极差12最小值162最小值125最小值116最大值170最大值132最大值1283.3(1)方差或标准差;(2)商业类股票;(3)(略)。第4章抽样与参数估计4.1(1)200。(2)5。(3)正态分布。(4)。4.2(1)32。(2)0.91。4.30.79。4.4(1)。(2)。4.5(1)1.41。(2)1.41,1.41,1.34。4.6(1)0.4。(2)0.024。(3)正态分布。4.7(1)0.050,0.035,0.022,016。(2)当样本量增大时,样本比例的标准差越来越小。4.8(1);(2)E=4.2;(3)(115.8,124.2)。4.9(87819,121301)。4.10(1)81±1.97;(2)81±2.35;(3)81±3.10。4.11(1)(24.11,25.89);(2)(113.17,126.03);(3)(3.136,3.702)4.12(1)(8687,9113);(2)(8734,9066);(3)(8761,9039);(4)(8682,9118)。4.13(2.88,3.76);(2.80,3.84);(2.63,4.01)。4.14(7.1,12.9)。4.15(7.18,11.57)。4.16(1)(148.9,150.1);(2)中心极限定理。4.17(1)(100.9,123.7);(2)(0.017,0.183)。4.18(15.63,16.55)。14 4.8(10.36,16.76)。4.9(1)(0.316,0.704);(2)(0.777,0.863);(3)(0.456,0.504)。4.10(18.11%,27.89%);(17.17%,22.835)。4.11167。4.12(1)2522;(2)601;(3)268。4.13(1)(51.37%,76.63%);(2)36。4.14(1)(2.13,2.97);(2)(0.015,0.029);(3)(25.3,42.5)。4.15(1)(0.33,0.87);(2)(1.25,3.33);(3)第一种排队方式更好。4.1648。4.17139。第5章假设检验5.1研究者想要寻找证据予以支持的假设是“新型弦线的平均抗拉强度相对于以前提高了”,所以原假设与备择假设应为:,。5.2=“某一品种的小鸡因为同类相残而导致的死亡率”,,。5.3,。5.4(1)第一类错误是该供应商提供的这批炸土豆片的平均重量的确大于等于60克,但检验结果却提供证据支持店方倾向于认为其重量少于60克;(2)第二类错误是该供应商提供的这批炸土豆片的平均重量其实少于60克,但检验结果却没有提供足够的证据支持店方发现这一点,从而拒收这批产品;(3)连锁店的顾客们自然看重第二类错误,而供应商更看重第一类错误。5.5(1)检验统计量,在大样本情形下近似服从标准正态分布;(2)如果,就拒绝;(3)检验统计量=2.94>1.645,所以应该拒绝。5.6=3.11,拒绝。5.7,不拒绝。5.8,拒绝。5.9,不拒绝5.10,拒绝。14 5.1=1.93,不拒绝。5.2=7.48,拒绝。5.3=206.22,拒绝。5.4,拒绝。第6章方差分析6.1(或),不能拒绝原假设。6.2(或),拒绝原假设。6.3(或),拒绝原假设。6.4(或),拒绝原假设。6.5(或),拒绝原假设。,拒绝原假设;,不能拒绝原假设;,拒绝原假设。6.6方差分析表中所缺的数值如下表:差异源SSdfMSFP-valueFcrit组间42022101.4780.2459463.354131组内383627142.07———总计425629————(或),不能拒绝原假设。第7章相关与回归分析7.1(1)散点图(略),产量与生产费用之间正的线性相关关系。(2)。(3)检验统计量,拒绝原假设,相关系数显著。7.2(1)散点图(略)。14 (2)。7.1(1)表示当时的期望值。(2)表示每变动一个单位平均下降0.5个单位。(3)。7.2(1)。(2)。7.3(1)散点图(略)。(2)。(3)。回归系数表示运送距离每增加1公里,运送时间平均增加0.00358天。7.4(1)散点图(略)。二者之间为高度的正线性相关关系。(2),二者之间为高度的正线性相关关系。(3)估计的回归方程为:。回归系数表示人均GDP每增加1元,人均消费水平平均增加0.308683元。(4)判定系数。表明在人均消费水平的变差中,有99.6259%是由人均GDP决定的。(5)检验统计量,拒绝原假设,线性关系显著。(6)(元)。(7)置信区间:[1990.749,2565.464];预测区间:[1580.463,2975.750]。7.5(1)散点图(略),二者之间为负的线性相关关系。(2)估计的回归方程为:。回归系数表示航班正点率每增加1%,顾客投诉次数平均下降4.7次。(3)检验统计量(P-Value=0.001108<),拒绝原假设,回归系数显著。(4)(次)。(5)置信区间:(37.660,70.619);预测区间:(7.572,100.707)。7.6Excel输出的结果如下(解释与分析请读者自己完成)MultipleR0.7951RSquare0.6322AdjustedRSquare0.6117标准误差2.685814 观测值20方差分析 dfSSMSFSignificanceF回归分析1223.1403223.140330.93322.79889E-05残差18129.84527.2136总计19352.9855    Coefficients标准误差tStatP-valueLower95%Upper95%Intercept49.31773.805012.96120.000041.323657.3117XVariable10.24920.04485.56180.00000.15510.34347.1(1)方差分析表中所缺的数值如下方差分析表变差来源dfSSMSFSignificanceF回归11422708.61422708.6354.2772.17E-09残差1040158.074015.807——总计111642866.67———(2)。表明汽车销售量的变差中有86.60%是由于广告费用的变动引起的。(3)。(4)。回归系数表示广告费用每增加一个单位,销售量平均增加1.420211个单位。(5)SignificanceF=2.17E-09<,线性关系显著。7.2;;。7.3(1)27。(2)4.41。(3)拒绝。(4)。(5)拒绝。7.4(1)。(2)。7.5;。7.6;预测28.586。14 7.1(略)。7.2(1)显著。(2)显著。(3)显著。7.3(1)。(2)。(3)不相同。方程(1)中的回归系数表示电视广告费用每增加1万元,月销售额平均增加1.6039万元;方程(1)中的回归系数表示在报纸广告费用不变的条件下,电视广告费用每增加1万元,月销售额平均增加2.2902万元。(4);。(5)的P-Value=0.0007,的P-Value=0.0098,均小于,两个回归系数均显著。7.4(1)(2)回归系数表示降雨量每增加1毫mm,小麦收获量平均增加22.3865kg/hm2;回归系数表示温度每增加1,小麦收获量平均增加327.6717kg/mh2。(3)可能存在。7.5(1)。(2);。(3)SignificanceF=3.88E-08<,线性关系显著。(4)的P-Value=0.1311>,不显著;的P-Value=0.0013<,显著;的P-Value=0.0571>,不显著。第8章时间序列分析和预测8.1(1)时间序列图(略)。(2)13.55%。(3)1232.90(亿元)。8.2(1)时间序列图(略)。(2)1421.2(公斤/公顷)。14 (3)时的预测值:,误差均方=291455;时的预测值:,误差均方=239123。更合适。8.1(1)3期移动平均预测值=630.33(万元)。(2)时的预测值:,误差均方=87514.7;时的预测值:,误差均方=62662.5;时的预测值:,误差均方=50236。更合适(3)趋势方程。估计标准误差。8.2(1)趋势图(略)。(2)趋势方程。2001年预测值=3336.89(亿元)。8.3(1)趋势图(略)。(2)线性趋势方程,2000年预测值=585.65(万吨)。8.4线性趋势:;二次曲线:;三次曲线:。8.5(1)原煤产量趋势图(略)。(2)趋势方程,预测值(亿吨)。8.6(1)图形(略)。(2)移动平均法或指数平滑法。(3)移动平均预测=72.49(万元);指数平滑法预测=72.5(万元)()。8.7(1)略。(2)结果如下2001年/月时间编号季节指数回归预测值最终预测值1971.04393056.303190.482980.99393077.503058.873990.95933098.712972.4841000.93983119.922931.9951010.94393141.132964.8861020.95893162.333032.3071030.92873183.542956.4381040.92613204.752967.8691050.98143225.963166.0514 101061.00753247.163271.51111071.04723268.373422.77121081.26943289.584175.958.1各季节指数如下1季度2季度3季度4季度季节指数0.75170.85131.23431.1627季节变动图(略)。计算趋势:分离季节因素后的趋势方程为:。图形(略)周期波动图(略)。8.2各月季节指数如下1月2月3月4月5月6月0.67440.66990.74320.79030.80610.85107月8月9月10月11月12月0.75520.34490.96191.19921.86622.3377季节变动图(略)。计算趋势:分离季节因素后的趋势方程为:。图形(略)。周期波动图(略)。随机波动图(略)。第9章指数9.1(1)。(2)。(3)。(4)13920元=26190元-12270元。9.2(1)111.72%。(2)111.60%。(3)100.10%。(4)15.3万元=15.1532万元+0.1468万元。9.3(1)2.62%;8016元。(2)28.42%;124864元。(3)143.37%;132880元。9.4(1)单位成本增长11.11%。(2);。9.5结果如下表:年份缩减后的人均GDP19901584.919911817.219922149.419932562.319943161.219954145.219965148.714 19975889.119986357.919996640.020007049.89.1,下跌1.48%。14'