• 1.23 MB
  • 2022-04-22 11:48:04 发布

《统计学》(第四版)学习指导书以及课后习题答案.doc

  • 42页
  • 当前文档由用户上传发布,收益归属用户
  1. 1、本文档共5页,可阅读全部内容。
  2. 2、本文档内容版权归属内容提供方,所产生的收益全部归内容提供方所有。如果您对本文有版权争议,可选择认领,认领后既往收益都归您。
  3. 3、本文档由用户上传,本站不保证质量和数量令人满意,可能有诸多瑕疵,付费之前,请仔细先通过免费阅读内容等途径辨别内容交易风险。如存在严重挂羊头卖狗肉之情形,可联系本站下载客服投诉处理。
  4. 文档侵权举报电话:19940600175。
'附录:教材各章习题答案第1章统计与统计数据1.1(1)数值型数据;(2)分类数据;(3)数值型数据;(4)顺序数据;(5)分类数据。1.2(1)总体是“该城市所有的职工家庭”,样本是“抽取的2000个职工家庭”;(2)城市所有职工家庭的年人均收入,抽取的“2000个家庭计算出的年人均收入。1.3(1)所有IT从业者;(2)数值型变量;(3)分类变量;(4)观察数据。1.4(1)总体是“所有的网上购物者”;(2)分类变量;(3)所有的网上购物者的月平均花费;(4)统计量;(5)推断统计方法。1.5(略)。1.6(略)。第2章数据的图表展示2.1(1)属于顺序数据。(2)频数分布表如下服务质量等级评价的频数分布服务质量等级家庭数/频率频率/%A1414B2121C3232D1818E1515合计100100(3)条形图(略)(4)帕累托图(略)。2.2(1)频数分布表如下40个企业按产品销售收入分组表按销售收入分组/万元企业数/个频率/%向上累积向下累积企业数频率企业数频率100以下100~110110~120120~130130~140140以上591274312.522.530.017.510.07.55142633374012.535.065.082.592.5100.04035261473100.087.565.035.017.57.5合计40100.0————(2)某管理局下属40个企分组表42 按销售收入分组/万元企业数/个频率/%先进企业良好企业一般企业落后企业11119927.527.522.522.5合计40100.02.1频数分布表如下某百货公司日商品销售额分组表按销售额分组/万元频数/天频率/%25~3030~3535~4040~4545~5046159610.015.037.522.515.0合计40100.0直方图(略)。2.2茎叶图如下茎叶数据个数18893201133688899912313569541236676501274箱线图(略)。2.3(1)排序略。(2)频数分布表如下100只灯泡使用寿命非频数分布按使用寿命分组/小时灯泡个数/只频率/%650~66022660~67055670~68066680~6901414690~7002626700~7101818710~7201313720~7301010730~74033740~75033合计100100(3)直方图(略)。(4)茎叶图如下42 茎叶6518661456867134679681123334555889969001111222334455666778888997000112234566677888971002233567788972012256789973356741472.1(1)频数分布表如下按重量分组频率/包40~42242~44344~46746~481648~501752~521052~542054~56856~581058~60460~623合计100(2)直方图(略)。(3)食品重量的分布基本上是对称的。2.2(1)频数分布表如下按重量误差分组频数/个10~20020~30530~40740~50850~601360~70970~80680~902合计50(2)直方图(略)。2.3(1)属于数值型数据。(2)分组结果如下分组天数/天-25~-206-20~-15842 -15~-1010-10~-513-5~0120~545~107合计60(3)直方图(略)。2.1(1)直方图(略)。(2)自学考试人员年龄的分布为右偏。2.2(1)茎叶图如下A班树茎B班数据个数树叶树叶数据个数03592144044842975122456677789121197665332110601123468892398877766555554443332100700113449876655200812334566632220901145660100003(2)A班考试成绩的分布比较集中,且平均分数较高;B班考试成绩的分布比A班分散,且平均成绩较A班低。2.3(略)。2.4(略)。2.5(略)。2.6(略)。2.7箱线图如下:(特征请读者自己分析)第3章数据的概括性度量3.1(1);;。42 (2);。(3)。(4)左偏分布。3.1(1);。(2);。(3);。(4);。(5)略。3.2(1)略。(2);。(3);。(4)选方法一,因为离散程度小。3.3(1)=274.1(万元);Me=272.5。(2)QL=260.25;QU=291.25。(3)(万元)。3.4甲企业平均成本=19.41(元),乙企业平均成本=18.29(元);原因:尽管两个企业的单位成本相同,但单位成本较低的产品在乙企业的产量中所占比重较大,因此拉低了总平均成本。3.5(1)=426.67(万元);(万元)。(2);。3.6(1)(2)两位调查人员所得到的平均身高和标准差应该差不多相同,因为均值和标准差的大小基本上不受样本大小的影响。(3)具有较大样本的调查人员有更大的机会取到最高或最低者,因为样本越大,变化的范围就可能越大。3.7(1)女生的体重差异大,因为女生其中的离散系数为0.1大于男生体重的离散系数0.08。(2)男生:=27.27(磅),(磅);女生:=22.73(磅),(磅);(3)68%;(4)95%。3.8通过计算标准化值来判断,,,说明在A项测试中该应试者比平均分数高出1个标准差,而在B项测试中只高出平均分数0.5个标准差,由于A项测试的标准化值高于B项测试,所以A项测试比较理想。3.9通过标准化值来判断,各天的标准化值如下表日期周一周二周三周四周五周六周日标准化值Z3-0.6-0.20.4-1.8-2.2042 周一和周六两天失去了控制。3.1(1)离散系数,因为它消除了不同组数据水平高地的影响。(2)成年组身高的离散系数:;幼儿组身高的离散系数:;由于幼儿组身高的离散系数大于成年组身高的离散系数,说明幼儿组身高的离散程度相对较大。3.2下表给出了一些主要描述统计量,请读者自己分析。方法A方法B方法C平均165.6平均128.73平均125.53中位数165中位数129中位数126众数164众数128众数126标准偏差2.13标准偏差1.75标准偏差2.77极差8极差7极差12最小值162最小值125最小值116最大值170最大值132最大值1283.3(1)方差或标准差;(2)商业类股票;(3)(略)。第4章抽样与参数估计4.1(1)200。(2)5。(3)正态分布。(4)。4.2(1)32。(2)0.91。4.30.79。4.4(1)。(2)。4.5(1)1.41。(2)1.41,1.41,1.34。4.6(1)0.4。(2)0.024。(3)正态分布。4.7(1)0.050,0.035,0.022,016。(2)当样本量增大时,样本比例的标准差越来越小。4.8(1);(2)E=4.2;(3)(115.8,124.2)。4.9(87819,121301)。4.10(1)81±1.97;(2)81±2.35;(3)81±3.10。4.11(1)(24.11,25.89);(2)(113.17,126.03);(3)(3.136,3.702)4.12(1)(8687,9113);(2)(8734,9066);(3)(8761,9039);(4)(8682,9118)。4.13(2.88,3.76);(2.80,3.84);(2.63,4.01)。4.14(7.1,12.9)。4.15(7.18,11.57)。4.16(1)(148.9,150.1);(2)中心极限定理。4.17(1)(100.9,123.7);(2)(0.017,0.183)。4.18(15.63,16.55)。42 4.8(10.36,16.76)。4.9(1)(0.316,0.704);(2)(0.777,0.863);(3)(0.456,0.504)。4.10(18.11%,27.89%);(17.17%,22.835)。4.11167。4.12(1)2522;(2)601;(3)268。4.13(1)(51.37%,76.63%);(2)36。4.14(1)(2.13,2.97);(2)(0.015,0.029);(3)(25.3,42.5)。4.15(1)(0.33,0.87);(2)(1.25,3.33);(3)第一种排队方式更好。4.1648。4.17139。第5章假设检验5.1研究者想要寻找证据予以支持的假设是“新型弦线的平均抗拉强度相对于以前提高了”,所以原假设与备择假设应为:,。5.2=“某一品种的小鸡因为同类相残而导致的死亡率”,,。5.3,。5.4(1)第一类错误是该供应商提供的这批炸土豆片的平均重量的确大于等于60克,但检验结果却提供证据支持店方倾向于认为其重量少于60克;(2)第二类错误是该供应商提供的这批炸土豆片的平均重量其实少于60克,但检验结果却没有提供足够的证据支持店方发现这一点,从而拒收这批产品;(3)连锁店的顾客们自然看重第二类错误,而供应商更看重第一类错误。5.5(1)检验统计量,在大样本情形下近似服从标准正态分布;(2)如果,就拒绝;(3)检验统计量=2.94>1.645,所以应该拒绝。5.6=3.11,拒绝。5.7,不拒绝。5.8,拒绝。5.9,不拒绝5.10,拒绝。42 5.1=1.93,不拒绝。5.2=7.48,拒绝。5.3=206.22,拒绝。5.4,拒绝。第6章方差分析6.1(或),不能拒绝原假设。6.2(或),拒绝原假设。6.3(或),拒绝原假设。6.4(或),拒绝原假设。6.5(或),拒绝原假设。,拒绝原假设;,不能拒绝原假设;,拒绝原假设。6.6方差分析表中所缺的数值如下表:差异源SSdfMSFP-valueFcrit组间42022101.4780.2459463.354131组内383627142.07———总计425629————(或),不能拒绝原假设。第7章相关与回归分析7.1(1)散点图(略),产量与生产费用之间正的线性相关关系。(2)。(3)检验统计量,拒绝原假设,相关系数显著。7.2(1)散点图(略)。42 (2)。7.1(1)表示当时的期望值。(2)表示每变动一个单位平均下降0.5个单位。(3)。7.2(1)。(2)。7.3(1)散点图(略)。(2)。(3)。回归系数表示运送距离每增加1公里,运送时间平均增加0.00358天。7.4(1)散点图(略)。二者之间为高度的正线性相关关系。(2),二者之间为高度的正线性相关关系。(3)估计的回归方程为:。回归系数表示人均GDP每增加1元,人均消费水平平均增加0.308683元。(4)判定系数。表明在人均消费水平的变差中,有99.6259%是由人均GDP决定的。(5)检验统计量,拒绝原假设,线性关系显著。(6)(元)。(7)置信区间:[1990.749,2565.464];预测区间:[1580.463,2975.750]。7.5(1)散点图(略),二者之间为负的线性相关关系。(2)估计的回归方程为:。回归系数表示航班正点率每增加1%,顾客投诉次数平均下降4.7次。(3)检验统计量(P-Value=0.001108<),拒绝原假设,回归系数显著。(4)(次)。(5)置信区间:(37.660,70.619);预测区间:(7.572,100.707)。7.6Excel输出的结果如下(解释与分析请读者自己完成)MultipleR0.7951RSquare0.6322AdjustedRSquare0.6117标准误差2.685842 观测值20方差分析 dfSSMSFSignificanceF回归分析1223.1403223.140330.93322.79889E-05残差18129.84527.2136总计19352.9855    Coefficients标准误差tStatP-valueLower95%Upper95%Intercept49.31773.805012.96120.000041.323657.3117XVariable10.24920.04485.56180.00000.15510.34347.1(1)方差分析表中所缺的数值如下方差分析表变差来源dfSSMSFSignificanceF回归11422708.61422708.6354.2772.17E-09残差1040158.074015.807——总计111642866.67———(2)。表明汽车销售量的变差中有86.60%是由于广告费用的变动引起的。(3)。(4)。回归系数表示广告费用每增加一个单位,销售量平均增加1.420211个单位。(5)SignificanceF=2.17E-09<,线性关系显著。7.2;;。7.3(1)27。(2)4.41。(3)拒绝。(4)。(5)拒绝。7.4(1)。(2)。7.5;。7.6;预测28.586。42 7.1(略)。7.2(1)显著。(2)显著。(3)显著。7.3(1)。(2)。(3)不相同。方程(1)中的回归系数表示电视广告费用每增加1万元,月销售额平均增加1.6039万元;方程(1)中的回归系数表示在报纸广告费用不变的条件下,电视广告费用每增加1万元,月销售额平均增加2.2902万元。(4);。(5)的P-Value=0.0007,的P-Value=0.0098,均小于,两个回归系数均显著。7.4(1)(2)回归系数表示降雨量每增加1毫mm,小麦收获量平均增加22.3865kg/hm2;回归系数表示温度每增加1,小麦收获量平均增加327.6717kg/mh2。(3)可能存在。7.5(1)。(2);。(3)SignificanceF=3.88E-08<,线性关系显著。(4)的P-Value=0.1311>,不显著;的P-Value=0.0013<,显著;的P-Value=0.0571>,不显著。第8章时间序列分析和预测8.1(1)时间序列图(略)。(2)13.55%。(3)1232.90(亿元)。8.2(1)时间序列图(略)。(2)1421.2(公斤/公顷)。42 (3)时的预测值:,误差均方=291455;时的预测值:,误差均方=239123。更合适。8.1(1)3期移动平均预测值=630.33(万元)。(2)时的预测值:,误差均方=87514.7;时的预测值:,误差均方=62662.5;时的预测值:,误差均方=50236。更合适(3)趋势方程。估计标准误差。8.2(1)趋势图(略)。(2)趋势方程。2001年预测值=3336.89(亿元)。8.3(1)趋势图(略)。(2)线性趋势方程,2000年预测值=585.65(万吨)。8.4线性趋势:;二次曲线:;三次曲线:。8.5(1)原煤产量趋势图(略)。(2)趋势方程,预测值(亿吨)。8.6(1)图形(略)。(2)移动平均法或指数平滑法。(3)移动平均预测=72.49(万元);指数平滑法预测=72.5(万元)()。8.7(1)略。(2)结果如下2001年/月时间编号季节指数回归预测值最终预测值1971.04393056.303190.482980.99393077.503058.873990.95933098.712972.4841000.93983119.922931.9951010.94393141.132964.8861020.95893162.333032.3071030.92873183.542956.4381040.92613204.752967.8691050.98143225.963166.0542 101061.00753247.163271.51111071.04723268.373422.77121081.26943289.584175.958.1各季节指数如下1季度2季度3季度4季度季节指数0.75170.85131.23431.1627季节变动图(略)。计算趋势:分离季节因素后的趋势方程为:。图形(略)周期波动图(略)。8.2各月季节指数如下1月2月3月4月5月6月0.67440.66990.74320.79030.80610.85107月8月9月10月11月12月0.75520.34490.96191.19921.86622.3377季节变动图(略)。计算趋势:分离季节因素后的趋势方程为:。图形(略)。周期波动图(略)。随机波动图(略)。第9章指数9.1(1)。(2)。(3)。(4)13920元=26190元-12270元。9.2(1)111.72%。(2)111.60%。(3)100.10%。(4)15.3万元=15.1532万元+0.1468万元。9.3(1)2.62%;8016元。(2)28.42%;124864元。(3)143.37%;132880元。9.4(1)单位成本增长11.11%。(2);。9.5结果如下表:年份缩减后的人均GDP19901584.919911817.219922149.419932562.319943161.219954145.219965148.742 19975889.119986357.919996640.020007049.89.1,下跌1.48%。42 第1章统计与统计数据一、学习指导统计学是处理和分析数据的方法和技术,它几乎被应用到所有的学科检验领域。本章首先介绍统计学的含义和应用领域,然后介绍统计数据的类型及其来源,最后介绍统计中常用的一些基本概念。本章各节的主要内容和学习要点如下表所示。章节主要内容学习要点1.1统计及其应用领域什么是统计学概念:统计学,描述统计,推断统计。统计的应用领域统计在工商管理中的应用。统计的其他应用领域。1.2数据的类型分类数据、顺序数据、数值型数据概念:分类数据,顺序数据,数值型数据。不同数据的特点。观测数据和实验数据概念:观测数据,实验数据。截面数据和时间序列数据概念:截面数据,时间序列数据。1.3数据来源数据的间接来源统计数据的间接来源。二手数据的特点。数据的直接来源概念:抽样调查,普查。数据的间接来源。数据的收集方法。调查方案设计调查方案的内容。数据质量概念。抽样误差,非抽样误差。统计数据的质量。1.4统计中的几个基本概念总体和样本概念:总体,样本。参数和统计量概念:参数,统计量。变量概念:变量,分类变量,顺序变量,数值型变量,连续型变量,离散型变量。二、主要术语1.统计学:收集、处理、分析、解释数据并从数据中得出结论的科学。2.描述统计:研究数据收集、处理和描述的统计学分支。3.推断统计:研究如何利用样本数据来推断总体特征的统计学分支。4.分类数据:只能归于某一类别的非数字型数据。5.顺序数据:只能归于某一有序类别的非数字型数据。6.数值型数据:按数字尺度测量的观察值。7.观测数据:通过调查或观测而收集到的数据。8.实验数据:在实验中控制实验对象而收集到的数据。9.截面数据:在相同或近似相同的时间点上收集的数据。10.时间序列数据:在不同时间上收集到的数据。11.42 抽样调查:从总体中随机抽取一部分单位作为样本进行调查,并根据样本调查结果来推断总体特征的数据收集方法。1.普查:为特定目的而专门组织的全面调查。2.总体:包含所研究的全部个体(数据)的集合。3.样本:从总体中抽取的一部分元素的集合。4.样本容量:也称样本量,是构成样本的元素数目。5.参数:用来描述总体特征的概括性数字度量。6.统计量:用来描述样本特征的概括性数字度量。7.变量:说明现象某种特征的概念。8.分类变量:说明事物类别的一个名称。9.顺序变量:说明事物有序类别的一个名称。10.数值型变量:说明事物数字特征的一个名称。11.离散型变量:只能取可数值的变量。12.连续型变量:可以在一个或多个区间中取任何值的变量。四、习题答案1.D2.D3.A4.B5.A6.D7.C8.B9.A10.A11.C、12.C13.B14.A15.C16.D17.C18.A19.C20.D21.A22.C23.C24.B25.D26.C27.B28.D29.A30.D31.A32.B33.C34.A35.A36.A37.D38.B39.B40.C41.C42.D43.C44.D45.A46.B47.C48.A49.C50.D51.A52.C53.D54.A55.B42 第2章数据的图表展示一、学习指导数据的图表展示是应用统计的基本技能。本章首先介绍数据的预处理方法,然后介绍不同类型数据的整理与图示方法,最后介绍图表的合理使用问题。本章各节的主要内容和学习要点如下表所示。章节主要内容学习要点2.1数据的预处理数据审核数据审核的目的。原始数据和二手数据的审核内容。数据排序数据排序的目的。分类数据和数值型数据的排序方法。数据筛选数据筛选的目的。用Excel进行数据筛选。数据透视表数据透视表的用途。用Excel进行数据透视。2.2品质数据的整理与展示分类数据的整理与图示概念:频数,频数分布,比例,百分比,比率。用Excel制作分类数据的频数分布表。分类数据的图示:条形图,帕累托图,对比条形图,饼图。顺序数据的整理与图示概念:累积频数,累积频率。累积频数分布图。2.3数值型数据的整理与展示数据分组概念:数据分组,单变量值分组,组距分组,等距分组,不等距分组,组距,组中值。频数分布表的制作步骤。用Excel制作频数分布表。数值型数据的图示直方图的绘制。茎叶图的绘制。箱线图的绘制。直方图与条形图的区别。茎叶图与直方图的区别。线图的绘制。散点图的绘制。气泡图的绘制。雷达图的绘制。2.4合理使用图表鉴别图形优劣的准则图形应包括的基本特征。鉴别图形优劣的准则。统计表的设计统计表的结构。统计表的设计。42 二、主要术语1.频数:落在某一特定类别(或组)中的数据个数。2.频数分布:数据在各类别(或组)中的分配。3.比例:一个样本(或总体)中各个部分的数据与全部数据之比。4.比率:样本(或总体)中各不同类别数值之间的比值。5.累积频数:将各有序类别或组的频数逐级累加起来得到的频数。6.数据分组:根据统计研究的需要,将原始数据按照某种标准划分成不同的组别。7.组距分组:将全部变量值依次划分为若干个区间,并将这一区间的变量值作为一组。8.组距:一个组的上限与下限的差。9.组中值:每一组的下限和上限之间的中点值,即组中值=(下限值+上限值)/2。10.直方图:用矩形的宽度和高度(即面积)来表示频数分布的图形。11.茎叶图:由“茎”和“叶”两部分组成的、反应原始数据分布的图形。12.箱线图:由一组数据的最大值、最小值、中位数和两个四分位数5个特征值绘制而成的、反应原始数据分布的图形。四、习题答案1.C2.A3.B4.C5.D6.B7.C8.B9.B10.C11.A12.B13.B14.C15.C16.B17.D18.D19.C20.B21.C22.D23.D24.B25.D26.B27.B28.D29.D30.C31.B32.C33.C34.A35.B42 第3章数据的概括性度量一、学习指导数据分布的特征可以从三个方面进行描述:一是分布的集中趋势,反映各数据向其中心值靠拢或聚集的程度;二是分布的离散程度,反映各数据远离其中心值的趋势;三是分布的形状,反映数据分布偏斜程度和峰度。本章将从数据的不同类型出发,分别介绍集中趋势测度值的计算方法、特点及其应用场合。本章各节的主要内容和学习要点如下表所示。章节主要内容学习要点3.1集中趋势的度量众数概念:众数。众数的特点。中位数和分位数概念:中位数,四分位数。中位数和四分位数的特点。中位数和四分位数的计算。平均数概念:平均数,简单平均数,加权平均数,几何平均数。简单平均数和加权平均数的计算。平均数的性质。几何平均数的计算和应用场合。众数、中位数和平均数的比较众数、中位数和平均数在分布上的关系。众数、中位数和平均数的特点及应用场合。3.2离散程度的度量异众比率概念:异众比率。异众比率的计算和应用场合。四分位差概念:四分位差。四分位差的计算和应用场合。方差和标准差概念:极差,平均差,方差,标准差。极差的计算和特点。平均差的计算和特点。样本方差和标准差的计算。总体方差和标准差的计算。相对位置的度量概念:标准分数。标准分数的计算和应用。经验法则。切比雪夫不等式。离散系数概念:离散系数。离散系数的计算。离散系数的用途。3.3偏态与峰态的度量偏态及其测度概念:偏态,偏态系数。偏态系数的计算。偏态系数数值的意义。42 峰态及其测度概念:峰态,峰态系数。峰态系数的计算。峰态系数数值的意义。用Excel计算描述统计量。Excel统计函数的应用。二、主要术语和公式(一)主要术语1.众数:一组数据中出现频数最多的变量值,用表示。2.中位数:一组数据排序后处于中间位置上的变量值,用表示。3.四分位数:一组数据排序后处于25%和75%位置上的值。4.平均数:一组数据相加后除以数据的个数而得到的结果。5.几何平均数:n个变量值乘积的n次方根,用表示。6.异众比率:非众数组的频数占总频数的比率。7.四分位差:也称为内距或四分间距,上四分位数与下四分位数之差。8.极差:也称全距,一组数据的最大值与最小值之差。9.平均差:也称平均绝对离差,各变量值与其平均数离差绝对值的平均数。10.方差:各变量值与其平均数离差平方的平均数。11.标准差:方差的平方根。12.标准分数:变量值与其平均数的离差除以标准差后的值。13.离散系数:也称为变异系数,一组数据的标准差与其相应的平均数之比。14.偏态:数据分布的不对称性。15.偏态系数:对数据分布不对称性的度量值。16.峰态:数据分布的平峰或尖峰程度。17.峰态系数:对数据分布峰态的度量值。(二)主要公式名称公式中位数简单样本平均数42 加权样本平均数几何平均数异众比率四分位差极差简单平均差加权平均差简单样本方差简单样本标准方差加权样本方差加权样本标准差标准分数离散系数42 未分组数据的偏态系数分组数据的偏态系数未分组数据的峰态系数分组数据的峰态系数四、习题答案1.A2.C3.B4.C5.D6.B7.D8.A9.A10.C11.B12.C13.A14.B15.A16.B17.A18.B19.C20.A21.B22.C23.C24.C25.C26.D27.A28.A29.B30.B31.A32.A33.B34.B35.A36.B37.A38.C39.B40.A41.A42.B43.B44.A45.B46.A47.C48.D49.B50.A51.C52.D53.B54.D55.B56.A57.B58.D59.A60.B61.C62.D63.A64.C65.D66.D67.C68.B69.D70.D71.A72.B73.D74.C75.A76.D77.D78.A79.A80.C81.D82.D83.A84.A85.A86.D42 第4章抽样与参数估计一、学习指导参数估计是推断统计的重要内容之一,它是在抽样及抽样分布的基础上,根据样本统计量来推断我们所关心的总体参数。本章首先介绍抽样分布的有关知识,然后讨论参数估计的一般问题,最后介绍一个总体参数估计的基本方法和参数估计中样本容量的确定问题。本章各节的主要内容和学习要点如下表所示。章节主要内容学习要点4.1抽样与抽样分布概率抽样方法概念:简单随机抽样,简单随机样本,重复抽样,不重复抽样,分层抽样,系统抽样,整群抽样。用Excel抽取简单随机样本。抽样分布概念:抽样分布,样本均值的抽样分布,样本比例的抽样分布,样本方差的抽样分布。中心极限定理。样本均值抽样分布的特征。样本均值的抽样分布与总体分布的关系。样本比例抽样分布的形式和特征。样本方差抽样分布的形式。4.2参数估计的一般问题估计量与估计值概念:估计量,估计值。点估计与区间估计概念:点估计,区间估计,置信区间,置信水平。置信区间构建的原理。置信区间的解释。评价估计量的标准概念:无偏性,有效性,一致性。4.3总体均值的区间估计正态总体、方差已知,或非正态总体、大样本正态总体、方差已知时的置信区间。非正态总体、大样本时的置信区间。用Excel计算给定的正态分布的临界值。正态总体、方差未知、小样本正态总体、方差已知时的小样本置信区间。正态总体、方差未知时的小样本置信区间。用Excel计算给定的t分布的临界值。4.4总体比例的区间估计总体比例的区间估计总体比例的置信区间。4.5总体方差的区间估计总体方差的区间估计总体方差的置信区间。42 用Excel计算给定的分布的临界值。4.6样本容量的确定估计总体均值时样本容量的确定样本容量的计算方法。估计总体比例时样本容量的确定样本容量的计算方法。二、主要术语和公式(一)主要术语1.简单随机抽样:也称纯随机抽样,它是从含有个元素的总体中,抽取个元素作为样本,使得总体中的每一个元素都有相同的机会(概率)被抽中。2.简单随机样本:从含有个元素的总体中,抽取个元素作为样本,使得总体中每一个样本量为的样本都有相同的机会(概率)被抽中。3.重复抽样:从总体中抽取一个元素后,把这个元素放回到总体中再抽取第二个元素,直至抽取个元素为止。4.不重复抽样:一个元素被抽中后不再放回总体,而是从所剩元素中抽取第二个元素,直到抽取个元素为止。5.分层抽样:也称分类抽样,它是在抽样之前先将总体的元素划分为若干层(类),然后从各个层中抽取一定数量的元素组成一个样本。6.系统抽样:也称等距抽样或机械抽样,它是先将总体中的各元素按某种顺序排列,并按某种规则确定一个随机起点;然后,每隔一定的间隔抽取一个元素,直至抽取个元素形成一个样本。7.整群抽样:先将总体划分成若干群,然后以群作为抽样单位从中抽取部分群,随后再对抽中的各个群中所包含的所有元素进行观察。8.抽样分布:在重复选取样本量为的样本时,由样本统计量的所有可能取值形成的相对频数分布。9.样本均值的抽样分布:在重复选取样本量为的样本时,由样本均值的所有可能取值形成的相对频数分布。10.样本比例抽样分布:在重复选取样本量为的样本时,由样本比例的所有可能取值形成的相对频数分布。11.标准误差:也称为标准误,它是样本统计量的抽样分布的标准差。12.估计标准误差:若计算标准误时所涉及的总体参数未知,可用样本统计量代替计算的标准误。13.估计量:用来估计总体参数的统计量的名称,用符号表示。14.估计值:用来估计总体参数时计算出来的估计量的具体数值。15.点估计:用样本统计量的某个取值直接作为总体参数的估计值。16.区间估计:在点估计的基础上,给出总体参数估计的一个范围。17.置信区间:由样本统计量所构造的总体参数的估计区间。18.42 置信水平:也称为置信系数,它是将构造置信区间的步骤重复多次后,置信区间中包含总体参数真值的次数所占的比率。(二)主要公式名称公式总体均值的置信区间(正态总体,已知)总体均值的置信区间(未知,大样本)总体均值的置信区间(正态总体,未知,小样本)总体比例的置信区间总体方差的置信区间估计总体均值时的样本容量估计总体比例时的样本容量四、习题答案1.A2.B3.A4.B5.B6.C7.D8.C9.A10.C11.A12.A13.C14.A15.D16.B17.A18.B19.D20.B21.A22.C23.A24.B25.A26.C27.D28.C29.B30.D31.A32.B33.C34.C35.D36.B37.D38.D39.C40.C41.B42.C43.D44.D45.A46.C47.A48.B49.C50.A51.D52.A53.B54.C55.A56.A57.A58.A59.A60.C61.B62.A63.A64.D65.C66.B67.A68.A69.B70.B71.B72.C73.B74.B75.D42 1.B2.D3.B4.B5.B6.A7.A8.A9.D10.D11.B12.C13.C14.B15.B16.B17.D18.D19.C20.C21.A22.A23.D24.A25.B26.C27.A28.C29.B30.A31.A32.A33.A34.A35.A36.A37.B38.A39.B40.C41.A42.A43.C44.C45.C46.B47.A48.B49.B50.A51.D52.C53.A54.B55.B56.C57.B58.B59.B60.A61.C62.C63.B64.C65.C66.B67.C68.B69.A70.B71.A72.A73.A74.C75.C76.D77.A78.B79.B80.C81.D42 第5章假设检验一、学习指导假设检验是推断统计的另一项重要内容,它是利用样本信息判断假设是否成立的一种统计方法。本章首先介绍有关假设检验的一些基本问题,然后介绍一个总体参数的检验方法。本章各节的主要内容和学习要点如下表所。章节主要内容学习要点5.1假设检验的基本问题假设的陈述概念:假设,假设检验,原假设,备择假设,单侧检验,双侧检验。针对具体的实际问题,建立合理的原假设和备择假设。两类错误与显著性水平概念:第Ⅰ类错误,第Ⅱ类错误,显著性水平。两类错误的控制。两类错误的关系。检验统计量与拒绝域概念:检验统计量,标准化检验统计量,拒绝域,临界值。统计量检验的原理。利用统计量检验的决策准则。利用P值进行决策概念:P值。P值决策的原理,P值的计算。P值检验与统计量检验的异同。P值决策的准则。小结假设检验的步骤。假设检验结果的表述。5.2总体均值的检验大样本的检验方法总体方差已知时,均值检验的统计量和程序。总体方差未知时,均值检验的统计量和程序。用Excel计算P值。小样本的检验方法总体方差已知时,均值检验的统计量和程序。总体方差未知时,均值检验的统计量和程序。用Excel计算P值。5.3总体比例的检验总体比例的检验检验的统计量。检验的程序。用Excel计算P值。5.4总体方差的检验总体方差的检验检验的统计量。检验的程序。用Excel计算P值。42 二、主要术语和公式(一)主要术语1.假设:对总体参数的具体数值所做的陈述。2.假设检验:先对总体参数提出某种假设,然后利用样本信息判断假设是否成立的过程。3.备择假设:也称研究假设,是研究者想收集证据予以支持的假设,用或表示。4.原假设:也称零假设,是研究者想收集证据予以反对的假设,用表示。5.单侧检验:也称单尾检验,是指备择假设具有特定的方向性,并含有符号“>”或“<”的假设检验。6.双侧检验:也称双尾检验,是指备择假设没有特定的方向性,并含有符号“¹”的假设检验。7.第Ⅰ类错误:当原假设为正确时拒绝原假设,犯第Ⅰ类错误的概率记为。8.第Ⅱ类错误:当原假设为错误时没有拒绝原假设,犯第Ⅱ类错误的概率通常记为。9.显著性水平:假设检验中发生第Ⅰ类错误的概率,记为。10.检验统计量:根据样本观测结果计算得到的,并据以对原假设和备择假设做出决策的某个样本统计量。11.拒绝域:能够拒绝原假设的检验统计量的所有可能取值的集合。12.临界值:根据给定的显著性水平确定的拒绝域的边界值。13.值:也称观察到的显著性水平,如果原假设是正确的,那么所得的样本结果出现实际观测结果那么极端的概率。(二)主要公式名称公式总体均值检验的统计量(正态总体,已知)总体均值检验的统计量(未知,大样本)总体均值检验的统计量(正态总体,未知,小样本)总体比例检验的统计量总体方差检验的统计量42 四、习题答案1.A2.D3.C4.A5.B6.C7.A8.B9.A10.B11.A12.C13.A14.C15.D16.C17.A18.B19.A20.B21.B22.A23.B24.B25.A26.D27.D28.D29.A30.B31.B32.C33.B34.A35.C36.B37.A38.D39.D40.C41.C42.C43.C44.A45.B46.A47.B48.D49.A50.A51.B52.D53.C54.A55.B56.C57.A58.C59.D60.C61.C62.A63.D64.B65.A66.D67.D68.A69.C70.D71.A72.C73.B74.A75.A76.B77.C78.D79.A80.C81.D82.B83.A84.A85.C86.B87.A88.C89.A90.A91.A92.A93.A94.B95.C96.B97.A98.A99.A100.B101.D102.C103.B104.D105.B106.B107.A108.A109.B110.A111.B112.A113.A114.B115.B116.B117.B118.A119.B120.B121.B122.D123.A42 第6章方差分析一、学习指导本章主要介绍检验多个总体均值是否相等的一种统计方法,即方差分析。它是通过对各观察数据误差来源的分析来判断多个总体均值是否相等。本章首先介绍方差分析中的一些基本问题,包括方差分析中的一些术语、方差分析的基本思想和基本假设,然后介绍单因素方差分析方法,最后介绍方差分析中的多重比较。本章各节的主要内容和学习要点如下表所示。章节主要内容学习要点6.1方差分析的基本问题方差分析及有关术语概念:方差分析,因子,处理。方差分析的基本思想和原理概念:组内误差,组间误差,总平方和,组内平方和,组间平方和。误差的分解总平方和、组内平方和、组间平方和的关系。方差分析中的基本假定方差分析中的3个基本假定。问题的一般提法方差分析中假设的提法。6.2单因素方差分析数据结构概念:单因素方差分析。数据结构。分析步骤概念:总平方和,组内方差,组间方差。假设的提法。总平方和、组内方差、组间方差的计算方法。检验统计量的计算方法。统计决策。方差分析表的结构。用Excel进行方差分析。关系强度的测量关系强度的测量方法。6.3方差分析中的多重比较方差分析中的多重比较多重比较的前提。多重比较的作用。多重比较的方法。二、主要术语和公式(一)主要术语1.方差分析(ANOVA):检验多个总体均值是否相等的统计方法。2.因素:也称因子,是方差分析中所要检验的对象。42 1.水平:也称处理,是因素的不同表现。2.组内误差:来自水平内部的数据误差。3.组间误差:来自不同水平之间的数据误差。4.总平方和:反映全部数据误差大小的平方和,记为SST。5.组内平方和:反映组内误差大小的平方和,记为SSE。6.组间平方和:反映组间误差大小的平方和,记为SSA。7.单因素方差分析:只涉及一个分类型自变量的方差分析。8.组内方差:组内平方和除以相应的自由度。9.组间方差:组间平方和除以相应的自由度。(二)主要公式名称公式组间方差组内方差方差分析的检验统计量关系强度的测量多重比较的LSD四、习题答案1.C2.B3.B4.D5.A6.A7.C8.D9.D10.C11.C12.A13.A14.B15.D16.B17.A18.B19.C20.D21.C22.A23.B24.A25.C26.A27.C28.B29.C30.A31.A32.B33.A34.A35.B36.A37.D38.C39.B40.B41.D42.B43.A44.B45.C46.D47.B48.A42 1.A2.A3.A4.A5.D6.C7.C8.B9.D10.D11.B12.A13.D14.A15.B42 第7章相关与回归分析一、学习指导相关与回归是研究变量之间关系的统计方法,该方法广泛应用于自然科学和社会科学的各个领域。本章首先介绍相关分析方法,然后介绍一元线性回归和多元线性回归分析方法。本章各节的主要内容和学习要点如下表所示。章节主要内容学习要点7.1变量间关系的度量变量间的关系概念:函数关系,相关关系。相关关系的特点。相关关系的描述与测度概念:相关系数。相关分析的内容。散点图的绘制和分析。相关系数的计算。相关系数的性质。相关系数的显著性检验相关系数检验的目的。相关系数检验的程序。7.2一元线性回归一元线性回归模型概念:回归模型,回归方程,估计的回归方程。回归分析的内容。回归模型的基本假定。参数的最小二乘估计概念:最小二乘法。和的计算。的解释。用Excel进行回归。回归直线的拟合优度概念:总平方和,回归平方和,残差平方和,判定系数,估计量的标准误差。判定系数的计算和解释。判定系数与相关系数的关系。估计量的标准误差的计算和解释。显著性检验线性相关检验的目的。线性关系显著性检验的程序。回归系数检验的目的。回归系数检验的程序。Excel输出的回归结果的解释和应用。42 利用回归方程进行估计和预测概念:平均值的点估计,个别值的点估计,平均值的置信区间估计,个别值的预测区间估计。平均值的点估计和个别值的点估计的区别。平均值的置信区间估计和个别值的预测区间估计的区别。点估计和区间估计的计算方法。7.3多元线性回归多元回归模型与回归方程概念:多元线性回归模型,多元线性回归方程,估计的多元线性回归方程。偏回归系数的解释。参数的最小二乘估计参数的最小二乘估计方法。用Excel进行回归。回归方程的拟合优度概念:多重判定系数,修正的多重判定系数,估计标准误差。判定系数的实际意义。估计标准误差的实际意义。Excel回归结果的解释。显著性检验线性关系检验与回归系数检验的区别。线性关系检验的程序。回归系数检验的程序。Excel回归结果的解释和应用。二、主要术语和公式(一)主要术语1.相关关系:变量之间存在的不确定的数量关系。2.相关系数:也称Pearson相关系数,是根据样本数据计算的度量两个变量之间线性关系强度的统计量。3.因变量:被预测或被解释的变量,用y表示。4.自变量:用来预测或用来解释因变量的一个或多个变量,用x表示。5.回归模型:描述因变量y如何依赖于自变量x和误差项的方程。6.回归方程:描述因变量y的期望值如何依赖于自变量x的方程。7.估计的回归方程:根据样本数据求出的回归方程的估计。8.最小二乘法:也称最小平方法,使因变量的观察值与估计值之间的离差平方和达到最小来求得和的方法。9.判定系数:回归平方和占总平方和的比例,记为。10.估计量的标准误差:均方残差(MSE)的平方根,用来表示。11.的平均值的点估计:利用估计的回归方程,对于的一个特定值,求出42 的平均值的一个估计值。1.的个别值的估计值:利用估计的回归方程,对于的一个特定值,求出的一个个别值的估计值。2.的平均值的置信区间估计:对的一个给定值,求出的平均值的区间估计。3.的个别值的预测区间估计:对的一个给定值,求出的一个个别值的区间估计。4.多元线性回归模型:描述因变量如何依赖于自变量和误差项的方程。5.多元线性回归方程:描述的期望值如何依赖于的方程。6.估计的多元线性回归方程:根据样本数据得到的多元线性回归方程的估计。7.多重判定系数:在多元回归中,回归平方和占总平方和的比例。8.修正的多重判定系数:用模型中自变量的个数和样本量进行调整的多重判定系数,记为。(二)主要公式名称公式相关系数相关系数检验的统计量回归方程的截距回归方程的斜率(回归系数)判定系数估计标准误差线性关系检验的统计量42 回归系数检验的统计的统计量的平均值的置信区间的个别值的预测区间修正的多重判定系数四、习题答案1.D2.D3.A4.B5.B6.A7.B8.C9.C10.A11.A12.B13.D14.C15.A16.C17.C18.A19.A20.D21.B22.A23.B24.A25.C26.C27.A28.A29.B30.B31.B32.C33.C34.B35.D36.D37.C38.B39.D40.A41.B42.B43.A44.B45.A46.B47.A48.A49.A50.C51.C52.C53.B54.D55.B56.C57.A58.A59.C60.A61.A62.B63.D64.C65.B66.B67.A68.C69.A70.A71.C72.A73.D74.B75.C76.A77.D78.B79.B80.D42 第8章时间序列分析和预测一、学习指导分析时间序列数据的主要目的是对未来的观测值进行预测。本章在给出时间序列概念及分类的基础上,首先介绍了时间序列的描述性分析方法,然后介绍了平稳序列和非平稳序列的一些简单预测方法。本章各节的主要内容和学习要点如下表所示。章节主要内容学习要点8.1时间序列及其分解时间序列及其分解概念:时间序列,平稳序列,非平稳序列,趋势,季节性,周期性,随机性。时间序列的分解模型。8.2时间序列的描述性分析图形描述时间序列的图形描述。增长率分析概念:增长率,环比增长率,定基增长率,平均增长率,年度化增长率,增长1%绝对值。一般增长率的计算与分析。平均增长率的计算与分析。年度化增长率的计算与分析。增长率分析中应注意的问题。增长1%绝对值的计算和应用。8.3时间序列的预测程序确定时间序列的成分时间序列的预测步骤。趋势成分的确定方法。季节性成分的确定方法。选择预测方法时间序列的类型和预测方法的预测方法的评估概念:平均误差,平均绝对误差,均方误差,平均百分比误差和平均绝对百分比误差。各种误差的计算方法。8.4平稳序列的预测简单平均法简单平均法预测。移动平均法移动平均法预测。用Excel进行移动平均预测。指数平滑法指数平滑法预测。用Excel进行指数平滑预测。8.5趋势型序列的预测线性趋势预测直线趋势方程的求法。直线趋势方程预测。非线性趋势预测二次曲线预测。指数趋势预测,指数曲线和直线的区别。修正指数曲线预测。龚铂茨曲线预测。Logistic曲线预测8.6复合型序列的分解预测确定并分离季节成分季节指数的计算。分离季节成分。建立预测模型并进行预测建立预测模型。42 计算最后的预测值最终预测值的计算。二、主要术语和公式(一)主要术语1.时间序列:同一现象在不同时间上的相继观察值排列而成的序列。2.平稳序列:基本上不存在趋势的序列。3.非平稳序列:包含趋势性、季节性或周期性的序列。4.趋势:也称长期趋势,是指时间序列在长时期内呈现出来的某种持续向上或持续下降的变动。5.季节性:也称季节变动,是指时间序列在一年内重复出现的周期性波动。6.周期性:也称循环波动,是指时间序列中呈现出来的围绕长期趋势的一种波浪形或振荡式变动。7.随机性:也称不规则波动,是指时间序列中除去趋势、周期性和季节性之后的偶然性波动。8.增长率:也称增长速度,是指时间序列中报告期观察值与基期观察值之比减1后的结果,用%表示。9.平均增长率:也称平均发展速度,是指时间序列中各逐期环比值(也称环比发展速度)的几何平均数减1后的结果。10.增长1%绝对值:增长率每增长一个百分点而增加的绝对数量。11.简单平均法预测:根据过去已有的期观察值通过简单平均来预测下一期的数值。12.移动平均法预测:通过对时间序列逐期递移求得平均数作为预测值的一种预测方法。13.指数平滑法预测:对过去的观察值加权平均进行预测的一种方法,该方法使得第+1期的预测值等于期的实际观察值与第期指数预测值的加权平均值。(二)主要公式名称公式环比增长率定基增长率平均增长率年度化增长率平均预测误差42 平均绝对预测误差均方预测误差平均百分比预测误差简单平均法预测移动平均法预测指数平滑法预测线性趋势方程的截距和斜率二次曲线的标准方程组指数曲线的标准方程组修正指数曲线的未知数42 龚铂茨曲线的未知数Logistic曲线未知数四、习题答案1.A2.D3.A4.B5.C6.D7.B8.A9.B10.A11.C12.C13.D14.D15.D16.B17.D18.B19.A20.A21.A22.D23.D24.C25.D26.B27.A28.C29.B30.B31.A32.C33.D34.B35.C36.B37.A38.B39.B40.D41.C42.A43.A44.C45.A46.B47.C48.A49.A50.C51.D52.B53.B54.C55.D56.C57.B58.D59.D60.C61.A62.A63.B64.B42 第9章指数一、学习指导指数是应用于经济领域的一种特殊统计方法。本章首先介绍指数的概念和分类,然后介绍加权指数的编制方法,最后介绍实际中几种常用的价格指数。本章各节的主要内容和学习要点如下表所示。章节主要内容学习要点9.1引言指数的概念和分类概念:指数,个体指数,综合指数,简单指数,加权指数,时间性指数,区域性指数。9.2加权指数加权综合指数概念:加权综合指数。加权综合指数的编制。加权平均指数概念:加权平均指数。加权平均指数的编制。价值指数与指数体系概念:价值指数,指数体系。指数体系的应用。9.3几种常用的价格指数几种常用的价格指数概念:零售价格指数,居民消费价格指数,生产价格指数,股票价格指数。零售价格指数和居民消费价格指数的区别。居民消费价格指数的作用。二、主要术语和公式(一)主要术语1.指数:测定多个项目在不同场合下综合变动的相对数。2.加权综合指数:通过加权来测定一组项目的综合变动状况的指数。3.加权平均指数:以某一时期的价值总量为权数对个体指数加权平均计算的指数。4.价值指数:由两个不同时期的价值总量对比形成的指数。5.指数体系:由价值指数及其若干个因素指数构成的数量关系式。6.零售价格指数:反映城乡商品零售价格变动趋势的一种经济指数。7.居民消费价格指数:反映一定时期内城乡居民所购买的生活消费品价格和服务项目价格的变动趋势和程度的一种相对数。8.生产价格指数:测量在初级市场上所售货物(即在非零售市场上首次购买某种商品时)价格变动的一种价格指数。9.股票价格指数:是反映某一股票市场上多种股票价格变动趋势的一种相对数。(二)主要公式名称公式加权综合价格指数42 加权综合销售量指数加权平均价格指数加权平均销售量指数价值指数四、习题答案1.A2.B3.C4.D5.D6.A7.C8.C9.A10.B11.A12.B13.B14.B15.A16.A17.C18.D19.A20.B21.D22.B23.C24.C25.D26.B27.C42'