• 1.10 MB
  • 2022-04-22 11:50:27 发布

统计学部分习题参考答案.doc

  • 32页
  • 当前文档由用户上传发布,收益归属用户
  1. 1、本文档共5页,可阅读全部内容。
  2. 2、本文档内容版权归属内容提供方,所产生的收益全部归内容提供方所有。如果您对本文有版权争议,可选择认领,认领后既往收益都归您。
  3. 3、本文档由用户上传,本站不保证质量和数量令人满意,可能有诸多瑕疵,付费之前,请仔细先通过免费阅读内容等途径辨别内容交易风险。如存在严重挂羊头卖狗肉之情形,可联系本站下载客服投诉处理。
  4. 文档侵权举报电话:19940600175。
'统计学导论曾五一、肖红叶主编部分习题参考解答(含简答题)2012年3月12日修改 《统计学导论》部分习题参考解答(含简答题)第一章绪论一、判断题1.答:错。统计学和数学具有不同的性质特点。数学撇开具体的对象,以最一般的形式研究数量的联系和空间形式;而统计学的数据则总是与客观的对象联系在一起。特别是统计学中的应用统计学与各不同领域的实质性学科有着非常密切的联系,是有具体对象的方法论。3.答:错。实质性科学研究该领域现象的本质关系和变化规律;而统计学则是为研究认识这些关系和规律提供合适的方法,特别是数量分析的方法。5.答:错。描述统计不仅仅使用文字和图表来描述,更重要的是要利用有关统计指标反映客观事物的数量特征。7.答:错。不少社会经济的统计问题属于无限总体。例如要研究消费者的消费倾向,消费者不仅包括现在的消费者而且还包括未来的消费者,因而实际上是一个无限总体。二、单项选择题1.A;3.A。三、分析问答题1.答:定类尺度的数学特征是“=”或“”,所以只可用来分类,民族可以区分为汉、藏、回等,但没有顺序和优劣之分,所以是定类尺度数据。;定序尺度的数学特征是“>”或“<”,所以它不但可以分类,还可以反映各类的优劣和顺序,教育程度可划分为大学、中学和小学,属于定序尺度数据;定距尺度的主要数学特征是“+”或“-”,它不但可以排序,还可以用确切的数值反映现象在两方面的差异,人口数、信教人数、进出口总额都是定距尺度数据;定比尺度的主要数学特征是“”或“”,它通常都是相对数或平均数,所以经济增长率是定比尺度数据。3.答:如考察全国居民人均住房情况,全国所有居民构成统计总体,每一户居民是总体单位,抽查其中5000户,这被调查的5000户居民构成样本。第二章统计数据的搜集、整理与显示一、单项选择题1.C;3.A。二、多项选择题1.A.B.C.D;3.A.B.C.三、简答题1.答:这种说法不对。从理论上分析,统计上的误差可分为登记性误差、代表性误差和推算误差。无论是全面调查还是抽样调查都会存在登记误差。而代表性误差和推算误差则是抽样调查所固有的。这样从表面来看,似乎全面调查的准确性一定会高于统计估算。但是,在全面调查的登记误差特别是其中的系统误差相当大,而抽样调查实现了科学化和规范化的场合,后者的误差也有可能小于前者。我国农产量调查中,利用抽样调查资料估算的粮食产量数字的可信程度大于全面报表的可信程度,就是一个很有说服力的事例。3.答:这种分组方法不合适。统计分组应该遵循“互斥性原则”,本题所示的分组方式违反了“互斥性原则”,例如,一观众是少女,若按以上分组,她既可被分在“女”组,又可被分在“少”组。四、计算题 解:(1)次(频)数分布和频率分布数列。居民户月消费品支出额(元)次(频)数频率(%)800以下800~850850~900900~950950~10001000~10501050~11001100以上141218841228243616824合计50100.00(2)编制向上和向下累计频数、频率数列。(3)绘制直方图、折线图、曲线图和向上、向下累计图。主要操作步骤:①次数和频率分布数列输入到Excel。②选定分布数列所在区域,并进入图表向导,在向导第1步中选定“簇状柱形图”类型,单击“完成”,即可绘制出次数和频率的柱形图。③将频率柱形图绘制在次坐标轴上,并将其改成折线图。主要操作步骤:在“直方图和折线图”基础上,将频率折线图改为“平滑线散点图”即可。主要操作步骤:①将下表数据输入到Excel。组限向上累计向下累计750050800149850545900173395035151000437105047311004821150500②选定所输入的数据,并进入图表向导,在向导第1步中选定“无数据点平滑线散点图”类型,单击“完成”,即可绘制出累计曲线图。(4)根据图形说明居民月人均可支配收入分布的特征。分布特征是呈现出轻微右偏态的特征。第三章数据分布特征的描述一、单项选择题1.D;3.B;5.A。二、判断分析题1.答:均值。呈右偏分布。由于存在极大值,使均值高于中位数和众数,而只有较少的数据高于均值。 3.答:峰度系数,属于尖顶分布。5.答:为了了解房屋价格变化的走势,宜选择住房价格的中位数来观察,因为均值受极端值影响;如果为了确定交易税率,估计相应税收总额,应利用均值,因为均值才能推算总体有关的总量。三、计算题1.解:基期总平均成本==660(元/吨)报告期总平均成本==640(元/吨)总平均成本下降的原因是该公司产品的生产结构发生了变化,即成本较低的甲企业产量占的比重上升、而成本较高的乙企业产量占的比重相应下降所致。3.解:根据总体方差的计算公式可得:;全部学生成绩的方差=2.745总体方差(208.2199)=组内方差平均数(205.4749)+组间方差(2.745)5.解:6.解:假设身高变量xi服从正态分布,则可查找《标准正态分布概率表》,估计出各种区间的人数比重,从而计算出人数,确定学生校服的套数。首先,对身高变量xi进行标准化:,得到以下的结果:Xi=160cm164cm168cmZi=-1.001.0Pi=15.865%68.27%15.865%Ni=190.38人819.24人190.38人然后,用男生总数1200人,分别乘以比重,即可确定校服的套数约为191,820,191套。7.解:用1代表“是”(即具有某种特征),0代表“非”(即不具有某种特征)。设总次数为N,1出现次数为N1,频率(N1/N)记为P。 由加权公式就不难得出:是非变量的均值=P;方差=P(1-P);标准差=。第四章概率基础一、判断分析题1.答:(1);(2);(3);(4);(5);(6);(7)3.答:表示没有次品;表示次品不超过一件。二、计算题1.解:设A、B、C分别表示炸弹炸中第一军火库、第二军火库、第三军火库这三个事件。于是,P(A)=0.025P(B)=0.1P(C)=0.1又以D表示军火库爆炸这一事件,则有,D=A+B+C其中A、B、C是互不相容事件(一个炸弹不会同时炸中两个或两个以上军火库)∴P(D)=P(A)+P(B)+P(C)=0.025+0.1+0.1=0.2253.解:设A表示这种动物活到20岁、B表示这种动物活到25岁。∵BA∴B=AB∴P(B|A)====0.55.解:设B1={第一台车床的产品};B2={第二台车床的产品};A={合格品}。则P(B1)=P(B2)=P(A|B1)=1-0.03=0.97P(A|B2)=1-0.02=0.98由全概率公式得:P(A)=P(B1)*P(A|B1)+P(B2)*P(A|B2)=*0.97+*0.98=0.9737.解:设B1={第一台车床的产品};B2={第二台车床的产品};A={废品}。则P(B1)=P(B2)=P(A|B1)=0.03P(A|B2)=0.02P(B2|A)====0.259.解:(1)一次投篮投中次数的概率分布表X=xi01P(X=xi)0.70.3(2)重复投篮5次,投中次数的概率分布表X=xi012345P(X=xi)0.168070.360150.308700.132300.028350.0024311.解: P(140011)=0.01;当f1=5、f2=6时P(X<5)=1-0.05=0.9515.解:X=xi23456789101112P(X=xi)E(X)==2*+3*+4*+5*+6*+7*+8*+9*+10*+11*+12*==7V(X)==*+*+*+*+*+*+*+*+*+*+*==5.83317.解:+=0.0769+0.2025=0.2794三、证明题1.证: 因于是3.证:第五章抽样分布与参数估计一、单项选择题(1)BC;(3)A;(5)AC。二、计算题1.解:样本平均数=425(米/秒)==(米/秒)2.1448==2.1448×2.1916=4.7005(米/秒)所求μ的置信区间为:425-4.7005≤μ≤425+4.7005,即[420.30,429.70](米/秒)。3.解:n=600,p=0.1,nP=60≥5,可以认为n充分大。α=0.05,。因此,一次投掷中发生1点的概率的置信区间为:0.1-0.0122<<0.1+0.0122,即(0.0878,0.1122)。5.解: 根据已知条件可以计算得:估计量=*14820=494(分钟)估计量的估计方差=**=1743.1653其中:===53017.9310(设α=0.05)7.解:,,置信度为0.95的置信区间为:=9.解:≈242(户)表明应抽取242户进行调查。第六章假设检验与方差分析一、单项选择题1.B;3.A;5.A。二、问答题1.答:双侧检验;检验统计量的样本值2.22;观察到的显著性水平0.0132;显著性水平为0.05时,,拒绝原假设;显著性水平为0.01时,,不能拒绝原假设。3.答:(1)拒绝域;(2)样本均值为23,24,25.5时,犯第一类错误的概率都是0.01。 三、计算题1.解:(1)提出假设:H0:μ=5H1:μ5(2)构造检验统计量并计算样本观测值在H0:μ=5成立的条件下,Z===-2.3570(3)确定临界值和拒绝域Z0.025=1.96∴拒绝域为(4)做出检验决策∵=2.3570>Z0.025=1.96检验统计量的样本观测值落在拒绝域。∴拒绝原假设H0,接受H1假设,认为生产控制水平不正常。3.解:α=0.05时(1)提出假设:H0:μ=60H1:μ60(2)构造检验统计量并计算样本观测值在H0:μ=60成立条件下:Z===2.222(3)确定临界值和拒绝域Z0.025=1.96∴拒绝域为(4)做出检验决策∵Z=2.222>Z0.025=1.96检验统计量的样本观测值落在拒绝域。∴拒绝原假设H0,接受H1假设,认为该县六年级男生体重的数学期望不等于60公斤。α=0.01时(1)提出假设:H0:μ=60H1:μ60(2)构造检验统计量并计算样本观测值在H0:μ=60成立条件下:Z===2.222 (3)确定临界值和拒绝域Z0.005=2.575∴拒绝域为(4)做出检验决策∵Z=2.222Z0.025=1.96检验统计量的样本观测值落在拒绝域。∴拒绝原假设H0,接受H1假设,即能够推翻所作的猜测。7.解:(1)提出假设:H0:μ1=μ2H1:μ1μ2(2)构造检验统计量并计算样本观测值在H0成立条件下:Z===2.209(3)确定临界值和拒绝域Z0.025=1.96∴拒绝域为(4)做出检验决策 ∵Z=2.209>Z0.025=1.96检验统计量的样本观测值落在拒绝域。∴拒绝原假设H0,接受H1假设,即两地的教育水平有显著差异。9.解:(1)提出假设:H0:1=2H1:12(2)构造检验统计量并计算样本观测值在H0成立条件下:p=(n1p1+n2p2)/(n1+n2)=(400*0.1+600*0.05)/(400+600)=0.07Z===-3.036(3)确定临界值和拒绝域Z0.05=1.645∴拒绝域为(4)做出检验决策∵=3.036>Z0.05=1.645检验统计量的样本观测值落在拒绝域。∴拒绝原假设H0,接受H1假设,即甲乙两地居民对该电视节目的偏好有差异。11.解:(一)(1)提出假设:H0:μ1=μ2H1:μ1μ2(2)计算离差平方和性别i成绩j男510410430380490498430390470420540300310280410540560524520450390300460450320340女500450490350530310290405400520400580550570540310530540370320480410560320m=2n1=26n2=24n=50=11122=10725=21847=4930980=5008425=9939405组间变差SSR=-n=26*+24*-50*=9550383.76-9545828.18=4555.58 组内变差SSE=-=9939405-9550383.76=389021.24(3)构造检验统计量并计算样本观测值F===0.5621(4)确定临界值和拒绝域F0.05(1,48)=4.048∴拒绝域为:(5)做出检验决策临界值规则:∵F=0.5621显著水平标准,所以不能拒绝,即没有得到足以表明性别对成绩有影响的显著证据。(二)(1)提出假设:H0:μ1=μ2=μ3=μ4,H1:μ1、μ2、μ3、μ4不全相等(2)计算离差平方和m=4n1=11n2=15n3=12n4=12n=50=5492=6730=5070=4555=21847=2763280=3098100=2237900=1840125=9939405组间变差SSR=-n=11*+15*+12*+12*-50*=9632609.568-9545828.18=86781.388组内变差SSE=-=9939405-9632609.568=306795.432(3)构造检验统计量并计算样本观测值F===4.3372(4)确定临界值和拒绝域F0.05(3,46)=2.816∴拒绝域为: (5)做出检验决策临界值规则:∵F=4.3372>F0.05(3,46)=2.816检验统计量的样本观测值落在拒绝域。∴拒绝原假设H0,接受H1假设,即父母文化程度对孩子的学习成绩有影响。P-值规则:根据算得的检验统计量的样本值(F值)算出P-值=0.008973。由于P-值=0.008973<显著水平标准,所以拒绝,接受H1,即得到足以表明父母文化程度对孩子的学习成绩有影响的显著证据。第七章相关与回归分析一、选择题1.B、C、D;3.A、B、D二、判断分析题1.错。应是相关关系。单位成本与产量间不存在确定的数值对应关系。3.对。因果关系的判断还有赖于实质性科学的理论分析。5.对。总体回归函数中的回归系数是有待估计的参数,因而是常数,样本回归函数中的回归系数的估计量的取值随抽取的样本不同而变化,因此是随机变量。7.错。由于各种原因,偏相关系数与单相关系数的符号有不一致的可能。三、证明题1.证明:教材中已经证明是现行无偏估计量。此处只要证明它在线形无偏估计量中具有最小方差。设为的任意线性无偏估计量。也即,作为的任意线性无偏估计量,必须满足下列约束条件:;且又因为,所以:分析此式:由于第二项是常数,所以只能通过第一项的处理使之最小化。明显,只有当时,才可以取最小值,即: 所以,是标准一元线性回归模型中总体回归系数的最优线性无偏估计量。四、计算题1.解:(1)得到:(2)(万元)(3)t值远大于临界值2.228,故拒绝零假设。这说明在5%的显著性水平下,通过了显著性检验。(4)当(万元)即有:(万元)。2.解:已知,,,,,n=9。可计算得到:,,,,。(1)计算回归系数:=0.0273 =0.0729即直线回归方程为:(2)残差平方和SSE=决定系数上式中,总离差平方和(3)直线相关系数为:或者(注意:r与的正、负符号应该相同)。进行显著性检验:,,由于|t|≥tα/2(n-2),t检验通过了;或者由于r≥rα(n-2),r检验也通过了,表明r在统计上是显著的。也就是说,身高与体重之间,存在着比较密切的直线相关关系。(4)回归估计的标准误差检验统计量由于|t|≥tα/2(n-2),t检验通过了,表明总体回归系数β2≠0,回归效果是比较显著的,直线回归方程可以用于预测。3.解:(1)回归分析的Excel操作步骤为:步骤一:首先对原先Excel数据表作适当修改,添加“滞后一期的消费”数据到表中。步骤二:进行回归分析选择“工具”→“数据分析”→“回归”,在该窗口中选定自变量和因变量的数据区域,最后点击“确定”完成操作:得到回归方程为:(2)从回归分析的结果可知:随机误差项的标准差估计值:S=442.2165修正自由度的决定系数:AdjustedRSquares=0.9994各回归系数的t统计量为:;;F统计量为16484.6,远远大于临界值3.52,说明整个方程非常显著。(3)预测使用Excel进行区间估计步骤如下:步骤一:构造工作表 步骤二:为方便后续步骤书写公式,定义某些单元格区域的名称步骤三:计算点预测值步骤四:计算t临界值步骤五:计算预测估计误差的估计值步骤六:计算置信区间的上、下限最终得出的区间预测结果:第八章非参数检验一、计算题1.解:(1)提出假设:H0:,H1:(2)构造检验统计量并计算样本观测值Z=(3)确定临界值和拒绝域Z0.005=2.575∴拒绝域为(4)做出检验决策∵=0.577355,因此,不能拒绝原假设H0,说明广告宣传没有扩大销售量。地区编号广告前销售量广告后销售量的秩次正秩负秩123456789102216153218101525171930191328171017281614+8+3-2-4-10+2+3-1-595.53.571.53.55.51.5895.53.55.53.571.51.58合计————23.521.55.解: H0:两班的组装效率无差异H1:两班的组装效率有差异将两个样本的19个观测值合并按递增顺序排列(早班的观测值及其秩用黑体),然后赋秩,见表。顺序号12345678910观测值28333439404041414242秩12345.55.57.57.59.59.5顺序号111213141516171819观测值434445464647484952秩11121314.514.516171819由表可知,。对于,由附表知,。由于介于69和111之间,可见两班的组装效率无差异。7.解:(1)提出假设:H0:新生男婴体重服从正态分布H1:新生男婴体重不服从正态分布(2)计算样本均值与样本标准差==*158160=3163.2(克)S==465.52(克)(3)列表:组号体重分组实际频数(人数)Vi标准化组限Z=概率理论频数Ei=n·1234567–∞~24502450~27002700~29502950~32003200~34503450~37003700~+∞257121086–∞~-1.53-1.53~-0.995-0.995~-0.46-0.46~0.080.08~0.620.62~1.151.15~+∞0.06300.09570.16410.20910.20050.14250.12513.154.7858.20510.45510.0257.1256.2550.41980.00970.17700.22830.00010.10750.0104合计——n=50——1.0000500.9528(4)构造检验统计量并计算样本观测值==0.9528(5)确定临界值和拒绝域自由度7-2-1=4,(4)=9.488拒绝域为:(6)做出检验决策 ∵=0.9528<(4)=9.488检验统计量的样本观测值落在接受域。∴不能拒绝H0,即没有显著证据表明新生男婴体重不服从正态分布。二、证明题:1.证:一般的样本相关系数的公式是若改为等级变量值,改为等级变量值,则等级相关系数为(1)其中,和(i=1,2,…,n)均不重不漏地取1,2,…,n等n个数值。因此把这两个结果代入式(1)得到(2)记,则从而得到:将其代入式(2)得到=证毕。第九章时间序列分析一、选择题1.C3.B5.C二、判断分析题1.正确;3.正确。5.错误。前10年的平均增长速度为7.177%,后4年的平均增长速度为8.775%。这14年间总的增长速度为180%(即2004年比1990年增长180%)。三、计算题1.解:第一季度的月平均商品流转次数为: 第一季度的平均商品流通费用率为:2.解:(1)年平均发展水平采用简单算术平均法:年平均增长量采用简单算术平均法:(2)年平均增长速度几何平均法(也称水平法):即年平均增长速度为4.2%。高次方程式法(也称累计法):运用Excel2003的[单变量求解工具]解方程式,可得到年平均增长速度为3.97%。(3)1990年98703—1991年1037835.15%1992年1091705.19%1993年1159936.25%1994年1227375.81%1995年1311766.88%1996年1389485.92%1997年137798-0.83%1998年132214-4.05%1999年130119-1.58%2000年1302970.14%2001年1349143.54%2002年1482229.86%2003年16780013.21% 可见,超过水平法年平均增长速度(4.2%)的年份有:1991~1996年、2002年、2003年。(4)预测我国的能源消费总量2005年:167800×1.0422=182191(万吨标准煤)2010年:167800×1.0427=223803(万吨标准煤)3.解:平均增长速度=,增长最快的是头两年。 第一年第二年第三年第四年第五年环比增长速度(%)77.486.66.16.9定基增长速度(%)71522.5930394.解:(1)y2010=100×(1+10%)6=177.16(万件)(2)即每年应增长12.25%才能达到翻一番的预定目标。即平均每月递增的速度应该是0.97%。5.解:两种方法计算的各月季节指数(%)如下:月份123456789101112同期平均法49.9455.01123.0592.4981.61137.0265.2872.22188.57138.1199.4197.29趋势剔除法52.5957.93125.1494.3783.17137.3761.7766.74189.39142.2493.9895.307.解:对全社会固定资产投资额,二次曲线和指数曲线拟合的趋势方程和预测值(单位:亿元)分别为:,R2=0.9806,2005年预测值=56081.60;,R2=0.9664,2005年预测值=73287.57。国有经济固定资产投资额,可用二次曲线和直线来拟合其长期趋势,趋势方程和预测值(单位:亿元)分别为:,R2=0.9792,2005年预测值=23364.57;,R2=0.9638,2005年预测值=21259.50。9.解:加权移动平均的预测值为:二次指数平滑预测的结果为:一阶自回归模型预测的结果为:。第十章对比分析与指数分析一、选择题1.D;3.A;5.B;7.D;9.C。二、判断分析题1.实际收入水平只提高了9.1%(=120%/110%-100%)。3.不正确。对于总指数而言,只有当各期指数的权数固定不变时,定基指数才等于相应环比指数的连乘积。 5.同度量因素与指数化指标的乘积是一个同度量、可加总的总量。同度量因素具有权衡影响轻重的作用,故又称为权数。平均指数中的权数一般是基期和报告期总量(总值),或是固定的比重权数。7.将各因素合理排序,才便于确定各个因素固定的时期;便于指标的合并与细分;也便于大家都按统一的方法进行分析,以保证分析结果的规范性和可比性。“连锁替代法”适用于按“先数量指标、后质量指标”的原则对各个因素进行合理排序的情况。三、计算题1.解:分别按不同公式计算产量指数和出厂价格指数,计算结果如下: 拉氏指数帕氏指数理想指数马埃指数产量指数113.00%112.37%112.68%112.66%出厂价格指数114.00%113.36%113.68%113.66%拉氏指数较大,帕氏指数较小,而理想指数和马埃指数都居中且二者很接近。3.解:农产品收购价格提高使农民收入增加11.46(=317-305.54)万元。5.解:已知各部门生产量增长率(从而可知类指数),可采用比重权数加权的算术平均指数公式计算工业生产指数,即:。6.解:已知=53950亿元,=1+13.3%=113.3%,=1+10.2%=110.2%。(1)即表明我国消费品零售价格总指数为102.81%,2004年比2003年上涨了2.81%。(2)影响的绝对额为:即由于消费品零售价格上涨了2.81%,使城乡居民消费支出增加约1474.56亿元。7.解:先分别计算出基期总成本(=342000)、报告期总成本(=362100)和假定的总成本(=360000)。总成本指数:总成本增加额:=362100-342000=20100(元)产量指数:产量变动的影响额:=360000-342000=18000(元)单位成本指数: 单位成本的影响额:=362100-360000=2100(元)三者的相对数关系和绝对数关系分别为:105.88%=105.26%×100.58%,20100=18000+2100(元)计算结果表示:两种产品的总成本增加了5.88%,即增加了20100元。其中,由于产量增加而使总成本增加5.26%,即增加了18000元;由于单位成本提高而使总成本增加了0.58%,即增加了2100元。9.解:先计算出基期总平均价格=26.2(元),报告期总平均价格=32.7692(元),假定的总平均价格=28.3846(元)。再计算对总平均价格进行因素分析所需的三个指数以及这三个指数分子分母的绝对数差额。详细计算过程和文字说明此不赘述。三者的相对数关系和绝对数关系分别为:125.07%=115.45%×108.34%,6.5692=4.3846+2.1846(元)。产品质量变化体现在产品的等级结构变化方面,因此,根据结构影响指数可知,质量变化使总平均价格上升8.34%,即提高了2.1846元,按报告期销售量计算,质量变化使总收入增加了28400(元),即:2.1846(元)×130(百件)=284(百元)=28400(元)第十一章统计决策一、选择题1.A.B.C.D。3.B.C。二、计算题1.解:(1)根据最大的最大收益值准则,应该选择方案一。(2)根据最大的最小收益值准则,应该选择方案三。(3)在市场需求大的情况下,采用方案一可获得最大收益,故有:在市场需求中的情况下,采用方案二可获得最大收益,故有:在市场需求小的情况下,采用方案三可获得最大收益,故有:根据后悔值计算公式,可以求得其决策问题的后悔矩阵,如下表:后悔矩阵表状态需求大需求中需求小方案方案一0100140方案二200020方案三4002000根据最小的最大后悔值准则,应选择方案一。(4)由于在所有可选择的方案中,方案一的期望收益值最大,所以根据折中原则,应该选择方案一 (5)因为方案二的期望收益值最大,所以按等可能性准则,应选择方案二。3.解:设由于飞机自身结构有缺陷造成的航空事故为,由于其它原因造成的航空事故为,被判定属于结构缺陷造成的航空事故为,则根据已知的条件有:=0.35,=0.65,=0.80,=0.30当某次航空事故被判断为结构缺陷引起的事故时,该事故确实属于结构缺陷的概率为:=5.解:决策树图略。(1)根据现有信息,生产该品种的期望收益为41.5万元大于不生产的期望收益,因此可生产。(2)自行调查得出受欢迎结论的概率=0.65*0.7+0.35*0.30=0.56,市场欢迎的后验概率=0.65*0.7/0.56=0.8125期望收益值=(77*0.8125-33*0.1875)0.56+(-3*0.44)=30.25万元自行调查的可靠性不高,并要花费相应的费用,其后验分析最佳方案的期望收益值小于先验分析最佳方案的期望收益,所以不宜采用该方案。(3)委托调查得出受欢迎结论的概率=0.65*0.95+0.35*0.05=0.6825市场欢迎的后验概率=0.65*0.95/0.6825=0.9744期望收益=(75*0.9744-35*0.0256)0.6825+(-5*0.3175)=47.67万元委托调查虽然要付出较高的费用,但比较可靠,其后验分析最佳方案的期望收益大于先验分析最佳方案的期望收益,所以应采用该方案。第十二章统计综合评价一、判断题1.错;3.错;5.对二、计算题1.解:由题中所给的指标间相关系数矩阵,可得距离矩阵表如下:指标1234567123456700.1500.420.4500.460.440.1100.560.440.270.2600.260.660.280.590.4600.400.380.400.280.200.340将距离d排序,可知d34=0.11最小,d12=0.15次之,d57=0.20 再次之(如此类推),又该题中项目的评价指标体系指标容量为4,所以可在指标3和指标4中选择一个指标,将它确定为第一个评价指标,又在指标1和指标2中选择一个指标,将它确定为第二个评价指标,在指标5和指标7之间选择一个指标,将它确定为第三个评价指标,确定指标6为第四个评价指标。该题的聚类图绘制如下:指标距离0.200.150.153412573.解:(1)功效系数法计算公式为:依据题中所给数据,用功效系数法对其进行同度量处理如下:指标计量单位满意值不容许值好中差实际值每天污水处理量BODS去除率悬浮物去除率处理1吨污水消耗空气量去除1公斤BODS耗电量千吨/日%%米3/吨度/公斤18.595956.50.8514.5797910.51.25100100100100100808080808060606060606510097.58580(2)题中所示5个指标中,每天污水处理量、BODS去除率、悬浮物去除率三项指标为正指标;处理1吨污水消耗空气量、去除1公斤BODS耗电量两项指标为逆指标。根据相对化处理公式:正指标:,逆指标:依据题中所给数据,用相对化法对其进行同度量处理如下:指标计量单位最优值好实际相对比率实际值与最优值的相对距离每天污水处理量BODS去除率悬浮物去除率处理1吨污水消耗空气量去除1公斤BODS耗电量千吨/日%%米3/吨度/公斤18.595956.50.85111110.810810.98950.81250.80950.189200.01050.18750.1905(3)加权算术平均实际值得分=90.5加权几何平均实际值得分≈89.72 (4)加权算术平均与最优值相对距离=0.07877。《统计学》简答题及参考答案1.简述描述统计学的概念、研究内容与目的。概念:它是研究数据收集、整理和描述的统计学分支。研究内容:搜集数据、整理数据、展示数据和描述性分析的理论与方法。研究目的:描述数据的特征;找出数据的基本数量规律。2.简述推断统计学的概念、研究内容与目的。概念:它是研究如何利用样本数据来推断总体特征的统计学分支。研究内容:参数估计和假设检验的理论与方法。研究目的:对总体特征作出统计推断。3.什么是总体和样本?总体是指所研究的全部个体(数据)的集合,其中的每一个元素称为个体(也称为总体单位)。可分为有限总体和无限总体:•有限总体的范围能够明确确定,且元素的数目是有限的,可数的。•无限总体所包括的元素数目是无限的,不可数的。总体单位数可用N表示。样本就是从总体中抽取的一部分元素的集合。构成样本的元素的数目称为样本容量,记为n。4.什么是普查?它有哪些特点?普查就是为了特定的研究目的,而专门组织的、非经常性的全面调查。它有以下的特点:1)通常是一次性或周期性的2)一般需要规定统一的标准调查时间3)数据的规范化程度较高4)应用范围比较狭窄。5.什么是抽样调查?它有哪些特点?抽样调查是指从总体中随机抽取一部分单位作为样本进行调查,并根据样本调查结果来推断总体特征的数据搜集方法和统计推断方法。它具有经济性好、时效性强、适应面广、准确性高等特点。6.简述统计调查方案的概念及应包括的基本内容。答:统计调查方案就是统计调查前所制订的实施计划,它是指导整个调查过程的纲领性文件,是保证调查工作有计划、有组织、有系统地进行的计划书。它应包括的基本内容有:〈1〉明确调查目的;〈2〉确定调查对象和调查单位;〈3〉设计调查项目;〈4〉设计调查表格和问卷;〈5〉确定调查时间;〈6〉组织实施调查计划;〈7〉调查报告的撰写,等等。7.简述统计分组的概念、原则和具体方法。答:(1)概念 根据统计研究的目的和客观现象的内在特点,按照某个标志(或几个标志)把被研究的总体划分为若干个不同性质的组,称为统计分组。统计分组标志有两种:品质标志或数量标志。(2)原则①穷尽原则;②互斥原则。即“不重复、不遗漏”的原则。(3)具体分组方法①按品质标志分组②按数量标志分组(A)单项式分组与组距式分组;(B)间断组距式分组和连续组距式分组;应遵循“上限不在组内”原则:凡是总体中某一个单位的变量值为相邻两组的界限值,则这一个单位就归入作为下限值的那一组内。(C)等距分组与异距分组。8.简述组距分组的基本步骤。(1)确定组数:组数的确定应以能够显示数据的分布特征和规律为目的(2)确定组距:组距是一个组的上限与下限之差,可根据全部数据的最大值和最小值及所分的组数来确定,即:组距=(最大值-最小值)÷组数(3)统计出各组的频数,并整理成频数分布表。9.简述算术平均数的概念及其数学性质。答:算术平均数是指一组数据的总和,除以这组数据的项数所得的结果。它是最常用的数值平均数,分为简单算术平均数和加权算术平均数两种。其数学性质是:(1)算术平均数与变量值个数的乘积,等于各个变量值的总和。(2)各变量值与其算术平均数的离差之总和,等于零。(3)各变量值与其算术平均数的离差平方之总和,为最小值。10.简述均值的概念和特征。均值就是算术平均数,它的基本公式为:算术平均数=总体标志总量/总体单位数=∑Xi/n其特征如下:1)集中趋势的最常用测度值2)一组数据的均衡点所在3)体现了数据的必然性特征4)易受极端值的影响5)用于数值型数据,不能用于分类数据和顺序数据6)可根据原始数据或者分组数据来计算,计算公式略有差异。11.简述众数、中位数、均值的特点与应用场合。1)众数l不受极端值影响l具有不唯一性l数据分布偏斜程度较大时应用2)中位数l不受极端值影响l数据分布偏斜程度较大时应用3)均值l易受极端值影响l数学性质优良l数据对称分布或接近对称分布时应用。 12.简述算术平均数、众数、中位数的概念及数量关系。答:(1)概念算术平均数是指一组数据的总和除以这组数据的项数所得的结果,也称为均值,可用表示。它是最常用的数值平均数,分为简单的和加权的算术平均数两种。众数是指一组数据中出现频数最多、频率最高的变量值,可用MO表示。它是最常见、最普遍的状况,是对现象集中趋势的度量。中位数是指将数据由小到大排列后,位置居中的数值,可用Me表示。(2)三者的数量关系是:在对称分布中,三者相等。即:=Me=Mo;在左偏分布中,一般有α,就接受H0。28.解释假设检验中的两类错误第Ⅰ类错误(弃真错误)指原假设为真时,拒绝原假设。其发生的概率记为α,α称为显著性水平。第Ⅱ类错误(取伪错误)指原假设为假时,未拒绝(即接受)原假设。其发生的概率记为β。29.简述假设检验中的小概率原理1)小概率是指在一次试验中,一个几乎不可能发生的事件发生的概率。2)在一次试验中小概率事件一旦发生,我们就有足够的理由拒绝原假设。3)小概率由研究者事先确定。30.解释假设检验的决策规则1.给定显著性水平α,查表得出相应的临界值za或za/2,ta或ta/22.将检验统计量的数值与α水平的临界值进行比较3.作出决策§双侧检验:|统计量|>临界值,拒绝H0 §左侧检验:统计量<-临界值,拒绝H0§右侧检验:统计量>临界值,拒绝H031.简述假设检验的基本步骤1.陈述原假设H0和备择假设H12.从所研究的总体中抽出一个随机样本3.确定一个适当的检验统计量,并利用样本数据计算出其具体数值4.确定一个适当的显著性水平α,并查表得出其临界值,指定拒绝域5.将统计量的数值与临界值进行比较,作出决策§统计量的数值落在拒绝域中,就拒绝H0。否则,就接受H0§也可以直接利用P值作出决策。如果P<α,就拒绝H0;否则P>α,就接受H032.简述相关分析与回归分析之间的联系1)有共同的研究对象:都是对变量间相关关系的分析。2)只有当变量间存在相关关系时,用回归分析去寻求相关的具体数学形式才有实际意义。3)相关分析只表明变量间相关关系的性质和程度,要确定相关的具体数学形式依赖于回归分析。4)相关分析中相关系数的确定,建立在回归分析的基础上。33.直线相关系数有哪些特点?¨相关系数的取值在-1与1之间。¨当r=0时,表明X与Y没有线性相关关系,但可能存在着其它的非线性相关关系。¨当0<|r|<1时,表明X与Y存在一定程度的线性相关关系:若r>0,表明X与Y为正相关;若r<0,表明X与Y为负相关。¨当|r|=1时,表明X与Y完全线性相关:若r=1,称X与Y完全正相关;若r=-1,称X与Y完全负相关。34.为什么只能对未知的总体参数作估计?总体参数是未知的、不可直接观测的、不能精确计算的,能够得到的只是变量的样本观测值。结论:只能通过变量的样本观测值,选择适当的统计方法去近似地估计回归系数等总体参数。前提:u是随机变量其分布性质不确定,必须作某些假定,其估计才有良好性质,其检验才可进行。原则:使参数估计值“尽可能地接近”总体参数的真实值。35.编制时间数列的基本原则及其具体要求是什么?答:可比性原则---保证时间数列中各项数据的可比性,是编制时间序列的基本原则。其具体要求是:(1)、时间一致;(2)、总体范围一致;(3)、经济内容、计算口径、计算方法、计算价格、计量单位等方面一致。36.比较时期数列和时点数列之间的4个不同特点。答:①时期序列的各个数据为时期指标值(流量),表示时期现象在各段时期内的发展总量。时点序列的各个数据为时点指标值(存量),反映时点现象在各个时点上所处的数量状态和所达到的水平。②时期序列中各期数据具有可加性,通过加总即可得到更长一段时间内的发展总量,有实际意义。时点序列中各时点数据不能相加,具有不可加性,即它们相加的结果没有实际意义。 ③时期序列中数值的大小与所属时期长短有直接的关系,一般是时期越长,数值就越大。时点序列中各时点数的大小与时点间隔长短没有直接的联系。并不是时点间隔长,时点数就大一些。④时期序列中各期数据是对每段时间内发生的数量连续登记、累计的结果。时点序列中各数据通常不可能、也不必要连续登记,一般是对代表时点进行间断计数的结果。37.时间数列的分解分析有哪些基本假设?基本假设是:(一)现象Y只有四个构成要素:长期趋势T、季节变动S、循环变动C和不规则变动I。(二)(二)这些构成要素存在以下的组合模型:乘法模型:Y=T·S·C·I加法模型:Y=T+S+C+I乘乘加模型:Y=T·S+C·I,等等。38.简述季节变动的概念及其研究意义。季节变动是指社会经济现象因受自然因素或社会因素影响,而形成的在一年内有规则的周期性变动。测定季节变动的意义在于:l分析与测定过去的季节变动规律l对未来现象的季节变动作出预测l消除季节变动对时间序列的影响。39.常用的对比分析方法及其相对数指标有哪些?答:根据分析目的和比较基准的不同来划分,对比分析主要有下述几种常用方法。(1)结构分析,可计算结构相对数(即比重);(2)比例分析,可计算比例相对数(简称比例);(3)空间比较分析,也叫横向对比分析,可计算空间比较相对数;(4)动态对比分析,也称为纵向对比分析,可计算动态相对数;(5)计划完成程度分析,可计算计划完成程度相对数;(6)强度、密度和效益分析,可计算强度相对数。40.简述统计指数的概念及其分类指数是一种对比分析指标,具有相对数的形式(%)。其对比方式有:不同时间、不同空间、实际与计划对比。指数的分类有:“数量指标指数”与“质量指标指数”;“个体指数”、“总指数”与“类指数”;“动态指数”与“静态指数”;“综合指数”与“平均指数”;“简单指数”与“加权指数”等。41.简述加权综合指数的概念及其编制原理。答:采用加权综合方法计算的总指数,称为加权综合指数。其编制的基本原理是:⑴.为了解决复杂现象总体的指数化指标不能直接加总的问题,必须引入同度量因素,使其转化成相应的、能够相加的价值总量形式;同度量因素通常也称为综合指数的权数,因为它具有权衡各个个体重要性的作用。引入了同度量因素的综合指数,通常被称为加权综合指数。⑵.为了在综合对比过程中,单纯反映指数化指标的变动或差异程度,又必须将引入的同度量因素的水平固定起来。要注意同度量因素的两个问题:指标性质(数量或质量指标)的确定、固定水平所属时期的选择。42.简述加权平均指数的概念及其编制原理。答:采用加权平均方法计算的总指数,称为加权平均指数。 其编制的基本原理是:先计算出个体指数,再将个体指数加以平均即可求得总指数,这种方法计算的总指数也称之为平均指数。由于各个个体指数的重要性不同,所以,平均指数通常需要加权。编制平均指数有两大问题:n采用哪种平均法?(1).算术平均法计算较为简便,也比较直观,所以其应用较为普遍。(2).根据所掌握的数据和服从研究目的之需要,调和平均法和几何平均法也有一定的实用价值。n权数如何确定?(1).既要考虑实际经济意义,又要考虑获取资料的可行性和简便性。(2).权数主要有:基期总值(q0p0)、报告期总值(q1p1)和固定权数(wi)等三种。要注意平均指数的两个问题:“权数”的选择、“型式”的选择。'