• 3.66 MB
  • 2022-04-22 11:18:32 发布

《医药数理统计方法》学习指导-标准答案.doc

  • 124页
  • 当前文档由用户上传发布,收益归属用户
  1. 1、本文档共5页,可阅读全部内容。
  2. 2、本文档内容版权归属内容提供方,所产生的收益全部归内容提供方所有。如果您对本文有版权争议,可选择认领,认领后既往收益都归您。
  3. 3、本文档由用户上传,本站不保证质量和数量令人满意,可能有诸多瑕疵,付费之前,请仔细先通过免费阅读内容等途径辨别内容交易风险。如存在严重挂羊头卖狗肉之情形,可联系本站下载客服投诉处理。
  4. 文档侵权举报电话:19940600175。
'10452班专用第一章数据的描述和整理一、学习目的和要求1.掌握数据的类型及特性;2.掌握定性和定量数据的整理步骤、显示方法;3.掌握描述数据分布的集中趋势、离散程度和分布形状的常用统计量;4.能理解并熟练掌握样本均值、样本方差的计算;5.了解统计图形和统计表的表示及意义;6.了解用Excel软件进行统计作图、频数分布表与直方图生成、统计量的计算。二、内容提要(一)数据的分类数据类型定性数据(品质数据)定量数据定类数据(计数数据)定序数据(等级数据)数值数据(计量数据)表现形式类别(无序)类别(有序)数值(+-×÷)对应变量定类变量定序变量数值变量(离散变量、连续变量)主要统计方法计算各组频数,进行列联表分析、c2检验等非参数方法计算各种统计量,进行参数估计和检验、回归分析、方差分析等参数方法常用统计图形条形图,圆形图(饼图)直方图,折线图,散点图,茎叶图,箱形图(二)常用统计量1、描述集中趋势的统计量124 10452班专用名称公式(原始数据)公式(分组数据)意义均值反映数据取值的平均水平,是描述数据分布集中趋势的最主要测度值,中位数Me中位数所在组:累积频数超过n/2的那个最低组是典型的位置平均数,不受极端值的影响众数Mo数据中出现次数最多的观察值众数所在组:频数最大的组测度定性数据集中趋势,对于定量数据意义不大2、描述离散程度的统计量名称公式(原始数据)公式(分组数据)意义极差RR=最大值-最小值R≈最高组上限值-最低组下限值反映离散程度的最简单测度值,不能反映中间数据的离散性总体方差s2反映每个总体数据偏离其总体均值的平均程度,是离散程度的最重要测度值,其中标准差具有与观察值数据相同的量纲总体标准差s样本方差S2反映每个样本数据偏离其样本均值的平均程度,是离散程度的最重要测度值,其中标准差具有与观察值数据相同的量纲样本标准差S变异系数CVCV=反映数据偏离其均值的相对偏差,是无量纲的相对变异性测度样本标准误反映样本均值偏离总体均值的平均程度,在用样本均值估计总体均值时测度偏差124 10452班专用3、描述分布形状的统计量名称公式(原始数据)公式(分组数据)意义偏度Sk反映数据分布的非对称性Sk=0时为对称;Sk>0时为正偏或右偏;Sk<0时为负偏或左偏峰度Ku(原始数据)(分组数据)反映数据分布的平峰或尖峰程度Ku=0时为标准正态;Ku>0时为尖峰分布;Ku<0时为扁平分布*在分组数据公式中,mi,fi分别为各组的组中值和观察值出现的频数。三、综合例题解析例1.证明:各数据观察值与其均值之差的平方和(称为离差平方和)最小,即对任意常数C,有证一:设由函数极值的求法,对上式求导数,得令f¢(C)=0,得唯一驻点由于,故当时f(C)y有最小值,其最小值为124 10452班专用。证二:因为对任意常数C有故有。四、习题一解答1.在某药合成过程中,测得的转化率(%)如下:94.392.892.792.693.392.991.892.493.492.692.293.092.992.292.492.292.892.493.992.093.593.693.093.093.494.292.893.292.291.892.593.693.992.491.893.893.692.192.090.8(1)取组距为0.5,最低组下限为90.5,试作出频数分布表;(2)作频数直方图和频率折线图;(3)根据频数分布表的分组数据,计算样本均值和样本标准差。解:(1)所求频数分布表:转化率的频数分布表转化率分组频数频率累积频率90.5~10.0250.02591.0~00.000.02591.5~30.0750.1092.0~110.2750.37592.5~90.2250.60124 10452班专用93.0~70.1750.77593.5~70.1750.9594.0~94.520.051.00(2)频数直方图:频率折线图:(3)由频数分布表可得转化率分组组中值mi频数90.5~90.75191.0~91.25091.5~91.753124 10452班专用92.0~92.251192.5~92.75993.0~93.25793.5~93.75794.0~94.594.252则=[(90.75-92.825)2×1+(91.25-92.825)2×0+…+(94.25-92.825)2×2]=0.584或者=≈0.76422.测得10名接触某种病毒的工人的白细胞(109/L)如下:7.1,6.5,7.4,6.35,6.8,7.25,6.6,7.8,6.0,5.95(1)计算其样本均值、方差、标准差、标准误和变异系数。(2)求出该组数据对应的标准化值;(3)计算其偏度。解:(1),n=10462.35样本均值124 10452班专用方差标准差=≈0.609标准误变异系数CV===8.99%;(2)对应的标准化值公式为对应的标准化值为0.534,-0.452,1.026,-0.698,0.041,0.78,-0.287,1.683,-1.273,-1.355;(3)=0.204。3.已知某年某城市居民家庭月人均支出分组数据如下表所示按月人均支出分组(元)家庭户数占总户数的比例(%)200以下200~500~800~1000以上1.518.246.825.38.2合计100试计算(1)该市平均每户月人均支出的均值和标准差;(2)并指出其月人均支出的中位数与众数所在组。解:(1)由原分组数据表可得支出分组(元)组中值比例(%)124 10452班专用200以下200~500~800~1000以上10035065090011001.518.246.825.38.2则;(2)由原分组数据表可得支出分组(元)比例(%)累积比例(%)200以下200~500~800~1000以上1.518.246.825.38.21.519.766.591.8100中位数所在组,即累积比例超过50的那个最低组,即为500~组。众数所在组是频数即比例最大的组,也是500~组。4.设x1,x2,…,xn和y1,y2,…,yn为两组样本观察值,它们有下列关系:i=1,2,…,n其中a、b为常数且b≠0,求样本均值与及样本方差和之间的关系。124 10452班专用解:。五、思考与练习(一)填充题1.统计数据可以分为数据、数据、数据、据等三类,其中数据、数据属于定性数据。2.常用于表示定性数据整理结果的统计图有、;而、、、等是专用于表示定量数据的特征和规律的统计图。3.用于数据整理和统计分析的常用统计软件有等。4.描述数据集中趋势的常用测度值主要有、、和等,其中最重要的是;描述数据离散程度的常用测度值主要有、、、等,其中最重要的是、。(二)选择题1.各样本观察值均加同一常数c后()A.样本均值不变,样本标准差改变B.样本均值改变,样本标准差不变C.两者均不变D.两者均改变2.关于样本标准差,以下哪项是错误的()。A.反映样本观察值的离散程度B.度量了数据偏离样本均值的大小C.反映了均值代表性的好坏D.不会小于样本均值124 10452班专用3.比较腰围和体重两组数据变异度大小宜采用()A.变异系数(CV)B.方差(S2)C.极差(R)D.标准差(S)(三)计算题1.在某次实验中,用洋地黄溶液分别注入10只家鸽内,直至动物死亡。将致死量折算至原来洋地黄叶粉的重量。其数据记录为(单位:mg/kg)97.3,91.3,102,129,92.8,98.4,96.3,99.0,89.2,90.1试计算该组数据的样本均值、方差、标准差、标准误和变异系数。六、思考与练习参考答案(一)填充题1.定类,定序,数值,定类,定序2.条形图、圆形图;直方图、频数折线图、茎叶图、箱形图3.SAS、SPSS、Excel4.均值、众数、中位数,均值,极差、方差、标准差、变异系数,方差、标准差(二)选择题1.B;2.D;3.A(三)计算题1.均值98.54、方差132.27、标准差11.501、标准误3.637、变异系数11.67%。124 10452班专用第二章随机事件与概率一、学习目的和要求1.掌握事件等的基本概念及运算关系;2.熟练掌握古典概率及计算;3.理解统计概率、主观概率和概率的公理化定义;4.熟练掌握概率的加法公式、乘法公式及计算;5.理解并掌握条件概率与事件独立性的概念并进行计算;6.掌握并应用全概率公式和贝叶斯公式进行计算。二、内容提要(一)基本概念概念符号概率论的定义集合论的含义随机试验(试验)E具有以下特征的观测或试验:1.试验在相同的条件下可重复地进行2.试验的所有结果事先已知,且不止一个3.每次试验恰好出现其中之一,但试验前无法预知到底出现哪一个结果。样本空间W试验所有可能结果组成的集合,即所有基本事件的全体全集基本事件(样本点)w试验的每个不可再分的可能结果,即样本空间的元素元素随机事件(事件)A试验中可能发生也可能不发生的结果,是由基本事件组成的样本空间的子集子集必然事件W在试验中一定发生的事件全集不可能事件Æ在试验中一定不发生的事件,不含任何基本事件空集124 10452班专用(二)事件间的关系关系符号概率论的定义集合论的含义包含AB事件A的发生必然导致事件B的发生A是B的子集相等A=BAB而且BAA与B相等和(并)A+B(A∪B)事件A与B中至少有一个事件发生A与B的并积(交)AB(A∩B)事件A与B同时发生A与B的交差A-B事件A发生同时B不发生A与B的差互不相容AB=Æ事件A与B不可能同时发生A与B不相交对立事件A不发生A的补集(余集)(三)事件的运算规律运算律公式交换律A+B=B+A,AB=BA结合律(A+B)+C=A+(B+C),(AB)C=A(BC)分配律(A+B)C=AC+BC,A+(BC)=(A+B)(A+C)差积转换律对立律A=Æ,A+=Ω德·摩根对偶律,(四)概率的定义类型定义公式古典概率P(A)=统计概率P(A)=p(≈)公理化定义(基本性质)对样本空间中任意事件A对应的一个实数P(A),满足公理1(非负性):0≤P(A)≤1124 10452班专用公理2(规范性):P(W)=1,P(Æ)=0公理3(可加性):若A1,A2,…,An,…,两两互不相容,P(A1+A2+…+An+…)=P(A1)+P(A2)+…+P(An)+…则称P(A)为随机事件A的概率。(五)概率的计算公式名称计算公式加法公式P(A+B)=P(A)+P(B)-P(AB)若A、B互不相容(AB=Æ):P(A+B)=P(A)+P(B)对立事件公式P(A)=1-P();P()=1-P(A)事件之差公式P(A-B)=P(A)-P(AB)若BÌA,P(A-B)=P(A)-P(B)条件概率公式,(P(A)>0)乘法公式若P(A)>0,P(AB)=P(A)P(B|A)若P(B)>0,P(AB)=P(B)P(A|B)当P(A1A2…An-1)>0时,有P(A1A2…An)=P(A1)P(A2|A1)P(A3|A1A2)…P(An|A1A2…An-1)独立事件公式A、B相互独立:P(AB)=P(A)P(B)A1,A2,…,An相互独立:P(A1A2…An)=P(A1)P(A2)…P(An)全概率公式若A1,A2,…,An为完备事件组*,对事件B逆概率公式(贝叶斯公式)若A1,A2,…,An为完备事件组*,P(B)>0*完备事件组{A1,A2,…,An}1.A1,A2,…,An互不相容且P(Ai)>0(i=1,2,…,n);2.A1+A2+…+An=W124 10452班专用三、综合例题解析例1从某鱼池中取100条鱼,做上记号后再放入该鱼池中。现从该池中任意捉来50条鱼,发现其中有两条有记号,问池内大约有多少条鱼?解:设池内大约有n条鱼,令A={从池中捉到有记号鱼}则从池中捉到有记号鱼的概率P(A)=由统计概率的定义知,它近似于捉到有记号鱼的频率fn(A)=,即解之得n=2500,故池内大约有2500条鱼。例2口袋里有两个伍分、三个贰分和五个壹分的硬币,从中任取五个,求总值超过一角的概率。解一:令A={总值超过一角},现将从10个硬币中任取5个的每种取法作为每个基本事件,显然本例属于古典概型问题,可利用组合数来解决。所取5个硬币总值超过一角的情形,其币值由大到小可根据其中有2个伍分、有1个伍分和没有伍分来考虑。则=0.5。解二:本例也可以先计算其对立事件={总值不超过一角}考察5个硬币总值不超过一角的情形,其币值由小到大先根据壹分硬币、贰分硬币的不同个数来计算其有利情形的组合数。则124 10452班专用=0.5或=0.5例3将n个人等可能地分配到N(n≤N)间房中去,试求下列事件的概率:(1)A={某指定的n间房中各有一人};(2)B={恰有n间房,其中各有一人};(3)C={某指定的房中恰有m(m≤n)个人}。解:把n个人等可能地分配到N间房中去,由于并没有限定每一间房中的人数,故是一可重复的排列问题,这样的分法共有Nn种。(1)对事件A,对指定的n间房,第一个人可分配到该n间房的任一间,有n种分法;第二个人可分配到余下的n-1间房中的任一间,有n-1种分法,以此类推,得到A共含有n!个基本事件,故(2)对事件B,因为n间房没有指定,所以可先在N间房中任意选出n间房(共有种选法),然后对于选出的某n间房,按照上面的分析,可知B共含有·n!个基本事件,从而(3)对于事件C,由于m个人可从n个人中任意选出,故有种选法,而其余n-m个人可任意地分配到其余的N-1间房中,共有(N-1)n-m种分配法,故C中共含有·(N-1)n-m个基本事件,因此注意:可归入上述“分房问题”来处理的古典概型的实际问题非常多,例如:(1)生日问题:n个人的生日的可能情形,这时N=365天(n≤365);124 10452班专用(2)乘客下车问题:一客车上有n名乘客,它在N个站上都停,乘客下车的各种可能情形;(3)印刷错误问题:n个印刷错误在一本有N页的书中的一切可能的分布(n不超过每一页的字符数);(4)放球问题:将n个球放入N个盒子的可能情形。值得注意的是,在处理这类问题时,要分清什么是“人”,什么是“房”,一般不能颠倒。例4(1994年考研题)设A,B为两事件,且P(A)=p,P(AB)=,求P(B)。解:由于现因为P(AB)=,则又P(A)=p,故。注意:事件运算的德·摩根律及对立事件公式的恰当应用。例5设某地区位于河流甲、乙的交汇处,而任一何流泛滥时,该地区即被淹没。已知某时期河流甲、乙泛滥的概率分别为0.2和0.3,又当河流甲泛滥时,“引起”河流乙泛滥的概率为0.4,求(1)当河流乙泛滥时,“引起”河流甲泛滥的概率;(2)该时期内该地区被淹没的概率。解:令A={河流甲泛滥},B={河流乙泛滥}由题意知P(A)=0.2,P(B)=0.3,P(B|A)=0.4再由乘法公式P(AB)=P(A)P(B|A)=0.2×0.4=0.08,则(1)所求概率为124 10452班专用(2)所求概率为P(A+B)=P(A)+P(B)-P(AB)=0.2+0.3-0.08=0.42。例6设两个相互独立的事件A和B都不发生的概率为1/9,A发生B不发生的概率与B发生A不发生的概率相等,求P(A)。解:由题设可知因为A和B相互独立,则P(AB)=P(A)P(B),再由题设可知,又因为,即P(A-B)=P(B-A),由事件之差公式得则有P(A)=P(B),从而有故有即。例7(1988年考研题)玻璃杯成箱出售,每箱20只,假设各箱含0,1,2只残次品的概率相应为0,0.8,0.1和0.1,一顾客欲购一箱玻璃杯,在购买时,售货员随意取一箱,而顾客开箱随机地查看4124 10452班专用只,若无残次品,则买下该箱玻璃杯,否则退回。试求(1)顾客买下该箱的概率α;(2)在顾客买下的一箱中,确实没有残次品的概率β。解:由于玻璃杯箱总共有三类,分别含0,1,2只残次品。而售货员取的那一箱可以是这三类中的任一箱,顾客是在售货员取的一箱中检查的,顾客是否买下这一箱是与售货员取的是哪一类的箱子有关系的,这类问题的概率计算一般可用全概率公式解决,第二问是贝叶斯公式也即条件概率问题。首先令A={顾客买下所查看一箱};B={售货员取的箱中恰好有i件残次品},i=0,1,2。显然,B0,B1,B2构成一组完备事件组。且(1)由全概率公式,有(2)由逆概率公式,得注意:本题是典型的全概率公式与贝叶斯公式的应用。例8.(小概率事件原理)设随机试验中某事件A发生的概率为ε,试证明,不论ε>0如何小,只要不断独立重复地做此试验,事件A迟早会发生的概率为1。证:令Ai={第i次试验中事件A发生},i=1,2,3,…由题意知,事件A1,A2,…,An,…相互独立且P(Ai)=e,i=1,2,3,…,则在n次试验中事件A发生的概率P()=1-P()124 10452班专用=1-当n→+∞,即为事件A迟早会发生的概率P()==1。四、习题二解答1.考察随机试验:“掷一枚骰子,观察其出现的点数”。如果设i={掷一枚骰子所出现的点数为i},i=1,2,…,6试用i来表示该试验的基本事件、样本空间Ω和事件A={出现奇数点}和事件B={点数至少是4}。解:基本事件:{0},{1},{2},{3},{4},{5},{6}。样本空间Ω={0,1,2,3,4,5,6}。事件A={1,3,5};B={4,5,6}。2.用事件A、B、C表示下列各事件:(1)A出现,但B、C不出现;(2)A、B出现,但C不出现;(3)三个都出现;(4)三个中至少有一个出现;(5)三个中至少有两个出现;(6)三个都不出现;(7)只有一个出现;(8)不多于一个出现;(9)不多于两个出现。解:(1)(2)(3)(4)或A+B+C或(5)124 10452班专用(6)或W-(A+B+C)或(7)(8)(9)或W-ABC或3.从52张扑克牌中,任取4张,求这四张花色不同的概率。解:现将从52张扑克牌中任取4张的每种取法作为每个基本事件,其结果与顺序无关,故可用组合数来解决该古典概型问题。。4.在一本标准英语词典中共有55个由两个不同字母组成的单词,现从26个英文字母中任取两个字母排成一个字母对,求它恰是上述字典中单词的概率。解:现将从26个英文字母中任取两个字母件的每种取法作为每个基本事件,其结果与顺序有关,故可用排列数来解决该古典概型问题。。5.某产品共20件,其中有4件次品。从中任取3件,求下列事件的概率。(1)3件中恰有2件次品;(2)3件中至少有1件次品;(3)3件全是次品;(4)3件全是正品。解:现将从20件产品中任取3件的每种取法作为每个基本事件,其结果与顺序无关,故可用组合数来解决该古典概型问题。(1);(2)或;124 10452班专用(3);(4)。6.房间里有10个人,分别佩戴着1~10号的纪念章,现等可能地任选三人,记录其纪念章号码,试求:(1)最小号码为5的概率;(2)最大号码为5的概率。解:设A={任选三人中最小号码为5},B={任选三人中最大号码为5}(1)对事件A,所选的三人只能从5~10中选取,而且5号必定被选中。;(2)对事件B,所选的三人只能从1~5中选取,而且5号必定被选中。。7.某大学学生中近视眼学生占22%,色盲学生占2%,其中既是近视眼又是色盲的学生占1%。现从该校学生中随机抽查一人,试求:(1)被抽查的学生是近视眼或色盲的概率;(2)被抽查的学生既非近视眼又非色盲的概率。解:设A={被抽查者是近视眼},B={被抽查者是色盲};由题意知,P(A)=0.22,P(B)=0.02,P(AB)=0.01,则(1)利用加法公式,所求概率为P(A+B)=P(A)+P(B)-P(AB)=0.22+0.02-0.01=0.23;(2)所求概率为P()=P()=1-P(A+B)=1-0.23=0.77。注意:上述计算利用了德·摩根对偶律、对立事件公式和(1)的结果。8.设P(A)=0.5,P(B)=0.3且P(AB)=0.l。求:(1)P(A+B);(2)P(+B)。解:(1)P(A+B)=P(A)+P(B)-P(AB)=0.5+0.3-0.1=0.7;(2)P(+B)=P()+P(B)-P(B)=[1-P(A)]+P(B)-P(B-A)=1-P(A)+P(B)-[P(B)-P(AB)]=1-P(A)+P(AB)124 10452班专用=1-0.5+0.1=0.6。注意:上述计算利用了加法公式、差积转换律、对立事件公式和事件之差公式。9.假设接受一批药品时,检验其中一半,若不合格品不超过2%,则接收,否则拒收。假设该批药品共100件,其中有5件不合格,试求该批药品被接收的概率。解:设A={50件抽检药品中不合格品不超过1件},据题意,仅当事件A发生时,该批药品才被接收,故所求概率为。10.设A,B为任意两个事件,且P(A)>0,P(B)>0。证明:(1)若A与B互不相容,则A和B不独立;(2)若P(B|A)=P(B|),则A和B相互独立。证明:(1)用反证法。假定A和B独立,因为已知A与B互不相容,则AB=Æ,P(AB)=P(Æ)=0故P(A)P(B)=P(AB)=0但由已知条件P(A)>0,P(B)>0得P(A)P(B)>0,由此导出矛盾,所以若A与B互不相容,则A和B不独立。(2)由已知P(B|A)=P(B|),又,则即P(AB)[1-P(A)]=P(A)[P(B)-P(AB)]P(AB)-P(AB)P(A)=P(A)P(B)-P(A)P(AB)故P(AB)=P(A)P(B)这即A和B相互独立。(2)又证:由已知124 10452班专用P(B|A)=P(B|)即P(B|A)[1-P(A)]=P(B)-P(AB)P(B|A)-P(B|A)P(A)=P(B)-P(AB)P(B|A)-P(AB)=P(B)-P(AB)P(B|A)=P(B)这即A和B相互独立。11.已知P(A)=0.1,P(B)=0.3,P(A|B)=0.2,求:(1)P(AB);(2)P(A+B);(3)P(B|A);(4)P();(5)P()。解:(1)P(AB)=P(B)P(A|B)=0.3×0.2=0.06;(2)P(A+B)=P(A)+P(B)-P(AB)=0.1+0.3-0.06=0.34;(3);(4)P()=P(A-B)=P(A)-P(AB)=0.1-0.06=0.04;(5)。12.某种动物活到12岁的概率为0.8,活到20岁的概率为0.4,问现年12岁的这种动物活到20岁的概率为多少?解:设A={该动物活到12岁},B={该动物活到20岁};由题意知P(A)=0.8,P(B)=0.4显然该动物“活到20岁”一定要先“活到12岁”,即有BÌA,且AB=B,则所求概率是条件概率。13.甲、乙、丙三人各自独立地去破译一密码,他们能译出该密码的概率分别是1/5,2/3,1/4,求该密码被破译的概率。解:设A={甲译出该密码},B={乙译出该密码},C={丙译出该密码}.124 10452班专用由题意知,A,B,C相互独立,而且P(A)=1/5,P(B)=2/3,P(C)=1/4则密码被破译的概率为P(A+B+C)=1-=1-==0.8或P(A+B+C)=P(A)+P(B)+P(C)-P(AB)-P(AC)-P(BC)+P(ABC)=P(A)+P(B)+P(C)-P(A)P(B)-P(A)P(C)-P(B)P(C)+P(A)P(B)P(C)=。14.有甲乙两批种籽,发芽率分别为0.8和0.7,在两批种籽中各任意抽取一粒,求下列事件的概率:(1)两粒种籽都能发芽;(2)至少有一粒种籽能发芽;(3)恰好有一粒种籽能发芽。解:设A={甲种籽能发芽},B={乙种籽能发芽}则由题意知,A与B相互独立,且有P(A)=0.8,P(B)=0.7,则所求概率为(1)P(AB)=P(A)P(B)=0.8×0.7=0.56;(2)P(A+B)=1-P()=1-P()=1-=1-0.2×0.3=0.96;(3)P()==0.8×0.3+0.2×0.7=0.38。15.设甲、乙两城的通讯线路间有n个相互独立的中继站,每个中继站中断的概率均为p,试求:(1)甲、乙两城间通讯中断的概率;(2)若已知p=0.005,问在甲、乙两城间至多只能设多少个中继站,才能保证两地间通讯不中断的概率不小于0.95?解:设Ak={第k个中继站通讯中断},k=1,2,…,n,则A1,A2,…,An相互独立,而且有P(Ak)=p,k=1,2,…,n。(1)所求概率为P(A1+A2+…+An)=1-P()=1-P()=1-=1-1-(1-p)n;124 10452班专用(2)设甲、乙两城间至多只能设n个中继站,由题意,应满足P()=(1-p)n≥0.95,即(1-0.005)n≥0.950.995n≥0.95n≤log0.9950.95=ln0.95/ln0.995=10.233故n=10,即甲、乙两城间至多只能设10个中继站。16.在一定条件下,每发射一发炮弹击中飞机的概率是0.6,现有若干门这样的炮独立地同时发射一发炮弹,问欲以99%的把握击中飞机,至少需要配置多少门这样的炮?解:设至少需要配置n门炮。再设Ak={第k门炮击中飞机},k=1,2,…,n,则A1,A2,…,An相互独立,而且有P(Ak)=0.6,k=1,2,…,n。由题意,应有P(A1+A2+…+An)=1-P()=1-=1-1-0.4n≥0.99即0.4n≤0.01,则有n≥log0.40.01=ln0.01/ln0.4=5.026故n=6,因此至少需要配置6门炮。17.甲袋中有3只白球,7只红球,15只黑球;乙袋中10只白球,6只红球,9只黑球。现从两袋中各取一球,求两球颜色相同的概率。解:设以A1、A2、A3分别表示从甲袋中任取一球为白球、红球、黑球;以B1、B2、B3分别表示从乙袋中任取一球为白球、红球、黑球。则所求两球颜色相同的概率为P(A1B1+A2B2+A3B3)=P(A1)P(B1)+P(A2)P(B2)+P(A3)P(B3)124 10452班专用。18.在某地供应的某药品中,甲、乙两厂的药品各占65%、35%,且甲、乙两厂的该药品合格率分别为90%、80%,现用A1、A2分别表示甲、乙两厂的药品,B表示合格品,试求:P(A1)、P(A2)、P(B|A1)、P(B|A2)、P(A1B)和P(B)。解:由题中已知条件可得P(A1)=0.65,P(A2)=0.35,P(B|A1)=0.9,P(B|A2)=0.8,P(A1B)=P(A1)P(B|A1)=0.65×0.9=0.585,P(B)=P(A1)P(B|A1)+P(A2)P(B|A2)=0.65×0.9+0.35×0.8=0.865。19.某地为甲种疾病多发区,其所辖的三个小区A1,A2,A3的人口比例为9∶7∶4,据统计资料,甲种疾病在这三个小区的发病率依次为4‰,2‰,5‰,求该地甲种疾病的发病率。解:设以A1、A2、A3表示病人分别来自小区A1、A2、A3,以B表示患甲种疾病。则由题意知P(A1)=,P(A2)=,P(A3)=,P(B|A1)=0.004,P(B|A2)=0.002,P(B|A3)=0.005,则该地甲种疾病的发病概率为P(B)=P(A1)P(B|A1)+P(A2)P(B|A2)+P(A3)P(B|A3)==3.5‰。20.若某地成年人中肥胖者(A1)占有10%,中等者(A2)占82%,瘦小者(A3)占8%,又肥胖者、中等者、瘦小者患高血压病的概率分别为20%,10%,5%。(1)求该地成年人患高血压的概率;(2)若知某人患高血压病,他最可能属于哪种体型?解:设B={该地成年人患高血压},则由题意知P(A1)=0.10,P(A2)=0.82,P(A3)=0.08,P(B|A1)=0.20,P(B|A2)=0.10,P(B|A3)=0.05,124 10452班专用(1)该地成年人患高血压的概率为P(B)=P(A1)P(B|A1)+P(A2)P(B|A2)+P(A3)P(B|A3)==0.106;(2)若已知某人患高血压病,他属于肥胖者(A1)、中等者(A2)、瘦小者(A3)体型的概率分别为P(A1|B)=P(A2|B)=P(A3|B)=因为P(A2|B)>P(A1|B)>P(A3|B)故若知某人患高血压病,他最可能属于中等体型。21.三个射手向一敌机射击,射中概率分别为0.4,0.6和0.7。若一人射中,敌机被击落的概率为0.2;若两人射中,敌机被击落的概率为0.6;若三人射中,则敌机必被击落。(1)求敌机被击落的概率;(2)已知敌机被击落,求该机是三人击中的概率。解:设A1、A2、A3分别表示第一个射手、第二个射手、第三个射手射中敌机;B0、B1、B2、B3分别表示无人射中、一人射中、两人射中、三人射中敌机;C表示敌机被击落。则A1、A2、A3相互独立,且由题意可得P(A1)=0.4,P(A2)=0.6,P(A3)=0.7P(B0)=P()=P()P()P()=0.6×0.4×0.3=0.072P(B1)=P()===0.4×0.4×0.3+0.6×0.6×0.3+0.6×0.4×0.7=0.324P(B2)=P()==124 10452班专用=0.4×0.6×0.3+0.6×0.6×0.7+0.4×0.4×0.7=0.436P(B3)=P()=P(A1)P(A2)P(A3)=0.4×0.6×0.7=0.168P(C|B0)=0,P(C|B1)=0.2,P(C|B2)=0.6,P(C|B3)=1(1)敌机被击落的概率为P(C)=P(C|B0)P(B0)+P(C|B1)P(B1)+P(C|B2)P(B2)+P(C|B3)P(B3)=0×0.072+0.2×0.324+0.6×0.436+1×0.168=0.4944;(2)所求概率为P(B3|C)=。五、思考与练习(一)填充题1.若P(A)=0.3,P(B)=0.6,则(1)若A和B独立,则P(A+B)=,P(B-A)=;(2)若A和B互不相容,则P(A+B)=,P(B-A)=;(3)若AÌB,则P(A+B)=,P(B-A)=。2.如果A与B相互独立,且P(A)=P(B)=0.7,则P()=。3.在4次独立重复试验中,事件A至少出现1次的概率为,则在每次试验中事件A出现的概率是。(二)选择题1.下列说法正确的是()A.任一事件的概率总在(0,1)之内B.不可能事件的概率不一定为0C.必然事件的概率一定为1D.以上均不对。2.以A表示事件“甲种药品畅销,乙种药品滞销”,则其A的对立事件为()A.甲,乙两种药品均畅销B.甲种药品滞销,乙种药品畅销124 10452班专用C.甲种药品滞销”D.甲种药品滞销或乙种药品畅销3.有100张从1到100号的卡片,从中任取一张,取到卡号是7的倍数的概率为()A.B.C.D.4.设A和B互不相容,且P(A)>0,P(B)>0,则下列结论正确的是()A.P(B|A)>0B.P(A)=P(A|B)C.P(A|B)=0D.P(AB)=P(A)P(B)(三)计算题1.设Ω={1,2,3,4,5,6,7},A={2,3,4},B={3,4,5}。试求下列事件:(1);(2)+B。2.某城市的电话号话由0,1,2,…,9这10个数字中任意8个数字组成,试求下列电话号码出现的概率:(1)数字各不相同的电话号码(事件A);(2)不含2和7的电话号码(事件B);(3)5恰好出现两次的电话号码(事件C)。3.一部五卷的文集,按任意次序放到书架上去,试求下列事件的概率:(1)第一卷出现在两边;(2)第一卷及第五卷出现在两边;(3)第一卷或第五卷出现在两边;(4)第三卷正好在正中。4.电路由电池A与两个并联的电池B、C串联而成,设电池A、B、C是否损坏相互独立,且它们损坏的概率依次为0.3,0.2,0.2,求电路发生间断的概率。5.124 10452班专用设一医院药房中的某种药品是由三个不同的药厂生产的,其中一厂、二厂、三厂生产的药品分别占1/4、1/4、1/2。已知一厂、二厂、三厂生产药品的次品率分别是7%,5%,4%。现从中任取一药品,试求(1)该药品是次品的概率;(2)若已知任取的药品是次品,求该次品是由三厂生产的概率。6.盒中放有12个乒乓球,其中有9个球是新球。第一次比赛从盘中任取3个来用,比赛后仍放回盒中;第二次比赛时又从盒中任取3个。(1)求第二次取出的球都是新球的概率;(2)若已知第二次取出的球都是新球,求第一次取到的都是新球的概率。六、思考与练习参考答案(一)填充题1.(1)0.72,0.42;(2)0.9,0.6;(3)0.6,0.32.0.093.(二)选择题1.C;2.D;3.A;4.C(三)计算题1.={1,5,6,7},={1,2,6,7},则(1)={1,6,7};(2)+B={1,3,4,5,6,7}2.(1)(2)(3)3.(1)=0.4;(2)=0.1;124 10452班专用(3)=0.7;或=0.7;或=0.7(4)=0.24.已知P()=0.3,P()=0.2,P()=0.2且A、B、C相互独立则所求概率P()=P()+P()-P()=P()+P()P()-P()P()P()=0.3+0.2×0.2-0.3×0.2×0.2=0.3285.令A={该药品是次品};Bk={药品是由k厂生产的},k=1,2,3。由题意知P(B1)=0.25,P(B2)=0.25,P(B3)=0.5,P(A|B1)=0.07,P(A|B2)=0.05,P(A|B3)=0.04,(1)P(A)=P(A|B1)P(B1)+P(A|P2)P(B2)+P(A|B3)P(B3)=0.07×0.25+0.05×0.25+0.04×0.50=0.05(2)6.令Ak={第一次比赛任取3球中有k个新球},k=0,1,2,3;B={第二次取出的球都是新球}。由题意得P(Ak)=,P(B|Ak)=,k=0,1,2,3。(1)124 10452班专用(2)=0.238第三章随机变量及其分布一、学习目的和要求1.理解随机变量及其分布函数的概念;2.熟练掌握离散型、连续型随机变量的分布及性质;3.熟练掌握常用数字特征:数学期望E(X)和方差D(X)及其性质;4.熟练掌握二项分布、泊松分布、正态分布等的性质及概率计算;5.了解随机变量函数的分布;6.了解随机向量及分布函数的概念、性质;7.掌握离散型随机向量和连续型随机向量及其分布;8.掌握二维随机向量的数字特征;9.了解契比晓雪夫不等式和大数定律及其意义;10.掌握中心极限定理及其应用;11.了解用Excel计算二项分布、泊松分布、正态分布等常用分布的概率。二、内容提要(一)随机变量及常用分布1.离散型随机变量及常用分布名称定义性质或背景备注分布律P{X=xk}=pk,k=1,2,…或Xx1x2…xk…Pp1p2…pk…1.pk≥0,k=1,2,…2.124 10452班专用0-1分布P{X=1}=p,P{X=0}=q,或X01Pqp二项分布n=1的特例:B(1,p)(一重贝努里试验)EX=pD(X)=pq二项分布B(n,p)P{X=k}=,k=0,1,…,nX为n重贝努里试验中A事件发生的次数EX=npD(X)=npq泊松分布P(l)P{X=k}=,k=0,1,2,…,l>0是常数二项分布泊松近似公式(l≈np)(n很大,p较小)EX=lD(X)=l超几何分布P{X=k}=k=1,2,…,min(M,n)无放回产品抽样试验当N→+∞时,时,EX=2.连续型随机变量及常用分布名称定义性质或背景备注密度函数f(x)对任意a0为常数E(X)=1/lD(X)=1/l2124 10452班专用均匀分布U[a,b]直线上几何概率模型的分布描述E(X)=(a+b)/2D(X)=(b-a)2/12对数正态分布LN()f(x)=若X服从对数正态分布LN(),则lnX~N()韦布尔分布W(m,a,b)f(x)=m=1且a=0时为指数分布;m=3.5时近似于正态分布分布函数为F(x)=,(x>a)3.随机变量的分布函数类型定义性质备注通用定义F(x)=P{X≤x},﹣∞<x<+∞1.0≤F(x)≤1;2.F(﹣∞)=0,F(+∞)=13.F(x)对x单调不减4.F(x)为右连续P{a30)时,有三、综合例题解析例1(1991年考研题)124 10452班专用一汽车沿一街道行驶,需要通过三个均设有红绿灯的路口。每个信号灯为红或绿与其他信号灯为红或绿相互独立,且红绿两种信号显示的时间相等。以X表示该汽车首次遇到红灯前已通过的路口个数,求X的概率分布。解:首先,由题设可知,X的可能值为0,1,2,3。现设Ai={汽车在第i个路口首次遇到红灯},i=1,2,3,则事件A1,A2,A3相互独立,且(i=1,2,3),故有P{X=0}=P(A1)=,所以,X的分布律为X0123P注意:利用性质:,可检查离散型概率分布律的正确与否。同时,若X的某个取值x0的概率较难计算,而其他所有取值的概率已算出时,则也可以利用上述性质得到:。比如本例中:。例2设连续型随机变量X的分布函数为124 10452班专用求:(1)常数A、B;(2)概率密度函数f(x)。解:(1)由分布函数的性质F(+∞)=1得F(+∞)=,再由分布函数的连续性知其右极限F(0+0)=F(0),即F(0+0)=联立上述两式,解之得:A=1,B=﹣1。则分布函数为(2)所求密度函数为。例3(1989年考研题)设随机变量x在区间[1,6]上服从均匀分布,求方程x2+xx+1=0有实根的概率。解:易知方程x2+xx+1=0有实根当且仅当Δ=x2-4≥0,即|x|≥2。故所求问题转化为:已知x~U[1,6],求P{|x|≥2}。现因x在[1,6]上服从均匀分布,则x的概率密度为方程x2+ξx+1=0有实根的充要条件是Δ=x2-4≥0,即|x|≥2,故124 10452班专用。例4已知X~N(2,s2),P{2<X<4}=0.3,求P{X<0}。解:由于X~N(2,s2),故由于,可知,故。注意:在正态分布的概率计算中,首先要将它标准化,转化为利用标准正态分布的公式求解即可。例5(1989年考研题)设随机变量X和Y独立,且X服从均值为1,标准差为的正态分布,而Y服从标准正态分布,试求随机变量Z=2X-Y+3的概率密度函数。解:由于X和Y相互独立且都服从正态分布,所以Z作为X,Y的线性组合也服从正态分布,故只需求E(Z)和D(Z)就可确定Z的概率密度函数了。由题设知,X~N(1,2),Y~N(0,1)。则由期望和方差的性质得E(Z)=E(2X-Y+3)=2E(X)-E(Y)+3=5,D(Z)=D(2X-Y+3)=22D(X)+D(Y)=9.又因X,Y是相互独立的正态随机变量,Z是X,Y的线性函数,故Z也为正态随机变量,即Z~N(m,s2),且m=E(Z)=5,s2=D(Z)=9。则Z的概率密度为。124 10452班专用注意:本题主要考察的性质是:一是独立正态分布的线性组合仍为正态分布;二是正态分布N(m,s2)完全由其期望m和方差s2决定。例6已知随机变量X的概率分布律为P{X=k}=1/2k,k=1,2,…,试求的概率分布律。解:对随机变量,当X取1,2,…,n,…时,Y的取值为1,0,﹣1,0,…,即X1234567…10-1010-1…P则只以﹣1,0,1为其取值,其取值概率为P{Y=﹣1}=P{X=3}+P{X=7}+P{X=11}+…;P{Y=0}=P{X=2}+P{X=4}+P{X=6}+…;P{Y=1}=P{X=1}+P{X=5}+P{X=9}+…(或P{Y=1}=1-P{X=﹣1}-P{X=0}=)故Y的分布律为124 10452班专用Y-101P例7设(X,Y)的联合分布律为XY-1011/41/421/6a求:(1)常数a;(2)联合分布函数在点()处的值F()。解:(1)由联合分布律的性质知求得。(2)(X,Y)的联合分布函数F(x,y)在点()处的值应为。注:求联合分布函数F(x,y)的值时,只需把取值满足xi≤x,yj≤y的点(xi,yj)的概率pij找出来,然后求和就可以了。例8设,则X与Y相互独立的充分必要条件是=0。证:(充分性)由于,则其X与Y的边缘密度分别为124 10452班专用当=0时,有故X与Y相互独立。(必要性)若已知X与Y相互独立,则对任意x,y,有特别地,取,上式变为,从而有r=0。例9(2001年考研题)一生产线生产的产品成箱包装,每箱的重量是随机的。假设每箱平均重50千克,标准差为5千克。若用最大载重量为5吨的汽车承运,试利用中心极限定理说明每辆车最多可以装多少箱,才能保障不超载的概率大于0.977。(F(2)=0.977,其中F(x)是标准正态分布函数)。解:设Xi是汽车装运的第i箱的重量(千克),n为最多可以装的箱数,则X1,X2,…,Xn可视为n个相互独立而且服从同分布的随机变量,再设X为n箱的总重量,则有,且而由列维-林德贝格中心极限定理,X近似服从正态分布N(nm,ns2)。则所求箱数n决定于条件124 10452班专用因F(2)=0.977,则有解之得n<98.02,即最多可以装98箱。例10设在n重伯努利试验中,每次试验事件A发生的概率都是0.7。(1)设X表示1000次独立试验中事件A发生的次数,用中心极限定理计算P{650<X≤750};(2)要使在n次试验中,A发生的频率在0.68与0.72之间的概率至少为0.9,问至少要做的试验次数n为多少?解(1)因X~B(1000,0.7),由德莫佛-拉普拉斯中心极限定理得(2)X为n次独立试验中事件A发生的次数,因此,n次试验中,A发生的频率为,其中X~B(n,0.7),E(X)=0.7n,D(X)=0.21n,依题意,n应使即由于F(1.65)=0.95,所以,n应使,124 10452班专用即因此,至少要做1430次试验。注意:运用德莫弗-拉普拉斯定理计算概率近似值时,其关键是:“标准化”和“正态近似”,n越大所得的近似值越精确。注:(1)若X~B(n,p),则,其中Xi相互独立且都服从参数为p的0-1分布;(2)二项分布概率的计算,可总结为下述三种方法;方法一:X~B(n,p),且不太大(n≤20)时,直接计算。方法二:当n较大,且p较小(n≥20,p<0.1)时,由泊松定理,可近似计算:方法三:当n较大,而p不太小时,用中心极限定理作正态近似计算例11一复杂系统由n个相互独立起作用的部件所组面,每个部件的可靠性(即部件正常工作的概率)为0.9,且必须至少有80%的部件工作才能使整个系统工作。问:(1)n至少为多大时,才能使系统的可靠性不低于0.95?(2)若该系统由85个部件组成,则该系统的可靠性是多少?解:令X={n个部件中正常工作的部件数},则X~B(n,0.9)。(1)由题意应求出n,使得则,n≥24.206。故n至少为25时,才能使系统的可靠性不低于0.95。(2)所求可靠性为124 10452班专用。四、习题三解答1.下面两表是否可作为离散型随机变量的分布列?为什么?X﹣102X012P﹣0.50.90.6P0.60.10.15解:对表1,因为P{X=﹣1}=﹣0.5<0,所以不可作为离散型随机变量的分布列。对表2,因为,所以不可作为离散型随机变量的分布列。2.一盒中有五枚纪念章,编号为1,2,3,4,5,从中任取3枚,用X表示取出的纪念章的最大号码,求X的分布律。解:由题意知:X的取值为3,4,5,P{X=3}=,P{X=4}=,P{X=5}=故X的分布律为X012P0.10.30.6124 10452班专用或X的分布律为P{X=k}=,k=3,4,5。3.进行某种试验,成功的概率为3/4,失败的概率为1/4,以X表示直到试验成功所需试验的次数,(1)试写出X的概率分布;(2)求X取偶数的概率。解:(1)X的概率分布律为,k=1,2,…(2)X取偶数的概率P{X=偶数}=P{X=2}+P{X=4}+…+P{X=2k}+…4.设随机变量X的分布列为:X0123P0.40.2p30.1求:(l)p3;(2)P{010}=P{X≥11}=。17.设X~N(5,22),查表计算概率:(1)P{4≤X<7};(2)P{|X|>1}。解:(1)P{4≤X<7}==F(1)-F(﹣0.5)=F(1)-(1-F(0.5))=F(1)-1+F(0.5)=0.8413-1+0.6915=0.5328(2)P{|X|>1}=1-P{|X|≤1}=1-P{﹣1≤X≤1}=1-[]=1-[F(﹣2)-F(﹣3)]=1-[1-F(2)-1+F(3)]=1+F(2)-F(3)=1+0.9773-0.9987=0.978618.将一温度调节器放置在贮存某种液体的容器内,调节器调整在d℃,则液体温度X是一个随机变量,且X~N(d,0.52)。(1)若d=90,求X<89的概率;(2124 10452班专用)若要保持液体温度至少为80℃的概率不小于0.99,问d至少为多少?解:(1)因X~N(90,0.52),则P{X<89}==F(﹣2)=1-F(2)=1-0.9773=0.0227(2)依题意应有P{X≥80}≥0.99,即P{X≥80}=1-P{X≤80}=1-≥0.99,则≥0.99,查表得,故d≥80+0.5×2.33=81.165。19.某工厂生产的螺栓长度(cm)服从参数m=10.05,s=0.06的正态分布,如果规定长度在10.05±0.12内为合格品,求任取一螺栓为不合格品的概率。解:螺栓为合格品的概率P{10.05-0.12x2}=1-P{X≤x2}=1-,则,故x2=60+3×0.21=60.63。因此所求分位数是x1=57.96,x2=60.63。22.设随机变量X的密度函数为,试求:(1)Y1=2X;(2)Y2=e-2X的数学期望。124 10452班专用解:(1)。(2)。23.已知随机变量X的概率分布为X-2-0.500.54P1/81/41/81/61/3试求下列随机变量的分布律:(1)2X+1;(2)X2;(3)。解:X﹣2﹣0.500.542X+1﹣30129X240.2500.2516000P1/81/41/81/61/3(1)则2X+1的分布律为2X+1﹣30129P1/81/41/81/61/3(2)则X2的分布律为X200.25416P1/85/121/81/3(3)则的分布律为124 10452班专用0P1/47/121/624.设随机变量X的概率密度为试求Y=2X的密度。解一:当X的取值为(0,1)时,函数y=2x在(0,1)内严格单调,其取值为(0,2)。当y≤0时,FY(y)=P{Y≤y}=0,则;当00,则y=2x为严格单调增加函数,其取值范围是(0,2),故可利用定理公式法。由y=2x得其反函数为,故Y的密度为124 10452班专用25.已知球体直径X在(a,b)内服从均匀分布,其中01.666}。解:虽然服从的分布未知,但由定理知124 10452班专用~c2(n-1)其中自由度n-1=15,故有P{>1.666}=P{>(n-1)×1.666}=P{>24.99}=a现应求a的值。因c2=~c2(15),由上侧临界值意义知,有c2a(15)=24.99。现对n=15,查c2(15)分布表(附表5)得a=P{>24.99}=0.05,所以P{>1.666}=a=0.05。例4(1998年考研题)设X1,X2,X3,X4是来自正态总体N(0,22)的简单随机样本,,则当a=,b=时,统计量Y服从c2分布,其自由度为。解:由已知Xi~N(0,22)(i=1,2,3,4)且X1,X2,X3,X4相互独立,则对X1-2X2,有E(X1-2X2)=0,D(X1-2X2)=D(X1)+4D(X2)=20从而同理可得由c2变量的构成知,两个服从N(0,1)的独立的随机变量的平方和应服从c2(2)分布。因此124 10452班专用对照题目条件,应得其自由度为2。四、习题四解答1.总体X~N(m,s2),其中m未知,s2为已知参数,X1,X2,…,Xn是从总体抽取的一组样本,则下列各式中哪些属于统计量?解:因为m是未知参数,s2为已知参数,故(1)、(3)、(4)、(6)是统计量,而(2)和(5)均含有未知参数m,不属于统计量。2.设对总体X得到一个容量为10的样本值:4.5,2.0,1.0,1.5,3.5,4.5,6.5,5.0.3.5,4.0试求样本均值、样本方差S2和样本标准差S。解:解:(1),n=10155.5样本均值124 10452班专用样本方差样本标准差=≈1.697。3.在总体N(52,6.32)中随机地抽取一个容量为36的样本,求样本平均值落在50.8到53.8之间的概率。解:因为总体X~N(52,6.32),则~N(52,)故所求概率为P{50.8≤≤53.8}==F(1.714)-F(-1.143)=F(1.714)-1+F(1.143)=0.9564-1+0.8729=0.8293。4.查表求下列各临界值(1)c20.01(10),c20.10(12),c20.99(60),c20.95(16);(2)t0.10(4),t0.99(10),t0.05(12),t0.975(60);(3)F0.99(10,9),F0.95(10,9),F0.10(28,2),F0.05(10,8)。解:(1)查c2分布表(附表5)及制表公式P{c2>c2a(n)}=a可得c20.01(10)=23.209,c20.10(12)=18.549,c20.99(60)≈,c20.95(16)=7.962;(2)查t分布表(附表6)及制表公式P{t>ta(n)}=a可得t0.10(4)=1.5332,t0.99(10)=﹣t0.01(10)=﹣2.7638,t0.05(12)=1.7829,t0.975(60)≈u0.975=﹣u0.025=﹣1.96;(3)查F分布表(附表7)及制表公式P{F>Fa(n)}=a可得124 10452班专用F0.99(10,9)=,F0.95(10,9),F0.10(28,2)≈9.46,F0.05(10,8)=3.35。5.已知随机变量T~t(n),求证:T2~F(1,n)。证:因为随机变量T~t(n),则有X~N(0,1),Y~c2(n),且X与Y相互独立,使得T=则T2=易知X2~c2(1),Y~c2(n),且X2与Y相互独立,由此得T2=~F(1,n)。6.已知随机变量F~F(n1,n2),试证随机变量~F(n2,n1)。证明:因为随机变量F~F(n1,n2),则有X1~c2(n1),X2~c2(n2),且X1与X2相互独立,使得F~F(n1,n2)则有由F分布的定义知有~F(n2,n1)。五、思考与练习(一)填充题1.设总体X~N(μ,s2),其中μ,s2为已知数,X1,X2,…,Xn来自X124 10452班专用的一个样本,,S2分别是样本均值和方差,且相互独立,则样本均值~分布,而统计量~分布,统计量~分布,统计量~分布。2.设x1,x2,…,x20是来自N(10,1)的一个简单样本,是其样本均值,则服从分布,E()=,D()=;P{>10}=。3.(1997年考研题)设随机变量X和Y相互独立而且都服从正态分布N(0,32),而X1,X2,…,X9和Y1,Y2,…,Y9分别是来自总体X和Y的简单随机样本,则统计量服从分布,参数为。4.设Q,U是两个相互独立的随机变量,并且已知,其中为常数,则服从分布;服从分布。(二)选择题1.关于随机抽样,下列哪一项说法是正确的()。A.抽样时应使得总体的每一个个体都有同等的机会被抽取B.研究者在抽样时应精心挑选个体,以使样本更能代表总体C.随机抽样即随意抽取个体D.为确保样本具有更好的代表性,样本量应比较大2.(2003年考研题)设随机变量X~t(n)(n>1),,则A.B.C.D.124 10452班专用(三)计算题1.设X1,X2,…,X10是来自总体X~N(μ,42)的简单随机样本,已知,试求a的值。2.求以下各分布的临界值(1)P{c2(21)>λ}=0.025;(2)P{c2(21)<λ}=0.025;(3)P{t(4)>λ}=0.99;(4)P{|t(4)|<λ}=0.99;(5)P{t(4)<λ}=0.1;(6)P{c2(15)<λ}=0.95。五、思考与练习参考答案(一)填充题1.,N(0,1),t(n-1),c2(n-1)2.,10,1/20;0.53.t,94.F(p,n-p-1),c2(n-1)(二)选择题1.A2.C(三)计算题1.因~c2(9),则=14.684,解之得a=26.1。2.注意各分布临界值表的制表公式。124 10452班专用(1)c20.025(21)=35.479;(2)c20.975(21)=10.283;(3)t0.99(4)=﹣t0.01(4)=﹣3.7469;(4)t0.01/2(4)=t0.005(4)=4.6041;(5)t0.9(4)=﹣t0.1(4)=﹣1.5332;(6)c20.05(21)=24.996。第五章参数估计一、学习目的和要求1.理解点估计与区间估计的概念和基本思想;2.掌握点估计的矩估计法;3.了解最大似然估计法;4.了解估计的优良性;5.熟练掌握正态总体参数(均值和方差)的区间估计;6.掌握二项分布总体率的区间估计;7.了解泊松分布的区间估计;8.了解用Excel进行正态总体参数的点估计与区间估计的运算。二、内容提要(一)总体参数的点估计法点估计法基本思想计算步骤矩估计法用样本矩估计相应的总体矩,从而得到总体未知参数的估计值设未知参数为θ1,θ21.由总体X的分布计算E(X),E(X2)2.解方程组得θ1,θ2的矩估计124 10452班专用最大似然估计法根据样本来选择参数,使得该样本出现的可能性最大设未知参数为θ1.写出似然函数2.选择q,使L(q)最大。即解似然方程或3.解之得即为θ的最大似然估计(二)估计量的判别标准判别标准定义备注无偏性样本均值是总体均值的无偏一致估计量;样本方差是总体方差的无偏一致估计量;样本率p是总体率P的无偏一致估计量。有效性设均为的无偏估计量,若,则称比有效一致性对任意给定的,有,即依概率收敛于(三)总体参数的区间估计总体分布参数条件置信区间正态分布均值已知未知未知大样本(n30)124 10452班专用方差未知二项分布总体率大样本(n30)小样本(n<30)查附表8泊松分布参数大样本(n30)小样本(n<30)查附表9三、综合例题解析例1设是总体分布中的未知参数,是其一个样本,若()的均值与方差都存在且满足条件,证明是的一致估计量。证:我们可应用切比雪夫不等式并结合定义加以证明。由题设已知由切比雪夫不等式,知对于任意的>0,有由一致性的定义,可知是参数的一致估计量。注意:若是的无偏估计量,且,则必是的一致估计量,这一点可以直接作为结论使用。例2设是在区间上服从均匀分布的总体的样本,试求未知参数的最大似然估计量。124 10452班专用解:总体的分布密度设为样本观测值,于是似然函数为为使达到最大,要求尽可能小;同时,为保证不为0,应使这等价于故只有取才能使达到最大值,即的最大似然估计值其最大似然估计量为。例3(2002年考研题)设总体X的概率密度为而X1,X2,…,Xn是来自总体X的简单随机样本,则未知参数θ的矩估计量为。解:因为只有一个未知参数,所以只要求总体一阶矩即可:124 10452班专用所以故应填。例4设某车间生产一批产品,其次品率为p,今从中抽取n件,发现其中有m件次品。试用最大似然估计法估计其次品率p。解:用Xi表示第i次抽取到的次品数,i=1,2,…,n。显然有则Xi服从0-1分布,且概率分布,于是似然函数由题意,n次抽取中有m件次品,故m=,于是L(p)=pm(1-p)n-m两边取对数,得上式两边对p求导,并令其导数为零,得似然方程解之,即可得到参数p的最大似然估计值为124 10452班专用而为参数p的最大似然估计量。例5某厂6名女工血红蛋白的均值为114.33g/L,标准差为10.61g/L,问该厂女工血红蛋白的总体均值是多少?其95%和99%置信区间为多少?解:已知6名女工血红蛋白的均值g/L,故该厂女工血红蛋白的总体均值的矩估计值是g/L。已知,,,,对和0.99,即和0.01,查分布表得,,于是所以该厂女工血红蛋白的总体均值的95%置信区间为(103.20,125.46)g/L;99%置信区间为(96.87,131.79)g/L。例6设大学生男生身高的总体X~N(m,16)(单位:cm),若要使其平均身高置信度为0.95的置信区间长度小于1.2,问应抽查多少名学生的身高?解:已知方差,且为正态总体,则对,即,查表得,则置信区间为124 10452班专用置信区间长度。问题要求,即所以故至少应抽查171名男生的身高。四、习题五解答1.设是在区间上服从均匀分布的总体的样本,试求未知参数的矩估计量。解:对区间上的均匀分布其总体数学期望E(X)=则E(X)=,所以未知参数的矩估计量为。1.设X1,X2是来自正态总体的一个样本,试证明以下三个估计量,,都是的无偏估计量,并确定哪一个最有效。解:(1)因总体X~N(m,1),则Xi~N(m,1),i=1,2。124 10452班专用因此,都是的无偏估计量。(2),3.设总体的概率密度为其中是未知参数,是来自该总体的一个样本,试分别用矩估计法和最大似然估计法求的估计量。解:(1)求的矩估计量。先求的总体均值由矩估计法,令,解之得q的矩估计量:(2)求的最大似然估计量。其似然函数124 10452班专用取对数得对q求导并令其为0,得似然方程解得q的最大似然估计值最大似然估计量为4.试对下列样本数据求总体均值和方差的无偏估计。(1)5,-3,2,0,8,6;(2)10,15,14,15,16。解:总体均值m的无偏估计为数据的样本均值,总体方差s2的无偏估计别为数据的样本方差S2。则(1)=3;=16.8;(2)=14;=5.5。5.某合成车间的产品在正常情况下,含水量服从N(m,s2),其中s2=0.25,现连续测试9批,得样本均值为2,试计算置信水平(1-a)为0.99时总体均值m的置信区间。解:已知s2=0.25,n=9,=2。又,,故=2.58。则总体均值m的置信水平(1-a)为0.99的置信区间124 10452班专用即总体均值的99%置信区间为(1.57,2.43)。6.已知,,,且总体服从正态分布,试计算总体均值的95%置信区间。解:已知,,,则=31.5,又对1-=0.95,=0.05,查t(n-1)分布表得则所求的95%置信区间为(-2.31,6.31)。7.设正态总体的方差已知,问抽取的样本容量应多大,才能使总体均值的置信度为0.95的置信区间长不大于。解:方差已知时总体均值的置信度为1-a的置信区间为则置信区间长度为,由题意知需求n满足故。124 10452班专用8.对某地区随机调查180名20岁男青年的身高,得均值167.10(cm),标准差4.90(cm),求该地区20岁男青年平均身高的95%置信区间。解:已知n=180,为大样本情形,又=167.10,=4.90。对1-a=0.95,a=0.05,查表得=1.96,则m的95%置信区间为=故平均身高的95%置信区间为(166.38,167.82)。9.采用尾容积测压法测得大白鼠的血压(kPa)如下:15.6、16.9、18.8、14.3、14.7、15.2、15.3、17.1、16.9、16.3试求大白鼠血压总体均值的95%置信区间。解:由样本数据计算得=16.11,=1.834,=1.354又已知=10,且对1-=0.95,=0.05,查t(n-1)分布表得临界值则大白鼠血压总体均值的95%置信区间为即(15.14,17.08)。10.试比较下列各情况下总体率的95%置信区间的宽窄与样本容量的大小关系,并说明较小时,若次试验中某事件发生次,将作为概率的近似值是否妥当?(1);(2);(3);(4)。解:(1)为小样本情形。用查表法得其总体率P的95%置信区间为(0.187,0.813),其置信区间宽度124 10452班专用L=0.813-0.187=0.626。(2)为大样本情形。样本率,其总体率P的95%置信区间为==即(0.3735,0.6265),其置信区间宽度。(3)为大样本情形。样本率,其总体率P的95%置信区间为==0.5±0.098即(0.402,0.598),其置信区间宽度。(4)为大样本情形。样本率,其总体率P的95%置信区间为==0.5±0.031即(0.469,0.531),其置信区间宽度显然样本容量越小,其置信区间越宽。因此当较小时,将作为概率的近似值是不妥当的。124 10452班专用实际上,上述各情形的样本率均为0.5,对大样本情形,其95%置信区间宽度与成反比,对小样本情形(1),其置信区间更宽。11.为测定某药物的成分含量,任取16个样品测得。假设被测总体服从正态分布,试求(1)总体均值的95%置信区间;(2)总体方差的90%置信区间。解:(1)已知,n=16,则。又对1-a=0.95,,查分布表得。于是故总体均值的95%置信区间为(2.037,3.963)。(2)对1-a=0.9,=0.1,=n-1=15,查2(15)临界值表,得,于是,故总体方差的90%置信区间为(1.956,6.735)。12.某医院用复方当归注射液静脉滴注治疗脑动脉硬化症22例,其中显效者10例。问该药显效的95%与99%置信区间分别为多少?解:本题为二项分布总体率P的区间估计问题。已知=22,=10为小样本情形,对1-=0.95和0.99,查附表8得该药显效率的95%置信区间为(0.224,0.678),99%置信区间为(0.195,0.734)。124 10452班专用13.用计数器测定某放射性标本,10分钟的脉冲数为16784,试求10分钟总脉冲数及平均每分钟的脉冲数的95%置信区间。解:因脉冲数服从泊松分布,由题意知,=10,,=1.96,于是所以10分钟内总脉冲数的95%置信区间为(16530,17038),而每分钟平均脉冲数的95%置信区间为(1653.0,1703.8)。五、思考与练习(一)填充题1.用样本X1,…,Xn估计总体参数,总体均值的一个无偏估计量是_______,总体方差的无偏估计量是_________。2.设和分别是θ的两个无偏估计量,则k1=,k2=时,k1+k2是θ的无偏估计量,且k2=2k1。3.(2003年考研题)已知一批零件的长度X(单位:cm)服从正态分布N(μ,1),从中随机抽取16个零件,得到长度的平均值为40cm,则μ的置信度为0.95的置信区间是。(标准正态分布函数值F(1.96)=0.975,F(1.645)=0.95)(二)选择题1.设总体X~N(m,s2),X1,X2,…,Xn(n≥3)是来自总体X的简单样本,则下列估计量中,不是总体参数m的无偏估计的是()A.B.X1+X2+…+XnC.0.1(6X1+4Xn)D.X1+X2-X3124 10452班专用1.设总体X~N(m,s2),X1,X2,…,Xn为来自总体X的一个样本,则的最大似然估计为()A.B.C.D.2.已知时,区间的含义是()A.95%的总体均值在此范围内B.样本均值的95%置信区间C.95%%的样本均值在此范围内D.总体均值的95%置信区间3.设总体X~N(,),且,均未知。若样本容量和样本值不变,则总体均值的置信区间长度L与置信度1-a的关系是()A.当1-a缩小时,L增大B.当1-a缩小时,L缩短C.当1-a缩小时,L不变D.以上三个都不对(三)计算题1.已知来自正态总体的样本值为7.0,8.0,7.8,9.2,6.4求未知时总体均值的90%及95%置信区间。2.某医院用中药青木香治疗高血压,记录了70例高血压患者治疗前后舒张压的差数,算得样本均值-16.28,样本标准差10.58,试求舒张压差数的总体均值的99%置信区间。3.在一批产品中随机抽取30个,得一级品8个,求这批产品一级品率的99%置信区间。4.在一指定地区的选民中,随机挑选300名选民进行民意测验,结果有182人对某个指定的候选人是满意的,求在所有选民中,对该候选人满意率的95%置信区间。124 10452班专用六、思考与练习参考答案(一)填充题1.,;2.k1=1/3;k2=2/3;3.(39.51,40.49)(二)选择题1.B;2.A;3.D;4.B(三)计算题1.(6.67,8.69)和(6.37,8.99)。用置信区间公式2.(-19.54,-13.02)。用置信区间公式3.(9.3%,51.6%)。用总体率p的小样本查表法4.(0.555,0.665)。用置信区间公式124 10452班专用第六章假设检验一、学习目的和要求1.理解假设检验的概念与基本原理;2.熟练掌握假设检验的基本步骤;3.理解并正确应用单、双侧检验;4.熟练掌握单个正态总体均值的u检验与t检验;5.熟练掌握单个正态总体方差的c2检验;6.掌握两个总体方差比较的F检验;7.熟练掌握配对总体均值的t检验;8.熟练掌握两正态总体均值的t检验;9.掌握非正态总体均值(大样本)的u检验;10.掌握总体率(大样本)的u检验;11.了解用Excel进行正态总体参数假设检验的运算。二、内容提要(一)假设检验的基本思想与步骤名目内容基本思想概率性质的反证法推断依据小概率原理:小概率事件在一次试验中几乎不可能发生两类错误第一类错误(弃真);第二类错误(取伪)124 10452班专用基本步骤1.建立检验假设:原假设H0和备择假设H1;2.确定检验统计量及其分布,并根据样本值计算检验统计量的值;3.根据显著性水平a,确定检验临界值,即得拒绝域;4.统计判断:若统计量的值落在拒绝域内,则拒绝原假设H0;否则,就接受原假设H0。分类参数假设检验;非参数假设检验(二)正态总体的参数假设检验1.单个正态总体均值的假设检验条件检验假设统计量临界值拒绝域s2已知H0:m=m0H1:m≠m0ua/2|u|≥ua/2H1:m>m0(或H1:mm0(或H1:m30)H0:m=m0H1:m≠m0ua/2|u|≥ua/2H1:m>m0(或H1:m0(或H1:<0)tat≥ta(或t≤-ta)124 10452班专用3.正态总体方差的假设检验条件检验假设统计量临界值拒绝域单个总体H0:s2=s02H1:s2≠s02c2=,或H1:s2>s02(或H1:s2<s02)(或)(或)两个总体H0:s12=s22H1:s12≠s22()Fa/2H1:s12>s22Fa4.两个正态总体的均值比较检验条件检验假设统计量临界值拒绝域s12、s22已知H0:m1=m2H1:m1≠m2ua/2|u|≥ua/2H1:m1>m2(或H1:m130)H0:m1=m2H1:m1≠m2ua/2|u|≥ua/2H1:m1>m2(或H1:m1m2(或H1:m1m2(或H1:m130)H0:m=m0H1:m≠m0ua/2|u|≥ua/2H1:m>m0(或H1:m30)H0:m1=m2H1:m1≠m2ua/2|u|≥ua/2H1:m1>m2(或H1:m130)H0:P=P0H1:P≠P0ua/2|u|≥ua/2H1:P>P0(或H1:PP0(或H1:P30)()H1:P1>P2(或H1:P1P2(或H1:P11对显著性水平α=0.05,查F分布表(附表7)得Fa/2(n1-1,n2-1)=F0.025(8,8)=4.43因F=1.460.05,故接受H0:s12=s22。再检验H0:m1=m2;H1:m1≠m2。因为这两个总体的方差未知但相等,故可用t检验法进行检验。则S2=(S12+S22)/2=(3.29+2.25)/2=2.77,S==1.664又检验统计量t的值对给定的α=0.05,查t分布表(附表6),得临界值ta/2(n1+n2-2)=t0.025(16)=2.12因|t|=2.295>t0.025(16)=2.12,P<0.05,则拒绝H0,接受H1,即认为甲、乙两批药品中该种成分的含量有显著性差异。四、习题六解答1.已知正态分布N(μ,s2)的标准差σ=0.8,由9个个体构成的样本均值,试检验假设H0:μ=3,H1:μ≠3。(α=0.01)124 10452班专用解:此题应为s2已知时单个正态总体均值u检验,采用双侧检验。应检验H0:μ=3,H1:μ≠3。由题中条件得:s=0.8,n=9,m0=3,=2,则检验统计量u的值为对于给定的显著性水平a=0.01,查正态分布双侧临界值表(附表4),得到临界值ua/2=2.58。因为|u|=3.75>2.58,P<0.01,拒绝H0,接受H1,即在0.01的显著水平下,认为μ≠3。2.某药厂用一台自动包装机包装葡萄糖,规定标准为每袋0.5kg。设包装机实际生产的每袋重量服从正态分布,且由以往经验知σ=0.015(kg),某天从生产线上随机抽取8袋,称得净重为(单位:kg)0.497,0.506,0.524,0.488,0.511,0.510,0.515,0.512如标准差σ不变,问包装机包装的平均重量是否仍为0.5kg?(α=0.05)解:此题应为s2已知单个正态总体均值u检验,采用双侧检验。应检验H0:μ=m0=0.5,H1:μ≠0.5由题中条件和计算得:s2=0.0152,n=8,m0=3,=0.508,则检验统计量u的值为对于给定的显著性水平a=0.05,查正态分布双侧临界值表(附表4),得到临界值:ua/2=u0.025=1.96。因为|u|=1.51<1.96,P>0.05,所以接受H0,即在0.05的显著水平下,可认为包装机包装的平均重量仍为0.5kg。124 10452班专用3.正常人的脉搏平均72次/min,现医生测得10例慢性四乙基铅中毒患者的脉搏(次/min)如下:54676878706667706569试问四乙基铅中毒者和正常人的脉搏有无显著性差异?(α=0.05)解:根据题意,此题应为s2未知单个正态总体均值t检验,采用双侧检验。应检验假设H0:m=m0=72;H1:m≠m0。由题中条件和计算得:n=10,m0=72,=67.40,S=5.93则检验统计量t的值为对于给定a=0.05和自由度n-1=9,查t分布表(附表6),得到临界值:ta/2(n-1)=t0.025(9)=2.2622,因为|t|=2.453>2.2622,P<0.05,所以拒绝H0,接受H1,即在0.05的显著水平下,可认为四乙基铅中毒者和正常人的脉搏有显著性差异。4.一公司声称某种类型的电池平均寿命是21.5小时,有个实验室检测了该公司所制造的6套电池,得如下的寿命小时数:19,18,22,20,16,25这些结果是否表明这种类型的电池低于该公司宣称的寿命?(α=0.05)解:此题为s2未知时单个正态总体均值t检验,采用单侧检验,应检验H0:m=m0=21.5;H1:m<21.5由题中条件和计算得:n=6,m0=21.5,=20,S=3.16则﹣1.163对于给定的a=0.05和自由度n-1=5,查t分布表(附表6),得到临界值:ta(n-1)=t0.05(5)=2.015,124 10452班专用因为t=﹣1.163>﹣t0.05(5)=﹣2.015,P>0.05,所以接受H0,即在0.05的显著水平下,尚不能认为这种类型的电池低于该公司宣称的寿命5.测定某种溶液中的水分(%),由它的10个测定值算出,S=0.037,设测定总体服从正态分布,试分别检验假设:(α=0.10)(1)H0:μ=0.5;(2)H0:σ2=0.042。解:(1)此题应为s2未知单个正态总体均值t检验,采用双侧检验,应检验H0:m=m0=0.5;H1:m≠0.5由题中条件得:n=10,m0=0.5,=0.452,S=0.037则对于给定的a=0.10和自由度n-1=9,查t分布表(附表6),得到临界值:ta/2(n-1)=t0.05(9)=1.833因为|t|=4.102>1.833,P<0.05,所以拒绝H0,接受H1,即在0.05的显著水平下,可认为m≠0.5。(2)根据题意,应检验H0:s2=0.042;H1:s2≠0.042(双侧)已知s02=0.042,n=10,S2=0.0372。则c2检验统计量的值对于给定的a=0.10和自由度n-1=9,由c2分布表(附表5)查得临界值(n-1)=(9)=(9)=3.325,(n-1)=(19)=(19)=16.919因,则P>0.10,故接受H0,认为s2与0.042无显著差异。6.由某个正态总体中抽出一个容量为21的样本,算得样本方差S2124 10452班专用=10,根据此结果能否说明总体方差小于15的结论?(α=0.05)解:根据题意,应检验H0:s2=15,H1:s2<15(单侧)已知s02=15,n=21,S2=10则c2检验统计量的值对于给定的a=0.05和自由度n-1=20,由c2分布表(附表5)查得临界值(n-1)=(20)=(20)=10.851,因为,P>0.05,故接受H0,认为s2与15无显著差异。7.某剂型药物正常的生产过程中,含碳量服从正态分布N(1.408,0.0482),今从某班生产的产品中任取5件,测量其含碳量(%)为1.32,1.55,1.36,1.40,1.44据分析其平均含量符合规定的要求,问含量的波动是否正常?(α=0.02)解:根据题意,应检验H0:s2=0.0482,H1:s2≠0.0482(双侧)由已知条件及计算可得s02=0.0482,n=5,S2=0.00778。则c2检验统计量的值对于给定的a=0.02和自由度n-1=4,由c2分布表(附表5)查得临界值(n-1)=(4)=(4)=0.297,(n-1)=(4)=(4)=15.086因为,P>0.02,故接受H0,认为含量波动正常。8.有人研究一种减少室性早搏的药物,为10名患者静脉注射2124 10452班专用mg/kg的剂量后一定时间内每分钟室性早搏次数减少值分别为0,7,﹣2,14,15,14,6,16,19,26试判断药物是否确实有效?(α=0.05)解:根据题意,此题应为配对比较总体均值的t检验,采用单侧检验,注射药物后一定时间内每分钟室性早搏次数减少值即为用药前后的差值d。应检验H0:=0;H1:>0(单侧)由已知条件及计算得:,,,则对于给定的a=0.05和自由度n-1=9,查t分布表(附表6),得到临界值ta(n-1)=t0.05(9)=1.833,因为t=4.194>ta(9)=1.833,P<0.05,故拒绝H0,接受H1,即可以认为治疗前后早搏次数减少,此药物有效。9.某医院试验中药青兰在改变兔脑血流图方面的作用,对5只兔子分别测得用药前后的数据如下表所示。兔号给药前给药后14.04.522.03.035.06.046.08.055.05.5试判断青兰有无改变兔脑血流图的作用。(α=0.05)124 10452班专用解:根据题意,此题应为配对比较总体均值的t检验,采用双侧检验。应检验H0:=0;H1:≠0(双侧)5只兔子用药后与用药前数据的差值di分别为:0.5,1.0,1.0,2.0,0.5由已知条件及计算得:,,则对于给定的a=0.05和自由度n-1=4,查t分布表(附表6),得到临界值ta/2(n-1)=t0.025(4)=2.776,因为|t|=3.6513>ta/2(4)=2.776,P<0.05,故拒绝H0,接受H1,即可认为青兰有改变兔脑血流图的作用。10.某医院用新药与常规药物治疗婴幼儿贫血,将16名贫血儿随机分为两组,分别接受两种药物治疗,测得血红蛋白增加量(g/L)见下表,问新药与常规药的疗效有无差别?(α=0.05)两种药物治疗婴幼儿贫血结果新药组常规药组24143618252014152622342423213025解:由题意,本题为总体方差未知时两正态总体均值比较的t124 10452班专用检验,首先应检验两总体方差是否相等,即检验H0:s12=s22,H1:s12≠s22(双侧)由题中条件和计算得:新药组:n1=8,=26.5,=6.9282;常规药组:n2=8,=19.875,=3.9802,则对显著性水平a=0.10,查F分布表(附表7)得临界值Fa/2(n1-1,n2-1)=F0.05(7,7)=3.79因F=1.5120.05,故接受H0,即认为两总体方差无显著差异。再进行两总体方差未知但相等的两正态总体均值比较的t检验,应检验H0:m1=m2;H1:m1≠m2。则S2=(S12+S22)/2=(6.9282+3.9802)/2=31.92,S==5.65对给定的α=0.05,查t分布表(附表6),得临界值ta/2(n1+n2-2)=t0.025(14)=2.145因|t|=2.345>t0.025(14)=2.145,P<0.05,则拒绝H0,接受H1,即认为新药与常规药的疗效有差别。11.从两台自动机床加工产品中分别抽取容量为n1=10和n2=8的两组产品,测得某个指标的尺寸,得到数据如下表所示。xi1.081.101.121.141.151.251.361.381.401.42yi1.111.121.181.221.331.351.361.38如果取显著性水平α=0.10,能认为两台机床加工产品的该指标的方差无显著性差异吗?(α=0.05)124 10452班专用解:由题意,本题为两总体方差比较的F检验。应检验H0:s12=s22,H1:s12≠s22(双侧)。由题中条件和计算得:n1=10,n2=8,=1.24,=0.01887,=1.256=0.01248则F检验统计量的值:对显著性水平a=0.10,查F分布表(附表7)得临界值Fa/2(n1-1,n2-1)=F0.05(9,7)=3.68因F=1.5120.10,故接受H0,即认为两台机床加工产品的该指标的方差无显著性差异。12.设有两种玉米的甲、乙块农业试验区,各分为10个小区,各小区的面积相同,除甲区施磷肥外,其他试验条件均相同,试验结果玉米产量(kg)如表所示。甲区62576560635857606058乙区56595657585760555755试判别磷肥对玉米产量有无显著性影响?(α=0.05)解:由题意,本题为总体方差未知时两正态总体均值比较的t检验。首先应检验两总体方差是否相等,即检验H0:s12=s22,H1:s12≠s22(双侧)由题中条件和计算得:甲区:n1=10,=60,=2.6672;乙区:n2=10,=57,=1.6332,则对显著性水平a=0.05,查F分布表(附表7)得临界值Fa/2(n1-1,n2-1)=F0.025(9,9)=4.03因F=2.667t0.025(18)=2.101,P<0.05,则拒绝H0,接受H1,即可认为磷肥对玉米产量有显著性影响。13.为研究矽肺患者肺功能的变化情况,某医院对Ⅰ、Ⅱ期矽肺患者各35名测定其肺活量,得到Ⅰ期患者的均值2710mL,标准差147mL;Ⅱ期患者的均值2830mL,标准差118mL。试问Ⅰ、Ⅱ期矽肺患者的肺活量是否有显著性差异?(α=0.01)解:由题意,n1=n2=35>30,本题可用大样本情形的两总体均值比较u检验。应检验H0:m1=m2;H1:m1≠m2。由题中条件知:Ⅰ期矽肺患者:n1=35,=2710,=1472,Ⅱ期矽肺患者:n2=35,=2830,=1182,则对于给定的a=0.01,查正态分布双侧临界值表(附表4),得到临界值ua/2=u0.01/2=2.576因|u|=3.766>ua/2=2.576,P<0.01,则拒绝H0,接受H1,即可认为Ⅰ、Ⅱ期矽肺患者的肺活量有显著性差异。14.某厂有一批产品,须检验合格才能出厂,按国家标准,次品率不得超过3%,今在其中任意抽取100件,发现有10件是次品,试问这批产品能否出厂?(α=0.10)解:由题意,此题应用总体率与已知定值比较的u检验法,应进行单侧检验124 10452班专用H0:P=0.03;H1:P>0.03由题意知:P0=0.03,n=100,m=10,而样本率,则检验统计量u的值对于给定的a=0.10,查正态分布表(附表4),得到临界值ua=u0.10=u0.2/2=1.282因为u=4.103>u0.10=1.282,P<0.10,故拒绝H0,接受H1,即认为该批产品次品率超过3%,不能出厂。15.某医院用内科疗法治疗一般类型胃溃疡病患者80例,治愈63例;治疗特殊类型胃溃疡病患者99例,治愈31例。试问内科疗法对两种类型胃溃疡病治愈率有无显著性差异?(α=0.01)解:由题意,此题应用两总体率比较的大样本u检验法。应检验H0:P1=P2;H1:P1≠P2(双侧检验)由题意知n1=80,p1==0.7875,n2=99,p2==0.3131=6.319对于给定的a=0.01,查正态分布临界值表(附表4),得到临界值ua/2=u0.01/2=2.576,因为|u|=6.319>u0.01/2=2.576,P<0.01,故拒绝H0,接受H1,即认为内科疗法对两种类型胃溃疡病治愈率有显著性差异。124 10452班专用16.为了观察某药物预防流感的效果,共观察了96人,其中试验组49人,发病7例;对照组47例,发病13例。试问两组发病率有无显著性差异?(α=0.05)解:由题意,此题应用两总体率比较的大样本u检验法。应检验H0:P1=P2;H1:P1≠P2(双侧检验)已知n1=49,p1==0.1429,n2=47,p2==0.2766对于给定的a=0.05,查正态分布临界值表(附表4),得到临界值ua/2=u0.05/2=1.96,因为|u|=1.6130.05,故接受H0,即认为两组发病率无显著性差异。17.用某疗法治疗某病,临床观察了20例,治愈13例,问总体治愈率与所传治愈率79%是否相符?(α=0.05)解:由题意,此题应用总体率与已知定值比较的小样本检验法。应检验H0:P=0.79;H1:P≠0.79(双侧检验)已知P0=0.79,n=20,p=13/20=0.65,对样本率p与P0进行反正弦变换(),查附表9得:=1.875,Ф0=2.190则对于给定的a=0.05,查正态分布临界值表(附表4),得到临界值ua/2=1.96。因为|u|=1.4090.05,故接受H0,即认为总体治愈率与所传治愈率79%相符。18.某医生研究复方哌唑嗪对高血压的治疗效果,以复方降压片为对照,结果如下,问两种药物效果有无显著性差别?(α=0.05)124 10452班专用治疗例数有效例数有效率(%)复方哌唑嗪复方降压片4030352087.5066.67解:由题意,此题可应用两总体率比较的小样本法。应检验H0:P1=P2;H1:P1≠P2(双侧检验)已知p1=0.875,p2=0.666,n1=40,n2=30,对p1和p2利用附表9化为和:=2.420,=1.910,则对于给定的a=0.05,查正态分布临界值表(附表4),得临界值ua/2=1.96。因为|u|=2.112>u0.05/2=1.96,P<0.05,故拒绝H0,接受H1,即可认为两种药物效果有显著性差别。五、思考与练习(一)填充题1.从正态总体N(m,s2)(m,s2未知)中随机抽取容量为n的一组样本,其样本均值和标准差分别为,S,现要检验假设H0:m=2.5,H1:m>2.5,则应该用检验法,检验统计量为;如取a=0.05,则临界值为,拒绝域为。2.用P值法进行假设检验时,若Pa,则在a水平下拒绝H03.对大样本情形,总体比例P的假设检验H0:P=P0(已知值)的检验法是()A.u检验法B.t检验法C.F检验法D.查表法4.在假设检验中,用α和β分别表示犯第一类错误和第二类错误的概率,则当样本容量一定时,下列说法正确的是()A.减小α时,β往往减小B.增大α时,β往往增大C.减小α时,β往往增大D.无法确定5.参数的区间估计与假设检验法都是统计推断的重要内容,它们之间的关系是()A.没有任何相同之处B.假设检验法隐含了区间估计法C.区间估计法隐含了假设检验法D.两种方法解决问题途径是相通的(三)计算题1.某公司生产某种灯管,该公司的经理称,他们产品的平均使用寿命为3年。为检验他的说法,随机抽取5个灯管,测得灯管寿命数据如下:(单位:年)1.3,4.1,4.8,3.4,2.9已知灯管的使用寿命服从正态分布,试检验他的说法是否正确?(a=0.05)2.为比较治疗组和对照组的肺表面活性物质PaO2124 10452班专用在治疗某病患儿过程中的作用是否不同,某医生在治疗30名患儿后48小时得到下表资料,问治疗后48小时,两组的PaO2是否不同?(a=0.05)两组患儿PaO2(kPa)比较分组例数均值标准差治疗组1512.601.60对照组159.722.003.取8份样品,每份一分为二,分别用容量法和仪器分析测定,数据如下:容量法35.547.126.851.180.163.175.086.4仪器分析35.848.027.151.581.063.075.886.0试判断容量法测量结果是否低于仪器分析结果?(a=0.05)4.某研究人员随机抽取20只小鼠分配到甲乙两个不同饲料组,每组10只,在喂养一段时间后,测得小鼠肝中铁含量(μg/g)结果如下:甲3.590.963.891.231.612.941.963.681.542.59乙2.231.142.631.001.352.011.641.131.011.70设小鼠肝中铁含量数据服从正态分布,试问:(1)两组数据总体方差是否相同?(a=0.10)(2)不同饲料对鼠肝中铁含量有无影响?(a=0.05)5.已知我国成人乙肝病毒表面抗原平均阳性率为10%,现随机抽查某地区100位成人的血清,其中23人为阳性。试检验该地区成人乙肝表面抗原阳性率是否高于全国平均水平?(a=0.05)6.为比较两种药物的疗效,分别治疗了某病患者若干例,结果如下。试判断甲药的有效率是否高于乙药?(a=0.05)分组有效例数无效例数合计甲药组乙药组1262042882154286124 10452班专用五、思考与练习参考答案(一)填充题1.t;;t0.05(n-1);t≥t0.05(n-1)。2.拒绝;3.1.96(二)选择题1.B;2.A;3.A;4.C;5.D(三)计算题1.应检验H0:m=3;H1:m≠3。则,因|t|=0.504〈t0.025(4)=2.776,接受H0,即认为他的说法是否正确。2.首先应检验H0:s12=s22,H1:s12≠s22F0.05(9,9)=3.18故拒绝H0,认为两总体方差不相等。再检验H0:m1=m2;H1:m1≠m2因|t|=2.1090.10>u0.05=1.64,故拒绝H0,接受H1,即认为该地区成人乙肝表面抗原阳性率高于全国平均水平。6.大样本u检验法。应检验H0:P1=P2;H1:P1>P2(单侧检验)>u0.05=1.64故拒绝H0,接受H1,即可认为甲药的有效率显著高于乙药。124 10452班专用124'