• 2.27 MB
  • 2022-04-22 11:50:25 发布

3-《医学统计学》教材后面的练习题及答案-2010-9-16.doc

  • 36页
  • 当前文档由用户上传发布,收益归属用户
  1. 1、本文档共5页,可阅读全部内容。
  2. 2、本文档内容版权归属内容提供方,所产生的收益全部归内容提供方所有。如果您对本文有版权争议,可选择认领,认领后既往收益都归您。
  3. 3、本文档由用户上传,本站不保证质量和数量令人满意,可能有诸多瑕疵,付费之前,请仔细先通过免费阅读内容等途径辨别内容交易风险。如存在严重挂羊头卖狗肉之情形,可联系本站下载客服投诉处理。
  4. 文档侵权举报电话:19940600175。
'《医学统计学》各章练习题与答案第一章医学统计中的基本概念一、单向选择题1.医学统计学研究的对象是A.医学中的小概率事件B.各种类型的数据C.动物和人的本质D.疾病的预防与治疗E.有变异的医学事件2.用样本推论总体,具有代表性的样本指的是A.总体中最容易获得的部分个体B.在总体中随意抽取任意个体C.挑选总体中的有代表性的部分个体D.用配对方法抽取的部分个体E.依照随机原则抽取总体中的部分个体3.下列观测结果属于等级资料的是A.收缩压测量值B.脉搏数C.住院天数D.病情程度E.四种血型4.随机误差指的是A.测量不准引起的误差B.由操作失误引起的误差C.选择样本不当引起的误差D.选择总体不当引起的误差E.由偶然因素引起的误差5.收集资料不可避免的误差是A.随机误差B.系统误差C.过失误差D.记录误差E.仪器故障误差答案:EEDEA二、简答题1.常见的三类误差是什么?应采取什么措施和方法加以控制?[参考答案]常见的三类误差是:(1)系统误差:在收集资料过程中,由于仪器初始状态未调整到零、标准试剂未经校正、医生掌握疗效标准偏高或偏低等原因,可造成观察结果倾向性的偏大或偏小,这叫系统误差。要尽量查明其原因,必须克服。(2)随机测量误差:在收集原始资料过程中,即使仪器初始状态及标准试剂已经校正,但是,由于各种偶然因素的影响也会造成同一对象多次测定的结果不完全一致。譬如,实验操作员操作技术不稳定,不同实验操作员之间的操作差异,电压不稳及环境温度差异等因素造成测量结果的误差。对于这种误差应采取相应的措施加以控制,至少应控制在一定的允许范围内。一般可以用技术培训、指定固定实验操作员、加强责任感教育及购置一定精度的稳压器、恒温装置等措施,从而达到控制的目的。(3)抽样误差:即使在消除了系统误差,并把随机测量误差控制在允许范围内,样本均数(或其它统计量)与总体均数(或其它参数)之间仍可能有差异。这种差异是由抽样引起的,故这种误差叫做抽样误差,要用统计方法进行正确分析。2.抽样中要求每一个样本应该具有哪三性?[参考答案]从总体中抽取样本,其样本应具有“代表性”、“随机性”和“可靠性”。(1)代表性:就是要求样本中的每一个个体必须符合总体的规定。(2)随机性:就是要保证总体中的每个个体均有相同的几率被抽作样本。(3)可靠性:即实验的结果要具有可重复性,即由科研课题的样本得出的结果所推测总体的结论有较大的可信度。由于个体之间存在差异,只有观察一定数量的个体方能体现出其客观规律性。每个样本的含量越多,可靠性会越大,但是例数增加,人力、物力都会发生困难,所以应以“足够”为准。需要作“样本例数估计”。3.什么是两个样本之间的可比性?[参考答案]可比性是指处理组(临床设计中称为治疗组)与对照组之间,除处理因素不同外,其他可能影响实验结果的因素要求基本齐同,也称为齐同对比原则。第二章集中趋势的统计描述一、单项选择题1.某医学资料数据大的一端没有确定数值,描述其集中趋势适用的统计指标是A.中位数B.几何均数36 C.均数D.百分位数E.频数分布2.算术均数与中位数相比,其特点是A.不易受极端值的影响B.能充分利用数据的信息C.抽样误差较大D.更适用于偏态分布资料E.更适用于分布不明确资料3.一组原始数据呈正偏态分布,其数据的特点是A.数值离散度较小B.数值离散度较大C.数值分布偏向较大一侧D.数值分布偏向较小一侧E.数值分布不均匀4.将一组计量资料整理成频数表的主要目的是A.化为计数资料B.便于计算C.形象描述数据的特点D.为了能够更精确地检验E.提供数据和描述数据的分布特征5.6人接种流感疫苗一个月后测定抗体滴度为1:20、1:40、1:80、1:80、1:160、1:320,求平均滴度应选用的指标是A.均数B.几何均数C.中位数D.百分位数E.倒数的均数答案:ABDEB二、计算与分析1.现测得10名乳腺癌患者化疗后血液尿素氮的含量(mmol/L)分别为3.43,2.96,4.43,3.03,4.53,5.25,5.64,3.82,4.28,5.25,试计算其均数和中位数。[参考答案]2.某地100例30-40岁健康男子血清总胆固醇值(mg/dl)测定结果如下:202165199234200213155168189170188168184147219174130183178174228156171199185195230232191210195165178172124150211177184149159149160142210142185146223176241164197174172189174173205224221184177161192181175178172136222113161131170138248153165182234161169221147209207164147210182183206209201149174253252156(1)编制频数分布表并画出直方图;(2)根据频数表计算均值和中位数,并说明用哪一个指标比较合适;(3)计算百分位数、、和。[参考答案](1)编制频数表:某地100例30-40岁健康男子血清总胆固醇值的频数表甘油三脂(mg/dL)(1)频数(2)累积频数(3)累积频率(4)110~222125~466140~111717155~163333170~276060185~127272200~138585215~7929236 230~59797245~3100100合计100——画直方图:图某地100例30-40岁健康男子血清总胆固醇值的频数分布(2)计算均数和中位数:从上述直方图能够看出:此计量指标近似服从正态分布,选用均数较为合适。(3)计算百分位数:3.测得10名肝癌病人与16名正常人的血清乙型肝炎表面抗原(HBsAg)滴度如下表,试分别计算它们的平均滴度。肝癌病人与正常人的血清乙肝表面抗原(HBsAg)滴度36 滴度倒数正常人数肝癌病人数8711652321364321280125601[参考答案]肝癌病人与正常人的血清乙肝表面抗原(HBsAg)滴度测定结果滴度倒数(X)正常人数()肝癌病人数()lgxlgxlgx8710.906.300.9016521.206.002.4032131.501.504.5064321.815.433.62128012.110.002.11256012.410.002.41合计1610-19.2315.94正常人乙肝表面抗原(HBsAg)滴度为1:15.92肝癌病人乙肝表面抗原(HBsAg)滴度为1:39.26第三章离散程度的统计描述一、单项选择题1.变异系数主要用于A.比较不同计量指标的变异程度B.衡量正态分布的变异程度C.衡量测量的准确度D.衡量偏态分布的变异程度E.衡量样本抽样误差的大小2.对于近似正态分布的资料,描述其变异程度应选用的指标是A.变异系数B.离均差平方和C.极差D.四分位数间距E.标准差3.某项指标95%医学参考值范围表示的是A.检测指标在此范围,判断“异常”正确的概率大于或等于95%B.检测指标在此范围,判断“正常”正确的概率大于或等于95%C.在“异常”总体中有95%的人在此范围之外D.在“正常”总体中有95%的人在此范围E.检测指标若超出此范围,则有95%的把握说明诊断对象为“异常”4.应用百分位数法估计参考值范围的条件是A.数据服从正态分布B.数据服从偏态分布C.有大样本数据D.数据服从对称分布E.数据变异不能太大5.已知动脉硬化患者载脂蛋白B的含量(mg/dl)呈明显偏态分布,描述其个体差异的统计指标应使用A.全距B.标准差C.变异系数D.方差E.四分位数间距答案:AEDBE二、计算与分析1.下表为10例垂体催乳素微腺瘤的病人手术前后的血催乳素浓度,试说明用何种指标比较手术前后数据的变异情况较为合适。36 表手术前后患者血催乳素浓度(ng/ml)例号血催乳素浓度术前术后12764128801103160028043246153981056266437500258176030095002151022092[参考答案]血催乳素浓度术前均值=672.4ng/ml,术后均值=127.2ng/ml。手术前后两组均值相差较大,故选择变异系数作为比较手术前后数据变异情况比较合适。术前:,术后:,可以看出:以标准差作为比较两组变异情况的指标,易夸大手术前血催乳素浓度的变异。2.某地144例30~45岁正常成年男子的血清总胆固醇测量值近似服从均数为4.95mmol/L,标准差为0.85mmol/L的正态分布。①试估计该地30~45岁成年男子血清总胆固醇的95%参考值范围;②血清总胆固醇大于5.72mmol/L的正常成年男子约占其总体的百分之多少?[参考答案]①正常成年男子的血清总胆固醇测量值近似服从正态分布,故可按正态分布法处理。又因血清总胆固醇测量值过高或过低均属异常,所以应计算双侧参考值范围。下限:(mol/L)上限:(mmol/L)即该地区成年男子血清总胆固醇测量值的95%参考值范围为3.28mmol/L~6.62mmol/L。②该地正常成年男子的血清总胆固醇测量值近似服从均数为4.95mmol/L,标准差为0.85mmol/L的正态分布,计算5.72mmol/L对应的标准正态分布值:问题转化为求值大于0.91的概率。由于标准正态分布具有对称性,所以值大于0.91的概率与值小于-0.91的概率相同。查附表1得,,所以说血清总胆固醇大于5.72mmol/L的正常成年男子约占其总体的18.14%。3.某地200例正常成人血铅含量的频数分布如下表。(1)简述该资料的分布特征。(2)若资料近似呈对数正态分布,试分别用百分位数法和正态分布法估计该地正常成人血铅值的95%参考值范围。表某地200例正常成人血铅含量(μmol/L)的频数分布36 血铅含量频数累积频数0.00~770.24~49560.48~451010.72~321330.96~281611.20~131741.44~141881.68~41921.92~41962.16~11972.40~21992.64~1200[参考答案](1)从表可以看出,血铅含量较低组段的频数明显高于较高组段,分布不对称。同正态分布相比,其分布高峰向血铅含量较低方向偏移,长尾向血铅含量较高组段延伸,数据为正偏态分布。某地200例正常成人血铅含量(μmol/L)的频数分布血铅含量组中值频数累积频数累积频率0.00~0.12773.50.24~0.36495628.00.48~0.604510150.50.72~0.843213366.50.96~1.082816180.51.20~1.321317487.01.44~1.561418894.01.68~1.80419296.01.92~2.04419698.02.16~2.28119798.52.40~2.52219999.52.64~2.761200100(2)因为正常人血铅含量越低越好,所以应计算单侧95%参考值范围。百分位数法:第95%百分位数位于1.68~组段,组距为0.24,频数为4,该组段以前的累积频数为188,故即该地正常成人血铅值的95%参考值范围为小于1.80。正态分布法:将组中值进行log变换,根据题中表格,得到均值和标准差计算表。某地200例正常成人血铅含量()均值和标准差计算表血铅含量组中值()频数()0.00~0.12-0.927-6.445.92480.24~0.36-0.4449-21.569.48640.48~0.60-0.2245-9.92.1780.72~0.84-0.0832-2.560.20480.96~1.080.03280.840.025236 1.20~1.320.12131.560.18721.44~1.560.19142.660.50541.68~1.800.2641.040.27041.92~2.040.3141.240.38442.16~2.280.3610.360.12962.40~2.520.4020.800.32002.64~2.760.4410.440.1936合计——200-31.5219.8098计算均值和标准差:  单侧95%参考值范围:即该地正常成人血铅值的95%参考值范围为小于1.96,与百分位数法相比两者相差不大。第四章抽样误差与假设检验一、单项选择题1.样本均数的标准误越小说明A.观察个体的变异越小B.观察个体的变异越大C.抽样误差越大D.由样本均数估计总体均数的可靠性越小E.由样本均数估计总体均数的可靠性越大2.抽样误差产生的原因是A.样本不是随机抽取B.测量不准确C.资料不是正态分布D.个体差异E.统计指标选择不当3.对于正偏态分布的的总体,当样本含量足够大时,样本均数的分布近似为A.正偏态分布B.负偏态分布C.正态分布D.t分布E.标准正态分布4.假设检验的目的是A.检验参数估计的准确度B.检验样本统计量是否不同C.检验样本统计量与总体参数是否不同D.检验总体参数是否不同E.检验样本的P值是否为小概率5.根据样本资料算得健康成人白细胞计数的95%可信区间为7.2×109/L~9.1×109/L,其含义是A.估计总体中有95%的观察值在此范围内B.总体均数在该区间的概率为95%C.样本中有95%的观察值在此范围内D.该区间包含样本均数的可能性为95%E.该区间包含总体均数的可能性为95%答案:EDCDE二、计算与分析1.为了解某地区小学生血红蛋白含量的平均水平,现随机抽取该地小学生450人,算得其血红蛋白平均数为101.4g/L,标准差为1.5g/L,试计算该地小学生血红蛋白平均数的95%可信区间。[参考答案]样本含量为450,属于大样本,可采用正态近似的方法计算可信区间。,,,95%可信区间为下限:(g/L)36 上限:(g/L)即该地成年男子红细胞总体均数的95%可信区间为101.26g/L~101.54g/L。1.研究高胆固醇是否有家庭聚集性,已知正常儿童的总胆固醇平均水平是175mg/dl,现测得100名曾患心脏病且胆固醇高的子代儿童的胆固醇平均水平为207.5mg/dl,标准差为30mg/dl。问题:①如何衡量这100名儿童总胆固醇样本平均数的抽样误差?②估计100名儿童的胆固醇平均水平的95%可信区间;③根据可信区间判断高胆固醇是否有家庭聚集性,并说明理由。[参考答案]①均数的标准误可以用来衡量样本均数的抽样误差大小,即mg/dl,②样本含量为100,属于大样本,可采用正态近似的方法计算可信区间。,,,,则95%可信区间为下限:(mg/dl)上限:(mg/dl)故该地100名儿童的胆固醇平均水平的95%可信区间为201.62mg/dl~213.38mg/dl。③因为100名曾患心脏病且胆固醇高的子代儿童的胆固醇平均水平的95%可信区间的下限高于正常儿童的总胆固醇平均水平175mg/dl,提示患心脏病且胆固醇高的父辈,其子代胆固醇水平较高,即高胆固醇具有一定的家庭聚集性。第五章t检验一、单项选择题1.两样本均数比较,检验结果说明A.两总体均数的差别较小B.两总体均数的差别较大C.支持两总体无差别的结论D.不支持两总体有差别的结论E.可以确认两总体无差别2.由两样本均数的差别推断两总体均数的差别,其差别有统计学意义是指A.两样本均数的差别具有实际意义B.两总体均数的差别具有实际意义C.两样本和两总体均数的差别都具有实际意义D.有理由认为两样本均数有差别E.有理由认为两总体均数有差别3.两样本均数比较,差别具有统计学意义时,P值越小说明A.两样本均数差别越大B.两总体均数差别越大C.越有理由认为两样本均数不同D.越有理由认为两总体均数不同E.越有理由认为两样本均数相同4.减少假设检验的Ⅱ类误差,应该使用的方法是A.减少Ⅰ类错误B.减少测量的系统误差C.减少测量的随机误差D.提高检验界值E.增加样本含量5.两样本均数比较的t检验和u检验的主要差别是A.t检验只能用于小样本资料B.u检验要求大样本资料C.t检验要求数据方差相同D.t检验的检验效能更高E.u检验能用于两大样本均数比较答案:DEDEB二、计算与分析1.已知正常成年男子血红蛋白均值为140g/L,今随机调查某厂成年男子60人,测其血红蛋白均值为125g/L,标准差15g/L。问该厂成年男子血红蛋白均值与一般成年男子是否不同?[参考答案]因样本含量n>50(n=60),故采用样本均数与总体均数比较的u检验。(1)建立检验假设,确定检验水平,该厂成年男子血红蛋白均值与一般成年男子相同,该厂成年男子血红蛋白均值与一般成年男子不同a=0.05(2)计算检验统计量==7.75(3)确定P值,做出推断结论7.75>1.96,故P<0.05,按α=0.05水准,拒绝,接受,可以认为该厂成年男子血红蛋白均值与一般成年男子不同,该厂成年男子血红蛋白均值低于一般成年男子。36 2.某研究者为比较耳垂血和手指血的白细胞数,调查12名成年人,同时采取耳垂血和手指血见下表,试比较两者的白细胞数有无不同。表成人耳垂血和手指血白细胞数(10g/L)编号耳垂血手指血19.76.726.25.437.05.745.35.058.17.569.98.374.74.685.84.297.87.5108.67.0116.15.3129.910.3[参考答案]本题为配对设计资料,采用配对检验进行分析(1)建立检验假设,确定检验水平H0:md=0,成人耳垂血和手指血白细胞数差异为零H1:md¹0,成人耳垂血和手指血白细胞数差异不为零a=0.05(2)计算检验统计量20.36==3.672>,P<0.05,拒绝H0,接受H1,差别有统计学意义,可以认为两者的白细胞数不同。3.分别测得15名健康人和13名Ⅲ度肺气肿病人痰中抗胰蛋白酶含量(g/L)如下表,问健康人与Ⅲ度肺气肿病人抗胰蛋白酶含量是否不同?表健康人与Ⅲ度肺气肿患者α1抗胰蛋白酶含量(g/L)健康人Ⅲ度肺气肿患者2.73.62.23.44.13.74.35.42.63.61.96.81.74.70.62.91.94.81.35.61.54.11.73.31.34.31.336 1.9[参考答案]由题意得,本题是两个小样本均数比较,可用成组设计t检验,首先检验两总体方差是否相等。H0:s12=s22,即两总体方差相等H1:s12≠s22,即两总体方差不等a=0.05F===1.19=2.53>1.19,F<,故P>0.05,按α=0.05水准,不拒绝H0,差别无统计学意义。故认为健康人与Ⅲ度肺气肿病人α1抗胰蛋白酶含量总体方差相等,可直接用两独立样本均数比较的t检验。(1)建立检验假设,确定检验水平,健康人与Ⅲ度肺气肿病人抗胰蛋白酶含量相同,健康人与Ⅲ度肺气肿病人抗胰蛋白酶含量不同a=0.05(2)计算检验统计量=1.12=5.63(3)确定P值,做出推断结论t=5.63>,P<0.001,拒绝H0,接受H1,差别有统计学意义,可认为健康人与Ⅲ度肺气肿病人α1抗胰蛋白酶含量不同。4.某地对241例正常成年男性面部上颌间隙进行了测定,得其结果如下表,问不同身高正常男性其上颌间隙是否不同?表某地241名正常男性上颌间隙(cm)身高(cm)例数均数标准差161~1160.21890.2351172~1250.22800.2561[参考答案]本题属于大样本均数比较,采用两独立样本均数比较的u检验。由上表可知,=116,=0.2189,=0.2351=125,=0.2280,=0.2561(1)建立检验假设,确定检验水平,不同身高正常男性其上颌间隙均值相同,不同身高正常男性其上颌间隙均值不同a=0.05(2)计算检验统计量36 =0.91(3)确定P值,做出推断结论u=0.91<1.96,故P>0.05,按α=0.05水准,不拒绝H0,差别无统计学意义,尚不能认为不同身高正常男性其上颌间隙不同。5.将钩端螺旋体病人的血清分别用标准株和水生株作凝溶试验,测得稀释倍数如下表,问两组的平均效价有无差别?表钩端螺旋体病患者凝溶试验的稀释倍数标准株100200400400400400800160016001600320032003200水生株1001001002002002002004004008001600[参考答案]本题采用两独立样本几何均数比较的t检验。t=2.689>t0.05/2,22,P<0.05,拒绝H0,接受H1,差别有统计学意义,可认为两组的平均效价有差别。6.为比较男、女大学生的血清谷胱甘肽过氧化物酶(GSH-Px)的活力是否相同,某医生对某大学18~22岁大学生随机抽查男生48名,女生46名,测定其血清谷胱甘肽过氧化酶含量(活力单位),男、女性的均数分别为96.53和93.73,男、女性标准差分别为7.66和14.97。问男女性的GSH-Px是否相同?[参考答案]由题意得=48,96.53,=7.66=46,=93.73,=14.97本题是两个小样本均数比较,可用成组设计t检验或t’检验,首先检验两总体方差是否相等。H0:s12=s22,即两总体方差相等H1:s12≠s22,即两总体方差不等a=0.05F===3.82F=3.82>,故P<0.05,差别有统计学意义,按a=0.05水准,拒绝H0,接受H1,故认为男、女大学生的血清谷胱甘肽过氧化物酶的活力总体方差不等,不能直接用两独立样本均数比较的t检验,而应用两独立样本均数比较的t’检验。=1.53,t’0.05/2=2.009,t’0.05,按α=0.05水准,不拒绝H0,差别无统计学意义,尚不能认为男性与女性的GSH-Px有差别。第六章方差分析一、单项选择题1.方差分析的基本思想和要点是A.组间均方大于组内均方B.组内均方大于组间均方C.不同来源的方差必须相等D.两方差之比服从F分布E.总变异及其自由度可按不同来源分解2.方差分析的应用条件之一是方差齐性,它是指A.各比较组相应的样本方差相等B.各比较组相应的总体方差相等C.组内方差=组间方差D.总方差=各组方差之和E.总方差=组内方差+组间方差3.完全随机设计方差分析中的组间均方反映的是36 A.随机测量误差大小B.某因素效应大小C.处理因素效应与随机误差综合结果D.全部数据的离散度E.各组方差的平均水平4.对于两组资料的比较,方差分析与t检验的关系是A.t检验结果更准确B.方差分析结果更准确C.t检验对数据的要求更为严格D.近似等价E.完全等价5.多组均数比较的方差分析,如果,则应该进一步做的是A.两均数的t检验B.区组方差分析C.方差齐性检验D.检验E.确定单独效应答案:EBCED二、计算与分析1.在评价某药物耐受性及安全性的I期临床试验中,对符合纳入标准的40名健康自愿者随机分为4组,每组10名,各组注射剂量分别为0.5U、1U、2U、3U,观察48小时后部分凝血活酶时间(s)。试比较任意两两剂量间的部分凝血活酶时间有无差别?各剂量组48小时部分凝血活酶时间(s)0.5U1U2U3U36.840.032.933.034.435.537.930.734.336.730.535.335.739.331.132.333.240.134.737.431.136.837.639.134.333.440.233.529.838.338.136.635.438.432.432.031.239.835.633.8[参考答案]如方差齐同,则采用完全随机设计的方差分析。经Bartlett方差齐性检验,=1.8991,=3。由于=7.81,,故>0.05,可认为四组48小时部分凝血活酶时间的总体方差齐同,于是采用完全随机设计的方差分析对四个剂量组部分凝血活酶时间进行比较。(1)提出检验假设,确定检验水准:,即四个剂量组部分凝血活酶时间的总体均数相同:、、、不全相同,即四个剂量组部分凝血活酶时间的总体均数不全相同=0.05(2)计算检验统计量,列于方差分析表中方差分析表变异来源平方和自由度均方值处理组间101.0860333.69534.80组内(误差)252.4780367.0133总变异353.564039(3)确定值,做出推断结论分子自由度,分母自由度,查界表(方差分析用),=2.87。由于=4.80,,故<0.05,按照=0.05的显著性水准,拒绝,接受,差别有统计学意义,可认为四个剂量组部分凝血活酶时间的总体均数不全相同,进而需进行均数间多重比较。本题采用SNK法进行多重比较。(1)提出检验假设,确定检验水准 :,即任意两组部分凝血活酶时间的总体均数相同 :,即任意两组部分凝血活酶时间的总体均数不相同36  =0.05(2)计算检验统计量,用标记字母法标记多重比较结果(=0.05)组别均数例数SNK标记1U37.83010A2U35.10010B3U34.37010B0.5U33.62010B(3)做出推断结论1U与0.5U,1U与2U,1U与3U间差别有统计学意义(标记字母不同),可认为1U与0.5U,1U与2U,1U与3U间部分凝血活酶时间的总体均数不同。0.5U、2U、3U组彼此间差别无统计学意义(均含有字母B),可认为这三组部分凝血活酶时间的总体均数相同。2.为探讨小剂量地塞米松对急性肺损伤动物模型肺脏的保护作用,将36只二级SD大鼠按性别、体重配成12个配伍组,每一配伍组的3只大鼠被随机分配到对照组、损伤组与激素组,实验24小时后测量支气管肺泡灌洗液总蛋白水平(g/L),结果如下表。问3组大鼠的总蛋白水平是否相同?3组大鼠总蛋白水平(g/L)配伍组对照组损伤组激素组10.361.480.3020.281.420.3230.261.330.2940.251.480.1650.361.260.3560.311.530.4370.331.400.3180.281.300.1390.351.580.33100.411.240.32110.491.470.26120.271.320.26[参考答案]本题采用随机区组设计的方差分析。(1)提出检验假设,确定检验水准:,即三组大鼠总蛋白水平的总体均值相同:、、不全相同,即三组大鼠总蛋白水平的总体均值不全相同:,即不同配伍组大鼠总蛋白水平的总体均值相同:、、…、 不全相同,即不同配伍组大鼠总蛋白水平的总体均值不全相同=0.05(2)计算检验统计量,列于方差分析表中方差分析表变异来源平方和自由度均方值处理组间9.551224.7756719.80区组间0.1138110.01031.56误差0.1460220.0066总变异9.810935(3)确定值,做出推断结论。对于处理因素,分子自由度=2,分母自由度=22,查界值表(方差分析用),=3.44。由于=719.80,,故<0.05,按照=0.05的显著性水准,拒绝,差别有统计学意义,可认为三组大鼠总蛋白水平的总体均值不全相同。对于区组因素,分子自由度=11,分母自由度=22,查界值表(方差分析用),=2.26。由于=1.56,,故>0.05,照=0.05的显著性水准,不拒绝,差别无统计学意义,尚不能认为区组因素对大鼠总蛋白水平有影响。36 3.为研究喹啉酸对大鼠急性和亚急性炎症的影响,将40只体重为20020(g)的雄性Wistar大鼠建立急性和亚急性炎症动物模型,然后随机分为4组,每组10只,给予不同的处理,观察其WBC值。4种处理分别为:腹腔注射生理盐水后3小时处死、腹腔注射生理盐水后6小时处死、腹腔注射喹啉酸(0.35mg/g)后3小时处死,腹腔注射喹啉酸(0.35mg/g)后6小时处死。实验结果如下表。问喹啉酸与给药距处死的时间间隔(简称时间)对WBC值是否有影响?不同药物与不同时间大鼠WBC值(103)时间药物生理盐水喹啉酸3h21.318.815.811.021.913.58.712.811.122.69.412.516.317.15.39.317.914.68.311.06h19.023.013.919.025.222.815.815.322.917.818.319.219.824.613.018.222.725.314.017.3[参考答案]本题采用22析因设计方差分析。(1)提出检验假设,确定检验水准:,即A因素两个水平组WBC值总体均数相等:,即A因素两个水平组WBC值总体均数不相等:,即B因素两个水平组WBC值总体均数相等:,即B因素两个水平组WBC值总体均数不相等:A与B无交互效应  :A与B存在交互效应=0.05 2.计算检验统计量,列于方差分析表中。方差分析表变异来源平方和自由度均方值A因素423.15021423.150248.68B因素291.06031291.060333.48AB3.540313.54030.41误差312.9470368.6930总变异1030.697839 3.确定值,做出推断结论。对于A因素,=1,=36,查界值表(方差分析用),=4.11。由于=48.68,,故<0.05,按照=0.05的显著性水准,拒绝,接受,认为A因素(药物)两个水平组WBC值总体均数不相等。对于B因素,=1,=36,查界值表(方差分析用),=4.11。由于=33.48,,故<0.05,按照=0.05的显著性水准,拒绝,认为B因素(时间)两个水平组WBC值总体均数不相等。对于AB交互作用,=1,=36,查界值表(方差分析用),=4.11。由于=0.41,,故>0.05,按照=0.05的显著性水准,不拒绝,认为A(药物)与B(时间)间无交互效应。第七章相对数及其应用一、单项选择题36 1.如果一种新的治疗方法能够使不能治愈的疾病得到缓解并延长生命,则应发生的情况是A.该病患病率增加B.该病患病率减少C.该病的发病率增加D.该病的发病率减少E.该疾病的死因构成比增加2.计算乙肝疫苗接种后血清学检查的阳转率,分母为A.乙肝易感人数B.平均人口数C.乙肝疫苗接种人数D.乙肝患者人数E.乙肝疫苗接种后的阳转人数3.计算标准化死亡率的目的是A.减少死亡率估计的偏倚B.减少死亡率估计的抽样误差C.便于进行不同地区死亡率的比较D.消除各地区内部构成不同的影响E.便于进行不同时间死亡率的比较4.影响总体率估计的抽样误差大小的因素是A.总体率估计的容许误差B.样本率估计的容许误差C.检验水准和样本含量D.检验的把握度和样本含量E.总体率和样本含量5.研究某种新药的降压效果,对100人进行试验,其显效率的95%可信区间为0.862~0.926,表示A.样本显效率在0.862~0.926之间的概率是95%B.有95%的把握说总体显效率在此范围内波动C.有95%的患者显效率在此范围D.样本率估计的抽样误差有95%的可能在此范围E.该区间包括总体显效率的可能性为95%答案:ACDEE二、计算与分析1.某工厂在“职工健康状况报告中”写到:“在946名工人中,患慢性病的有274人,其中女性219人,占80%,男性55人,占20%。所以女性易患慢性病”,你认为是否正确?为什么?[参考答案]不正确,因为此百分比是构成比,不是率,要知道男女谁更易患病需知道946名工人中的男女比例,然后计算男女患病率。2.在“锑剂短程疗法治疗血吸虫病病例的临床分析”一文中,根据下表资料认为“其中10~岁组死亡率最高,其次为20~岁组”,问这种说法是否正确?锑剂治疗血吸虫不同性别死亡者年龄分布年龄组男女合计0~33610~1171820~461030~53840~12350~516合计292251[参考答案]不正确,此为构成比替代率来下结论,正确的计算是用各年龄段的死亡人数除各年龄段的调查人数得到死亡率。3.某研究根据以下资料说明沙眼20岁患病率最高,年龄大的反而患病率下降,你同意吗?说明理由。某研究资料沙眼病人的年龄分布年龄组沙眼人数构成比(%)0~474.610~19819.320~33032.136 30~19819.340~12812.450~807.860~383.770~80.8合计1027100.0[参考答案]不正确,此为构成比替代率来下结论,正确的计算是用各年龄段的沙眼人数除各年龄段的调查人数得到患病率。4.今有两个煤矿的工人尘肺患病率(%)如下表,试比较两个煤矿的工人尘肺总的患病率。两个煤矿的工人尘肺患病率情况(%)工龄(年)甲矿乙矿检查人数尘肺人数患病率检查人数尘肺人数患病率<6140261200.8699220.206~42851683.92190580.4210~254231612.43101411711.54合计208536042.9039111273.25[参考答案]两个煤矿的工人尘肺标准化患病率(%)工龄(年)标准构成甲矿乙矿原患病率预期患病人数原患病率预期患病人数<6150180.861290.20306~61903.922430.422610~355612.4344211.54410合计24764814466甲矿尘肺患病率=乙矿尘肺患病率甲矿尘肺患病率高于乙矿尘肺患病率。5.抽样调查了某校10岁儿童200名的牙齿,患龋130人,试求该校儿童患龋率的95%的区间估计。[参考答案](,)=第八章检验36 一、单项选择题1.利用检验公式不适合解决的实际问题是A.比较两种药物的有效率B.检验某种疾病与基因多态性的关系C.两组有序试验结果的药物疗效D.药物三种不同剂量显效率有无差别E.两组病情“轻、中、重”的构成比例2.欲比较两组阳性反应率,在样本量非常小的情况下(如),应采用A.四格表检验B.校正四格表检验C.Fisher确切概率法D.配对检验E.校正配对检验3.进行四组样本率比较的检验,如,可认为A.四组样本率均不相同B.四组总体率均不相同C.四组样本率相差较大D.至少有两组样本率不相同E.至少有两组总体率不相同4.从甲、乙两文中,查到同类研究的两个率比较的检验,甲文,乙文,可认为A.两文结果有矛盾B.两文结果完全相同C.甲文结果更为可信D.乙文结果更为可信E.甲文说明总体的差异较大5.两组有效率比较检验功效的相关因素是A.检验水准和样本率B.总体率差别和样本含量C.样本含量和样本率D.总体率差别和理论频数E.容许误差和检验水准答案:CCECB二、计算与分析1.某神经内科医师观察291例脑梗塞病人,其中102例病人用西医疗法,其它189例病人采用西医疗法加中医疗法,观察一年后,单纯用西医疗法组的病人死亡13例,采用中西医疗法组的病人死亡9例,请分析两组病人的死亡率差异是否有统计学意义?[参考答案]本题是两组频数分布的比较,资料课整理成下表的形式。两组疗法病人的死亡率的比较组别死亡存活合计西医疗法1389102西医疗法加中医疗法9180189合计22269291(1)建立检验假设并确定检验水准:,即两组病人的死亡率相等:,即两组病人的死亡率不等(2)用四个表的专用公式,计算检验统计量值==6.041(3)确定P值,作出推断结论以=1查附表7的界值表,得。按水准,拒绝,接受,可以认为两组病人的死亡率不等。2.某医院研究中药治疗急性心肌梗死的疗效,临床观察结果见下表。问接受两种不同疗法的患者病死率是否不同?两种药治疗急性心肌梗死的疗效组别存活死亡合计病死率(%)中药组653684.41非中药组1221414.29合计775826.10[参考答案]本题=,宜用四格表的确切概率法(1)建立检验假设并确定检验水准36 :,即两种不同疗法的患者病死率相同:,即两种不同疗法的患者病死率不同(2)计算确切概率=0.2001(3)作出推断结论按水准,不拒绝,无统计学意义,还不可以认为两种不同疗法的患者病死率不同。3.某医师观察三种降血脂药A,B,C的临床疗效,观察3个月后,按照患者的血脂下降程度分为有效与无效,结果如下表,问三种药物的降血脂效果是否不同?三种药物降血脂的疗效药物有效无效合计A12025145B602787C402262[参考答案]本题为3个样本构成比的比较,是3×2表资料。(1)建立检验假设并确定检验水准H0:三种药物的降血脂有效的概率相同H1:三种药物的降血脂有效的概率相同=0.05(2)计算检验统计量==9.933.确定P值,作出推断结论查界值表得P<0.05,在=0.05检验水准下,拒绝H0,接受H1,认为三种药物的降血脂有效率不同。4.某医师按照白血病患者的发病情况,将308例患者分为两组,并按ABO血型分类记数,试问两组患者血型总体构成有无差别?308例急、慢性白血病患者的血型分布组别ABOAB合计急性组60476121189慢性组42303413119合计102779534308[参考答案]本例为2个样本构成比的比较,是2×4表资料。(1)建立检验假设并确定检验水准H0:两组患者血型总体构成比相同H1:两组患者血型总体构成比不全相同=0.05(2)计算检验统计量36 0.6081(3)确定P值,作出推断结论查界值表得P>0.05,在=0.05检验水准下,不拒绝H0,还不能认为两组患者血型总体构成比不全相同。5.为研究某补钙制剂的临床效果,观察56例儿童,其中一组给与这种新药,另一组给与钙片,观察结果如表,问两种药物预防儿童的佝偻病患病率是否不同?表两组儿童的佝偻病患病情况组别病例数非病例数合计患病率(%)新药组8324020.0钙片组6101637.5合计14425625.0[参考答案]本题是两组二分类频数分布的比较,用四个表检验。表中=56>40,且有一个格子的理论频数小于5,须采用四个表检验的校正公式进行计算。(1)建立检验假设并确定检验水准:,即新药组与钙片组儿童佝偻病患病概率相同:,即新药组与钙片组儿童佝偻病患病概率不同=0.05(2)用四个表检验的校正公式,计算检验统计量值:==13.确定P值,作出推断结论以=1查附表7的界值表得,<,P>0.05。按水准,不拒绝,无统计学意义,还不能认为新药组与钙片组儿童佝偻病患病概率不同。6.某医院147例大肠杆菌标本分别在A,B两种培养基上培养,然后进行检验,资料见下表,试分析两种培养基的检验结果是否有显著性差别?表A、B两种培养基上培养大肠杆菌标本结果A培养基B培养基合计+-+593695-153752合计7473147[参考答案]本题是一个配对设计的二分类资料,采用配对四个表资料的检验。(1)建立检验假设并确定检验水准:,即两种培养基的阳性培养率相等:,即两种培养基的阳性培养率不相等(2)计算检验统计量本例b+c=36+15=51>40,用配对四个表检验公式,计算检验统计量值=,3.确定P值,作出推断结论查界值表得P<0.05。按水准,拒绝。认为两种培养基的阳性培养率不同。36 第九章非参数检验一、单项选择题1.对医学计量资料成组比较,相对参数检验来说,非参数秩和检验的优点是A.适用范围广B.检验效能高C.检验结果更准确D.充分利用资料信息E.不易出现假阴性错误2.对于计量资料的比较,在满足参数法条件下用非参方法分析,可能产生的结果是A.增加Ⅰ类错误B.增加Ⅱ类错误C.减少Ⅰ类错误D.减少Ⅱ类错误E.两类错误都增加3.两样本比较的秩和检验,如果样本含量一定,两组秩和的差别越大说明A.两总体的差别越大B.两总体的差别越小C.两样本的差别可能越大D.越有理由说明两总体有差别E.越有理由说明两总体无差别4.多个计量资料的比较,当分布类型不清时,应选择的统计方法是A.方差分析B.WilcoxonT检验C.Kruskal-WallisH检验D.u检验E.检验5.在一项临床试验研究中,疗效分为“痊愈、显效、有效、无效”四个等级,现欲比较试验组与对照组治疗效果有无差别,宜采用的统计方法是A.Wilcoxon秩和检验  B.列联表检验C.四格表检验  D.Fisher确切概率法E.计算标准化率答案:ABDCA二、计算与分析1.某医院测定10名受试者针刺膻中穴前后痛阈的数据,见下表,试分析针刺膻中穴前后痛阈值的差异有无统计学意义?10名受试者针刺膻中穴前后痛阈资料编号针刺前针刺后1600610260070036855754105060059006006112514257140013508750825910008001015001400[参考答案](1)建立假设检验H0:差值总体中位数为零H1:差值总体中位数不为零α=0.05(2)计算统计量见下表10名受试者针刺膻中穴前后痛阈编号针刺前针刺后差值秩次160061010136 26007001004.53685575-110-641050600-450-105900600-300-8.56112514253008.5714001350-50-2875082575391000800-200-71015001400-100-4.5合计T+=17T-=38T++T-=17+38=55,总秩和,计算准确无误T=min(T+,T-)=17。(3)查表及结论现n=10,查T界值表T0.05(10)=8~47,T=17落在此范围内,所以P>0.05,按α=0.05水准,不拒绝H0,针刺膻中穴前后痛阈值的差异无统计学意义。2.8名健康男子服用肠溶醋酸棉酚片前后的精液中精子浓度检查结果如下表(服用时间3月),问服用肠溶醋酸棉酚片前后精液中精子浓度有无下降?8名健康男子服用肠溶醋酸棉酚片前后的精液中精子浓度(万/ml)编号服药前服药后1600066022200056003590037004440050005600063006650012007260001800858002200[参考答案](1)建立假设检验H0:差值总体中位数为零H1:差值总体中位数不为零(2)计算统计量见下表8名健康男子服用肠溶醋酸棉酚片前后的精液中精子浓度(万/ml)编号服药前服药后差值秩次16000660-5340-62220005600-16400-7359003700-2200-344400500060025600063003001665001200-5300-57260001800-24200-8858002200-3600-436 合计T+=3T-=33T++T-=33+3=36,总秩和,计算准确无误T=min(T+,T-)=3。(3)查表及结论现n=8,查T界值表T0.05(8)=3~33,T=3恰好落在界点上,所以P≤0.05,按α=0.05水准,拒绝H0,接受H1,可认为健康男子服用肠溶醋酸棉酚片前后的精液中精子浓度有差异。3.雌鼠两组分别给以高蛋白和低蛋白的饲料,实验时间自生后28天至84天止,计8周。观察各鼠所增体重,结果如下表,问两种饲料对雌鼠体重增加有无显著影响?两种饲料雌鼠体重增加量(g)高蛋白组低蛋白组8365977010470107781138511994123101124107129122134146161[参考答案](1)建立假设检验H0:两总体分布相同H1:两总体分布不同α=0.05(2)计算统计量将两样本21个数据由小到大统一编秩,见下表两种饲料雌鼠体重增加量(g)高蛋白组秩次低蛋白组秩次835651978702.510410702.510711.578411313856119149471231610191241710711.51291812215134191462036 16121172.5()58.5()T=58.5(3)查表与结论9,12,=3,按α=0.05,查T值表得范围71~127,因为T=58.5<71,超出范围,故P<0.05,拒绝H0,接受H1,接受即两种饲料对雌鼠体重增加有显著影响。4.测得铅作业与非铅作业工人的血铅值(μg/100g),问铅作业工人的血铅值是否高于非铅作业工人?铅作业与非铅作业工人的血铅值(μg/100g)非铅作业组铅作业组51751862072593412431344151821[参考答案](1)建立假设检验H0:两总体分布相同H1:两总体分布不同(2)计算统计量将两样本17个数据由小到大统一编秩,见下表铅作业与非铅作业工人的血铅值(μg/100g)非铅作业组秩次铅作业组秩次51.517951.51810.5632012742514953415126431613744171581810.52113 59.5()93.5()T=93.5(3)查表与结论7,10,=3,按α=0.05,查T值表得范围42~84,因为T=93.5,超出范围,故P<0.05,拒绝H0,接受H1,铅作业工人的血铅值高于非铅作业工人的血铅值。5.用VK3眼药水对近视眼患者作治疗,对照组用生理盐水作安慰剂,对两组的疗效进行观察,结果如下表,试分析VK3眼药水对近视眼患者的治疗是否有疗效?表VK3眼药水治疗近视眼患者的疗效观察疗效VK3眼药水组生理盐水组退步82036 不变9360进步1110恢复41合计11691[参考答案](1)建立假设检验H0:两总体分布相同H1:两总体分布不同α=0.05(2)计算统计量将两样本的资料统一由小到大统一编秩,见下表:VK3眼药水治疗近视眼患者的疗效观察疗效VK3眼药水组生理盐水组合计范围平均秩次盐水组秩和退步820281—2814.5290不变936015329—1811056300进步111021182—2021921920恢复415203—207205205合计116912078715由于=1.96,>,P<0.05,拒绝H0,接受H1,有统计学意义,可认为两总体分布不同。即可认为VK3眼药水对近视眼患者的治疗有疗效。6.对正常、单纯性肥胖及皮质醇增多症三组人的血浆皮质醇含量进行测定,其结果见下表,问三组人的血浆皮质醇含量的差异有无统计学意义?三组人的血浆皮质醇测定值(nmol/L)正常人单纯性肥胖人皮质醇增多症0.40.69.81.91.210.22.22.010.62.52.413.02.83.114.03.14.114.83.75.015.63.95.915.64.67.421.67.013.624.036 [参考答案](1)建立假设检验H0:三组人的血浆皮质醇含量的总体分布相同。H1:三组人的血浆皮质醇含量的总体分布不全相同。(2)计算统计量将三样本30个观察值统一由小到大编秩,见下表:三组人的血浆皮质醇测定值(nmol/L)正常人秩次单纯性肥胖人秩次皮质醇增多症秩次0.410.629.8201.941.2310.2212.262510.6222.582.4713232.893.110.514253.110.54.11414.8263.71251615.6273.9135.91715.6284.6157.41921.62971813.6242430合计96.5合计117.5合计251(3)查表及结论现k=3,ν=k-1=3-1=2查界值表0.05,2=5.99,>0.05,3;P<0.05按α=0.05水准,拒绝H0,接受H1,故可认为三组人的血浆皮质醇含量的总体分布有差别。7.在针刺麻醉下,对肺癌、肺化脓症及肺结核三组患者进行肺部手术,效果分四级,结果见下表,试比较针刺麻醉对三组病人的效果有无差异?三组患者肺部手术的针麻效果针麻效果肺癌肺化脓症肺结核Ⅰ102448Ⅱ174165Ⅲ193336Ⅳ478合计50105157[参考答案](1)建立假设检验H0:三组病人的总体效果相同。H1:三组病人的总体效果不全相同。α=0.05(2)计算统计量将三个样本的资料统一由小到大编秩,见下表:表三组患者肺部手术的针麻效果针麻例数合计范围平均秩和36 效果秩次肺癌肺化脓症肺结核肺癌肺化脓症肺结核Ⅰ102448821—8241.54159961992Ⅱ17416512383—205144244859049360Ⅲ19333688206—293249.54740.58233.58982Ⅳ47819294—312303121221212424合计501051573128815.517254.522758(3)查表及结论现k=3,ν=k-1=3-1=2查界值表0.05,2=5.99,>0.05,3;P<0.05按α=0.05水准,拒绝H0,接受H1,故可认为三组病人的总体效果不全相同。第十章线性相关与回归一、单项选择题1.回归系数的最小二乘估计使其平方和最小的是A.各点到X均数直线的横向距离B.各点到X轴的横向距离C.各点到回归直线的垂直距离D.各点到Y均数直线的垂直距离E.各点到Y轴的垂直距离2.两数值变量相关关系越强,表示A.相关系数越大B.相关系数的绝对值越大B.回归系数越大C.回归系数的绝对值越大E.相关系数检验统计量的t值越大3.回归分析的决定系数越接近于1,说明A.相关系数越大B.回归方程的显著程度越高C.应变量的变异越大D.应变量的变异越小E.自变量对应变量的影响越大4.两组资料作回归分析,直线回归系数b较大的一组,表示A.两变量关系密切的可能性较大B.检验显著的可能性较大C.决定系数较大D.决定系数可能大也可能小E.数量依存关系更密切5.1—7岁儿童可以用年龄(岁)估计体重(市斤),回归方程为,若将体重换成国际单位kg,则此方程A.常数项改变B.回归系数改变C.常数项和回归系数都改变D.常数项和回归系数都不改变E.决定系数改变答案:DBEDC二、计算与分析1.12名20岁女青年的身高与体重资料如下表,试问女青年身高与体重之间有无相关关系?表12名20岁女青年的身高与体重资料编号123456789101112身高(cm)164156172172177180166162172167158152体重(kg)555660686665565560554651[参考答案]身高为X,体重为Y。36 代入公式(10-2)得:由公式(10-1)计算相关系数下面采用t检验法对相关系数进行检验。(1)建立检验假设,即身高与体重之间不存在相关关系,即身高与体重之间存在相关关系(2)计算统计量(3)查界值表,得统计结论查t界值表,得,,按水准,拒绝H0,接受H1,可以认为女青年身高与体重之间存在正相关关系。2.某医师研究某种代乳粉价值时,用大白鼠做实验,得大白鼠进食量和体重增加量的资料如下,试问大白鼠的进食量与体重的增加量之间有无关系?能否用大白鼠的进食量来估计其体重的增加量?大白鼠进食量和体重增加量的资料动物编号1234567891011进食量(g)820780720867690787934679639820780增重量(g)165158130180134167186145120150135[参考答案]进食量为X,增重量为Y。36 由公式(10-2)计算可得:由公式(10-1)计算相关系数:下面用r检验法对相关系数进行检验:由r=0.881,n=11,v=11-2=9查r界值表,得r0.005/2,9=0.776,因r>r0.005/2,9,故P<0.005,按水准,拒绝H0,接受H1,可以认为大白鼠的进食量与体重增加量之间存在正相关关系。我们根据上表得数据绘制散点图,见下图,可以看出大白鼠的进食量与增重量有明显的直线趋势,我们考虑建立二者之间的线性回归方程。由上述计算代入公式(10-5)和(10-6)得:则回归方程为:36 图大白鼠的进食量与增重量之间关系散点图最后我们采用方差分析法对回归方程作检验:(1)建立假设检验:,(2)由计算可得:(3)查界值表,得统计结论查F界值表,,,P<0.01,拒绝H0,接受H1,说明大白鼠的进食量与体重增加量之间存在线性回归关系,也就是说,可以用大白鼠的进食量来估计其体重的增加量。3.测得347名13岁健康男童的身高和体重,身高均数为146.4cm,标准差为8.61cm,体重均数为37.04kg,标准差为6.67kg。身高和体重的相关系数r=0.74,试计算由身高推体重的回归系数及由体重推身高的回归系数。[参考答案]身高为X,体重为Y。由题意,由身高推体重的回归系数为b1,则由体重推身高的回归系数为b2,则4.某防治所作病因研究,对一些地区水质的平均碘含量(μg/l)与地方性甲状腺肿患病率进行了调查,结果如下表,试问甲状腺肿患病率与水质中碘的含量有无相关关系?局部地区水质的平均碘含量(μg/l)与地方性甲状腺肿患病率地区编号1234567891011121314患病率(%)40.537.739.020.022.537.431.515.621.06.37.19.04.05.4碘含量(μg/l)1.02.02.53.53.54.04.44.54.67.78.08.08.38.5[参考答案]甲状腺肿患病率为Y,水质中碘含量为X。①将X,Y分别从小到大编秩,见下表(3)、(5)两栏;②计算差数d,见(6)栏;③计算,见(7)栏,;36 ④代入公式(10-18)计算rs下面对rs进行检验(1)建立假设检验(2)计算统计量rs=-0.912(3)结论当时,查附表12中的等级相关系数rs界值表。由于,拒绝H0,接受H1,可认为甲状腺肿患病率与水质中碘的含量存在负相关关系。不同地区水质中碘含量()与甲状腺肿患病率(%)地区编号(1)水质中碘含量甲状腺肿患病率d(6)d2(7)X(2)秩次(3)Y(4)秩次(5)11.0140.514-1316922.0237.712-1010032.5339.013-1010043.54.520.07-2.56.2553.54.522.59-4.520.2564.0637.411-52574.4731.510-3984.5815.662494.6921.0811107.7106.33749118.011.57.147.556.25128.011.59.056.542.25138.3134.0112144148.5145.4212144第十一章多元线性回归与多元逐步回归一、单项选择题1.在疾病发生危险因素的研究中,采用多变量回归分析的主要目的是A.节省样本B.提高分析效率C.克服共线影响D.减少异常值的影响E.减少混杂的影响2.多元线性回归分析中,反映回归平方和在应变量的总离均差平方和中所占比重的统计量是A.简单相关系数B.复相关系数C.偏回归系数D.回归均方E.决定系数3.对同一资料作多变量线性回归分析,若对两个具有不同个数自变量的回归方程进行比较,应选用的指标是A.决定系数B.相关系数C.偏回归平方和D.校正决定系数E.复相关系数4.多元线性回归分析,对回归方程作方差分析,检验统计量F值反映的是A.所有自变量与应变量间是否存在线性回归关系B.部分自变量与应变量间是否存在线性回归关系C.自变量与应变量间存在的线性回归关系是否较强D.自变量之间是否存在共线E.回归方程的拟合优度5.在多元回归分析中,若对某个自变量的值都乘以一个常数(),则A.偏回归系数不变、标准回归系数改变36 B.偏回归系数改变、标准回归系数不变C.偏回归系数与标准回归系数均不改变D.偏回归系数与标准回归系数均改变E.偏回归系数和决定系数均改变答案:EEDAB二、计算与分析1.某种特殊营养缺乏状态下,儿童年龄(岁)、身高(cm)与体重(kg)测定结果见下表,j试建立年龄、身高与体重的二元回归方程;k对回归方程作检验;l计算复相关系数与决定系数;m计算年龄和身高的标准偏回归系数。营养缺乏儿童年龄、身高、体重测定值编号i123456789101112身高X1145150124157129127140122107107155148年龄X281061187109106129体重Y293224302526352625233531[参考答案](1)参数估计模型变量偏回归系数标准误标准化偏回归系数tP1常数2.1145.0480.4190.6850.1350.0470.5642.8630.0190.9230.4340.4192.1260.062回归方程为:(2)方差分析变异来源离均差平方和自由度均方差FP回归150.884275.44216.1540.001误差42.03394.670总变异192.91711从上表可见,F=16.154,P<0.001,此回归方程有统计学意义。(3)复相关系数R=0.884,决定系数R2=0.782。m年龄和身高的标准偏回归系数第一个表。2.有学者认为,血清中低密度脂蛋白增高和高密度脂蛋白降低,是引起动脉硬化的一个重要原因。现测量了30名动脉硬化疑似患者的载脂蛋白AI、载脂蛋白B、载脂蛋白E、载脂蛋白C、低密度脂蛋白中的胆固醇、高密度脂蛋白中的胆固醇含量,资料如下表。①分别作和对,,,的多元线性回归分析。②作对,,,的逐步回归分析,并与前面的分析结果进行比较。30名动脉硬化疑似患者的观测资料序号i载脂蛋白AI(mg/dL)X1载脂蛋白B(mg/dL)X2载脂蛋白E(mg/dL)X3载脂蛋白C(mg/dL)X4低密度脂蛋白(mg/dL)Y1高密度脂蛋白(mg/dL)Y21173106714.71376221391326.417.81624331981126.916.71348141181387.115.7188395139948.613.613851617516012.120.321565713115411.221.51714081581419.729.61484291581377.418.219756101321517.517.21133711162110615.91457036 1214411310.142.88141131621377.220.718556141691298.516.715758151291386.310.1197471616614811.533.41564917185118617.515669181551216.120.415457191751114.127.214474201361109.4269039211531338.516.921565221101499.524.71844023160865.310.81185724112123816.612734251471108.518.413754262041226.121.012672271311026.613.413051281701278.424.713562291731238.719.0188853013213113.829.212238[参考答案]①和对,,,的多元线性回归分析为应变量的方差分析表变异来源离均差平方和自由度均方差FP回归18530.40844632.6028.0900.000误差14316.25825572.650总变异32846.66729为应变量的参数估计变量偏回归系数标准误标准化偏回归系数tP常数-0.82947.773--0.0170.9860.2330.1970.1651.1810.2491.3250.2820.7144.6990.000-0.1242.783-0.008-0.0450.965-2.3850.765-0.494-3.1190.005复相关系数R=0.751,决定系数=0.564。按α=0.05检验水准,回归方程中和有统计学意义,即低密度脂蛋白中的胆固醇与载脂蛋白B及载脂蛋白C有线性回归关系。与载脂蛋白B呈正相关,而与载脂蛋白C呈负相关。为应变量的方差分析表变异来源离均差平方和自由度均方差FP回归4392.58141098.14522.4870.000误差1220.8862548.835总变异5613.46729为应变量的参数估计变量偏回归系数标准误标准化偏回归系数tP常数-2.13213.951--0.1530.8800.4830.0580.8258.3850.000-0.0530.082-0.069-0.6400.528-0.2940.813-0.046-0.3620.720-0.4150.223-0.208-1.8580.07536 此时,复相关系数R=0.885,决定系数=0.783。按α=0.05检验水准,回归方程中只有有统计学意义,即高密度脂蛋白中的胆固醇含量与载脂蛋白AI有线性回归关系,并呈正相关。②作关于,,,的逐步回归,选入水准α选入=0.05,剔除水准α剔除=0.10。/为应变量的方差分析表变异来源离均差平方和自由度均方差FP回归0.28330.09446.8460.000误差0.052260.002总变异0.33629/为应变量的参数估计变量偏回归系数标准误标准化偏回归系数tP常数0.3550.088-4.0180.0000.0030.0000.5837.3570.000-0.0040.000-0.612-7.5070.0000.0030.0010.2162.7000.012此时,复相关系数R=0.919,决定系数=0.844。按α=0.05检验水准,回归方程中、和有统计学意义,即高、低密度脂蛋白中的胆固醇含量的比值与载脂蛋白B、载脂蛋白C和载脂蛋白AI有线性回归关系,并与载脂蛋白C及载脂蛋白AI呈正相关,而与载脂蛋白B呈负相关。与前面的回归结果比较,用作应变量得到的回归方程=0.844,比单独用或作应变量得到的回归方程(:=0.564;:=0.783)要高,这提示:高、低密度脂蛋白中的胆固醇含量的比值,较低密度脂蛋白中的胆固醇含量或高密度脂蛋白中的胆固醇含量,对诊断动脉硬化可能更有价值。第十二章统计表与统计图一、单项选择题1.统计表的主要作用是A.便于形象描述和表达结果B.客观表达实验的原始数据C.减少论文篇幅D.容易进行统计描述和推断E.代替冗长的文字叙述和便于分析对比2.描述某疾病患者年龄(岁)的分布,应采用的统计图是A.线图B.条图C.百分条图D.直方图E.箱式图3.高血压临床试验分为试验组和对照组,分析考虑治疗0周、2周、4周、6周、8周血压的动态变化和改善情况,为了直观显示出两组血压平均变动情况,宜选用的统计图是A.半对数图B.线图C.条图D.直方图E.百分条图4.研究三种不同麻醉剂在麻醉后的镇痛效果,采用计量评分法,分数呈偏态分布,比较终点时分数的平均水平及个体的变异程度,应使用的图形是A.复式条图B.复式线图C.散点图D.直方图E.箱式图5.研究血清低密度脂蛋白LDL与载脂蛋白B-100的数量依存关系,应绘制的图形是A.直方图B.箱式图C.线图D.散点图E.条图答案:EDBED二、改表和绘图1.某地调查脾肿大和疟疾临床分型的关系、程度与血片查疟原虫结果列表如下,此表有何缺点,请改进。项目脾血膜阴性血膜阳性合计36 肿程度恶性疟间日疟例数%例数%例数%脾肿者1742812.6209.042224821.6脾Ⅰ10586.697.401221713.9脾Ⅱ511420.057.10701927.1脾Ⅲ15623.1519.20261142.3300.0125.004125.0[参考答案]本表的缺点有:(1)无标题,(2)横表目与纵标目分类不明确,标目设计不合理,“合计”不清晰,不便于比较分析;(3)线条过多,比例数小数位不统一。具体修改如下,见下表,也可以把血膜阳性分类单独列表。表某地脾肿大程度和疟疾临床分型的关系脾肿程度血膜阴性血膜阳性合计例数%(*)恶性疟间日疟合计例数%(△)例数%(*)例数%(*)例数%(*)脾Ⅰ10586.0686.5697.381713.9412254.96脾Ⅱ5172.861420.0057.141927.147051.53脾Ⅲ1557.69623.08519.231142.312611.71其他375.0000.00125.00125.0041.80合计17478.382812.61209.014821.60222100注:(*)表示行百分比,(△)表示列百分比1.试根据下表资料绘制适当统计图形。表某地1975年839例正常人发汞值分布资料(μg/g)组段0~0.2~0.4~0.6~0.8~1.0~1.2~1.4~1.6~2.2合计例数1331931901118334431636839[参考答案]本题需要应用直方图表示839例正常人发汞值分布情况,由于最后一组的组距与其它组不等,制图时转换成:矩形高度=组段频数/组距,即变成等组距。为保持原始数据的组距一致为0.2,也可把最后一组频数转换为36/(0.6/0.2)=12,频数图见下图。图某地1975年839例正常人发汞值分布图3.根据下表分别绘制普通线图和半对数线图,并说明两种统计图型的意义。某地某年食管癌年龄别发病率(1/10万)年龄(岁)男女40~4.42.145~7.23.350~7.34.555~6.95.560~19.36.765~50.216.470~68.512.575~86.219.980~97.015.2[参考答案]将表中数据绘制成普通线图(见下图1),可以看出,60岁之前,男女食管癌年龄别发病率随年龄增长的变化趋势差异较小,60岁之后,男性随年龄变化食管癌发病率比女性增长较快,差异明显扩大。将表中数据绘制成半对数线图(见图2),不同性别随年龄变化食管癌年龄别发病率变化快慢程度相当,而且女性食管癌发病率趋势和转折点更清楚。应用半对数线图能够更恰当的表示相对指标的变化趋势。图某地某年不同性别食管癌年龄别发病率(1/10万)比较(普通线图)图某地某年不同性别食管癌年龄别发病率对数比较(半对数线图)第十三章医学实验设计与诊断试验的评价一、单项选择题1.实验研究随机化分组的目的是36 A.减少抽样误差B.减少实验例数C.保证客观D.提高检验准确度E.保持各组的非处理因素均衡一致2.关于实验指标的准确度和精密度,正确的说法是A.精密度较准确度更重要B.准确度较精密度更重要C.精密度主要受随机误差的影响D.准确度主要受随机误差的影响E.精密度包含准确度3.在临床试验设计选择对照时,最可靠的对照形式是A.历史对照B.空白对照C.标准对照D.安慰对照E.自身对照4.两名医生分别阅读同一组CT片诊断某种疾病,Kappa值越大说明A.观察个体的变异越大B.观察个体的变异越小C.观察一致性越大D.机遇一致性越大E.实际一致性越大5.下列叙述正确的有A.特异度高说明测量的稳定性好B.灵敏度必须大于特异度才有实际意义C.增大样本含量可以同时提高灵敏度和特异度D.特异度高说明假阳性率低E.阳性预测值高说明患病的概率大答案:ECDCC二、计算与分析将100名头外伤的急诊患者作为受检人群,用患者失去知觉的时间、头部表面外伤严重程度和神经检查结果作为有无颅骨骨折的新的综合诊断标准,与所有患者的影像诊断有无颅骨骨折进行比较,结果见下表,试计算其敏感度、特异度、总的符合率、阳性预测值、阴性预测值,并对该诊断试验标准进行评价。100名头外伤人群的疾病状态和诊断结果影像诊断新的诊断方法合计阳性阴性有骨折48(a)2(b)50无骨折10(c)40(d)50合计5842100[参考答案]:(1)计算评价指标敏感度:特异度:总的符合率:阳性预测值:阴性预测值:36 (2)对该诊断试验标准进行评价36'