• 3.26 MB
  • 2022-04-22 11:45:24 发布

张小山 新编《社会统计学与SPSS应用》课后答案.doc

  • 93页
  • 当前文档由用户上传发布,收益归属用户
  1. 1、本文档共5页,可阅读全部内容。
  2. 2、本文档内容版权归属内容提供方,所产生的收益全部归内容提供方所有。如果您对本文有版权争议,可选择认领,认领后既往收益都归您。
  3. 3、本文档由用户上传,本站不保证质量和数量令人满意,可能有诸多瑕疵,付费之前,请仔细先通过免费阅读内容等途径辨别内容交易风险。如存在严重挂羊头卖狗肉之情形,可联系本站下载客服投诉处理。
  4. 文档侵权举报电话:19940600175。
'练习题解答:第二章随机现象与基础概率第二章随机现象与基础概率练习题:1.从一副洗好的扑克牌(共52张,无大小王)中任意抽取3张,求以下事件的概率:(1)三张K;(2)三张黑桃;(3)一张黑桃、一张梅花和一张方块;(4)至少有两张花色相同;(5)至少一个K。解:(1)三张K。设:=“第一张为K”=“第二张为K”=“第三张为K”则==若题目改为有回置地抽取三张,则答案为(2)三张黑桃。设:=“第一张为黑桃”=“第二张为黑桃”=“第三张为黑桃”则==(3)一张黑桃、一张梅花和一张方块。设:=“第一张为黑桃”=“第二张为梅花”=“第三张为方块”则==93 练习题解答:第二章随机现象与基础概率注意,上述结果只是一种排列顺序的结果,若考虑到符合题意的其他排列顺序,则最终的结果为:0.017×6=0.102(4)至少有两张花色相同。设:=“第一张为任意花色”=“第二张的花色与第一张不同”=“第三张的花色与第一、二张不同”则==1=====1==(5)至少一个K。设:=第一张不为K=第二张不为K=第三张不为K则====1==2.某地区3/10的婚姻以离婚而告终。问下面两种情况的概率各是多少:(1)某对新婚夫妇白头偕老,永不离异;(2)两对在集体婚礼上结婚的夫妻最终都离婚了。解:(1)某对新婚夫妇白头偕老,永不离异。=0.7(2)两对在集体婚礼上结婚的夫妻最终都离婚了。==0.093.某班级有45%的学生喜欢打羽毛球,80%学生喜欢打乒乓球;两种运动都喜欢的学生有30%。现从该班随机抽取一名学生,求以下事件的概率:(1)只喜欢打羽毛球;(2)至少喜欢以上一种运动;93 练习题解答:第二章随机现象与基础概率(3)只喜欢以上一种运动;(4)以上两种运动都不喜欢。解:设:A=“喜欢打羽毛球”B=“喜欢打乒乓球”(1)只喜欢打羽毛球:(2)至少喜欢以上一种运动:=(3)只喜欢以上一种运动:=(4)以上两种运动都不喜欢:=4.拥有40%命中率的篮球手投球5次,他获得如下结果的概率是多少:(1)恰好两次命中。(2)少于两次命中解:设:(1)恰好两次命中。=(2)少于两次命中=5.求在某一天相遇的前5个人中,至少有3个人是星期一出生的概率。解:设:93 练习题解答:第二章随机现象与基础概率6.投掷5颗骰子,恰好获得4个面相同的概率是多少?解:设:=第四章数据的组织与展示练习题:1.有240个贫困家庭接受调查,被问及对政府的廉租房政策是否满意,有180个家庭表示不满意,40个家庭表示满意,20个家庭不置可否,请计算表示满意的家庭占被调查家庭的比例和百分比?解:比例:百分比:0.1667×100%=16.67%2.某中学初三数学教研室在课程改革后对初三(一)班的数学成绩做了分析,45名学生的成绩由好到差分为A、B、C与D四种,统计结果如下表所示:AABCBCACDBBBBAAACAACBBCCAAAACACACABBBBBBCBBDB(1)上表的数据属于什么类型的数据?(2)请用SPSS绘制上表的频数分布表,然后再绘制一个饼形图或条形图。解:(1)定序数据;(2)频数分布表:93 练习题解答:第二章随机现象与基础概率成绩频数A15B17C11D2饼形图:条形图:3.某镇福利院有老人50名,截止2009年9月,其存款数目如下表所示:180003100620051009206000250048502450850093 练习题解答:第二章随机现象与基础概率930060003100460035002950450012003400140019002800570029004000650315022006100350041008008506100650270410047003006050108509805504250800012100840016504002150(1)根据上表的数据将上面数据分为4组,组距为5000元。(2)根据分组绘制频数分布表,并且计算出累积频数和累积百分比。解:(1)组距为5000元,分成的4组分别为0-5000元、5001-10000元、10001-15000元和15001-20000元。(2)频数分布表存款数目分组频数百分比(%)累积频数累积百分比(%)0-5000元3570.03570.05001-10000元1224.04794.010001-15000元24.04998.015001-20000元12.050100.0 总计50 100.0 4.根据武汉市初中生日常行为状况调查的数据(data9),绘制饼状图说明武汉市初中生中独生子女和非独生子女(a4)的分布状况。解:《武汉市初中生日常行为状况调查问卷》:A4你是独生子女吗1)是2)不是SPSS操作步骤的如下:打开数据data9,点击Graphs→Pie,弹出一个窗口,如图4-1(练习)所示。图4-1(练习)PieCharts对话框点击Define按钮,出现如图4-2(练习)所示的对话框,将变量“是否独生子女(a4)”放在DefineSlicesby一栏中,选择Nofcases选项。93 练习题解答:第二章随机现象与基础概率图4-2(练习)DefinePie对话框点击OK按钮,提交运行,可以得到独生子女和非独生子女分布状况的饼状图,如图4-3(练习)所示。图4-3(练习)独生子女和非独生子女的频数分布图(饼图)5.根据武汉市初中生日常行为状况调查的数据(data9),绘制武汉市初中生家庭总体经济状况(a11)的累积频数图。解:《武汉市初中生日常行为状况调查问卷》:A11你觉得你家庭的总体经济状况属于1)非常困难2)比较困难3)一般4)比较富裕5)非常富裕SPSS操作的步骤如下:依次点击Graphs→Bar,弹出一个窗口,如图4-4(练习)所示。93 练习题解答:第二章随机现象与基础概率图4-4(练习)BarCharts窗口选择Simple,点击Define按钮,弹出一个如图4-5(练习)所示的对话框。将变量“家庭的总体经济状况(a11)”放在CategoryAxis栏中,选择CumNofcases选项。图4-5(练习)DefineSimpleBar对话框点击OK按钮,提交运行,SPSS输入如图4-6(练习)所示的结果。93 练习题解答:第二章随机现象与基础概率图4-6(练习)初中生家庭总体经济状况累积类频数分布图6.根据武汉市初中生日常行为状况调查的数据(data9),将节假日初中生与父母聊天的时间(c11)以半个小时为组距进行分组,并绘制新生成的分组的直方图。解:《武汉市初中生日常行为状况调查问卷》C11请你根据自己的实际情况,估算一天内在下面列出的日常课外活动上所花的时间大约为(请填写具体时间,没有则填“0”)节假日:9)和父母聊天_______小时SPSS的操作步骤如下:依次点击Transform→Recode→IntoDifferentVariables,弹出一个窗口,如图4-7(练习)所示。将变量“节假日初中生与父母聊天的时间(c11b9)”放置在NumeiricVariable→Output栏中,分组之后生成的新变量命名为“c11b9fz”,标签Label命名为“节假日与父母聊天时间分组”。图4-7(练习)RecodeIntoSameVariables对话框93 练习题解答:第二章随机现象与基础概率单击OldandNewvalues按钮出现如图4-8(练习)所示的对话框,进行分组区间的设置。“0-0.5小时”是一组,“0.5-1”小时是一组,“1-1.5”小时是一组,“1.5-2”小时是一组,“2个小时以上”是一组。图4-8(练习)OldandNewvalues对话框点击Continue按钮,返回到如图4-7(练习)所示的对话框。点击OK按钮,完成新变量“节假日与父母聊天时间分组(c11b9fz)”的设置。依次点击Analyze→Graphs→Histogram,出现如图4-9(练习)所示的对话框,将新生成的变量“节假日与父母聊天时间分组(c11b9fz)”放在Variable(s)栏中。图4-9(练习)Histogram对话框点击OK按钮,提交运行,输出如图4-10(练习)所示的结果。图4-10(练习)初中生节假日与父母聊天时间分组的直方图93 练习题解答:第二章随机现象与基础概率上表中,“1.0”指示的是“0-0.5小时”,“2.0”指示的是“0.50-1小时”,“3.0”指示的是“1-1.5小时”,“4.0”指示的是“1.5-2小时”,“5.0”指示的是“2个小时以上”。从上表可以看到各个分组的频数及其相对应的百分比。第五章集中趋势与离散趋势练习题:1.17名体重超重者参加了一项减肥计划,项目结束后,体重下降的重量分别为:(单位:千克)121015826141210121010111051016(1)计算体重下降重量的中位数、众数和均值。(2)计算体重下降重量的全距和四分位差。(3)计算体重下降重量的方差和标准差。解:(1)中位数:对上面的数据进行从小到大的排序:序号1234567891011121314151617数据256810101010101011121212141516Md的位置==9,数列中从左到右第9个是10,即Md=10。众数:绘制各个数的频数分布表:数据2568101112141516频数111161311193 练习题解答:第二章随机现象与基础概率“10”的频数是6,大于其他数据的频数,因此众数MO=“10”均值:(2)全距:R=max(xi)-min(xi)=16-2=14四分位差:根据题意,首先求出Q1和Q3的位置:Q1的位置===4.5,则Q1=8+0.5×(10-8)=9Q3的位置===13.5,则Q3=12+0.5×(12-12)=12Q=Q3-Q1=12-9=3(3)方差:标准差:2.下表是武汉市一家公司60名员工的省(市)籍的频数分布:省(市)籍频数(个)湖北28河南12湖南6四川6浙江5安徽3(1)根据上表找出众值。(2)根据上表计算出异众比率。解:(1)“湖北”的频数是28,大于其他省(市)籍的频数,因此众数MO=“湖北”93 练习题解答:第二章随机现象与基础概率(2)异众比率的计算公式为:(n代表总频数,代表众数的频数)其中n=60,=28,则:3.某个高校男生体重的平均值为58千克,标准差为6千克,女生体重的平均值为48千克,标准差为5千克。请计算男生体重和女生体重的离散系数,比较男生和女生的体重差异的程度。解:计算离散系数的公式:男生体重的离散系数:女生体重的离散系数:男生体重的离散系数为10.34%,女生体重的离散系数为10.42%,男生体重的差异程度比女生要稍微小一些。4.在某地区抽取的120家企业按利润额进行分组,结果如下:按利润额分组(万元)企业数200——29919300——39930400——49942500——59918600——69911合计120(1)计算120家企业利润额的中位数和四分位差。(2)计算120家企业利润额的均值和标准差。解:(1)中位数Md的位置=,Md位于“400—499”组,L=399.5,U=499.5,cf(m-1)=49,fm=42,n=120,代入公式得93 练习题解答:第二章随机现象与基础概率=职工收入的中位数为425.69元。四分位差(2)均值:标准差:5.根据武汉市初中生日常行为状况调查的数据(data9),运用SPSS统计被调查的初中生平时一天做作业时间(c11)的众数、中位数和四分位差。解:《武汉市初中生日常行为状况调查问卷》:C11请你根据自己的实际情况,估算一天内在下面列出的日常课外活动上所花的时间大约为(请填写具体时间,没有则填“0”)平时(非节假日):1)做作业_______小时SPSS操作步骤如下:依次点击Analyze→DescriptiveStatistics→frequencies,打开如图5-1(练习)所示的对话框。将变量“平时一天做作业时间(c11a1)”,放置在Variables栏中。93 练习题解答:第二章随机现象与基础概率图5-1(练习)Frequencies对话框单击图5-1(练习)中Frequencies对话框中下方的Statistics(统计量)按钮,打开如图5-2(练习)所示的对话框。选择Quartiles(四分位数)选项,Median(中位数)选项和Mode(众数)选项。点击Continue按钮,返回到上一级对话框。图5-2(练习)Frequencies:Statistics统计分析对话框点击OK按钮,SPSS将输出如表5-1(练习)所示的结果。表5-1平时初中生一天做作业时间的中位数、众值和四分位差NValid517Missing9Median2.500Mode2.0Percentiles252.000502.500753.000从上表可以看出,平时初中生一天做作业时间的中位数是2.5小时,众数是2小时,四分位差是1(即3.000-2.000)个小时。6.根据武汉市初中生日常行为状况调查的数据(data9),运用SPSS分别统计初93 练习题解答:第二章随机现象与基础概率中生月零花钱的均值和标准差,并进一步解释统计结果。解:《武汉市初中生日常行为状况调查问卷》:F1你每个月的零用钱大致为___________元。SPSS操作的步骤如下:依次点击Analyze→DescriptiveStatistics→frequencies,打开如图5-3(练习)所示的对话框。将变量“每个月的零花钱(f1)”,放置在Variables栏中。图5-3(练习)Frequencies对话框单击图5-3(练习)Frequencies对话框中下方的Statistics(统计量)按钮,打开如图5-4(练习)所示的对话框。选择Mean(均值)选项和Std.deviation(标准差)选项。点击Continue按钮,返回到如图5-3(练习)所示的对话框。图5-4(练习)Frequencies:Statistics统计分析对话框点击OK按钮,SPSS将输出如表5-2(练习)所示的结果。表5-2(练习)初中生月零用钱的均值和标准差93 练习题解答:第二章随机现象与基础概率从表5-2(练习)可以看出,“初中生月零用钱”的均值为109.80元,标准差为114.2元。第六章正态分布练习题:1.一个正态分布中,有300个变量值在130至150之间,求有多少变量值在130至145之间。解:该题目的求解分为以下4个步骤:130至150之间的300个变量值占总体的变量值的个数的比例:总体的变量值的个数为:130至145之间的变量值的个数占总体变量值个数的比例:总体中130至145之间的变量值的个数:2.已知一个正态分布的标准差为6.0,随机抽取一个变量值超过45.0的概率是0.02,求:(1)该分布的均值;(2)某一变量值,使95%的变量值都比它大。解:设该正态分布为,则其均值为,标准差为6.0。(1)随机抽取一个变量值超过45.0的概率是0.02,即:即:查标准正态分布表可知:93 练习题解答:第二章随机现象与基础概率=2.05可得:(2)设该变量值为,则:即:即:即:也即:查标准正态分布表可得:可得:3.对某大学的学生进行调查发现,平均缺课天数为3.5,标准差为1.2。假设该大学的缺课情况服从正态分布,求:(1)一名学生缺课3.5到5天的概率;(2)一名学生缺课5天及以上的概率;(3)三名学生都缺课5天及以上的概率。解:该总体服从的正态分布为(1)(2)(3)4.某社区10000名居民的体重服从正态分布,均值为80千克,标准差为12千克。求:(1)有多少人的体重在80千克至93千克之间;(2)有多少人的体重在90千克至105千克之间;(3)有多少人的体重在70千克至105千克之间;(4)有多少人的体重低于68千克。解:该社区10000名居民的体重服从的正态分布为。93 练习题解答:第二章随机现象与基础概率(1)体重在80千克至93千克之间居民占该社区全部居民人数的比例:体重在80千克至93千克之间的居民的人数:(2)体重在90千克至105千克之间居民占该社区全部居民人数的比例:体重在80千克至93千克之间的居民的人数:(3)体重在70千克至105千克之间居民占该社区全部居民人数的比例:体重在70千克至105千克之间的居民的人数:(4)低于68千克的居民占该社区全部居民人数的比例:低于68千克的居民的人数:5.若入学考试中各个考生的总分数服从正态分布,总共有2000人参加考试,问欲进入被录取的前300名内,其总分至少应该有多少?93 练习题解答:第二章随机现象与基础概率解:被录取的前300名的考生人数占总参考人数的比例:假设分数至少为时才能进入前300名,则:即:即:即:可得:可得:6.根据武汉市初中生日常行为状况调查的数据(data9),绘制初中生节假日做作业时间的P-P图,判断该变量是否服从正态分布?解:《武汉市初中生日常行为状况调查问卷》:C11请你根据自己的实际情况,估算一天内在下面列出的日常课外活动上所花的时间大约为(请填写具体时间,没有则填“0”)节假日:1)做作业_______小时SPSS操作步骤如下:选择Graphs中的P-PPlots,弹出如图6-1(练习)所示的对话框。图6-1(练习)P-PPlots对话框将要分析的变量“节假日做作业的时间(c11b1)”放置在Variables栏中,如图6-1(练习)所示,在TestDistritution框中设定Normal(正态分布)。93 练习题解答:第二章随机现象与基础概率点击OK按钮,就可以输出如图6-2(练习)所示的P-P图。(a)(b)图6-2(练习)节假日做作业时间的P-P图上图中的(a)、(b)两图分别是P-P图和去势P-P图,图(a)中的横轴和纵轴分别是实际累积概率和理论累积概率,如果研究数据呈正态分布,则图中数据点应当与理论直线(对角线)基本重合,可以看出“节假日做作业的时间”的实际分布基本上与理论直线分布相差比较小。(b)去势P-P图反映的是按正态分布计算的理论值与实际值之差的分布情况,如果研究数据呈现正态分布,则数据点将均匀地分布在y=0这条直线上下两边。图(b)数据点比较均匀地分布在y=0这条直线上下两边,其残差绝对值不超过0.05,因此可以判断中生节假日做作业时间基本上服从正态分布。第七章参数估计练习题:1.假设一个总体有3、6、9、12、15共5个元素,抽取样本容量为2的样本,绘制总体分布与样本均值的抽样分布,并比较两个分布的异同?解:总体分布:总体中5个元素3、6、9、12和15在总体中都各自仅仅出现一次,其分布为均匀分布,如下图所示:93 练习题解答:第二章随机现象与基础概率均匀分布若重复抽取(抽取后放回)样本容量为2的样本,则可以抽取的样本有52=25个,样本以及样本的均值如下表所示:样本第一个观察值第二个观察值样本均值样本第一个观察值第二个观察值样本均值样本第一个观察值第二个观察值样本均值13331061510.5191212122364.51193620121513.5339612967.521153943127.5139992215610.5531591491210.523159126634.5159151224151213.57666161237.5251515158697.5171269961291812910.5根据上表可以绘制出25个样本均值的相对频数分布,如下图所示:93 练习题解答:第二章随机现象与基础概率样本均值的抽样分布1.某报刊为了对某市交通的便利情况进行调查,在全市随机抽取了56名市民,调查其每天上下班大约在公交车上花费的时间,下表是56名市民做出的回答:(单位:分钟)8080684860501105085957570210605060200704035120906080708019045601201004078508050305580110507090406030606070606080506080120(1)请计算这56名市民上下班在公交车上花费的时间的平均数和标准差S。(2)求该市市民上下班在公交车上花费的平均时间的置信区间,置信度为95%。解:(1)均值:标准差:(2)大样本单总体均值的区间估计:93 练习题解答:第二章随机现象与基础概率在的置信度下,总体均值的置信区间为,该题目中:,,,,则:可得:可得总体均值的置信区间为。3.某大学为了了解本校学生每天上网的时间,在全校6000名学生中随机抽取了20名学生进行调查,得到下面的数据:(单位:小时)2.53421.62.542312.83.5624123.815(1)请计算这20学生每天上网的时间的平均数和方差S。(2)求该校20名学生每天上网的平均时间的置信区间,置信度为99%。解:(1)均值:标准差:(2)小样本单总体均值的区间估计:在的置信度下,总体均值的置信区间为,该题目中:,,,(自由度为19),93 练习题解答:第二章随机现象与基础概率则:可得:可得总体均值的置信区间为。4.中华人民共和国建国60周年阅兵式通过电视和网络直播传递到了世界的每一个角落,阅兵式结束的当天下午,某国的中文报纸随机抽取了200名华人对之进行电话调查,结果显示有180名华人对阅兵式印象深刻,请计算该国对于阅兵式印象深刻的华侨的比例的置信区间,置信度为95%。解:大样本单总体比例的区间估计:样本中对阅兵式印象深刻的华侨占200名华人的比例:在置信度为下的置信区间为,本题目中:,,,则:可得:可得总体比例的置信区间为。5.某购物中心准备在甲乙两个城区选出一个建立一个新的购物中心,策划人员分别在甲城区随机抽取了200名居民,在乙城区随机抽取了240名居民,对其月消费额度进行了调查,下表是调查的结果:(单位:元)来自甲城区的样本来自乙城区的样本93 练习题解答:第二章随机现象与基础概率=200=240=720=640=120=88(1)求的95%的置信区间。(2)求的99%的置信区间。解:(1)大样本两总体均值差的区间估计:在置信度为下两总体均值差的置信区间为,=200,=240,=120,=88,可得:可得的95%的置信区间为。(2)可得:可得的99%的置信区间为。93 练习题解答:第二章随机现象与基础概率6.在旅游开发过程中将旅游地社区居民的意见考虑进来已经是一种比较通行的做法,某地要新开发一个旅游项目,在附近的甲社区随机抽取60名居民,在乙社区随机抽取了64名居民,调查其是否同意该旅游项目开工建设,表示同意开工建设的居民的百分比如下表所示:来自甲社区的样本来自乙社区的样本=60=64=86%=72%(1)构造的90%的置信区间。(2)构造的95%的置信区间。解:(1)在置信度为下两总体比例差的置信区间为:该题目中:,=60,=64,可得:的90%的置信区间为。(2)可得:93 练习题解答:第二章随机现象与基础概率的95%的置信区间为。7.现今有大量的中小学生参加各种培优项目,某教育研究机构在某中学初二年级中随机抽取了30名学生,上一学期参加过培优的有12名学生,没有参加过培优的有18名学生,这两类学生期末考试各科的平均成绩如下:参加90788778899092938986==8082没有参加80877669899086896778==8090689489907687(1)请计算、、与并填入上表。(2)求的95%的置信区间。解:(1)93 练习题解答:第二章随机现象与基础概率(2)小样本总体均值差的区间估计,≠且≠:在置信度为下两总体均值差的置信区间为:其中分布的自由度:该题目中,则在自由度为28,置信度为时,可得:可得:可得的95%的置信区间为。93 练习题解答:第二章随机现象与基础概率8.根据武汉市初中生日常行为状况调查的数据(data9),试以95%的置信度求武汉市初中生平时一天睡觉时间(C11)的置信区间?解:《武汉市初中生日常行为状况调查问卷》:C11请你根据自己的实际情况,估算一天内在下面列出的日常课外活动上所花的时间大约为(请填写具体时间,没有则填“0”)平时(非节假日):8)睡觉_______小时SPSS的操作步骤如下:选择“AanalyzeDescriptiveStatisticsExplore”,打开如图7-1(练习)所示的对话框。图7-1(练习)Explore的对话框将变量“初中生平时一天睡觉时间(c11a8)”放在DependentList栏中,Display选项中选择Both。点击Statitics按钮,出现如图7-2(练习)所示的对话框。设置置信水平为95%,点击Continue按钮,返回到上一级对话框。图7-2(练习)Explore:Statistics分析对话框点击OK按钮,输出如表7-1(练习)所示的结果。表7-1(练习)变量描述表93 练习题解答:第二章随机现象与基础概率从表7-1(练习)可以看出,初中生平时每天睡觉的平均时间为7.772小时,我们有95%的把握认为初中生平时每天平均睡觉时间在7.626-7.918小时之间。9.根据武汉市初中生日常行为状况调查的数据(data9),试以95%的置信度求武汉市不与父母双亲住在一起(A7)的初中生的比例的置信区间?解:《武汉市初中生日常行为状况调查问卷》:A7你的居住情形是1)与父母亲住在一起2)仅与其他亲戚住3)只与父亲住在一起4)只与母亲住在一起5)单独居住6)和父母及其他亲戚一起居住SPSS的操作步骤如下:《武汉市初中生日常行为状况调查问卷》“A7你的居住情形”这个题目有1)到6)六个选项,其中只有1)和6)是与父母亲双亲住在一起,其余的2)到5)都不是与双亲住在一起。将变量“居住情形(a7)”进行变换,生成新变量“是否与父母双亲住在一起(a7fz)”,其中1)与父母双亲住在一起,2)不与父母双亲住在一起。该步骤的操作步骤如下:A.依次点击Transform→Recode→IntoDifferentVariables,打开如图7-3(练习)所示的对话框。图7-3(练习)Transform对话框93 练习题解答:第二章随机现象与基础概率B.再将“你的居住情形(a7)”这个变量放置在NumericVavriable→output对话框中,如图7-3(练习)所示,并在OutputVariable框中给要生成的新变量命名为“a7fz”,点击Change按钮后,新变量名字将出现在NumericVavriable→output中,Label是新变量的标签,将之标示为“是否与父母双亲住在一起”。C.点击如图7-3(练习)的OldandNewValues按钮,得到如图7-4(练习)所示的对话框,将“你的居住情形(a7)”这个变量转换成两种类别。OldValue选项Value中输入1,在NewValue一栏Value中输入0,再点击Add按钮,使之出现在Old→New栏中;同样OldValue选项Value中输入6,在NewValue一栏Value中输入0,再点击Add按钮,使之出现在Old→New栏中;OldValue选项的Range栏的through左侧框中输入2,through右侧框中输入5,在NewValue一栏Value中输入1,再点击Add按钮,也使之出现在Old→New栏中。图7-4(练习)OldandNewValues对话框D.点击Continue按钮,返回到上一级对话框,再点击图7-3(练习)中的OK按钮,完成设置。则生成新变量“是否与父母双亲住在一起(a7fz)”,该变量在SPSS数据中有0和1两个取值,其中“与父母双亲住在一起”取值为0,“不与父母双亲住在一起”取值为1。则变量“是否与父母双亲住在一起(a7fz)”的平均值就是“不与父母双亲住在一起的初中生”的比例。选择“AanalyzeDescriptiveStatisticsExplore”,打开如图7-5(练习)所示的对话框。93 练习题解答:第二章随机现象与基础概率图7-5(练习)Explore的对话框将变量“是否与父母双亲住在一起(a7fz)”放在DependentList栏中,Display选项中选择Both。点击Statitics按钮,出现如图7-6(练习)所示的对话框。设置置信水平为95%,点击Continue按钮,返回到上一级对话框。图7-6(练习)Explore:Statistics分析对话框点击OK按钮,输出如表7-2(练习)所示的结果。表7-2(练习)变量描述表从上表可以看出,有12.06%的初中生没有与父母双亲住在一起,我们有95%的把握认为没有与父母双亲住在一起的初中生的比例在9.21%—14.90%之间。第八章单总体假设检验练习题:1.某市去年进行的调查显示该市市民上下班花费的平均时间为75.45分钟。今年有两条地铁线路开通,今年某报社在全市随机抽取了60名市民对其上下班时间进行调查,调查结果如下表所示:(单位:分钟)6060564848708070557093 练习题解答:第二章随机现象与基础概率756512060545420506060905836806068905864648040455854504058705850486264553680404866585850386810080908865(1)请计算这60名市民今年每天上下班在公交车上花费的时间的平均数和标准差S。(2)请陈述研究假设和虚无假设。(3)若显著性水平为0.05,能否认为该市市民上下班变得更加便利了。解:(1),(2)研究假设:虚无假设:(3)采用Z检验:,,假设方向明确,采用一端(左)检定,显著性水平为0.05时,否定域,检验统计值(Z=-6.24<-1.65)落在否定域中,因此可以否定虚无假设,接受研究假设,也就是说在0.05的显著性水平上,该市居民上下班变得更加便利了。2.某大学去年的调查显示,该校学生每周体育锻炼平均时间为5.2个小时,今年在全校6000名学生中随机抽取了20名学生进行调查,得到下面的数据:(单位:小时)5.54333.52.5596442812768924(1)请计算这20学生每天体育锻炼时间的平均数和标准差S。(2)请陈述研究假设和虚无假设。(3)若显著性水平为0.05,能否认为该校学生体育锻炼的时间有所增加?解:(1);93 练习题解答:第二章随机现象与基础概率(2)研究假设:虚无假设:(3)采用小样本t检验:df=20-1=19假设方向明确,采用一端(右端)检验,显著性水平为0.05时否定域为,检验统计值(t=0.028<1.729)没有落在否定域中,因此不能否定虚无假设,即在0.05的显著性水平下,不能认为该校学生体育锻炼的时间有所增加。3.2007年某市抽烟的成年人的比例为41%,今年在该市随机调查了500名成年人,发现抽烟的有180名,若显著性水平为0.05,能否认为该市抽烟的成年人的比例有所下降?解:研究假设:虚无假设:样本中抽烟的成年人的比例:采用Z检验:假设方向明确,采用一端(左)检验,显著性水平为0.05时,否定域,统计检验值(Z=-2.27<-1.65)落在否定域中,因此可以否定虚无假设,接受研究假设,即在0.05的显著性水平下,该市抽烟的成年人的比例有所下降。(注:本题原来的解答过程有误)4.某产粮大县去年的小麦亩产是400千克,今年小麦播种采用了新的品种,该县农业部门在夏粮收获后,随机抽取了120亩进行调查,调查发现平均亩产为420千克,标准差为30千克,能否认为新品种的产量比老品种有所增加?(显著性水平为0.05)93 练习题解答:第二章随机现象与基础概率解:研究假设:,虚无假设:.采用Z检验:假设方向明确,采用一端(右)检定,显著性水平为0.05时否定域,检验统计值(Z=7.303>1.65)落在否定域中,因此可以否定虚无假设,接受研究假设,即在0.05的显著性水平下,认为新品种的产量比老品种有所增加。5.武汉某学校一次家长会上,大多数家长认为在节假日自己的孩子每天看电视的时间(C11)都大于两个半小时,武汉市初中生日常行为状况调查的数据(data9)是否支持这样的说法?(显著性水平)解:《武汉市初中生日常行为状况调查问卷》:C11请你根据自己的实际情况,估算一天内在下面列出的日常课外活动上所花的时间大约为(请填写具体时间,没有则填“0”)节假日:2)看电视_______小时SPSS的操作步骤如下:依次点击Analyze→CompareMeans→One-SampleTTest,打开如图8-1(练习)所示的T检验对话框。将变量“节假日一天看电视时间(c11b2)”放在TestVariable(s)栏中。图8-1(练习)One-SampleTTest检验对话框在TestValue窗口中输入2.5。Options各项取默认值,即显著度是95%和只剔除分析变量为缺失值的个案。如图8-2(练习)所示。93 练习题解答:第二章随机现象与基础概率图8-2(练习)t检验的置信度和缺失值选项框单击OK提交运行。可以在输出结果窗口看到表8-1(练习)和表8-2(练习)。表8-1(练习)单一样本T检验的基本描述统计量表8-2(练习)单一样本T检验的结果表8-1(练习)是简单描述统计结果,即调查了516人,初中生节假日一天看电视的平均时间为2.322小时,标准差为1.8221。表8-2(练习)是t检验的结果,由表8-1(练习)可知,初中生每天看电视的平均时间为2.322小时,那么这一结果在总体中是否真实存在?可以通过假设检验来说明,研究假设(H1)为节假日中学生每天看电视的时间小于2.5小时,原假设(H0)为学生看电视的时间大于2.5小时。通过表8-2(练习)可知,在假设初中生节假日一天看电视的平均时间为2.5小时的情况下,t值为-2.225,自由度df为515,表8-2(练习)给出的是双尾t检验的P值0.027,但是因为该题目考察的是初中生节假日一天看电视的时间是否大于2.5小时,因此采用的是右端检验,右端检验的P值为双尾检验的一半,即0.027/2,等于0.0135,小于0.05,所以在0.05的显著性水平下通过了显著性检验,否定原假设,接受研究假设,即初中生每天看电视的时间低于2.5小时。也可以根据t值的结果进行判断,在0.05的显著性水平下,自由度是515时,单尾检验时否定域为t<-1.65或t>1.65,这里的结果t=-2.225<-1.65,落在了否定域中,也就是说在0.05的显著性水平下通过了显著性检验,否定原假设,接受研究假设,即初中生每天看电视的时间低于2.5小时。6.某报刊宣称现今初中男生女生比例失调,并认为女生比例小于一半,武汉市初中生日常行为状况调查的数据(data9)是否支持这样的看法?(显著性水平)解:《武汉市初中生日常行为状况调查问卷》:A1你的性别1)女2)男SPSS的操作步骤如下:data9数据中,“女”的取值是“1”,“男”的取值是“2”,需要将之变换成0-1取值的变量。运用Transform→Recode→IntoDifferentVariables生成新变量“是否为女生(a1bh)”,其中“女”取值为“1”,“男”取值为“0”。依次点击Analyze→CompareMeans→One-SampleTTest,打开如图8-3(练习)所示的T检验对话框。将变量“是否为女生(a1bh)”放置在TestVariable(s)栏中。93 练习题解答:第二章随机现象与基础概率图8-3(练习)One-SampleTTest检验对话框在TestValue窗口中输入0.5。Options各项取默认值,即显著度是95%和只剔除分析变量为缺失值的个案。单击OK按钮,提交运行。可以在SPSS输出结果窗口看到表8-3(练习)和表8-4(练习)。表8-3(练习)单一样本T检验的基本描述统计量表8-4(练习)单一样本T检验的结果表8-3(练习)是简单描述统计结果,即调查了526人,女生的比例为47.53%。研究假设H1为男女比例失调,女生少于男生,原假设(虚无假设)H0则为男女比例不失调,两者比例相当。表8-4(练习)是t检验的结果,即在假设总体的女生比例为50%的情况下,计算t值为-1.134,自由度df为525,表中给出的是双尾t检验的P值,但是因为该题目考察的是初中生中女生的比例是否小于50%,也就是说研究假设(H1)为女生的比例小于50%,虚无假设(H0)则为女性比例不低于50%,因此要采用的是左端检验,左端检验的P值等于双尾检验的一半,即0.257/2,等于0.1285,大于0.05,不能排除H0,也就说,在0.05的显著性水平下,没有通过显著性检验,因此不能支持武汉市初中生性别比例失调的说法。同样,也可以根据计算的t值,与自由度是525显著性水平为0.05的单尾检验的t值进行比较,t=-1.134>-1.65结果落在了接受域中,因此在0.05的显著性水平上,不能拒绝虚无假设,也就是说不能支持武汉市初中生性别比例失调的说法。93 练习题解答:第二章随机现象与基础概率第九章双总体假设检验练习题:1.某电信运营商对某市居民的电话费进行了调查,随机抽取了180名男性和200名女性,其月电话费的平均值、标准差如下表所示:(单位:元)男性女性=180=200=140=160=30=48(1)为了分析男性和女性的月电话费是否有显著差异,请陈述研究假设和虚无假设。(2)若显著性水平为0.05,请判断该市男性和女性居民的月电话费是否有显著差异?解:(1)研究假设:虚无假设:(2)大样本采用Z检验:研究假设方向不明,采用二端检验,否定域≥1.96或≤-1.96,检验统计值Z=-4.92<-1.96,落在否定域中,因此可以否定虚无假设,接受研究假设,即在0.05的显著性水平下,男性与女性居民的电话费有显著差异。2.某旅游景区随机抽取了40名游客进行调查,其中散客有24人,跟团游客有16人,他们在景区消费的金额如下表所示:散客跟团游客=360=310=80=48(1)为了分析散客和跟团游客的消费额是否有显著差异,请陈述研究假设和虚无假设。(2)若显著性水平为0.05,请判断散客和跟团游客在该景区的消费额是否有显93 练习题解答:第二章随机现象与基础概率著差异。(3)若是要分析散客的消费额是否高于跟团游客,该如何构造研究假设和虚无假设。(4)若显著性水平为0.05,请判断散客的消费额是否高于跟团游客?解:(1)研究假设:虚无假设:(2)小样本(独立样本),采用检验:,=24+16-2=38研究假设方向不明,采用二端检验,否定域或(按自由度为40查表得到的结果),可见检验统计值落在否定域中,因此否定虚无假设,接受研究假设,即在0.05的显著性水平下,散客的消费额不同于跟团游客。(3)研究假设:虚无假设:(4)采用t检验:研究假设方向明确,采用一端检验,(按自由度为40查表得到的结果),可见检验统计值落在否定域中,因此否定虚无假设,接受研究假设,即在0.05的显著性水平下,散客的消费额高于跟团游客。1.某市最近开展了综合治安整治行动,为了对东西两个城区进行比较,随机在东城区抽取了100名市民,在西城区抽取了90名市民,认为城区治安明显好转的市民的百分比如下表所示:93 练习题解答:第二章随机现象与基础概率来自东城区的样本来自西城区的样本=100=90=76%=65%(1)为了分析两个城区治安好转的状况是否有所差异,请陈述研究假设和虚无假设。(2)若显著性水平为0.05,请判断两个城区治安好转的状况是否有所差异?(3)若是要分析东城区的治安好转的状况是否明显于西城区,该如何构造研究假设和虚无假设。(4)若显著性水平为0.05,请判断东城区的治安好转的状况是否好于西城区?解:(1)研究假设:虚无假设:(2)采用Z检验:研究假设方向不明,采用二端检验,显著性水平为0.05,否定域≥1.96或≤-1.96,由Z=1.67可知,检验统计值没有落在否定域中,因此不能否定虚无假设,也就是说在0.05的显著性水平下,两个城区的治安状况没有显著差异。(3)研究假设:虚无假设:(4)采用Z检验:研究假设方向明确,采用一端(右)检验,显著性水平为0.05,否定域Z0≥1.65或Z0≤-1.65,统计值Z=1.67>1.65,检验统计值落在否定域中,因此可以否定虚无假设,接受研究假设,即在0.05的显著性水平下,东城区的治安好转的状况好于西城区。1.93 练习题解答:第二章随机现象与基础概率某学校采用两种方法对青年教师进行培训,采用方法1对14名青年教师进行培训,采用方法2对12名青年教师进行培训,培训后的测试分数如下表所示:方法176697780868576796775==82837674方法275688078798280756472==6264(1)请计算、、与并填入上表。(2)为了比较方法1是否优于方法2,该如何构造研究假设和虚无假设。(3)若显著性水平为0.05,能否认为方法1优于方法2?解:(1)由数据计算得知,=77.50,=73.25,=5.52,=7.11(2)研究假设:虚无假设:(3)小样本(独立样本),采用检验,研究假设方明确,采用一端(右)检验,显著性水平为0.05,否定域为≥1.711,这里t=1.65<1.711,检验统计值没有落在否定域中,因此不能否定虚无假设,也就是说在0.05的显著性水平下,不能认为方法1优于方法2。1.某公司有很多业务经常需要员工加班,但是有不少员工不愿意加班,于是公司考虑改变员工激励的方式,为了对该激励方式是否有效进行评估,公司人力资源部门在激励实施前后同样调查了相同的12名员工,下表是新激励方式实施前后这12名员工每周愿意加班的时间:(单位:小时)员工编号123456789101112实施前101211581192015689实施后121411881012201591011(1)请计算出新激励方式实施前后这12名员工每周愿意加班的时间差的平均值和标准差。(2)新激励方式对员工愿意加班的时间是否有显著性影响?(显著性水平0.05)解:(1)员工编号1到12,激励方式个案数值差异(d=)分别是:2;2;0;3;0;-1;3;0;0;3;2;2;=1.33;=1.4493 练习题解答:第二章随机现象与基础概率(2)小样本(相关样本)采用检验:研究假设:虚无假设:=12-1=11研究方向不确定,所以采用二端检验,显著性水平为0.05时,否定域>2.201或<-2.201,这里t=3.06>2.201,结果落在否定域中,因此可以否定虚无假设,接受研究假设,即在0.05的显著性水平下,激励方式对员工愿意加班的时间有显著影响。6.根据武汉市初中生日常行为状况调查的数据(data9),运用SPSS检验男同学和女同学(A1)平时做作业的时间(C11)有无显著差异?(显著性水平)解:《武汉市初中生日常行为状况调查问卷》:A1你的性别1)女2)男C11请你根据自己的实际情况,估算一天内在下面列出的日常课外活动上所花的时间大约为(请填写具体时间,没有则填“0”)平时(非节假日):1)做作业_______小时(1)先采用Means过程计算女生和男生平时一天做作业的平均时间,SPSS的操作步骤如下:点击Analyze→CompareMeans→Means,打开如图9-1(练习)所示的对话框。图9-1(练习)Means分析对话框将要分析的变量“平时一天做作业时间(c11a1)”放置在DependentList窗口(分析变量窗口),将分组变量“性别(a1)”放置在IndependentList窗口(分组变量窗口)。Options按钮选择默认值,即选择均值,个案数目和标准差。单击OK提交运行。得到如表9-1(练习)与表9-2(练习)所示的结果。表9-1(练习)统计概要93 练习题解答:第二章随机现象与基础概率表9-2(练习)均值分析的结果表9-1(练习)是对参与统计样本的简要概述,说明517个初中生全部对“性别”和“平时一天做作业时间”两个变量做了回答。表9-2(练习)是均值分析的结果,列出了不同性别初中生平时一天做作业时间的均值、个案数和标准差,可以看出,调查样本中男生平时一天做作业的平均时间为2.539个小时,女生平时一天做作业的平均时间为2.755个小时。(2)用独立样本的T检验来检验男同学和女同学平时做作业的时间有无显著差异依次点击Analyze→CompareMeans→Independent-SamplesTTest,打开如图9-2(练习)所示的对话框。图9-2(练习)独立样本T检验对话框从左边的源变量框中选择要分析的变量“平时一天做作业时间(c11a1)”放置在TestVariable(s)窗口(分析变量窗口)。左边的源变量框中选择变量“您的性别(a1)”作为分组依据进入GroupingVariable窗口,同时激活DefineGroups按钮。单击DefineGroups按钮,打开分组设置对话框,如图9-3(练习)所示。在Group1中填入“1”,指示的是“女生”,在Group2中填入“2”,指示的是“男生”。然后点击Continue按钮,返回到上一级对话框。93 练习题解答:第二章随机现象与基础概率图9-3(练习)分组对话框Options按钮选择默认值,点击OK按钮,SPSS输出如表9-3(练习)和表9-4(练习)所示的结果。表9-3(练习)分析变量的简单描述统计量表9-4(练习)独立样本t检验的结果表9-3(练习)与Means过程的结果相差不大。表9-4(练习)是“女”“男”两组初中生平均数差异的t检验结果。上表方差齐性检验(Levene’sTestforEqualityofVariances)显示,两者的方差是相同的(sig.=0.081>0.05),因此应该看Equalvariancesassumed一行对应的t值,t检验结果的p值为0.155,大于0.05。也就是说,在0.05的显著性水平下,女生和男生平时一天做作业的时间不存在显著差异。7.大众普遍持有的看法是,与女同学相比男同学与好朋友打架的比例要大一些,武汉市初中生日常行为状况调查的数据(data9)是否支持这样的看法?(显著性水平)解:《武汉市初中生日常行为状况调查问卷》:A1你的性别1)女2)男E8你和好朋友之间有没有打过架1)有2)没有SPSS的操作步骤如下:该题目要分析的是女生和男生与好朋友之间打过架的比例,因此要将变量“与好朋友有没有打过架(e8)”变换成0-1取值的变量。运用Transform→Recode→IntoDifferentVariables生成新变量“是否与好朋友打过架(e8bh)”,其中“打过架”取值为“1”,“没有打过架”取值为“0”。这样,均值就是同好朋友打过架的学生的比例。依次点击Analyze→CompareMeans→Independent-SamplesTTest,打开如图9-4(练习)所示的对话框。93 练习题解答:第二章随机现象与基础概率图9-4(练习)独立样本T检验对话框从左边的源变量框中选择变量“您的性别(a1)”作为分组依据进入GroupingVariable窗口,同时激活DefineGroups按钮。单击DefineGroups按钮,打开分组设置对话框,如图9-5(练习)所示。在Group1中填入“1”,指示的是“女生”,在Group2中填入“2”,指示的是“男生”。然后点击Continue按钮,返回上一级对话框。图9-5(练习)分组对话框Options按钮选择默认值,点击OK按钮,SPSS输出分析结果,如表9-5(练习)和表9-6(练习)所示。表9-5(练习)分析变量的简单描述统计量表9-6(练习)独立样本t检验的结果93 练习题解答:第二章随机现象与基础概率表9-5(练习)对女生和男生两组的情况进行了简单的描述,从表中可以看出,女生与好朋友打过架的比例为6.48%,男生与好朋友打过架的比例为28.57%。表9-6(练习)是“女生”“男生”两组初中生是否与好朋友打过架的比例的t检验结果。表9-6(练习)方差齐性检验显示,两者的方差是不相同的(sig.=0.000<0.05),因此应该看Equalvariancesnotassumed一行对应的t值。t检验结果的P值为0.000,远远小于0.05,通过了0.05的显著性水平检验。因此可以说,在0.05的显著性水平上,女生和男生与好朋友打过架的比例是有显著差异的。第十章交互分类与检验练习题:1.为了研究婆媳分居对于婆媳关系的影响,在某地随机抽取了180个家庭,调查结果如下表所示:表10-26居住方式(X)分居不分居婆媳关系(Y)状况紧张1535一般2010和睦8020N:180(1)计算变量X与Y的边际和(即边缘和)和并填入上表。(2)请根据表10-26的数据完成下面的联合分布的交互分类表。表10-27居住方式(X)分居不分居婆媳关系(Y)状况紧张P11:P21::一般P12:P22::和睦P13:P23::::(3)根据表10-27指出关于X的边缘分布和关于Y的边缘分布。(4)根据表10-27指出关于X的条件分布和关于Y的条件分布。解:(1)(从上到下):50;30;100.(从左到右):115;65.93 练习题解答:第二章随机现象与基础概率(2)P11=15/180;P21=35/180;=50/180;P12=20/180;P22=10/180;=30/180;P13=80/180;P23=20/180;=100/180;=115/180;=65/180.(3)关于X的边缘分布:x分居不分居P(x)115/18065/180关于Y的边缘分布:y紧张一般和睦P(y)50/18030/180100/180(4)关于X的条件分布有三个:y=“紧张”x分居不分居P(x)15/5035/50y=“一般”x分居不分居P(x)20/3010/30y=“和睦”x分居不分居P(x)80/10020/100关于y的条件分布有两个:X=“分居”y紧张一般和睦P(y)15/11520/11580/115X=“不分居”y紧张一般和睦P(y)35/6510/6520/652.一名社会学家关于“利他主义”的研究中,对被调查者的宗教信仰情况进行了分析,得到的结果如下表所示:表10-28宗教信仰情况(X)93 练习题解答:第二章随机现象与基础概率信教不信教利他主义的程度(Y)高9029119中6065125低3578113185172357(1)根据表10-28的观察频次,计算每一个单元格的期望频次并填入表10-29。表10-29宗教信仰情况(X)信教不信教利他主义的程度(Y)高中低(2)根据表10-28和表10-29计算,计算公式为。(3)若要对有无宗教信仰的人的利他主义程度有无显著性差异进行检验,请陈述研究假设和虚无假设。(4)本题目中的自由度为多少?若显著性水平为0.05,请查附录的分布表,找出相对应的临界值。并判断有无宗教信仰的人的利他主义程度有无显著性差异。(5)若变量“宗教信仰”和“利他主义程度”存在相关关系,请计算C系数。解:(1)“信教”一列(从上到下):;;.“不信教”一列(从上到下):;;.(2)93 练习题解答:第二章随机现象与基础概率(3):总体中有无宗教信仰的人的利他主义程度有显著性差异。:总体中有无宗教信仰的人的利他主义程度没有显著性差异。(4)df=(r-1)(c-1)=(3-1)(2-1)=2;显著性水平为0.05时的临界值是5.991。因为5.99<47.42,检验统计值落在否定域中,可以拒绝虚无假设,接受研究假设,即认为总体中有无宗教信仰的人的利他主义程度是有显著性差异的。(5)C值要利用表“部分交互分类表C值的上限”中的数值进行修正,本题的表格是32,对应的C值上限是0.685,因此:3.某英语培训学校为了研究英语四级考试试卷客观选择题正确答案的设置在A、B、C与D的某一个选项上是否有偏好,对最近三年英语四级考试试卷做了分析,258个单选题的正确答案在A、B、C与D四个选项上的分布情况如下表所示:答案选项频次A48B74C50D86合计258(1)请陈述研究假设和虚无假设。(2)A、B、C与D四个选项上的期望频次是多少。(3)根据上表计算值。(4)若显著性水平为0.05,请判断英语四级考试试卷选择题的正确答案在A、B、C与D四个选项上的分配是否有显著的倾向。93 练习题解答:第二章随机现象与基础概率解:(1)研究假设:正确答案在A、B、C与D四个选项中的设置有偏好。虚无假设:正确答案在A、B、C与D四个选项中的设置没有偏好。(2)A、B、C与D四个选项上的期望频次都是258/4=64.5(3)(4)df=4-1=3,显著性水平为0.05时,查分布表可知临界值是7.815,统计量落在否定域内,因此,拒绝虚无假设,接受研究假设,即认为正确答案在A、B、C与D四个选项上的分配是有偏好的。4.某个电视节目收视率的商业调查,涉及到了儿童、少年、青年、中年、老年5个群体的收视习惯,调查结果如下表所示:群体分类(X)儿童少年青年中年老年收视习惯(Y)几乎天天看8978566778368偶尔看1234458956236101112101156134604(1)为了分析5个群体的收视习惯是否有显著差异,请陈述研究假设和虚无假设。(2)根据上表计算值。(3)若显著性水平为0.05,请判断不同群体的收视习惯是否有显著性差异。解:(1)研究假设:5个群体的收视习惯有显著差异。虚无假设:5个群体的收视习惯没有显著差异。(2)(3)df=(r-1)(c-1)=(2-1)(5-1)=4,显著性水平0.05下的临界值为93 练习题解答:第二章随机现象与基础概率9.448,很明显,检验统计值落在否定域内,因此,拒绝虚无假设,接受研究假设,即认为5个群体的收视习惯有显著差异。5.根据武汉市初中生日常行为状况调查的数据(data9),运用SPSS检验是否有自己的房间(C3)以供学习对学生在本班的学习层次(C2)有无显著影响,并计算关系强度系数C系数、V系数和φ系数。(显著性水平)解:《武汉市初中生日常行为状况调查问卷》:C2你的成绩目前在本班大致属于1)上等2)中上等3)中等4)中下等5)下等C3你是否有自己的房间以供学习不被打扰1)有2)没有SPSS的操作步骤如下:点击Analyze→DescriptiveStatistics→Crosstabs,打开Crosstabs对话框,如图10-1(练习)所示。将变量“是否有自己的房间以供学习不被打扰(c3)”放置在Column(s)框中,将变量“成绩目前在本班的大致层次(c2)”放置在Row(s)框中,如图10-1(练习)所示。图10-1(练习)Crosstabs对话框点击Statistics按钮,分别点击Chi-square、Contingencycoefficient、PhiandCramér’sV复选框,如图10-2(练习)所示。93 练习题解答:第二章随机现象与基础概率图10-2(练习)Crosstabs:statistics对话框点击Cells按钮,对单元格进行设置,如图10-3(练习)所示,选择Column选项,选择的是在单元格中计算列百分比。图10-3(练习)Crosstabs:CellDisplay对话框Format采取系统默认格式,点击OK,提交运行,可得到如下的结果。表10-1(练习)是否拥有房间与在班上学习层次的交互分类表表10-2(练习)卡方检验表93 练习题解答:第二章随机现象与基础概率表10-3(练习)各相关关系表从表10-2(练习)可以看出卡方值为10.605,自由度为4,卡方检验的P值为0.031,小于0.05,即通过了卡方检验,这意味着是否有自己的房间(C3)以供学习对学生在本班的学习层次(C2)有显著影响。从表10-1(练习)可以看出“有”和“没有”自己房间的两组初中生各个成绩层次的学生在各组所占的比例,在有自己房间的学生中,学习成绩为上等和中上等的比例均高于没有自己房间的学生。从表10-3(练习)可以看出,列联系数(Contingencycoefficient)为0.142,Cramer’sV系数为0.143,φ系数(Phi系数)为0.143。6.根据武汉市初中生日常行为状况调查的数据(data9),运用SPSS检验在本班的学习层次(C2)对自己与母亲关系的好坏(D2)有无显著影响,并计算关系强度系数C系数、V系数和φ系数。(显著性水平)解:初中生学习成绩的层次与自己同母亲的关系存在着相互影响,这个题目假定学习层次(C2)为自变量,自己与母亲关系的好坏(D2)为因变量。《武汉市初中生日常行为状况调查问卷》:C2你的成绩目前在本班大致属于1)上等2)中上等3)中等4)中下等5)下等D2你对自己与母亲的关系1)非常满意2)比较满意3)一般4)不太满意5)很不满意SPSS的操作步骤如下:点击Analyze→DescriptiveStatistics→Crosstabs,打开Crosstabs对话框,如图10-4(练习)所示。将变量“成绩目前在本班的大致层次(c2)”放置在column(s)框中,将变量“自己与母亲的关系(d2)”放置在row(s)框中,如图10-4(练习)所示。93 练习题解答:第二章随机现象与基础概率图10-4(练习)Crosstabs对话框点击Statistics按钮,分别点击Chi-square、Contingencycoefficient、PhiandCramr’V复选框,如图10-5(练习)所示。图10-5(练习)Crosstabs:statistics对话框点击Cells按钮,对单元格进行设置,如下图所示,选择Column,设置的是在单元格中计算列百分比。图10-6(练习)Crosstabs:CellDisplay对话框Format采取系统默认格式,点击OK,提交运行,SPSS输出如下的结果。表10-4(练习)成绩在班上的层次与自己同母亲的关系的交互分类表93 练习题解答:第二章随机现象与基础概率表10-5(练习)卡方检验表表10-6(练习)各相关关系表从表10-5(练习)可以看出卡方值为32.358,自由度为16,卡方检验的P值为0.009,小于0.05,即通过了卡方检验。这意味着学生学习成绩的层次对自己与母亲的关系的满意程度有显著影响。从表10-4(练习)可以看出“上等”、“中上等”、“中等”、“中下等”与“下等”5组中与父母不同关系水平的初中生占各组的比例,其表现出的总体趋势为:学生的学习成绩的层次越高,其对自己与母亲的关系越满意。从表10-3(练习)可以看出,列联系数(Contingencycoefficient)为0.243,Cramer’sV系数为0.125,φ系数(Phi)为0.250。第十一章相关分析93 练习题解答:第二章随机现象与基础概率练习题:1.某大型公司为了了解公司员工对于公司福利的满意程度,做了一个抽样调查,结果如下:老员工新员工合计满意9035125一般504090不满意4261103合计182136318(1)新老员工对于公司福利的满意程度是否有差异?(显著性水平为0.05)(2)如果有显著性差异,请计算Lambda系数和tau-y系数。(3)请用第十章讲到的内容,计算C系数,比较一下C系数与Lambda系数、tau-y系数有多大差异。解:(1)研究假设H1:两者有显著差异无假设H0:两者没有显著差异df=(r-1)(c-1)=(3-1)(2-1)=2显著性水平为0.05,查卡方分布表可得,当自由度为2时,0.05的显著性水平下的临界值为5.991,检验统计值22.64>5.991,落在否定域内,因此否定虚无假设,接受研究假设,即在0.05的显著性水平下,新老员工对于公司福利的满意程度有显著差异。(2)非对称形式:Lambda系数=tau-y测量法:=210.0393 练习题解答:第二章随机现象与基础概率(3)由上面的三个系数结果可以看出,同样是计算两个变量之间的相关关系,选用不同的方法进行计算时,结果存在很大的差异。因此,我们在进行相关系数的计算时,要根据变量的测量层次和变量的对称性等因素选择最恰当的方法进行分析。2.一项社区研究涉及到了邻里关系的状况,以抽样调查的方法得到了社区居民教育程度和邻里关系状况的列联表:初中及以下高中或中专大专本科及以上不和睦39232115一般40384036和睦57605880(1)请跟根据上表计算Gamma系数、dy系数和rho系数。(2)总体中教育程度对于邻里关系的好坏是否有显著性影响?(显著性水平为0.05)解:(1)93 练习题解答:第二章随机现象与基础概率rho系数:(2)采用Z检验(也可采用t检验):H1:总体中Gamma≠0H0:总体中Gamma=0查Z检验表,二端检验,在显著性水平0.05下的临界值是1.96,检验统计值2.228>1.96,检验统计值落在否定域,否定虚无假设,接受研究假设,即在0.05的显著性水平下,总体中教育程度对于邻里关系的好坏是有显著影响的。3.一名中学数学教师为了了解课外练习对于数学成绩的作用,特意统计了本班20名学生每周用于课外练习的时间和期末考试的成绩,结果如下表所示:(单位:小时)学生编号12345678910课外练习时间3412425638期末考试成绩78897670896887897290学生编号11121314151617181920课外练习时间24458124236期末考试成绩68708188799590768087(1)令“课外练习时间”为X变量,“期末考试成绩”Y变量,请绘制出这两个变量的散点图。(2)用最小二乘法计算出回归直线的斜率b和截距a。(3)根据上表计算积矩相关系数r。解:(1)“课外练习时间”与“期末考试成绩”两个变量的散点图93 练习题解答:第二章随机现象与基础概率(2)由统计数据可得:,,,,则回归直线的斜率b和截距a为:(3)积距相关系数:4.题目3中的数学老师后来将这20名学生,按照这个学期是否请过家教进行了分类,两类学生数学期末考试的成绩如下表所示:请过家教7889688772817976没有请过家教897670899068709080879588(1)请计算相关比率E2。(2)请过家教和没有请过家教的学生的数学成绩是否有显著差异?()解:93 练习题解答:第二章随机现象与基础概率(1)根据上表计算可得:请过家教的学生的平均成绩1=78.75没有请过家教的学生的平均成绩2=82.67所有学生的平均成绩=81.1n1=8,n2=12,n=20则:(2)用F检验法推断总体中两个变量的关系:研究假设H1:≠虚无假设H0:=df1=k-1=2-1=1df2=n-k=20-2=18显著性水平0.05下,查附录F分布表得临界值为4.41,求得F值为1.088<4.41,不在否定域内,因此在0.05的显著性水平下,我们不能否定虚无假设,也就是说,在0.05的显著性水平下,请没请过家教与学生的成绩没有显著关系。5.为了研究外出打工是否会对村庄邻里关系产生影响,某位研究者在一个村庄调查之后得到了如下数据:外出打过工没有打过工非常不和睦3025不和睦2413一般2414和睦1525非常和睦1241(1)外出打工对邻里关系是否有显著性影响?(显著性水平为0.05)(2)请计算λyx和tau-y系数。解:93 练习题解答:第二章随机现象与基础概率(1)研究假设H1:外出打工对邻里关系有影响虚无假设H0:外出打工对邻里关系没有影响由上表进一步可得:外出打过工没有打过工合计非常不和睦302555不和睦241337一般241438和睦152540非常和睦124153合计105118223进一步计算期望频次可得:外出打过工没有打过工非常不和睦:25.90:29.10不和睦:17.42:19.58一般:17.89:20.11和睦:18.83:21.17非常和睦:24.96:28.04;自由度为4,显著性水平为0.05时,临界值是9.448。检验统计值24.06>9.488,落在否定域中,可以否定虚无假设,接受研究假设,即认为在0.05的显著性水平下,是否外出打工对邻里关系是有显著影响的。(2)根据上表统计结果可知,My=55,my=30,41,n=223。93 练习题解答:第二章随机现象与基础概率那么,6.根据武汉市初中生日常行为状况调查的数据(data9)分析中学生母亲的文化程度与中学生学习成绩之间(成绩目前在本班属于的层次C2)的关系。解:《武汉市初中生日常行为状况调查问卷》:A8父母受教育程度(此题需分别填写父母亲的情况,将适合的答案序号写在横线上)父亲的受教育程度:___________母亲的受教育程度:___________1)初中及以下2)高中,中专及职业学校3)大专,本科4)硕士、博士研究生及以上C2你的成绩目前在本班大致属于1)上等2)中上等3)中等4)中下等5)下等变量“母亲的文化程度(a82)”与“成绩目前在本班的大致层次(c2)”都属于定序变量,因此可以选用定序-定序测量层次的检验方法和相关测量方法。SPSS的操作步骤如下:点击Analyze→DescriptiveStatistics→Crosstabs,打开如图11-1(练习)所示的对话框。分别将“母亲的文化程度(a82)”变量放入Column(s)框中,将“成绩目前在本班的大致层次(c2)”变量放入Row(s)框中。93 练习题解答:第二章随机现象与基础概率c图11-1(练习)Crosstabs对话框单击Statistics按钮,打开如图10-2(练习)所示的对话框,选择Chi-square。因为“母亲的文化程度(a82)”与“成绩目前在本班的大致层次(c2)”都属于定序变量,所以也选择Correlations命令和Gamma系数。单击Continue,返回到图11-1(练习)的对话框。图11-2(练习)Crosstabs:Stastics对话框点击Cells按钮,如图11-3(练习)所示,选择Percentages选项下的Column选项,Format选项选择默认。点击Continue按钮,返回到上一级对话框。93 练习题解答:第二章随机现象与基础概率图11-3(练习)Crosstabs:CellDisplay对话框点击OK按钮,SPSS输出如下的结果。表11-1(练习)母亲受教育程度与初中生在班级成绩层次的交互分类表表11-2(练习)卡方检验结果表11-3(练习)相关系数结果从表11-1(练习)可以看出母亲不同受教育程度的初中生其学习成绩在班级所处层次的分布状况。从表11-2(练习)可以看出卡方值为19.509,自由度为12,卡方检验的P值为0.077,大于0.05,没有通过了卡方检验。也就是说,在0.05的显著性水平下,母亲受教育程度与孩子的成绩水平的关系不显著。从表11-3(练习)可以看出,Gamma系数和斯皮尔曼(Spearman)的rho系数都比较小,p值都大于0.05,不能否定虚无假设(两个变量间没有显著性关系),即在0.05的显著性水平下,母亲受教育程度与孩子的成绩水平没有显著性关系。7.根据武汉市初中生日常行为状况调查的数据(data9),分析初中生性别与平时每天用于休闲的总时间(C11)(包括看电视时间,上网打游戏时间,看课外书时间和逛街时间)的相关关系。解:《武汉市初中生日常行为状况调查问卷》:93 练习题解答:第二章随机现象与基础概率A1你的性别1)女2)男C11请你根据自己的实际情况,估算一天内在下面列出的日常课外活动上所花的时间大约为(请填具体时间,没有则填“0”)平时(非节假日):2)看电视_______小时3)上网打游戏_______小时6)看课外书_______小时7)逛街_______小时“性别(a1)”属于定类变量,“休闲总时间”属于定距变量,因此要选择定类-定距层次的检验方法和相关关系测量方法。定类-定距层次变量相关关系的检验方法要用到方差分析(书中第十二章),本章还没有讲到方差分析的内容,这里将定距变量下降为定类变量进行处理,选择检验。具体的方差分析的检验方法,可参考第十二章正文的例题和练习题的解答。SPSS操作步骤如下:将看电视时间(c11a2),上网打游戏时间(c11a3),看课外书时间(c11a6)和逛街时间(c11a7)三个变量变换成新变量“休闲总时间(xxzsj)”操作步骤如下:A.点击Transform-Compute,出现如图11-4(练习)所示的对话框。图11-4(练习)ComputeVariable对话框B.在TargetVariable栏中输入新变量“xxzsj”,同时激活Type&Label按钮,点击Type&Label按钮,出现如图11-5(练习)所示的对话框,在Label栏中输入标签名字“休闲总时间”,点击Continue返回到图11-4(练习)中的对话框。图11-5(练习)ComputeVariable:TypeandLabel对话框C.从左侧源变量框中选择变量“看电视时间(c11a2),上网打游戏时间(c11a3),看课外书时间(c11a6)和逛街时间(c11a7)”,将之放置在NumericExpression框中,并将这几个变量用“+”号连接。D.点击OK按钮,完成设置,就生成了新变量“休闲总时间(xxzsj)”。依次点击Analyze→DescriptiveStatistics→Crosstabs,打开如图11-6(练习)所示的对话框。将“性别(a1)”和“休闲总时间(xxzsj)”放置在Column(s)和Row(s)框中。93 练习题解答:第二章随机现象与基础概率图11-6(练习)Crosstabs对话框单击Statistics按钮,如图11-7(练习)所示打开对话框。因为“性别(a1)”属于定类变量,“休闲总时间(xxzsj)”属于定距变量,所以选择NominalbyInterval下的Eta选项。点击Continue按钮,返回如图11-6(练习)所示的对话框。图11-7(练习)Crosstabs:Statistics对话框Cells和Format按钮选择默认选项,点击OK按钮,SPSS输出如下的结果。表11-4(练习)卡方检验结果93 练习题解答:第二章随机现象与基础概率表11-5(练习)相关测量结果表11-4(练习)是卡方检验的结果,从表中可以看出,卡方值为57.288,自由度为36,P值为0.013,小于0.05,通过了显著性检验,即说明在0.05的显著性水平下,男性和女性的休闲总时间存在差异。表11-5(练习)是相关测量的结果,这里休闲总时间为因变量(Dependent),Eta系数为0.107。8.根据武汉市初中生日常行为状况调查的数据(data9),统计初中生每天用于休闲的总时间(包括看电视时间,上网打游戏时间,看课外书时间和逛街时间)与成绩目前在本班的大致层次(视为定距变量)的积距相关系数(Pearson相关系数)。解:《武汉市初中生日常行为状况调查》:C2你的成绩目前在本班大致属于1)上等2)中上等3)中等4)中下等5)下等C11请你根据自己的实际情况,估算一天内在下面列出的日常课外活动上所花的时间大约为(请填具体时间,没有则填“0”)平时(非节假日):2)看电视_______小时3)上网打游戏_______小时6)看课外书_______小时7)逛街_______小时“C2你的成绩目前在本班大致属于?”这个题目的选项在data9中,“上等”赋值为“1”,“中上等”赋值为“2”,“中等”赋值为“3”,“中下等”赋值为“4”,“下等”赋值为“5”,为了便于分析通过Transform-RecodeintoDifferentVariables命令将“下等”赋值为“1”,“中下等”赋值为“2”,“中等”赋值为“3”,“中上等”赋值为“4”,“上等”赋值为“5”,生成新变量“成绩层次(cjcc)”。SPSS的操作步骤如下:点击Analyze→Correlate→Bivariate,打开如图11-6(练习)所示的对话框。分别将变量“休闲总时间(xxzsj)”和“成绩层次(cjcc)”放入“Variables”窗口。图11-6(练习)Bivariate:Correlations相关分析对话框因为“休闲总时间(xxzsj)”和“成绩层次(cjcc)”都是定距变量,所以选择Pearson93 练习题解答:第二章随机现象与基础概率相关系数,选择双尾检验。点击OK,提交运行,SPSS输出如表11-5(练习)所示的结果。表11-5(练习)相关分析结果表11-5(练习)是相关分析矩阵表。“休闲总时间(xxzsj)”和“成绩层次(cjcc)”的积距相关系数为-0.154,显著性水平为0.001时,通过显著性检验,也就是说在总体中两者之间的关系也是存在的。积距相关系数为负值,表明休闲时间越多,成绩在班级的层次就越低。第十二章方差分析练习题:1.现今越来越多的外国人学习汉语,某孔子学院设计了3种汉字的讲授方法,随机抽取了28名汉语基础相近的学生进行试验,试验后对每一个学生汉字理解记忆水平进行打分,满分为10分,28名学生的分数如下:表12-3三种汉字讲授方法下的学生得分汉字讲授方法讲授方法一讲授方法二讲授方法三8.78.17.19.16.66.28.67.07.49.08.07.88.17.47.99.47.68.29.28.18.18.87.46.79.47.96.97.5====(1)请分别计算3种汉字讲授方法下学生相应分数的平均值、与以及所有参加试验的学生的平均得分,并填入上表。93 练习题解答:第二章随机现象与基础概率(2)请根据上表计算总平方和(TSS),组间平方和(BSS),组内平方和(WSS),组间均方(MSSB),组内均方(MSSW),以及各自对应的自由度并填入下表。表12-4方差分析的结果误差来源平方和SS自由度df均方MSSF值P值F临界值组间BSS:k-1:MSSB:MSSB/MSSW:——组内WSS:n-k:MSSW:————————————总和TSS:n-1:————————————————(3)根据上表计算出F值,并查附录中的F分布表,看P是否小于0.05。(4)若显著性水平为0.05,请查附录中的F分布表找出F临界值,并填入上表。(5)若显著性水平为0.05,请根据P值或F临界值判断三种汉字的讲授方法对学生汉字的理解和记忆水平是否有显著性影响。解:(1)=8.9222≈8.92,=7.5667≈7.57,=7.3800≈7.38,=7.9357≈7.94.(2)BSS==9×(-)2+9×(-)+10×(-)=9×(8.92-7.94)2+9×(7.57-7.94)2+10×(7.38-7.94)2=13.0117≈13.01WSS==[(8.7-)2+(9.1-)2+…+(9.4-)2]+[(8.1-)2+(6.6-)2+…+(7.9-)2]+[(7.1-)2+(6.2-)2+……+(7.5-)2]=7.4117≈7.41TSS==++……+=20.4848≈20.48k-1=2,n-k=25,n-1=27=13.01/2=6.505=6.51=7.41/25=0.2964=0.30F=MSSB/MSSW=6.51/0.30=21.7(3)df1=k-1=3-1=2;df2=n-k=28-3=25,在显著性水平0.05下的F值的临界值是3.38,而21.7远大于3.38,因此可以看出P值小于0.05。(4)df1=k-1=3-1=2;df2=n-k=28-3=25;显著性水平0.05下的F值的临界值是3.38,即,F临界值=3.38。(5)根据(2)可知F=21.7>3.38,检验统计值落在否定域,可以认为三种汉字的讲授方法对学生汉字的理解和记忆水平有显著影响。2.某大学设置有经管类、法学类和统计类三大门类的专业,2009年该校就业服务指导部门随机抽取了300名该校2006届的本科毕业生并对其月薪情况进行了调查,而且用方差分析的方法分析专业门类对毕业生的薪酬是否有显著性影响,93 练习题解答:第二章随机现象与基础概率研究中得到下面的方差分析表。误差来源平方和SS自由度df均方MSF值P值F临界值组间BSS:2216800k-1:MSSB:MSSB/MSSW:——组内WSS:n-k:MSSW:2410——————————总和TSS:n-1:——————————(1)请完成上面的方差分析表(显著性水平为0.05)。(2)请判断该大学的毕业生专业门类对薪酬是否有显著性影响。解:(1)由k=3,n=300可得:k-1=2;n-k=297;n-1=299MSSB=BSS/k-1=2216800/2=1108400WSS=MSSW×(n-k)=2410×297=715770TSS=BSS+WSS=2216800+715770=2932570F=MSSB/MSSW=1108400/2410=459.917当df1=k-1=3-1=2;df2=n-k=300-3=297时,查F分布表可得,F临界值=2.99。(2)根据(1)可知F=459.917>2.99,检验统计值落在否定域,可以认为该校毕业生专业门类对毕业生薪酬有显著影响。3.根据武汉市初中生日常行为状况调查的数据(data9),运用SPSS检验老师上课的效果(C8)对于初中生平时上网打游戏的时间(C11)是否有显著影响?(显著性水平)解:《武汉市初中生日常行为状况调查问卷》:C8你觉得目前老师上课1)普遍枯燥无味,听不进去2)有的课上的好,有的不好3)都很好,很易接受C11请你根据自己的实际情况,估算一天内在下面列出的日常课外活动上所花的时间大约为(请填写具体时间,没有则填“0”)平时(非节假日):3)上网打游戏_______小时SPSS的操作步骤如下:该题目属于单因方差分析,依次点击Analyze→CompareMeans→One-WayANOVA打开如图12-1(练习)所示的对话框。93 练习题解答:第二章随机现象与基础概率图12-1(练习)One-WayANOVA对话框单击Options按钮,打开选项对话框。选择Descriptive、Homogeneity-of-variance、Brown-Forsythe、Welch与Meansplot选项。如图12-2(练习)所示。选择之后点击Continue按钮返回到上一级对话框。图12-2(练习)One-WayANOVA:Options对话框单击OK按钮,提交运行。可以得到如表12-1(练习)、表12-2(练习)、表12-3(练习)、表12-4(练习)与图12-3(练习)所示的结果。表12-1(练习)方差分析中因变量的描述统计结果表12-2(练习)是方差分析中对因变量的描述统计结果,三种教学水平(“普遍枯燥无味,听不进去”、“有的课上的好,有的不好”和“都很好,很易接受”)下初中生的样本数N,收入平均值Mean、标准差Sta.Deviation、标准误Std.Error、95%的置信区间、最小值和最大值。从表中数据结果可看出,505位初中生平时一天上网打游戏时间的平均数为0.265个小时,其中教师授课“普遍枯燥无味,听不进去”93 练习题解答:第二章随机现象与基础概率下的初中生一天上网打游戏的时间明显高于其他两种授课水平下的初中生上网打游戏的时间。表12-2(练习)方差齐次性检验结果表12-3(练习)Brown-Forsythe检验与Welch检验的结果表12-3(练习)是方差齐性检验结果,这是对方差分析前提的检验。从表12-3(练习)中可以看出,显著性水平为0.000,由于显著性水平小于0.05,因此不能认为不同教师授课水平下各总体方差无显著性差异(这个地方的原假设H0:各组的方差相等,研究假设H1:各组的方差不相等),即没有通过方差齐次性检验。表12-3(练习)的Brown-Forsythe检验与Welch检验是没有通过方差齐次性检验时采用的两种检验,从表12-3(练习)可以看出两种检验的显著性水平都大于0.05,因此可以认为不同教师授课水平下各总体的均值是相等的,即也没有通过Brown-Forsythe检验与Welch检验。表12-4(练习)方差分析结果表12-4(练习)是方差分析的结果,总变差是333.287,组间变差是5.968,组内变差是323.319;组间自由度为2,组内自由度为502,总自由度为504;组间均方差为2.984,组内均方差为0.652;F值为4.576;显著性水平为0.011,小于0.05,可以认为不同的教师授课水平下的初中生平时每天上网打游戏的时间有显著差异。注意,由于没有通过方差齐次性检验,也没有通过Brown-Forsythe检验与Welch检验,这里的方差分析实际上是没有意义的。93 练习题解答:第二章随机现象与基础概率图12-3(练习)均值分布图图12-3(练习)是不同的教师授课水平(“普遍枯燥无味,听不进去”,、“有的课上的好,有的不好”和“都很好,很易接受”)下初中生平时一天上网打游戏的平均时间的分布图,从图中可以明显看出授课“都很好,很易接受”下的初中生一天上网打游戏的平均时间明显少于其他两种授课水平下的初中生上网打游戏的平均时间4.根据武汉市初中生日常行为状况调查的数据(data9),运用SPSS检验初一、初二和初三学生(A3)节假日看课外书的时间(C11)有无显著差异?(显著性水平)解:《武汉市初中生日常行为状况调查问卷》:A3你的年级1)初一2)初二3)初三C11请你根据自己的实际情况,估算一天内在下面列出的日常课外活动上所花的时间大约为(请填写具体时间,没有则填“0”)节假日:6)看课外书_______小时SPSS的操作步骤如下:该题目属于单因方差分析,点击Analyze→CompareMeans→One-WayANOVA打开如图12-4(练习)所示的对话框。93 练习题解答:第二章随机现象与基础概率图12-4(练习)One-WayANOVA对话框单击Options按钮,打开选项对话框。选择Descriptive、Homogeneity-of-variance、与Meansplot选项。如图12-5(练习)所示。选择之后点击Continue按钮返回到上一级对话框。图12-5(练习)One-WayANOVA:Options对话框单击OK按钮,提交运行。可以得到表12-5(练习)、表12-6(练习)、表12-7(练习)、与图12-6(练习)。表12-5(练习)方差分析中因变量的描述统计结果93 练习题解答:第二章随机现象与基础概率表12-5(练习)是方差分析中对于因变量的描述统计结果,三个年级(“初一”、“初二”和“初三”)初中生的样本数N,收入平均值Mean、标准差Sta.Deviation、标准误Std.Error、95%的置信区间、最小值和最大值。从表中数据结果可看出,515位初中生节假日平均一天看课外书的平均时间为1.477小时。表12-6(练习)方差齐次性检验结果表12-6(练习)是方差齐性检验结果,这是对方差分析前提的检验。从表12-6(练习)中可以看出,F值(leveneStatistic)为2.536,显著性水平为0.080,两个自由度分别为2和512。由于显著性水平大于0.05,可以认为不同年级下各总体的方差无显著性差异,所以可以接受分析变量在自变量的各个不同影响因素上的分布是等方差的假设,这样下面的方差分析的结果才是有意义的。表12-7(练习)方差分析结果表12-7(练习)是方差分析的结果,总变差是891.826,组间变差是13.774,组内变差是878.052;组间自由度为2,组内自由度为512,总自由度为514;组间均方差为6.887,组内均方差为1.715;F值为4.016;显著性水平为0.019,小于0.05,可以认为不同年级的初中生节假日每天看课外书的时间有显著差异。93 练习题解答:第二章随机现象与基础概率图12-6(练习)均值分布图图12-3(练习)是不同年级(“初一”、“初二”和“初三”)的初中生节假日平均一天看课外书的平均时间的分布图,从图中可以明显看出初一学生每天读课外书的平均时间明显高于初二和初三学生。第十三章详析分析与偏相关练习题:1.一学者研究了青年人的文化程度与社区参与的关系,获得下表13-4的数据,为了进一步分析两者之间的关系,研究者引进了性别变量,获得表13-5的数据。表13-4文化程度与社区参与的关系社区参与文化程度合计高低高14578223中9780177低58102160合计300260560表13-5控制性别后文化程度与社区参与的关系社区参与男女合计高低高低高80456533223中4025575517793 练习题解答:第二章随机现象与基础概率低28703032160合计148140152120560根据上面两表计算:(1)根据表13-4计算青年人的受教育程度与社区参与的相关系数Gamma。(2)计算表13-5各分表的Gamma值,并与表13-1的结果进行比较。(3)计算偏相关系数。(4)根据所得到的结果作出研究结论。解:(1)同序对:Ns=145×(80+102)+97×102=36284异序对:Nd=78×(97+58)+80×58=16730这一结果说明青年人文化程度越高,其社区参与程度越高,或者说,根据青年人的文化程度来预测社区参与程度时可以减少36.8%的误差。(2)根据计算同序对与异序对的方法,可得:男:同序对:Ns1=80×(25+70)+40×70=10400异序对:Nd1=45×(40+28)+25×28=3760女:同序对:Ns2=65×(55+32)+57×32=7479异序对:Nd2=33×(57+30)+55×30=4521与(1)的计算结果相比可知:在男性青年人中,依据文化程度来预测其社区参与程度可以减少47%的误差,在女性青年人中,依据文化程度来预测其社区参与程度可以减少25%的误差。相比女性青年而言,男性青年的文化程度与其社区参与程度的相关性更强,也就是说,性别对青年人的社区参与程度是有影响的。(3)通过计算可知:(4)控制性别变量之后计算的偏相关系数与原相关系数相近,说明青年人的文化程度与其社区参与程度之间的关系可能是真实存在的。93 练习题解答:第二章随机现象与基础概率2.某地15名13岁男童身高(x1,cm),体重(x2,kg)及肺活量(y,L)的实测数据文件如下表。x1x2y1135.1032.0017502139.9030.4020003163.6046.2027504146.5033.5025005156.2037.1027506156.4035.5020007167.8041.5027508149.7031.0015009145.0033.00250010148.5037.20225011165.5049.50300012135.0027.60125013153.3041.00275014152.0032.00175015160.5047.202250(1)试计算变量间的积矩相关系数。(2)当体重(x2)被控制时,计算身高(x1)与肺活量(y)的偏相关系数,并作假设检验(α=0.05)。解:(1)=2275,=554.7,=33750,=346535.2,=21142.45,=79812500,=84946.2,=5171300,=1285400根据积距系数的计算公式:可得:=0.842=0.691=0.756(2)偏相关系数rp(简写为rxy·1或rp)计算公式为:93 练习题解答:第二章随机现象与基础概率将(1)所得相关系数结果代入rp公式可得:=0.154假设检验:研究假设H1:总体中的≠0虚无假设H0:总体中的=0由于样本中rp=0.154,n=15,k=1,那么,由df1=1df2=n-k-2可得:df1=1df2=n-k-2=12F=0.29当显著性水平α=0.05时,从附录F分布中可以查到,df1=1,df2=12时的临界值为F=4.75,检验统计值F=0.29<4.75,在接受域内,所以接受虚无假设,拒绝研究假设,即在0.05的显著性水平下,控制了体重后,身高与肺活量的相关关系在总体中不存在。3.第十一章练习第1题新老员工对公司福利满意程度的研究中,研究人员认为新老员工对公司福利的满意度可能是通过文化程度影响的,也就是文化程度越高,对公司的福利要求越高,因而对公司的福利就越不满意,因此控制了文化程度之后分析新老员工对公司福利的满意度,发现偏相关系数λp=0.112,该相关系数是否达到了0.05的显著性水平?解:控制文化程度(高、低)之后新老员工满意度情况如下表所示:老员工新员工合计高低高低满意60302510125一般3020103090不满意3394120103合计93897660318下表可转化为:93 练习题解答:第二章随机现象与基础概率老员工新员工高低合计高低合计满意603090251035一般302050103040不满意33942412061合计93891827660136在控制文化程度时测量新老员工满意度的偏相关分析中涉及到的变量都是定类或定序变量,根据详析分析的特点,可以通过计算每一个分表的结果来反映总体的情况。可参考李沛良.社会研究的统计应用.社会科学文献出版社.2002年版.P240-241先来计算老员工满意度的相关系数:新员工满意度的相关系数偏相关系数:下面来对这一结果进行检验。首先分别来计算每一个分表的值。,自由度df=df总+df新=4自由度为4,>18.465时,得到这一结果的概率小于0.001,所以可以判断此题中的偏相关系数达到了0.05的显著性水平。4.根据武汉市初中生日常行为状况调查的数据(data9),运用SPSS分析初中生的学习成绩(目前在班级中的水平C2)与参加课外活动时间状况(C4)的关系。在0.05的显著性水平下,这种关系在总体中是否真实存在?控制年级(A3)因素之后,两者之间的关系是否还存在?解:《武汉市初中生日常行为状况调查问卷》:C2你的成绩目前在本班大致属于1)上等2)中上等3)中等4)中下等5)下等93 练习题解答:第二章随机现象与基础概率C4你有充足的时间进行自己喜欢的课外活动吗1)非常充足2)比较充足3)一般4)不太充足5)很不充足A3你的年级1)初一2)初二3)初三(1)SPSS操作的步骤如下:点击Analyze→Correlate→Bivariate因为后面要计算偏相关系数,SPSS给出的偏相关系数的结果主要针对的是数值型变量的结果,为了统计结果的统一,这里也采用r系数进行计算,把定序变量看作定距变量。如果只是简单的进行相关计算,最好采用Gamma系数。打开如图13-1(练习)所示的对话框。分别将“成绩目前在本班的大致层次(c2)”和“参加课外活动的时间状况(c4)”变量放在Variables框中。选择皮尔逊相关系数r和斯皮尔曼的rho系数。选择单尾检验。图13-1(练习)BivariateCorrelations对话框单点OK按钮,提交运行,输出如表13-1(练习)和表13-2(练习)所示的结果。表13-1(练习)Person相关结果表13-2(练习)Spearman相关结果93 练习题解答:第二章随机现象与基础概率、表13-1(练习)是皮尔逊相关系数的结果,从中可以看出,目前成绩(c2))和参加课外活动的时间(c4)情况的相关系数是0.092,P值为0.018,小于0.05,通过了显著性检验。从表13-2(练习)可以看出目前成绩和参加课外活动时间状况的Spearman系数是0.087,p值为0.024,小于0.05,因此可以得出结论,在0.05的显著性水平下,目前成绩和课外活动参加时间的关系在总体中可能也存在。(2)控制年级(a3)变量计算“成绩目前在本班的大致层次(c2)”和“参加课外活动的时间状况(C4)”的相关系数,SPSS的操作步骤如下:依次点击Analyze→Correlate→Partial,打开如图13-3(练习)所示的对话框。将年级(a3)放置在Controllingfor栏中,将“成绩目前在本班的大致层次(c2)”和“参加课外活动的时间状况(C4)”放置在Variables栏中,选择单尾检验(假定两变量呈正相关)。图13-2(练习)PartialCorrelation对话框点击OK按钮,输出如表13-3(练习)所示的结果。表13-3(练习)相关测测量结果从表13-3(练习)中可以看出,控制年级(a3)后“成绩目前在本班的大致层次(c2)”和“参加课外活动的时间状况(c4)”93 练习题解答:第二章随机现象与基础概率的相关系数为0.085,P=0.026<0.05,偏相关系数也通过0.05的显著性检验,这说明目前成绩和参加课外活动时间的关系不受年级因素的影响。5.根据武汉市初中生日常行为状况调查的数据(data9),运用SPSS分析母亲的文化程度(A8)与中学生是否独生子女(A4)之间的关系。在0.05的显著性水平下,这种关系在总体中是否真实存在?这种关系是否会受到初中生性别(A1)的影响?解:《武汉市初中生日常行为状况调查问卷》:A1你的性别1)女2)男A4你是独生子女吗1)是2)不是A8父母受教育程度(此题需分别填写父母亲的情况,将适合的答案序号写在横线上)父亲的受教育程度:___________母亲的受教育程度:___________1)初中及以下2)高中,中专及职业学校3)大专,本科4)硕士、博士研究生及以上(1)分析“母亲的文化程度(A8)”与“初中生是否独生子女(A4)”两个变量的相关关系的操作步骤如下:首先对是否独生子女变量取值作虚拟变量处理:1=独生子女,0=非独生子女。点击Analyze→Correlate→Bivariate打开如图13-3(练习)所示的对话框。分别将“母亲的文化程度(a82)”和“是否独生子女(a4)”变量放入Variables框中。选择皮尔逊相关系数r原理同第2题。,选择单尾检验。图13-3(练习)Correlate对话框单点OK,提交运行,SPSS输出如表13-4的结果。表13-4(练习)相关分析结果93 练习题解答:第二章随机现象与基础概率从表13-4(练习)的结果可以看出,相关系数是0.356,说明母亲的文化程度与是否是独生子女存在相关关系,母亲文化程度越高,孩子越可能是独生子女。P值为0.000,小于0.05,这说明调查样本中的相关关系,在总体中可能也存在。(2)控制“性别(a1)”计算“母亲的文化程度(a82)”和“是否独生子女(a4)”的相关系数,SPSS的操作步骤如下:依次点击Analyze→Correlate→Partial,打开如图13-3(练习)所示的对话框。将“性别(a1)”放置在Controllingfor栏中,将“母亲的文化程度(a82)”和“是否独生子女(a4)”放置在Variables栏中,选择单尾检验(One-tailed)。图13-5(练习)PartialCorrelation对话框点击OK按钮,输出如表13-5(练习)所示的结果。表13-5(练习)相关测量结果从表13-5(练习)中可以看出,控制“性别(a1)”后“母亲的文化程度(a82)”和“是否独生子女(a4)”的偏相关系数为0.3560,与没有控制“性别(a1)”时,“母亲的文化程度(a82)”和“是否独生子女(a4)”93 练习题解答:第二章随机现象与基础概率的相关系数一样,因此可以认为,“母亲的文化程度(a82)”和“是否独生子女(a4)”的相关关系不会因孩子的性别而不同。第十四章多元回归分析练习题:1.为了研究某社区1500名居民的受教育年数(X)与收入(Y)的关系,随机抽取了20人进行调查,得到下表的结果。个案编号12345678910受教育年数(X)1091215149165613收入(Y)1000100013002000190090021006008001400个案编号11121314151617181920受教育年数(X)19121875102011812收入(Y)3200150030008005001100350013009501100根据统计结果,(1)画出散点图;(2)X与Y之间是否呈直线关系?求出回归方程。(3)计算X与Y的决定系数。(4)在0.05的显著性水平下,作回归系数的显著性检验。解:(1)散点图:(2)从散点图可以看出,受教育年数与收入呈现出线性相关的关系;根据上表数据计算可得:,,,,,93 练习题解答:第二章随机现象与基础概率,,,根据一元线性回归方程回归直线的斜率b和截距a的计算公式可知:所以,回归方程是=-646.66+185.64X(3)决定系数(4)回归系数的检验:研究假设:(即)虚无假设:(即)用F检验法:df1=k=1df2=n-k-1=20-1-1=18其中,k表示自变量的个数,将代入上式可得:在0.05的显著性水平下,从F分布表可知df1=1,df2=18时。否定域是:F≥4.41。因为F=182在否定域内,所以可否定虚无假设,接受研究假设。研究结论是:在0.05的显著性水平下,该社区居民的受教育年数(X)与收入(Y)呈线性相关的,且教育年数每增加一年,收入增加185.64元。2.子女的受教育水平(Y)往往受到父母的受教育水平(X1,X2)以及家庭经济条件(X3)的影响,我们对某单位10个人进行了调查,得到如下表格:被调查者受教育年数(Y)父亲受教育年数(X1)母亲受教育年数(X2)家庭经济条件(X3)11598中21289中3151211上93 练习题解答:第二章随机现象与基础概率4191512上5975中61088下7967中81499下9161012中10181412上根据数据统计:(1)求出各X变量的回归系数,写出回归方程。(2)计算X与Y的决定系数。解:(1)变量X3为定序变量,对其重新赋值:“上”=3,“中”=2,“下”=1。计算各个变量之间的积距相关系数为:=0.920,=0.886,=0.600,=1,==0.848,==0.719,==0.545将之代入下列方程组:计算可得:=0.672,=0.360,=-0.079根据上表计算可得:=13.70,=3.59;=9.80,=2.97;=9.30,=2.41;=2.10,=0.74。将之代入公式:93 练习题解答:第二章随机现象与基础概率可得:=1.54,=0.81,=0.54,=-0.38(2)决定系数:3.根据武汉市初中生日常行为状况调查的数据(data9),用SPSS分析初中生平时每天做作业时间(),看电视时间(),睡觉时间()对其目前学习成绩的影响(目前成绩在班级中的大致水平),并对结果进行解释。解:《武汉市初中生日常行为状况调查问卷》:C2你的成绩目前在本班大致属于1)上等2)中上等3)中等4)中下等5)下等C11请你根据自己的实际情况,估算一天内在下面列出的日常课外活动上所花的时间大约为(请填写具体时间,没有则填“0”)平时(非节假日):1)做作业_______小时2)看电视_______小时8)睡觉_______小时“C2你的成绩目前在本班大致属于?”这个题目的选项在data9中,“上等”赋值为“1”,“中上等”赋值为“2”,“中等”赋值为“3”,“中下等”赋值为“4”,“下等”赋值为“5”,为了便于分析,通过Transform-RecodeintoDifferentVariables命令将“下等”赋值为“1”,“中下等”赋值为“2”,“中等”赋值为“3”,“中上等”赋值为“4”,“上等”赋值为“5”,生成新变量“成绩层次(cjcc)”。SPSS的操作步骤如下:打开武汉市初中生日常行为状况调查的数据data9。依次点击Analyze→Regression→Linear,打开如图14-1(练习)所示的对话框。93 练习题解答:第二章随机现象与基础概率图14-1(练习)Linear回归主对话框将自变量“做作业时间c11a1”、“看电视时间c11a2”和“睡觉时间c11a8”放在Independent(s)框口,将因变量“成绩层次(cjcc)”放置在Dependent框中。Method栏中选择强制进入法Enter。点击按钮OK,SPSS依次输出下列结果。表14-1(练习)纳入线性回归模型的变量表14-2(练习)模型概况表14-3(练习)方差分析表93 练习题解答:第二章随机现象与基础概率表14-4(练习)回归系数结果从表14-1(练习)可以看出,变量进入分析选择的是强制进入法(Enter),“做作业时间c11a1”、“看电视时间c11a2”和“睡觉时间c11a8”三个变量都进入了模型。表14-2(练习)显示的是模型概况。结果显示,相关系数为0.143,决定系数为0.02,调整后的决定系数为0.015,也就是说这三个变量可以解释学生成绩层次的1.5%,模型的拟合度不高。表14-3(练习)显示的是模型的方差检验结果。表14-4(练习)是回归系数的结果,可以看出,引进的三个自变量中对因变量成绩层次有影响的只有平时看电视的时间(p=0.004<0.05),其他两个变量对成绩层次的影响不显著。因此,线性回归模型可表示为=2.921-0.156x2或=-0.129。4.以下是对青年白领工作/家庭冲突(WFC)的影响因素进行多元线形回归分析的结果,请根据所学知识对其进行分析说明。93 练习题解答:第二章随机现象与基础概率表1模型概况表2回归系数表Coefficients(a)UnstandardizedCoefficientsStandardizedCoefficientsBetatSig.ModelBStd.Error7(Constant)2.673.4675.727.000加班情况.147.023.3966.548.000文化程度-.109.029-.208-3.810.000每天工作时间.071.035.1232.063.040性别(1=男)*-.253.084-.166-3.025.003婚姻观:孩子会影响工作.123.040.1683.087.002单位支持工作自主性-.202.083.061.042-.194.112-3.3212.006.001.046aDependentVariable:工作/家庭冲突*参照对象:0=女解:这两个表反映的是线性回归分析的结果。表1是回归分析模型的概况,因为采用的是逐步回归的方法,所以出现了7个模型,每个模型对引进一个变量后模型的解释力等信息进行了说明。从表1下面的注解可以看出因变量为青年白领工作/家庭冲突(WFC),还可以看出每一个模型中自变量的个数。RSquareChange反映了每引进一个自变量,模型解释力的变化情况,从这个表中可以看出,加班情况、文化程度、每天工作时间等7个变量可以解释青年白领工作/家庭冲突的34.1%(决定系数RSquare为0.361,调整后的决定系数为0.341)。93 练习题解答:第二章随机现象与基础概率表2显示的是第7个模型中各自变量对因变量的影响情况,因为采用的是逐步回归的方法,所以只把对因变量有影响的变量引进了模型(sig小于0.05)。从各自变量影响力的大小来看,加班对青年白领工作家庭冲突的影响最大(标准回归系数为0.396),表示每多加班一天工作/家庭冲突程度就可能会增加0.396。根据标准回归系数的大小可以看出各自变量影响力的大小。再者,从各变量影响的方向来看,加班情况,每天工作时间和孩子会影响工作的婚姻观都会加大青年白领的工作/家庭冲突,而文化程度每提高一个等级,青年白领的工作/家庭冲突可以降低0.208,单位为青年白领的工作和家庭问题提供支持(比如请假方便程度,允许员工工作时适当处理家庭事务等)都会减轻青年白领的工作/家庭冲突。从性别角度来看,男性的工作/家庭冲突程度比女性要低0.166。93'