• 1.30 MB
  • 2022-04-22 11:48:38 发布

统计学spss课后题答案.doc

  • 36页
  • 当前文档由用户上传发布,收益归属用户
  1. 1、本文档共5页,可阅读全部内容。
  2. 2、本文档内容版权归属内容提供方,所产生的收益全部归内容提供方所有。如果您对本文有版权争议,可选择认领,认领后既往收益都归您。
  3. 3、本文档由用户上传,本站不保证质量和数量令人满意,可能有诸多瑕疵,付费之前,请仔细先通过免费阅读内容等途径辨别内容交易风险。如存在严重挂羊头卖狗肉之情形,可联系本站下载客服投诉处理。
  4. 文档侵权举报电话:19940600175。
'实操训练答案目录第一章1第二章2第三章3第四章4第五章8第六章11第七章22第八章27第九章32第十章40 第一章(一)思考题略(二)练习题1.(1)定类变量(2)定类变量(3)定序变量(4)数值型变量(5)数值型变量2.A3.B4.ABCD5.DA6.AB(三)操作题略 第二章(一)思考题略(二)练习题1.BDAC2.C3.D4.D5.A(三)操作题1.见SPSS文件2.1.sav。2.略。3.略。4.略。 第三章1.2011年人均国内生产总值(agdp2011),排在前五位的是天津、上海、北京、江苏、浙江;排在后五位的是广西、西藏、甘肃、云南、贵州。.2011年国内生产总值(gdp2011),在东部各省市里,排在第1位的是广东,排在最后1位的分别是海南;在中部各省市里,排在第1位的是河南,排在最后1位的分别是吉林;在西部各省市里,排在第1位的是四川,排在最后1位的分别是西藏。2.见SPSS文件3.2.sav。3.见SPSS文件3.3.sav。4.A老师提供的管理学成绩见SPSS文件3.4-1.sav,B老师提供的经济学成绩见SPSS文件3.4-2.sav,合并后的文件见SPSS文件3.4.sav。5.见SPSS文件3.5.sav。6.见SPSS文件3.6.sav。7.见SPSS文件3.7.sav。8.见SPSS文件3.8.sav。9.两门课程都在80分以上的共4人,见SPSS文件3.5.sav。10.管理学成绩在80-89,经济学成绩在90分以上的只有1人,见SPSS文件3.6.sav。 第四章1.由于变量品牌(brand)是定类变量,所以分别用众数和异众比来描述其集中趋势和离散趋势。由分析结果可知,众数是B,异众比是(800-279)/800=65.1%。统计量品牌N有效800缺失0众数2品牌频率百分比有效百分比累积百分比有效A16420.520.520.5B27934.934.955.4C11013.813.869.1D556.96.976.0E19224.024.0100.0合计800100.0100.02.由于变量《统计学》这门课程难吗(v2.4)是定序变量,所以用众数,中位数,四分位数来描述其集中趋势,用四分位差来描述其离散趋势。由分析结果可知,四分位差是3-2=1。统计量您认为《统计学》这门课程难吗?N有效255缺失0中值3.00众数3百分位数252.00503.00753.00您认为《统计学》这门课程难吗?频率百分比有效百分比累积百分比有效非常难103.93.93.9难9537.337.341.2一般13854.154.195.3简单83.13.198.4 很简单41.61.6100.0合计255100.0100.03.录入后的数据见SPSS文件4.3.sav。(1)数据中只有定类和定序变量,对于定类变量可以用用众数和异众比来描述其集中趋势和离散趋势。对于定序变量,可以众数,中位数,四分位数来描述其集中趋势,用四分位差来描述其离散趋势。(2)可以用条形图或饼图。先对数据进行加权,然后将中国队筛选出来,再通过频数分析做出条形图。(3)可以用条形图或饼图。先对数据进行加权,然后将中国队筛选出来,再通过频数分析做出饼图。(4)可以用条形图或饼图。先对数据进行加权,再通过频数分析做出饼图。 4.录入后的数据见SPSS文件4.4.sav。采用基本的描述性统计可得如下结果,所以四分位差为391.25-360.25=31。还可以通过基本的描述性统计计算Z分数,可知368的标准分数为-0.08618。统计量销售额N有效30缺失0均值370.77中值372.50众数238a标准差32.104方差1030.668偏度-2.371偏度的标准误.427峰度9.677峰度的标准误.833百分位数25360.2550372.5075391.25a.存在多个众数。显示最小值5.使用探索性分析完成本题,结果见SPSS文件4.5.spv。 第五章(一)思考题略(二)练习题1.A2.B3.C4.绩效得分,连续的5.测量得分,连续的6.录入后的数据见SPSS文件5.6.sav,将变量概率(p)作为权重变量进行加权,再通过频数分析绘制直方图如下所示。7.使用探索分析绘制正态概率图,的如下结果,可知两个变量都是非正态分布。正态性检验Kolmogorov-SmirnovaShapiro-Wilk统计量dfSig.统计量dfSig.每股收益(元).182923.000.759923.000净资产收益率(%).295923.000.438923.000a.Lilliefors显著水平修正sig的值小于0.05说明不服从正态分布 8.第一步,先列出样本容量为3的所有样本。组合中位数1,3,531,3,731,3,931,5,751,5,951,7,973,5,753,5,953,7,975,7,97第二步,统计中位数出现的频数。中位数频数概率333/10=0.3544/10=0.4733/10=0.3 第三步,数据录入后,结果见SPSS文件5.8.sav,将变量频率(f)作为权重变量进行加权,再通过频数分析绘制直方图如下所示。 第六章(一)思考题略(二)练习题1.A2.B3.A4.B5.B(三)操作题1.采用平均数分析过程,计算平均数。报告CEO年度报酬CSRC行业分类均值N标准差农林牧渔359286.7225213764.287采掘业590242.1156317833.666制造业519896.111644465024.395电力、煤气及水的生产和供应业453231.41196225904.480建筑业697179.70100405924.285交通运输、仓储业600931.31336354617.014信息技术业630815.33350408263.810批发和零售贸易648283.84560453729.226金融、保险业830874.98585665377.768房地产业459350.44280272179.784社会服务业594574.00110392970.868传播与文化产业719317.65516819097.617总计607878.214758524319.837(2)报告CEO年度报酬地区均值N标准差东部658988.062832465035.082中部550343.11747727166.242西部487307.09780467696.544东北588532.58399524062.008总计607878.214758524319.837 (3)报告CEO年度报酬地区CSRC行业分类均值N标准差东部农林牧渔335600.0011168289.667采掘业704364.9224358745.650制造业606842.92795495823.958电力、煤气及水的生产和供应业582996.9576202372.197建筑业821714.3165434904.725交通运输、仓储业681862.60216332732.075信息技术业681380.70266413654.402批发和零售贸易707141.89376475438.125金融、保险业812714.97405571359.283房地产业493577.19170244343.839社会服务业751925.0044556560.314传播与文化产业585784.38384415430.058总计658988.062832465035.082中部农林牧渔447450.00463956.053采掘业596775.0016177162.560制造业424178.05354275855.860电力、煤气及水的生产和供应业441421.8936244512.351建筑业569202.671528109.826交通运输、仓储业277290.0060136126.901信息技术业456883.3342247969.443批发和零售贸易508375.0064390998.282金融、保险业1277540.00451133584.826房地产业234500.003051653.688社会服务业478446.6733147062.455传播与文化产业1593839.75482084056.882总计550343.11747727166.242西部农林牧渔272696.008169525.332采掘业412525.0016295132.430制造业443455.90375545421.194电力、煤气及水的生产和供应业313592.3152151225.812建筑业485900.0015182463.284交通运输、仓储业461280.0030208523.354 信息技术业351733.3321225647.292批发和零售贸易490244.4472203672.707金融、保险业713085.7163531329.284房地产业489642.8670352607.981社会服务业566350.0022184389.404传播与文化产业923466.6736550985.810总计487307.09780467696.544东北农林牧渔659600.002567806.745制造业465117.50120292355.478电力、煤气及水的生产和供应业385237.5032194627.637建筑业96000.005.000交通运输、仓储业805160.0030471041.244信息技术业617266.6721533730.877批发和零售贸易610833.3348532322.864金融、保险业756925.0072771346.882房地产业340000.0010.000社会服务业370000.0011.000传播与文化产业759950.0048644591.415总计588532.58399524062.008总计农林牧渔359286.7225213764.287采掘业590242.1156317833.666制造业519896.111644465024.395电力、煤气及水的生产和供应业453231.41196225904.480建筑业697179.70100405924.285交通运输、仓储业600931.31336354617.014信息技术业630815.33350408263.810批发和零售贸易648283.84560453729.226金融、保险业830874.98585665377.768房地产业459350.44280272179.784社会服务业594574.00110392970.868传播与文化产业719317.65516819097.617总计607878.214758524319.8372.(1)首先提出原假设和备择假设:(工作时间是每周40个小时);(工作时间不是每周40个小时)。(2)采用单样本T检验,通过SPSS操作得到如下图表: 单个样本统计量N均值标准差均值的标准误工时3046.579.3871.714单个样本检验检验值=40TdfSig.(双侧)均值差值差分的95%置信区间下限上限工时3.83229.0016.5673.0610.07假定给定的显著性水平是0.05,由t值是3.832,值=0.001<0.05,拒绝原假设,认为工作时间与每周40个小时在统计上有显著差异,由样本均值是46.57,我国员工工作时间远超过40小时。3.(1)①首先提出原假设和备择假设:原假设(国有和非国有上市公司CEO薪酬没有显著差异);备择假设(国有和非国上市公司CEO薪酬有显著差异)。②采用独立样本T检验,通过SPSS操作得到如下图表:组统计量最终控制人类型N均值标准差均值的标准误CEO年度报酬dimension1国有633549411.14455164.42618091.162非国有359593606.05521538.52927525.751独立样本检验方差方程的Levene检验均值方程的t检验FSig.tdfSig.(双侧)均值差值标准误差值差分的99%置信区间下限上限CEO年度报酬假设方差相等8.864.0031.393990.16444194.9131728.74-37690.764126080.59假设方差不相等1.342663.92.18044194.9132938.69-40894.108129283.93首先根据方差方程的Levene检验判断国有CEO报酬和非国有CEO报酬方差是否相等,提出原假设是方差相等,备择假设是方差不等。根据F值=8.864和值=0.003<0.01(<,拒绝原假设,接受备择假设),判断出方差不相等。再根据第二行数据中判断两组均值是否相等。第二行数据中的t值=1.342,值=0.180>0.01,则不拒绝原假设,认为国有和非国有上市公司CEO薪酬没有显著差异。 两者成绩平均数之差的99%的置信区间是-40894.108~129283.93。(2)①首先提出原假设和备择假设:原假设(本科及以上和本科以下教育水平CEO薪酬没有显著差异);备择假设(本科及以上和本科以下教育水平CEO薪酬有显著差异)。②采用独立样本T检验,通过SPSS操作得到如下图表:组统计量CEO教育水平N均值标准差均值的标准误CEO年度报酬dimension1>=3872581229.72483684.70516379.631<3120450412.54441372.02540291.569独立样本检验方差方程的Levene检验均值方程的t检验FSig.tdfSig.(双侧)均值差值标准误差值差分的99%置信区间下限上限CEO年度报酬假设方差相等.239.6252.806990.005130817.17846618.45210504.066251130.289假设方差不相等3.008160.982.003130817.17843493.71017441.512244192.843首先根据方差方程的Levene检验判断本科及以上CEO报酬和本科以下CEO报酬方差是否相等,则原假设是方差相等,备择假设是方差不等。根据F值=0.239和值=0.625>0.01,判断出方差相等。再根据第一行数据中判断两组均值是否相等。第一行数据中的t值=2.806,值=0.005<0.01,则拒绝原假设,认为本科及以上CEO报酬和本科以下CEO报酬方差存在显著差异。两者成绩平均数之差的99%的置信区间是10504.066~251130.289。4.①首先提出原假设和备择假设:原假设(2011与2007年人均国内生产总值没有显著差异);备择假设(2011与2007年人均国内生产总值有显著差异)。②采用配对样本T检验,通过SPSS操作得到如下图表:成对样本统计量均值N标准差均值的标准误对12011年人均国内生产总值(元)39136.163118614.0943343.1902007年人均国内生产总值(元)22221.843113787.1352476.243 成对样本相关系数N相关系数Sig.对12011年人均国内生产总值(元)&2007年人均国内生产总值(元)31.964.000成对样本检验成对差分tdfSig.(双侧)均值标准差均值的标准误差分的95%置信区间下限上限对12011年人均国内生产总值(元)-2007年人均国内生产总值(元)16914.3236474.4931162.85314539.45919289.18614.54630.000给定的显著性水平是0.05,t值=14.546,值=0<0.05,因此拒绝原假设,认为2011与2007年人均国内生产总值有显著差异,两者成绩平均数之差的95%的置信区间是14539.459~19289.186。5.录入后的数据见SPSS文件6.5.sav。①首先提出原假设和备择假设:原假设(喝茶前后体重没有显著差异);备择假设(喝茶前后体重有显著差异)。②采用配对样本T检验,通过SPSS操作得到如下图表: 成对样本统计量均值N标准差均值的标准误对1喝后69.92365.623.937喝前89.31365.296.883成对样本相关系数N相关系数Sig.对1喝后&喝前36-.056.747成对样本检验成对差分tdfSig.(双侧)均值标准差均值的标准误差分的95%置信区间下限上限对1喝后-喝前-19.3897.9361.323-22.074-16.704-14.65835.000给定的显著性水平是0.05,t值=14.546,值=0<0.05,因此拒绝原假设,认为喝茶前后体重有显著差异,由于喝茶前体重的平均数远大于喝茶后体重的平均数,因此认为该减肥茶有较好的减肥效果。 第七章(一)思考题略(二)操作题1.①首先提出检验假设:原假设:专业方向与《统计学》学习难度之间不存在相关关系;备择假设:专业方向与《统计学》学习难度之间存在相关关系。②采用交叉表分析及卡方检验得到如下图表,由=51.926,渐进的=0<0.05,则拒绝原假设,认为专业方向与《统计学》学习难两个变量之间有相关关系,即不同专业方向的学生,其《统计学》学习难度有显著差异。您认为《统计学》这门课程难吗?*专业方向交叉制表专业方向合计人力资源管理国际连锁经营管理商务助理城市物流物业管理出版营销您认为《统计学》这门课程难吗?非常难计数05102210您认为《统计学》这门课程难吗?中的%.0%50.0%10.0%.0%20.0%20.0%100.0%难计数2972012141395您认为《统计学》这门课程难吗?中的%30.5%7.4%21.1%12.6%14.7%13.7%100.0%一般计数60202011261138您认为《统计学》这门课程难吗?中的%43.5%14.5%14.5%8.0%18.8%.7%100.0%简单计数5000308您认为《统计学》这门课程难吗?中的%62.5%.0%.0%.0%37.5%.0%100.0%很简单计数1110014您认为《统计学》这门课程难吗?中的%25.0%25.0%25.0%.0%.0%25.0%100.0%合计计数953342234517255 您认为《统计学》这门课程难吗?中的%37.3%12.9%16.5%9.0%17.6%6.7%100.0%卡方检验值df渐进Sig.(双侧)Pearson卡方51.926a20.000似然比57.41620.000线性和线性组合7.2281.007有效案例中的N255a.18单元格(60.0%)的期望计数少于5。最小期望计数0.27。观察卡方检验表的注释发现,有60%的单元格的期望频数都小于5,所以该结果是无效的,需要进行变量值的合并。将“您认为《统计学》这门课程难吗?”的变量值“非常难”和“难”合并,定义为“难”,将变量值“一般”“简单”“很简单”合并,定义为“不难”,再进行交叉分析和卡方检验,得到如下结果: 统计学学习难度*专业方向交叉制表计数专业方向合计人力资源管理国际连锁经营管理商务助理城市物流物业管理出版营销统计学学习难度1.002912211216151052.0066212111292150合计953342234517255卡方检验值df渐进Sig.(双侧)Pearson卡方23.393a5.000似然比24.4075.000线性和线性组合10.2051.001有效案例中的N255a.0单元格(.0%)的期望计数少于5。最小期望计数为7.00。所以,卡方值是23.393,P<0.05,则拒绝原假设,认为学习难度和专业不存在相关关系。2.录入后的数据见SPSS文件7.2.sav。采用交叉表分析、卡方检验及等级相关分析所得结果见SPSS文件7.2.spv。所以独立性的卡方值是8.075,性别与最高文凭之间的相关系数是0.003。3.录入后的数据见SPSS文件7.3.sav。采用等级相关分析所得结果如下表,可见工作压力对满意度影响较低,相关系数-0.182,值=0<0.05,说明两者的相关性较弱,且在统计上是显著的。对称度量值渐进标准误差a近似值Tb近似值Sig.按顺序γ-.182.049-3.670.000有效案例中的N411a.不假定零假设。b.使用渐进标准误差假定零假设。4.录入后的数据见SPSS文件7.4.sav。采用Kappa分析所得结果如下表,,值=0<0.05,说明两个评委打分结果的一致性较差,且Kappa系数在统计上是显著的。对称度量值渐进标准误差a近似值Tb近似值Sig.一致性度量Kappa.213.0396.133.000有效案例中的N513a.不假定零假设。b.使用渐进标准误差假定零假设。 第八章(一)思考题略(二)操作题1.采用方差分析,结果见SPSS文件8.1.spv。由此可知,东部、中部、西部三大地区的2011年人均国内生产总值(agdp2011),2011城镇居民家庭人均可支配收入(ui2011)都存在显著差异。2.(1)采用独立样本T检验得如下表格,可见不同性别的上市公司CEO年度报酬平均数不存在显著差异。组统计量CEO性别N均值标准差均值的标准误CEO年度报酬dimension1男957561917.58476706.40515409.730女35660762.86573399.33296922.177 独立样本检验方差方程的Levene检验均值方程的t检验FSig.tdfSig.(双侧)均值差值标准误差值差分的95%置信区间下限上限CEO年度报酬假设方差相等3.501.062-1.196990.232-98845.27882665.381-261064.7763374.21假设方差不相等-1.00735.740.321-98845.27898139.534-297931.80100241.25(2)采用方差分析得如下表格,不同教育水平的上市公司CEO年度报酬平均数存在显著差异。ANOVACEO年度报酬平方和df均方F显著性组间3.745E1249.362E114.106.003组内2.250E149872.280E11总数2.288E14991 3.录入后的数据见SPSS文件8.3.sav。①首先提出检验假设:(三支队之间的射箭成绩无显著差异);不全相等(三支队之间的射箭成绩有显著差异)。②采用方差分析得如下表格,由值=0.025,值=0.975>0.05,不拒绝原假设,认为三支队之间的射箭成绩没有显著差异。方差齐性检验成绩Levene统计量df1df2显著性1.176245.318ANOVA成绩平方和df均方F显著性组间.0562.028.025.975组内49.194451.093总数49.250474.录入后的数据见SPSS文件8.4.sav。①首先提出检验假设::不同广告方案下的销售量平均数没有显著差异;:不同广告媒体下的销售量平均数没有显著差异;:广告方案和广告媒体之间没有对销量产生交互作用。:不同广告方案下的销售量平均数有显著差异;:不同广告媒体下的销售量平均数有显著差异;:广告方案和广告媒体之间对销量有交互作用。②采用双因素方差分析,得如下结果,根据F值和P值,可知不同广告媒体下的销售量平均数没有显著差异;不同广告方案下的销售量平均数有显著差异;广告方案和广告媒体之间没有对销量产生交互作用。主体间效应的检验因变量:销售量源III型平方和df均方FSig.校正模型448.000a589.6005.600.029截距3072.00013072.000192.000.000media48.000148.0003.000.134project344.0002172.00010.750.010media*project56.000228.0001.750.252误差96.000616.000 总计3616.00012校正的总计544.00011a.R方=.824(调整R方=.676)5.录入后的数据见SPSS文件8.5.sav。①首先提出检验假设::不同工作年限的销售量平均数没有显著差异;:不同职位的销售量平均数没有显著差异;:工作年限和职位之间没有对满意度产生交互作用。:不同工作年限的销售量平均数有显著差异;:不同职位下的销售量平均数有显著差异;:工作年限和职位之间对满意度有交互作用。②采用双因素方差分析,得如下结果,根据F值和P值,可知不同工作年限的满意度有显著差异;不同职位的满意度没有显著差异;工作年限和职位之间对满意度没有交互作用。 主体间效应的检验因变量:满意度打分源III型平方和df均方FSig.校正模型31.000a83.8753.875.030截距1058.00011058.0001058.000.000year24.333212.16712.167.003occup5.33322.6672.667.123year*occup1.3334.333.333.849误差9.00091.000总计1098.00018校正的总计40.00017a.R方=.775(调整R方=.575) 第九章(一)思考题略(二)操作题1.录入后的数据见SPSS文件9.1.sav。(1)做出散点图,如下图所示。由图可知,价格与需求量之间应该存在线性关系。(2)采用相关分析得到如下表格,由表可知,需求量与价格的Pearson相关系数为-0.926,且显著性水平为0,说明两个变量呈线性的负相关关系,且在统计上是显著的。相关性需求量价格需求量Pearson相关性1-.926**显著性(双侧).000N1414价格Pearson相关性-.926**1显著性(双侧).000N1414**.在.01水平(双侧)上显著相关。(3)建立一元线性回归模型,采用一元线性回归分析,得如下表格:R2=0.857,说明模型拟合较好;DW=1.230,说明残差的独立性欠佳;F=71.773,P=0,说明自变量与因变量呈显著线性关系;回归方程的常数项即截距为311.606,T检验值为12.048,显著性水平为0。回归方程的斜率为-0.052,t检验值为-8.472,显著性水平为0<0.05,拒绝原假设,认为自变量对因变量的影响是显著的。由此可以得出回归方程: 回归系数-0.052的含义是,价格每增加1元,需求量减少0.052个。若16期的产品定价是4800元,将4800代入回归方程,得到销售量是62。模型汇总b模型RR方调整R方标准估计的误差Durbin-Watson1.926a.857.84517.429441.230a.预测变量:(常量),价格。b.因变量:需求量Anovab模型平方和df均方FSig.1回归21803.503121803.50371.773.000a残差3645.42512303.785总计25448.92913a.预测变量:(常量),价格。b.因变量:需求量系数a模型非标准化系数标准系数tSig.B标准误差试用版1(常量)311.60625.86412.048.000价格-.052.006-.926-8.472.000a.因变量:需求量2.(1)做出散点图,如下图所示。由图可知,北京城镇居民家庭人均可支配收入(元)与城市人均居住使用面积(平方米)之间应该存在显著正线性关系。(2)采用相关分析得到如下表格,由表可知,需求量与价格的Pearson相关系数为0.985,且显著性水平为0,说明两个变量呈线性的正相关关系,且在统计上是显著的。相关性 城镇居民人均可支配收入(元)城市人均居住使用面积(平方米)城镇居民人均可支配收入(元)Pearson相关性1.985**显著性(双侧).000N3434城市人均居住使用面积(平方米)Pearson相关性.985**1显著性(双侧).000N3434**.在.01水平(双侧)上显著相关。(3)建立一元线性回归模型,采用一元线性回归分析,得如下表格:R2=0.971,说明模型拟合得很好;DW=0.224,说明残差不独立性;F=1063.901,P=0,说明自变量与因变量呈显著线性关系;回归方程的常数项即截距为8.766,T检验值为30.939,显著性水平为0。回归方程的斜率为0.001,T检验值为32.617,显著性水平为0<0.05,拒绝原假设,认为自变量对因变量的影响是显著的。由此可以得出回归方程:回归系数0.001的含义是,收入每增加1元,居住面积增加0.001平方米。若2012年的城镇居民家庭人均可支配收入是35000元,将35000代入回归方程,得到居住面积是43.766。模型汇总b模型RR方调整R方标准估计的误差Durbin-Watson1.985a.971.9701.2059.224a.预测变量:(常量),城镇居民人均可支配收入(元)。b.因变量:城市人均居住使用面积(平方米)Anovab模型平方和df均方FSig.1回归1546.99911546.9991063.901.000a残差46.531321.454总计1593.53033a.预测变量:(常量),城镇居民人均可支配收入(元)。b.因变量:城市人均居住使用面积(平方米)系数a模型非标准化系数标准系数tSig.B标准误差试用版1(常量)8.766.28330.939.000 城镇居民人均可支配收入(元).001.000.98532.617.000a.因变量:城市人均居住使用面积(平方米)3.录入后的数据见SPSS文件9.3.sav。建立二元线性回归模型,其中是虚拟变量,=0代表女性;=1代表男性。采用多元线性回归分析,得如下表格:R2=0.890,说明模型拟合得很好;DW=2.334,说明残差相互独立;F=48.539,P=0,说明自变量与因变量呈显著线性关系;回归方程的常数项即截距为2732.061,t检验值为11.597,显著性水平为0。工龄的回归系数为111.220,t检验值为1.543,显著性水平为0.149>0.05,不拒绝原假设,认为工龄对收入没有显著影响。性别的回归系数为458.684,t检验值为8.580,显著性水平为0<0.05,拒绝原假设,认为性对收入有显著影响。观察容差和VIF可知,回归模型不存在多重共线性。由此可以得出回归方程:回归系数458.684的含义是,在其他条件保持不变的情况下,男性员工比女性员工的收入多458.684,因此该行业的薪水有性别歧视。模型汇总b模型RR方调整R方标准估计的误差Durbin-Watson1.943a.890.87296.791582.334a.预测变量:(常量),性别,工龄(年)。b.因变量:月薪(元)Anovab模型平方和df均方FSig.1回归909488.4182454744.20948.539.000a残差112423.316129368.610总计1021911.73314a.预测变量:(常量),性别,工龄(年)。b.因变量:月薪(元)系数a模型非标准化系数标准系数tSig.共线性统计量B标准误差试用版容差VIF1(常量)2732.061235.58411.597.000工龄(年)111.22072.083.1581.543.149.8781.139性别458.68453.458.8778.580.000.8781.139a.因变量:月薪(元)4.录入后的数据见SPSS文件9.4.sav。 建立多元线性回归模型,,采用多元线性回归分析,得如下表格,根据回归系数的T值及P值可知,流通股比例,深成指,换手率对公司上市首日收益率的影响都不是显著的。模型汇总b模型RR方调整R方标准估计的误差Durbin-Watson1.540a.291.150.33436032.194a.预测变量:(常量),换手率,流通股比例,深成指。b.因变量:上市首日收益率Anovab模型平方和df均方FSig.1回归.6903.2302.056.149a残差1.67715.112总计2.36718a.预测变量:(常量),换手率,流通股比例,深成指。b.因变量:上市首日收益率系数a模型非标准化系数标准系数tSig.共线性统计量B标准误差试用版容差VIF1(常量)-1.056.823-1.284.219流通股比例1.1101.313.203.845.411.8191.222深成指.000.000.3631.277.221.5841.711换手率1.016.915.2971.110.284.6591.518a.因变量:上市首日收益率 第十章(一)思考题略(二)操作题1.①首先提出检验假设:原假设:五种不同文化程度者被抽中的概率一样;备择假设:五种不同文化程度者被抽中的概率不一样。②采用非参数检验之卡方检验,通过SPSS操作得到如下图表。由表可知,=26.900,自由度(df)为4,值为0。假定显著性水平是0.05,则,拒绝原假设,认为五种不同文化程度者被抽中的概率不一样。文化程度观察数期望数残差研究生及以上2340.0-17.0大学本科6140.021.0大专4040.0.0高中/中专5140.011.0初中及以下2540.0-15.0总数200检验统计量文化程度卡方26.900adf4渐近显著性.000a.0个单元(.0%)具有小于5的期望频率。单元最小期望频率为40.0。2.①首先提出检验假设:原假设:本地出生婴儿的性别比例与通常的男女性比例无显著差异;备择假设:本地出生婴儿的性别比例与通常的男女性比例有显著差异。②采用非参数检验之二项分布检验,通过SPSS操作得到如下图表,由表可知,值=0.031,假定显著性水平是0.05,则,拒绝原假设,认为本地出生婴儿的性别比例与通常的男女性比例有显著差异。二项式检验类别N观察比例检验比例渐近显著性(双侧) 性别组1男75.60.50.031a组2女50.40总数1251.00a.基于Z近似值。3.①首先提出检验假设:原假设:24个学生家庭收入部分排列呈随机分布;备择假设:24个学生家庭收入部分排列呈非随机分布。②采用非参数检验之游程检验,通过SPSS操作得到如下图表,由表可知,值=1.086,值=0.277,假定显著性水平是0.05,则,不拒绝原假设,认为24个学生家庭收入部分排列呈随机分布。游程检验年收入检验值a332083.33案例<检验值13案例>=检验值11案例总数24Runs数16Z1.086渐近显著性(双侧).277a.均值4.①首先提出检验假设:原假设:呼叫次数服从泊松分布;备择假设:呼叫次数不服从泊松分布。②采用非参数检验之单样本K-S检验,通过SPSS操作得到如下图表,由表可知,P=0.117>0.05,所以不拒绝原假设,认为呼叫次数服从泊松分布。单样本Kolmogorov-Smirnov检验电话呼叫次数N100Poisson参数a,b均值2.76最极端差别绝对值.119正.119负-.118Kolmogorov-SmirnovZ1.192渐近显著性(双侧).117a.检验分布为Poisson分布。b.根据数据计算得到。5.①首先提出检验假设:原假设:东部地区、中部地区和西部地区分公司销售额无显著差异; 备择假设:东部地区、中部地区和西部地区分公司销售额有显著差异。②采用非参数检验之多个独立样本的检验,通过SPSS操作得到如下图表,由表可知,卡方是35.183,P=0<0.05,所以拒绝原假设,认为东部地区、中部地区和西部地区分公司销售额有显著差异。秩地区N秩均值销售额东部地区1736.59中部地区1523.27西部地区147.86总数46检验统计量a,b销售额卡方35.183df2渐近显著性.000a.KruskalWallis检验b.分组变量:地区6.①首先提出检验假设:原假设:广告宣传前后的月销售量无显著差异;备择假设:广告宣传前后的月销售量有显著差异。②采用非参数检验之两个相关样本的检验,通过SPSS操作得到如下图表,由表可知,Z值=-0.119,P=0.905>0.05,所以不拒绝原假设,认为广告宣传前后的月销售量无显著差异。秩N秩均值秩和广告宣传后销量-广告宣传前销量负秩5a4.3021.50正秩4b5.8823.50结1c总数10a.广告宣传后销量<广告宣传前销量b.广告宣传后销量>广告宣传前销量c.广告宣传后销量=广告宣传前销量检验统计量b广告宣传后销量-广告宣传前销量Z-.119a 渐近显著性(双侧).905a.基于负秩。b.Wilcoxon带符号秩检验7.①首先提出检验假设:原假设:4条生产线生产产品的质量无显著差异;备择假设:4条生产线生产产品的质量有显著差异。②采用非参数检验之多个独立样本的检验,通过SPSS操作得到如下图表,由表可知,卡方=12.875,P=0.005<0.05,所以拒绝原假设,认为4条生产线生产产品的质量有显著差异。秩生产线N秩均值次品数生产线A64.83生产线B719.29生产线C712.43生产线D616.67总数26检验统计量a,b次品数卡方12.875df3渐近显著性.005a.KruskalWallis检验b.分组变量:生产线8.①首先提出检验假设:原假设:5种广告方案的得分无显著差异,即专家的评价标准不一致;备择假设:5种广告方案的得分有显著差异,即专家的评价标准一致。②采用非参数检验之多个相关样本的检验,通过SPSS操作得到如下图表,由表可知,卡方=0.880,P=0.927>0.05,所以不拒绝原假设,认为5种广告方案的得分无显著差异,即专家的评价标准不一致。KendallW=0.022,接近与0,认为5种广告方案的得分无显著差异,即评价者的评价标准不一致。秩秩均值方案A得分3.20方案B得分3.20方案C得分3.10方案D得分2.80方案E得分2.70 检验统计量aN10卡方.880df4渐近显著性.927a.Friedman检验检验统计量N10KendallWa.022卡方.880df4渐近显著性.927a.Kendall协同系数'