• 78.47 KB
  • 2022-04-22 11:50:03 发布

统计学徐国祥第二版课后题答案.docx

  • 36页
  • 当前文档由用户上传发布,收益归属用户
  1. 1、本文档共5页,可阅读全部内容。
  2. 2、本文档内容版权归属内容提供方,所产生的收益全部归内容提供方所有。如果您对本文有版权争议,可选择认领,认领后既往收益都归您。
  3. 3、本文档由用户上传,本站不保证质量和数量令人满意,可能有诸多瑕疵,付费之前,请仔细先通过免费阅读内容等途径辨别内容交易风险。如存在严重挂羊头卖狗肉之情形,可联系本站下载客服投诉处理。
  4. 文档侵权举报电话:19940600175。
'第1章总论1.1复习笔记一、统计学的产生和发展从统计学的产生和发展过程来看可以把统计学划分为3个时期统计学的萌芽期、统计学的近代期和统计学的现代期。1统计学的萌芽期统计学的萌芽期始于17世纪中叶至18世纪中、末叶主要有国势学派和政治算术学派。2统计学的近代期统计学的近代期始于18世纪末至19世纪末主要有数理统计学派和社会统计学派。3统计学的现代期统计学的现代期为20世纪初到现在的数理统计时期发展有三个明显的趋势1随着数学的发展统计学依赖和吸收数学营养的程度越来越迅速2向其他学科领域渗透或者说以统计学为基础的边缘学科不断形成3随着应用的日益广泛和深入特别是借助电子计算机后统计学所发挥的功效越益增强。二、统计学的研究对象和研究方法1统计的涵义“统计”一词具有统计学、统计工作和统计资料三种涵义。1统计学是研究如何搜集资料、整理资料和进行数量分析、推断的一门方法论科学。2统计工作即统计实践是对社会、经济以及自然现象的总体数量方面进行搜集、整理和分析的活动过程。3统计资料即统计工作的成果是统计工作过程所取得的各项数字和有关情况的资料它反映现象的规模、水平、速度和比例关系等等以表明现象发展的特征。三者之间的联系统计工作的好坏直接影响统计资料的数量和质量。统计工作的发展需要统计理论的指导。统计学来源于统计工作是统计工作经验的理论概括又用理论和方法指导统计工作推动统计工作的不断提高。随着统计工作的进一步发展统计学不断地充实和提高两者是理论和实践的关系。2统计学的研究对象统计学的研究对象是大量现象的数量其性质是一门适用于自然现象和社会现象的方法论学科。3统计学的研究方法1大量观察法大量观察法是指对所研究的事物的全部或足够数量进行观察的方法。它的数学依据是大数定律。2综合指标法综合指标是从数量方面对现象总体的规模及其特征的概括说明。综合指标法是运用各种综合指标对现象的数量关系进行对比分析的方法。3统计推断法统计推断法是在一定置信程度下根据样本资料的特征对总体的特征作出估计和预测的方法。三、统计学的要素和内容1统计要素1总体是要调查或统计的某一现象的全部数据的集合。它是最基本的要素。2样本是从总体中随机抽取的若干数据的子集。它是统计问题的第二要素。3推断是对以样本所包含的信息为基础对总体的某些特征作出决策、预测和估计。它是统计问题的第三要素也是统计的基本任务。4推断的可靠性是统计问题的最重要的要素也是统计对企业决策最重要的贡献它使统计的推断与“算命”截然分开。2统计学的内容1描述统计描述统计是指如何从已知的观察资料搜集、整理、分析、研究并提供统计资料的理论和方法用以说明研究现象的情况和特征。描述统计的主要作用是通过对现象进行调查或观察然后将所得到的大量数据加以整理、简缩、制成统计图表并就这些数据的分布特征计算出一些概括性的数字。描述统计的主要目的之一是使反映客观现象的统计数据可以一目了然条理清晰使用方便。2推断统计推断统计是指只凭样本资料以推断总体特征的技术和方法。其优点是可以节省时间、人力和物力。其类型包括参数估计和假设检验如果所作的推断是对整个总体的某个数值作出估计这样的问题属于估计这一类型。如果所作的推断是在几个可供选择的行动方案中进行选择这样的问题属于检验这一类型。描述统计是推断统计的前提而推断统计是描述统计的发展。1.2课后习题详解1统计学的产生和发展可分为哪几个时期主要有哪些重要学派它们有何历史贡献答统计学的产生和发展可分为以下3个时期1统计学的萌芽期始于17世纪中叶至18世纪中、末叶当时主要有国势学派和政治算术学派。①国势学派又称记述学派所做的工作主要是对国家重要事项的记录对统计学 的创立和发展作了不少贡献。首先国势学派为统计学这门新兴的学科起了一个至今仍为世界公认的名词“统计学”并提出了至今仍为统计学者所采用的一些术语。国势学派建立的最重要的概念就是“显著事项”它事实上是建立统计指标和使统计对象数量化的重要前提其次国势学派在研究各国的显著事项时主要是系统地运用对比的方法来研究各国实力和强弱统计图表实际上也是“对比”思想的形象化的产物。②政治算术学派在统计发展史上有着重要的地位。首先它并不满足于社会经济现象的数量登记、列表、汇总、记述等传统的统计过程而是进而要求把这些统计资料加以全面系统地总结并从中提炼出某些理论原则。这个学派在搜集资料方面较明确地提出了大量观察法、典型调查、定期调查等思想在处理资料方面较为广泛地运用了分类、制表及各种指标来浓缩与显现数量资料的内含信息。其次政治算术学派第一次有意识地运用可度量的方法力求把自己的论证建立在具体的、有说服力的数字上面依靠数量的观察来解释与说明社会经济生活。2统计学的近代期始于18世纪末至19世纪末在这时期的统计学主要有数理统计学派和社会统计学派。社会统计学派认为统计学的研究对象是社会现象目的在于明确社会现象内部的联系和相互关系统计方法应当包括社会统计调查中资料的搜集、整理以及对其分析研究。他们认为在社会统计中全面调查包括人口普查和工农业调查居于重要地位以概率论为根据的抽样调查在一定的范围内具有实际意义和作用。3统计学的现代期统计学的现代期为自20世纪初到现在的数理统计时期。自20世纪20年代以来数理统计学发展的主流从描述统计学转向推断统计学。2“统计”一词有哪几种涵义它们之间是怎样的关系答统计一般具有统计学、统计工作和统计资料三种涵义。1统计工作即统计实践是对社会、经济以及自然现象的总体数量方面进行搜集、整理和分析的活动过程。2统计资料即统计工作的成果是统计工作过程所取得的各项数字和有关情况的资料它反映现象的规模、水平、速度和比例关系等以表明现象发展的特征。统计工作的好坏直接影响统计资料的数量和质量。统计工作的发展需要统计理论的指导。3统计学是研究如何搜集资料、整理资料和进行数量分析、推断的一门方法论科学。统计学来源于统计工作是统计工作经验的理论概括又用理论和方法指导统计工作推动统计工作的不断提高。随着统计工作的进一步发展统计学不断地充实和提高两者是理论和实践的关系。由于以上三者之间具有如此紧密的联系所以习惯上把这三者通称为统计。3统计学的研究对象是什么答统计学是从研究社会经济现象的数量开始的随着统计方法的不断完善统计学得以不断发展。因此统计学的研究对象为大量现象的数量方面。就其性质来说它是一门适用于自然现象和社会现象的方法论学科。*********************************文件基本信息:文件名G:软件Desktop徐国祥截图7.swf文件版本9经过压缩宽:595pixels高:841pixels帧数:1frame帧率:0fps共提取文字:1644个4统计学主要有哪些研究方法答统计学的研究对象和性质决定着统计学的研究方法 统计学的研究方法主要有以下三种1大量观察法大量观察法是统计学所特有的方法是指对所研究的事物的全部或足够数量进行观察的方法。2综合指标法综合指标就是从数量方面对现象总体的规模及其特征的概括说明综合指标法就是运用各种综合指标对现象的数量关系进行对比分析的方法。3统计推断法统计推断法是指在一定置信程度下根据样本资料的特征对总体的特征作出估计和预测的方法。统计推断是现代统计学的基本方法在统计研究中得到了极为广泛的应用。5统计学有哪些基本要素举出你生活中熟悉的例子来说明这些要素。答统计学有四个要素即总体、样本、推断以及推断的可靠性。1总体总体是最基本的要素是指要调查或统计的某一现象的全部数据的集合。例如全部有资格投票的人、大学中新生总数等都可以称为总体。2样本样本是统计问题的第二要素是指从总体中随机抽取的若干数据的子集。例如从某企业的有投票资格的选民中选出30人的选民样本就是从总体中抽取样本的例子。3推断推断是统计问题的第三要素也是统计的基本任务。所谓推断就是对以样本所包含的信息为基础对总体的某些特征作出决策、预测和估计。例如根据样本选民的回答情况便可以推断出全体选民将如何进行投票。4推断的可靠性推断的可靠性测度是统计问题的最重要的要素也是统计对企业决策最重要的贡献。例如某人对某公司进行统计调查他估计该公司的产品明年的需求量将增加30并且他还会统计出这个推断误差的可能范围让该公司明白在这个推断中可以寄予多大的信任。6什么是描述统计什么是推断统计试举例说明。答1描述统计是指如何从已知的观察资料搜集、整理、分析、研究并提供统计资料的理论和方法用以说明研究现象的情况和特征。描述统计包括各种数据处理这些数据的处理是用来总括或描述数据的重要特征的而不必深入一层地去试图推论数据本身以外的任何事情。例如生产小组工人的日产量依次为23、25、28、28、28、30、35那么其日产量的平均数、众数和中位数均为28件。2推断统计则是指只凭样本资料以推断总体特征的技术和方法。推断统计可以利用样本资料来代替总体资料在观察资料的基础上深入一步地分析、研究和推断以推知资料本身以外的情况和数量关系从而对不肯定的事物作出决断为进行决策提供数据依据。推断统计主要有两种类型即参数估计和假设检验。描述统计是推断统计的前提而推断统计是描述统计的发展。例如某种灯泡的寿命服从正态分布但是均值和方差都是未知的今随机抽取了四只灯泡测得寿命以小时计为1520145313671650利用这些样本数据可以估计出均值为1493小时方差为14069。1.3典型习题详解一、单项选择题1国势学派建立的重要的概念是它事实上是建立统计指标和使统计对象数量化的重要前提。A数量分析方法B大数法则C显著事项D小样本理论【答案】C【解析】国势学派产生于统计学的萌芽时期该学派对统计学的创立和发展的贡献有①为统计学这门新兴*********************************文件基本信息:文件名G:软件Desktop徐国祥截图8.swf文件版本9经过压缩宽:595pixels高:841pixels帧数:1frame帧率:0fps共提取文字:1358个 的学科起了一个至今仍为世界公认的名词“统计学”statistics)并提出了至今仍为统计学者所采用的一些术语如“统计数字资料”、“数字对比”等②建立了重要的“显著事项”概念它事实上是建立统计指标和使统计对象数量化的重要前提③在研究各国的显著事项时主要是系统地运用对比的方法来研究各国实力和强弱统计图表实际上也是“对比”思想的形象化的产物。2被马克思誉为“政治经济学之父及某种程度上也是统计学的创始人”的是。A康令B凯特勒C威廉·配第D约翰·格朗特【答案】C3最早把古典概率论引入统计学领域的是。A康令B威廉·配第C凯特勒D拉普拉斯【答案】D4社会统计学派是由首创的。A梅尔B尼斯C凯特勒D恩格尔【答案】B5大量观察法的数学依据是。A大数定律B中心极限定律C小数定律D切比雪夫不等式【答案】A【解析】大量观察法是指对所研究的事物的全部或足够数量进行观察的方法其数学依据是大数定律。大数定律是随机现象出现的基本规律也是在随机现象大量重复中出现的必然规律。大数定律的一般概念是指在观察过程中每次取得的结果不同这是由偶然性所致的但大量重复观察结果的平均值却几乎接近确定的数值。狭义的大数定律是指概率论中反映上述规律性的一些定理它所表明的是平均数的规律性与随机现象的概率关系。6统计学是一门关于研究客观事物数量方面和数量关系的。A社会科学B自然科学C方法论科学D实质性科学【答案】C7在一定置信程度下根据样本资料的特征对总体的特征作出估计和预测的方法是。A大量观察法B统计描述法C综合指标法D统计推断法【答案】D*********************************文件基本信息:文件名G:软件Desktop徐国祥截图9.swf文件版本9经过压缩宽:595pixels高:841pixels帧数:1frame帧率:0fps共提取文字:777个8任何一个统计问题的最基本要素是。A总体B样本C总体单位D推断【答案】A【解析】统计的四要素是总体、样本、推断以及推断的可靠性。其中总体是统计问题的最基本的要素样本是统计问题的第二要素推断是统计问题的第三要素也是统计的基本任务推断的可靠性测度是统计问题的最重要的要素也是统计对企业决策最重要的贡献。9推断统计主要有和两种类型。A统计描述和预测B理论统计和运用统计C统计预测和决策D参数估计和假设检验【答案】D10统计决策是由把古典统计理论中的假设检验和估计推断方法应用于决策中而创立起来的。A恩格尔B凯特勒C阿·瓦尔德D约翰·格朗特【答案】C二、多项选择题1国势学派对统计学的创立和发展作出的贡献有。A第一次有意识地运用可度量的方法依据数量的观察来解释与说明社会经济生活B为统计学这门学科起了一个世界公认的名词“统计学”C 在研究各国的显著事项时主要是系统地运用对比的方法来研究各国实力和强弱D处理资料方面较为广泛地运用了分类、制表及各种指标来浓缩与显现数量资料的信息E把古典概率论引入统计学并推广了概率论在统计中的应用【答案】BC【解析】AD两项是政治算术学派作出的贡献E项是树立统计学派作出的贡献。2“统计”一词的三种涵义是。A统计资料B统计学C统计指标D统计工作E统计图表【答案】ABD【解析】“统计”一词的三种涵义是指①统计工作即统计实践是对社会、经济以及自然现象的总体数量方面进行搜集、整理和分析的活动过程②统计资料即统计工作的成果是统计工作过程所取得的各项数字和有关情况的资料它反映现象的规模、水平、速度和比例关系等以表明现象发展的特征③统计学是研究如何搜集资料、整理资料和进行数量分析、推断的一门方法论科学。3统计学的研究方法主要有。A统计描述法B综合指标法*********************************文件基本信息:文件名G:软件Desktop徐国祥截图10.swf文件版本9经过压缩宽:595pixels高:841pixels帧数:1frame帧率:0fps共提取文字:885个C统计推断法D统计比较法E大量观察法【答案】BCE【解析】统计学的研究方法主要有①大量观察法是对所研究的事物的全部或足够数量进行观察的方法②综合指标法是从数量方面对现象总体的规模及其特征的概括说明的方法③统计推断法指在一定置信程度下根据样本资料的特征对总体的特征作出估计和预测的方法。4描述统计与推断统计的关系是。A描述统计是推断统计的发展B推断统计是描述统计的发展C描述统计是推断统计的前提D推断统计是描述统计的前提E描述统计与推断统计是统计学的两大基本内容【答案】BC【解析】统计学的基本内容包括描述统计和推断统计两大类。描述统计是指如何从已知的观察资料搜集、整理、分析、研究并提供统计资料的理论和方法用以说明研究对象的情况和特征。推断统计则是指只凭样本资料以推断总体特征的技术和方法。二者的关系是①描述统计是推断统计的前提②推断统计是描述统计的发展。5统计的要素包括。A总体B样本C推断D样本容量E推断的可靠性【答案】ABCE三、简答题1统计学的产生和发展可分为哪几个时期主要有哪些重要学派答最早的统计是作为国家重要事项的记录从统计的产生和发展过程来看可以把统计学划分为三个时期1统计学的萌芽时期主要有国势学派和政治算术学派2统计学的近代时期主要有数理统计学派和社会统计学派3统计学的现代期主要表现为统计学吸收数学营养的程度越来越迅速统计学向其他学科领域渗透的能力越来越强统计学的应用日趋广泛和深入所发挥的功能越益增强。2简述统计学的基本内容并绘出统计在管理决策中作用的流程图。答随着统计学的不断发展统计学的内容越来越丰富但就其基本内容来说包括描述统计和推断统计两大类描述统计就是指如何从已知的观察资料搜集、整理、分析、研究并提供统 计资料的理论和方法用以说明研究对象的情况和特征推断统计则是指只凭样本资料以推断总体特征的技术和方法。图1-1统计在管理决策中作用的流程图?*********************************文件基本信息:文件名G:软件Desktop徐国祥截图11.swf文件版本9经过压缩宽:595pixels高:841pixels帧数:1frame帧率:0fps共提取文字:891个任何一个管理决策问题都是从现实问题开始的。而现实问题在工商管理中可用管理术语提出进而进一步确立管理问题。管理问题可转化为统计问题。统计问题可从抽取的样本并加以整理和分析后找到答案然后再利用统计问题的答案来找到管理问题的答案以达到最终解决管理问题的目的。*********************************文件基本信息:文件名G:软件Desktop徐国祥截图12.swf文件版本9经过压缩宽:595pixels高:841pixels帧数:1frame帧率:0fps共提取文字:131个第2章统计资料的搜集和整理2.1复习笔记一、统计调查的概念和方案的设计1统计调查的概念原始资料也称初级资料是指为了研究某个问题而进行实地观察或通过从党政机关、企事业单位、学校和其他团体而获得的第一手资料。次级资料是指借用原来已经加工过的现成资料例如从统计年鉴、会计报表、报刊杂志上摘引的资料。统计调查就是对统计资料的搜集它是根据研究的目的和要求有组织、有计划地向调查对象搜集原始资料和次级资料的过程。统计调查所搜集的资料主要是原始资料。统计调查是统计整理、统计分析、统计预测和统计决策的前提因此所搜集的资料必须满足准确性、及时性和完整性的要求。2统计调查方案的设计1确定调查的目的即首先要明确所搜集的资料要解决什么问题它决定着调查的对象、内容和方法。2确定调查对象、调查单位和填报单位调查对象就是被研究现象的总体调查单位是指构成总体的每一个单位填报单位是指受征集资料的单位。填报单位与调查单位两者有时是不一致的但两者有时又是一致的。3明确调查项目和制定调查表格调查项目实际上就是进行调查时要向被调查者所要询问的问题。 调查表格就是把确定好的调查项目按一定的逻辑顺序排列在一定的表格上凡是以文字作为答案的可以采取问答式凡是以数字作为答案的则必须制定调查表格。4确定调查时间调查时间包含两个方面的含义一是调查资料所属的时间它是由调查对象的特点所决定的二是调查工作的起止时间它对保证调查工作按期完成是必要的。5制定调查的组织实施计划制定调查的组织实施计划的内容包括确定调查的组织机构确定调查人员明确调查的方式、方法和进行调查的地点制定调查的准备措施。二、统计调查的方式和方法1统计调查的方式按照搜集资料的组织方式不同分为专门调查和统计报表两种。1专门调查专门调查是指为了某些特定目的而专门进行的调查。这种调查多属一次性调查一般有普查、重点调查、抽样调查和典型调查四种。①普查普查是专门组织的一次性全面调查。其组织方式有一是组织专门的普查机构配备一定的普查人员对调查单位进行直接的登记二是利用调查单位的原始记录和核算资料颁发一定的调查表格由填报单位进行填报。在组织普查工作中需注意一是规定统一的标准时点二是确定统一的普查期限三是规定普查的项目和指标。②重点调查重点单位是指其在总体中具有举足轻重的地位通过对这些少数单位的调查就能取得反映总体的基本情况。重点调查是指只在调查对象中选择一部分重点单位进行调查借以了解总体基本情况的一种非全面调查。其适用范围是当调查任务只要求掌握调查对象的基本情况而在总体中部分单位又能较集中地反映所要研究的问题。它的结果不能用数理统计的方法来进行分析。③抽样调查抽样调查是指根据随机原则从调查总体中抽取部分单位进行观察并根据其结果推断总体数量特征的一种非全面调查方法。优点是可以节省人力、物力减少调查时间提高调查质量。与重点调查和典型调查的区别是抽样调查是从总体中随机抽取部分单位(样本)进行调查而重点调查和典型调查则从总体中有意识地选择部分单位作为调查的对象。*********************************文件基本信息:文件名G:软件Desktop徐国祥截图13.swf文件版本9经过压缩宽:595pixels高:841pixels帧数:1frame帧率:0fps共提取文字:1338个适用于调查范围广不可能或不必要进行全面调查的情况或者调查本身具有破坏性的情况。④典型调查典型调查就是根据调查的目的和要求在对研究对象进行全面分析的基础上有意识地选择部分有代表性的单位进行调查它也是一种非全面调查。特点是调查单位是在对调查对象进行全面分析的基础上有意识地选择出来的一种深入细致的调查方法。其作用在于a可以研究经济管理中的新生事物或典型事例的情况也可以作为其他统计调查的补充b在一定条件下可验证全国调查数字的真实性c有时利用典型调查的资料来估计总体数字。选点方式有a如果在调查单位之间情况差异较少时可选择一、二个典型单位进行“解剖麻雀”式的调查b如果作为调查对象的各个单位之间差异较大时可采取“划类选典”的办法把总体分成若干类型然后在每一类型中选择典型进行调查。2统计报表统计报表是按国家有关法规的规定自上而下地统一布置自下而上地逐级提供统计资料的一种统计调查方式。统计报表的分类有①全面和非全面统计报表按调查范围不同分类 全面统计报表要求调查对象中的每一个单位都要填报非全面统计报表只要求调查对象中的一部分单位填报它需要结合重点调查、典型调查和抽样调查来应用。②国家统计报表、部门统计报表和地方统计报表按报表内容和实施范围不同分类国家统计报表也称国民经济基本统计报表由国家统计部门统一制发用以反映全国性的经济和社会基本情况的统计资料。部门统计报表是为了适应本部门业务管理需要而制定的专业统计报表在本系统内实行用以搜集有关部门的业务技术资料。地方统计报表是针对地区特点而补充规定的地区性统计报表它是为本地区的计划和管理服务的。③日报、旬报、月报、季报、半年报和年报按报送周期长短分类④基层统计报表和综合统计报表按填报单位的不同分类基层统计报表即由基层企事业单位填报的报表综合统计报表是由主管部门或统计部门根据基层报表逐级汇总填报的报表。2统计调查的方法1直接观察法直接观察法是指调查人员到现场对调查对象进行观察、计量和登记以取得资料的方法。优点在于能够直接取得第一手资料并能够保证资料的准确性。缺点是需要大量的人力、物力和财力及较长的时间并且受一定条件的限制。2报告法报告法是指报告单位以各种原始记录和核算资料为依据向有关单位提供统计资料的方法。3采访法采访法是指调查员和应答者之间用对话方式进行调查的方法。①优点a应答率比较高一般在80%以上b调查员可以设法确保应答者独立回答问题而且可以做到没有任何第三者在场的情况下完成调查c调查员可以直接观察、记录被调查者的态度等非语言性的资料并且对应答者的诚实程度作出评估。d可以使用复杂的调查表并且能保证应答者答案的完整性和保证所有的问题均得到回答。②缺点a采访调查的费用高。b在采访调查中误差来自应答者和调查员双方而这种误差往往由偏见引起。c调查时间长。d应答者情绪受干忧时不易被调整。e匿名保证较差。③一次成功的采访调查必须具备的条件a要取得的信息对应答者来说具有可取性。b应答者必须明白对他的要求是什么。*********************************文件基本信息:文件名G:软件Desktop徐国祥截图14.swf文件版本9经过压缩宽:595pixels高:841pixels帧数:1frame帧率:0fps共提取文字:1342个c应答者有准确回答问题的动机其中包括决定接受采访、准确回答问题等方面。④调查员需要注意的问题a必须正直诚实对工作有热情有较强的适应性b应该品性端庄、脾气和善c必须有一定的文化程度否则无法准确理解问卷无法在采访中正确措词无法准确理解和记录回答。4邮寄调查法邮寄调查法是通过邮政系统分发和收回调查表的调查方法。①优点a调查的费用低b可以在很大的地域范围内进行c调查所花费的时间较短d在进行敏感性问题的调查中运用邮寄调查法可以得到比较可行的资料e可避免调查员的偏见。②缺点a应答率低b邮寄调查所得到的是一种一次性的结果如果应答者有含糊不清等情况则无法补救c调查环境无法控制研究者不知道应答者是否和别人讨论后才形成答案无法知道应答者是否独立完成调查是否有一部分甚至全部问卷都由别人代答d 研究者没有机会增补应答者在回答问题时的非语言性资料。三、问卷的设计1问卷的概念和作用问卷是有问有答的调查表。其作用在于可以使调查研究规范化、程序化和科学化。2问卷的基本要素1前言前言是给应答者的简短信函一般写在问卷的首项或封面上。其基本内容包括①调查者自我介绍②说明调查的目的及其重要性③解除应答者的思想顾虑④请求给予合作并表示谢意。2问题和答案问题是向应答者提出而要求回答的事实、态度、行为和愿望等。归纳起来有事实方面的态度、观念、志趣方面的行为方面的和理由方面的问题。答案反映了研究对象的不同状况和水平包括事先规定答案和只提问题不规定答案两种形式。3编码编码的目的是使资料数量化以便测量和统计。编码就是用自然数给各种答案编上号码。其作用有①对没有明确的数量化的研究对象起数量化的作用。②对已经数量化的研究对象起归纳分析的作用。③用来区分类别。4资料登录地址资料登录地址是指明每一项资料在汇总时登录在什么地方实际上起着资料索引的作用。3设计问卷时应注意的问题1对每个问题和答案的设计应充分考虑到问题的统计方法。2提问的意义要准确、清楚要使用一般的语句尽量避免使用专业术语。3问题要适用于调查对象的最低文化程度。4问题应当短小便于做明确的答复。5问题的排列应当具有逻辑性。6对敏感性问题设计问卷时应遵守保密的原则。四、统计分组统计整理的中心任务就是分组和编制频数分布表。1统计分组的意义统计分组就是根据统计研究的需要将统计总体按照一定的标志区分为若干组成部分的一种统计方法。其意s*********************************文件基本信息:文件名G:软件Desktop徐国祥截图15.swf文件版本9经过压缩宽:595pixels高:841pixels帧数:1frame帧率:0fps共提取文字:1101个义在于1划分现象的类型并反映各类型组的数量特征。2按照某一标志将性质不同的单位进行分组以说明现象的内部结构。3通过分组可以揭示现象与现象之间的依存关系。2统计分组的标志在进行统计分组时最关键的问题是如何选择分组的标志和确定各组的界限。分组标志就是将总体区分为不同组别的标准或根据。分组标志有品质标志和数量标志两种。1按品质标志分组就是按事物的品质特征进行分组。2按数量标志分组就是按事物的数量特征进行分组。3统计分组体系为了从不同侧面反映总体的特征就必须运用几个标志对总体进行分组以形成一个完整的体系这就是统计分组体系。统计分组体系的形式有1平行分组体系。同一总体的几个简单分组按某一规定排列起来就构成一个平行分组体系。2复合分组体系。如果总体同时按两个或两个以上的标志层叠起来分组就称为复合分组。由复合分组形成的分组系列就称为复合分组体系。五、频数分布1频数分布的概念在统计分组的基础上将总体中所有单位按一定标志进行分组整理形成总体中各单位数在各组间的分布称为频数分布又称分布数列。根据分组标志特征的不同分布数列可分为1属性分布数列是指按品质标志分组所形成的分布数列简称品质数列。2变量分布数列是指按数量标志分组所形成的分布数列简称变量数列。按照用以分组的变量的表现形式变量分布数列可以分为 ①单项式变量数列。它是指数列中每个组的变量值都只有一个即一个变量值就代表一组。单项式变量数列一般是在离散型变量变异幅度不太大的情况下被采用的。②组距式变量数列。它是指按一定的变化范围或距离进行分组的变量数列又称组距数列。编制组距数列适用于变量值个数较多、变动范围较大的资料。2频数分布表的编制1整理原始资料首先对原始资料加以整理确定最大值和最小值并计算全距。2确定变量数列的形式对于离散型变量如果项数不多、变异幅度不大可编制单项式变量数列。否则应编制组距式变量数列。对于连续型变量不能编制单项式变量数列而只能编制组距式变量数列。3编制组距式变量数列应注意的问题①确定组距组距的大小要适度要能正确地反映总体的分布特征及其规律。组距与组数成反比例关系组距越大组数就越少组距越小组数就越多(组数=全距÷组距)。如果资料分布比较均匀就可采用等距分组否则应采用不等距分组。②确定组限对于离散型变量组的上下限可用肯定性的数值表示组限非常清楚。对于连续型变量其变量值有小数组限不能用肯定的数值表示只能用前一组的上限与后一组的下限重叠的方法表示。开口组在组限的表示方法中数列的首末两组用“××以下”和“××以上”表示。闭口组首末两组上下限俱全的。一般原则是把达到上限值的单位划入下一组内。组中值是上限和下限之间的中点数值它是代表各组标志值平均水平的数值。计算组中值的公式为s*********************************文件基本信息:文件名G:软件Desktop徐国祥截图16.swf文件版本9经过压缩宽:595pixels高:841pixels帧数:1frame帧率:0fps共提取文字:1237个2上限下限组中值开口组的组距和组中值的确定一般以其邻近组的组距为准。其计算公式为22邻组组距缺下限开口组的组中值上限邻组组距缺上限开口组的组中值下限+3频数分布表示方法1列表法即用统计表来表示频数分布并可列入累计频数。较小制累计是以最小组的频数或频率为始点逐项累计各组频数或频率。较小制累计中每组的累计频数或频率表示小于该组上限的频数或频率合计有多少。较大制累计则是从最大组的频数或频率开始逐项累计各组的频数或频率。较大制累计中每组的累计频数或频率表示该组下限以上的频数或频率合计有多少。2图示法即用统计图形来表示频数分布的方法。常用的图示法有直方图、折线图和曲线图三种。①直方图直方图即用直方形的宽度和高度来表示频数分布情况的图形。对于不等距数列要先计算出各组的频数密度然后以组距为宽以频数密度为高画直方图。其中频数密度的计算公式为频数密度=频数÷组距②折线图折线图可以在直方图的基础上将直方图中的每个长方形的顶端中点用折线连点而成。如果不绘直方图也可以用组中值与频数求坐标点连接而成。起点是在距左边最低组半个组距处的横轴上终点是在距右边最高组半个组距处的横轴上。它表示频数分布的图形。③曲线图曲线图的绘制方法与折线图基本相同只是连接各组频数坐标点的线段应当用平滑曲线而不用折线。六、统计汇总方法和统计表 统计汇总的组织方法基本上有两种逐级汇总法和集中汇总法。逐级汇总法就是一种从基层取得调查资料按照一定的领导系统自下而上逐级整理综合的方法。集中汇总法是一种把全部调查资料集中到某一机构进行一次性汇总的方法。统计汇总的技术方法常用的有手工汇总和电子计算机汇总两种。次级资料的汇总整理方法主要有调整法、推算法和再分组三种。统计表是纵横线交叉所组成的一种表格表格内所列的是整理后系统的统计资料。其优点在于资料易于条理化简单明了且可以节省大量文字叙述便于比较分析、检查数值的完整性和准确性。统计表的结构可以从表的形式和内容两方面加以论述。统计表是由总标题、横行标题、纵栏标题、纵横表格线和数字资料等基本内容构成。统计表在内容上分为主词栏和宾词栏两部分。2.2课后习题详解1什么是统计调查统计调查有哪几种组织形式答1统计调查就是对统计资料的搜集它是根据研究的目的和要求有组织、有计划地向调查对象搜集原始资料和次级资料的过程。2统计调查按照搜集资料的组织方式不同分为专门调查和统计报表两种。①专门调查指为了某些特定目的而专门进行的调查。这种调查多属一次性调查一般有普查、重点调查、抽样调查和典型调查四种。②统计报表是我国搜集统计资料的主要方式之一。统计报表有定期、临时和全面、非全面之分。主要的统计报表是全面的、定期的统计报表在搜集统计资料的工作中占有重要的地位。局灯骄降氖怠<扑阕橹兄档墓轿?s*********************************文件基本信息:文件名G:软件Desktop徐国祥截图17.swf文件版本9经过压缩宽:595pixels高:841pixels帧数:1frame帧率:0fps共提取文字:1213个2普查、典型调查、重点调查和抽样调查各有什么特点和区别答1普查是专门组织的一次性全面调查所搜集的资料表明某一现象在某一时点或某一时期的情况时间性要求很强。普查工作多在全国或很大范围内进行需要动员大量人力、物力和财力。因此只有需要摸清国家重要的国情、国力时才有可能和必要在全国或很大范围内组织普查。2典型调查是根据调查的目的和要求在对研究对象进行全面分析的基础上有意识地选择部分有代表性的单位进行调查它也是一种非全面调查。其中调查单位是在对调查对象进行全面分析的基础上有意识地选择出来的一种深入细致的调查方法。3重点调查是指只在调查对象中选择一部分重点单位进行调查借以了解总体基本情况的一种非全面调查。重点单位是指其在总体中具有举足轻重的地位通过对这些少数单位的调查就能取得反映总体的基本情况。重点调查既可用于经常性调查也可用于一次性调查。当调查任务只要求掌握调查对象的基本情况而在总体中部分单位又能较集中地反映所要研究的问题时进行重点调查是比较适宜的。4抽样调查是指根据随机原则从调查总体中抽取部分单位进行观察并根据其结果推断总体数量特征的一种非全面调查方法。它可以节省人力、物力减少调查时间提高调查质量因而应用广泛。抽样调查与重点调查和典型调查之间是有区别的。其中最大的不同点是抽样调查是从总体中随机抽取部分单位样本进行调查而重点调查和典型调查则从总体中有意识地选择部分单位作为调查的对象。3 在我国统计调查实际中为什么要强调多种形式的统计调查的结合应用如何结合应用答统计调查的两种组织方式是专门调查和统计报表其中专门调查方式包括普查、重点调查、抽样调查和典型调查四种。这些方式分别具有不同的特点、作用及局限性。在社会主义市场经济的条件下必须注意各种方式的综合应用选择才能搜集到所需要的统计资料。统计报表作为一种统计调查的重要方式也有其局限性。因此统计实践中要把统计报表和专门调查结合起来应用。根据我国的实际情况必须建立以普查为基础以抽样调查为主体同时辅助以典型调查、重点调查、统计报表和科学结算相结合的统计调查体系。4什么是统计报表试述统计报表的种类及其作用。答统计报表是按国家统一规定的表式统一的指标项目统一的报送时间自下而上逐级定期提供基本统计资料的调查方式方法。统计报表的种类根据其性质和要求不同有以下几种1按调查范围不同可分为全面和非全面统计报表。全面统计报表要求调查对象中的每一个单位都要填报非全面统计报表只要求调查对象中的一部分单位填报它需要结合重点调查、典型调查和抽样调查来应用。2按报表内容和实施范围不同可分为国家统计报表、部门统计报表和地方统计报表。国家统计报表由国家统计部门统一制发用以反映全国性的经济和社会基本情况部门统计报表是为了适应本部门业务管理需要而制定的专业统计报表在本系统内实行用以搜集有关部门的业务技术资料地方统计报表是针对地区特点而补充规定的地区性统计报表它是为本地区的计划和管理服务的。3按报送周期长短可分为日报、旬报、月报、季报、半年报和年报。这些报表不仅反映时间长短的差别且所包括指标项目的繁简也有所不同。周期短的要求资料上报迅速因此项目不能多周期长一点的内容就要求全面一些对指标的要求也可以详细一点。年报具有年度总结性质指标要求更全面、内容要求更详尽。4按填报单位的不同可分为基层统计报表和综合统计报表。基层统计报表即由基层企事业单位填报的报表综合统计报表是由主管部门或统计部门根据基层报表逐级汇总填报的报表。5为什么要对统计资料进行审核审核的方法有哪几种答统计调查过程中由于种种原因难免会发生一些差错为了保证统计资料的质量在统计资料进入数据处理之前必须对统计资料进行审核。审核的内容主要是资料的完整性和准确性。完整性审核就是检查调查单位是否有遗漏调查项目是否填写齐全等。准确性审核包括两个方面一是检查数据是否真实、符合实际二是检查数据的登记是否正确、计算是否有误。逻辑检查和计算检查是审核数据准确*********************************文件基本信息:文件名G:软件Desktop徐国祥截图18.swf文件版本9经过压缩宽:595pixels高:841pixels帧数:1frame帧率:0fps共提取文字:1740个性的常用方法。6什么是统计分组它有什么作用答统计分组就是根据统计研究的需要将统计总体按照一定的标志区分为若干组成部分的一种统计方法。统计分组的作用1划分现象的类型并反映各类型组的数量特征2按照某一标志将性质 不同的单位进行分组就可以计算各组的数量特征在总体中所占的比重以说明现象的内部结构3通过分组可以揭示现象与现象之间的依存关系也就是说按照所研究现象的有关标志来分组可以分析该因素对另一因素的影响程度和因果关系。7什么是分组标志在统计研究工作中怎样选择分组标志和确定分组界限答1分组标志是将总体区分为不同组别的标准或根据。2在统计研究工作中进行分组的基本原则是按照不同的标志分组体现组内的同质性和组间的差别性。上限和下限统称为组限。确定组限的基本原则是按这样的组限分组后要能使性质相同的单位归入同一组内使不同性质的单位按不同的组别划分把达到上限值的单位划入下一组内。8什么是分布数列有哪些种类怎样编制分布数列答1在统计分组的基础上将总体中所有单位按一定标志进行分组整理形成总体中各单位数在各组间的分布称为频数分布又称分布数列。2根据分组标志特征的不同分布数列可分为属性分布数列和变量分布数列两种。①属性分布数列是指按品质标志分组所形成的分布数列简称品质数列②变量分布数列是指按数量标志形成的分布数列简称变量数列。3编制分布数列的步骤编制次数分布数列可分以下几个步骤进行①将原始资料按大小顺序排列确定总体中的最小值、最大值以及全距。②确定编制数列的类型。若离散变量且变量值变动幅度不大可编制单项式数列若连续变量应编制连续的组距数列。③确定组数和组距。当变量值分布较均匀可取相等组距若分布相对集中应采用不等组距。组数的多少与组距的大小可根据前面所讲的方法和公式计算。④确定组限。⑤计算各组次数编制分布数列表。9什么叫全距、组距、组中值、上限、下限、频数和频率试举例说明。答全距是一组总体数据中总体单位的最大标志值和最小标志值之间的距离反应总体标志值之间的范围。在组距式变量数列中每一组的最大变量值称为该组的上限最小变量值称为该组的下限。上限与下限之间的距离或差数就是该组的组距即组距=上限下限。分布在各组的个体单位数称频数又称次数。各组次数与总次数之比称频率又称比率。例如50学生的《统计学》期末考试成绩如表2-1所示。表2-1《统计学》期末考试成绩考试成绩频数频率5060607070808090901005111711610.022.034.022.012.0合计50100.0若学生的最低成绩为50分最高成绩为100分则全距为10050=50。以90100为例100为上限90为下限则组距=上限下限=10090=10成绩在此范围的考生人数4*********************************文件基本信息:文件名G:软件Desktop徐国祥截图19.swf文件版本9经过压缩宽:595pixels高:841pixels帧数:1frame帧率:0fps共提取文字:1261个即频数为6人故频率为6/50=12.0%。10试述统计汇总组织方法和技术方法的种类。答1统计汇总的组织方法基本上有以下两种①逐级汇总法 逐级汇总法是一种从基层取得调查资料按照一定的领导系统自下而上逐级整理综合的方法。我国的定期统计报表一般都是采用逐级汇总方法。这种方法的优点是各级机构都可以取得本系统范围内的全面资料而且资料经过逐级审查后容易被发现错误并被及时纠正使汇总资料的质量得以提高。②集中汇总法集中汇总法是一种把全部调查资料集中到某一机构进行一次性汇总的方法。一些专门调查和快速调查都采用这种方法汇总资料。集中汇总的优点是可以缩短汇总资料的时间满足紧急需要结合电子计算机的应用能提高汇总资料的及时性和精确性。不足之处是原始资料如有差错不能就地更正同时汇总资料不能及时满足各地区、各部门的需要。2统计汇总的技术方法常用的有手工汇总和电子计算机汇总两种①手工汇总手工汇总是采用手工操作方法进行的汇总。常用的手工汇总有划记法、过录法、折叠法和卡片法四种。这四种方法各有利弊适用范围也不尽相同因都以手工操作为主只适宜处理少量数据。②电子计算机汇总电子计算机汇总整理统计资料的方法主要分为五个步骤a对原始资料审查和编码b根据汇总整理的要求选用适当的计算机语言编写程序c录入数据资料和程序d逻辑检查和运算e汇总结果制表打印。应用电子计算机进行汇总其主要特点是速度快、精度高在程序控制下自动工作进行各种逻辑判断能储存大量的数据信息。电子计算机汇总技术是实现统计工作现代化的重要标志之一。11统计表是怎样构成的它在统计研究中有什么重要作用答1统计表是纵横线交叉所组成的一种表格表格内所列的是整理后系统的统计资料。统计表一般采用开口式即表的左右两条线不画。2统计表的作用是可以科学地合理地显示统计资料使统计资料便于人们阅读为分析研究现象之间的数量关系如现象的规模、结构、比例、发展速度等提供条件。12编制统计表时应注意哪些问题答编制统计表时应注意以下几方面的问题1统计表的栏数如果过多要加以编号主词和计量单位各栏用甲、乙、丙等文字编写宾词指标各栏则用1、2、3等数字编号。2表中数字要填写整齐位数对准。当不存在这项数字时用符号“—”表示当缺乏某项资料时用符号“?”表示。3数字资料要注明计量单位。当全表只有一种计量单位时可把它写在表头的右上方。如果表中需要分别注明不同单位时横行的计量单位可专设“计量单位”一栏纵栏的计量单位可与纵标题写在一起用小字标明。4统计表的文字、数字要书写工整、清晰数位要对齐。5某些特殊资料需要说明的应在表的下方加以注解数字资料要在表下说明来源以备查考。6统计表编制完毕经审核后制表人和主管部门负责人要签名并加盖公章以示负责。13设某班50名学生的统计学原理考试成绩如下5070717273737271606869707081827576787780818384859092958687838990929394787981767355726970808184676869上述数据比较分散零乱不易直接看出其基本特征。试将这些数据由小到大顺序排列确定最大值和最小值并计算全距。解将数据从小到大排列*********************************文件基本信息:文件名G:软件Desktop徐国祥截图20.swf文件版本9经过压缩宽:595pixels高:841pixels帧数:1frame帧率:0fps共提取文字:1534个 5055606768686969697070707071717272727373737576767778787980808181818182838384848586878990909292939495所以最大值为95最小值为50全距=9550=45。14对13题中由小到大顺序排列的数据进行分组并编制频数分布表。解编制频数分布表如表2-2所示。表2-2考试成绩频数分布表考试成绩频数频率%50606070708080909010027191574.014.038.030.014.0合计50100在计算频数时一般原则是把达到上限值的单位划入下一组内即“上限不在内”。15对14题中的频数分布表进行扩展把较小制累计和较大制累计数值列入表格中。解频数分布表2-2的扩展如表2-3所示。表2-350名学生的统计学原理考试成绩考试成绩频数较小制累计较大制累计人数人比率%人数人比率%人数人比率%50606070708080909010027191574.014.038.030.014.0292843504.018.056.086.0100.0504841227100.096.082.044.014.0合计50100————16根据15题所得的数值绘制频数分布直方图、频数分布折线图、累计频数分布折线图即较小制累计和较大制累计频数分布折线图以及频数分布曲线图。解利用EXCEL作图分别如图2-1、2-2、2-3、2-4和2-5所示。图2-1频数分布直方图*********************************文件基本信息:文件名G:软件Desktop徐国祥截图21.swf文件版本9经过压缩宽:595pixels高:841pixels帧数:1frame帧率:0fps共提取文字:852个图2-2频数分布折线图图2-3较小制累计图图2-4较大制累计图图2-5频数分布曲线图*********************************文件基本信息:文件名G:软件Desktop徐国祥截图22.swf文件版本9经过压缩宽:595pixels高:841pixels帧数:1frame帧率:0fps共提取文字:60个2.3典型习题详解一、单项选择题1统计调查对象是。A总体各单位标志值 B总体单位C现象总体D统计指标【答案】C【解析】调查对象是指根据调查目的、任务确定的调查的范围即所要调查的现象总体它是由某些性质上相同的许多调查单位所组成的。2要对某企业的生产设备的实际生产能力进行调查则该企业的“生产设备”是。A调查对象B调查单位C调查项目D报告单位【答案】A【解析】调查对象是指需要调查的现象总体调查单位是指所要调查的具体单位是进行调查登记的标志的承担者报告单位是指负责向上报告调查内容、提交统计资料的单位调查项目是指调查中所要登记的调查单位的特征。3普查是为了某种特定的目的而()。A非专门组织的一次性全面调查B专门组织的经常性全面调查C专门组织的一次性全面调查D非专门组织的经常性全面调查【答案】C4下例调查中最适合采用重点调查的是。A了解全国钢铁生产的基本情况B了解全国人口总数C了解上海市居民家庭的收支情况D了解某校学生的学习情况【答案】A【解析】重点调查是指只在调查对象中选择一部分重点单位进行调查借以了解总体基本情况的一种非全面调查。当调查任务只要求掌握调查对象的基本情况而在总体中部分单位又能较集中地反映所要研究的问题时进行重点调查是比较适宜的。要了解全国钢铁生产的基本情况采用重点调查是适合的。B项适合采用普查C项适合采用抽样调查D项适合采用典型调查。5主要的统计报表属于的统计报表。A一次性非全面B全面定期C经常性非全面D全面临时【答案】B6统计分组的原则是要体现。A组内同质性组间差异性B组内差异性组间同质性C组内差异性组间差异性*********************************文件基本信息:文件名G:软件Desktop徐国祥截图23.swf文件版本9经过压缩宽:595pixels高:841pixels帧数:1frame帧率:0fps共提取文字:795个D组内同质性组间同质性【答案】A【解析】统计分组是指根据统计研究的需要将统计总体按照一定的标志区分为若干组成部分的一种统计方法。分组的基本原则是按照不同的标志分组体现组内的同质性和组间的差别性。7对于变量个数较多、变动范围较大的资料应编制()。A异距数列B等距数列C单项数列D组距数列【答案】D【解析】组距数列是总体按照组距式分组而形成的变量数列。对于变量值个数较多、变动范围较大的资料由于不能一一列举它的变量值不能作单项式分组只能进行组距式分组。8组距与组数的关系是。A正比例关系B因果关系C反比例关系D平行变动关系【答案】C【解析】在组距式变量数列中组距是指上限与下限之间的距离或差数组数是指一组中包含的数据个数(组数=全距÷组距)。组距与组数成反比例关系组距越大组数就越少组距越小组数就越多。9某企业职工的工资分为四组11000元以下210001200元312001800元41800元以上则第4组的组中值为元。A2000B2100C2300D2400【答案】B【解析】对于开口组的组距和组中值的确定一般以其邻近组的组距为准。第4组的上限=1800元邻组的组距=18001200=600元所以第4组的组中值为缺上限开口组的组中值=下限+邻组 组距/2=1800+600/2=2100元10统计表的横行标题写在表的。A右方B下方C左方D右上方【答案】C11统计表中的主词是指。A表中全部统计资料的内容B统计表中所要说明的对象C描述研究对象的指标D分布在各栏中的指标数值【答案】B【解析】统计表分为主词栏和宾词栏两部分。主词是统计表所要说明的对象它可以是各个总体单位的名称、总体各个组或全部一般列在表的左端宾词是说明主词的各种指标包括指标名称和指标数值一般列在表的右端。*********************************文件基本信息:文件名G:软件Desktop徐国祥截图24.swf文件版本9经过压缩宽:595pixels高:841pixels帧数:1frame帧率:0fps共提取文字:875个二、多项选择题1设计一个完整的统计调查方案应包括的内容有。A确定调查的目的B确定调查对象、调查单位和填报单位C明确调查项目和制定调查表格D确定调查时间和制定调查的组织实施计划E确定调查方式【答案】ABCD2普查必须注意的原则有。A规定统一的标准时点B规定统一的普查期限C规定统一的普查人员D规定统一的普查费用E规定普查的项目和指标【答案】ABE【解析】普查作为一种一次性的全面调查对资料的准确性和时效性要求高。在组织普查工作中必须注意的原则有①规定统一的标准时点。标准时点是指对被调查对象登记时所依据的统一时点。这个时点一经确定所有调查资料都要反映这一时点上的状况以避免搜集资料时因情况变动而产生重复登记和遗漏现象②确定统一的普查期限。在普查范围内各调查单位或调查点应尽可能同时进行普查并尽可能在最短的期限内完成以便在方法上和步调上保持一致性以保证资料的准确性和时效性③规定普查的项目和指标。普查项目和指标一经规定不准任意改变或增减以免影响汇总综合降低资料质量。3下列现象中适宜采用非全面调查的有。A企业经营管理中出现的新问题B一批X型号日光灯耐用时数检测C一个地区新增加的人口数D某地区森林的木材积蓄量E出口商品的国外市场调查【答案】ABDE【解析】全面调查是对构成调查对象的所有单位进行逐一的、无一遗漏的调查包括全面统计报表和普查非全面调查是对调查对象中的一部分单位进行调查包括非全面统计报表、抽样调查、重点调查和典型调查。C项属于人口普查普查是全面调查ABDE项若采用全面调查那么调查的单位多、组织工作量大耗费大量的人力、财力所以比较适宜采用非全面调查。4统计报表按内容和实施范围不同可分为。A国家统计报表B基层统计报表C基层统计报表D部门统计报表E综合统计报表【答案】ADE【解析】统计报表是按国家有关法规的规定自上而下地统一布置自下而上地逐级提供统计资料的一种统计调查方式。按报表内容和实施范围不同可分为①国家统计报表②部门统计报表③地方统计报表。BE两项是按填报单位的不同进行的分类。5统计调查中属于专门调查形式的调查有。A普查B典型调查********************************* 文件基本信息:文件名G:软件Desktop徐国祥截图25.swf文件版本9经过压缩宽:595pixels高:841pixels帧数:1frame帧率:0fps共提取文字:1001个C重点调查D统计报表E抽样调查【答案】ABCE【解析】统计调查按照搜集资料的组织方式不同分为专门调查和统计报表两种。专门调查是指为了某些特定目的而专门进行的调查。这种调查多属一次性调查一般有普查、重点调查、抽样调查和典型调查四种。6问卷的核心内容包括。A前言B问题C答案D编码E资料登录地址【答案】BC【解析】问卷的内容大致上都由前言、问题和答案、编码、资料登录地址四个基本要素所组成。其中问题和答案是问卷的核心内容。7统计分组的关键在于。A计算组距和组中值B选择分组标志C按数量标志分组D运用统计体系分组E确定各组界限【答案】BE【解析】统计分组是指根据统计研究的需要将统计总体按照一定的标志区分为若干组成部分的一种统计方法。在进行统计分组时最关键的问题是如何选择分组的标志和确定各组的界限。8统计汇总的组织方法包括。A逐级汇总法B记录法C集中汇总法D卡片法E电子计算机汇总【答案】AC【解析】BDE三项属于统计汇总的技术方法。9次数分布数列根据分组标志的特征可以分为。A变量数列B组距变量数列C单项变量数列D品质数列E异距变量数列【答案】AD【解析】分布数列是指在统计分组的基础上将总体中所有单位按一定标志进行分组整理形成总体中各单位数在各组间的分布又称频数分布它是统计整理的结果。根据分组标志特征的不同分布数列可分为属性分布数列和变量分布数列两种。属性分布数列是指按品质标志分组所形成的分布数列简称品质数列变量分布数列是指按数量标志形成的分布数列简称变量数列。10常用的手工汇总方法有。A划记法*********************************文件基本信息:文件名G:软件Desktop徐国祥截图26.swf文件版本9经过压缩宽:595pixels高:841pixels帧数:1frame帧率:0fps共提取文字:766个B过录法C折叠法D卡片法E制表法【答案】ABCD11对次级资料进行汇总整理的方法有。A调整法B过录法C推算法D折叠法E再分组【答案】ACE12统计表的优点在于。A资料易于条理化简单明了B容易被发现错误C节省大量文字叙述D便于比较分析E便于检查数字的完整性和准确性【答案】 ACDE13下列属于品质标志分组的有。A按年龄分组B按职称分组C按性别分组D按身高分组E按人均收入分组【答案】BC【解析】分组标志有品质标志和数量标志两种。按数量标志分组就是按事物的数量特征进行分组按品质标志分组就是按事物的品质特征进行分组。ADE三项属于按照数量标志分组。14对统计总体进行分组时采用等距分组还是异距分组决定于。A现象的特点B变量值的多少C统计研究的目的D次数的大小E所搜集到的资料分布是否均匀【答案】ACE【解析】组距变量数列分为等距数列和不等距数列。如果各组组距都相等称为等距数列如果各组组距大小不等称为不等距(或异距)数列。采用等距分组还是采用异距分组要根据以下几个方面来确定①现象的特点②统计研究的目的③所搜集到的资料分布是否均匀。如果资料分布比较均匀就可采用等距分组否则应采用不等距分组。15统计资料汇总前审核的主要内容是关于资料的。A系统性B广泛性C准确性D及时性E完整性*********************************文件基本信息:文件名G:软件Desktop徐国祥截图27.swf文件版本9经过压缩宽:595pixels高:841pixels帧数:1frame帧率:0fps共提取文字:660个【答案】CDE【解析】统计调查是统计整理、统计分析、统计预测和统计决策的前提因此所搜集的资料必须满足准确性、及时性和完整性的要求。三、简答题1“抽样调查是以样本资料推断总体数量特征”这种说法是否缺乏科学依据答抽样调查的理论依据是概率论、数理统计抽样分布理论指明了样本指标和相应的总体指标之间存在的内在联系且其误差的分布是有规律可循的。实施抽样调查样本是按随机原则抽取的排除了主观因素的影响保证样本对总体的代表性。所以以样本资料推断总体数量特征是有科学依据的。2简述典型调查的作用。答典型调查是指根据调查的目的和要求在对研究对象进行全面分析的基础上有意识地选择部分有代表性的单位进行调查它也是一种非全面调查。典型调查的作用有1可以研究新生事物或典型事例的情况也可作为其他统计调查的补充2在一定的条件下可验证全国调查数字的真实性3在有些时候可以通过典型调查的资料来估算总体数字。3对足球赛观众按男、女、老、少分为四组以分析观众的结构这种分组方法合适吗答分组应遵循“互斥原则”即总体任何一个单位只能归属于某一组而不能同时归属于几个组。这种分组方法违背“互斥原则”例如某一观众是少女她可以分在“女”组又可以分在“少”组所以这种分组方法不合适。4什么是变量数列简述编制单项式变量数列和组距变量数列的适用范围。答变量数列是指按数量标志形成的分布数列。变量数列按照用以分组的变量的表现形式可以分为单项式变量数列和组距变量数列。1 单项式变量数列是指数列中每个组的变量值都只有一个即一个变量值就代表一组。单项式变量数列一般是在离散型变量变异幅度不太大的情况下所采用。2组距式变量数列是指按一定的变化范围或距离进行分组的变量数列。编制组距数列适用于变量值个数较多、变动范围较大的资料。5简述问卷设计应该注意的问题。答问卷设计应该注意的问题有1对每个问题和答案的设计应充分考虑到问题的统计方法2提问的意义要准确、清楚要使用一般的语句尽量避免使用专业术语3问题要适用于调查对象的最低文化程度4问题应当短小便于做明确的答复5问题的排列应当具有逻辑性6敏感性问题设计问卷时应遵守保密的原则。四、计算题1抽样调查某地区50户居民的月消费品支出额数据资料如下单位元:要求1试根据上述资料编制次频数分布和频率分布数列*********************************文件基本信息:文件名G:软件Desktop徐国祥截图28.swf文件版本9经过压缩宽:595pixels高:841pixels帧数:1frame帧率:0fps共提取文字:1057个2编制较小制和较大制累计频数、频率数列。解1次数分布和频率分布数列如表2-4所示。表2-4居民户月消费品支出额频数分布和频率分布表居民户月消费品支出额元次频数频率%800以下1280085048850900122490095018369501000816100010504810501100121100以上24合计50100.002较小制累计和较大制累计频数、频率数列如表2-5和表2-6所示。表2-5居民户月消费品支出额较小制累计表居民户月消费品支出额上限元较小制累计频数较小制累计频率%8001285051090017349503570100043861050479411004896115050100表2-6居民户月消费品支出额较大制累计表居民户月消费品支出额下限元较大制累计频数较大制累计频率%600501008004998850459090033669501530100071410503611002422010年某地区24个工业企业的资料如表2-7所示。表2-72010年某地区24个工业企业的资料企业编号经济类型企业规模职工人数人全年总产值万元1国有企业中320035002国有企业大8500110003其他类型企业中240022004个体企业小3002005集体企业中8007406个体企业小1601207个体企业小80358集体企业小6530*********************************文件基本信息:文件名G:软件Desktop徐国祥截图29.swf文件版本9经过压缩宽:595pixels高:841pixels 帧数:1frame帧率:0fps共提取文字:761个9国有企业小1208010其他类型企业中1000120011集体企业中1800200012个体企业小40025013其他类型企业小1309414国有企业中900210015集体企业小27030016个体企业小46022017国有企业大56003000018国有企业大47002800019个体企业小30035020集体企业小28030021个体企业小16020022其他类型企业小20017023集体企业小1409724其他类型企业小90100试根据上述资料按经济类型和企业规模进行简单分组和复合分组计算各组企业数、职工人数和总产值并编制统计表。解1按经济类型做简单分组的统计表如表2-8所示。表2-8简单分组的统计表按经济类型分组企业数个职工人数人总产值万元国有企业集体企业个体企业其他类型企业66752302033551860382074680346713753764合计2432055832862按企业规模做简单分组的统计表如表2-9所示。表2-9简单分组的统计表按企业规模分组企业数个职工人数人总产值万元大型中型小型36151880010100315569000117402546合计2432055832863按经济类型和企业规模做复合分组的统计表如表2-10所示。表2-10复合分组的统计表按经济类型和企业规模分组企业数个职工人数人总产值万元国有企业62302074680大型中型小型32118800410012069000560080集体企业633553467*********************************文件基本信息:文件名G:软件Desktop徐国祥截图30.swf文件版本9经过压缩宽:595pixels高:841pixels帧数:1frame帧率:0fps共提取文字:828个大型中型小型—24—2600755—2740727个体企业718601375大型中型小型——7——1860——1375其他类型企业538203764大型申型小型—23—3400420—3400364合计243205583286l*********************************文件基本信息:文件名G:软件Desktop徐国祥截图31.swf文件版本9经过压缩宽:595pixels高:841pixels 帧数:1frame帧率:0fps共提取文字:163个第3章集中趋势和离散趋势3.1复习笔记一、集中趋势的测度常用来表述数列集中趋势的测度有算术平均数、调和平均数、几何平均数、中位数和众数。这些测度在统计学中也称为平均指标或平均数可以用来反映标志值的典型水平和标志值分布的中心位置或集中趋势。1算术平均数算术平均数是平均指标中最重要的一种。算术平均数的定义公式为总体标志总量算术平均数总体单位总量1简单算术平均数简单算术平均数是将总体的各个单位标志值简单相加然后除以单位个数求出的平均标志值。它的计算公式为121niniXXXXXNN…2加权算术平均数加权算术平均数的计算公式为11niiiniiXfXf其中if代表标志值Xi出现的次数或权数。2调和平均数调和平均数也称倒数平均数它是根据各标志值的倒数来计算的平均数即各个标志值倒数的算术平均数的倒数。简单调和平均数的计算公式为12311111HnNNXXXXXX…若设m为权数则加权调和平均数的计算公式为12313121123niniHnniinimmmmmXmmmmmXXXXX……3几何平均数几何平均数是计算平均比率和平均速度最适用的一种方法。适用于当标志总量表现为各个标志值的连乘积的情况。1简单几何平均数简单几何平均数是N个标志值连乘积的n次方根。其计算公式为123nNGnXXXXXX…2加权几何平均数*********************************文件基本信息:文件名G:软件Desktop徐国祥截图32.swf文件版本9经过压缩宽:595pixels高:841pixels帧数:1frame帧率:0fps共提取文字:659个3121123kiikiikfffffffGiXXXXXX…在用几何平均数法计算平均数时如果N大于2可采用对数法来计算。12311loglogloglogloglogGnXXXXXXNN…4中位数中位数是一种按其在数列中的特殊位置而决定的平均数。把总体各单位标志值按大小顺序排列后处在中点位次的标志值就是中位数它将全部标志值分成两个部分一半标志值比它大一半标志值比它小而且比它大的标志值个数和比它小的标志值个数相等。1未分组资料的中位数未分组资料时12N中位数位次。当总体位数N为奇数时中位数就是中位数位次上的那个数据而当N为偶数时中位数是中位数位次上两项数据的算术平均数。2分组资料的中位数①中位数的下限公式12memfSMLif其中L表示中位数所在组的下限mf表示中位数所在组的次数1mS表示小于中位数组的各组次数之和i表示中位数所在组的组距。②中位数的上限公式12memfSMUif其中U表示中位数所在组的上限1mS表示大于中位数组的各组次数之和。5众数 众数也是一种位置平均数。众数是总体单位中标志值出现次数最多的那个数值。单项数列中频数最多组的标志值就是众数。在组距数列的条件下先要确定众数所在组然后计算以求得近似的众数值。计算众数的下限公式为1012dMLidd上限公式为2012dMUidd。其中L表示众数组的下限U表示众数组的上限d1表示众数组次数与上一组次数之差d2表示众数组次数与下一组次数之差i表示众数组的组距。二、离散趋势的测度离散趋势的测度在统计学中也称为标志变异指标是用来描述数列中标志值的离散趋势与离散程度的。1极差极差是指一个数列中两个极端值即最大值和最小值之间的差异。其公式为极差=最大标志值最小标志值。根据组距数列求极差的计算公式为极差=最高组上限最低组下限。2四分位差四分位差是根据四分位数计算的。首先把变量各单位标志值从小到大排序再将数列四等分处于四分位点位次的标志值就是四分位数记作MlM2M3。四分位差的计算公式为*********************************文件基本信息:文件名G:软件Desktop徐国祥截图33.swf文件版本9经过压缩宽:595pixels高:841pixels帧数:1frame帧率:0fps共提取文字:955个312MM四分位差四分位差的计算步骤是先寻找四分位数然后根据四分位差的计算公式计算。1由未分组资料计算四分位数首先是确定四分位数的位次再找出对应位次的标志值即为四分位数。设样本容量为n则1314314nMnM的位次的位次如果14n计算出来的位次恰好是整数这时各位位次上的标志值即为相应的四分位数。如果14n计算出来的位次不是整数这时可用插值法计算四分位数即与该位次相邻的两个整数位次上的标志值的加权算术平均数权数的大小取决于两个整数位次与四分位次距离的远近距离越近权数越大。2由分组资料计算四分位数第i个四分位数的计算公式为14123miiiimiifSMLdif…其中Li表示第i个四分位数所在组的下限fmi表示第i个四分位数所在组的次数∑f表示总次数即为各组次数总和1miS表示小于第i个四分位数所在组的各组次数之和id表示第i个四分位数所在组的组距。3平均差平均差是各单位标志值对平均数的离差绝对值的平均数。平均差仅反映总体各单位标志值对其平均数的平均离差量。平均差愈大表明标志变异程度愈大反之则表明标志变异程度愈小。未分组资料时其计算公式为..XXADN;分组资料时其计算公式为..XXfADf4方差和标准差1未分组资料方差的公式为22XXN标准差的公式为2XXN2分组资料方差的公式为*********************************文件基本信息:文件名G:软件Desktop徐国祥截图34.swf 文件版本9经过压缩宽:595pixels高:841pixels帧数:1frame帧率:0fps共提取文字:686个22iXXff标准差的公式为2iXXff5离散系数离散系数是测定总体中各单位标志值变异的相对量指标以消除不同总体之间在计量单位和平均水平方面的不可比因素。常用的离散系数主要有平均差系数VA.D.和标准差离散系数V两种。其公式分别为....100%100%ADADVXVX6偏度和峰度1偏度偏度是用来反映变量数列分布偏斜程度的指标。变量数列的单峰钟形分布有对称分布和非对称分布两种非对称分布也即为偏态分布具体包括右偏分布和左偏分布。偏度系数的计算方法通常有两种①Pearson偏度系数0XMSKSK为无量纲的系数通常取值在3+3之间。其绝对值大表明偏斜程度大反之则表明偏斜程度小。利用平均数X、中位数Me、众数M0的位置关系来大致判断分布是对称分布还是偏态分布。当0eXMM0SK分布为对称分布。当0eXMM0SK分布呈右偏态也称为正偏态。当0eXMM0SK分布呈左偏态也称为负偏态。②动差法取变量中的A值为中心点时定义变量X关于A的K阶矩为当A=0时即变量以原点为中心M称为原点K阶矩。当A=X时即变量以算术平均数为中心M称为K阶中心矩。动差法计算的偏度系数记为其计算公式为333mm为三阶中心矩α=0分布呈对称α0分布呈负左偏态α值越小负偏程度愈高α0分布呈正右偏态α值越大正偏程度愈高。2峰度峰度是用来反映变量数列曲线顶端尖峭或扁平程度的指标它是统计学中描述次数分布的另一特征指标。测定分布的峰度可用标准差的四次方除以四阶中心矩的方法来计算。峰度系数记为β*********************************文件基本信息:文件名G:软件Desktop徐国祥截图35.swf文件版本9经过压缩宽:595pixels高:841pixels帧数:1frame帧率:0fps共提取文字:765个44m一般来说当β=3时变量数列的曲线为正态曲线当β3时为尖顶曲线且β越大顶部尖峭程度越高当β3时为平顶曲线且β值越小顶部就更趋平坦当β=1.8时变量数列的曲线呈矩形分布当β1.8时变量数列的曲线就呈U形分布。3.2课后习题详解1试述平均数在统计分析中的作用。 答常用来表述数列集中趋势的测度有算术平均数、调和平均数、几何平均数、中位数和众数。这些测度在统计学中也称为平均指标或平均数它们可以用来反映标志值的典型水平和标志值分布的中心位置或集中趋势。2平均数有哪几种应用最广泛的是哪一种它们在统计应用中各有什么用途答1平均数平均指标有算术平均数、调和平均数、几何平均数、中位数和众数五种。2应用最广泛的是算术平均数。3①算术平均数又称均值。它是集中趋势最主要的测度值在统计学中具有重要的地位是进行统计分析和统计推断的基础。它主要适用于数值型数据但不适用于品质数据。②调和平均数主要用于在不掌握各组单位数的资料及总体单位数只掌握各组的标志值和各组的标志总量及总体总量情况下计算平均指标。③几何平均数要求各观察值之间存在连乘积关系它的主要用途是对比率、指数等进行平均计算平均发展速度。④中位数主要用于顺序数据也适用于数值型数据但不适用于分类数据。中位数是一个位置代表值不受极端值的影响抗干扰性强所谓极端值就是明显比其他数据大得多或小得多的数值。⑤众数是一组数据中出现频数最多的那个数值用于反映集中趋势非常直观不仅适用于品质数据也适用于数值型数据。众数是一个位置代表值不受极端值的影响抗干扰性强。3试述算术平均数的数学性质。答算术平均数是平均指标中最重要的一种。可分为简单算术平均数和加权算术平均数。1简单算术平均数是将总体的各个单位标志值简单相加然后除以单位个数求出的平均标志值。其计算公式为121…niniXXXXXNN2当资料中被平均的变量值重复出现时例如某个变量值X重复出现f次按照简单平均法就要对变量值X连加f次。为了简化计算可以用X乘以来代替同一变量值X的连加f次。用这种方法计算的平均数就称为加权算术平均数。其计算公式为11niiiniiXfXf4常用的标志变异指标有哪些各种指标的作用和局限性怎样答常用的标志变异指标有极差、四分位差、平均差、方差和标准差、离散系数、偏度和峰度等。1极差是测定标志变动程度的一种粗略方法它计算简便易于理解。但它只受极端值的影响测定的结果往往不能反映数据的实际离散程度。2与极差相比四分位差因不受极值的影响在反映数据的离散程度方面比极差准确具有较高的稳定緵E ?*********************************文件基本信息:文件名G:软件Desktop徐国祥截图36.swf文件版本9经过压缩宽:595pixels高:841pixels帧数:1frame帧率:0fps共提取文字:1175个性同时对于存在开口的组距数列不能计算极差但可以计算四分位差。但是它也是只由两个标志值确定的不能充分利用数列的全部信息也无法反映标志值的一般变动。3平均差是各单位标志值对平均数的离差绝对值的平均数。平均差仅反映总体各单位标志值对其平均数的平均离差量。4平均差对离差采用绝对值避免了正负离差求和时互相抵消的问题但绝对值不便于代数运算而方差和标准差可弥补这一不足。将方差开平方得到的即为标准差这是为了使变量单位同数据单位一致。5对于不同水平即平均指标不相同的总体不易直接用标准差等比较其变动度的大小而需要利用离散系数进行比较。因为离散系数是将标准差等和相应的平均数进行对比消除了平均水平高低不同的影响。6偏度和峰度是描述数列分布的形状是否对称、偏斜程度以及分布的扁平程度等。其中偏度是用来反映变量数列分布偏斜程度的指标峰度是用来反映变量数列曲线顶端尖峭或扁平程度的指标它是统计学中描述次数分布的另一特征指标。5为什么要计算离散系数常用的离散系数有哪几种答1极差、四分位差、平均差、方差和标准差、离散系数、偏度和峰度等各种标志变异度指标都是对总体中各单位标志值变异测定的绝对量指标。在统计研究中为了对不同的总体的标志变异度进行对比分析往往还需要有测定总体中各单位标志值变异的相对量指标即离散系数以消除不同总体之间在计量单位和平均水平方面的不可比因素。2常用的离散系数主要有平均差系数..ADV和标准差系数V两种。其公式分别为....100%100%ADADVVXX6某市地毯公司所属三个工厂的全年销售额和利润率分别如表3-1所示。表3-1某市地毯公司所属三个工厂全年销售与利润情况销售额千元利润率一厂二厂三厂2000300050008.25.64.2要求1试计算利润率的简单平均数2试计算以销售额加权的平均利润率3试问综合利润率应是简单平均数还是加权平均数为什么解1利润率的简单平均数8.2%5.6%4.2%6%3。2以销售额加权的平均利润率20008.2%30005.6%50004.2%200030005000=5.42%。3综合利润率应是加权平均数。由1和2的结果可知利润率平均数的大小不仅取决于各厂的标志值而且还受到各厂销售额大小的影响销售额也称为权数即它对平均的结果起权衡轻重的作用。7设市场上某种蔬菜早市每千克价格为0.25元中市每千克价格为0.20元晚市每千克价格为0.10元。试计算各买1千克的平均价格和各买l元的平均价格。解1各买1千克的平均价格=0.250.200.100.183元/千克。2该市场在早市时1元可以买41/0.25千克蔬菜中市时1元可以买51/0.2千克蔬菜晚市时1元可以买101/0.1千克。所以各买l元的平均价格40.2550.2100.10.164510 元/千克8某工业公司所属的12个企业按产值计划完成程度的分组资料如表3-2和表3-3所示。*********************************文件基本信息:文件名G:软件Desktop徐国祥截图37.swf文件版本9经过压缩宽:595pixels高:841pixels帧数:1frame帧率:0fps共提取文字:1371个表3-2某工业公司12个企业产值计划完成情况分组按产值计划完成程度分组组中值企业数个计划产值万元90100100110110120951051152731200128002000合计—1216000表3-3某工业公司12个企业产值计划完成情况分组资料按产值计划完成程度分组组中值实际产值万元90100100110110120951051151140134402300合计—16880要求1根据表3-2资料0什么方法计算产值计划平均完成程度为什么并计算之。2根据表3-3资料应该用什么方法计算产值计划平均完成程度为什么并计算之。3试比较以上两者计算结果是否一致如果是一致的请说明原因。解1表3-2给出了各分组的企业数和计划产值以计划产值为作为权数这里不能以企业个数作为权数只有当各个企业的计划利润全部相同时才可以以企业个数为权数进行加权算术平均。则产值计划平均完成程度=95%1200105%12800115%200016000=105.5%2表3-3中给出了实际产值故以实际产值作为权数采用加权调和平均数即产值计划平均完成程度=1140134402300105.5%114013440230095%105%115%3由1和2可知两者计算结果是一致的。因为1中分子计算出来的实际产值与2中的实际产值相等2中分母计算出的计划产值与1中的计划产值相等所以两者计算结果是一致的。9某企业20012006年各年工业产值按不变价格计算资料如表3-4所示。表3-4某企业20012006年各年工业产值2001年2002年2003年2004年2005年2006年工业总产值万元250275286303327377要求根据表3-4资料计算20012006年的平均发展速度。解2002年的发展速度2751.12502003年的发展速度2861.042752004年的发展速度3031.062862005年的发展速度3271.083032006年的发展速度3771.15327。由几何平均数法得20012006年的平均发展速度51.11.041.061.081.051.085*********************************文件基本信息:文件名G:软件Desktop徐国祥截图38.swf文件版本9经过压缩宽:595pixels 高:841pixels帧数:1frame帧率:0fps共提取文字:1079个10某工厂有59个工人对某种部件装配时间的分组资料如表3-5所示。表3-5某工厂某种部件装配时间分组资料装配时间分组分组中值分X工人人数人f162020242428283232363640182226303438161423105合计—59要求根据表3-5资料分别计算算术平均数、中位数和众数。解1以各组的组中值为标志值代入加权算术平均数的公式得1812263852959…XfXf分2由于数据为组距资料中位数的位次为5929.522f至第三组止为1+6+14=21个至第四组止为21+23=55个中位数就在第四组内。12memfSMLif29.52128429.5233装配时间在2832分这一组的工人人数最多即为众数组。众数组的下限L=28众数组次数与上一组次数之差123149d众数组次数与下一组次数之差2231013d众数组的组距i=4。由下限公式可得112odMLidd928429.6913112006年某市某家用电器商场每个售货员的销售额最高为60万元最低为20万元。其分组数列的统计资料如表3-6所列。表3-6某家电商场销售额分组统计资料按每个售货员的销售额分组万元售货员人数人20303040405050605354515合计100要求根据表3-6资料计算极差、四分位差、平均差、标准差及各自的离散系数。解1极差R=最高销售额最低销售额6020=40万元。2首先确定M1的位次254f它说明第一个四分位数是位于3040组的。L1=30fm1=35Sm1-1=5d1=4030=10255301035.7135M万元。其次确定M3的位次3754f它说明第三个四分位数是位于4050组的。L3=40fm3=45Sm3-1=5+35=40d1=5040=1037540401047.7845M万元。*********************************文件基本信息:文件名G:软件Desktop徐国祥截图39.swf文件版本9经过压缩宽:595pixels高:841pixels帧数:1frame帧率:0fps共提取文字:962个所以四分位差47.7835.716.042万元。3由表3-6进行计算结果如表3-7所示。表3-7按每个售货员的销售额分组万元组中值万元X售货员人数人f各组售货员的销售总额万元Xf离差绝对值||XX203030404050506025354555535451512512252025825177313合计100则1251225202582542100万元XfXf||5173574531513..6.6100XXfADf万元222222()175735345131561100XXff7.81极差系数VR=4042极差X=0.952平均差系数....6.60.15742ADADVX标准差系数离散系数7.810.18642VX。12某企业某车间甲、乙两个班各有工人6 名每人日产零件数如下甲班61013161920乙班91112141820要求根据上述资料分别计算甲、乙两个班的全距和标准差并加以比较说明。解1甲班全距=最大值最小值=206=1461013161920146甲X22222()6141014201424.336甲…XXN2()24.334.93甲XXN2乙班全距=最大值最小值=209=1191120146乙…X22222()91411142014156乙…XXN*********************************文件基本信息:文件名G:软件Desktop徐国祥截图40.swf文件版本9经过压缩宽:595pixels高:841pixels帧数:1frame帧率:0fps共提取文字:793个2()153.87乙XXN由于甲班和乙班的均值相等但是乙甲并且甲班全距大于乙班全距这说明乙班的每人日产零件具有较大代表性。13某农村抽样调查队对某县两个乡的小麦产量分别进行抽样调查结果如表3-8所示。表3-8某县两个乡小麦产量抽样调查结果单位千克甲乡乙乡每亩平均产量标准差3504048052要求试比较两个样本的变异程度大小。解由于400.114350甲V>520.108480乙V即乙甲VV所以甲乡小麦产量的变异程度较大。14某市某企业有1000名工人某年底按工人工资额分组的分布数列如表3-9所示。表3-9某企业按工人工资额分组统计资料工人按工资额分组元组中值X元工人数f人累计工人数人30040040050050060060070070080080090090010001000110011001200350450550650750850950105011502050180250200150100302020702505007008509509801000合计—1000—要求1绘制工人按工资额分组的频数分布曲线图2分别计算算术平均数、众数、中位数和标准差。解1绘制按工资额分组的工人数频数分布曲线图如图3-1所示。图3-1频数分布图?*********************************文件基本信息:文件名G:软件Desktop徐国祥截图41.swf文件版本9经过压缩宽:595pixels高:841pixels帧数:1frame帧率:0fps 共提取文字:681个2①算术平均数35020450501150207181000…XfXf。②工资额在600700这一组的工人人数最多即为众数组。众数组的上限U=700众数组次数与上一组次数之差125018070d众数组次数与下一组次数之差225020050d众数组的组距i=100众数的上限公式为212odMUidd50700100658.37050③中位数的位次为100050022f至第四组止为500中位数就在第四组内。12memfSMLif500250600100700250④22()XXff2223507182045071850115071820100218952.8…2()218952.8467.9XXff15A、B两商店在2005年最后100天里的日销售额分组的分布数列如表3-10所示。表3-10A、B商店的日销售额分组统计资料日销售额分组元A商店B商店700900900110011001300130015001500170017001900190021009272418135421425371455合计100100要求分别计算A、B商店日销售额的均值、中位数、四分位数、众数、标准差、四分位差以及偏度和峰度系数并进行对比分析。解1对于A商店由已知数据进行计算计算结果如表3-11所示。*********************************文件基本信息:文件名G:软件Desktop徐国祥截图42.swf文件版本9经过压缩宽:595pixels高:841pixels帧数:1frame帧率:0fps共提取文字:709个表3-11日销售额分组元组中值X元A商店f()XX2()XXf3()XXf4()XXf700900900110011001300130015001500170017001900190021008001000120014001600180020009272418135446026060140340540740190440018252008640035280015028001458000219040087602400047455200051840004939200051095200078732000016208960004.02971E+111.23384E+1131104000069148800001.73724E+114.25153E+111.19946E+12合计100932000016128000002.33192E+12①A8009100027200041260100…XfXf②中位数的位次为1005022f至第三组止为50中位数就在第三组内。12memfSMLif50(927)11002001216.724③首先确定M1的位次254f它说明第一个四分位数是位于9001100组的。L1=900fm1=27Sm1-1=9d1=1100900=2002599002001018.527M元。其次确定M3的位次3754f它说明第三个四分位数是位于13001500组的。L3=1300fm3=18Sm3-1=9+27+24=60d1=15001300=2003756013002001466.718M元四分位差=311466.71018.5224.122MM。④日销售额在9001100这一组的天数最多即为众数组。则由下限公式可得112odMLidd189002001071.4183⑤22A()XXff222(8001260)9(10001260)27(20001260)410093200… 2A()93200305.3XXff。⑥33()161280000016128000100XXfmf则偏度系数为3A332387682.560.084305.3m*********************************文件基本信息:文件名G:软件Desktop徐国祥截图43.swf文件版本9经过压缩宽:595pixels高:841pixels帧数:1frame帧率:0fps共提取文字:1139个412104()2.33192102.3319210100XXfmf则峰度系数为104A442.33192102.68305.3m。2对于B商店由已知数据进行计算计算结果如表3-12所示。表3-12日销售额分组元组中值X元B商店f()XX2()XXf3()XXf4()XXf7009009001100110013001300150015001700170019001900210080010001200140016001800200021425371455588388188122124126126914882107616883600532862921684872018727204065949448177550081661168006393613339379234967264011461046402.39078E+113.17289E+1131229958400767232282794839041.44065E+117.01416E+11合计10070386882387682561.46136E+12B8002100014200051388100…XfXf中位数就在第四组内利用中位数的下限公式可得12memfSMLif50(21425)13002001348.637③利用四分位数的下限公式可得25161100200117225M3752142513002001483.737M四分位差=311483.71172155.922MM。④日销售额在13001500这一组的天数最多即为众数组。则由下限公式可得112odMLidd(3725)13002001369(3725)(3714)⑤2B()70386.88265.3XXff。⑥33()2387682562387682.56100XXfmf则偏度系数为3B332387682.560.128265.3m412104()1.46136101.4613610100XXfmf则峰度系数为104B441.46136102.95265.3m。*********************************文件基本信息:文件名G:软件Desktop徐国祥截图44.swf文件版本9经过压缩宽:595pixels高:841pixels帧数:1frame 帧率:0fps共提取文字:1110个由以上计算结果可知①B商店的日销售额均值大于A商店的均值且B商店日销售额的标准差小于A商店的标准差所以B商店的日销售额具有较大代表性②偏度系数αB>αA>0说明A、B两商店的日销售额低于平均数的变量次数比高于平均数的变量次数更多分布均呈正右偏态且B商店的日销售额的正偏程度比A商店的高③峰度系数βA<βB<3即A、B两商店的日销售额为平顶曲线次数分布的峰顶较正态分布的曲线更为平滑表明变量数列的次数在众数附近比较分散且商店A的曲线顶部比商店B的曲线顶部更趋平坦。3.3典型习题详解一、单项选择题1标志值较小的一组其权数较大时则算术平均数()。A接近标志值较大的一组B接近标志值较小的一组C不受权数影响D仅受标志值影响【答案】B【解析】权数即标志值X出现的次数。它表示该标志值在决定平均数水平方面的作用的大小。权数越大标志值X在决定平均数水平方面的作用也相对大反之其作用也相对小。2如果所有标志值的频数都减少为原来的1/5而标志值仍然不变那么算术平均数()。A不变B扩大到原来的5倍C减少为原来的1/5D不能预测其变化【答案】A【解析】算术平均数是总体标志总量和总体单位总量的比值。计算公式为XfXfX为标志值f为频数。如果所有标志值的频数都减少为原来的1/5而标志值不变则1515XfXfXff即算术平均数不变。3在下列两两组合的平均指标中两个平均数完全不受极端数值影响的是()。A算术平均数和中位数B几何平均数和众数C算术平均数和众数D众数和中位数【答案】D【解析】将总体中各单位的标志值按大小顺序排列则处于数列中的中点位置的标志值就是中位数。众数是指总体单位中标志值出现次数最多的那个数值。它们是位置代表值不受极端数值影响。4现有一数列3927812437292187反映其平均水平最好用()。A算术平均数B调和平均数C几何平均数D众数【答案】C【解析】此数列的特点是数据分散不适合用众数存在极大值和极小值不适合用易受极端值影响的算术平均数和调和平均数几何平均数受极端值的影响相对算术平均数和调和平均数小因而此数列最好用几何平均*********************************文件基本信息:文件名G:软件Desktop徐国祥截图45.swf文件版本9经过压缩宽:595pixels高:841pixels帧数:1frame帧率:0fps共提取文字:994个数。5下列关于众数的叙述不正确的是。A一组数据可能存在多个众数B众数主要适用于分类数据C一组数据的众数是唯一的D众数不受极端值的影响【答案】C【解析】众数是一组数据中出现次数最多的变量值用MO表示其主要用 于测度分类数据的集中趋势也适用于作为顺序数据以及数值型数据集中趋势的测度值。众数是一个位置代表值它不受数据中的极端值影响一组数据的众数可能只有一个也可能有几个也可能没有众数。6当一组数据属于左偏分布时则。A平均数、中位数与众数是合而为一的B众数的数值较小平均数的数值较大C众数在左边平均数在右边D众数在右边平均数在左边【答案】D【解析】记XeMoM分别为一组数据的平均数中位数和众数三者的关系如下oeoeeoMMXMMXXMM分布为对称分布分布呈右偏态分布呈左偏态所以当一组数据属于左偏分布时众数在右边平均数在左边。7一组数据的最大值与最小值之差称为。A平均差B标准差C极差D方差【答案】C8四分位差是。A上四分位数减下四分位数的结果B下四分位数减上四分位数的结果C下四分位数加上四分位数D下四分位数与上四分位数的中间值【答案】A9四分位数实际上是一种。A算术平均数B几何平均数C位置平均数D数值平均数【答案】C【解析】四分位数是指把变量各单位标志值从小到大排序再将数列四等分处于四分位点位次的标志值。因此四分位数是一种位置平均数。10四分位差排除了数列两端各单位标志值的影响。A10%B15%C25%D35%【答案】C*********************************文件基本信息:文件名G:软件Desktop徐国祥截图46.swf文件版本9经过压缩宽:595pixels高:841pixels帧数:1frame帧率:0fps共提取文字:780个【解析】四分位差是根据四分位数计算的。记第一、二、三四分位数分别为MlM2和M3则四分位差=(M3M1)/2。其意义是去掉数列中四分之一最小的部分和四分之一最大的部分即去掉小于M1和大于M3的标志值再根据中间50部分来测定四分之一全距为多少即四分位数排除了数列两端各25%单位标志值的影响。11方差是数据中各变量值与其算术平均数的。A离差绝对值的平均数B离差平方的平均数C离差平均数的平方D离差平均数的绝对值【答案】B【解析】方差的计算公式为22()XXN其中σ2表示方差X为各变量值X为各变量值的算术平均数N为总体单位数。即方差是数据中各变量值与其算术平均数的离差平方的平均数。12若n=20200x22080x则标准差为()。A1.5B2C3D4【答案】B【解析】由于200x所以其算术平均数2001020xxn故标准差222()xxxxnnn220802002020=213离散趋势指标中最容易受极端值影响的是。A极差B平均差C标准差D标准差系数【答案】A【解析】离散趋势的测度是用来描述数列中标志值的离散趋势与离散程度的。常用的离散趋势的测度指标有极差、四分位差、平均差、方差和标准差、离散系数、偏度和峰度等。极差是指一个数列中两个极端值即最大值和最小值之间的差异。其计算公式为极差=最大标志值最小标志值。极差是测定标志变动程度的一种粗略方法它计算简便易于理解但它只受极端值的影响测定的结果往往不能反映数据的实际离散程度。14若甲单位的平均数比乙单位的平均数小但甲单位的标准差比乙单位的标准差大则()。A 甲单位的平均数代表性比较大B甲单位的平均数代表性比较小C两单位的平均数代表性一样D无法判断【答案】B【解析】平均数的代表性可以用离散趋势来衡量。本题中已知标准差和平均数的关系可采用最常用的离散系数――标准差系数其越大平均数的代表性就越小。公式为XV由已知得VV乙甲即甲单位的平均数代表性比较小。鯪*********************************文件基本信息:文件名G:软件Desktop徐国祥截图47.swf文件版本9经过压缩宽:595pixels高:841pixels帧数:1frame帧率:0fps共提取文字:967个15一组数据的偏度系数为1.3表明该组数据的分布是。A正态分布B平顶分布C左偏分布D右偏分布【答案】D【解析】偏度是用来反映变量数列分布偏斜程度的指标。偏度系数的计算方法通常有两种①偏度系数SK000oXMSK分布呈左偏态分布为对称分布分布呈右偏态②偏度系数α33000m分布呈左偏态分布为对称分布分布呈右偏态题中数据的偏度系数是1.3>0表明该组数据的分布是右偏分布。二、多项选择题1平均数的作用是。A反映总体的规模B反映总体的一般水平C测定总体各单位的离散程度D测定总体各单位分布的集中趋势E对不同时间、不同地点、不同部门的同质总体进行平均【答案】BDE2下列应采用加权算术平均数的情况有()。A已知生产同种产品的四个企业的计划完成程度和计划产量求平均计划完成程度B已知某车间的工人数和每人每日生产某种零件数求平均每个工人日产量C已知某种产品在不同集贸市场上的销售单价和销售额求平均价格D已知某种产品在不同集贸市场上的销售单价和销售量求平均价格E已知各车间劳动生产率和职工人数求企业总劳动生产率【答案】ADE【解析】加权算术平均数是根据分组的资料计算的其分子是将各组标志值乘以各组相应的次数得各组标志总量然后加总再除以总次数。其公式为112212nnnxfxfxfxfxffff……ABDE三项科分别以计划产值、工人数、销售量、职工人数作为权数应用加权算术平均数来计算。3加权算术平均数的大小()。A受各组频数大小的影响B受各组标志值大小的影响C受各组单位数占总体单位总数比重的影响D与各组标志值大小无关E受各组变量值占总体标志总量比重的影响【答案】ABC*********************************文件基本信息:文件名G:软件Desktop徐国祥截图48.swf文件版本9经过压缩宽:595pixels 高:841pixels帧数:1frame帧率:0fps共提取文字:833个【解析】加权算数平均数的公式iiwxfxfx其中ffwi。由公式可以看出其大小不仅受各组标志值大小的影响还受各组频数大小的影响同时也受到各组单位数占总体单位总数比重的影响。4受极端值影响比较大的平均数有()。A算术平均数B调和平均数C几何平均数D众数E中位数【答案】ABC【解析】ABC三项中的三种平均数根据总体各单位所有标志值计算而得的平均指标即数值平均数他们都受极端值较大的影响。三者中几何平均数受极端值影响的程度相对较轻众数和中位数是位置代表值他们的优点就是不受极端值的影响。5几何平均数适合()。A等差数列B等比数列C标志总量等于各标志值之和D标志总量等于各标志值之积E具有极大极小值的数列【答案】BD【解析】几何平均数分位简单几何平均数和加权几何平均数两种。一般来说只有当标志总量表现为各个标志值的连乘积时才适合采用几何平均数方法来计算平均标志值。6众数是。A位置平均数B总体中出现次数最多的标志值C不受极端值的影响D适用于总体单位数多明显集中趋势的情况E处于变量数列中点位置的那个标志值【答案】ABCD【解析】众数是指总体单位中标志值出现次数最多的那个数值。众数是一种位置平均数它不受极端值的影响。单项数列中频数最多组的标志值就是众数众数的计算只适用于单位数较多且存在明显的集中趋势的情况否则计算众数是没有意义的。处于变量数列中点位置的那个标志值是中位数。7中位数是。A由标志值在变量数列中所处的位置决定的B根据标志值出现的次数决定的C总体单位水平的平均值D总体一般水平的代表值E不受总体中极端数值的影响【答案】ADE【解析】中位数是一种按其在数列中的特殊位置而决定的平均数。把总体各单位标志值按大小顺序排列后处在中点位次的标志值就是中位数它将全部标志值分成两个部分一半标志值比它大一半标志值比它小而且比它大的标志值个数和比它小的标志值个数相等。中位数是一种位置平均数所以它代表了总体的一般水平并且不受总体中极端数值的影响。8关于极差下列说法正确的有。wf*********************************文件基本信息:文件名G:软件Desktop徐国祥截图49.swf文件版本9经过压缩宽:595pixels高:841pixels帧数:1frame帧率:0fps共提取文字:958个A只能说明变量值变异的范围B不反映所有变量值差异的大小C反映数据的分配状况D最大的缺点是受极端值的影响E最大的优点是不受极端值的影响【答案】ABD 【解析】极差是指一个数列中两个极端值即最大值和最小值之间的差异。根据极差的大小能说明标志值变动范围的大小。其计算公式为极差=最大标志值—最小标志值。极差的优点是容易理解、计算方便极差的缺点是不能反映全部数据分布状况易受到极值的影响。9不同数据组间各标志值的差异程度可以通过离散系数进行比较因为离散系数。A消除了不同数据组各标志值的计量单位的影响B消除了不同数列平均水平高低的影响C消除了各标志值差异的影响D数值的大小与数列的差异水平无关E数值的大小与数列的平均数大小无关【答案】AB【解析】离散系数是测定总体中各单位标志值变异的相对量指标以消除不同总体之间在计量单位和平均水平方面的不可比因素。常用的离散系数主要有平均差系数(VA.D.)和和标准差系数(V)其计算公式分别为....100%100%ADADVXVX10须计算离散系数来比较两数列的离散程度大小的情况有()。A平均数大的标准差亦大平均数小的标准差亦小B平均数大的标准差小平均数小的标准差大C两数列的计量单位不同D两平均数相等E两标准差相等【答案】AC【解析】当两数列的平均数相等时可直接计算标准差比较其离散程度的大小当两数列的标准差相等时平均数大的离散程度小反之成立当两数列的均数和标准差都不相等时①平均数大的标准差小平均数小的标准差大依据离散系数XV可推得前者V小于后者②平均数大的标准差亦大平均数小的标准差亦小须计算离散系数当两数列的计量单位不同时须计算离散系数。11下列指标中反映数据组中所有数值变异大小的指标有。A四分位差B平均差C标准差D极差E离散系数【答案】BCE【解析】四分位差平均差标准差极差离散系数都是标志变异指标但是四分位差只利用了数据组中的四分位数极差只利用了数据组中的两个极端值即最大值和最小值所以它们无法反映数据组中所有数值变异的大小。;*********************************文件基本信息:文件名G:软件Desktop徐国祥截图50.swf文件版本9经过压缩宽:595pixels高:841pixels帧数:1frame帧率:0fps共提取文字:954个'