• 1.03 MB
  • 2022-04-22 13:33:13 发布

主成分与因子分析的发展水平的应用毕业论文.doc

  • 32页
  • 当前文档由用户上传发布,收益归属用户
  1. 1、本文档共5页,可阅读全部内容。
  2. 2、本文档内容版权归属内容提供方,所产生的收益全部归内容提供方所有。如果您对本文有版权争议,可选择认领,认领后既往收益都归您。
  3. 3、本文档由用户上传,本站不保证质量和数量令人满意,可能有诸多瑕疵,付费之前,请仔细先通过免费阅读内容等途径辨别内容交易风险。如存在严重挂羊头卖狗肉之情形,可联系本站下载客服投诉处理。
  4. 文档侵权举报电话:19940600175。
'主成分与因子分析的发展水平的应用毕业论文目录摘要IAbstractII第1章绪论11.1选题的背景和提出11.1.1选题的背景11.1.2选题的提出21.2选题的意义和目的31.2.1选题的意义31.2.2选题的目的31.3主成分分析和因子分析的发展及应用41.3.1主成分分析的发展及应用41.3.2因子分析的发展及应用41.4本文主要研究内容5第2章主成分与因子分析62.1主成分分析的内容62.1.1主成分分析原理和基本思想62.1.2主成分的几何意义631 2.1.3主成分分析的性质82.2主成分分析的求解方法和数学模型82.3主成分分析的基本步骤112.4因子分析的内容122.4.1因子分析原理和基本思想122.4.2因子分析的性质132.5因子分析的求解方法和数学模型132.5.1数学模型(正交因子模型)132.5.2因子模型中公共因子,因子载荷量的统计意义142.5.3因子旋转与因子得分152.6计算步骤16第3章主成分与因子分析在黑龙江省城市经济水平研究中的应用173.1主成分分析法183.2因子分析法213.3综合评价结果分析25结论27致谢28参考文献2931 第1章绪论1.1选题的背景和提出1.1.1选题的背景经济的发展不仅仅意味着国民经济规模的扩大,更意味着经济和社会生活素质的提高。所以,经济发展涉及的内容比单纯的经济增长更为广泛。就现代经济而言,发展的含义十分丰富复杂。发展总是与发达、工业化、现代化、增长之间交替使用。一般来说,经济发展包括三种含义[1]:第一种,经济量的增长,即一个国家或地区产品和劳务的增加,它是经济发展的物质基础;第二种,经济结构的改善,即一个国家或地区的技术、产业结构、收入分配、消费结构及人口结构等经济结构的变化;第三种,经济质量的完善和提升,即一个国家或地区经济效益的提升、经济稳定程度、卫生健康状况的完善、自然环境和生态平衡以及政治、文化和人的现代化进程。在近10年加快改革开放的步伐中,我国地区之间的发展不平衡呈现了不断的加剧局面。有调查显示,目前中国城市与农村发展差异化比较严重,在第九个五年计划期间所统计到的数据显示,中国农业从业者的收入一直在下降,粮食产品的价格也在下降,虽然收成增产了,但收入却不见增加,地方政府对城市经济发展的重视程度要远远大于农业。除了造成了农村经济发展失衡外,也促使了城市经济发展过程中贫富差距问题的深化,也使社会分配不公平现象得到剧增,更令社会当中不稳定的因素有所增加。除去城乡发展不平衡,我国东中西部发展差距也较大,主要表现在以下两方面:一是在资本存量方面:沿海地区由于开放得比较早,以乡镇企业为代表的民营经济迅速增长,资本大量累积;同时因为改革开放一系列优惠政策的实施,成功地吸引了大量国外资本的输入,这为沿海地区快速的经济增长提供了充足的资本投入。但是由于中西部地理位置和政策的影响资本存量都不及东部,而而还有愈演愈烈的趋势。二是科技投入方面:东部是优势地区,据调查显示1990年东部地区从事科技活动人数是中部地区的2倍,西部地区的3倍;迄今,东部此类人才数量增加到中部的2.5倍,西部的4倍。尤其是在200031 年东部从事科技活动人员比上年激增48%,但中西部地区同期分别只增长了19%、32%。东部地区20世纪90年代以来加大了研发经费投入力度,2000年东部研发经费支出比上年增长了87%,到2010这一年经费开支增加到2000年的2.4倍,而中西部地区研发经费支出基本保持1.3∶1的态势,在1990到1999年增长较慢,2000年开始逐年稳步增长,但从绝对数量来看远低于东部地区。经济发展不能以危害环境为代价,可持续发展的要求是一个国家或地区的发展不能影响其他国家或地区的发展,可持续性则意味着维持全人类福利的自然资源基础,使生态环境和经济社会协调全面地发展。了解我国各省市经济发展情况对推动我国经济发展有着重要作用,所以对各省经济的研究是很必要的。1.1.2选题的提出黑龙江省位于中国东北部,是我国著名的老工业基地,2008年全年实现地区生产总值(GDP)8310.0亿元,在各省自治区中排名17位,按可比价格计算比上年增长11.8%,连续五年保持11.6%以上的增幅,整体经济继续在较高的增长平台运行。其中,第一产业增加了1089.1亿元,增长8.2%;第二产业增加了4365.9亿元,增长12.1%;第三产业增加了2855亿元,增长12.4%。三次产业构成为13.1:52.5:34.4。第一、二、三产业对GDP的增长贡献率分别为7.8%、55.7%和36.5%。人均地区生产总值为21727元,增长11.7%。经济发展布局进一步优化。全年哈大齐工业走廊项目区实现工业总产值296.4亿元,比上年增长37.6%;创造利税46.5亿元,增长92.1%。全年完成固定资产投资投资117.8亿元,增加241项新开工项目,新增入251户区企业,新增了182户的投产企业。东部煤电化基地建设区充分挖掘和发挥电力、煤化工、冶金、建材原料、生物工程等产业的优势,坚持走新型工业化道路。东北亚经济贸易开发区积极主动推进区域的经济贸易合作,打造了面向东北亚、亚欧大陆的经济贸易开发区。加快大小兴安岭生态功能保护区发展特色产业、生态产业等替代产业,优化产业结构,加快基础设施建设,努力形成以生态经济为主的产业格局。两大平原农业综合开发试验区主要抓好农业基础建设、农业结构调整,做大做强畜牧产业,以大力推进农业标准化、规模化和产业化经营,致力于打造销售收入千亿元以上龙头企业集群,创出一批知名品牌。北国风光特色旅游开发区积极开发具有国际性、地域性和市场竞争力较强的旅游精品和品牌。哈牡绥东对俄贸易加工区的对内对外开放战略升级逐步加快。增强了31 高新科技产业集中开发区发挥高新技术集聚效应,发展取得积极进展的有服务外包产业、动漫基地。黑龙江省主要有12个地级市,这些城市的综合发展是带动周边地区经济发展的重要动力。这些城市的发展状况直接关系到城市自身和周边地区(尤其是小城镇)的进步,对这些城市进行分析评价,从而有效的根据城市的实际情况,采取促进经济和社会发展的有效措施。对黑龙江省的经济研究的现况是没有把这12个城市放在一起进行多指标综合评价。而目前国内外关于多指标综合评价的方法很多,根据权重确定方法的不同,这些方法可大致分为两类;一类是主观赋权法,如层次分析法,德尔菲法等,多是采用综合咨询评分的定向方法,这类方法因受到人为因素的影响,往往会夸大或降低了某些指标的作用,致使排序的结果不能完全真实地反应事物间真实关系;另一类是客观赋权法,即根据各指标间的相关关系或各指标值的变异程度来确定权数,避免了人为因素带来的偏差,如主成分分析法和因子分析法。1.2选题的意义和目的1.2.1选题的意义经济是指一个国家国民经济的总称[2]。区域经济是在一定区域内经济发展的内部因素与外部条件相互影响而形成的综合性经济概念,它受到该区域的自然条件、资源开发和利用状况、社会经济条件以及经济政策等各种因素的制约和影响。经济发展为一个国家摆脱贫困落后状态,走向经济和社会生活现代化的过程。区域经济发展不仅意味着该区域国民经济规模的扩大,更意味着经济和社会生活素质的提高。我们要提高某地方人民的生活水平,要更好更快地发展某个地方,就必须充分了解这个地方现有的经济发展状况。因此,现有的经济发展状况研究对将来的发展有着非常重要的指导意义。1.2.2选题的目的本文利用主成分分析和因子分析的方法对经济发展水平进行综合分析,按照城市的经济实力评价各城市的发展层次,认识到城市之间竞争力的差异,城市经济发展的优势和劣势,从而促进各省经济全面、协调、共同发展。31 1.3主成分分析和因子分析的发展及应用1.3.1主成分分析的发展及应用主成分分析也称主分量分析,旨在利用降维的思想,把多指标转化为少数几个综合指标。首先是由K皮尔森对非随机变量引入的[3],而后H霍特林将此方法推广到随机变量的情形。信息的大小通常用离差平方和或方差来衡量。在实际课题中,为了全面分析问题,往往提出很多与此有关的变量(或因素)因为每个变量都在不同程度上反映这个课题的客观信息。在实际问题研究中,为了全面、系统地分析问题,我们必须考虑众多影响因素。在用统计方法研究多变量问题时,变量太多会增加计算量和增加分析问题的复杂性,人们希望在进行定量分析的过程中,涉及的变量较少,得到的信息量较多。主成分分析正是适应这一要求产生的,是解决这类题的理想工具。主成分分析往往会在大型研究中成为一个中间环节,用于解决数据信息浓缩等问题,这就可能产生各种各样的组合方法。主成分所关心的问题,是通过一组变量的几个线性组合来解释这组变量的方差-协方差结构,它的一般目的是数据的压缩以及数据的解释。在一些欧美国家用核主成分分析的方法也就是主成分分析的改进方法,其采用非线性方法提取主成分,把核主成分分析应用到人脸识别中。在国外运用主成分分析的方法对肝素钠、肝素钙等低分子肝素相关产品的销售额数据进行处理,形成新的指标体系,而后应用BP神经网络的方法建立模型,评价模型的拟合能力。在日本运用主成分分析的方法对地质行分析,从而来预测地震避免不必要的损失。同时,主成分作为一种优秀的降维提取主要信息的手段,先后在海洋学、地质学、地球物理学、资源科学等中都得到了一定程度的应用。我国经过近几十年来的发展,运用主成分分析的方法对高光谱遥感矿物信息特征提取已经取得了很大进展。在国内运用主成分分析的方法对人口、教育、地区的经济发展等方面研究,都取得了一定的成果。1.3.2因子分析的发展及应用31 在对某一个问题进行论证分析时,采集大量多变量的数据能为我们的研究分析提供更为丰富的信息和增加分析的精确度。然而,这种方法不仅需要巨大的工作量,并且可能会因为变量之间存在相关性而增加了我们研究问题的复杂性。因而分析法就是从研究变量内部相关的依赖关系出发把一些具有错综复杂关系的变量归结为少数几个综合因子的一种多变量统计分析方法。这样我们就对原始的数据进行分类归并,将相关比较密切的变量分别归类,归结多个综合指标,这些综合指标互不相关,即它们所综合的信息互相不重叠。这些综合指标就称为因子或公共子因子。因子分析法是两种分析形式的统一体,即验证性分析和纯粹的探索性分析。因子分析最早是由英国的心理学家CharlesSpearman在1904年的时候,提出单一化的智能因子(ASingleIntellectualFactor)开始。随着试验的深入,大量个体样本被分析研究,证明了Spearman的单一智能因子理论是不充分的。同时,人们渐渐认识到有必要考虑多元因子。20世纪30年代,瑞典心理学家Thurstone打破了流行的单因子理论假设,经长期实践研究,他大胆提出了多元因子分析(MultipleFactorAnalysis)理论。Thurstone在他的《心智向量》(VectorsofMind,1935)一书中,阐述了多元因子分析理论的数学和逻辑基础。因子分析的基本目的就是用少数几个因子去描述许多指标或因素之间的联系,即将相关比较密切的几个变量归在同一类中,每一类变量就成为一个因子(之所以称其为因子,是因为它是不可观测的,即不是具体的变量),以较少的几个因子反映原资料的大部分信息。因子分析法(Factor Analysis)就是寻找这些公共因子的模型分析方法,它是在主成分的基础上构筑若干意义较为明确的公因子,以它们为框架分解原变量,以此考察原变量间的联系与区别[4]。因子分析在市场调研中有着广泛的应用,主要包括:经济发展的研究、评价指标结构、消费者习惯和态度研究(U&A)、品牌形象和特性研究、服务质量调查、个性测试、形象调查、市场划分识别、顾客、产品和行为分类。1.4本文主要研究内容本文首先是了解了国内外经济发展的基础及黑龙江省经济发展的现状,接着学习研究主成分分析和因子分析的基本思路和步骤,并将其理论与本文所研究的内容结合,其目的在于找到目前影响黑龙江省经济发展指标的主要因素,并根据得到的数学模型对黑龙江省经济发展情况进行综合分析。然后通过学习与查阅相关资料找到黑龙江省12个地级市的10个具有代表性指标,运用spss统计分析软件对这些指标进行主成分分析和因子分析得到特征值、方差贡献率及公共因子等相关数据。并利用这些数据对12个市经济水平划分等级。最后对论文进行总体的评价,指出本文的不足,以期待改进的新方案。31 第2章主成分与因子分析2.1主成分分析的内容2.1.1主成分分析原理和基本思想Karlparson在1901年最先引进了主成分的概念[5],但是当时只是对非随机变量讨论的。Hotelling在1933年将这个概念推广到随机变量。主成分分析的思想是降维,在损失很少信息的前提下把多个指标转化为较少的几个综合指标。通常情况下将转化生成的综合指标称为主成分,原始变量的线性组合就是每个主成分,且各个主成分之间是各不相关的,这就使得主成分比原始变量具有更优越的性能[3]。通常数学上的处理就是将原来个指标作线性组合,作为新的综合指标,但是这种现行组合,如果不加以限制,则可以有很多,我们应该选取方差最大的作为第一主成分,较大的作为第二主成分,一次类推可以构造出第三、四,……等个主成分。不难想像这些主成分之间不仅不相关,而且他们的方差一次递减。因此在实际问题中,就挑选前几个最大成分,虽然这样会损失一些信息,但是由于它使我们抓住了主要矛盾,并从原始数据中进一步提取了某些新信息,因为在某次额实际工作中的研究中得益较多,这种不仅减少了变量的数目还抓住了主要矛盾的做法更有利于问题的分析和处理。2.1.2主成分的几何意义从代数学的点看,成分就是个变量的一些特殊的线性组合[6],在几何上这些线性组合正是把构成的坐标系旋转产生的新坐标系,新坐标轴使之通过样品变差最大方向(或说具有最大的样品方差)。下面以最简单的二元正态变量来说明主成分的几何意义[6]。设有个样品,每个样品有个变量记为,它们的综合变量记为。当时,原变量是设它们有图3-1的相关关系:31 图3-1相关关系图对于二元正态分布变量,个点的散步大致为一个椭圆,若在椭圆长轴方向取坐标轴,在短轴方向取,这相当于在平面上作一个坐标变换,即按逆时针方向旋转角度,根据旋轴变换公式新老坐标之间有关系:我们看到,是原变量和的线性组合,用矩阵表示是显然。从上图还容易看出二维平面上的个点的波动(可用方差表示)大部分可以归结为在轴上的波动,而在轴上的波动是较小的。如果上图的椭圆是相当扁平的,那么我们可以只考虑方向上的波动,忽略方向的波动。这样一来,二维可以降为一维了,只取第一个综合变量即可。而是椭圆的长轴。一般情况,个变量组成维空间,个样品就是维空间的个点,对元正态分布变量来说,找主成分的问题就是找维空间中椭球体的主轴问题。31 2.1.3主成分分析的性质(1)各主成分之间互不相关,若原变量服从正态,则各主成分之间互相独立[7];(2)全部个主成分所反映的例样品的总信息,等于个原变量的总信息。信息量的多少,用变量的方差来度量。若将个原变量标准化后,每个变量的方差都为1,故方差之和为,此时,求得主成分的方差之和也为;(3)各主成分的作用大小是:(4)第个主成分的贡献率是(/)×100%,为贡献率之和;(5)前个主成分的累计贡献率是(()×100%。在应用时,一般取累计贡献率为70~85%或以上所对应的前个主成分即可。在资料所含的变量个数、样品数及累计贡献率固定的前提下,的比值越小,则说明此资料用主成分分析越合适。2.2主成分分析的求解方法和数学模型求解主成分的方法主要有两种,一是从原始变量的协方差矩阵结构入手,二是从原始变量的相关性矩阵结构入手。(1)从协方差矩阵出发求解主成分为[8]:设矩阵,将的特征值依大小顺序排列,不妨设为矩阵各特征值对应的标准正交特征向量,则对任意向量有所以我们把的协方差矩阵的非零特征值,对应的标准化特征像量,分别作为系数向量分别称为随机向量的第一主成分,第二主成分,…,第主成分。于是随机与随机向量之间存在关系:31 (2-1)(2)从相关系数矩阵出发求解主成分为:首先数据矩阵元素进行标准化(2-2)式中,和分别表示变量的期望与方差,于是有(2-3)于是对原始变量进行如下标准化:(2-4)显然有(2-5)因此,原始变量的相关矩阵实际是对原始变量标准化后的协方差阵。由相关阵求主成分的过程与主成分个数的确定准则实际上是与由协方差阵出发求主成分的过程与主成分个数的确定准则是一致的。求得的主成分与原始变量表示为:。31 数学模型设有个样品,每个样品观测项指标(变量):,得到原始数据资料库:(2-6)其中,。用数据矩阵的个向量(即个指标向量)作线性组合(即综合指标向量)为[9]:(2-7)上述方程要求:且系数由下列原则决定:(1)与不相关;(2)是与的一切线性组合(系数满足上述方程组)中方差最大的,与是不相关的的一切线性相关中方差最大的,是与都不相关的的所有线性组合的最大者。这里要说明两点:一个是数学模型中为什么作线性组合?基于两种原因:①数学上比较容易处理31 ②在实践中效果很好。另一个要说明的是每次选取的主成分要使Var()最大,如果不加限制就可使Var(),这样就没什么意义了,常用的限制是要求,。2.3主成分分析的基本步骤设原始资料矩阵为:(1)将原始数据进行标准化处理:进行标准化的目的在于消除原始数据各指标的量纲不同,公式如下:(2-8)其中为每一列指标的标准值;为每一列指标的均方差。标准化处理后,得到新的矩阵(2)建立变量的相关系数阵:根据公式建立样本的相关系数矩阵;(3)求特征根和特征向量:根据公式求出其前个特征值根据公式解出与特征值31 对应的单位正交化特征向量。4.写出主成分将原变量转换成主成分的线性组合,且具有正交特征,综合成为相应,而基本信息量保持不变。这样确定的综合变量分别称作原变量的第一、第二、…第个主成分,且应在总方差中所占比例依次递减。2.4因子分析的内容2.4.1因子分析原理和基本思想1904年,CharlesSpearman发表一篇著名论文《对智力检验得分进行统计分析》视为因子分析的起点[10]。因子分析的形成和发展有相当长的历史,最早用以研究解决心理学和教育学方面的问题,由于计算量大,又缺少高速计算的设备使因子分析的应用和发展受到很大的限制,甚至停滞了很长的时间。后来,由于电子计算机的出现,才使因子分析的理论研究和计算问题,有了很大的进展。目前这一方法的应用范围已十分广泛,在经济学、社会学、考古学、生物学、医学、地质学以及体育科学等各个领域都取得了显著的成绩。因子分析是主成分分析的推广和发展,它也是将具有错综复杂关系的变量(或样品)综合为数量较少的几个因子,以再现原始变量与因子的相互关系,同时根据不同因子还可以对变量进行分类,它也是属于多元分析中处理降维的一种统计方法。因子分析的基本思想是通过变量(或样品)的相关系数矩阵(对样品是相似系数矩阵)内部结构的研究,找出能控制所有变量(或样品)的少数几个随机变量去描述多个变量(或样品)之间的相关(相似)关系,但在这里,这少数几个随机变量是不可观测的,通常称为因子。然后根据相关性的大小把变量分组,使得同组内的变量之间相关性较高,但不同的变量相关性较低。31 因为因子分析的内容很丰富,本文仅介绍因子分析常用的两种类型:型因子分析(对变量作因子分析)和型因子分析(对样品作因子分析)。2.4.2因子分析的性质因子分析是主成分分析的推广,也是一种把多个变量化为少数几个综合变量的多变量分析方法,其目的是用有限个不可观测的隐变量解释原始变量之间的相关关系[11]。 因子性质主要表现变量之间关联度上,根据关联度可以划分为特殊因子和公共因子,利用因子分析,减少分析变量个数,通过对变量的相关关系探测,将原始变量进行分类。其中共同度表明的第个分量对于的每一分量共同依赖程度。如果它的值越大,依赖程度就越大.方差贡献是衡量公共因子相对重要性的指标。越大,表明公共因子对的贡献越大,或者说对的影响和作用就越大[12]。2.5因子分析的求解方法和数学模型2.5.1数学模型(正交因子模型)型因子分析数学模型[13]简记为且满足:i);ii)即和是不相关的;31 iii)即不相关且方差皆为1.即不相关,且方差不同。其中是可实测的个指标所构成的维随机向量,是不可观测的向量,称为的公共因子或潜因子,即前面所说的综合变量,可以把它们理解为高维空间中相互垂直的个坐标轴;称为因子载荷是第个变量在第个公共因子上的负荷,如果把变量看成维因子空间中的一个向量,则表示在坐标轴上的投影,矩阵称为因子载荷矩阵;称为的特殊因子,通常理论上要求的协方差阵是对角阵,包括随机误差[14]。因子分析的目的就是通过模型以代替,由于,从而达到简化变量维数的愿望。2.5.2因子模型中公共因子,因子载荷量的统计意义为了便于对因子分析计算结果做解释,将因子分析数学模型中各个量的统计意义加以说明是十分必要的。假定因子模型中,各个变量以及公共因子、特殊因子都已经是标准化(均值为0,方差为1)的变量[15]。(1)因子载荷的统计意义已知模型:由于在标准化下有:31 因此,,公式中F同一所以上式可写成:(因为各因子不相关,所以相关系数为0)故因子载荷的统计意义就是第个变量与第个公共因子的相关系数即表示依赖的分量(比重)。因此用统计学的术语应该叫做权,但由于历史的原因,心理学家将它叫做载荷,即表示第个变量在第个公共因子上的负荷,它反映了第个变量在第个公共因子上的相对重要性。(2)公因子的方差贡献率的统计意义将因子载荷矩阵中各列元素的平方和记为称为公共因子对的贡献,即表示同一公共因子对诸变量所提供的方差贡献之总和,它是衡量公共因子相对重要性指标。2.5.3因子旋转与因子得分建立因子分析数学模型的目的不仅要找出公共因子以及对变量进行分组,更重要的是要知道每个因子的意义,以便对实际问题作出科学的分析,如果每个公共因子的涵义不清,不便于进行实际背景的解释,这时根据因子载荷阵的不唯一性,可对因子载荷阵实行旋转即用一个正交阵右乘使旋转后的因子载荷阵结构简化,便于对公共因子进行解释。所谓结构简化就是使每个变量仅在一个公共因子上有较大的载荷,而在其余公共因子上的载荷比较小,至多是中等大小。这种变换因子载荷的方法称为因子轴的旋转,而旋转的方法有很多。如正交旋转,斜交旋转等。因子分析的最后一步是计算因子得分。因子变量确定后,便可计算各因子得分即每个样本上的具体数值,新变量形成了因子变量31 ,它和原变量的得分是相对应的。想要在以后分析中用因子变量代替原有变量进行数据建模,就要有因子得分,或利用因子变量对样本进行分类或评价等研究,进而实现降维和简化的目标[16]。2.6计算步骤因子分析法的步骤入下:(1)将原始数据标准化,为书写方便记为;(2)建立变量的相系数阵;(3)求的特征根及相应的单位特征向量,分别记为和;(4)对施行方差最大正交旋转;(5)计算因子得分。31 第3章主成分与因子分析在黑龙江省城市经济水平研究中的应用对黑龙江省12个地级市选取10个主要经济指标[17](见表3-1),-国内生产总值(亿元)、-工业总产值(亿元)、-人均GDP(元)、-工业企业单位数(个)、-固定资产投资(亿元)、-社会消费品零售总额(亿元)、-财政收入(万元)、-金融机构存款年底余额(亿元)、-年末人口数(万人)、-财政支出(万元)。运用spss软件进行主成分和因子分析。表3-1经济指标城市哈尔滨4550.22503.74581011424127.7齐齐哈尔1176.1891.922139302735.6鸡西582.3370.431076122299.3鹤岗358.2306.932968143261.3双鸭山565.4632.337490193514.8大庆4001.14280.31420674131407.9伊春260178.820686112238.2佳木斯668.3506.527774306466.4七台河298.9368.232308114169.2牡丹江981725.137001441733.8黑河366.1108.91889285233.2绥化1063.5620.818474267648.8表3-1经济指标续城市哈尔滨2394.658142067360.3993.58417764齐齐哈尔480.28968711151.7559.13086815鸡西162.3749852737.4185.9129869631 鹤岗91.1455351424.1108.5851063双鸭山88.5540332533.7150.41034629大庆803.122405591970.6281.73082478伊春76.5205743453124.1936280佳木斯277.4642216805.9239.41697016七台河74.2430529338.292.4649334牡丹江346.212450001034.2259.61992704黑河73.5340828500.8172.81250417绥化353.1947769763.957728511023.1主成分分析法将数据标准化,标准化后相应数据记为、、、、、、、、、,如表3-2所示[18],表3-2标准化指标城市哈尔滨2.275661.267820.206172.889683.01543齐齐哈尔-0.04341-0.05406-0.49912-0.00459-0.07665鸡西-0.45154-0.48176-0.23283-0.6248-0.47436鹤岗-0.60556-0.53383-0.17646-0.55244-0.509双鸭山-0.46315-0.26696-0.04173-0.38016-0.27792大庆1.898262.724853.074190.377860.53619伊春-0.67306-0.63889-0.54241-0.65925-0.53005佳木斯-0.39243-0.37014-0.331220.00919-0.32204七台河-0.64632-0.48356-0.19613-0.65236-0.59295牡丹江-0.1775-0.19086-0.05630.47434-0.07829黑河-0.60013-0.69622-0.59586-0.75228-0.53461绥化-0.1208-0.2764-0.60832-0.12519-0.1557731 表3-2标准化指标续城市哈尔滨2.991732.975263.091042.541292.89315齐齐哈尔0.06892-0.20173-0.096410.921350.38751鸡西-0.41643-0.29671-0.3091-0.47037-0.45294鹤岗-0.52514-0.48698-0.46995-0.75901-0.66333双鸭山-0.52911-0.43208-0.41368-0.60275-0.57706大庆0.561910.66640.32401-0.113120.38547伊春-0.54743-0.64825-0.45511-0.70083-0.62328佳木斯-0.2407-0.36626-0.27394-0.27086-0.26572七台河-0.55094-0.50302-0.51405-0.81904-0.75815牡丹江-0.135660.02319-0.15673-0.19553-0.12674黑河-0.55201-0.56098-0.43057-0.51922-0.47563绥化-0.12513-0.16884-0.29550.98810.27672利用spss软件进行主成分分析,得出方差解释表,见表3-3。表3-3方差解释表表3-3给出12个地级市经济发展水平的特征值、各主成分方差在总方差中的比重。表中显示第一主成分的特征值为8.098,方差在总的方差中的比重为80.976%;第二主成分的特征值为1.629,方差在总的方差中的比重16.293%31 。前两个特征值的累积贡献率达到97.269%,且其特征值均大于1,也就是说这两个主成分基本涵盖指标因子的主要信息,并且由于主成分分析得到的主成分彼此相互独立,互相不可替代。于是,取前2个因子作为主成分,碎石土的分析也说明了这一点[19]。图3-1碎石图图3-1是分析结果碎石图,明显拐点为2,可以得出保留前2个因子将能概括大部分信息,前2个因子贡献占总方差的比例为97.269%,说明提取前2个因子是比较合适的。表3-4主成分载荷表31 从表3-4可以看出,固定资产投资、社会消费品零售总额、财政收入在第一主成分上的载荷较大,即与第一主成分的关系数较高;人均GDP在第二主成分上的载荷较大,即与第二主成分的关系数较高。因此可将主成分命名如下:第一主成分:产出及收入主成分;第二主成分:效益主成分[12]。表3-5成分得分系数矩阵表3-5给出了用原始变量表示主成分得分的系数信息。标准化第一主成分=0.117*+0.092*+0.053*+0.119*+0.122*+0.122*+0.122*+0.119*+0.106*+0.12*标准化第二主成分=0.1957*+0.405*+0.554*-0.1*-0.076*-0.078*-0.047*-0.114*-0.028*-0.1272*到目前为止,通过主成分分析法,将10个指标转化为了具有典型经济涵义的2个综合评价指标。3.2因子分析法首先,对这组数据的原始值进行KMO和Bartlett’s检验[20],以判断数据是否适合进行因子分析。结果为,KMO抽样适度测定值统计量为0.621,在0.5以上,Bartlett球度检验统计量为305.380,足够大,且其相应的值(Sig=0.000)<0.05,表示可以拒绝偏相关系数为0和相关系数矩阵(见表3-6)为单位阵的原假设,所以数据适合进行因子分析(如表3-7所示)。31 表3-6相关系数矩阵F1F2F3F4F5F6F7F8F9F10F110.9180.6930.8480.8870.8920.9030.8490.710.86F20.91810.9130.5990.640.6450.6680.5790.430.597F30.6930.91310.2730.3130.3110.3580.2490.030.23F40.8480.5990.27310.9740.9720.970.9620.8550.958F50.8870.640.3130.97410.9950.9940.9930.8540.973F60.8920.6450.3110.9720.99510.9920.9920.8730.983F70.9030.6680.3580.970.9940.99210.9880.8320.963F80.8490.5790.2490.9620.9930.9920.98810.8420.965F90.710.430.030.8550.8540.8730.8320.84210.946F100.860.5970.230.9580.9730.9830.9630.9650.9461表3-7KMO和Bartlett的检验在进行因子分析之前,每项指标的原始值也需进行标准化处理,以消除变量间在数量和量纲上的不同。进行标准化处理后,平均水平为0,后面分析的结果会出现正值和负值,正值表示高于平均水平,负值表示低于平均水平。运用SPSS软件对10个变量的原始观测值进行相关系数的因子载荷估计,为了使主因子有明显地含义,采用方差最大正交法对因子载荷阵进行旋转,表3-8为旋转后主因子对应特征值的方差贡献率。以特征值大于1为标准提取主因子,可以发现,前两个因子的累积方差贡献率达到97.269%,能够反映原始数据的大部分信息。因此,可以运用这两个因子代替上面的10个指标对黑龙江省个地级市经济发展状况进行综合评价。31 表3-8解释的总方差利用方差极大法对因子载荷矩阵进行旋转根据SPSS输出的旋转后的因子载荷阵,如表3-9所示,可以看出10个原始变量与两个因子的载荷情况。第一主因子拥有69.835%的解释变量,在财政支出()、金融机构存款年底余额()、社会消费品零售总额()等几个指标上有较高的载荷,主要反映了各市的经济规模和经济结构。第二主因子拥有27.434%的解释变量,对人均GDP()有较大载荷[15],主要反映了各市的经济发展水平。这两个主因子的累计方差贡献率为97.269%,可以比较准确的反应该系统中各原始指标的综合状况。表3-9旋转成份矩阵31 由于主因子的数值无法直接观测,所以我们通过具体原始数据来描述主因子的变化特征和水平差异。利用公共因子和原始变量之间的关系,采用回归方法可以估计两个主要因子的得分系数矩阵(见表3-10)。表3-10成份得分系数矩阵由此可的因子得分公式第一主因子得分=0.025*-0.085*-0.1813*+0.15*+0.142*+0.143*+0.13*+0.156*+0.191*+0.62*第二主因子得分=0.226*+0.406*+0.526*-0.041*-0.018*-0.02*+0.008*-0.054*-0.164*-0.066*在上式的基础上,用两个主因子的方差贡献率占累计贡献率的比重作为权重计算各个城市的综合得分(表3-11),得到综合评价函数为:某区域值的大小反映了该市经济发展状况在黑龙江省的相对位置。最后,可以针对两个主因子的得分以及加权后的综合得分,对各市的经济发展状况做出综合评价法[21]。表3-11经济系统主因子得分即综合得分城市第一主因子得分排名第二主因子得分排名综合因子得分排名哈尔滨3.02433310.15405722.2149151齐齐哈尔0.2896232-0.4671990.0762013鸡西-0.398837-0.256277-0.35863731 鹤岗-0.5571111-0.214366-0.460469双鸭山-0.482810-0.048023-0.360198大庆-0.349463.09688310.6224552伊春-0.506889-0.4738310-0.4975611佳木斯-0.18235-0.329138-0.223716七台河-0.6252312-0.189025-0.5022212牡丹江-0.01674-0.113464-0.043995黑河-0.431998-0.544911-0.4638310绥化0.2372973-0.6147612-0.0029843.3综合评价结果分析由主成分和因子分析综合来看,财政(收入及支出)和社会消费品零售总额是影响这12个城市经济发展的第一主要因素;人均GDP是影响这12个城市经济发展的第二主要因素。这些就是导致黑龙江省各市经济发展存在差异性的主要因素。从表3-11可以看出,综合得分排名与第一主因子得分排名大体一致,这是因为第一主因子方差贡献率达到了69.835%,在很大程度上反映了实际情况。由上表可知,第一因子得分较高的是哈尔滨、齐齐哈尔、绥化,说明这三个城市的消费能力及政府财政力度上比较大;第二因子得分高的是大庆、哈尔滨、双鸭山,说明这三个城市经济实力比较强。以上的结果可以将这些城市大致分为三类,第一类是比较发达的城市:哈尔滨、大庆齐齐哈尔;第二类是发展中城市:绥化、牡丹江、佳木斯;第三类是有待发展的城市:鸡西、双鸭山、鹤岗、黑河、伊春、七台河。综合得分排在第一的哈尔滨市在财政、社会消费品零售总额和人均GDP上都比较高。作为黑龙江省的省会,它可以带动其他城市经济的发展。促进消费是改进其他城市经济发展的有力手段。可以根据在哈尔滨消费的调查,找到人们消费的热点商品,然后再将这些商品推广到其他城市,以此来带动各市的消费水平。从本文的研究结果可以看出,财政的支出和收入对城市的经济也有着很大的影响,提高了财政收入的同时也要增加财政支出。各市政府可以将财政支出多用在科教、卫生、医疗等方面。让人们享受到更多的社会福利,对于提高人们生活水平和促进其他消费有很大的推动作用。31 各市在以后的工作中,在努力增加财政收入的同时要努力改善财政支出结构体系以有效的加大财政支出。其次是想办法提高人们对社会消费品的消费水平。我认为这样对促进各市经济全面、协调、共同的发展,会有一定的作用。31 结论本文通过查阅2013年的黑龙江省统计年鉴,在介绍了国内外经济发展的基础上,阐述了黑龙江省的经济现状,结合黑龙江省的实际情况得到了12个地级市的10个具有代表性的经济指标。然后分别用主成分分析法和因子分析法两种方法对黑龙江省12个地级市的10个经济指标做出了综合分析,找到了影响经济发展的两个主要因素,并对各因素的含义做了详细解释,对以后各市经济发展的调整提供了有利条件,也为促进各市经济同步发展找到了一个大致的方向。并利用这些数据对黑龙江省地级市经济发展情况进行了排名。从本文可以看出,虽然主成分分析和因子分析都是从原始数据的协差阵(有时是相关系数阵)出发[22],计算特征值与特征向量,按照累计贡献率大于85%的原则确定新的指标个数。但是为了避免混淆两种方法,在解释新的指标时应该回归到各自的模型上面来。即:按照主成分分析原理,新指标仅仅是原始指标的简单汇总,如果想用较少的几个变量替代原来的变量则用主成分分析;而对于因子分析新指标则是对所有原始指标皆有影响的那些公共因子,所以当需要寻找潜在的影响要素时,倾向于用因子分析。明白了这一点,对新指标的解释也就变得顺理成章了。在《黑龙江省地级市综合竞争力分析》中[23],从综合经济竞争力、人民生活水平、环境质量状况、基础设施竞争力、对外开放程度、科技文化竞争力6个方面选取42项指标利用均差法获取各因素权重,利用现行加权法对黑龙江省12个地级市的综合竞争力进行评价的结果是哈尔滨综合竞争力最强大,大庆、牡丹江、齐齐哈尔和佳木斯较强,鸡西、黑河双鸭山、七台河、鹤岗、伊春、绥化较弱。而本文得出的排名虽然与其有些差异,但基本一致,主要是由于可以衡量一个地区经济发展的评估指标体系涉及的指标变量很多,本文在选取经济指标的数量上不够全面。但本文仅用10项指标,就得到了基本一致的结果。说明了本文采取的方法有一定的优越性。虽然本文用了两种统计方法,但还有很多统计分析评价方法可以进行综合评价,今后还有待于进一步的提高。31 致谢四年的本科学习即将过去,在我的论文完成之际,在黑龙江科技大学的学习期间,我不仅学到了文化知识,还锻炼了自己的能力,更收获了快乐。首先我要感谢我的老师们,是你们为我创造了良好学习的机会和环境,并给了我悉心指导和孜孜不倦的教诲,使我能在工作和学习上克服困难,取得进步。我的导师刘华南老师在本次的论文写作中,从论文的选题到最后定稿都给了我详细的指导,使我受益匪浅,在此表示我最衷心的感谢。我还要感谢我的同学们,她们在我这四年的学习生活中给予的帮助与关心让我轻松的完成了学业,并感到充实。再次我对她们表示最真挚的感谢!我特别要感谢我的父母。他们无微不至的关怀与支持,让我倍感温暖,没有负担,并鞭策着我不断前进。最后祝我的老师们、同学们以后的生活更加美满幸福!31 参考文献1王艳杰,郑小贤.可持续发展指标体系研究概述[J].北京:北京林业大学学报,2001,35(5):103-106.2李艳双,曾珍香,张闽等.主成分分析法在多指标综合评价中的应用[J].河北工业大学学报,1999,28(24):94-97.3何晓群.现代统计分析方法与应用[M].北京:北京中国人民大学出版社,2007:98-105.4黄润龙.数据统计分析与分析技术-SPSS软件使用教程[M].北京:北京高等教育出版社,2007:89-92.5崔立瑶,刘忠.区域工业发展水品评价方法研究[J].四川大学学报(自然科学版),2006,17(1):250-255.6杨小平.统计分析方法与SPSS应用教程[M].北京:北京清华大学出版社,2008:106-109.7ReuvenR.Levary.Usingtheanalytichiearchyprocesstorankforignsuppliersbasedonsupplyrisks[J].Computers&IndustrialEngineering,2008,(55):535-542.8M.A.Papalexandrou,P.A.Pilavachi,A.I.Chatzimouratidis.Evaluationofliquidbio-fuelsusingtheAnalyticHierarchyProcess[J].ProcessSafetyAndEnvironmentProtection,2008,(86):360-374.9卢文岱.SPSSforWindows统计分析(第二版)[M].北京:电子工业出版社,2003:311-330.10童其慧.主成成分分析法在指标综合评价中的应用[J].北京理工大学学报,2002,45(4):59-61.11刘政永,孙娜.基于因子分析的福建城市竞争力研究[J].现代商贸工业报,2008,31(2):314-317.12王庆丰,党耀国,王丽敏.基于因子分析和聚类分析的县域经济发展研究—以河南18个省(市)为例[J].数理统计与管理,2009,28(3):495-501.13廖为鲲,蔡国梁,徐文桃.基于因子分析法的城市经济发展评价[J].统计与决策,2005,19(24):110-115.14薛薇.基于SPSS的数据分析[M].北京:中国人民出版社,2006:78-85.15袁万海.基于主成分分析的多元集成综合评价模型[J].31 技术与创新管理报,2011,15(4):14-17.16何晓群.多元统计分析[M].北京:中国人民大学出版社,2011:78-82.17黑龙江省统计局.黑龙江统计年鉴2013[M].北京:中国统计出版社,2013.18RICHARDA,JOHNSON,DEANWICHERN.陆璇,叶俊译.实用多元统计分析(6版)[M].北京:清华大学出版社,2008:99-118.19Landgrebe,J.Wurst,W.&Weizi,G.GenomeBiol.3,RESEARCH0019(2002):177-19620Li,C.M.&Klevecz,R.R.Proc.Natl.Acad.Sci.USA103,16254-16259(2006):105-14321管琳,李春兰,张博.基于主成分分析法的我国农村居民消费结构的综合评价[J].安徽农业科学报,2011,16(14):114-117.22赵凡莹.全国各省市农业发展规模综合评价[J].中国证券期货报,2011,25(7):74-77.23李建平.中国省域经济综合竞争力发展报告(2009-2010)蓝皮书[M].北京:社会科学文献出版社,2011:1-10.31'