• 709.50 KB
  • 2022-04-22 11:23:42 发布

本科毕业论文PCA-LDA算法在性别鉴别中的应用.doc

  • 52页
  • 当前文档由用户上传发布,收益归属用户
  1. 1、本文档共5页,可阅读全部内容。
  2. 2、本文档内容版权归属内容提供方,所产生的收益全部归内容提供方所有。如果您对本文有版权争议,可选择认领,认领后既往收益都归您。
  3. 3、本文档由用户上传,本站不保证质量和数量令人满意,可能有诸多瑕疵,付费之前,请仔细先通过免费阅读内容等途径辨别内容交易风险。如存在严重挂羊头卖狗肉之情形,可联系本站下载客服投诉处理。
  4. 文档侵权举报电话:19940600175。
'摘要人脸性别鉴别是计算机视觉和模式识别领域的一个活跃课题,有着十分广泛的应用前景。本文提出了一种新的人脸性别鉴别方法。该方法是结合PCA-LDA算法来进行对人脸提取特征量的。先采用PCA算法将图像进行降维,然后在低维空间中利用LDA进行特征提取作为分类特征。利用ORL人脸数据库进行测试,通过实验验证该方法的可行性,及表明:该识别方法识别效果较好,能够适应表情、光照的变换。且在ORL人脸图象数据库有较好的识别效果。关键词人脸识别;人脸性别鉴别;MATLAB;ORL人脸数据库;特征向量;主元分析方法;线性鉴别分析方法48 AbstractThehumanfacesexdistinctionisthecomputervisionandapatternrecognitiondomainactivetopic,hastheextremelywidespreadapplicationprospect.Thisarticleproposedonenewpersonfacesexdistinctionmethod.ThismethodisunifiesthePCA-LDAalgorithmtocarryontothehumanfaceextractioncharacteristicquantity.UsesthePCAalgorithmtocarryonfirsttheimagefallsUygur,theninlowersintheUygurspacetocarryonthecharacteristicextractionusingLDAtotaketheclassifiedcharacteristic.CarriesonthetestusingtheORLpersonfacedatabase,confirmsthismethodthroughtheexperimentthefeasibility,andindicated:Thisrecognitionmethodsrecognitioneffectisgood,Canadapttheexpression,theilluminationtransformation.AlsohasthegoodrecognitioneffectintheORLpersonfaceimagedatabase.KeywordsHumanfacerecognition;Humanfacesexdistinction;MATLAB;ORLpersonfacedatabase;Characteristicvector;Principalelementanalysismethod;Lineardistinctionanalysismethod48 目录摘要……………………………………………………………………..ⅠAbstract………………………………………………………………….Ⅱ第1章引言…………………………………………………………….11.1人脸性别鉴别概述…………………………………………..11.1.1图像处理与模式识别原理…………………………...11.1.2人脸识别概述………………………………………...21.1.3人脸性别鉴别的发展历史…………………………...31.1.4人脸性别鉴别的特点………………………………...41.2人脸性别鉴别原理…………………………………………..51.2.1人脸性别鉴别的概念………………………………...51.2.2人脸性别鉴别的过程………………………………...61.2.3人脸性别鉴别的主要方法及各方法优缺点………...71.3人脸性别鉴别的应用………………………………………..10第2章软件介绍……………………………………………….............122.1MATLAB简介……………………………………………….122.1.1Matlab语言特点…………………………………….122.1.2MATLABimageprocessingtoolbox简介……….142.2MATLAB在图像处理技术方面的应用…………………….16第3章基于主元分析和线性判别分析原理……………………….....183.1主元分析(PCA)的概念………………………………..……..183.2线性判别分析(LDA)的概念…………………………………193.3基于PCA-LDA的人脸性别鉴别方法……………………....20第4章程序的设计过程及调试过程…………………………………..224.1人脸性别鉴别系统设计流程图……………………………...234.2程序设计过程及调试过程…………………………………...244.3实验结果分析和比较………………………………………...26总结………………………………………………………………………28致谢………………………………………………………………………2948 参考文献………………………………………………………………….30附录1……………………………………………………………………..31附录2……………………………………………………………………..37附录3…………………………………………………………………….4248 第1章引言1.1人脸性别鉴别概述1.1.1图像处理与模式识别原理图像处理,即用计算机对图像进行处理。与人类对视觉机理着迷的历史相比,它是一门相对年轻的科学。但在其短短的历史中,它却广泛应用于几乎所有与成像有关的领域。所谓数字图像就是量化的图像。我们可以把数字图像处理定义为:对一个物体的数字表示施加一系列的操作,以得到所期望的结果。数字图像处理可分为三个部分:第一部分是图像的获取、存贮和检索,其中包括图像变换成压缩图像以及压缩图像的复原。图像压缩技术采用某些方法将图像中最主要的信息保存,以节省硬盘或外围存贮设备空间。压缩图像的复原是指采取一定的方法,尽可能将压缩后的图像恢复为原始图像。第二部分是图像的处理和增强,其中包括直方图的均衡化、图像增强、图像复原以及投影重建图像。图像直方图是指一幅图像灰度分布的概率图,为提高图像对比度,常常需要改变原图像灰度分布的概率图,及图像直方图均衡化。图像增强指将原始图像经过一定变换后,提高图像对比度。图像复原是指将失真或畸变的图像尽可能恢复到原状。图像重建是图像处理中一个重要的内容,它是指由原三维投影数据(图像)重建原三维图像的方法。第三部分是图像比较和抽象,其中包括图像匹配,图像描述和模式识别。采用必要的方法提取图像特征部分,以达到定量或半定量分析的目的。模式识别诞生于20世纪20年代,随着40年代计算机的出现,50年代人工智能的兴起,模式识别在60年代迅速发展成一门学科,它所研究的理论和方法在很多科学和技术领域中得到广泛的重视,推动了人工智能系统的发展,扩大了计算机应用的可能性。几十年来,模式识别研究取得了大量的成果,在很多方面得到了成功的应用。模式识别方法和应用十分广泛,也相当复杂。模式识别的研究对象基本上可概括为二大类:一类是有直觉形象的如图象48 、相片、图案、文字等等,一类是没有直觉形象而只有数据或信息波形如语声、心电脉冲、地震波等等。对于模式识别来说,无论是数据、信号还是平面图形或立体景物都是除掉他们的物理内容而找出它们的共性,把具有同一共性的归为一类,而具有另一种共性者归为另一类。它的目的是研制出能够自动处理某些信息的机器系统,以便代替人来完成分类和辨别的任务。以下就是模式识别的简单框图:信息处理特征抽取判决被识图象图象信息获取结果图1-1-1图象识别的简单框图从框图可以看出,一个图象识别系统可分为三个主要部分:第一部分是图象信息的获取,它相当于对被研究对象的调查和了解,从中得到数据和材料,对图象识别来说就是把图片、底片、文字图形等用光电扫描设备变换为电信号以备后续处理。第二部分是信息的加工与处理。它的作用在于把调查了解到的数据材料进行加工、整理、分析、归纳以去伪存真,去粗取精,抽出能发映事物本质的特征。抽取什么特征,保留多少特征与采用何种判决有很大关系。第三部分是判决或分类。这相当于人们从感性认识升到理性认识而做出的结论的过程。第三部分与特征抽取的方式密切相关。它的复杂程度也依赖于特征的抽取方式。如类似度相关性最小距离等等。1.1.2人脸识别概述自古以来,鉴别人的身份就是人类生活必不可少的内容。早在古埃及时,人们就开始通过人体生物特征的测量(如人脸、人手等)来鉴别人的身份。在刑侦领域,人们也早已使用最有效的人体生物特征之一——指纹来确定罪犯。本世纪随着计算机技术的出现,人们开始凭借计算机的强大功能来研究和实现自动的身份鉴别系统。六十年代,出现了以自动测量人体手指和手的身份鉴别系统;八十年代,计算机技术日新月异,于是基于计算机技术的人体生物识别技术的研究和产品研发也方兴未艾,如火如荼了。48 早在60年代末,人脸识别即引起了研究者的强烈兴趣,但早期的人脸识别一般都需要人的某些先验知识,无法摆脱人的干预。进入90年代,由于高速度高性能的计算机的出现,人脸识别的方法有了重大突破,进入了真正的机器自动识别阶段,人脸识别研究得到了前所未有的重视,国际上发表有关人脸识别等方面的论文数量大幅度增加,仅从1990年到2000年之间,EI可检索到的相关文献多达数千篇,这期间关于人脸识别的综述也屡屡可见。1.1.3人脸性别鉴别的发展历史现实生活中,两类模式识别问题广泛存在,例如身份认证中的性别鉴别、钞票的真假识别、医学染色体变异与非变异识别、以及医学细胞的识别等。随着计算机及网络技术的高速发展,信息安全显示出前所未有的重要性。身份鉴定(识别)是保证系统安全的必要前提,在金融、国家安全、司法、电子商务、电子政务等应用领域,都需要准确的身份鉴定(识别)。身份鉴定(识别)一般可分为三类:基于特定物品;基于特定知识;基于生物特征。前两类方法(如身份证、工作证、智能卡、密码、口令等)存在携带不便、容易遗失、或者由于使用过多或不当而损坏、不可读和密码易被破解等诸多问题。因此,目前广泛使用的依靠证件、个人识别号码、口令等传统方法来确认个人身份的技术面临着严峻的挑战,并越来越不适应现代科技的发展和社会的进步。而基于生物特征识别技术的个人身份识别系统具有更好的安全性、可靠性和有效性,而且人脸的识别具有唯一性,因此越来越受到人们的重视。例如应用人脸的性别识别来判别身份的真假。48 人脸性别鉴别(识别)技术[1]就是利用计算机分析人脸图像,从中提取有效的识别信息,用来辨认性别的一门技术,它涉及到模式识别、图像处理、计算机视觉、生理学、心理学及认识学等诸多学科的知识,并与基于其他生物特征的身份鉴别方法以及计算机人机感知交互的研究领域都有密切联系。与指纹、视网膜、虹膜、基因、掌纹等其他人体生物特征识别系统相比,人脸识别系统更加直接、友好。使用者无心理障碍。人脸性别鉴别技术应用背景十分广泛,可用于公安系统刑侦破案的罪犯身份识别、身份证及驾驶执照等证件验证、银行及海关的监控、自动门卫系统、视频会议、机器人的智能化研究以及医学等方面。虽然人类可以毫不困难地由人脸辨别一个人的性别,但利用计算机进行完全自动的人脸性别鉴别仍存在许多困难,其表现在:人脸是非刚体,存在表情变化;人脸随年龄增长而变化;发型、眼镜等装饰对人脸造成遮挡;人脸所成图像受光照、成像角度、成像距离和一个人的漂亮程度等影响[2]。女性化程度越高人的漂亮程度就越高。此外人脸性别鉴别技术研究与相关学科的发展及人脑的认识程度紧密相关。这诸多因素使得人脸性别鉴别研究成为一项极富挑战性的课题。经过数十年的研究,计算机技术日新月异,于是基于计算机技术的人体生物识别技术的研究和产品研发也方兴未艾,如火如荼了。近年来,在美国、欧洲、中国香港等许多国家和地区的大学都成立了以人体生物识别技术(biometrics)为主要研究方向的实验室或研究中心,同时许多公司也相继开发出许多产品,并不断地推向市场,逐步形成了一个很有希望的产业。在我国,哈工大成立了第一个人体生物识别技术研究中心,已经开展了用于身份鉴别的人脸识别、话者识别、联机签名识别、指纹识别等多项研究工作,已取得了一定的成果,并首次提出了将人体生物识别技术用于中医诊断,已经开展了面向中医诊断的自动舌象处理系统,基于人体生物特征识别技术的掌纹诊病系统等研究工作。另外,中科院自动化所国家模式识别实验室也已广泛开展人体生物识别技术方面的研究工作,清华大学、北京大学等高校及其他研究机构都有许多人员投身到这一新兴研究领域。90年代直今,由于高速度高性能计算机的出现,人脸性别鉴别的方法有了重大突破,进入了真正的机器自动识别阶段,国际上发表有关人脸性别鉴别等方面的论文数量大幅度增加。识别的方法也层出不鲜,多种多样。Gollomb等人[3]采用两层神经元网络SEXNET方法,用来识别30×30的人脸样本的性别;Cottrell等人[4]先对样本进行主分量分析,然后训练BP神经元网络用于识别人脸的表情和性别;Edelman等[5]采用线性神经元网络进行分类,用人脸的三个不同部分(整个人脸、人脸的上半部分和下半部分)分别训练,对这三种情况下的分类器性能加以比较分析;Alice等[2]系统地研究了人脸女性化程度、男性化程度、可识别程度和漂亮程度之间的关系,并用PCA模型对人脸中所含信息的统计结构进行了定量计算;他们还用PCA方法从人脸的三维模型(结构和纹理)中提取特征,并用于训练性别分类的感知机[6]等等。1.1.4人脸性别鉴别的特点人脸图象的性别鉴别是人脸识别中的两类识别问题,而鉴于人脸识别技术与其他人体生物特征识别技术相比较,因而它有其独特的优点。(1)人脸识别技术有快速、简便、非侵扰和不需要人的被动配合的特点。48 因为除这种识别技术以外,其余的人体生物特征识别技术对人们来说都是一种干扰,都需要人的被动配合。如指纹和掌纹识别都需要人们将手放在玻璃表面,而虹膜识别需要用激光照射人的眼睛,而声音识别需要人对着麦克风讲话,字迹识别则需要人签字等等。而人体面貌识别无需干扰人们的行为,你只需要很快从一架摄像机前走过,你的面貌就已经被快速地采集和检验,所以非常简便。(2)人脸识别技术有良好的防伪、防欺诈、准确、直观、方便的特点。因为同其他人体生物特征识别技术相比较,只有面像识别是最直观、最可靠、最准确的,因而它是优良的防伪、防欺诈的。(3)人脸识别技术具有性价比高、经济、可扩展性良好的特点。因为人体面貌识别技术比其他的人体生物特征识别技术的性能要优越,它不要人的行为的配合能方便有效地核查人的身份,而且只需通用的PC硬件及相关软件,因而经济、性价比高;由于其直观、准确,且应用更为广泛,因此具有良好的可扩展性能。(4)人脸识别技术具有非接触式的、连续的和实时的特点,利用此优点,可以在监控范围内发现人脸,而不论其远近和位置,能连续的跟踪他们并将它们从背景中分离出来,将他的面像与监控列表进行比对。整个过程完全是无需干预的,连续的和实时的。1.2人脸性别鉴别原理1.2.1人脸性别鉴别的概念人脸性别鉴别就是对于输入的人脸图像或者视频,首先判断其中是否存在人脸,如果存在人脸,则进一步的给出每个人脸的位置、大小和各个主要面部器官的位置信息,并依据这些信息,进一步提取每个人脸中所蕴含的身份特征,并将其与已知人脸库中的人脸进行对比,从而辨别出每个人脸的性别身份。人脸性别鉴别的过程可以分为以下三个部分:(1)人脸检测判断输入图像中是否存在人脸,如果有,给出每个人脸的位置,大小。(2)面部特征定位对找到的每个人脸,检测其主要器官的位置和形状等信息。48 (3)人脸比对根据面部特征定位的结果,与库中人脸对比,判断该人脸的性别身份信息。从应用的角度,人脸性别鉴别包括两大类:(1)人脸性别身份识别即根据人脸图像识别出人物的性别身份,鉴别此人的性别问题;(2)人脸性别身份确认/验证判断图像中的人脸的性别是否是其真实的性别,即确认真实性别的问题;特征提取:为了利用仪器进行图像判读及分析处理,需要从原始图像数据中求出有益于分析的判读标志及统计量等各种参数。对图像进行变换,突出其具有代表性的特征的方法,叫特征提取。特征提取可以定量地抽出以下三种特征:(1)光谱特征可提取颜色或灰度或波段间的亮度比等目标物的光谱特征,例如Landsat的MSS有四个波段,根据某类地物的光谱特征,采用特定的比值可将其突出出来。(2)空间(几何)特征把目标物的形状、大小、或者边缘,线性构造等几何性特征提取出来,例如把区域断层明显突出出来。(3)纹理特征是指周期性图案及区域的均匀性等有关纹理的特征。根据构成图案的要素形状、分布密度、方向性等纹理进行图像特征提取的处理叫做纹理分析。1.2.2人脸性别鉴别的过程人脸性别鉴别的识别过程一般分三步:(1)首先建立人体面貌的面像档案即用摄像机采集单位人员的人体面貌的面像文件或取他们的照片形成面像文件,并将这些面像文件生成面纹(Faceprint)编码贮存起来。(2)获取当前的人体面像即用摄像机捕捉的当前出入人员的面像,或取照片输入,并将当前的面像文件生成面纹编码。(3)用当前的面纹编码与档案库存的对比即将当前的面像的面纹编码与档案库存中的面纹编码进行检索比对。上述的48 “面纹编码”方式是根据人体面貌脸部的本质特征和开头来工作的。这种面纹编码可以抵抗光线、皮肤色调、面部毛发、发型、眼镜、表情和姿态的变化,具有强大的可靠性,从而使它可以从百万人中精确地辩认出某个人,从而鉴别出其性别来。1.2.3人脸性别鉴别的主要方法及各方法优缺点人脸性别自动识别系统包括两个主要的技术环节,如图1-2-1所示。人脸检测与定位特征提取与分类识别输入图像输出结果图1-2-1性别自动识别系统首先是人脸检测与定位,即检测图像中是否有人脸,若有,将其从背景中分割出来,并确定其在图像中的位置。其次是特征提取与人脸分类识别。特征提取之前一般需要做几何归一化和灰度归一化的工作。前者是指根据人脸定位结果将图像中的人脸变化到同一位置和大小,后者是指对图像进行光照补偿等处理,以克服光照变化的影响。提取出待识别的人脸特征之后,即可进行特征匹配。这个过程是一对多或一对一的匹配过程,前者是确定输入图像为图像库中的哪一类人,后者是验证输入图像的人的性别是否属实。识别人脸主要依据那些在不同个体之间存在较大差异而对于同一个人则比较稳定的特征。而性别判别就是两类识别问题,依据的是对于某类事物有相对比较稳定的特征。具体的特征形式随识别方法的不同而不同,而且提取特征量的方法不同分类的方法和结果就不同。早期研究较多的静态人脸识别方法有基于几何特征的人脸识别分类方法和基于相关匹配的人脸识别方法。目前,静止图像的人脸识别方法主要有三个研究方向:一是基于统计的识别方法,包括特征脸(Eigenface)方法和隐马尔科夫模型(HiddenMarkovModel)方法;二是基于连接机制的识别方法,包括一般的神经网络方法和弹性图匹配(ElasticGraphMathching)方法;三是其他一些综合方法或处理非二维灰度图像的方法。(1)几何特征的人脸性别鉴别方法常采用的几何特征有人脸的五官如眼睛、鼻子、嘴巴等的局部形状特征,脸型特征以及五官在脸上分布的几何特征。提取特征时往往要用到人脸结构的一些先验知识。在这种基于几何特征的识别中,识别总归为特征矢量之间的匹配,基于欧氏距离的判决是最常用的识别方法。48 基于几何特征的识别方法具有如下优点:①符合人类识别人脸的机理,易于理解;②对每幅图像只需存储一个特征矢量,存储量小;③对光照变化不太敏感。但是这种方法同样存在很多的问题:①从图像中抽取稳定的特征比较困难,特别是特征受到遮挡时;②对强烈的表情变化和姿态变化的鲁棒性较差;③一般几何特征只描述了部件的基本形状与结构关系,忽略了局部细微特征,造成部分信息丢失,一般只适合于要求不高的粗分类。(2)基于模板匹配的人脸性别鉴别方法模板匹配法是一种经典的模式识别方法,这种方法大多是用归一化互相关,直接计算两类图像之间的匹配程度。由于这种方法要求两类图像上的目标要有相同的尺度、取向和光照条件,所以预处理要做尺度归一化和灰度归一化的工作。最简单的人脸模板是将人脸看成一个椭圆,检测人脸也就是检测图像中的椭圆。另一种方法是将人脸用一组独立的小模板表示,如眼睛模板、嘴巴模板、鼻子模板、眉毛模板和下巴模板等。但这些模板的获得必须利用各个特征的轮廓,而传统的基于边缘提取的方法很难获得较高的连续边缘。即使获得了可靠度高的边缘,也很难从中自动提取所需的特征量。为此,用弹性模板方法提取特征显示出其独到的优越性。弹性模板由一组根据特征形状的先验知识设计的可调参数所定义。为了求出这组参数,需要利用图像的边缘、峰值、谷值和强度信息及特征形状的先验知识设计合适的能量函数。参数向能量减小方向调整,当能量达到最小时,这组参数对应的模板形状最符合特征形状。把基于几何特征的人脸性别鉴别方法和基于模板匹配的人脸性别鉴别方法进行比较,可以得出结论:基于几何特征的人脸分类方法具有识别速度快和内存要求小的优点,但在识别率上模板匹配要优于基于几何特征的识别方法。增加几何特征对于基于几何特征的人脸分类方法只能轻微地提高识别率,因为要提高几何特征的提取质量本身就十分困难,而且随着图像质量的下降和人脸遮挡的引入,则后者的识别分类效果会大幅下降。所以模板匹配法要优于几何特征法。(3)特征脸(Eigenface)方法此方法是从主成分分析(PrincipalComponentAnalysis,48 PCA)导出的一种人脸识别和描述技术。PCA实质上是KL展开的网络递推实现,KL变换是图像压缩中的一种最优正交变换,其生成矩阵一般为训练样本的总体散布矩阵。特征脸方法就是将包含人脸的图像区域看作是一种随机向量,因此可以采用KL变换获得其正交KL基底。对应其中较大特征值的基底具有与人脸相似的形状,因此又称之为特征脸。利用这些基底的线性组合可以描述、表达和逼近人脸图像,因此可以进行人脸性别识别和合成。识别过程就是将一类人脸图像映射到由特征脸张成的子空间上,比较其与已知人脸在特征脸空间中的位置。但特征脸方法受光照、角度和人脸尺寸等因素影响较大,于是对特征脸方法进行了改进,如双子空间法、相形歧义分析方法、Fisher脸方法等。其中Fisher脸方法又称为线性判别分析方法(LinearDiscriminantAnalysis,LDA),它选择以类内散布正交的矢量作为特征脸空间,从而能压制图像之间的与识别信息无关的差异,对光照及人脸表情变化都不太敏感。Luis等人从传统特征脸发展出自身特征脸的概念,使用这种技术并结合人脸颜色信息,可以有效地从动态图像序列中识别出指定的人脸。此外,与KL变换的思想比较接近但不是从统计角度出发的另一种变换是奇异值分解(SVD)的方法,即将图像矩阵的奇异值作为模式的特征矢量。SVD方法具有如下优点:①人脸图像的奇异值具有良好的稳定性,当图像上有小的扰动时,奇异值变化不大;②奇异值表示了图像的代数特征,是一种本质的内在特征,在某种程度上,SV特征同时拥有代数与几何两方面的不变性,即对图像灰度值的比例变化、平移、旋转和伸缩不变性。(4)隐马尔科夫模型(HiddenMarkovModel,HMM)隐马尔科夫模型(HiddenMarkovModel,HMM)主要是用于描述信号统计特性的一组统计模型。(5)基于神经网络的方法神经网络在人脸识别应用中有很长的历史。早期用于人脸识别的神经网络主要是Kohonen自联想映射神经网络,如果将神经网络方法和统计方法结合在一起,便产生了一种基于概率决策的神经网络(ProbabilisticDecisoinBasedNeuralNetwork,PDBNN)用于识别人脸并进行性别鉴别48 。其主要思想是采用虚拟样本(正反例)进行强化和反强化学习,从而得到较理想的概率估计结果,并采用模块化的网络结构加快网络的学习。这种网络结构继承了决策神经网络(DBNN)的结构,并加入概率变化。每个子网对应一个人,这种结构不仅有利于训练和识别,而且有利于做硬件。现在出现了多模态的神经网络,如TDNN+RBF等,即由两种类型的神经网络共同来完成人脸识别任务。神经网络方法在性别判别上比其他类型的方法有其独到的优势,它避免了复杂的特征提取工作,可以通过学习的过程获得其他方法难以实现的关于人脸分类识别的规律和规则的隐性表达。此外,神经网络以并行方式处理信息,如果能用硬件实现,就能显著提高速度。神经网络方法主要用于人脸识别、性别识别和种族识别等等。(6)弹性图匹配方法弹性图匹配方法是一种基于动态链接结构(DynamicLinkArchitecture,DLA)的方法,它将人脸用格状的稀疏图表示,图中的节点用图像位置的Gabor小波分解得到的特征向量标记,图的边用连接节点的距离向量标记。匹配时,首先寻找与输入图像最相似的模型图,再对图中的每个节点位置进行最佳匹配,这样产生一个变形图,其节点逼近模型图的对应点的位置。弹性图匹配方法对光照、位移、旋转及尺度变化都不敏感,是一种优于特征脸方法的人脸识别分类方法。此方法的主要缺点是对每个存储的人脸需计算其模型图,计算量大,存储量大。1.3人脸性别鉴别的应用随着经济的发展,高新科技的越来越完善,恐怖分子的袭击对国家的安全有很大的威胁。社会上的不良分子利用高科技进行犯案,对社会造成混乱,对人们造成身体上和财富上的极大伤害。为此,各国都投入大量物力人力研究并发展各类识别技术,通过这些识别技术来对人进行身份鉴定、画面监控等,从而有效地打击犯罪分子的犯案。也因此这一技术得到极大发展,其中,目前最受重视并最为有效的,就要算是人脸识别和性别鉴别技术了。  人脸性别鉴别技术48 是一门崭新的科学技术,在国家安全、军事安全和公安、司法、民政、金融、民航、海关、边境、口岸、保险及民用等领域实际应用具有极广阔的前景。如:公安布控监控、监狱监控、司法认证、民航安检、口岸出入控制、海关身份验证、银行密押、智能身份证、智能门禁、智能视频监控、智能出入控制、司机驾照验证、各类银行卡、金融卡、信用卡、储蓄卡的持卡人的身份验证,社会保险身份验证等。人脸性别鉴别技术是人脸识别中的两类判别技术,而人脸识别技术又是生物特征识别技术的一种。生物特征识别技术,又是依据人体本身所固有的生理特征(面像、指纹、掌纹、视网膜、虹膜、签名、语音等)或行为特征,利用图像处理技术(或其他数位信号处理技术)和模式识别的方法来达到身份鉴别或验证目的的一门科学。其主要有面像识别、指纹识别、掌纹识别、虹膜识别、话音识别、签名识别和视网膜识别等。人脸性别鉴别技术在需要进行身份鉴定的领域均可使用,特别是在不能接触识别对象时,更能体现出技术的优越性。人脸性别鉴别技术的应用领域十分广,目前此技术已经在商业的和政府的许多领域中得到应用。(1)身份确认与人员的男女检索可用于电脑/网络安全、银行业务、智能卡、访问控制、边境控制等领域,网讯公司在这一领域的产品有门禁和考勤,民政收容与遣送等。  (2)身份证可用于选民登记、身份证、护照、驾驶执照、工作证等、网讯公司在这一领域的产品有机场安检口身份证检查以及结合犯罪嫌疑人识别系统的安检口控制系统等。  (3)计算机信息保护系统利用人脸特征识别用户,保护计算机信息,网讯公司在这一领域的产品有面像屏幕保护和文件加密。  (4)犯罪嫌疑人识别系统应用于脸部照片登记系统,事件后分析系统,网讯公司在这一领域的主要应用系统为基于Internet的网上追逃系统。  (5)远距离身份识别应用于监视、监控、闭路电视、交通管理、敌友识别等,网讯公司在这一领域的主要应用系统为重大嫌疑犯重点地区布控系统。此外,此技术在信息安全领域也有着巨大的潜在应用价值。可以进行计算机的安全登录控制、应用程序安全使用、数据库安全访问和文件加密,还可以保护电子商务的安全性,还可用于图像库检索,在大型人脸库中检索与索引图像相同或相近的脸像。例如:公安部门可以利用此技术进行罪犯脸像库的管理和查询,自动取款机(ATMA)可以从数据库中快速检索用户身份。48 第2章软件介绍2.1MATLAB简介MATLAB是matrixlaboratory(矩阵实验室)的缩写,是1984年由美国MathWorks公司推出的数值计算及图形工具软件,最初是作为“矩阵理论”和“数据分析”等课程的计算工具。MathWorks公司1993年推出了MATLAB4.0版,1997年推出5.0版,2000年推出5.2版,到了今天已经推出到6.5版。经过十几年的发展和完善,目前已成为世界各国在科学分析和计算领域的主流软件,并被IEEE评述为国际公认的最优秀的科技应用软件。特别是6.5版,它在界面编程方面,参考了现今非常流行的可视化编程的思想,因此在界面制作上显得十分容易。MATLAB具有以下的基本功能:(1)数值计算功能(2)符号计算功能(3)完备的图形处理及可视化功能(4)可视化建模及动态仿真功能。2.1.1Matlab语言特点:(1)编程效率高Matlab语言编写程序,比Basic、Fortran和C等语言更加接近我们书写计算公式的思维方式,用Matlab编写程序犹如在演算纸上排列出公式与求解问题。因此,Matlab语言也可通俗地称为演算纸式科学算法语言由于它编写简单,所以编程效率高,易学易懂。(2)用户使用方便48 Matlab语言是一种解释执行的语言(在没被专门的工具编译之前),它灵活、方便,其调试程序手段丰富,调试速度快,需要学习时间少。人们用任何一种语言编写程序和调试程序一般都要经过四个步骤:编辑、编译、连接以及执行和调试。各个步骤之间是顺序关系,编程的过程就是在它们之间作瀑布型的循环。Matlab语言与其它语言相比,较好地解决了上述问题,把编辑、编译、连接和执行融为一体。它能在同一画面上进行灵活操作快速排除输入程序中的书写错误、语法错误以至语意错误,从而加快了用户编写、修改和调试程序的速度,可以说在编程和调试过程中它是一种比VB还要简单的语言。  具体地说,Matlab运行时,如直接在命令行输入Matlab语句(命令),包括调用M文件的语句,每输入一条语句,就立即对其进行处理,完成绩译、连接和运行的全过程。又如,将Matlab源程序编辑为M文件,由于Mat1ab磁盘文件也是M文件,所以编辑后的源文件就可直接运行,而不需进行编译和连接。在运行M文件时,如果有错,计算机屏幕上会给出详细的出锗信息,用户经修改后再执行,直到正确为止。所以可以说,Mat1ab语言不仅是一种语言,广义上讲是一种该语言开发系统,即语言调试系统。(3)扩充能力强高版本的Matlab语言有丰富的库函数,在进行复杂的数学运算时可以直接调用,而且Matlab的库函数同用户文件在形成上一样,所以用户文件也可作为Matlab的库函数来调用。因而,用户可以根据自己的需要方便地建立和扩充新的库函数,以便提高Matlab使用效率和扩充它的功能。另外,为了充分利用Fortran、C等语言的资源,包括用户已编好的Fortran,C语言程序,通过建立Me调文件的形式,混合编程,方便地调用有关的Fortran,C语言的子程序。(4)语句简单,内涵丰富Mat1ab语言中最基本最重要的成分是函数,其一般形式为「a,b,c……」=fun(d,e,f,……),即一个函数由函数名,输入变量d,e,f,……和输出变量a,b,c……组成,同一函数名F,不同数目的输入变量(包括无输入变量)及不同数目的输出变量,代表着不同的含义(有点像面向对像中的多态性。这不仅使Matlab的库函数功能更丰富,而大大减少了需要的磁盘空间,使得Matlab编写的M文件简单、短小而高效。(5)高效方便的矩阵和数组运算48 Matlab语言像Basic、Fortran和C语言一样规定了矩阵的算术运算符、关系运算符、逻辑运算符、条件运算符及赋值运算符,而且这些运算符大部分可以毫无改变地照搬到数组间的运算,有些如算术运算符只要增加“·”就可用于数组间的运算,另外,它不需定义数组的维数,并给出矩阵函数、特殊矩阵专门的库函数,使之在求解诸如信号处理、建模、系统识别、控制、优化等领域的问题时,显得大为简捷、高效、方便,这是其它高级语言所不能比拟的。在此基础上,高版本的Matlab已逐步扩展到科学及工程计算的其它领域。因此,不久的将来,它一定能名符其实地成为“万能演算纸式的”科学算法语言。(6)方便的绘图功能Matlab的绘图是十分方便的,它有一系列绘图函数(命令),例如线性坐标、对数坐标,半对数坐标及极坐标,均只需调用不同的绘图函数(命令),在图上标出图题、XY轴标注,格(栅)绘制也只需调用相应的命令,简单易行。另外,在调用绘图函数时调整自变量可绘出不变颜色的点、线、复线或多重线。这种为科学研究着想的设计是通用的编程语言所不及的。总之,Matlab语言的设计思想可以说代表了当前计算机高级语言的发展方向。MATLAB的上述特点,使它深受工程技术人员及科技专家的欢迎,并很快成为应用学科计算机辅助分析、设计、仿真、教学等领域不可缺少的基础软件。目前,在国外高等院校,MATLAB已成为本科生、研究生必须掌握的基础软件,国内一些理工院校也已经或正把MATLAB作为学生必须掌握的一种软件。2.1.2MATLABimageprocessingtoolbox简介图像处理工具包是由一系列支持处理操作的函数组成的,所支持的图像处理操作有:几何操作、区域操作和块操作;线性滤波和滤波器设计;变换(DCT变换);图像分析和增强;二值图像操作等。图像处理工具包的函数,按功能可以分为以下几类:图像显示;图像文件输入与输出;几何操作;像素值和统计;图像分析与增强;图像滤波;线性二维滤波器设计;图像变换;领域和块操作;二值图像操作;颜色映射和颜色空间转换;图像类型和类型转换;工具包参数获取和设置等。和其他工具包一样,用户还可以根据需要书写自己的函数,以满足特定的需要。也可以将这个工具包和信号处理工具包或小波工具包等其他工具包联合起来使用。由于图像操作很多,这里仅仅以图像的噪声消除和边缘检测为例,来说明该工具包的基本使用方法。(1)图像的噪声消除操作48 在图像处理中,经常要对噪声污染的图像进行去噪操作。图像处理工具包提供了多种消除或降低噪声的方法。不同的方法应用于不同种类的噪声。这些方法是:线性滤波、中值滤波和自适应滤波等。此外为了模拟各种噪声的作用,工具包还提供了imnoise()函数,通过这个函数,可以向图像加入各种不同的噪声。当然,图像降质的原因是多种多样的,可以根据不同的降质原因建立相应的数学模型,由于MATLAB强大的数学功能,无论使用连续或是离散方法,都是可能的。举个最简单的例子,如果图像降质是由于附加了背景噪声图案而引起,那么只要知道了背景图案,两幅图相差就可以较好的恢复原图像。这在MATLAB中用两个矩阵相减就可实现。(2)图像的边缘检测为了进一步显示MATLAB的友好的用户界面功能,下一个例子是随工具包带的一个名为“edgedemo”的演示程序(代码也是可见的)。在MATLAB集成环境中运行edgedemo,将出现一个图形窗口界面,这是一个典型的MATLAB应用程序和用户交互的图形界面。MATLAB5.1版以后,这个界面可以很方便地用软件所带的图形用户界面生成工具(GUItools)生成。48 图2-1-1edgedemo演示界面本例是对名为“Rice”的图像应用“Sobel”算子,用户还可以设定检测的阈值和方向等参数。实际上,这个演示程序使用了工具包提供的“edge”函数,该函数以图像强度作为输入参数之一,输出一幅二值图像,图像中像素值为“1”,表示的是边缘上的点,“0”表示非边缘点。该函数提供了6种检测边缘的方法,如“Sobel”、“Prewitt”等。其中“THRESH”规定了检测的敏感性阈值,凡是边强度小于这个阈值,就不认为是检测到了边界。“DIRECTION”规定了检测的方向,它的值是一个字符串,用来表示只检测水平方向的边界(当为“horizontal”时),还是只检测垂直方向的边界(当为“vertical”时)。它的默认值是“both”,表示同时检测两个方向的边界。2.2MATLAB在图像处理技术方面的应用MATLAB图形处理工具箱支持四种图像类型,分别为真彩色图像、索引色图像、灰度图像、二值图像,由于有的函数对图象类型有限制,这四种类型可以用工具箱的类型转换函数相互转换。MATLAB可操作的图像文件包括BMP、HDF、JPEG、PCX、TIFF、XWD等格式。下面就图形处理的基本过程讨论工具箱所实现的常用功能。(1)常用图像操作图像的读写与显示操作:用imread()读取图像,imwrite()输出图像,把图像显示于屏幕有imshow(),image()等函数。Imcrop()对图像进行裁剪,图像的插值缩放可用imresize()函数实现,旋转用imrotate()实现。(2)图像增强功能图像增强是数字图像处理过程中常用的一种方法,目的是采用一系列技术去改善图像的视觉效果或将图像转换成一种更适合于人眼观察和机器自动分析的形式。常用的图像增强方法有以下几种:灰度直方图均衡化。均匀量化的自然图像的灰度直方图通常在低灰度区间上频率较大,使得图像中较暗区域中的细节看不清楚,采用直方图修整可使原图像灰度集中的区域拉开或使灰度分布均匀,从而增大反差,使图像的细节清晰,达到增强目的。直方图均衡化可用histeq()函数实现。48 灰度变换法。照片或电子方法得到的图像,常表现出低对比度即整个图像偏亮或偏暗,为此需要对图像中的每一个象素的灰度级进行标度变换,扩大图像灰度范围,以达到改善图像质量的目的。这一灰度调整过程可用imadjust()函数实现。平滑与锐化滤波。平滑技术用于平滑图像中的噪声,基本采用在空间域上的求平均值或中值。或在频域上采取低通滤波,因在灰度连续变化的图像中,我们通常认为与相邻象素灰度相差很大的突变点为噪声点,灰度突变代表了一种高频分量,低通滤波则可以削弱图像的高频成分,平滑了图像信号,但也可能使图像目标区域的边界变得模糊。而锐化技术采用的是频域上的高通滤波方法,通过增强高频成分减少图像中的模糊,特别是模糊的边缘部分得到了增强,但同时也放大了图像的噪声。在MATLAB中,各种滤波方法都是在空间域中通过不同的卷积模板即滤波算子实现,可用fspecial()函数创建预定义的滤波算子,然后用filter2()或conv2()函数在实现卷积运算的基础上进行滤波。(3)边缘检测和图像分割功能边缘检测试一种重要的区域处理方法,边缘是所要提取目标和背景的分界线,提取出边缘才能将目标和背景区分开来。如果一个象素落在边界上,那么它的领域将成为一个灰度级变化的带。对这种变化最有用的两个特征是灰度的变化率和方向。边缘检测算子可以检查每个象素的领域并对灰度变化率进行量化,也包括对方向的确定,其中大多数是基于方向导数掩模求卷积的方法。MATLAB工具箱提供所谓edge()函数可针对sobel算子、prewitt算子、Roberts算子、log算子和canny算子实现检测边缘的功能。基于灰度的图像分割方法也可以用简单的MATLAB代码实现。(4)图像变换功能图像变换技术是图像处理的重要工具,常运用于图像压缩、滤波、编码和后续的特征抽取或信息分析过程。MATLAB工具箱提供了常用的变换函数,如fft2()与ifft2()函数分别实现二维快速傅立叶变换与其逆变换,dct2()与idct2()函数实现二维离散余弦变换与其逆变换,Radon()与iraon()函数实现Radon变换与逆Radon变换。除了以上基本的图像除了功能,MATLAB还提供了如二值图像的膨胀运算dilate()函数、腐蚀运算erode()函数等基于数学形态学与二值图像的操作函数。48 第3章基于主元分析和线性判别分析原理3.1主元分析(PCA)的概念主成分分析(PrincipalComponentAnalysis,PCA)方法就是将包含人脸的图像区域看作是一种随机向量,因此可以用K-L变换获取其正交K-L基底,对应其中较大特征值的基底具有与人脸相似的形状,因此,又称之为特征脸。利用相对较小的Eigenface集描述人脸,这样每幅人脸图像就对应于一个维数较低的权向量,因此,人脸识别可以在降维后的空间上进行。然而,该方法的缺点是,得到的特征在一般情况下是最佳描述特征(themostexpressivefeatures,MEFs),而不是最佳分类特征(themostdiscriminatingfeatures,MDFs)。其具体的算法思想如下:假设参加训练的人脸图像一共有N张,每张图像的维数为M×M,则可以分别表示为:L1、L2、L3、…、LN,那么平均脸可以表示为:(1)每张人脸和平均人脸的距离可以表示为:(2)设矩阵={、、、…、},特征脸需要做的就是找出矩阵的前Z个较大特征值的特征向量,但是一个×维的大矩阵,求这样一个矩阵的特征值计算量是非常大的。为此我们可以先求出的特征值与特征向量,然后求出如下:(j=0、1、2、…、Z-1)(3)表示的特征向量,表示的特征向量,是的特征值,48 就是所指的特征脸。求出特征脸以后,剩下的工作就是要对库中的人脸进行降维,由可以组成一个投影矩阵,表示为,并进行降维:(i=0、1、2、…、N-1)(4)由式(4)可以得出所有人脸向量的降维向量。3.2线性判别分析(LDA)的概念LDA(LinearDiscriminantAnalysis)方法也称为线性判别分析方法。它选择与类内散布的正交的矢量作为特征脸空间,从而能够压制图像之间的与识别信息无关的差异,对光照及人脸表情变化都不太敏感。这种方法的最终目的就是找到一些特征使得类间离散度和类内离散度的比值最大。样本的类内离散度矩阵可以定义为:(5)其中可以定义为:(i=1、2、…、C)(6)其中,是先验概率,是类的均值。样本的内间离散度矩阵可以定义为:(7)其中,是先验概率,是类的均值,是所有样本的均值。如果是非奇异矩阵,在投影以后,各类样本之间尽可能的分开一些,即类间离散度越大越好,同时各类样本的内部尽量的密集起来,48 即类内离散度越小越好。因此可以定义Fisher准则函数如下:(8)下面就是要求出取最大值时对应的特征向量。通过数学变换可以得出,就是满足如下等式的解:(i=1、2、…、m)(9)如果非奇异,就是求的本征值问题。其中该矩阵最多只有C-1非零特征值,C是类别数目。3.3基于PCA-LDA的人脸性别鉴别方法人脸图象的识别和分类一定要对图片进行标准化,因为图像要受到各种因素的影响,例如:图像的质量、图像的背景、图像的光照情况、图像的大小、图像中人脸的旋转、图像中人脸的脸部表情的不同等等因素,会造成人脸识别和分类的困难和识别率的下降。本文也不例外,先对图片进行设置并格式转换和归一化。本文设计的总的思路是,首先利用PCA将图像进行降维,然后在低维空间中利用LDA进行特征提取作为分类特征,然后再利用ORL人脸数据库进行测试。其简单自动性别分类系统如下图3-3-1所示:输入图象性别分类特征提取人脸检测性别图3-3-1自动性别分类系统人脸识别的基本过程主要分为训练阶段和识别阶段48 。而人脸的性别鉴别是人脸识别中的典型两类识别问题,因而性别鉴别的方法和思路跟人脸识别大同小异,也分为训练阶段和识别阶段。由于构成训练样本的尺寸有多种,所以需要把原始图像归一化到一个标准的尺寸,得到一个训练样本集,共有C个类,每个图像可以设为ψi(i=1、2、…、N),即一共有N张训练样本。训练阶段的步骤如下:(1)把归一化好的图像看成是一个向量,可以设为xi(i=1、2、…、N),用这些向量减去平均脸,得到每一幅人脸与平均脸的差值。(2)由这些差值构成一个协方差矩阵,求出这个矩阵的前K个最大特征值的特征向量,然后把这些向量再组合起来构成一个PCA投影矩阵,设为Wpca;(3)用这个投影矩阵把所有的训练样本投影到一个K维的子空间,具体的算法可以参照公式(4);(4)把第2步得出的最佳描述特征qi(i=1,2,…,N),分别构成类内散布矩阵和类间散布矩阵,计算矩阵的前t个最大特征值的特征向量,由这些向量构成一个LDA投影矩阵,设为Wlda;(5)可以采用与(4)式类似的方法,用第3步得出的矩阵把所有样本投影到一个t维子空间,得出最佳分类特征ηi(i=1,2,…,N),并根据这些特征组成一个C类特征人脸识别分类数据库;(6)计算人脸类间的最大距离β=||ηi-ηj||(i,j=1、2、…、C)(10)识别阶段的基本步骤如下:(1)把待识别的人脸图像减去平均脸,得到一个差值向量,可以设为S:(2)把这个差值作两次投影变换,得出最佳分类特征η=(11)(3)用待识别人脸与人脸库中的每类人脸进行比较,得出最小的欧几里德距离α1=||η-ηi||(i=1,2,…,C)(12)(4)如果要区分待识别的图像是否为人脸图像,则需要计算待识别的人脸的图像与重建人脸图像的距离48 α2=||x-η+f||(13)其中f为平均脸。(5)根据分类规则最小距离(欧几里德距离)则可判别是库中的哪类人脸。即判别出输入的人脸图像是男还是女,并计算出识别率。其人脸性别鉴别系统结构见图3-3-2训练用的图像集合主分量分析模拟K-L变换测试用的图像集合识别对比识别结果线性判别分析判别为男判别为女人脸特征数据库图3-3-2人脸性别鉴别系统结构图48 第4章程序的设计过程及调试过程4.1人脸性别鉴别系统设计流程图测试人脸图像训练人脸图像提取数据,并进行格式转换和归一化,计算各类的平均值和总平均值提取数据,并进行格式转换和归一化,计算各类的平均值和总平均值求出PCA投影距阵Wpca求出PCA投影距阵Wpca由Wpca获得最佳描述特征MEFs由Wpca获得最佳描述特征MEFs由最佳描述特征MEFs求得类内散布距阵Sw和类间散布距阵Sb由最佳描述特征MEFs求得类内散布距阵Sw和类间散布距阵Sb由类内散布距阵Sw和类间散布距阵Sb求得LDA投影距阵Wlda由类内散布距阵Sw和类间散布距阵Sb求得LDA投影距阵Wlda由LDA投影距阵Wlda获得最佳分类特征MDFs由LDA投影距阵Wlda获得最佳分类特征MDFs根据训练样本和测试样本的最佳分类特征MDFs,由最小距离(欧几里德距离)进行识别分类并计算出识别率48 图4-1-1人脸性别鉴别系统设计流程图4.2程序设计过程及调试过程因为本文研究的是人脸性别鉴别,是人脸识别的典型两类识别。因此利用ORL人脸数据库进行测试具有较好的识别效果。ORL人脸数据库是英国剑桥大学Olivetti研究所制作的人脸数据库。该数据库由40个不同人、每人10幅、共400幅图像组成。其中,(36人为男性,4人为女性)。这些人的图像是在不同时间、不同视角、不同表情(闭眼/睁眼、微笑/吃惊/生气/愤怒/高兴)和不同脸部细节(戴眼镜/没戴眼镜、有胡子/没胡子、不同发型)的条件下拍摄的。人脸姿态也有变化,其深度旋转与平面旋转可达到20度;人脸的尺度也有最多10%的变化。每幅原始图像有256个灰度级,大小为112×92。程序的设计步骤如下:(1)先建立人脸图象数据库。在ORL人脸数据库中任意取4个男的图片,每人取5幅一共20幅,存入文件夹dBso1作为一类。取4个女的每人5幅图片,一共20幅存入文件夹dBso2作为另一类。其中取每一类的10幅作为训练样本,10幅作为测试样本。(2)读取训练样本和测试样本,并进行格式转换,归一化和计算各类的平均值和总平均值。先定义训练(测试)ORL图库路径,由ORLPath[]和BMPPath[]得出。img=double(imread()),读入图像并转换为双精度以便计算。详细见附带程序。(3)对训练样本和测试样本进行特征提取,分别得出训练样本和测试样本的特征距阵即最佳分类特征,并存为B.mat和T.mat文件。这一步是最关键最复杂的。先计算由训练(测试)集特征向量构成的协方差矩阵中个最大特征值对应的特征向量,这个特征向量构成PCA投影矩阵。接着利用PCA投影矩阵,将特征向量空间转换为降维的维MEF48 空间,并获得最佳描述特征MEFs,即,其中。然后计算由训练(测试)集最佳描述特征构成的类内散布矩阵和类间散布矩阵和,然后计算对应矩阵的个最大特征值对应的特征向量。由这个最大特征值对应的特征向量构成FLD投影矩阵。最后就利用FLD投影矩阵,将MEF空间转换为降维的维MDF空间,获得对应的最佳分类特征MDFs,即,其中。这过程当中,在进行LDA提取特征的时候,运用了自编的辅助函数eig_self.m。eif_self(x)的功能是对x求特征值并使特征值安降序排列。(4)根据训练样本和测试样本的最佳分类特征MDFs,由最小距离(欧几里德距离)即α1=||η-ηi||(i=1、2、…、C),其中η和ηi分别为训练样本和测试样本的最佳分类特征,进行识别分类并计算出识别率。当训练样本和测试样本都是20幅时,训练样本程序和测试样本程序分别用了1.828秒和1.249秒时间对40幅图像进行处理,平均每幅0.0715秒,而识别判定程序只用了0.0160秒就完成了识别过程,而且识别率达到了96%,也很稳定。LDA中存在奇异性问题。当样本总数大于样本维数时,通常是非奇异的。否则,很可能是奇异的。最初建立的人脸数据库在运行当中就出现了奇异性的警告,因此我又进行了数据库的多样本分类,把实验结果制成了表格并且和之前的小样本分类结果进行了对比,得出了一般性指导作用。训练样本的选择为:每人选前4幅为训练样本,40人共160幅,则测试样本为240幅;每人选前5幅为训练样本,40人共200幅,则测试样本为200幅;每人选前6幅为训练样本,40人共240幅,则测试样本为160幅。实验结果见表4-2-148 表4-2-1不同的训练样本和测试样本下的识别率结果训练样本数(个)测试样本数(个)识别率(%)20209616024093.52002009424016095程序调试过程:(1)先读取训练样本。此步骤包括设置训练样本路径;进行格式转换使图象变为双精度格式方便计算;归一化图象去除光照等影响。执行的程序为zhh_train.m。(2)对训练样本进行特征提取。此步骤的最终目的是经过计算来获得训练样本的最佳分类特征MDFs。执行的程序为TQ_train.m。(3)读取测试样本。此步骤也是包括设置测试样本路径;进行格式转换使图象变为双精度格式方便计算;归一化图象去除光照等影响。执行的程序为zhh_test.m。(4)对测试样本进行特征提取。此步骤的最终目的是经过计算来获得测试样本的最佳分类特征MDFs。执行的程序为TQ_test.m。(5)最后的步骤就是判别分类了。此步骤是根据步骤(2)获得的训练样本的最佳分类特征MDFs和步骤(4)获得的测试样本的最佳分类特征MDFs,利用最少距离的方法来计算出识别率的。执行的程序为PB.m。4.3实验结果分析和比较程序调试的最初阶段是取每一类的10幅图片做训练样本,另外10幅做测试样本的,结果很理想,识别率达到了96%。针对训练样本和测试样本的不同而识别率不同,我把训练样本和测试样本的图片数目进行多种分类后再进行调试。例如取16幅为训练样本,则剩下24幅为测试样本;取14幅为训练样本,则剩下26幅为测试样本;按照此法以下累推。经过实验得出结论:识别率都比较稳定,能达到很高的识别率。当训练样本个数为248 个,测试样本为38时,仍然能得出稳定的识别率。只是在提取训练样本特征向量的时候出现警告。因为训练样本总数太少,产生了奇异向量,即分母为零的情况。但是这并不影响分类的最后结果,仍然能得出较高的识别率。同时知道此方法在小样本的测试中能得到很高的识别率。程序调试的第二阶段取400幅样本来实验,样本总数大于样本的维数,故没有出现奇异性的问题。同时可以知道,一般情况下训练样本越多则识别率就越高。证明此方法在人脸性别鉴别中有很好的推广能力和应用前景。由上面的实验结果数据可以知道,利用PCA-LDA的方法具有识别率较高而所用的特征向量数目较小(即最终的特征空间维数低)的特点。特征脸的图像主要反映的是原始模式变化最大的成分而Fisher线性判别方法使投影后的模式样本的类间散布矩阵最大而类内散布矩阵最小,也就是说,投影后保证模式样本在新的空间中有最大的类间距离和最小的类内距离,即模式在该空间中有最佳的可分离性。Fisher线性判别分析提取的特征向量集强调的是不同人脸的差异,而不是照明条件、人脸表情和方向的变化。因而,采用FLD方法对人脸进行识别比采用PCA方法对光照条件、人脸的姿态等的变化更为不敏感,从而采用Fisher鉴别向量有助于提高识别效果。本文的方法由于综合利用了PCA方法和FLD方法的优点,因此具有最佳识别效果,即所用的特征数目少而识别率较高。使用PCA方法和FLD方法都能大大降低原始特征空间的维数,并已在人脸识别中得到了广泛的应用;然而,PCA方法得到的特征是最佳描述特征而不是最佳分类特征。本文通过主分量分析得到人脸的最佳描述特征,最后利用Fisher线性判别分析来得到维数更低的最佳鉴别特征。这样,既利用了特征脸方法和Fisher线性判别分析方法的优点,又克服了它们的不足之处,同时使分类器的设计更加简洁、有效,提高了人脸图像的识别率。实验证明该方法具有良好的识别能力和推广能力。48 总结本课题历经3个多月的学习、探索和实践,到如今告一段落,这个过程感触良多。刚接到这个课题时,我对图像的识别和MATLAB编程的了解不深,仅仅是表面很肤浅,很笼统的认识。在1-2周查找资料的过程中,我渐渐了解到原来图像的识别是一门很大、很深的学问,而且人体图像识别技术不但在学术上有极大的研究价值,而且有极广泛的应用领域,正是因为图像识别技术有美好的发展前景,所以我渐渐的对图像识别产生了浓厚的兴趣,在查找资料的过程中也了解许多生物识别技术的最新科研成果及未来的发展方向。开始,我首先学习了MATLAB的程序设计,对MATLAB的图像读取,矩阵运算,以及图像处理工具包(imageprocessingtoolbox)等进行了全面的学习。这为以后做毕业设计打下了良好的基础。然后就是查找大量的科技文献资料,包括前人的研究成果和最新的研究成果,国外的人脸识别的发展状况等等,加深了对人脸识别的理解。然后就是结合自己的毕业设计的题目进行方案设计,并制订程序设计流程图,在审查过方案是可行的之后就着手编程,用了两周的时间基本上把程序编写完毕,但是进行调试的时候由于程序的设计方案不够好,运行的时间很长。然后我及时找甘老师给我指导,讨论之后,我重新整理思路设计一套简洁的方案出来。接着对程序进行调试,刚开始由于几个变量设置错误,程序无法运行,修改过之后程序可以运行,但结果不对,于是又从头到尾把程序检查一遍,又对所用到的函数逐个检查,还是没发现问题,后经甘老师的数次指导才发现问题所在,把错误改正后,程序可以正常运行,而且结果比较理想。最后,在甘俊英老师的指导和帮助下,经过自己坚持不懈地努力和一个一个不眠夜晚的奋斗,终于能如期地完成了本课题的设计任务。通过本次毕业设计除了使我对图像处理和模式识别的原理有了更深步的认识;掌握了PCA和LDA的概念和特征提取的原理;另外,这次毕业设计也是对我四年来所学各专业知识的一个综合运用和检查。使我的分析与解决实际问题的能力得到很大的提高和认识。而且48 查找和收集资料的能力;及对实验数据的分析处理能力都有一个巨大的进步。令我的自学能力更上了一个台阶,同时也使我明白到理论和实践是相互联系的,学习理论的目的就是把它更好的应用于实践当中,而实践又能使自己对理论有更深一层的理解。致谢本人的毕业设计题目为PCA-LDA算法在性别鉴别中的应用。本论文是在我的指导老师甘俊英老师的悉心指导下完成的,在此表示衷心的感谢!在毕业设计的过程中,从开始查找资料到最后程序的调试,甘老师都一直从严要求,每星期至少与甘老师汇报一次进度,使我在毕业设计的过程中遇到的问题都能够及时得到解决,甘老师对待工作严格要求,一丝不苟;但在遇到问题请教甘老师时又是和蔼可亲、平易近人,特别是我在调试程序时,程序运行结果不正确,检查了一个多星期也没查出问题所在,后多次与甘老师讨论,才找到问题。每次去请教甘老师,甘老师都会热情解答我的问题,有时一个小小的问题,甘老师也会认真的解答,有些我一时不能理解的问题,甘老师都会耐心的讲好几次,直到我真正明白为止,甘老师这种诲人不倦,认真负责的教学精神值得让人敬佩!在甘老师的悉心指导和帮助下,使我对MTALAB编程及模式识别方面的知识有了更深一步的认识,在遇到困难时甘老师给我的鼓励与支持使我有了克服困难的决心和勇气!我会紧记甘老师的淳淳教诲和热心帮助,这次毕业设计是我踏进社会前的一次很好的演习,使我学会了怎样去完成一个任务,怎样去克服困难,这次毕业设计真的使我获益非浅!48 主要参考文献1边肇祺,张学工.模式识别(第二版)[M].北京:清华大学出版社,2000.2AliceJ.O"Tooleetal.ThePerceptionofFaceGender:TheRoleofStimulusStructureinRecognitionandClassification.MemoryandCognition,Vol.26,pp.146-160,1997.3B.A.Golomb,D.T.Lawrence,andT.J.Sejnowski.SEXNET:Aneuralnetworkidentifiessexfromhumanfaces.InAdvancesinNeuralInformationProcessingSystems,pp.572–577,1991.4G.W.CottrellandJ.Metcalfe.EMPATH:Face,emotion,andgenderrecognitionusingholons.InAdvancesinNeuralInformationProcessingSystems,pp.564–571,1991.5B.Edelman,D.Valentin,H.Abdi.Sexclassificationoffaceareas:howwellcanalinearneuralnetworkpredicthumanperformance.JournalofBiologicalSystem,Vol.6(3),pp.241-264,1998.6AliceJ.O"Toole,ThomasVetter,HeinrichH.Bulthoff&NikolausF.Troje.Theroleofshapeandtextureinformationinsexclassification.TechnicalReportNo.23December10,1995.7甘俊英,张有为,毛士艺.自适应主元提取算法及其在人脸图象特征提取中的应用[J].电子学报,2002,30(7):1013-10168余冰,金连甫,陈平.利用标准化LDA进行人脸识别[J].计算机辅助设计与图形学学报,2003,15(3):302-30648 附录1【1】训练样本特征矩阵生成源程序tic%定义训练ORL图库路径ORLPath=["E:dbs01";"E:dbs02";];BMPPath=["1.bmp";"2.bmp";"3.bmp";"4.bmp";"5.bmp";"6.bmp";"7.bmp";"8.bmp";"9.bmp";"10.bmp";];%=========================================%相关变量设置persons=2;dd=2;%降维后的维数pic=20;%每个人包含的人脸图像个数xun=10;%每个人参加训练样本个数ce=pic-xun;%每个人参加测试的样本个数P=persons*xun;%总训练样本个数T=persons*ce;%测试样本的个数%Partone训练A_1=zeros([112,92]);%计算全体训练样本的总值fori=1:personsAA(:,:,i)=zeros([112,92]);forj=1:xunimg_path=[ORLPath(i,:),BMPPath(j,:)];img=double(imread(img_path));%读入图像并转换为双精度以便计算TR(:,:,(i-1)*xun+j)=img;%载入全体训练样本48 AA(:,:,i)=AA(:,:,i)+img;%第i类训练样本的总值A_1=A_1+img;%计算总值endMC(:,:,i)=1/xun*AA(:,:,i);%计算第i类训练样本的均值endMM=1/P*A_1;%计算全体训练样本均值saveMCMCsaveMMMMsaveTRTRtocticN=2;%输入是几类模式识别问题M=10;%输入每一类模式有几幅图片loadTR%读取测试图像loadMC%载入每类图像的均值loadMM%载入总均值m=MCtotal_m=MMS=zeros(112,112);%计算类内离散度矩阵Sw=zeros(112,112);Sb=zeros(112,112)fori=1:Nforj=((i-1)*M+1):i*MS=S+(TR(:,j)-m(:,i))*(TR(:,j)-m(:,i))";endSw=Sw+S;%计算类间离散度矩阵Sb=Sb+(m(:,:,i)-total_m)*(m(:,:,i)-total_m)";endw1=inv(Sw)*Sb;%inv(Sw)对Sw求逆w1=10×1048 [WfI]=eig_self(w1);%eif_self(x)为自编函数,功能是对x求特征值并使特征值安降序排列Wfld=Wf(:,1:10);%求FLD投影矩阵其中l=10saveWfldWfld;B=Wfld"*TR;%获得最佳分类特征空间MDFssaveBB;%B=10×4800toc%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%【2】测试样本特征矩阵生成源程序tic%定义测试ORL图库路径ORLPath=["E:dbs01";"E:dbs02";];BMPPath=["11.bmp";"12.bmp";"13.bmp";"14.bmp";"15.bmp";"16.bmp";"17.bmp";"18.bmp";"19.bmp";"20.bmp";]%=========================================%相关变量设置person=2xun=10;%每个人参加训练样本个数ce=10;%每个人参加测试的样本个数P=persons*xun;%总训练样本个数T=persons*ce;%测试样本的个数A_1=zeros([112,92]);%计算全体训练样本的总值X_sum=zeros([10304,1]);fori=1:personsAA(:,:,i)=zeros([112,92]);forj=1:ceimg_path=[ORLPath(i,:),BMPPath(j,:)];48 img=double(imread(img_path));%读入图像并转换为双精度以便计算TT(:,:,(i-1)*xun+j)=img;%载入全体训练样本AA(:,:,i)=AA(:,:,i)+img;%第i训练样本的总值A_1=A_1+img;%计算总值endMCT(:,:,i)=1/xun*AA(:,:,i);%计算第i类训练样本的均值endMMT=1/P*A_1;%计算全体训练样本均值saveMCTMCTsaveMMTMMTsaveTTTTtocticN=2;%输入是几类模式识别问题M=10;%输入每一类模式有几幅图片loadTT%读取测试图像loadMCT%载入每类图像的均值loadMMT%载入总均值m=MCTtotal_m=MMTS=zeros(112,112);%计算类内离散度矩阵Sw=zeros(112,112);Sb=zeros(112,112)fori=1:Nforj=((i-1)*M+1):i*MS=S+(TR(:,j)-m(:,i))*(TR(:,j)-m(:,i))";endSw=Sw+S;48 %计算类间离散度矩阵Sb=Sb+(m(:,:,i)-total_m)*(m(:,:,i)-total_m)";endw1=inv(Sw)*Sb;%inv(Sw)对Sw求逆w1=10×10[WfI]=eig_self(w1);%eif_self(x)为自编函数,功能是对x求特征值并使特征值安降序排列Wfld=Wf(:,1:10);%求FLD投影矩阵其中l=10saveWfldWfld;T=Wfld"*TT;%获得最佳分类特征空间MDFssaveTT;%B=10×4800toc%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%【3】基于最小距离的识别率判定程序%Partthree识别ticloadT;loadB;sum=0;%计数器Aclass=zeros(40,1);%训练样本分类Bclass=zeros(40,1);%测试样本本应属于的类别forac=1:2Aclass(ac)=ceil(ac/5);%训练样本的分类endforbc=1:2Bclass(bc)=ceil(bc/2);%测试样本的本应类别endfori=1:2%第i个测试样本d=zeros(1,2);%第i个测试样本至所有样本的距离forj=1:2e=T(:,i)-B(:,j);48 e=norm(e);d(1,j)=d(1,j)+e;%第i幅测试样本至第j幅训练样本的距离end[Min,IND]=sort(d);%从小到大索引,取最小的那个类别即为结果Bresult(i)=Aclass(IND(1));ifBresult(i)~=Bclass(i)%识别率sum=sum+1;endenddisp("识别率:"),disp(100-100*sum/40);toc【4】特征值按降序排列——eig_self函数%特征值按降序排列——eig_self函数function[v,d]=eig_self(x)%特征值按降序排列[v1,d1]=eig(x);[m,n]=size(x);d2=zeros(n,1);d2=sum(d1)";v=zeros(m,n);d=zeros(m,n);fori=1:n[v3,d3]=max(d2);d(i,i)=v3;v(:,i)=v1(:,d3);d2(d3,1)=0;end48 附录2一种基于离散余弦变换与线性鉴别分析的有效的人脸识别方法摘要:已经证明线性鉴别分析是人脸识别中一种有效的方法.但是当涉及到高维矩阵的时候,大多数LDA方法都会首先使用PCA来将原始图像映射为低维矩阵,然后应用LDA转换来提取特征.但是在这种方法中一些对于LDA有效的矩阵信息在PCA步骤会丢失.为了克服这个缺点,本文提出了一种基于离散余弦变换(DCT)和线性鉴别分析(LDA)的人脸识别新方法.首先应用DCT进行降维,然后在低维空间中应用LDA来进行特征提取.我用应用2个人脸数据库来测试我们的方法,分别获得了基于两个数据库的识别率97.5%和96.0%.与PCA+LDA方法进行比较,可以发现本文提出的方法可以得到比PCA+LDA更好的性能.关键词:人脸识别,离散余弦变换,线性鉴别,主元分析1引言人脸识别是计算机视觉中一个很有挑战的任务.由于人脸识别在监控、安全、人份鉴别、访问控制以及人机智能交互等方面有着广泛的研究,因此它也吸引了越来越多的研究兴趣。最近10年,研究者提出了大量的人脸识别方法。在这些方法中LDA方法,通常人们也称之为Fisherface已经被证明是很有研究前景的。但是因为涉及到高维矩阵,而且由于训练集中的样本数通常远远少于每幅图像的像素,标准LDA会引起数学上的不稳定性。因此大量基于LDA的方法,都首先应用PCA的方法对原始矩阵进行降维,然后才使用LDA进行特征提取。但是PCA步骤很可能会丢失一些对LDA很有用的信息。PCA的另外一个缺点就是它的计算复杂性。应用这种方法必须求解训练样本的协方差矩阵,这就意味着训练过程就耗费大量的计算资源。48 为了克服这些传统的PCA+LDA方法的这些缺点,我们提出了一种新的基于LDA算法的人脸识别方法。新方法中应用DCT来取代PCA进行第一步的降维工作,从而使得LDA能够得到最好的判别结果。与PCA不同,DCT应用于降维不会对下一步的LDA产生任何影响。同时由于可以采用快速傅立叶变换(FFT),也使得这一方法更有效率。我们在ORL数据库和我们自建的数据库中进行了实验,结果表明我们提出的方法的性能要优于PCA+LDA和其它的一些方法。2LDA在人脸识别中的应用以及存在的问题LDA是模式识别中的一种降维方法。在降维方法中,PCA选择使得训练样本散布矩阵和类内相关性最大的线性投影,因此PCA选择的投影轴,并不能提供很好的鉴别性能,然而对于LDA,在降维的同时尽可能多的保留了分类信息。它试图直接找到一个能够很好将各类分开的投影。LDA不仅仅考虑到了类内散布矩阵,同时它也考虑到了类间散布矩阵。因此它更适合于用于图像源由于其它原因造成的变化,例如光照和表情最人脸识别图像的影响。LDA已经成功的应用与目标分类,图像修复和人脸识别中。LDA算法的基本思路寻找到一个使得类间散布矩阵与类内散布矩阵比值最大化的投影轴Wopt。对于一个M类问题,类间散布矩阵Sb和类内散布矩阵Sw分别定义为:(1)(2)其中μi是第i类的均值,μ是样本总体均值。如果Sw是非奇异的,那么最佳投影Wopt就是使得类间散布矩阵与类内散布矩阵最大化的值:(3)其中Wi是Sb和Sw的特征向量集的子集。是与之相关的n个最大的特征值。(4)48 等式(4)的一个解法就是求解矩阵的特征值问题。但是,在人脸识别问题中,训练样本数通常是小于样本矩阵的维数的,这使得类内散布矩阵Sw经常是奇异的。因此,很多基于LDA方法的人脸识别通常首先使用PCA来得到低维子空间。文献3中已经证明,PCA步骤可以有助于去掉Sb和Sw中的空矩阵。但是Sw中的空矩阵包含了大量的识别信息。此外PCA用于人脸识别将耗费大量的计算资源,使得使用该方法的人脸识别系统很难实现实时化。因此在我们的方法中将使用DCT取代PCA来进行降维,第三节将详细讨论DCT在降维中的应用。3DCT在降维中的应用离散余弦变换是图像处理中经常使用的一种方法。已经证明,它的信息包含性能很接近KLT。DCT的另一个优点是它可以使用FFT来有效地提高系统性能,因此很多实用的编码系统都是基于DCT的。对于一个m×n的图像输入,它的DCT由下式给出:u=0,1,2,…M-1;v=0,1,2,…N-1…………(5)它的反变换定义为:x=0,1,2,…M-1;y=0,1,2,…N-1…………(6)定义为:或者(当取其它值时)图一(a)显示的是一个92×112维的8位人脸图像,图1(b)显示的是其DCT后的结果C(u,v)。48 从图1(b)中可以看出,它包含了原始图像中的大量信息,而且只在左上角存储了少量的映射。4,人脸识别系统我们提出的人脸识别系统框图为:图35,实验结果我们使用了两个数据库来测试本文所提算法的性能,一个是ORL数据库,另一个是上海交通大学图像处理实验室的数据库。5.1基于ORL数据库的结果表一为基于ORL数据的库的一些常用人脸识别算法的识别率:表148 5.2基于自建数据库的结果表二为基于自建数据库的一些常用人脸识别算法的识别率:表26,结论我们提出了一种使用DCT和LDA的新的人脸识别方法。我们的方法有效的应用了DCT在降维中的优点和高的计算速的。因为使用了DCT取代PCA在传统FISHERFACE中的降维作用,我们的方法很好的克服了PCA使得有效信息丢失的问题。识别结果表明,我们的方法无论是在识别率还是运算时间上都优于其它的一些方法。48 附录3EfficientfacerecognitionmethodbasedonDCTandLDAZhangYankun&LiuChongqingInstituteofImageProcessingandPatternRecognition,ShanghaiJiaotongUniversity,Shanghai200030,P.R.Ghina(ReceivedApril15,2002)Abstract:Ithasbeendemonstratedthatthelineardiscriminantanalysis(LDA)isaneffectiveapproachinfacerecognitiontasks.However,duetothehighdimensionalityofanimagespace,manyLDAbasedapproachesfirstusetheprincipalcomponentanalysis(PCA)toprojectanimageintoalowerdimensionalspace,thenperformtheLDAtransformtoextractdiscriminantfeature.ButsomeusefuldiscriminantinformationtothefollowingLDAtransformwillbelostinthePCAstep.Toovercomethesedefects,afacerecognitionmethodbasedonthediscretecosinetransform(DCT)andtheLDAisproposed.FirsttheDCTisusedtoachievedimensionreduction,thenLDAtransformisperformedonthelowerspacetoextractfeatures.Twofacedatabasesareusedtotestourmethodandthecorrectrecognitionratesof97.5%and96.0%areobtainedrespectively.TheperformanceoftheproposedmethodiscomparedwiththatofthePCA+LDAmethodandtheresultsshowthatthemethodproposedoutperformsthePCA+LDAmethod.Keywords:facerecognition,discretecosinetransform,lineardiscriminantanalysis,principalcomponentanalysis.1。INTRODUCTIONFacerecognitionisachallengingtaskincomputervision.Ithasbeenofgreatinterestinrecentyearsbecauseofitswiderangeofapplicationssuchassurveillanceandsecurity,identityauthenticationandaccesscontrol,humancomputerintelligentinteraction.Numerousmethodshavebeenproposedforfacerecognitioninthelastdecade.Amongalltheseapproaches,atechniquebasedonlineardiscriminant48 analysis(LDA),whichisalsocalledFisherfaces,hasbeenprovedtobeapromisingapproach..However,duetothehighdimensionalityofanimagespaceandbecausethenumberofimagesinthetrainingsetismuchsmallerthanthenumberofpixelsineachimageasusual,theimplementationofstandardLDAwillresultinnumericalunstability.SomanyapproachesbasedonLDAoftenusetheprincipalcomponentanalysis(PCA,alsocalledKarhunen-Loevetransform(KLT))approachtoprojectanimageintoalowerdimensionalspaceatthefirststep,andthenperformtheLDAtoextractdiscrirninantfeatures.ButthefirstPCAsteppotentiallylosesusefuldiscriminantinformationthatisimportanttothefollowingLDAtransform.AnotherdrawbackofthePCAisitscomputationalcomplexity.Itmustsolvetheeigenproblemsforcovariancematrixofthetrainingsamples,whichmeansthetrainingiscomputationalexpensive.ToovercomethedrawbacksofthetraditionalPCA+LDAapproach,weproposeanovelLDAalgorithmforfacerecognition.Thenewalgorithmusesthediscretecosinetransform(DCT)toreplacethePCAforthedimensionreductionatthefirststep,andthenperformstheLDAtomaximizethediscriminantpower.UnlikethePCA,theDCTusedfordimensionreductionwillnotaffectthefollowingLDAtransformandcanbecomputedefficientlybyusingthefastFouriertransform(FFT).WeconducttheexperimentonORLdatabaseandourlargefacedatabase.TheresultsshowthatourapproachoutperformsthePCA+LDAapproachandsomeotherapproaches.2.LDAFORFACERECOGNITIONANDITSPROBLEMSLDAisadimensionreductionmethodinpatternrecognition.Fordimensionreduction,PCAchoosesadimensionreducinglinearprojectionthatmaximizesthescatterofallprojectedsamplesandisirrespectiveofclass-membership.SotheprojectionaxeschosenbyPCAmightnotprovidegooddiscriminantpower.TheLDA,however,istoperformdimensionreductionwhilepreservingasmuchclassdiscriminatoryinformationaspossible.Ittriestofinddirectionalongwhichtheclassesarebestseparated.Itdoesnotonlyconsiderthescatterwithinclassesbutalsothescatterbetweenclasses.Soitismorecapableofdistinguishingimagevariationduetoidentityformvariationcausedbyothersourcessuchas48 illuminationandexpressioninfacerecognition.LDAhasbeensuccessfullyappliedinobjectclassification,imageretrievalandfacerecognition.ThebasicideaofLDAistofindalineartransformWoptinsuchawaythattheratioofthebetween-classscatterandthewithin-classscatterismaximized.ForanM-classproblem,thebetween-andwithin-classscattermatricesSbandSwaredefinedas(1)(2)whereisthemeanvectorofclassXi.Uisoverallmeanvector.IfSwnonsingular,theoptimalprojectionWoptischosenasthematrixwithorthonormalwlumnwhichmaximizestheratioofthedeterminantofthebetween-classscattermatrixoftheprojectedsamplestothewithin-classscattermatrixofprojectedsamples.(3)whereWiisthesetofgeneralizedeigenvectorsSbandSwcorrespondingtothenlargestgeneralizedeigenvalues(4)AsolutiontoEq.(4)istocomputetheinverseofSb,andsolveaneigenproblemformatrix.However,infacerecognitionproblem,thenumberoftrainingsamplesissmallerthanthedimensionofthesamplevector.Thewithin-classscattermatrixSwisalwayssingular.SomanyLDAbasedapproachesfirstusethePCAtoprojectanimageintoalowerdimensionalsub-space,andthenperformdiscriminantprojectionusingLDA.AsYupointedoutinRef.[3],thePCAstephelpstoremovenullspacesfrombothSband48 Sw.ButthenullspaceofSw,containsthemostdiscriminantinformationforrecognition.Inaddition,thePCAiscomputationalexpensiveforfacerecognition.Itisdifficulttoimplementinrealtime.SoherewedonotusePCAfordimensionreductionatthestep,butusetheDCT.IntheSection3,wewilldiscussDCTfordimensionreduction.3。DCTFORDIMENSIONREDUCTIONThediscretecosinetransformisapopularimagecompressionmethod.Asisknown,itsinformationpackingabilitycloselyapproachesKLT.AnothermeritoftheDCTisthatitcanbeimplementedefficientlyusingthefastFouriertransform.SomostpracticaltransformcodingsystemsarebasedontheDCT.GivenaninputMXNimagef(x,y),itsDCT,C(u,v)isobtainedbythefollowingequation.u=0,1,2,…M-1;v=0,1,2,…N-1…………(5)Theinversetransformisdefinedbyx=0,1,2,…M-1;y=0,1,2,…N-1…………(6)TheisdefinedbyOR(otherwise)Figure1(a)showsa92X1128-bitfaceandFig.l(b)showsitsDCTcoefficientsC(u,v).48 FromFig.1(b),itcanbeobservedthatalargeamountofinformationabouttheoriginalimageisEfficientfacerecognitionmethodbasedonDCTandLDA.4.PROP0SEDFACEREOOGNITIONSYSTEMThissystemassumesthatthefaceregionhasbeenextractedfromimages.5。EXPERIMENTALRESULTSWeusetwofacedatabasestotestouralgorithm.OneisfromOlivettiResearchLaboratory(ORL),theotherisfromtheInstituteofImageProcessingandPatternRecognitionofShanghaiJiaotongUniversity.5.1TheexperimentalrerultsbasedonORLdatabases.WecomparetheperformanceofourmethodwiththoseofsomeothersinliteratureonORLdatabase,andlisttherecognitionratesinTable1.48 5.2ExperimentonaLargeFaceDatabaseInTable2,welisttheratesoftherecognitionconductedonourdatabasebyEigenfacesapproach,PCA+SVMapproach,DCTapproach,Fisherfacesapproachandourapproach.6.CONCLUSIONWehaveproposedanewfacerecognitionapproachbasedontheDCTandLDA.OurapproachexploitsthemeritoftheDCTfordimensionreductionandits48 highcomputationalspeed.ByusingtheDCTtoreplacethePCAinthetraditionalFisherfacesapproachfordimensionreduction,ourapproachcanovercomethedrawbacksofthePCAinthetraditionalFisher-facesapproach.Weusetwofacedatabasestotestourapproach.Theexperimentalresultshowsthatourapproachoutperformssomeotherapproaches,bothinrecognitionrateandcomputationaltime.48'