第八章特征提取

上传人:仙*** 文档编号:33934658 上传时间:2021-10-19 格式:PPT 页数:25 大小:709KB
收藏 版权申诉 举报 下载
第八章特征提取_第1页
第1页 / 共25页
第八章特征提取_第2页
第2页 / 共25页
第八章特征提取_第3页
第3页 / 共25页
资源描述:

《第八章特征提取》由会员分享,可在线阅读,更多相关《第八章特征提取(25页珍藏版)》请在装配图网上搜索。

1、第八章 特征提取王文伟 Wang Wenwei, Dr.-Ing.Tel: 18971562600Email: Web: http:/ 特征提取2Table of Contents电子信息学院第八章 特征提取38.1 基本概念u特征选择与提取是模式识别中重要而困难的一个环节:分析各种特征的有效性并选出最有代表性的特征是模式识别系统设计的关键步骤。降低特征维数在很多情况下是有效设计分类器的重要课题。 计算上更易实现。 消除特征间的相关性,使新特征更有利于分类。引言数据获取预处理特征提取与选择分类决策分类器设计信号空间特征空间x xa第八章 特征提取48.1.1 三大类特征u三大类特征:物理、结构

2、和数学特征物理和结构特征:易于为人的直觉感知,但有时难于定量描述,因而不易用于机器判别。数学特征:易于用机器定量描述和判别,如基于统计的特征。u讨论的重点是根据学习样本来选择和提取数学特征,而物理和结构特征的测量与分析涉及研究对象本身的物理规律。引言第八章 特征提取58.1.2 有关特征的基本概念u特征形成 (acquisition):信号获取或测量原始测量,其值域称为测量空间:对象表示x x = 测量空间的点原始特征:通过基本计算产生基本特征y yu实例:数字图象中的各像素灰度值人体的各种生理指标u原始测量和原始特征分析:原始测量不能反映对象(类别)本质高维原始特征不利于分类器设计:计算量大

3、,数据冗余,样本分布十分稀疏。引言第八章 特征提取6特征的选择与提取u两类提取有效信息、压缩特征空间的方法:特征提取和特征选择u特征提取 (extraction):用映射(或变换)的方法把高维原始特征变换为较少的新特征。u特征选择(selection) :从原始特征中挑选出一些最有代表性、分类性能最好的特征。u特征的选择与提取与具体问题有很大关系,目前没有理论能给出对任何问题都有效的特征选择与提取方法。引言第八章 特征提取7特征的选择与提取举例u细胞图像自动分类:原始测量:(正常与异常)细胞的数字图像原始特征(特征的形成,找到一组代表细胞性质的特征):细胞面积,胞核面积,形状系数,光密度,核内

4、纹理,核浆比 等等压缩特征:原始特征的维数仍很高,需压缩以便于分类 特征选择:挑选最有分类信息的特征,方法有:专家知识,数学方法 特征提取:数学变换,消除特征之间的相关性。 傅立叶变换或小波变换 用PCA方法作特征压缩引言TyWx第八章 特征提取88.2 基于类别可分性判据的特征提取u特征提取:用映射(或变换)的方法把高维原始特征变换为较少的新特征。线性变换:u特征有效性=类别可分性 类别可分性判据J:衡量不同特征及其组合对分类是否有效的定量准则u基于可分性判据的特征提取,就是求最优变换W*argm ax()TJWWWxTyWx第八章 特征提取9基于距离可分性判据的特征提取1()()cTbii

5、iiSPmm mm( )( )111()()inciiTwikikiikiSPnxmxm( )tr()tr()dwbTwbJSSxWSSW样本类间离散度矩阵样本类内离散度矩阵类间可分离性判据可分性判据112,.,wbDd S S设矩阵的本征值为并降序排列,则选前 个本征值对应的本证向量组成变换矩阵W,就是基于该可分性判据的最佳变换。12*,.,dWu uu1(*)(1)ddiiJW*argm ax()dJWWx第八章 特征提取108.3 主成分分析方法u特征提取:用映射(或变换)的方法把高维原始特征变换为较少的新特征u主成分分析PCA (Principle Component Analysis

6、)方法:K. Pearson提出,从一组特征中计算出一组按重要性排列的新特征,它们是原特征的线性组合,并且相互之间不相关。*argm ax()TJWWWx第八章 特征提取11第一主成分变换11T x111T特征提取11,.,DxxD记为个 原 始 特 征 , 想变 换 出 最 重 要 的 一 个 新 特 征11最 佳 的 变 换,是 使 得的 方 差 最 大 的 变 换2211111var()()()TEE构造拉格朗日函数:11111()(1)TTLv第八章 特征提取12第一主成分变换11v特征提取11最 佳 的是的 最 大 本 征 值对 应 的 本 证 向 量 ,称 为 第一 主 成 分 ,

7、 它 在 原 始 特 征的 所 有 线 性 组 合 里 方 差 最 大最优解11111var()TTvv第八章 特征提取13推广特征提取121,.,DdddW设协方差矩阵 的本征值为并降序排列,则选前个本征值对应的本证向量组成变换矩阵,就是构造 个主成分,.,的最佳变换。数据中大部分信息集中在较少的几个主成分上11/dDii根据给定的比例,选择适当数目的主成分作为样本的新特征第八章 特征提取148.4 K-L (Karhunen-Loeve)变换u特征提取:用映射(或变换)的方法把高维原始特征变换为较少的新特征uK-L (Karhunen-Loeve)变换:特征降维变换后,不能完全地表示原有的

8、对象,信息总会有损失。希望找到一种信息能量最为集中的的变换方法,使降维后信息损失最小。最优正交线性变换。*argm ax()TJWWWx第八章 特征提取15K-L变换(展开)u离散K-L变换:对(随机)向量x用确定的完备正交归一向量组(系)uj展开1jjjyxuTijijuuTjjy uxxy特征提取组合系数12,.,Tyyyy第八章 特征提取16有限项K-L展开的均方误差u用有限项估计x :1djjjyxuu该估计的均方误差:()()TExxxx211TTjjjjdjdEyEuxxuE ()Tijijrx xE Rxx11TTTjjjjjdjdEuxxuuR uTjjy ux特征提取记矩阵则

9、第八章 特征提取17求解最小均方误差正交基u用Lagrange乘子法,得到:1if then TjjjjjjdR uuuR u 取 得 极 值u结论:以相关矩阵R R的d个本征向量为基向量来展开x x时,其均方误差为:1jjduK-L变换:当取矩阵R R的d个最大本征值对应的本征向量来展开x x时,其截断均方误差,在所有用d维正交坐标系展开中最小。这d个本征向量组成的正交坐标系称作x x所在的D维空间的d维K-L变换坐标系, x x在K-L坐标系上的展开系数向量y y称作x x的K-L变换特征提取第八章 特征提取18K-L变换的表示uK-L变换的向量展开表示:Tjjy uxuK-L变换的矩阵表

10、示:12,.,dxuuuyU yTyUx1djjjyxu特征提取xy第八章 特征提取19K-L变换的性质uK-L变换是信号的最佳压缩表示,误差最小。uy的相关矩阵是对角矩阵,即各分量互不相关。TTTTijijijTTijijjiijEy yEER uxxuuxxuuuuuTTTTREEUUUUyy yxxR特征提取第八章 特征提取20K-L坐标系将相关函数矩阵对角化1200dRyuK-L坐标系将相关函数矩阵对角化,即通过K-L变换消除原有向量x的各分量间的相关性,从而有可能去掉那些带有较少信息的分量以达到降低特征维数的目的。特征提取第八章 特征提取21K-L变换图解x1x2u2u112, 12

11、221 12 2( , , , )( )nnij i ji jUn nf x xxrxxyyyxyxRxy URUy y y二次曲线方程标准二次曲线方程特征提取等概率密度轨迹第八章 特征提取22K-L变换的数据压缩例解u以2x1变换为例,有两个本证向量,取变换矩阵U=u1,则x的K-L变换y为为: y = UTx = u1T x = y1u变换的能量损失为2222221215.9 %41特征提取第八章 特征提取23K-L变换的产生矩阵u数据集KN=xi的K-L变换的产生矩阵由数据的二阶统计量决定,即K-L坐标系的基向量为基于数据x的某种二阶统计量的产生矩阵的本征向量。uK-L变换的产生矩阵可以

12、有多种选择:x的相关函数矩阵R=ExxTx的协方差矩阵C=E(x-) (x-)T(当样本类别已知)样本总类内离散度矩阵:1,E()(),cTwiiiiiiiSPxxx特征提取第八章 特征提取24未知类别样本的K-L变换u常用总体样本的协方差矩阵C=E(x-) (x-)T进行K-L变换,K-L坐标系U=u1,u2,.,ud按照C的本征值的下降次序选择。u例:设一样本集的协方差矩阵是:求最优2x1特征提取器U解答:计算特征值及特征向量V, D=eig(C);特征值D=24.736, 2.263T,特征向量:由于12,故最优2x1特征提取器此时的K-L变换式为:19.59.59.57.5C0.8750.4820.4820.875V10.8750.482Uu1120.8750.482TTxUxyxux特征提取第八章 特征提取258.5 讨论u特征的选择与提取是模式识别中重要而非常困难的一步 模式识别的第一步:分析各种特征的有效性并选出最有代表性的特征 降低特征维数在很多情况下是有效设计分类器的重要课题u三大类特征:物理、结构和数学特征 物理和结构特征:易于为人的直觉感知,但难于定量描述,因而不易用机器判别 数学特征:易于用机器定量描述和判别

展开阅读全文
温馨提示:
1: 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
2: 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
3.本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
5. 装配图网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

相关资源

更多
正为您匹配相似的精品文档

相关搜索

关于我们 - 网站声明 - 网站地图 - 资源地图 - 友情链接 - 网站客服 - 联系我们

copyright@ 2023-2025  zhuangpeitu.com 装配图网版权所有   联系电话:18123376007

备案号:ICP2024067431-1 川公网安备51140202000466号


本站为文档C2C交易模式,即用户上传的文档直接被用户下载,本站只是中间服务平台,本站所有文档下载所得的收益归上传人(含作者)所有。装配图网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。若文档所含内容侵犯了您的版权或隐私,请立即通知装配图网,我们立即给予删除!