计算机硬件及网络支持向量机

上传人:e****s 文档编号:252198718 上传时间:2024-11-13 格式:PPT 页数:34 大小:305KB
收藏 版权申诉 举报 下载
计算机硬件及网络支持向量机_第1页
第1页 / 共34页
计算机硬件及网络支持向量机_第2页
第2页 / 共34页
计算机硬件及网络支持向量机_第3页
第3页 / 共34页
资源描述:

《计算机硬件及网络支持向量机》由会员分享,可在线阅读,更多相关《计算机硬件及网络支持向量机(34页珍藏版)》请在装配图网上搜索。

1、Click to edit Master title style,Click to edit Master text styles,Second level,Third level,Fourth level,Fifth level,*,*,支持向量机引导,孙宗宝,2006年12月20日,哈尔滨理工大学网络信息中心学术交流,11/13/2024,1,支持向量机引导,孙宗宝,2006年12月20日,哈尔滨理工大学网络信息中心学术交流,11/13/2024,2,内容提要,概述,线性可分情况理论,线性不可分情况,支持向量机模型,核函数,支持向量机网络,11/13/2024,3,SVM,简介,90年代中

2、期在统计学习理论的根底上开展起来的一种机器学习方法 (Boser,Guyon,Vapnik),适合有限样本(小样本)问题,在很大程度上解决了传统方法如神经网络中存在的问题,如过学习、非线性、多维问题、局部极小点问题等,统计学习理论和支持向量机被视为机器学习问题的一个根本框架,传统的方法都可以看作是SVM方法的一种实现,有坚实的理论根底和严格的理论分析,11/13/2024,4,概述,一、向量的内积与超平面,11/13/2024,5,概述,二、最优分类平面,11/13/2024,6,概述,二维数据最优分类线的根本要求:,1、要能将两类样本无错误的分开,即使经验风险最小,理论上为零,2、要使两类之

3、间的距离最大,也就是使margin最大,从而使实际风险最小,11/13/2024,7,概述,我们要做的是什么呢?,找到一个超平面(最优分类面),使得它能够尽可能多的将两类数据点正确的分开,同时使分开的两类数据点距离分类面最远。,11/13/2024,8,H,H,2,H,1,最优分类平面,为最优分类平面的方程,11/13/2024,9,SVM原理之线性可分,设线性可分样本集为(xi,yi),i=1,2,n,xRd,y+1,-1是类别标号。,那么d维空间中线性判别函数的一般形式为:,g(x)=wx+b,分类面方程为:,wx+b=0 (1),11/13/2024,10,SVM原理之线性可分,将判别函

4、数进行归一化,使两类所有样本都满足|g(x)|1,即,使离分类面最近的样本的|g(x)|=1,这样分类间隔就等于2/w,因此,间隔最大等价于使w(或w,2,)最小;,而,要求分类线对所有样本正确分类,就是要求其满足:,y,i,(wx,i,)+b-10,(i=1,2,n)(2),11/13/2024,11,SVM原理之线性可分,我们解决这样问题的思路是什么呢?,首要的就是设法找到解决问题的数学模型!,我们的问题是:,找到满足上述式2、且使w2的分类面。,其实这个分类面就是最优分类面!,11/13/2024,12,SVM原理之线性可分,支持向量SV在那呢?,能使式2,yi(wxi)+b-10,(i

5、=1,2,n),中等号成立的,也就是位于margin 上的样本就是支持向量。,11/13/2024,13,SVM原理之线性可分,最优分类平面求解的数学模型,我们的求解过程显然是一个有 约束条件的优化问题:,即在式(2)的约束下,求函数:,(w)=1/2w,2,=1/2(ww)(3),的最小值。,11/13/2024,14,SVM原理之线性可分,求解方法-Lagrange 乘子法,什么是Lagrange 乘子法?,看一个例子。,问题:给你一块面积固定等于a 的平方 板子,问做成什么样的长方体盒子,它具有最大的体积。,11/13/2024,15,SVM原理之线性可分,Lagrange 乘子法,设长

6、方体的三个棱长为x,y,z,那么其体积f 为三个边长的乘积:,f(x,y,z)=xyz,本问题要求外表积为a 的平方,于是长方体的6面的面积可以写成:,2xy+2xz+2yz=a2,即 2xy+2xz+2yz-a2=0,这个问题转化为了有约束条件的优化问题。,11/13/2024,16,SVM原理之线性可分,Lagrange 乘子法,解题方法为:,1 用拉格朗日方法制造一个新函数,F,2 在,F,中放进一个未知的常数,C,得到:,F=xyz+C(2xy+2xz+2yz-a,2,),11/13/2024,17,SVM原理之线性可分,Lagrange 乘子法,F对,x,y,z 的三个自变量的偏微分

7、分别为零,得到三个新方程式:,yz+2,C,(,y,+,z,),=,0,xz,+2,C,(,x,+,z,)=0,xy,+2,C,(,x,+,y,)=0,因为自变量仅可能是正数,把上面的式子相除得,(,x/y,)=(,x,+,z,)/(,y,+,z,),(,y,/,z,)=(,x,+,y,)/(,x,+,z,),11/13/2024,18,SVM原理之线性可分,Lagrange 乘子法,由此得出只有各个自变量的值相等才可以维持上面的关系,再由约束条件得到它们的值是:,x=y=z=(a/6),11/13/2024,19,SVM原理之线性可分,构造拉格朗日函数:,L(w,b,a)=(ww),a,i,

8、y,i,(wx,i,)+b-1,其中:a,i,0为Lagrange系数。求式(3)的极小值就是对w和b求拉氏函数的极小值。求L对w和b的偏微分,并令其等于0,可转化为对偶问题:,在约束条件 a,i,y,i,=0,ai0,i=1,2,n之下对,a,i,0求式(5)的最大值:,11/13/2024,20,SVM原理之线性可分,W(a)=ai-aiajyiyj(xi.xj)5,假设ai*为最优解,那么,w*=i=1.n ai*yixi 6,即最优分类面的权系数向量式训练样本的线性组合。,11/13/2024,21,SVM原理之线性可分,这是一个不等式约束的二次函数极值问题,存在唯一解,并且解必须满足

9、(Kuhn-Tucker条件):,aiyi(w*xi+b)-1=0,i=1.n 7,显然,只有支持向量的系数a,i,不为0,即只有支持向量影响最终的划分结果。,这是为什么?,11/13/2024,22,SVM原理之线性可分,于是式6,w*=i=1.n ai*yixi,可以写成:,w=,a,i,y,i,x,i,可以看出,只有支持向量影响最终的划分结果,,,最优分类面的权系数向量是训练样本向量的线性组合。,8,11/13/2024,23,SVM原理之线性可分,假设ai*为最优解,求解上述问题后得到的最优分类函数是:,f(x)=sgn(w*x)+b*=sgnai*yi(xix)+b*,其中:sgn(

10、)为符号函数,b*是分类的阈值,可以由任意一个支持向量用式(2)求得,或通过两类中任意一对支持向量取中值求得。对于给定的未知样本x,只需计算sgn(wx+b),即可判定x所属的分类。对于非支持向量ai 都为0。,11/13/2024,24,SVM原理之线性不可分,对于线性不可分的样本,希望使误分类的点数最小,为此在式(2)中引入松弛变量i0,即:,yi(wxi)+b-1+i0,(i=1,2,n)9,/yi(wxi)+b-10,(i=1,2,n)(2),11/13/2024,25,SVM原理之线性不可分,在式(9)中,对于给定的常数C,求出使,(w,)=(ww)+C i 10,取极小值的w,b,

11、这一优化问题同样需要变换为用拉格朗日乘子表示的对偶问题,变换的过程与前面线性可分样本的对偶问题类似,结果也几乎完全相同,只是约束条件略有变化:,a,i,y,i,=0,(0a,i,C,i=1,2,n)(11),C反映了在复杂性和不可分样本所占比例之间的折中。,11/13/2024,26,支持向量机,如果用内积K(x,x)代替最优分类面中的点积,就相当于把原特征空间变换到了某一新的特征空间,此时优化函数变为:,W(a)=a,i,-a,i,a,j,y,i,y,j,K,(x,i,x,j,),相应的判别函数也应变为:,f(x)=sgn,a,i,*,y,i,k,(x,i,x)+b,*,11/13/2024

12、,27,支持向量机,算法的其他条件均不变,这就是支持向量机。,所以,原问题就转化成了找SV的问题,而求SV的过程就是解一个,二次规划,(有约束的),二次规划无局部极值,只有一个最值,所以SV的求解不会有 不收敛 或者 收敛到局部极小 的问题。而VC维又保证了机器的容量,不可能过学习(因为机器的结构已经固定),具体的求解方法可以参考运筹学中约束二次规划的求解,11/13/2024,28,非线性分类面,非线性可分的数据样本在高维空间有可能转化为线性可分。,在训练问题中,涉及到训练样本的数据计算只有两个样本向量点乘的形式,使用函数 ,将所有样本点映射到高为空间,那么新的样本集为,设函数,内核函数(Kernel function),11/13/2024,29,一个能实现非线性关系到线性关系变换的实例,取:,那么,11/13/2024,30,核函数,11/13/2024,31,核函数,Mercer条件,对于任意的对称函数K(,x,x,),它是某个特征空间中的内积运算的充分必要条件是,对于任意的(x)0且2(,x,)d,x,0,11/13/2024,32,支持向量网络,11/13/2024,33,通常的内核函数,线性内核,多项式内核,径向基函数内核(RBF),S形内核,谢谢大家,!,11/13/2024,34,

展开阅读全文
温馨提示:
1: 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
2: 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
3.本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
5. 装配图网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

相关资源

更多
正为您匹配相似的精品文档
关于我们 - 网站声明 - 网站地图 - 资源地图 - 友情链接 - 网站客服 - 联系我们

copyright@ 2023-2025  sobing.com 装配图网版权所有   联系电话:18123376007

备案号:ICP2024067431-1 川公网安备51140202000466号


本站为文档C2C交易模式,即用户上传的文档直接被用户下载,本站只是中间服务平台,本站所有文档下载所得的收益归上传人(含作者)所有。装配图网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。若文档所含内容侵犯了您的版权或隐私,请立即通知装配图网,我们立即给予删除!