模式识别与人工智能.pptx
《模式识别与人工智能.pptx》由会员分享,可在线阅读,更多相关《模式识别与人工智能.pptx(60页珍藏版)》请在三一办公上搜索。
1、Pattern Recognition&artificial IntelligenceLecture 2:特征选择与提取(一),主要内容,1.引言2 类别可分离性判据3 特征选择4.特征提取,1.引言,【问题的提出】,【问题的提出】,【问题的提出】,【问题的提出】,方案2.强调分析不同截面的信号,如在框架的若干部位沿不同方向截取截面分析从背景到字,以及从字到背景转换的情况,如AB截面切割字符三次,CD截面切割字符一次等。,【问题的提出】,例 用RGB颜色空间和HSI颜色空间,【问题的提出】,【问题的提出】,【问题的提出】,【概念】,【概念】,【概念】,2 类别可分离性判据,【概念】,特征选择与
2、提取的任务是找出一组对分类最有效的特征,因此需一准则。,概念:数学上定义的用以衡量特征对分类的效果的准则实际问题中需根据实际情况人为确定。,误识率判据:理论上的目标,实际采用困难(密度未知,形式复杂,样本不充分,),可分性判据:实用的可计算的判据,【概念】,(1)与误判概率(或误分概率的上界、下界)有单调关系。,(2)当特征相互独立时,判据有可加性,即:,类可分别判断函数,【概念】,(3)判据具有“距离”的某些特性,即:,(4)对特征数目是单调不减,即加入新的特征后,判 据值不减。,类可分别判断函数,【概念】,19,值得注意的是:上述的构造可分性判据的要求,即“单调性”、“叠加性”、“距离性”
3、、“单调不减性”。在实际应用并不一定能同时具备,但并不影响它在实际使用中的价值。,类可分别判断函数,类可分别判断依据的常用方法:基于几何距离的可分性判据基于概率密度的可分性判据基于熵的类可分性判据,基于几何距离的类可分离判据,一般来讲,不同类的模式可以被区分是由于它们所属类别在特征空间中的类域是不同的区域。显然,区域重叠的部分越小或完全没有重叠,类别的可分性就越好。因此可以用距离或离差测度(散度)来构造类别的可分性判据。,基于几何距离的类可分离判据,(一)点与点的距离,(二)点到点集的距离,用均方欧氏距离表示,基于几何距离的类可分离判据,(三)类内及总体的均值矢量,各类模式的总体均值矢量,类的
4、均值矢量:,为相应类的先验概率,当用统计量代替先验概率时,总体均值矢量可表示为:,基于几何距离的类可分离判据,(四)类内距离,类内均方欧氏距离,类内均方距离也可定义为:,基于几何距离的类可分离判据,(五)类内离差矩阵,显然,(六)两类之间的距离,基于几何距离的类可分离判据,(七)各类模式之间的总的均方距离,当取欧氏距离时,总的均方距离为,基于几何距离的类可分离判据,(八)多类情况下总的类内、类间及总体离差矩阵,类内离差,类间离差,总体离差,易导出,各模式之间总的均方距离,基于几何距离的类可分离判据,基于几何距离的类可分离判据,在特征空间中,当类内模式较密聚,而不同类的模式相距较远时,从直觉上我
5、们知道分类就较容易,由各判据的构造可知,这种情况下所算得的判据值也较大。由判据的构造我们还可以初步了解运用这类判据的原则和方法。,选择原则:,ii.计算简单,易于实现。,iii.数学上容易处理。,准则函数的递推计算问题:每增/减一个特征,只影响向量中的一个元素,矩阵的一行和一列。,i.实际分类问题需要,找与分类性能关系密切者。,基于几何距离的类可分离判据,基于概率分布的可分性判据,考查两类分布密度之间的交叠程度,基于概率分布的可分性判据,32,可用两类概密函数的重叠程度来度量可分性,构造基于类概密的可分性判据。此处的所谓重叠程度是指两个概密函数相似的程度。,基于概率分布的可分性判据,基于概率分
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 模式识别 人工智能
链接地址:https://www.31ppt.com/p-4589528.html