ch11特征选择与稀疏学习 周志华ppt课件.ppt
《ch11特征选择与稀疏学习 周志华ppt课件.ppt》由会员分享,可在线阅读,更多相关《ch11特征选择与稀疏学习 周志华ppt课件.ppt(33页珍藏版)》请在三一办公上搜索。
1、徐淼,第十一章:特征选择与稀疏学习,特征,特征描述物体的属性特征的分类相关特征: 对当前学习任务有用的属性无关特征: 与当前学习任务无关的属性冗余特征*: 其所包含信息能由其他特征推演出来,*为简化讨论,本章暂不涉及冗余特征,例子:西瓜的特征,西瓜的特征,颜色纹理触感根蒂声音,相关特征,无关特征,好瓜,坏瓜,当前任务:西瓜是否是好瓜,特征选择,特征选择从给定的特征集合中选出任务相关特征子集必须确保不丢失重要特征原因减轻维度灾难:在少量属性上构建模型降低学习难度:留下关键信息,例子:判断是否好瓜时的特征选择,西瓜的特征,颜色纹理触感根蒂声音,相关特征,无关特征,好瓜,坏瓜,当前任务:西瓜是否是好
2、瓜,特征选择:选择当前任务相关特征,特征选择的一般方法,遍历所有可能的子集计算上遭遇组合爆炸,不可行可行方法,两个关键环节:子集搜索和子集评价,子集搜索,前向搜索:逐渐增加相关特征后向搜索:从完整的特征集合开始,逐渐减少特征双向搜索:每一轮逐渐增加相关特征,同时减少无关特征,用贪心策略选择包含重要信息的特征子集,特征集合,当前最优子集优于上一轮最优子集?,Y,N,前向搜索,最优子集初始为空集,特征集合初始时包括所有给定特征,结束,子集评价,特征子集确定了对数据集的一个划分每个划分区域对应着特征子集的某种取值样本标记对应着对数据集的真实划分,通过估算这两个划分的差异,就能对特征子集进行评价;与样
3、本标记对应的划分的差异越小,则说明当前特征子集越好,用信息熵进行子集评价,常见的特征选择方法,常见的特征选择方法大致分为如下三类:过滤式包裹式嵌入式,将特征子集搜索机制与子集评价机制相结合,即可得到特征选择方法,过滤式选择,Relief (Relevant Features) 方法 Kira and Rendell, 1992为每个初始特征赋予一个“相关统计量”,度量特征的重要性特征子集的重要性由子集中每个特征所对应的相关统计量之和决定设计一个阈值,然后选择比阈值大的相关统计量分量所对应的特征或者指定欲选取的特征个数,然后选择相关统计量分量最大的指定个数特征如何确定相关统计量?,先用特征选择过
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- ch11特征选择与稀疏学习 周志华ppt课件 ch11 特征 选择 稀疏 学习 周志华 ppt 课件
链接地址:https://www.31ppt.com/p-1375661.html