欢迎来到三一办公! | 帮助中心 三一办公31ppt.com(应用文档模板下载平台)
三一办公
全部分类
  • 办公文档>
  • PPT模板>
  • 建筑/施工/环境>
  • 毕业设计>
  • 工程图纸>
  • 教育教学>
  • 素材源码>
  • 生活休闲>
  • 临时分类>
  • ImageVerifierCode 换一换
    首页 三一办公 > 资源分类 > PPT文档下载  

    《weka操作介绍》PPT课件.ppt

    • 资源ID:5454471       资源大小:557KB        全文页数:15页
    • 资源格式: PPT        下载积分:15金币
    快捷下载 游客一键下载
    会员登录下载
    三方登录下载: 微信开放平台登录 QQ登录  
    下载资源需要15金币
    邮箱/手机:
    温馨提示:
    用户名和密码都是您填写的邮箱或者手机号,方便查询和重复下载(系统自动生成)
    支付方式: 支付宝    微信支付   
    验证码:   换一换

    加入VIP免费专享
     
    账号:
    密码:
    验证码:   换一换
      忘记密码?
        
    友情提示
    2、PDF文件下载后,可能会被浏览器默认打开,此种情况可以点击浏览器菜单,保存网页到桌面,就可以正常下载了。
    3、本站不支持迅雷下载,请使用电脑自带的IE浏览器,或者360浏览器、谷歌浏览器下载即可。
    4、本站资源下载后的文档和图纸-无水印,预览文档经过压缩,下载后原文更清晰。
    5、试题试卷类文档,如果标题没有明确说明有答案则都视为没有答案,请知晓。

    《weka操作介绍》PPT课件.ppt

    ,WEKA操作介绍,命令环境,算法实验环境,知识流环境,在KnowledgeFlow 窗口顶部有八个标签:DataSources-数据载入器 DataSinks-数据保存器Filters-筛选器Classifiers-分类器Clusterers-聚类器Associations关联器Evaluation评估器Visualization可视化,3,2,5,4,1,6,7,8,1.区域1的几个选项卡是用来切换不同的挖掘任务面板。,Preprocess(数据预处理)Classify(分类)Cluster(聚类)Associate(关联分析)Select Attributes(选择属性)Visualize(可视化),2.区域2是一些常用按钮。包括打开数据,保存及编辑功能。我们可以在这里把“bank-data.csv”,另存为“bank-data.arff”,3.在区域3中“Choose”某个“Filter”,可以实现筛选数据或者对数据进行某种变换。数据预处理主要就利用它来实现。,对取值较多的数值型属性,离散化可借助WEKA中名为“Discretize”的Filter来完成。,4.区域4展示了数据集的一些基本情况。,5.区域5中列出了数据集的所有属性。勾选一些属性并“Remove”就可以删除它们,删除后还可以利用区域2的“Undo”按钮找回。区域5上方的一排按钮是用来实现快速勾选的。在区域5中选中某个属性,则区域6中有关于这个属性的摘要。注意对于数值属性和标称属性,摘要的方式是不一样的。,6.区域7是区域5中选中属性的直方图。若数据集的某个属性是目标变量,直方图中的每个长方形就会按照该变量的比例分成不同颜色的段。默认地,分类或回归任务的默认目标变量是数据集的最后一个属性。要想换个分段的依据,即目标变量,在区域7上方的下拉框中选个不同的分类属性就可以了。下拉框里选上“No Class”或者一个数值属性会变成黑白的直方图。,属性名(Name)、属性类型(Type)、缺失值(Missing)数及比例、不同值(Distinct)数、唯一值(Unique)数及比例对于数值属性和标称属性,摘要的方式是不一样的。数值属性显示最小值(Minimum)、最大值(Maximum)、均值(Mean)和标准差(StdDev),7.区域8是状态栏,可以查看Log以判断是否有错。右边的weka鸟在动的话说明WEKA正在执行挖掘任务。右键点击状态栏还可以执行JAVA内存的垃圾回收。,Using training set 使用训练集评估Supplied test set 使用测试集评估Cross-validation 交叉验证 设置折数FoldsPercentage split 保持方法。使用一定比例的训练实例作评估 设置训练实例的百分比,Classify,Run information 运行信息Summary 针对训练/检验集的预测效果汇总(平均绝对误差等等)Detailed Accuracy By Class 对每个类的预测准确度的详细描述。Confusion Matrix 混淆矩阵,其中矩阵的行是实际的类,矩阵的列是预测得到的类,矩阵元素就是相应测试样本的个数,主要算法包括:SimpleKMeans 支持分类属性的K均值算法DBScan 支持分类属性的基于密度的算法EM 基于混合模型的聚类算法 FathestFirst K中心点算法 OPTICS 基于密度的另一个算法Cobweb 概念聚类算法sIB 基于信息论的聚类算法,不支持分类属性XMeans 能自动确定簇个数的扩展K均值算法,不支持分类属性,Cluster,右击左侧栏result list,点“Visualize cluster assignments”。弹出的窗口给出了各实例的散点图。,Cluster,Associate,设置参数car:如果设为真,则会挖掘类关联规则而不是全局关联规则。classindex:类属性索引。如果设置为-1,最后的属性被当做类属性。delta:以此数值为迭代递减单位。不断减小支持度直至达到最小支持度或产生了满足数量要求的规则。lowerBoundMinSupport:最小支持度下界。metricType:度量类型,设置对规则进行排序的度量依据。可以是:置信度(类关联规则只能用置信度挖掘),提升度(lift),平衡度(leverage),确信度(conviction)。minMtric:度量的最小值。numRules:要发现的规则数。outputItemSets:如果设置为真,会在结果中输出项集。removeAllMissingCols:移除全部为缺失值的列。significanceLevel:重要程度。重要性测试(仅用于置信度)。upperBoundMinSupport:最小支持度上界。从这个值开始迭代减小最小支持度。verbose:如果设置为真,则算法会以冗余模式运行。,关联运行结果,

    注意事项

    本文(《weka操作介绍》PPT课件.ppt)为本站会员(小飞机)主动上传,三一办公仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。 若此文所含内容侵犯了您的版权或隐私,请立即通知三一办公(点击联系客服),我们立即给予删除!

    温馨提示:如果因为网速或其他原因下载失败请重新下载,重复下载不扣分。




    备案号:宁ICP备20000045号-2

    经营许可证:宁B2-20210002

    宁公网安备 64010402000987号

    三一办公
    收起
    展开