欢迎来到三一办公! | 帮助中心 三一办公31ppt.com(应用文档模板下载平台)
三一办公
全部分类
  • 办公文档>
  • PPT模板>
  • 建筑/施工/环境>
  • 毕业设计>
  • 工程图纸>
  • 教育教学>
  • 素材源码>
  • 生活休闲>
  • 临时分类>
  • ImageVerifierCode 换一换
    首页 三一办公 > 资源分类 > DOCX文档下载  

    阿里天池大数据竞赛实战.docx

    • 资源ID:3134440       资源大小:37.50KB        全文页数:4页
    • 资源格式: DOCX        下载积分:6.99金币
    快捷下载 游客一键下载
    会员登录下载
    三方登录下载: 微信开放平台登录 QQ登录  
    下载资源需要6.99金币
    邮箱/手机:
    温馨提示:
    用户名和密码都是您填写的邮箱或者手机号,方便查询和重复下载(系统自动生成)
    支付方式: 支付宝    微信支付   
    验证码:   换一换

    加入VIP免费专享
     
    账号:
    密码:
    验证码:   换一换
      忘记密码?
        
    友情提示
    2、PDF文件下载后,可能会被浏览器默认打开,此种情况可以点击浏览器菜单,保存网页到桌面,就可以正常下载了。
    3、本站不支持迅雷下载,请使用电脑自带的IE浏览器,或者360浏览器、谷歌浏览器下载即可。
    4、本站资源下载后的文档和图纸-无水印,预览文档经过压缩,下载后原文更清晰。
    5、试题试卷类文档,如果标题没有明确说明有答案则都视为没有答案,请知晓。

    阿里天池大数据竞赛实战.docx

    阿里天池大数据竞赛实战阿里天池大数据竞赛实战:RF&GBRT 完成过程 1、Xlab GBRT上手 微信公众号ID: datadw 进入领取资料。 1.1、训练特征表准备 训练的特征表gbrt_offline_section_one_24格式为:user_id,brand_id,feature1,feature2.Label 见下图: 1.2 、建立特征稀疏表,为训练做准备 特征稀疏表可直接在Xlab由原始特征表转换得到,截图如下: 进入普通表转稀疏矩阵界面后,在选择列里填上: user_id对应的列号,brand_id对应的列号,以及想要使用的众多特征对应的列号;然后在输出表里填上转换成的稀疏矩阵:gbrt_offline_section_one_24_1;如下图 1.3 、GBRT训练 利用训练的特征表gbrt_offline_section_one_24,进行GBRT训练,如下图所以 进入配置界面,勾选训练的标签,稀疏矩阵名处输入刚才转好的稀疏矩阵gbrt_offline_section_one_24_1,模型输出表处填写模型输出表名,参数配置处根据效果进行配置。如下图所示: 配置好只好就可以进行训练了,等待训练好之后等到GBRT预测模型:gbrt_offline_section_one_25; 1.4、GBRT预测特征表准备 训练的特征表gbrt_offline_section_two_11格式与训练特征表格式一样,为:user_id, brand_id, feature1, feature2.Label 见下图: 1.5、建立预测稀疏矩阵表 特征稀疏表可直接在Xlab由原始特征表转换得到,方法和原来一样,直接截图如下: 需要注意的是,选择列必须和训练时候一样! 1.6、GBRT预测 利用转好的预测稀疏矩阵表gbrt_offline_section_two_11_1进行预测,如下图所示 进入界面如下:model 处填写刚才训练好的GBRT模型表:gbrt_offline_section_one_25;输出表名处填写预测结果输出表 gbrt_offline_section_two_13,然后进行预测,如下图所示: 1.7、GBRT碎碎念 GBRT预测好之后,得到的结果为与原始预测表gbrt_offline_section_two_11一一对应的单列值y_var(搞不懂为什么不提供类似RF那样预测结果追加user_id,brand_id 列),如下图: 所以,还得进行追加ID列,进行zxs_gbrt_offline_section_two_13_1和zxs_gbrt_offline_section_two_11_1两张表的合并,得到类似user_id,brand_id,y_val的表,取阈值进行推荐就可以了,下图为xlab里提供的脚本,追加ID列代码。 另外:附上脚本实现的代码,方便测试: 2、Xlab RF上手 2.1、训练特征表准备 训练的特征表gbrt_offline_section_one_24格式为:user_id,brand_id,feature1,feature2.Label ,见下图所示: 2.2、RF训练 利用训练的特征表gbrt_offline_section_one_24,进行RF训练,如下图所以 进入配置界面,在Features 框里勾选训练特征以及该特征连续与否,在Class框里目标处选择标签列,模型输出表处填写输出模型表名:gbrt_offline_section_one_25;进一步,点击参数配置选项卡,进入参数配置界面,进行参数配置,我们主要配置了树的棵树,配置好后,进行训练,如下图所示: 训练结束,得到RF模型表gbrt_offline_section_one_25。 2.3、RF预测 利用预测特征表gbrt_offline_section_two_11进行RF预测,如下图所示: 进入配置界面:在结果附加列中添加user_id ,brand_id 列,勾选目标列2分类,主分类为1,这样预测结果表中就会给出预测为1 的概率值,输出信息处填写预测输出表,进行预测,如下图: 预测完成之后即可根据conclusion=1判断预测的正样本,或者根据probability阈值判断,如下图:

    注意事项

    本文(阿里天池大数据竞赛实战.docx)为本站会员(牧羊曲112)主动上传,三一办公仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。 若此文所含内容侵犯了您的版权或隐私,请立即通知三一办公(点击联系客服),我们立即给予删除!

    温馨提示:如果因为网速或其他原因下载失败请重新下载,重复下载不扣分。




    备案号:宁ICP备20000045号-2

    经营许可证:宁B2-20210002

    宁公网安备 64010402000987号

    三一办公
    收起
    展开