暨南大学并行计算实验室MapReduce研究现状.ppt
《暨南大学并行计算实验室MapReduce研究现状.ppt》由会员分享,可在线阅读,更多相关《暨南大学并行计算实验室MapReduce研究现状.ppt(18页珍藏版)》请在三一办公上搜索。
1、暨南大学并行计算实验室MapReduce研究现状,专 业:计算机软件与理论姓 名:周敏 丁光华指导教师:周继鹏 教授,摘要,MapReduce研究 调试、监控等优化、扩展等常用APIHadoop改造数据挖掘项目RedpollCanopy,k-meansNaive bayes,SVM,调试,标准输出,标准出错Web显示(50030,50060,50070)NameNode,JobTracker,DataNode,TaskTracker日志本地重现:Local RunnerDistributedCache中放入调试代码,Profiling,目的:查性能瓶颈,内存泄漏,线程死锁等工具:jmap,js
2、tat,hprof,jconsole,jprofiler mat,jstack对JobTracker的Profile对各slave节点TaskTracker的Profile对各slave节点某Child进程的Profile(可能存在单点执行速度过慢),监控,目的:监控集群或单个节点I/O,内存及CPU工具:Ganglia,调优点(1),I/OShuffle,调优点(2),数据压缩推测性执行(同时执行同一Task,杀死运行慢的)同一节点的Child重用jvm重写Partitioner,使分布到各Reducer的数据均匀设置堆空间大小,常用API,Mapper,ReducerWritable,Co
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 暨南大学 并行 计算 实验室 MapReduce 研究 现状

链接地址:https://www.31ppt.com/p-6300111.html