2017-机器学习入门指南.ppt
机器学习-入门指南,目录CONTENT,01,What is machine learning,何为机器学习,02,Machine learning algorithms,三类机器学习算法,03,Example code,学习例子,04,What!,还有什么,第一部分,What is ML?,何为机器学习,何为机器学习,What is machine learning,下面几首诗,大家来猜猜,哪些是机器写的,哪些是人写的?平仄,押韵,对偶,对仗,春到江南草更青,胭脂粉黛玉为屏。无端一夜西窗雨,吹落梨花满地庭。一夜秋风扫叶开,云边雁阵向南来。清霜渐染梧桐树,满地黄花坡上栽。梨花落尽柳絮飞,雨打芭蕉入翠微。夜静更深人不寐,江头月下泪沾衣。雨打芭蕉滴泪痕,残灯孤影对黄昏。夜来无寐听窗外,数声鸡鸣过晓村。秋深更觉少人行,雁去无声月满庭。兄弟别离肠断处,江南烟雨总关情。明月当窗照夜空,桂花香透小楼东。金风玉露三更后,雪落梅梢一点红。,手机百度为你写诗,何为机器学习,What is machine learning,Google Brain 黑科技,何为机器学习,What is machine learning,Facebook文字理解引擎DeepText,何为机器学习,What is machine learning,机器学习界的执牛耳者与互联网界的大鳄的联姻,中间的是Geoffrey Hinton,加拿大多伦多大学的教授,如今被聘为“Google大脑”的负责人。右边的是Yann LeCun,纽约大学教授,如今是Facebook人工智能实验室的主任。而左边的大家都很熟悉,Andrew Ng,中文名吴恩达,斯坦福大学副教授,如今也是“百度大脑”的负责人与百度首席科学家。,何为机器学习,What is machine learning,机器学习,数据相关,传统编程,指令因果,入门级高漏误报率,通配符简单逻辑描述简单数据挖掘(关联、序列),自然语言处理数据挖掘(聚类、分类)无监督学习、监督学习、强化学习,关键词、特征,正则表达式,人工智能,从广义上来说,机器学习是一种能够赋予机器学习的能力以此让它完成直接编程无法完成的功能的方法。但从实践的意义上来说,机器学习是一种通过利用数据,训练出模型,然后使用模型预测的一种方法。,第二部分,Machine learning algorithms,三类机器学习算法,三类机器学习算法,Machine learning algorithms,监督学习,?,和平区、120平、新房,价格多少。,三类机器学习算法,Machine learning algorithms,01,03,04,02,SVM,通过给予逻辑回归算法更严格的优化条件,支持向量机算法可以获得比逻辑回归更好的分类界线。但是如果没有某类函数技术,则支持向量机算法最多算是一种更好的线性分类技术。,逻辑回归,预测结果是离散的分类,例如判断这封邮件是否是垃圾邮件,以及用户是否会点击此广告等等。,神经网络,分解与整合。每个处理单元事实上就是一个逻辑回归模型,逻辑回归模型接收上层的输入,把模型的预测结果作为输出传输到下一个层次。通过这样的过程,神经网络可以完成非常复杂的非线性分类。,线性回归,拟合出的直线代表数据的真实值,而观测到的数据代表拥有误差的值。为了尽可能减小误差的影响,需要求解一条直线使所有误差的平方和最小。,三类机器学习算法,Machine learning algorithms,非监督学习,聚类,降维,三类机器学习算法,Machine learning algorithms,三类机器学习算法,Machine learning algorithms,强化学习,三类机器学习算法,Machine learning algorithms,第三部分,Example code,学习例子,学习例子,Example code,疯狂的if else语句,权重,学习例子,Example code,步骤1:,首先,将每个权重都设为1.0,步骤2:,将每栋房产带入你的函数运算,检验估算值与正确价格的偏离程度。,步骤3:,不断重复步骤2,尝试所有可能的权重值组合。哪一个组合使得代价最接近于0,它就是你要使用的,你只要找到了这样的组合,问题就得到了解决!,第四部分,AND,还有什么!,还有什么,And,过拟合,还有什么,And,大数据,大数据的核心是利用数据的价值,机器学习是利用数据价值的关键技术,对于大数据而言,机器学习是不可或缺的。相反,对于机器学习而言,越多的数据会越 可能提升模型的精确性,同时,复杂的机器学习算法的计算时间也迫切需要分布式计算与内存计算这样的关键技术。因此,机器学习的兴盛也离不开大数据的帮助。大数据与机器学习两者是互相促进,相依相存的关系。,还有什么,And,深度学习,从传统神经网络的单一隐藏层发展到了多隐藏层。,人脸/图像识别语音搜索语音转文字(Speech to text)垃圾信息过滤(异常侦测)电商欺诈侦测情感/词性分类机器翻译 语言生成模型,还有什么,And,百度大脑的深度学习平台,谢谢观看,