从神经网络到深度学习 AI视野课件.ppt
《从神经网络到深度学习 AI视野课件.ppt》由会员分享,可在线阅读,更多相关《从神经网络到深度学习 AI视野课件.ppt(41页珍藏版)》请在三一办公上搜索。
1、从神经网络到深度学习大数据催生的新智慧物种,自然语言处理,怎样用神经网络处理离散(符号)数据?嵌入(Embedding),2,怎样学习词嵌入?,Neural Language Model & word2vec,3,word2vec词嵌入的性质,向量空间中的距离 = 词义相似性,4,word2vec词嵌入的性质,捕获语言的某些规律,5,嵌入空间可视化,6,从单词到句子,CNN,7,序列学习问题,序列识别和生成语音、时间序列、文本.注意控制按顺序决定下一时刻注意什么运动控制、玩游戏。共同模式历史状态(可变长度)- 内部状态表示(短时记忆) - 下一步动作,传统序列学习模型,“无记忆”Autoreg
2、ressive modelsFeed-forward NN“简单记忆”Linear dynamical systems (LDS)Hidden Markov Models (HMM),FNN - RNN,Forward propagation,RNN for 语言模型/序列生成,常用的训练目标:预测下一时刻的输入,训练RNN:Backpropagation through time (BPTT),优化目标最大对数似然(在整个序列上累加),A toy problem for RNN:二进制加法,问题train a neural net to do binary addition by givin
3、g it many 01 string as examples方案1:FNN需要预先确定最大位数对不同的位使用不同的权重泛化能力差,二进制加法的算法,方案2:RNN,网络结构2 ins, 3 hiddens, 1 outh(t) = f(Wihx(t) + Whhh(t-1)(前一时刻的隐状态,当前时刻的输入) - 下一时刻的隐状态2个时间步的延迟输入-隐单元隐单元-输出,网络学到了什么?,自动学习出3个隐单元的4种不同的激活模式,用以完成加法运算模拟有限状态自动机,但能力更强N个隐单元,2N种激活模式,N2个参数(权重)对比HMM,RNN训练的难题:梯度爆炸与消失,if for all m:
4、 gradient explodeif for all m: gradient vanish在包含长时关联(dt 10)的序列上很难有效训练RNN,Long Short-Term Memory (LSTM),Two types of memory in RNNShort-term memory: encoded in activity patterns of hidden unitsLong-term memory: encoded in weights,不同类型的记忆,LSTM cell,Input gate: scales input to cell (write)Output gate:
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 从神经网络到深度学习 AI视野课件 神经网络 深度 学习 AI 视野 课件
![提示](https://www.31ppt.com/images/bang_tan.gif)
链接地址:https://www.31ppt.com/p-1787662.html