《自然语言处理》PPT课件.ppt
《《自然语言处理》PPT课件.ppt》由会员分享,可在线阅读,更多相关《《自然语言处理》PPT课件.ppt(17页珍藏版)》请在三一办公上搜索。
1、本周报告,2016/12/22,主要内容,1、爬虫的数据处理2、网页的知识(评论数放在哪个类型下)3、K-means算法,爬虫,主要代码import requestsfrom bs4 import BeautifulSoupdef getNewsDetail(newsurl):result=#字典 res=requests.get(newsurl)res.encoding=utf-8 soup=BeautifulSoup(res.text,html.parser)resulttitle=soup.select(#artibodyTitle)0.text#大标题 resultnewssource
2、=soup.select(.time-source span a)0.text timesource=soup.select(.time-source)0.contents0.strip()resultdt=datetime.strptime(timesource,%Y年%m月%d日%H:%M)resultarticle=.join(p.text.strip()for p in soup.select(#artibody p):-1)#正文 resulteditor=soup.select(.article-editor)0.text.strip(责任编辑:)resultcomments=ge
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 自然语言处理 自然语言 处理 PPT 课件

链接地址:https://www.31ppt.com/p-5573274.html