《第17章新媒体概论(第三版)课件.pptx》由会员分享,可在线阅读,更多相关《第17章新媒体概论(第三版)课件.pptx(33页珍藏版)》请在三一办公上搜索。
1、第 4 单元 新媒体的发展:移动信息传播,新媒体带来了传媒业的巨变。从报刊、广播、电视“老三样”到今天“两微一端”、抖音、快手等新传播载体层出不穷,新传播技术正带来崭新的传媒生态格局。网络平台越来越具有媒体的特征,腾讯、百度、网易、今日头条、新浪、抖音、快手等头部新媒体和超过300万的自媒体传播力、影响力日趋加大。传播主渠道、舆论主阵地、意识形态斗争的主战场已转场网络,受众已转移到网上是不争的事实。移动传播、自动推送、人脸识别等新的传播手段的运用使传媒业态更加个性化、分众化、场景化、体验化。新一代媒体人不仅承载着探究真相、表达观点、传递信息和价值的使命,还要使用机器、理解机器、驾驭机器。新媒体
2、是由技术和资本双轮驱动的。目前,对新媒体发展影响最大的技术莫过于人工智能技术和推荐算法。,第 17 章 新技术与新媒体的未来,第 17 章 新技术与新媒体的未来,第1节 人工智能会取代记者吗,第2节 新闻推荐算法,2016年谷歌机器人阿尔法狗(AlphaGo)大比分击败韩国围棋高手李世石。2017年年初,人工智能围棋Master在一周内横扫柯洁、朴廷桓、井山裕太等中日韩顶尖高手,战绩停留在令人恐怖的60胜0负。Master已经被确认是2016年人机大战主角AlphaGo的升级版。,第 1 节 人工智能会取代记者吗,一、哪些职业容易被取代,在计算机能够充分掌握数据的领域,人工智能能够替代部分工作
3、。,司机、技工、建筑工人、裁缝、快递员、抄表员、收银员、保安 和洗碗工,职业中可自动化、计算机化的任务越多,就越有可能被交给机器完成,其中以行政、销售、服务业最为危险。,律师、翻译,一、哪些职业容易被取代,虽然计算机可能在一些方面超过人类,但是它依旧不是“完整的人”,只有人类能处理生活中纷繁复杂的情况,人工智能取代人类的担心为时尚早。,文创、科技和管理行业;内外科医生、编舞、教师、作家、律师、人力资源经理、科学家、工程师和记者,相比人类,机器欠缺了原创能力、互动能力和谈判能力。因此,具备这三种要素的职业不容易被机器取代。,机器人新闻(Robo-journalism)早在2014年,第一篇机器人
4、新闻诞生在洛杉矶时报,用一台机器写了一篇地震发生3分钟后的震后报道。美联社跟美国大学体育协会(NCAA)合作处理数据,现在使用自动化内容技术提供成千上万的大学体育赛事报道,这是以前从未涉及的领域。,二、人工智能会取代记者吗,韩国的新闻通讯社已开始采用“人工智能记者”编写简单的体育和财经新闻。“人工智能记者”的重要优势体现在两大方面:一是“勤勤恳恳,态度认真每天股市收盘时,它都会基于韩国证券交易所公布的数据即刻写出最新报道,“毫不懈怠一名机器人记者只要0.3秒就能完成一篇股市行情简讯。,二、人工智能会取代记者吗,破坏媒体舆论监督和批判的功能?产生大量无意义的文章?显然,这些担忧都会通过完善算法或
5、添加人工编辑的方式得到解决。,二、人工智能会取代记者吗,人类的想象力和创新力,是在可以预见的未来里,少数无法被人工智能复制的能力。记者应该转而挖掘深度调查新闻。,三、具有创新能力的记者将成为人工智能时代的强者,只有更深入地了解新闻媒体行业的本质和人类通过媒介获得信息、人的思考方式的本质,加深人工智能领域的人文探索,才能使人工智能更好地为我们所用。,第 2 节 新闻推荐算法,Facebook于2006年最早在其网页端推出了Newsfeed页面,让用户能够在个人主页上看到以信息流的形式呈现的朋友们的更新。这个功能最终成为社交类App的主流信息展现方式。移动互联网浪潮来袭,Facebook手机App
6、,以及大量其他类别的App,特别是新闻信息类App,也都开始采用这种方式来构建他们的手机页面。最近两年几乎所有的手机应用都加入了信息流大战。这背后的逻辑其实还是为了争夺尽可能多的用户流量。,第 2 节 新闻推荐算法,Newsfeed即信息流。当你登陆Facebook首页时,哪些信息会展示在我们前面,哪些会排在后面,这个是非常的重要的点(获取大量的曝光)。特别需要说明的是Facebook的算法里面很重要的一点就是基于人的关系链。,第 2 节 新闻推荐算法,互联网行业定义一个App价值的公式一般是:价值=用户数*打开次数*在线时长,一、一般热门推荐算法,热门推荐算法(Hot)在互联网早期就发展起来
7、了,在新闻网站常常可以看到类似“Trending”的栏目,这些栏目的推荐算法就被称为热门推荐算法。特点:原理简单;主要针对新闻当前的浏览情况,对全体用户做无差别的推荐。,一、一般热门推荐算法,(一)聚合计算,热门推荐算法是基于聚合计算的算法,这种算法使用发表时间、点击量、赞量、点踩量、独立访客数等指标,综合给出一个新闻推荐的排序列表。其中所谓的聚合计算,指的就是数据的加总,包括求和、求平均值、求最大最小值等方式,如此处理完之后,再把结果进行排序并展示到页面上。,一、一般热门推荐算法,(二)时间因素,新闻信息很关键的一个因素就是信息本身的时新性,位列新闻价值五大要素之首。因此根据业务场景去合理考
8、虑时间因素的作用是一个成功的热门推荐算法的必要条件。,一、一般热门推荐算法,(三)案例,1.Hacker News新闻排序算法 Hacker News 所采用的计算公式为:Score=(F-1)/(T+2)*GP表示投票数,即新闻的点赞数;T表示从信息发布到现在的小时数,+2防止除数太小;G表示重力加速度,代表了 score 根据时间降低的速率。重力加速度G对时间因子T的影响:随着时间流逝,时间因子T变大,这也导致了 score 值的下降;G值代表了时间因子T的幕指数,因为G越大,score值随时间T变小的速度会 越快。,一、一般热门推荐算法,(三)案例,1.Hacker News新闻排序算法
9、在Hacker News看来,时间因子对信息的作用是先使其价值快速下降,之后下降的速度会越来越慢。值得注意的是,Hacker News更关心用户对新闻主动做出评价的点赞数目,而不关心点击数本身。这样的设计可能会使“标题党”“灌水”类新闻因为没人点赞快速 沉下去,而真正得到用户好评的新闻会排到比较靠前的位置,这体现了该网站对优质内容的倾向性。,一、一般热门推荐算法,(三)案例,2.Reddit信息排序算法算法公式为:f(t,y,z)=lg z+y*t/45000其中,t=A-B,A为资讯发表时间,B为网站成立时间,所以这两个都是时间点;而t是时 间点的差值,也就是所经过的时间。t,A,B的单位都
10、是秒(s)。x=U D,U为点赞数(upvote),D为点踩数(down vote),x是用来体现用户评分的指标。y值取决于x是否为正,也就是说用户评分总体是好还是坏。总体偏向好的话取1,好坏相当取0,偏负面的话取-1。z的作用就是把x的值取绝对整数值。,一、一般热门推荐算法,(三)案例,2.Reddit信息排序算法特点:第一,时间的因素。从时间角度看,Reddit算法事实上实现了让一个帖子的相对排名随着时间下降的效果。第二,用户评分的平滑处理。第三,争议性大的帖子容易得到低分。,二、个性化推荐系统,(一)个性化推荐系统的相关概念及变量,热门推荐:聚合计算出实时的十大热门新闻,如国乒退赛等推荐
11、给用户。这样的新闻有很大可能会引起用户关注。相关推荐:与用户当前正在阅读的文章主题相关的推荐。用户的短期兴趣:根据用户最近的行为来进行推荐,比如用户刚刚阅读了与“西伯利亚”相关的新闻,刚刚在App中搜索了“天空之城”关键词,则识别出用户短期的兴趣是“西伯利亚”和“天空之城”。,二、个性化推荐系统,(一)个性化推荐系统的相关概念及变量,用户的长期兴趣:也叫用户画像,是用户的长期口味,技术上的本质是一组用户ID所对 应的一组keyword。比如某个用户常年阅读与军事相关的新闻,就会形成一组相应的keyword。长期兴趣还会考虑进用户的地理位置、年龄、性别、毕业院校等多个人口统计学因素”。长期兴趣的
12、推荐可能会不仅仅使用用户自身的用户画像,还会计算与用户的用户画像相似的其他用户,并找出其他用户看过而这个用户没看过的新闻进行推荐,这就构成了协同过滤。融合:把以上所述的推荐结果都打乱了放在一起展示给用户,就叫作融合,二、个性化推荐系统,(二)新闻文本的特征提取,tf-idf 算法:计算的是一个关键词的权重值(weight)。tf-idf权重经常被用作信息检索和文本挖掘领域的应用。在提供了一个语料库的前提下,该方法通过统计手段,得出某文本中的某一个词语的重要性/独特性。tf-idf算法及其衍生变种算法,常常被搜索引擎用来给网页打分和排序。,二、个性化推荐系统,(三)基于内容的推荐(CB),基于内
13、容的推荐:本质上是对用户画像与文章特征之间进行相似度计算。用户画像与文章特征形式上是完全一致的,都是一组获得较高tf-idf权重的关键词的集合。只要对用户画像和文章的特征之间进行相似度计算,然后在所有计算了相似度的文章中选取相似度最高的K篇文章作为推荐文章发给用户即可。,二、个性化推荐系统,(四)基于协同过滤的推荐(CF),协同过滤算法:也叫作社会过滤方法,是一种通过他人推荐来过滤信息的有效办法。我们在生活中都喜欢找自己身边的朋友来推荐一些电影、书籍和音乐,协同过滤就是这种朴素生活思想在算法上的体现。协同过滤首先为你找到和你口味相似的人群,然后把这个人群的选择推荐给你。,二、个性化推荐系统,(
14、五)矩阵分解方法(MD),矩阵分解方法:也叫隐含因子模型;是一种通过把用户对商品的评价矩阵分解为(1)用户对隐含因子的偏好矩阵和(2)商品中包含隐含因子的情况矩阵这么两个矩阵来实现有效推荐的模型。在新闻推荐问题中,隐含因子的应用难度比较大。这主要是由于新闻推荐问题中我们往往只有用户是否阅读新闻的数据,而没有打分的数据,因此无法进行有效的矩阵分解。,二、个性化推荐系统,(六)推荐系统的融合,一般的融合算法可以是简单的线性融合,也就是说每个算法的结果被赋予一个固定的比例,然后简单地加在一起:Result=w1 Hot+w2 CB+w3 CF其中,各个算法的推荐结果权重wi(i指1,2,3,)值的确
15、定,可能需要使用A/Btest进行小流量对比试验,甚至对全量用户进行分流,通过事后分析数据进行参数调优。也可以通过实时的机器学习方法,不断地优化这些权重值。,三、目前个性化新闻推荐算法存在的问题,(一)内容不符合用户兴趣,目前自然语言处理的局限协同过滤算法本身的缺陷,(二)内容质量问题,文不对题、内容空洞、蹭热点打擦边球内容重复,三、目前个性化新闻推荐算法存在的问题,(三)信息茧房与信息成瘾,信息茧房:指的是信息个性化技术使得人们可能减少阅读多样化内容的趋势。信息成瘾:算法不断贴合用户当前想看的东西,使得用户的欲望不断地被满足,这就形成了一个正向反馈,用户在心理上往往会形成一种依赖。,(四)可遗忘性,(五)版权,四、推荐算法的发展方向,人工神经网络考虑给予优质内容生产者所发布的文章和视频更高的推荐权重加强内容审核开发机器学习系统贝叶斯方法:检测谩骂和政治敏感内容加入允许重置用户画像的功能:解决算法的可遗忘性问题,本章小结,热门推荐算法,Hacker News新闻排序算法,Reddit信息排序算法,tf-idf 算法,协同过滤算法,信息茧房,本章小结,新媒体是由技术和资本双轮驱动的。对新媒体发展产生影响的技术很多,本章主要介绍了人工智能技术和推荐算法。,思考题,1、你认为人工智能会取代记者吗?2、请你分析今日头条中所用的推荐算法。,
链接地址:https://www.31ppt.com/p-3340039.html