大数据与广电.docx
《大数据与广电.docx》由会员分享,可在线阅读,更多相关《大数据与广电.docx(27页珍藏版)》请在三一办公上搜索。
1、优酷土豆优酷的数据挖掘优酷作为一家大型视频网站,拥有海量播放流畅的视频。注重用户体验这一产品技术理念,将绝大部分存储用 在视频资源上。通过建设专用的视频CDN,建立了可自由扩展、性能优异的架构,在提供更好用户体验的同时优化了存储资源。在除视频资源外的其他方面,我们 也累积了海量数据:仅运营数据,每天收集到的网站各类访问日志总量已经达到TB级,经分析及压缩处理后留存下来的历史运营数据已达数百TB,很快将会达到 PB级,5年后数据量将会达到几十PB级。挖掘数据中的价值对优酷而言,通过用户的每次播放流程,对页面浏览、评论收藏、视频播放以及播放时的各种操作进行了记录。经处理后的分析结果会反馈给不同的业
2、务模块,对包括产品、内容运营、用户的个性化推荐及广告投放等方面的提升,都起到了关键作用。网站页面、客户端的UI/UE的设计及效果,都需要数据进行支持。通过A/B测试系统,我们收集到用户对不同UI下的操作反馈,进而评估UI的改变对用户的影响。内容方面,通过对用户网络情况的统计:每次播放是否发生了缓冲,平均下载速度是多少等,进行实时的统计和计算,获取每个地区每个运营商下用户的加载表现,以此来决定CDN节点的分布和分配策略,为不同地区、不同运营商的用户提供清晰流畅的视频服务。在推荐方面,通过对大量视频播放行为的分析,归纳不同时长、不同类型、不同内容的视频之间的相互关联,挖掘不同人群用户的同质化观看习
3、惯,对每次用户的观看进行有针对性的后续推荐,并借助后续数据的分析,迭代地改善现有服务,为用户提供量身定制的推送服务。数据对于优酷的广告精准投放也起到了重要作用。优酷的广告系统支持对不同地域、频道、标签及人群等条件的定向投放。在投放策略上,我们本着尽可能不 影响用户体验的原则,对于广告长度及投放频次都进行了限制。虽然这给投放造成了较大难度,但通过对各种细粒度的定向条件组合历史数据进行的分析,我们在广 告投放方面已经相当准确。在投放阶段,我们实时分析用户属性、访问情况及当前广告投放量,对每次投放动态调整。 图1 运营数据处理技术架构优酷自制剧靠数据涨分4年前,优酷的自制剧嘻哈四重奏上线,这被认为是
4、中国互联网第一部真正意义上的网剧,到目前已播出四季,累计播放量超过2亿。卢梵溪强调,嘻哈四重奏能够播出四季,功劳在数据挖掘和分析。“当初第一季上线时,网友评价不高,总评分只有6.3分。”卢梵溪说,之后团队对用户习惯进行挖掘,包括高峰时段用户最青睐的剧情类型、点评最多的情节、哪些剧情用户跳过或重复观看“比如,我们发现第一季中,网友对偷菜游戏的评论频次很高,所以在后来的剧情中,加入了植物大战僵尸、愤怒的小鸟等当下最流行的游戏。”卢梵溪说,第二季时用户评分提高到7.8分,第三季和第四季则一路升至8.9分和9分。优酷土豆集团高级副总裁魏明说,每个优酷视频播放按钮的下方都有核心数据,包括播放量、顶和踩的
5、数量、评论数和收藏数量等。数据处理技术方面,在优酷的后台有拖页统计的功能,一秒钟有多少人拖过,有多少人看过,都能收集到。“这些数据从优酷建站第一天就在积累,大数据是最近一两年才冒出来的话题,而优酷出品很早就靠这些详尽的数据分析来运作,做出投资判断。”不仅是优酷土豆集团,搜狐视频、爱奇艺等都在做着数据收集的事情,并逐步加大对自制剧的投入。乐视基于大数据的网络剧将成业界标配8月29日,乐视网举办自制剧X Girl启动发布会,该剧亦是2013年度乐视网络自制剧的收官之作。事实上,自两年前发布“乐视制造”原创战略至今,乐视网在自制栏目、网络剧及微电影方面已作出诸多探索。尤其在2013年,乐视网连续推出
6、了我叫郝聪明、我怀了你的孩子、PMAM、唐朝好男人、女人帮妞儿等自制剧,均取得不俗成绩。PMAM上线不久便突破一亿VV大关,在百度搜索风云榜台剧排名居第二位;前不久刚刚下线的网络穿越剧唐朝好男人赢得近3亿播放量。乐视网自制的黄段子以及就好这一口也颇受观众青睐。对于自制剧未来趋势,刘弘认为,基于大数据制作、运营网络剧将会成为业界标配。乐视网注重数据积累、数据分析,用户只要登录乐视网站,每一次点击、播放、甚至看了几分钟就关闭了视频,都会被作为数据计进入后台分析,乐视网自制剧题材90%来自于点击率排名最高的网络小说,而且尽量选择与电视剧传统主题之外的题材,比如现在电视上已不常见的穿越剧等。今年年初,
7、乐视网与钻石商每克拉美合作打造的定制剧我叫郝聪明,凭借其播放互动、网络征集及全站独占贴片宣传三大创新模式,在广受观众青睐。刘弘认为,除大数据之外,自制剧未来趋势还有三大方向:一、传统领域的重量级人物,包括导演、制片人和演员会越来越多地加盟到网络自制剧的创作中;二;互动性更强。未来,网络自制剧的互动性将进一步加强,网络用户不仅可以参与投票选演员,定剧情,甚至可以随时改变剧情的走向和最终的结局;三、网络自制剧会逐步拥有真正具备网络化优势的传播模式和播出方式。乐视的网络大剧诞生记 年初,乐视原创事业部的剧本创意小组将一部名为唐朝好男人的网络小说摆在郝舫的案头,在网上,唐朝好男人的点击日浏览量最高时超
8、过8000万,剧中描绘的盛唐时代青山绿水、平凡生活的“种田流”故事吸引了宁财神等众多大牌粉丝。 郝舫认为,将这部网络小说改编成自制剧一定能火。然而,现实却是一波三折。 当乐视网最初找到唐朝好男人作者多一半提出改编时,遭到了直接拒绝。“唐朝好男人不适合改编成影视作品,因为它没有很激烈的矛盾冲突。”多一半担心,没有跌宕的剧情,靠细水长流的故事难以打动网友。“这种担心我们也有过,团队还因此产生过颇为激烈的争论。但最终我们相信,用网络剧特有的节奏编排,网民喜爱的方式剪辑,就可以吸引和打动观众。”郝舫说。 为此,郝舫还拿出了乐视制造的流量来向多一半证明:2012年,乐视网首部网络自制大剧东北往事之黑道风
9、云20年上线16天流量破两亿;紧接着,时尚都市戏女人帮妞儿创下10亿流量纪录。 郝舫还告诉多一半,改编会充分尊重原著,除了拍摄要求的必要的逻辑与人物调整之外,将尽可能地将小说中精彩部分保留下来。 最终,在郝舫“还原作者心目中繁华的盛唐,将主人公的奇妙遭遇变成一段曼妙、奇幻、有意思的梦”的承诺之下,多一半被说服了。 然而,在电视宫廷戏与穿越戏已泛滥的情况下,如何为唐朝好男人找到卖点?通过讨论,创作人员将看点设定为:没有宫斗的尔虞我诈、充满趣味的平实生活细节、以各种“玩转”唐朝的搞笑经历取胜。 一位现代男性白领穿越到盛唐,应用现代技术造纸、酿酒、种棉花,不仅赚得家大业大,还造福百姓做公益,最后加官
10、晋爵成了朝廷一品大员。最终,这部“种田流”的40集网络剧点播量超过两亿。“我们的创作原则首先是草根化,相比电视剧,网络剧要更加平民。”乐视网COO刘弘说,因此剧本多由网络小说改编。东北往事之黑道风云20年改编自天涯社区2009年最热门同名网络小说,之后乐视网与天涯社区开始合作招募优秀网络剧本。除此之外,乐视自制剧的内容源和还有两个,一是原创,如女人帮妞儿,二是客户定制,比如我是郝聪明。 7月初,女人帮妞儿第二季开机,甘薇担任制片人。两年前,她与演员李小璐成立了乐雨薇璐电影人工作室,号称首家“2.0时代的电影人工作室”。甘薇称,所谓“2.0时代”指的是在大剧的运作上,更注重培养网民参与度。制片方
11、和网友共同讨论剧情发展,甚至由网友决定故事结局,从微博上征集演员,让网友直接参加角色创作与表演等。 为此,女人帮妞儿第二季融入了网友的最新评论和设想。甘薇对修改剧本过程的描述是,“主创人员开会改剧本就是一场激烈的辩论,常常一个转弯处,就有一百个可能的剧情转变。” 在乐视原创事业部,有编辑专门负责搜集热门网络小说、观看各种视频,找选题,每人一年平均要读3000万字的网络作品,相当于80本的网络小说。 而在两年前,乐视就开始在各大网络文学网站“圈地”。“几乎每个网络文学网站排名前20的作品,我们都已经买下来了。如果接连拍的话,应该能坚持至少两年。”郝舫说。 选题上报之后,郝舫会对其进行初步审查,把
12、握大方向,看内容是否符合国家对影视剧的要求;之后,制片人与审查委员会的同事一起对改编可行度进行详细评估,聚集了导演、销售、市场等专业人员,再一步全面核查,以保证生产内容的质量。最后,再将审查报告提交到董事会,由董事会对是否立项进行审批。 段子与大数据 网络剧的制作流程与传统影视的拍摄过程几乎一样:写剧本、选演员、定档期、选景、出分镜、试妆、试镜等等。但在题材与内容风格上,网络剧的处理方式却与电视剧大相径庭。 网络自制剧在内容尺度比电视剧更大,因为二者的受众不同。电视剧受众年龄层偏大,收视习惯倾向于慢节奏。视频网站受众的收视习惯则偏向快节奏,较为年轻化。另外,很多具有争议性的话题和内容,在电视台
13、无法播出,网络自制剧就成了很好的内容承载方。 此外,网络自制剧更重喜剧效果,每集长度一般是20分钟,“段子”是剧本的基础。在优酷网已经连播四季的嘻哈四重奏、搜狐视频的屌丝男士和我的极品是前任,都是靠段子支撑,屌丝男士一集剧大概用到十五六条段子,该剧编剧“李亚有鸭梨”被圈内称为“段子神”。 对大数据的使用是网络剧另一大特性。乐视通过对观众的观看数据分析,来进行剧情设置和安排明星阵容,还包括对流行文化的趋势与观众欣赏心理的研究。女人帮妞儿剧组会实时将网络评价制作成详细报告反馈到主创团队;作为时尚剧,剧组中会有专职人员捕捉时下最流行的时尚搭配与趣味。 在女人帮妞儿第一季刚开播时,甘薇担心如何有效地与
14、观众互动。所以该剧采用的制作模式是边播边剪,如果网友说节奏太慢,就在后面剧集里把节奏剪得更快。为此,她养成了一个习惯是每天一睁开眼和睡前,都要浏览一遍观众评价,随时修剪拍摄素材。第一季刚播完,剧组就在网上就下一季拍摄意见征集“英雄帖”。“网络剧的互动设计关键在于调动观众的主观能动性。”知名电视剧导演郑晓龙说,“以今年美国网络剧纸牌屋最典型,其在选角、情节设置等方面将大数据应用到了新高度。其实在国内,和观众互动,在网络自制剧领域已经有了一定程度的尝试。” 全民大Party 众多网络大剧的诞生标志着整个网络视频的自制,从风格、表现形式、制作精致度正逐渐摆脱之前的廉价和粗制滥造。事实上,相比电视剧市
15、场来说,网络剧的优势首先在于成本与投资回报率。 显然,当越来越多的用户习惯在互联网上观看剧集之后,网络自制剧似乎拥有着更广阔的新世界。对此,郝舫认为,网络剧呈现四个发展趋势: 首先,传统影视圈的重量级人物,包括导演、制片人和演员会越来越多地加盟到网络自制剧的创作中。 其二,互动性会更强。网络用户不仅可以参与投票选演员、定剧情,甚至可以随时改变剧情的走向和最终的结局。网络剧会变成一个全民大Party。 其三,基于大数据制作、运营网络剧将会成为标准,用户只要登录视频网站,每一次点击、播放、甚至看了几分钟就关闭了视频,产生的数据都会进入后台被分析。这是网络剧相较于电视剧的先天优势。 其四,网络自制剧
16、会逐步拥有真正具备网络化优势的传播模式和播出方式。借用微博、微信、APP、APK等互动性强的工具,实现社会化媒体爆炸式宣传的同时,也会绑定云平台,逐步产生全新的推广模式。 多屏联动的生态链 除了广告收入之外,网络大剧在整个视频网站的生态链中还扮演了重要的角色。“未来,视频行业不再是点对点的竞争,而是在平台与平台之间展开。”乐视网董事长兼CEO贾跃亭对视频行业未来的竞争格局有过如此的概括,“战略领先性是未来支撑视频网站可持续发展的最重要指标。” 谷歌谷歌公布了一项重要研究成果电影票房预测模型。该模型能够提前一个月预测电影上映首周的票房收入,准确度高达94%。谷歌的票房预测模型是大数据分析技术在电
17、影行业的一个重要应用。据谷歌统计,从2011到2012年,电影相关的搜索量增长了56%。谷歌发现,电影相关的搜索量与票房收入之间存在很强的关联。图1显示了2012年电影票房收入(红色)和电影的搜索量(灰色)的曲线。可以看到,两条曲线的起伏变化有着很强的相似性。图1 2012年票房收入与搜索量的曲线(红色是票房收入,灰色是搜索量,横轴是月份,纵轴是数量)谷歌把电影的搜索分成了两类:I.涉及电影名的搜索(MovieTitleSearch);II.不涉及电影名的搜索(Non-TitleFilm-RelatedSearch)。这类搜索不包含具体的名字,而是一些更宽泛的关键词搜索,如“热门电影”、“爱情
18、片”、“好莱坞电影”等。图2显示了票房收入与这两类搜索量之间的关系。从图上可以看到,大部分情况下,第I类搜索量超过第II类搜索量。但在电影淡季的时候(图中灰色椭圆区域,这时候票房收入较低),第I类搜索量会低于第II类搜索量。这符合常理,因为在淡季的时候知名度高的电影很少,人们往往用更宽泛的搜索来寻找想看的电影。图2 2012年票房收入和两类搜索量的曲线(红色代表票房收入,蓝色代表第I搜索,灰色代表第II类搜索,横轴是月份,纵轴是数量)这一发现对电影的网络营销来说有一定的指导意义:在淡季的时候,电影公司可多购买相对宽泛的关键词的广告,而在旺季的时候,多购买涉及电影名的、更具体的关键词的广告。提前
19、一周预测票房,可达到92%的准确度。谷歌最终采用了四类指标:(1)(电影放映前一周的)电影的搜索量(2)(电影放映前一周的)电影广告的点击量(3)上映影院数量(4)同系列电影前几部的票房表现其中每类指标又包含了多项类内指标。在获取到每部电影的这些指标后,谷歌构建了一个线性回归模型(linearregressionmodel)模型,来建立这些指标和票房收入的关系。线性回归模型,在大数据分析领域里算是最基本的模型之一,它认为票房收入与这些指标之间是简单的线性关系。图3展示了模型的效果,其中灰色点代表了实际的票房收入,红色点代表了预测的票房收入。可以看到,预测的结果与实际的结果差异很小。图3 提前一
20、周预测票房的效果(横轴是搜索量,纵轴是首周票房收入,灰色点对应某部电影的首周票房收入,红色点对应预测的首周票房收入)提前一个月预测票房,可达到94%的准确度。、对于电影的营销来说,掌握各项指标对票房收入的影响,可以优化营销策略,降低营销成本。谷歌的报告中指出,用户一般会通过多达13个渠道来了解电影的信息。票房预测模型的出现无疑使得营销策略的制定更加有效。大数据分析在电影行业的应用前景:把模糊的行业经验变得更科学,更精准FacebookFacebook将于2013年10月8日开始向八国(包括法国、英国、德国、巴西和印度)的10个电视台提供主流电视节目相关的用户评论数据,这些数据包括“赞”、评论、
21、分享在内的诸多“行动”方面的数据。法国的TF1、英国的Channel 4、德国的ARD、巴西的Esporte Interativo、印度的STAR网络等电视台计划利用Facebook的数据向广告主证明它们的节目能够在网上引起轰动和讨论,这可能将有助于提高它们的广告价格。Facebook合作关系副总裁丹罗斯(Dan Rose)受访时指出,那些数据具有价值,因为它们反映了真实人群对电视节目的反应。“有关流行电视节目的对话都是在朋友、家人、同事和邻居之间发生。”他透露,权力的游戏、唐顿庄园等电视剧在Facebook上引发了大量的讨论。其中对于小天后麦莉赛勒斯(Miley Cyrus)在MTV音乐录影
22、带大奖上的那段性暗示舞蹈“twerking”,900万人(占观众总数的90%)在Facebook上产生了2600次互动;今年6月,迈阿密热火和圣安东尼奥马刺之间的NBA总决赛在Facebook上也引起了1.25亿次互动。电视台可利用那些数据向广告主说明,电视节目所产生的 涟漪 比节目本身要长久的多,Facebook的数据还有助于电视台按照年龄、性别之外的标准更好地划分观众。搜狐搜狐自我数据挖掘国内视频网站当中,搜狐视频无疑是将数据深度挖掘与分析做到极致的一家。每天会有数千万的用户访问题,其中产生交互式观看的VV量则过亿,搜狐的数据采集部门则会将大量用户产生的数据进行规模性的采集备用,会后续的深
23、度分析储备足够的“弹药“,前期数据的规模采集只是数据深度分析的第一步,在将大量数据进行合理归类之后,第二步是从多维度进行解析,搜狐视频将用户体验分解为结构、交互、视觉、内容四方面,根据产品形态制定通用的标准,每一项标准又分为四个等级,等级越高说明用户体验越差。可用性测试人员设计题目,并从搜狐视频的样本库中分背景邀请不同类型的用户进行任务走查测试,通过观察和沟通逐项评分。量化后的结果,帮助搜狐视频定位体验中对用户影响最多的方面并能细化到具体问题;更重要的是,在测试过程中横向比较了搜狐视频与竞争对手的实际差距。在样本的分析当中,搜狐视频会将具有相同规律的数据进行合理的关联并予以反馈,特别是其中的访
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 数据 广电
![提示](https://www.31ppt.com/images/bang_tan.gif)
链接地址:https://www.31ppt.com/p-1667969.html