如何通过舆情大数据分析成为新媒体运营领域的“增长黑客”.docx
《如何通过舆情大数据分析成为新媒体运营领域的“增长黑客”.docx》由会员分享,可在线阅读,更多相关《如何通过舆情大数据分析成为新媒体运营领域的“增长黑客”.docx(65页珍藏版)》请在三一办公上搜索。
1、如何通过舆情大数据分析成为新媒体运营领域的“增长黑客”即使我们不懂专业的技术分析和复杂的数学知识,我们也可以通过舆情分析大数据找到我们想要的内容,根据客户反馈数据,不断优化公众号内容,逐渐成为新媒体运营领域的:“增长黑客”。1为新媒体运营领域的“增长黑客”1.1 一般意义上的“增长黑客”“增长黑客(Growth Hacker)”,这个近几年来风靡中国互联网界的新兴概念,滥觞于美国硅谷互联网创业圈,国内则是由范冰首先引进,他的著作增长黑客:创业公司的用户与收入增长秘籍使这个概念深入人心。结合国内外关于“增长黑客”的表述:“增长黑客”是以数据驱动营销、以市场指导产品,通过技术手段贯彻增长目标的一群
2、人。这就需要他们既了解技术,写得了代码;又能了解人性,能捕捉用户的心理感受和真实需求;最重要的是,他们经常能突发奇想,发挥创意,大开脑洞,以小的投入获取较多的用户和收入。一言以蔽之,“增长黑客”就是具备各种跨界技能,可以利用各种巧妙的手段以极小的成本获取大量用户,实现最终的收入增加。“增长黑客”让那些资金不够充裕、前期资源紧缺和初始用户匮乏的初创型互联网初创团队看到了“四两拨千斤”的希望,小投入也能办大事。“增长黑客”的一个很好的理念,但它在不同的互联网领域有着不同的形态,具体的实现手法也不尽相同,比如在新媒体运营领域。1.2 新媒体运营领域的“增长黑客”新媒体是跟随互联网兴起的一个新兴媒体形
3、态,它已经在很大程度上颠覆了以往的纸质刊物、广播及电视等传统媒体,重要性不言而喻。关于它的概念和内涵,笔者不想多说,网上有很多的详细介绍。在这里,笔者认为新媒体最为重要的一个特征是:人人都可以是信息的生产者,人人也都是信息的传播者。这意味着无论是谁,包含企业、机构还有个人,都有机会成为这个新媒体时代的成功者。咪蒙、一条、十点读书即是例证。然而,随着中国的互联网时代进入下半场,新媒体行业也从野蛮生长的时代进入“弱肉强食”的“丛林时代”,常规的新媒体运营手段(包括内容、展现形式及推广方法等)已经很难从用户增长缓慢和收入增长停滞的困境中突围出来。写到这里,笔者不由得想到儿时看过的动漫数码宝贝中的主人
4、公身边各类可爱的小精灵,在遇到危急情况时会进化,由“成长期”进化到“成熟期”、“完全体”,甚至是“究极体”,适应性和攻击力呈现指数级的提升,足以在危如累卵的逆境中打败强大的敌人,反败为胜。与此类似,广大新媒体从业者们在这个时候,也需要“进化”,完成华丽的转身采用精细运作、量化分析的科学手段去进行新媒体运营,以适应这个足以革新我们思维观念的“大数据时代”,而“增长黑客”正是一剂良方。从前面对“增长黑客”的介绍中,我们可以发现:“增长黑客”是一个多面手的角色,需要掌握跨领域的知识,其中最为核心的技能即是懂技术、精通数据分析。然而,技术(码代码、编写程序等)和数据分析(数学知识和BI软件操作等)对于
5、很多做新媒体运营的小伙伴来说,是十分棘手的两样事物:很多从事新媒体运营的小伙伴是正儿八经的文科生毕业,文案和排版方面,他们可以说是“长袖善舞”,但技术和数据分析却可能是他们的“梦魇”。鉴于这种情形,笔者提倡“人+数据驱动思维+工具”理念以人为本,从运营者自身的知识结构出发,以数据/量化思维作为方法论,用工具辅助运营,从而做到扬长避短,把自己的精力集中在重要的事情上。笔者在这里特意收罗了10几款跟数据分析有关的工具,以弥补技术小白和数据分析小白技能上的匮乏,而且掌握它们不需要很懂技术,连数据分析这项技能也能借助它们轻松get。值得注意的是,本文所要介绍的工具,并不是狭义上的“工具”,如可视化工具
6、、文本分析工具和事件热度趋势/预测分析操作类工具,还包括数据新闻这种广义上的新型信息载体;更为重要的是,他们分别代表着四种思维/观念重视非结构性数据、科学化预测、信息的具象化呈现以及用数据讲故事,这些“工具”都是为达到、完成或促进新媒体运营效果的有利武器。如下图所示,以下是本文的行文结构:新媒体运营的“增长黑客”数据分析工具箱2文本分析工具2.1 NLPIR在线系统NLPIR,即“自然语言处理与信息检索共享平台”的英文缩写, 打开该网址,即可进入主界面“语义分析系统”,顾名思义,它是一个在线的中文语义分析工具,因为非商业化,它对处理文本的篇幅大小也有限制,只能处理3000字,可以给热衷于文本分
7、析的小伙伴过过瘾,但要想用于商业目的,那只能呵呵了。NLPIR在线系统的首页上图中间部分的11个圆圈即是该系统的所有功能,但其中有几个只是挂出来,目前还未实现,结合新媒体运营工作中的实际需求,笔者只介绍其中几个比较有实用价值的功能模块。以下以破5.5亿元日媒:和中国联手有钱赚这则新闻作为测试文本,笔者来给大家介绍下这个系统中的实体抽取、词频统计、文本分类、情感分析和关键词提取这5个比较有实用价值、且准确度较高的功能模块。2.1.1实体抽取NLPIR中的“实体抽取”功能模块可以智能识别出测试文本中出现的人名、地名、机构名、媒体、作者及文章的主题关键词,这是对语言规律的深入理解和科学预测,它提炼出
8、的词语不需要在词典库中事先存在。实体抽取的图表效果支持力导向图和弦图这两种形式,如下图所示:测试文本“实体抽取”的2种呈现形式上图中,从“文本”这个一级类目中,分别分出了“关键词”、“地名”、“时间”这3个二级类目,由此能大致判断出测试文本中包含的事件元素,如主题是关于电影的,涉及国家(地区)间的对比,还有纵向时间维度的分析,一些关键词能让我们把握文章中重要的词句。2.1.2词频统计在一份给定的文件里,词频(term frequency,TF)指的是某一个给定的词语在该文件中出现的次数。在文本分析中,词频统计是较为常规的、同时也是最为重要的一个环节,它用来评估一个词对于一个文件或者一个语料库中
9、的一个领域文件集的重要程度。NLPIR只展示了名词、动词、形容词这3种开放词类,这个3个此类也是一段文本中最为重要的3个部分: 名词介绍文章中的各个主体,能让我们知道文本描述的对象是谁; 动词表征各个主体的动作和行为,能让我们知道关于主体发生了什么; 而形容词则能描述主体及动作/行为的特征,能让我们知道主体及其行为/动作的性质、状态、特征或属性。NLPIR的词频统计只展示了上述词类的Top 10结果,以折线图和条形图的形式进行展现。看了下面的词频分类展示,联想文章标题,我们很自然地了解到你的名字。这部电影在市场上获得了不错的业绩,引发中日媒体的广泛报道和关注测试文本的词频统计呈现2.1.3文本
10、分类NLPIR“文本分类”部分目前所展示的类别只是新闻的政治、经济、军事、交通等,分类有待扩展和细化。NLPIR深度文本分类,可以用于新闻分类、简历分类、邮件分类、办公文档分类、区域分类等诸多方面。此外,它还可以实现文本过滤,能够从大量文本中快速识别和过滤出符合特殊要求的信息,可应用于品牌报道监测、垃圾信息屏蔽、敏感信息审查等领域。然而,从测试的效果来看,这个功能模块的分析效果还不甚准确,它没有“娱乐”这一分类,但起码也应该划入“其他”这一类中。测试文本的文本分类结果呈现2.1.4情感分析NLPIR的“情感分析”提供两种模式:全文的情感判别(左图)与指定对象的情感判别(右图)。大类上,“情感分
11、析”部分分为“正(面)”和“负(面)”这两大类情感,这是内层;在外层,两个大类又分为“乐”、“好”、“怒”、“哀”、“惧”、“恶”、“惊”7中细分的情感,这也就是大家常说的“七情六欲”中的“七情”。目前正负面的判断已经较为成熟,但鉴于汉语的博大精深和词汇语义(用法)的波谲多变(反讽、贬义褒用、语境变化等),细分情绪的判断准确度还值得观察。测试文本的情感分析结果呈现观察上面测试文本的情感分析效果图,再比对原始文本,这个判断大致上是准确的,但负面的部分应该比实际的占比小,尤其是“恶”这个部分笔者并未发现有出现厌恶的语句和词汇。2.1.5关键词提取这里的关键词提取和前面的词频统计有一定的联系,但二者
12、的算法(实现方法)是不一样的: 词频统计:词频统计的是一个词在文章中出现次数,出现的次数越多一般越重要; 关键词提取:关键词提取则是依据TF-IDF(term frequencyinverse document frequency,词频反转文件频率),用以评估一个词对于文本内容的重要程度。字词的重要性随着它在文件中出现的次数成正比增加,但同时会随着它在语料库中出现的频率成反比下降。比如,“如果”、“也”、“你们”等词汇,他们出现的频次很高,但它们的重要性就很弱。测试文本的关键词分析从上图中测试文本的“关键词提取”中可以发现,这部分和“词频统计”部分既有重合也有明显区分,原因就在于上述的算法不同
13、。值得注意的是,不论是“词频统计”还是“关键词提取”,已经设置了“停用词(stopwords)”,在进行上述分析的时候,自动的将那些无明显意义的副词、冠词、代词给去掉了。2.2图悦图悦是一款在线的热词分析工具,它可以对于载入文本或指向文本内容的链接进行词频提取和词语(重要性)权重分析,并可以导出成excel格式的文件,便于后期分析和处理。图悦的主界面处理热词分析,图悦还可以自定义词云形状,不过这里的词云效果不敢恭维,下面笔者将会介绍一个更优秀的词云制作工具,让经图悦处理过的词频焕发出个性化的风采。值得注意的是,图悦导出的excel文档有三列:提取出的词语、词频数、词汇权重。后两个指标,笔者已经
14、在前面做过论述,不明白的小伙伴可以“倒带”回去看看。具体的使用方法笔者将在下面的可视化自定义词云部分详述。但这款词频分析工具只能导出150个词汇,对于处理一些复杂且大量的文本就会捉襟见肘。2.3 Tone AnalyzerTone Analyzer是一款由IBM推出的、基于云计算的人工智能文本分析工具,能对电子邮件、博客文章以及手机短信进行感情色彩分析,以确定它的措辞是否如实地表达了你的愤怒、肯定、高兴或者悲伤等感情。ToneAnalyzer的主界面这一用来帮助评估和改善文字沟通当中的语气的服务目前尚处实验模式,如获成功,或将改变未来商家和营销人员同消费者、客户的沟通方式。更重要的是,它可以应
15、用到新媒体运营者的内容校正中来: 用来查验文章内容的调性和风格,了解自己的文字给人留下的印象如何,以使公众号的内容运营不偏离预设的定位。 帮助品牌运营者和内容输出分析,撰写何种风格的文案才可以引起受众的共鸣。ToneAnalyzer的评价系统包含三个维度,各个维度及其简介如下图所示:ToneAnalyzer的评价系统的三个维度以下是ToneAnalyzer的使用案例,大家可以从下面的几个模块中获得对文字信息的洞察,这部分笔者不做详述,感兴趣的小伙伴可以去官网查阅文档。输入文本信息和选择分析类别文本信息3个维度的分析结果文本信息段落的逐行分析(附有标记)3热点捕获/趋势预测工具3.1搜索指数型这
16、里的搜索指数型趋势工具指的是,它们的数据绝大部分是基于用户的搜索行为,即用户搜索关键词而形成的数据及其展示,有一定的预测价值,但缺点是并不能发现搜索行为背后的原因。3.1.1百度指数关于百度指数的介绍,笔者仅贴出部分官方关于功能的介绍:百度指数是以百度海量网民行为数据为基础的数据分享平台,它能够告诉用户:某个关键词在百度的搜索规模有多大,一段时间内的涨跌态势以及相关的新闻舆论变化,关注这些词的网民是什么样的,分布在哪里,同时还搜了哪些相关的词,帮助用户优化数字营销活动方案。关于详细它的使用方法及一些关键原理,笔者在寻找创业方向时,如何零成本用大数据获悉市场行情?有详述,感兴趣的小伙伴可以去看看
17、。3.1.2微指数微指数是新浪微博的数据分析工具,基于新浪微博的全量数据,通过关键词的热议度,以及行业/类别的平均影响力,来反映微博舆情或账号的发展走势。微指数分为热词趋势、实时趋势、(信息分布)地域解读和(用户)属性分析4个板块。“热词趋势”部分与百度指数的趋势很相像,但它有一个更为有价值的地方点击趋势曲线中的各个节点,会显示出关注度排名靠前的3条微博,可以做到“知其然并知其所以然”。微指数的热词趋势图“实时趋势”则反映该热词近一天的走势情况。“地域解读”即该热词相关微博信息的地域分布情况。最后一个功能板块是“属性分析”,这部分能获悉关注该热词及其相关事件的人群画像,有性别、年龄、兴趣标签比
18、例和星座标签比例这4个人群属性。微指数的“(人群)属性分析”3.2现网信息型现网信息型,顾名思义,就是该类工具的主要数据来源于现有的网络信息,而不是基于网民的搜索行为,因而通过它可以找到热词或事件关注(量)发生波动起伏的原因。一般来说,这类数据产品的典型应用领域在舆情领域(包括舆情监测、品牌口碑监测等),比如新浪舆情通。新浪舆情通的主页新浪舆情通开放工具“热度指数”产品页面以下是新浪舆情通这个大数据分析工具的介绍,我们能从中看到现网信息型热度分析工具的基本原理:“利用独有的分布式网络技术,对互联网上舆情相关数据源进行完整采集,同时根据用户预定的监控关键词对全网数据进行补充获取。“新浪舆情通”可
19、以在很短时间内收录到国内外重要网站、论坛、微博、微信公众号、贴吧、博客等互联网开放平台的相关信息,通过中文智能分词、自然语言处理、正负面研判等大数据处理技术对收录到的信息进行处理并分析可以看出,现网信息型热度分析工具的数据基于现有的全网信息搜集,并经过自然语言处理等技术对文本信息进行信息的“去粗取精”,从而有效把握事件的重要方面和影响因素。“下面,笔者来详述新浪舆情通的几个很有价值的功能模块分别是热度趋势分析、信息监测、事件分析和微博传播分析,它们可以很好的运用到新媒体领域,可以在热点追踪、内容规划、受众画像分析和营销分析方面给予运营者们以有益的指导。3.2.1 (事件)热度趋势分析在地震救援
20、中,有一个概念叫做“黄金72小时”,它是地质灾害发生后的黄金救援期。因为救援界认为,灾难发生之后存在一个“黄金72小时”,在此时间段内,灾民的存活率极高。同样,在新媒体内容运营追踪热点事件方面,也存在类似的定律,能在最短的时间内,把握观众所关注事件的发展走向和舆论倾向,因势利导,就能成功的“借势“。新浪舆情通的(事件)热度趋势分析中有一个能反映事件关注度的一个数据指标热度指数,它的全称是“网络传播热度指数”,是指在从新闻媒体、微博、微信、客户端、网站、论坛等互联网平台采集海量信息的基础上,提取与指定事件、人物、品牌、地域等相关的信息,并对所提取的信息进行标准化计算后得出的指数。热度指数能客观反
21、映事件、人物、品牌、地域等在互联网上的受关注程度。热度指数所呈现的数值为0100,数值越大,表明其网络受关注度越高。下面举个栗子,拿前不久广受关注的“淘宝被列入恶名市场名单”事件作为分析对象,来看看(事件)热度趋势分析的各个功能模块是如何运用到新媒体运营领域的。(1)热度概况和热度趋势从下图的“指数概况”部分,我们可以看到,淘宝被列入恶名市场名单”在72小时内(当然也可以选择24小时这个时间区间)的热度同比增长达到62315%,表明互联网上关于该事件的媒体报道和公众评论信息出现骤增的情形,且指数有将近6%的增幅,幅度不大结合这两个指标可以看出,在近72小时内该事件很火热,且热度呈现稳步增长的趋
22、势。值得注意的是,这里的“同比”和“指数变化”是针对此次查询的72小时区间和上一个72小时区间的数值进行对比的。在“热度趋势”部分,由时间轴和热度指数轴构成的折线图反映了近72小时内该事件热度指数的变化趋势,这个折线图的分析意义重大,能起到预测事件未来热度走势的神奇作用。在分析热度指数的折线图的时候,要注意从微观层面和宏观层面上的把握。在微观层面上,要特别注意折线图中比较重要的节点,特别是峰值节点,它代表其对应的时间点它的关注度较高,要注意发现事件爆发的时间规律;在宏观层面上,要看整条折线的整体走向,是整体呈现上升趋势,还是呈现关注度的下降趋势,当情况属于前者时,新媒体运营者们则可以继续跟进事
23、件的发展,接着“借势”和“跟风”。热度概况及热度趋势分析既然知道了事件热度的峰值节点出现在哪个时间点,这时我们肯定想了解这些时间区间内事件关注度骤然上升的原因。还好,紧接着“热度趋势”,下方给出了其中最突出的峰值节点出现的原因,以重点信息聚类的方式呈现。在下图中,呈现的是12月23日 08时,达到24的峰值时的重点信息聚类。给出了这些热门文章的标题和来源站点,点击标题即可进入相应的网页,查看源信息。最突出峰值节点的信息聚类这里需要强调的是,对于最突出峰值节点的重点聚类信息的解读十分重要,因为这些文章阅读数高,抑或是转发量高,在某种程度上表明了公众对于这些信息的认可度高,能代表一定的公众舆论倾向
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 如何 通过 舆情 数据 分析 成为 媒体 运营 领域 增长 黑客
链接地址:https://www.31ppt.com/p-1706864.html