大数据与图书馆服.ppt
《大数据与图书馆服.ppt》由会员分享,可在线阅读,更多相关《大数据与图书馆服.ppt(14页珍藏版)》请在三一办公上搜索。
1、大数据与图书馆服务,摘要:通过对大数据特征和国内外现状的详细分析,对大数据时代的图书馆服务提出了三点思考,对图书馆利用大数据提出了期望。,关键词:大数据;图书馆服务,大数据概论,大数据(bigdata),或称海量数据,是用来描述海量的结构化和非结构化数据的专业术语,包括业务流程数据,如天文望远镜拍摄的图像视频数据、气象学里面的卫星云图数据等;企业大数据,如物联网、联通、移动、电信等通信和互联网运营商的数据等;社会大数据,如社会性网络服务(SNS)、微博、新闻媒体、视频网站、电子商务、招聘信息等;个人大数据,如个人实时位置、状态、见闻、言论等;科学大数据,如各种学科数据库等。大数据所描述的数据量
2、规模巨大到无法通过传统的数据库和软件技术进行存储、管理和处理。作为这两年的热词,大数据是继Web2.0、数据仓库、数据挖掘和云计算之后为计算机界所主要研究的对象。在感知上,大数据是指难以用常用的软件工具在可容忍时间内抓取、管理以及处理的数据集合,大数据之所以可能成为一个“时代”,在很大程度上是因为这是一个可以由社会各界广泛参与的社会运动,而不仅仅是少数专家学者的研究对象。,大数据特征,数量Volume 第一个特征也是最重要的,大数据描述的是大批量数据,数据量级一般可以达到PB(1024TB)级规模,根据互联网数据中心(IDC)的监测,全球在2010年正式进入ZB(10243TB)时代,2011
3、年全球数据量将达到1.8ZB,预计到2020年,全球将总共拥有35ZB的数据量。日益庞大的数据量使得人们对数据的有效利用日益重视,从而衍生了大数据概念。大数据需要处理的是各类统计、用户行为等数据,如企业的经营交易信息、商品物流信息、社会网络交流信息、位置信息等,数据规模极为庞大,有着自己独特的处理方案。多样性Variety 大数据种类繁多,在编码方式、数据格式、应用特征等多个方面存在差异性,多信息源并发形成了大量的异构数据,因此不能再用处理结构化数据的方法来进行处理。速度Velocity 大数据对数据实时处理有着极高的要求,需要实时反馈结果,捕捉、分析、处理每一瞬时出现的数据,因此通过传统数据
4、库查询方式得到的当前结果很可能已经没有了价值。真实性Veracity 大数据策略可以提供更为真实的数据,通过对大量数据的分析,在用户行为、数据总结和未来预测方面做出准确的判断,为政府、企业、科研决策提供了真实可靠的依据。,大数据技术及应用现状,大数据的研究是近几年开始的,为了适应大数据日益迅猛的发展,其技术发展很快。就目前来看,大数据技术主要涵盖的领域有可视化分析、数据挖掘算法、预测性分析能力、语义引擎、数据管理以及Hadoop、Map-Reduce、HDFS等。在大数据存储方面,有分布式缓存、基于MPP的分布式数据库、分布式文件系统和NoSQL数据库技术,通过这些技术,大数据的优势得以发挥,
5、其数据才得以整合和利用,从而为社会带来效益的提升。近几年,大数据在国内外都有较快的发展。,国外发展现状,大数据的重要性已经得到了世界各国的共识,在2010年7月,联合国发布了大数据促发展,挑战与机遇白皮书,白皮书中指出,大数据时代已经到来,如今人们可以使用极其丰富的数据资源,包括旧数据和新数据,来对社会,对人口进行前所未有的实时分析。2012年1月,在瑞士达沃斯召开的世界经济论坛上,大数据是主题之一,会上发布的报告大数据,大影响:国际化发展的新机遇宣称,数据已经成为一种新的经济资产类别,就像货币或黄金一样。同时各国也在积极研究和利用大数据。2012年5月,美国政府发布了大数据研究和发展计划,此
6、项带有2亿多美元推动资金的倡议,旨在通过推动和改善与大数据相关的收集、组织和分析工具及技术,提升从海量和复杂的数据集中获取知识和洞察分析能力,推动政府与公司、大学的合作结盟,全民动员来应对“大数据”时代的挑战。美国政府推动的大数据计划也涵盖了图书馆部分,例如美国国家医学图书馆,开展了整合生物学及临床信息项目(i2b2:InformaticsforIntegratingBiologyandtheBedside),旨在创造能够整合和交换医疗保健和生物医学研究数据的方法和工具。通过i2b2开发的软件工具整合、挖掘和表现的数据,能够通过开源共享,在全球50多个组织进行使用。该项目就利用了大数据对于数据
7、整合和共享的优势,实现了生物学和临床信息数据的共享。美国有名的IT大公司,包括谷歌、Amazon、IBM、FACEBOOK、甲骨文等都在进行大数据开发和商业营运。例如谷歌推出了BigQuery服务,为企业提供廉价的大数据分析方案。2012年年底,英国的商业、创新和技能部宣布将注资1.89亿英镑发展大数据。2013年5月初,英国首个综合运用大数据技术的医药卫生科研中心在牛津大学成立,投资达9000万英磅,中心通过搜集、存储和分析大量医疗信息,确定新药物的研发方向,从而减少药物开发成本,同时为发现新的治疗手段提供线索。随着越来越多的发达国家重视大数据的研究和应用,并取得了一定成果。中国也开始逐步意
8、识到大数据的重要性。,国内发展现状,国内计算机行业对大数据的重要性有着清醒的认识,2013年6月5日召开的第五届中国云计算大会就确定会议的主题是“大数据大带宽推动云计算应用与创新”,会上,中国云计算技术与产业联盟理事长吴基传指出,大数据是云计算服务的基础,是构架云平台最基本的要素之一,没有对海量信息分析的大数据,就没有为所有信息消费者获取有价值信息的可能性。国内搜索领域巨头,掌握大量用户数据的百度公司已经着手开展大数据的处理和实践。由于百度是基于互联网的数据处理而生,处理大数据的需求十分迫切,百度技术委员会理事长陈尚义透露,“百度每天处理的数据量将近100个PB,相当于5000个国家图书馆的信
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 数据 图书馆
链接地址:https://www.31ppt.com/p-6110372.html