《分布式架构》PPT课件.ppt
1.分布式架构的发展,2.分布式数据库,3.分布式框架,1.分布式架构的发展,通常我们认为静态网页HTML的网站速度是最快的,但是自从有了动态网页之后,很多交互数据都从数据库查询而来,数据也是经常变化的,除了一些新闻资讯类的网站,使用HTML静态化来提高访问速度是不太现实的方案。我们不得不在代码与数据库之间寻求一种更合适的解决方案。,减少数据库访问次数,文件和数据库分离,大数据分布式存储,服务器的集群负载均衡,页面缓存的使用,NoSql内存数据库代替关系型数据库,这些方案措施都是提高系统高并发性能的关键,1.1 初始阶段架构,特征:应用程序、数据库、文件等所有的资源都在一台服务器上。,描述:通常服务器操作系统使用Linux,应用程序使用PHP开发,然后部署在Apache上,数据库使用MySQL,汇集各种免费开源软件以及一台廉价服务器就可以开始系统的发展之路了。,1.2 应用服务和数据服务分离,特征:应用程序、数据库、文件分别部署在独立的资源上。描述:数据量增加,单台服务器性能及存储空间不足,需要将应用和数据分离,并发处理能力和数据存储空间得到了很大改善。,1.3 使用缓存改善性能,特征:数据库中访问较集中的一小部分数据存储在缓存服务器中,减少数据库的访问次数,降低数据库的访问压力。描述:系统访问特点遵循二八定律,即80%的业务访问集中在20%的数据上。缓存分为本地缓存和远程分布式缓存,本地缓存访问速度更快但缓存数据量有限,同时存在与应用程序争用内存的情况。,1.4 使用应用服务器集群,特征:多台服务器通过负载均衡同时向外部提供服务,解决单台服务器处理能力和存储空间上限的问题。描述:使用集群是系统解决高并发、海量数据问题的常用手段。通过向集群中追加资源,提升系统的并发处理能力,使得服务器的负载压力不再成为整个系统的瓶颈。,1.5 数据库读写分离,特征:主流数据库提供主从热备功能,通过配置主从关系,将一台数据库中的数据更新同步到另一台服务器上,实现读写分离,改善数据库负载压力。描述:网站使用缓存之后,绝大多数数据读操作都可以不通过数据库完成,但是仍有一些读操作(缓存不明中,缓存过期)和全部的写操作需要访问数据库,当网站访问量大的时候,数据库因为负载压力大而成为瓶颈。,1.6 反向代理和CDN加速,特征:采用CDN(Content Delivery Network)和反向代理加快系统的 访问速度。描述:为了应付复杂的网络环境和不同地区用户的访问,通过CDN和反向代理加快用户访问的速度,同时减轻后端服务器的负载压力。CDN与反向代理的基本原理都是缓存。,1.7 分布式文件系统和分布式数据库,特征:数据库采用分布式数据库,文件系统采用分布式文件系统。描述:任何强大的单一服务器都满足不了大型系统持续增长的业务需求,数据库读写分离随着业务的发展最终也将无法满足需求,需要使用分布式数据库及分布式文件系统来支撑。,1.8 使用NoSQL和搜索引擎,特征:系统引入NoSQL数据库及搜索引擎。描述:随着业务越来越复杂,对数据存储和检索的需求也越来越复杂,系统需要采用一些非关系型数据库如NoSQL和分数据库查询技术如搜索引擎。,1.9 业务拆分,特征:系统上按照业务进行拆分改造,应用服务器按照业务区分进行分别部署。描述:为了应对日益复杂的业务场景,通常使用分而治之的手段将整个系统业务分成不同的产品线,应用之间通过超链接建立关系,也可以通过消息队列进行数据分发,当然更多的还是通过访问同一个数据存储系统来构成一个关联的完整系统。,2.分布式数据库,数据量变大之后的问题:数据放不下数据查不了数据丢不起,集中式数据库的缺点:通信开销大系统可靠性差性能差可扩展性差设计管理困难,2.1 分布式数据库的基本要求,1.数据分布性:数据分布在不同的机器,甚至不同的地域2.数据统一性:整个系统在逻辑上一致3.数据透明性:入口统一4.数据安全性:单个节点的数据出现错误,不会影响整体5.可扩展性:扩容6.数据自治性:每个子系统能够独立的管理数据,2.2 分布式数据库的体系结构,1.数据分配分割分配全复制分配混合分配2.数据分片水平分片垂直分片混合分片,2.2 分布式数据库的体系结构,1.数据分配分割分配全复制分配混合分配2.数据分片水平分片垂直分片混合分片,2.2 分布式数据库的体系结构,1.数据分配分割分配全复制分配混合分配2.数据分片水平分片垂直分片混合分片,2.2 分布式数据库的体系结构,1.数据分配分割分配全复制分配混合分配2.数据分片水平分片垂直分片混合分片,按行拆分,2.2 分布式数据库的体系结构,1.数据分配分割分配全复制分配混合分配2.数据分片水平分片垂直分片混合分片,将一张表的数据按字段拆分成多个表,减少更新对磁盘造成的影响,2.2 分布式数据库的体系结构,1.数据分配分割分配全复制分配混合分配2.数据分片水平分片垂直分片混合分片,2.3 分布式数据库组件,1.全局数据库管理系统(获取连接,解析分片,协调全局事务执行)2.全局数据字典(维护分片规则,完整性约束,事务统计)3.局部数据库管理系统(执行操作,心跳检测)4.通信管理系统(全局与局部,分片之间的通信),2.4 分布式数据库查询,1.单节点类2.跨节点类,2.4 分布式数据库查询,1.单节点类2.跨节点类,查询下发,2.4 分布式数据库查询,1.单节点类2.跨节点类,获取数据,2.4 分布式数据库更新,1.原子性2.隔离性,两阶段提交:准备阶段提交阶段,2.4 分布式数据库更新,1.原子性2.隔离性,3.分布式框架,1.Dubbo一款分布式服务框架高性能和透明化的RPC(Remote Procedure Call)远程服务调用方案SOA(service-oriented architecture)服务治理方案,2.Spring CloudSpring Cloud是一系列框架的有序集合。它利用Spring Boot的开发便利性巧妙地简化了分布式系统基础设施的开发,如服务发现注册、配置中心、消息总线、负载均衡、断路器、数据监控等,都可以用Spring Boot的开发风格做到一键启动和部署。,3.1 Dubbo,Provider暴露服务方称之为“服务提供者”。Consumer调用远程服务方称之为“服务消费者”。Registry服务注册与发现的中心目录服务称之为“服务注册中心”。Monitor统计服务的调用次数和调用时间的日志服务称之为“服务监控中心”。,3.2 Spring Cloud,Spring Cloud Netflix是对Netflix开发的一套分布式服务框架的封装,包括服务的发现和注册,负载均衡、断路器、REST客户端、请求路由等。Spring Cloud Config将配置信息中央化保存,可以实现动态修改配置文件Spring Cloud Bus分布式消息队列,是对Kafka,MQ的封装Spring Cloud Security对Spring Security的封装,并能配合Netflix使用Spring Cloud Zookeeper 实现注册中心,