原理与技术.ppt
《原理与技术.ppt》由会员分享,可在线阅读,更多相关《原理与技术.ppt(94页珍藏版)》请在三一办公上搜索。
1、2023/7/29,李之棠 HUST 1,P2P原理与技术,Firewall,因特网洲际主干,洲际主干,ISP,消费者用户,第三方内容,Web 服务器,应用服务器,因特网主干,地区网络,企业网提供商,ISP,专业提供商,本地 ISP,T1,社团用户,社团网络,数据库,Slide source:,Slide source:,消费者用户,Peer,Peer,Peer,Peer,李之棠华中科技大学计算机学院CERNET华中地区网络中心,2023/7/29,李之棠 HUST 2,P2P原理与技术,概述分类构件与算法关键技术特性P2P分析与比较研究与未来,2023/7/29,李之棠 HUST 3,1.1
2、 什么是P2P,P2P:Peer-to-Peer对等(网络,计算);端到端以非集中方式使用分布式资源来完成关键任务的一类系统和应用资源包括计算能力、数据(存储和内容)、网络带宽和场景(计算机、人和其它资源)关键任务可能是分布式计算、数据/内容共享,通信和协同、或平台服务典型位置:因特网边界或ad-hoc网内,2023/7/29,李之棠 HUST 4,Sarnoff law:效益规模是O(n):网络是广播媒介,任1发送者(设备)和多个(n-1)接收者(设备)。,Metcalfe law:效益规模是O(n2)网络是全互连媒介,任何1个设备可与其它n-1个交互,同时存在n(n-1)=n2-n个并发执
3、行的事务,Reed law:效益规模是O(2n):网络是群组媒介。网络可建立Cn2+Cn3+Cnn-1+Cnn=2n-n-1 个小组,网络服务规模三法则,2023/7/29,李之棠 HUST 5,P2P的效果,巨大的扩展力通过低成本交互来聚合资源,导致整体大于部分之和。低成本的所有权和共享使用现存的基础设施、削减和分布成本匿名和隐私允许对等端在其数据和资源上很大的自治控制,2023/7/29,李之棠 HUST 6,P2P Network,Linux,NAT,TCP/IP,Bluetooth,HTTP,Firewall,TCP/IP,TCP/IP,Application,XP,P2P的网络基本构
4、成,2023/7/29,李之棠 HUST 7,P2P 今天的影响,P2P文件共享产生的流量可能是今天因特网最大的单项流量,Source:www.internet2.edu,July 04,Source:Eurpoean Tier I ISP Feb 04,BT,HTTP,eDonkey,Internet2 traffic statistics,Eurpoean traffic by Protocol,2023/7/29,李之棠 HUST 8,不同共享P2P的下载率和使用率,2023/7/29,李之棠 HUST 9,Deflection capabilitiesResponsiveness,全系
5、统仿真由许多子系统仿真构成,Lift CapabilitiesDrag CapabilitiesResponsiveness,Thrust performanceReverse Thrust performanceResponsivenessFuel Consumption,Braking performanceSteering capabilitiesTractionDampening capabilities,Crew Capabilities-accuracy-perception-stamina-re-action times-SOPs,引擎模块,机身模块,翅膀模块,起落架装置模块,水
6、平尾翼模块,分布式 P2P 仿真,2023/7/29,李之棠 HUST 10,Foldinghome/蛋白质折叠和药物设计,虚拟超级计算机 peer-to-peer technology 产生空前大量的计算能力使医疗研究者能加速治疗方法的改进和药物的设计加快癌研究的新发现,http:/www.stanford.edu/group/pandegroup/Cosm/http:/,2023/7/29,李之棠 HUST 11,1.2 P2P的定义,Intel 工作组:通过在系统之间直接交换来共享计算机资源和服务的一种应用模式A.Weytsel:在因特网周边以非客户地位使用的设备R.l.Granham:
7、通过3个关键条件定义具有服务器质量的可运行计算机具有独立于DNS的寻址系统具有与可变连接合作的能力C.Shirky:利用因特网边界的存储/CPU/内容/现场等资源的一种应访问这些非集中资源意味着运行在不稳定连接和不可预知IP地址环境下,P2P节点必须运行在DNS系统外边具备有效或全部的自治,2023/7/29,李之棠 HUST 12,Kindberg:独立生存的的系统D.J.Milojicic:给对等组提供或从对等组获得共享对等端向组给出某些资源,并从组获得某些资源Napster:把音乐供给组内其他人,并从其他人获得音乐捐赠计算资源用于外星生命的搜索或战胜癌症,获得帮助其他人的满足另一种应用模
8、式选择:相对集中式、和C/S模式纯P2P:没有服务器的概念,所有成员都是对等端并不是全新的概念早期分布式系统:如UUCP和交换网络电话通信计算机网络中的通信、网络游戏中的诸玩家自助餐,志愿组活动,2023/7/29,李之棠 HUST 13,1.3 P2P 与 C/S,二者在结构和构成上有很大区别管理能力、构态能力、功能(查找或发现)、组织(分层与网孔)、元素(DNS)和协议(IP)但又无明显边界都能运行在不同的(Internet/Intranet)平台上都能服务传统或新的应用:eBusiness eServuices,2023/7/29,李之棠 HUST 14,有管理自组织,预构-Ad-hoc
9、,查找发现,分层Mesh,静态移动,依赖服务器独立生存,以IP为中心不以IP为中心,基于DNS客户命名,RPC异步,.NET,JXTA,C/S模式,P2P模式,CORBA,CORBA,Gnutella,Napster,eBusiness,Web apps,eServices,Distr.apps,Ad-hoc NW,Clusters,Internet Intranet,WANs,Grids,P2P与C/S,2023/7/29,李之棠 HUST 15,1.4 P2P 相关背景,一般计算和因特网特殊计算的历史演进:因特网边界计算:如SETIhome和其它分布式计算系统内容共享的社会方面:如Naps
10、ter音乐和其他文件/内容共享系统计算机、网络通信技术的进步和改进大型机桌面PC 便携机手持设备(手机)使通信和协同变得更方便P2P软件结构:如JXTA,.NET开发的P2P算法:如Gnutella,FreeNet,2023/7/29,李之棠 HUST 16,1.5 P2P之目标:满足应用需要,共享/削减成本:Napster 共享文件空间,SETIhome聚合未用资源改进可扩展性/可靠性:对缺乏很强中心授权的自治对等端这点尤为重要资源聚合与互操作能力增加自治匿名/隐私:自治的理念和结果。用户不希望任何人或ISP知道其包含在系统中动态性;资源动态进入或离开系统实现Ad-hoc通信和协同,动态的理
11、念和结果,2023/7/29,李之棠 HUST 17,P2P解决方案,2023/7/29,李之棠 HUST 18,2 P2P分类,所有的计算机系统可分为集中式和分布式两类分布式可进一步划分为C/S和P2P模式C/S模式可划分为扁平:所有的客户端仅仅和单个服务器(含重复服务器)通信,如传统的中间件分层:提高可扩展性,某层的服务器又作为更高层的客户端:如DNS服务器和文件系统,2023/7/29,李之棠 HUST 19,纯P2P系统:如Gnutella 和 Freenet混合P2P系统:首先从服务器获得元数据或索引信息,如存储某些信息的对等端的标识符,或安全信誉的验证,以后P2P通信直接和对等端进
12、行,典型系统有:Napster,Groove,Aimster,Magi,Softwax,iMesh 以及华中科技大学的5Q;Anysee某些有SuperPeers的中间形式:如Kazaa,超级Peers拥有其他Peers没有的信息,它们常常在不能发现时查找这些超级Peers,混合P2P的资源寻找过程,2023/7/29,李之棠 HUST 20,2.1 P2P系统的分类,SETIhomeAvbaki,Entropia,NapsterGnutellaFreenetPubliusFree Haven,MagiGrooveJabber,JXTA.NET.NETMyServices,2023/7/29,
13、李之棠 HUST 21,P2P 多维视图,2023/7/29,李之棠 HUST 22,2.2 P2P 应用分类,2023/7/29,李之棠 HUST 23,可并行化P2P应用,计算密集型:把一个大的任务分解成许多可在大量独立对等端省并行执行的子任务。基本思想是:利用连接在因特网上的诸多计算机的空闲周期来解那些需要大量计算的不同问题。通常是那些使用不同参数的相同计算任务:如外星生命搜索 SETIhome,密码破解,风险预测,市场和信誉评估,人口统计分析构件化应用:还没有广泛认着为P2P应用在许多对等端上运行不同的构件如Workflow,JavaBean,Web Services,2023/7/2
14、9,李之棠 HUST 24,内容和文件管理,集中应用信息存储信息查询(来自网络上各种Peers)大众模式:内容交换2001年:Napster和Gnutella让Peers搜速和下载文件当前重点是提供可靠性:用户下载文件时的智能选择,重复DB协同过虑和挖掘开始出现,2023/7/29,李之棠 HUST 25,协同,什么是协同应用?允许用户实时协同不依赖中心服务器去搜集和转发消息应用实例实时消息:Yahoo!、AOL和Jabber已在各种计算机用户之间广泛使用同行共享:Buzzpad,分布式Power Point异地同时互动评审、编辑同一信息P2P游戏:NetZ 1.0,Scour Exchang
15、e,Cybiko游戏运行在所有Peer的计算机上,更新也分布在所有Peer端,不需要中心服务器,2023/7/29,李之棠 HUST 26,P2P 平台环境,P2P平台由Internet、Intranet和Ad-hoc网构成从拨号线到宽带都可支持P2P当前结构多是个人家庭主机、单位桌面机和个人移动计算机(便携和手持)历史与现状早期P2P系统多用家庭机进行内容共享,Napster,Gnutella Aimster分布式计算多基于桌面机,SETIhomeAd-hoc手持网络最近可用,专于协同计算,如Endeavors,Technologies Magi。发展:更大的场景单位桌面机支持内容共享、ID
16、C与手持机资源聚合、NGI/Inernet2 支持P2P系统和应用,2023/7/29,李之棠 HUST 27,2.3 P2P 市场分类,2023/7/29,李之棠 HUST 28,消费空间个人:音乐和内容共享,及时消息,email 和游戏团体:Napster Gnutella方式:内容交换和通信企业空间单个应用:生物、金融、传统IT解决方案(B2B)联合应用:Data Synapse/Information Architects WorldStreet公用空间信息共享数字版权管理娱乐CenterSpan,AIM,Scour音乐和视频交付都在宽带上使用了P2P技术,2023/7/29,李之棠
17、HUST 29,P2P 市场与 P2P应用,2023/7/29,李之棠 HUST 30,3 构件与算法,P2P结构抽象:由许多构件组成(非正式划分),2023/7/29,李之棠 HUST 31,3.1 基础设施构件,通信P2P模式覆盖广泛的通信方式是通过高速稳定链路连接到因特网的桌面机可是小型无线设备PDA甚至通过无线媒质连接到Ad-hoc网的基于传感的装置P2P群体通信的根本挑战:和对等端动态特点配合的问题有意(关机)或无意(拨号或网络断开)使P2P群体组发生频繁变化在这种环境下维持应用层的连接是P2P开发者面临的最大 的挑战,2023/7/29,李之棠 HUST 32,组管理,组管理的内容
18、发现本群组中其他Peers:Napster:高度集中式发现Peers,Gnutella:高度分布式发现,有时在集中与分布之间定位及Peers之间的路由影响发现算法设计的原因移动、无线设备的发现必须是其他Peers在通信范围内桌面机运行的协议大多用于集中化目录定位及路由算法:从某Peer到另一个之间的消息传送路径的优化已开发的Napster Gnutella主要优化现行网络的延时,2023/7/29,李之棠 HUST 33,健壮性,基本构成安全、资源聚合、可靠性安全是最大挑战P2P的好处是让节点同时具有客户和服务器的功能但从客户端转变成服务器角色就把大量风险带进到系统:仅可信和授权的资源才可提供
19、然而:安全需求或要求来自用户潜在而烦琐的干预,或同可信第三方交互集中式的安全问题避开了分布的风险,可这却是P2P的潜在好处,2023/7/29,李之棠 HUST 34,资源聚合,P2P通过提供Peers间基本的交互来聚合其系统上可用的资源资源范围广泛文件和其他常驻在计算机内的内容,大量的文件共享系统解决了这类资源的聚合问题但资源可定义为:在给定Peer设备上可用东西。如CPU处理能力,带宽,能量和磁盘空间等等,2023/7/29,李之棠 HUST 35,可靠性,P2P系统中困难的问题固有的分布式特点使保障可靠性很困难通常解是:冗余计算密集模式中,当检测到某机失效,则该任务可启动其它可用计算机相
20、同的任务可分配到多个Peers上在文件共享系统,可在许多Peers上部署重复DB丢失的消息可重发或沿着多个通路同时发送,2023/7/29,李之棠 HUST 36,类说明,两类构件前面所讨论的构件是可应用到P2P结构应用类说明是构件每类P2P应用的功能抽象或概要类说明调度:应用于可并行化或计算密集类(任务分块调度给Peers)元数据:应用于内容和文件管理,描述存储在各Peers上的内容,并可被查阅以决定所求信息的位置消息:应用于协同,在各Peers间发送以完成通信管理:支持先行P2P基础设施的管理,2023/7/29,李之棠 HUST 37,应用说明,构成与功能工具、例程和服务详细描述应用,以
21、协调现行P2P设施上的某些应用适应于分布式调度(科学、金融、生物计算)内容和文件共享(音乐MP3文件交换)运行在协同和通信系统上面的特别应用,如日历、笔记、消息和聊天,2023/7/29,李之棠 HUST 38,3.2 模式与算法,集中目录模式最流行,Napster使用群组的Peers连接到发布其能提供共享内容的中心目录上,匹配请求与索引文件直接交换在两个Peers间进行需要一些可管理的设施(目录服务器:记载群组所有参加者的信息)限制了规模的扩大:大量用户增加大量请求-大服务器-存储器然Napster经验表明,除开法律问题外,该模式还很有效和强大,2023/7/29,李之棠 HUST 39,N
22、apster原理,I have X!,insert(X,1.2.3.4).,1.2.3.4,2023/7/29,李之棠 HUST 40,Napster原理,Where is file A?,search(A)-4.3.2.1,4.3.2.1,2023/7/29,李之棠 HUST 41,洪泛请求模式,过程每个Peer的请求直接广播到连接的Peers各Peers又广播到各自的Peers直到收到应答或 达到最大洪泛步数(典型5-9)特点无广告性共享资源Gnutella 使用该算法,限于公司内通信有效大量请求占用网络带宽,可扩展性并不一定最好改进Kazaa 设立Super-Peer客户软件,以集中大量
23、请求BT 文件分块Cache最近请求,2023/7/29,李之棠 HUST 42,Gnutella原理,Where is file A?,2023/7/29,李之棠 HUST 43,KaZaA原理,I have X!,insert(X,123.2.21.23).,123.2.21.23,2023/7/29,李之棠 HUST 44,KaZaA原理,Where is file A?,2023/7/29,李之棠 HUST 45,BitTorrent原理,Tracker,A,D,C,B,2023/7/29,李之棠 HUST 46,BitTorrent原理,A,C,B,D,2023/7/29,李之棠 H
24、UST 47,文件路由模式,过程每个网上Peer分配一个随机ID,并知道其他Peers的给定号码当共享文件发布到系统上时,根据文件名字和内容Hash成为ID每个Peer将根据该ID向该文件路由该过程重复执行,直到最近的PeerID是现行Peer的ID每个路由操作还保持文件副本在本地当Peer请求某文件时,该请求将用该文件的ID到达Peer,过程重复直到发现文件副本,最终文件下载到请求源端,2023/7/29,李之棠 HUST 48,4个算法实现文件路由,Chord/CAN/Tapestry/Pastry目标相同减少路由到指定文件的P2P跳数减少每个Peer必须保持的路由状态算法异同都保证算法的
25、跳数与Peer群组的大小相关或都指出算法能以高概率完成方法上的差别很小,2023/7/29,李之棠 HUST 49,Chord每个Peer保持LogN其他Peer的踪迹(N是群组的全部Peer数)当Peer加入或离开时,高优化算法版本仅需关注LogN个Peers的变化CAN每个Peer保持少于LogN个其他Peers的踪迹在插入和删除时仅这些Peers受影响其路由表较小,但到达的路径较长可能更适合动态通信Tapestry与Pastry很相似除减少跳数外,还积极削减每个P2P跳上的时延,2023/7/29,李之棠 HUST 50,路由表,路由表内容id文件标识符next_hop存储文件id的另一
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 原理 技术
链接地址:https://www.31ppt.com/p-5575895.html