Linux操作系统原理与应用.ppt
Linux操作系统原理与应用,第一章 操作系统概述,Linux内核源代码,不同角度看到的操作系统,操作系统,认识操作系统,打开计算机,首先跳入眼帘的是什么?要拷贝一个文件,具体的拷贝操作是谁完成的?你需要知道文件存放在何处吗?柱面、磁道、扇区描述什么?数据的搬动过程怎样进行繁琐留给自己,简单留给用户 操作系统穿上华丽的外衣图形界面操作系统穿上朴素的外衣字符界面,认识操作系统从使用者的角度看,拷贝命令的C语言实现片断,inf=open(“/floppy/TEST”,O_RDONLY,0);out=open(“/mydir/test”,O_WRONLY,0600);dol=read(inf,buf,4096);write(outf,buf,l);while(l);close(outf);close(inf);,认识操作系统从程序开发者的角度看,认识操作系统从所处位置看,操作系统是其它所有用户程序运行的基础。,#includemain()printf(“Hello worldn”),用户告诉操作系统执行test程序 操作系统通过文件名找到该程序 检查其类型,检查程序首部,找出代码和数据存放的地址文件系统找到第一个磁盘块 操作系统建立程序的执行环境 操作系统把程序从磁盘装入内存,并跳到程序开始处执行,该程序的执行过程简述如下:,操作系统检查字符串的位置是否正确 操作系统找到字符串被送往的设备 操作系统将字符串送往输出设备窗口系统确定这是一个合法的操作,然后将字符串转换成像素窗口系统将像素写入存储映像区 视频硬件将像素表示转换成一组模拟信号控制显示器(重画屏幕)显示器发射电子束。你在屏幕上看到Hello world。,从中看到什么,认识操作系统从程序执行看,从操作系统设计者的角度看操作系统的设计目标是什么?尽可能地方便用户使用计算机 让各种软件资源和硬件资源高效而协调地运转起来。计算机的硬件资源和软件资源各指什么?假设在一台计算机上有三道程序同时运行,并试图在一台打印机上输出运算结果,必须考虑哪些问题?从操作系统设计者的角度考虑,一个操作系统必须包含以下几部分 操作系统接口CPU管理内存管理设备管理文件管理,认识操作系统从设计者角度看,操作系统是计算机系统中的一个系统软件,是一些程序模块的集合它们能以尽量有效、合理的方式组织和管理计算机的软硬件资源,合理的组织计算机的工作流程,控制程序的执行并向用户提供各种服务功能,使得用户能够灵活、方便、有效的使用计算机,使整个计算机系统能高效、顺畅地运行。,认识操作系统定义,操作系统的演变单道批处理系统 串行执行预先组织好的一组任务 提高了系统效率。多道批处理系统 可以交错运行多个程序 再次提高系统效率。分时系统将处理器的运行时间分成数片,均分或依照一定权重派发给系统中的用户使用 快速响应,操作系统的发展,硬件角度下的操作系发展轨迹,硬件角度下的操作系统发展轨迹,分析在硬件的性价比较低的时候,操作系统设计追求什么?在硬件性价比越来越高后,操作系统的设计开始追求的目标是什么?计算机开始普及后,操作系统的设计开始追求?从第三代到第四代计算机,操作系统的发展逐渐摆脱追随硬件发展的状况,形成自己的理论体系进入第四代系统后,分布式系统和多处理器系统虽然极大的扩充了操作系统理论,但系统结构并没有变化,只是各功能模块得以进一步完善。,操作系统的发展,硬件角度下操作系统发展的分析,软件角度下的操作系统发展轨迹,分析程序设计理论约束着操作系统设计。操作系统的发展滞后于计算机语言的发展,从结构化设计到对象化设计,操作系统总是最后应用新编程理论的软件之一。至今操作系统对于是否需要彻底对象化(即微内核化),还处于徘徊时期,仍在探索单内核与微内核的最佳结合方式。人机交互技术主要是为用户考虑,这是对操作系统设计进行的变革。以Linux为代表的开源软件的出现,打破了带有神秘色彩的传统的封闭式开发模式。,软件角度下的操作系统发展轨迹分析,讲究效率的单模块操作系统,进程管理,内存管理,设备管理,文件管理,模块之间可以互相调用的单模块结构,讲究效率的单模块操作系统,模块之间直接调用函数,除了函数调用的开销外,没有额外开销。庞大的操作系统有数以千计的函数复杂的调用关系势必导致操作系统维护的困难,追求简洁的微内核操作系统,客户进程,进程服务器,内存服务器,文件服务器,微内核,追求简洁的微内核操作系统,内核与各个服务器之间通过通信机制进行交互,这使得微内核结构的效率大大折扣。内核发出请求,服务器做出应答为各个服务器模块的相对独立性,使得其维护相对容易,历史悠久的Unix,在MULTICS(1969)的肩上制研制者Ken Thompson和Dennis M.Ritchie 站Unix的诞生还伴有C语言呱呱落地Unix是现代操作系统的代表:安全、可靠、强大的计算能力Unix的商业化是一把双刃剑,自由而奔放的黑马Linux,诞生于学生之手成长于Internet 壮大于自由而开放的文化,Linux之父-Linus Torvalds,芬兰、赫尔辛基大学、1990起始于写两个进程 然后写驱动程序、文件系统、任务切换程序,从而形成一个操作系统邹形,Linux得以流行的原因之一 遵循POSIX标准,POSIX 表示可移植操作系统接口(Portable Operating System Interface)POSIX是在Unix标准化过程中出现的产物。POSIX 1003.1标准定义了一个最小的Unix操作系统接口 任何操作系统只有符合这一标准,才有可能运行Unix程序,Linux的肥沃土壤GNU,GNU 是 GNU Is Not Unix 的递归缩写,是自由软件基金会的一个项目。GNU 项目产品包括 emacs 编辑器、著名的 GNU C 和 Gcc编译器等,这些软件叫做GNU软件。GNU 软件和派生工作均适用 GNU 通用公共许可证,即 GPL(General Public License)Linux的开发使用了众多的GUN工具,GPL开源软件的法律,GPL 允许软件作者拥有软件版权 但GPL规定授予其他任何人以合法复制、发行和修改软件的权利。,Linux系统或发布版,符合 POSIX 标准的操作系统内核、Shell 和外围工具。C 语言编译器和其他开发工具及函数库 X Window 窗口系统 各种应用软件,包括字处理软件、图象处理软件等。,开放与协作的开发模式,世界各地软件爱好者集体智慧的结晶 提供源代码,遵守GPL。经历了各种各样的测试与考验,软件的稳定性好。开发人员凭兴趣去开发,热情高,具有创造性。,Linux内核,Linus领导下的开发小组开发出的系统内核 是所有Linux 发布版本的核心 内核开发人员一般在百人以上,任何自由程序员都可以提交自己的修改工作。采用邮件列表来进行项目管理、交流、错误报告有大量的用户进行测试,正式发布的代码质量高,整个系统的核心内核,硬件,系统调用接口,应用程序进程1,应用程序进程2,应用程序进程3,Linux内核,用户进程,内核子系统,系统调用,整个系统的核心内核,用户进程运行在Linux内核之上的一个庞大软件集合。系统调用内核的出口,用户程序通过它使用内核提供的功能。Linux内核操作系统的灵魂,负责管理磁盘上的文件、内存,负责启动并运行程序,负责从网络上接收和发送数据包等等。硬件包括了Linux安装时需要的所有可能的物理设备。例如,CPU、内存、硬盘、网络硬件等等。,内核子系统,内核子系统,进程调度控制着进程对CPU的访问。内存管理允许多个进程安全地共享主内存区域 虚拟文件系统隐藏各种不同硬件的具体细节,为所有设备提供统一的接口。网络提供了对各种网络标准协议的存取和各种网络硬件的支持。进程间通信(IPC)支持进程间各种通信机制,包括共享内存、消息队列及管道等。,Linux内核版本树,0.01Linux(第一版),0.13版|产品化版本实验版本 的拷贝)1.0.X(修改)1.1.X(增加新功能,进行测试)1.1.95(成为1.2.0),内核源代码结构,Linux内核源代码分析工具,Linux超文本交叉代码检索工具 http:/lxr.linux.no/Windows平台下的源代码阅读工具Source Insight,“内核之旅”网站,电子杂志栏目是关于内核研究和学习的资料 第一期“走入Linux世界”涉猎了操作系统的来龙去脉后与大家携手步入Linux世界。下载代码,亲手搭建实验系统。,第二章 内存寻址,Linux系统地址映射示例,内存寻址操作系统设计的硬件基础之一,操作系统横跨软件和硬件的桥梁内存寻址操作系统设计的硬件基础之一 操作系统的设计者必须在硬件相关的代码与硬件无关的代码之间划出清楚的界限,以便于一个操作系统很容易地移植到不同的平台。在这众多的平台中,大家最熟悉的就是i386,即Intel80386体系结构。因此,我们所介绍的内存寻址也是以此为背景。,内存寻址的不同时期,石器时期8位寻址,在微处理器的历史上,第一款微处理器芯片4004是由Intel推出的,4位。在4004之后,intel推出了一款8位处理器叫8080,它有1个主累加器(寄存器A)和6个次累加器(寄存器B,C,D,E,H和L)那时没有段的概念,访问内存都要通过绝对地址,因此程序中的地址必须进行硬编码(给出具体地址),而且也难以重定位,青铜时期“段”的引入,intel开发出的16位的处理器叫8086,标志着Intel X86王朝的开始,同时引入了“段”概念。段描述了一块有限的内存区域,区域的起始位置存在专门的寄存器(段寄存器)中。8086处理器地址线扩展到了20位,寻址空间到了1M也就是把1M大的空间分成数个64k的段来管理(化整为零了)。把16位的段地址左移动4位后,再与16位的偏移量相加便可获得一个20位的内存地址,,白银时期“保护模式”的引入,intel的80286处理器于1982年问世。地址总线位数增加到了24位。从此开始引进了一个全新理念保护模式 访问内存时不能直接从段寄存器中获得段的起始地址了,而需要经过额外转换和检查。80286处理器一些致命的缺陷注定不能长久,它很快被天资卓越的兄弟80386代替了,黄金时期内存寻址的飞跃,80386是一个32位的CPU,其寻址能力达到4GB Intel选择了在段寄存器的基础上构筑保护模式,并且保留段寄存器16位 在保护模式下,它的段范围不再受限于64K,可以达到4G这真正解放了软件工程师,他们不必再费尽心思去压缩程序规模,软件功能也因此迅速提升 从80386以后,Intel的CPU经历了80486、Pentium、PentiumII、PentiumIII等型号,但基本上属于同一种系统结构的改进与加强,而无本质的变化,所以我们把80386以后的处理器统称为IA32(32 Bit Intel Architecture)。,IA32寄存器简介,把16位的通用寄存器、标志寄存器以及指令指针寄存器扩充为32位的寄存器 段寄存器仍然为16位。增加4个32位的控制寄存器 增加4个系统地址寄存器 增加8个调式寄存器 增加2个测试寄存器,常用寄存器简介,通用寄存器8个通用寄存器是8086寄存器的超集,它们分别为:EAX,EBX,ECX,EDX,EBP,EBP,ESI及 EDI 段寄存器8086中有4个16位的段寄存器:CS、DS、SS、ES,分别用于存放可执行代码的代码段、数据段、堆栈段和其他段的基地址。这些段寄存器中存放的不再是某个段的基地址,而是某个段的选择符(Selector)段基地址存放在段描述符表(Descriptor)中,表的索引就是选择符,常用寄存器简介,指令指针寄存器 指令指针寄存器EIP中存放下一条将要执行指令的偏移量(offset),这个偏移量是相对于目前正在运行的代码段寄存器CS而言的。偏移量加上当前代码段的基地址,就形成了下一条指令的地址。EIP中的低16位可以被单独访问,给它起名叫指令指针IP寄存器,用于16位寻址。标志寄存器 标志寄存器EFLAGS存放有关处理器的控制标志,很多标志与16位FLAGS中的标志含义一样。,用于分页机制的控制寄存器,物理地址、虚拟地址及线性地址,将主板上的物理内存条所提供的内存空间定义为物理内存空间,其中每个内存单元的实际地址就是物理地址将应用程序员看到的内存空间定义为虚拟地址空间(或地址空间),其中的地址就叫虚拟地址(或虚地址),一般用“段:偏移量”的形式来描述 线性地址空间是指一段连续的,不分段的,范围为0到4GB的地址空间,一个线性地址就是线性地址空间的一个绝对地址。,地址之间的转换保护模式下的寻址,CPU,MMU,内存,磁盘控制器,总线,CPU把虚地址送给MMU,MMU把物理地址送给存储器,地址之间的转换MMU机制,段机制,段是虚拟地址空间的基本单位,段机制必须把虚拟地址空间的一个地址转换为线性地址空间的一个线性地址。用三个方面来描述段 段的基地址(Base Address):在线性地址空间中段的起始地址。段的界限(Limit):在虚拟地址空间中,段内可以使用的最大偏移量。段的保护属性(Attribute):表示段的特性。例如,该段是否可被读出或写入,或者该段是否作为一个程序来执行,以及段的特权级等等。,虚拟线性地址的转换,虚拟地址空间,段描述符表段表,如图所示的段描述符表(或叫段表)来描述转换关系。段号描述的是虚拟地址空间段的编号,基地址是线性地址空间段的起始地址。段描述符表中的每一个表项叫做段描述符,012,索引(段号),保护模式下的其他描述符表简介,全局描述符表GDT(Gloabal Descriptor Table)中断描述符表IDT(Interrupt Descriptor Table)局部描述符表LDT(Local Descriptor Table)为了加快对这些表的访问,Intel设计了专门的寄存器,以存放这些表的基地址及表的长度界限。这些寄存器只供操作系统使用。有关这些表的详细内容请参看有关保护模式的参考书。,保护模式下段寄存器中存放什么,存放索引或叫段号,因此,这里的段寄存器也叫选择符,即从描述符表中选择某个段。选择符(段寄存器)的结构:,RPL表示请求者的特权级(Requestor Privilege Level),保护模式下的特权级,保护模式提供了四个特权级,用03四个数字表示 很多操作系统(包括Linux,Windwos)只使用了其中的最低和最高两个,即0表示最高特权级,对应内核态;3表示最低特权级,对应用户态。保护模式规定,高特权级可以访问低特权级,而低特权级不能随便访问高特权级。,地址转换及保护,Linux中的段,Linux是怎样处理段机制?,?,分页机制页,将线性地址空间划分成若干大小相等的片,称为页(Page)物理地址空间分成与页大小相等的若干存储块,称为(物理)块或页面(Page Frame)页的大小应该为多少?由谁确定?,分页机制页表,页表是把线性地址映射到物理地址的一种数据结构。页表中应当包含如下内容:物理页面基地址:线性地址空间中的一个页装入内存后所对应的物理页面的起始地址。页的属性:表示页的特性。例如该页是否在内存,是否可被读出或写入等。页面的大小为4KB,物理页面基地址需要多少位就可以?,分页机制页表项结构,物理页面基地址:指的是页所对应的物理页面在内存的起始物理地址。相当于物理块号(为什么?)其最低12位全部为0,因此用高20位来描述32位的地址。属性见书,物理页面基地址 属性,31 11 0,分页机制两级页表,为什么要采用两级页表?,页目录,页表,物理页面,分页机制线性地址结构,这个结构的伪代码描述如下 typedef struct unsigned int dir:10;/*用作页目录中的下标,对应的 目录项指向一个页表*/unsigned int page:10/*用作页表的下标,对应的页表 项指向一个物理页面*/unsigned int offset:12/*在4K字物理页面内的偏移量*/LinearAddr,31 22 12 0,分页机制硬件保护机制,对于页表,页的保护是由属性部分的U/S标志和R/W标志来控制的。当U/S标志为0时,只有处于内核态的操作系统才能对此页或页表进行寻址。当这个标志为1时,则不管在内核态还是用户态,总能对此页进行寻址。此外,与段的三种存取权限(读、写、执行)不同,页的存取权限只有两种(读、写)。如果页目录项或页表项的读写标志为0,说明相应的页表或页是只读的,否则是可读写的。,分页机制线性地址到物理地址的转换,分页机制分页示例,假如操作系统给一个正在运行的进程分配的线性地址空间范围是0 x20000000 到 0 x2003ffff。这个空间由64页组成。我们从分配给进程的线性地址的最高10位(分页硬件机制把它自动解释成页目录域)开始。这两个地址都以2开头,后面跟着0,因此高10位有相同的值,即十六进制的0 x080或十进制的128。因此,这两个地址的页目录域都指向进程页目录的第129项。相应的目录项中必须包含分配给进程的页表的物理地址,如图2.13。如果给这个进程没有分配其它的线性地址,则页目录的其余1023项都为0,也就是这个进程在页目录中只占一项。,分页机制分页示例,1023(0 x3ff)128(0 x80),1023(0 x3ff)64(0 x040)63(0 x03f),页目录,页表,假设进程需要读线性地址0 x20021406中的内容。这个地址由分页机制如何进行处理?,分页机制页面高速缓存,分页机制Linux中的分页,Linux主要采用分页机制来实现虚拟存储器管理,因为:Linux的分段机制使得所有的进程都使用相同的段寄存器值,这就使得内存管理变得简单,也就是说,所有的进程都使用同样的线性地址空间(04G)。Linux设计目标之一就是能够把自己移植到绝大多数流行的处理器平台。但是,许多RISC处理器支持的段功能非常有限。为了保持可移植性,Linux采用三级分页模式而不是两级,分页机制Linux中的分页,Linux中的C语言和汇编语言,GNU 的C语言 AT&T的汇编:参见书,Linux系统地址映射示例,Linux采用分页存储管理。虚拟地址空间划分成固定大小的“页”,由MMU在运行时将虚拟地址映射(变换)成某个物理页面中的地址 IA32的MMU对程序中的虚拟地址先进行段式映射(虚拟地址转换为线性地址),然后才能进行页式映射(线性地址转换为物理地址)Linux巧妙地使段式映射实际上不起什么作用,Linux系统地址映射示例,假定我们有一个简单的C程序Hello.c#include greeting()printf(“Hello,world!n”);main()greeting();,Linux系统地址映射示例,用Linux的实用程序objdump对其可执行代码进行反汇编:%objdump d hello08048568:8048568:pushl%ebp 8048569:movl%esp,%ebp 804856b:pushl$0 x809404 8048570:call 8048474 8048575:addl$0 x4,%esp 8048578:leave 8048579:ret 804857a:movl%esi,%esi 0804857c:804857c:pushl%ebp 804857d:movl%esp,%ebp 804857f:call 8048568 8048584:leave 8048585:ret 8048586:nop 8048587:nop,Linux系统地址映射示例,Linux最常见的可执行文件格式为elf(Executable and Linkable Format)。在elf格式的可执行代码中,ld总是从0 x8000000开始安排程序的“代码段”,这个地址就是虚地址程序执行时在物理内存中的实际地址,则由内核为其建立内存映射时临时分配,具体地址取决于当时所分配的物理内存页面。,0 x08048568 如何转化为物理地址?,本章小节,Linux系统地址映射示例,“内核之旅”网站,电子杂志栏目是关于内核研究和学习的资料 第二期“i386体系结构分两部分,上半部分让大家认识一下Intel系统中的内存寻址和虚拟内存的来龙去脉。下半部分将实现一个最短小的可启动内核,一是加深对i386体系的了解,再就是演示系统开发的原始过程。下载代码进行调试,第三章 进程,进程的创建,与进程相关的系统调用及其应用,与调度相关的系统调用及应用,进程介绍程序和进程,进程介绍进程层次结构,init,A,B,C,D,E,进程介绍进程状态,运行态,阻塞态,就绪态,进程介绍进程示例,include/*提供类型pid_t的定义,在PC机上与int型 相同*/#include/*提供系统调用的定义*/main()pid_t pid;/*此时仅有一个进程*/printf(“PID before fork():%dn”,(int)getpid();pid=fork();/*此时已经有两个进程在同时运行*/if(pid0)printf(error in fork!);else if(pid=0)printf(I am the child process,my process ID is%dn,getpid();else printf(I am the parent process,my process ID is%dn,getpid();,进程介绍进程示例,编译并运行这个程序:$gcc fork_test.c-o fork_test$./fork_test PID before fork():1991 I am the parent process,my process ID is 1991 I am the child process,my process ID is 1992 再运行一遍,输出结果可能不同。读者考虑一下为什么?,进程控制块,对进程进行全面描述的数据结构 Linux中把对进程的描述结构叫做task_struct:struct task_struct 传统上,这样的数据结构被叫做进程控制块PCB(process control blaock),进程控制块信息分类,状态信息描述进程动态的变化。链接信息描述进程的父子关系。各种标识符用简单数字对进程进行标识。进程间通信信息描述多个进程在同一任务上协作工作。时间和定时器信息描述进程在生存周期内使用CPU时间的统计、计费等信息。调度信息描述进程优先级、调度策略等信息。文件系统信息对进程使用文件情况进行记录。虚拟内存信息描述每个进程拥有的地址空间。处理器环境信息描述进程的执行环境(处理器的寄存器及堆栈等),进程控制块Linux进程状态及转换,fork(),进程控制块进程标识符,每个进程都有一个唯一的标识符,内核通过这个标识符来识别不同的进程。进程标识符PID也是内核提供给用户程序的接口,用户程序通过PID对进程发号施令。PID是32位的无符号整数,它被顺序编号 每个进程都属于某个用户组。task_struct结构中定义有用户标识符UID(User Identifier)和组标识符GID(Group Identifier)这两种标识符用于系统的安全控制 系统通过这两种标识符控制进程对系统中文件和设备的访问。,进程控制块进程之间的亲属关系,父进程,兄进程,进程P,弟进程,指向父进程,指向兄进程,指向子进程,指向弟进程,进程控制块部分内容的描述,上面通过对进程状态、标识符及亲属关系的描述,我们可以把这些域描述如下:task_struct long state;/*进程状态*/int pid,uid,gid;/*一些标识符*/struct task_struct*parent,*child,*o_sibling,*y_sibling/*一些亲属关系*/,进程控制块如何存放,C语言使用下列的联合结构表示这样一个混合结构:union task_union struct task_struct task;unsigned long stack2408;Linux调用alloc_task_struct()函数分配8KB的task_union 内存区,调用free_task_struct()函数释放它,进程控制块如何存放,C语言使用下列的联合结构表示这样一个混合结构:union task_union struct task_struct task;unsigned long stack2408;Linux调用alloc_task_struct()函数分配8KB的task_union 内存区,调用free_task_struct()函数释放它,进程控制块如何存放,把PCB与内核栈放在一起具有以下好处:(1)内核可以方便而快速地找到PCB,用伪代码描述如下:p=(struct task_struct*)STACK_POINTER&0 xffffe000(2)避免在创建进程时动态分配额外的内存在Linux中,为了表示当前正在运行的进程,定义了一个current宏,可以把它看作全局变量来用,例如current-pid返回正在执行的进程的标识符,进程的组织方式-进程链表,在task_struct中定义如下:task_struct*prev_task,*next_task,宏for_each_task()遍历整个进程链表#define for_each_task(p)for(p=),进程的组织方式-哈希表,哈希函数#define pid_hashfn(x)(x)8)(x)&(PIDHASH_SZ-1),图为地址法处理冲突时的哈希表假定哈希表义为:struct task_struct*pidhashPIDHASH_SZ 对给定的PID,如何快速找到对应进程?,进程的组织方式-可运行队列,把可运行状态的进程组成一个双向循环链表,也叫可运行队列(runqueue)在task_struct结构中定义了两个指针。struct task_struct*next_run,*prev_run;init_task起链表头的作用在调度程序运行过程中,允许队列中加入新出现的可运行态进程,新出现的可运行态进程插入到队尾,进程的组织方式-等待队列,等待队列表示一组睡眠的进程 可以把等待队列定义为如下结构:struct wait_queue struct task_struct*task;struct wait_queue*next;如何让正在运行的进程等待某一特定事件?Linux内核中实现了sleep_on()函数,请给出该函数的实现。如果要让等待的进程唤醒,就调用唤醒函数wake_up(),它让待唤醒的进程进入TASK_RUNNING状态。,进程调度-调度算法考虑的因素,公平:保证每个进程得到合理的CPU时间。高效:使CPU保持忙碌状态,即总是有进程在CPU上运行。响应时间:使交互用户的响应时间尽可能短。周转时间:使批处理用户等待输出的时间尽可能短。吞吐量:使单位时间内处理的进程数量尽可能多。,进程调度-调度算法,时间片轮转调度算法 系统使每个进程依次地按时间片轮流地执行 优先权调度算法 非抢占式优先权算法 抢占式优先权调度算法 多级反馈队列调度 优先权高的进程先运行给定的时间片,相同优先权的进程轮流运行给定的时间片 实时调度 一般采用抢占式调度方式,进程调度-时间片,时间片表明进程在被抢占前所能持续运行的时间。时间片过长会导致系统对交互的响应表现欠佳 时间片太短会明显增大进程切换带来的处理器时间。Linux调度程序提高交互式程序的优先级,让它们运行得更频繁,于是,调度程序提供较长的默认时间片给交互式程序 Linux调度程序还根据进程的优先级动态调整分配给它的时间片,进程调度-调度时机,进程状态转换的时刻:进程终止、进程睡眠 当前进程的时间片用完时;设备驱动程序运行时;从内核态返回到用户态时;,为什么在这些时机返回?,进程调度-与调度相关的域,need_resched:调度标志,以决定是否调用schedule()函数。counter:进程处于可运行状态时所剩余的时钟节拍(即时钟中断的间隔时间,为10ms或1ms)数。这个域也叫动态优先级。priority:进程的基本优先级或叫“静态优先级”rt_priority:实时进程的优先级 policy:调度的类型,允许的取值是:SCHED_FIFO:先入先出的实时进程 SCHED_RR:时间片轮转的实时进程 SCHED_OTHER:普通的分时进程。,进程调度-衡量值得运行的程度,static inline int goodness(struct task_struct*p,struct task_struct*prev)int weight;*权值,作为衡量进程是否运行的唯一依据*/if(p-police!=SCHED_OTHER)/*实时进程*/weight=1000+p-rt_priority;goto out weight=p-counter;/*普通进程*/if(!weight)/*p用完了时间片*/goto out;if(p=prev)*细微调整*/weight+=1;weight+=p-priorityout:return weight,调度函数schedule()-变量说明,struct task_truct current,*prev,*next;current:全局变量,表示当前正在运行的进程。prev:局部变量,表示调度发生之前运行的进程,用它保存current的值。next:局部变量,表示调度发生之后要运行的进程。c:局部变量,进程值得运行的程度schedule()函数的关键操作是设置局部变量next,以使next代替prev而指向被选中进程的PCB。,调度函数schedule()片段,如果prev进程时间片用完,而且还是实时进程,就给它分配新的时间片,并让它到可运行队列末尾:if(prev-policy=SCHED_RR,调度函数schedule()片段,如果prev进程处于浅度睡眠状态,而且它有未处理的信号,就应当唤醒它,给它一个被选择执行的机会。if(prev-state=TASK_INTERRUPTIBLE,调度函数schedule()片段,把next初始化为要检查的第一个可运行进程。if(prev-state=TASK_RUNNING)next=prev;if(prev-policy,调度函数schedule()片段,schedule()在可运行进程队列上重复调用goodness()函数以确定最佳后选者:p=init_task.next_run;while(p!=,调度函数schedule()片段,现在到了schedule()的结束部分:如果已选择了一个进程,进程切换必定发生:if(prev!=next)kstat.context_swtch+;*统计进程切换的次数*/switch_to(prev,next);/*从prev切换到next*/return;,进程的创建,进程的创建fork()借用现实世界的“克隆”技术 子进程克隆父进程,但不仅如此。而是采用了“写时复制”技术父进程并不是把自己的所有东西马上都给儿子,而是直到儿子真正需要时才给它。也就是当父进程或子进程试图修改某些内容时,内核才在修改之前将被修改的部分进行拷贝这叫做写时复制。fork()的实际开销就是复制父进程的页表以及给子进程创建唯一的PCB,进程的创建fork(),进程创建函数fork()和线程创建函数clone()都调用内核函数do_fork(),其主要操作:调用alloc_task_struct()函数以获得8KB的union task_union内存区,用来存放新进程的PCB和内核栈。让当前指针指向父进程的PCB,并把父进程PCB的内容拷贝到刚刚分配的新进程的PCB中。检查新创建这个子进程后,当前用户所拥有的进程数目没有超出给他分配的资源的限制。现在,do_fork()已经获得它从父进程能利用的几乎所有的东西;剩下的事情就是集中建立子进程的新资源,并让内核知道这个新进程已经呱呱落地。,进程的创建fork(),接下来,子进程的状态被设置为TASK_UNINTERRUPTIBLE以保证它不会马上投入运行。调用get_pid()为新进程获取一个有效的PID。然后,更新不能从父进程继承的PCB的其他所有域,例如,进程间亲属关系的域。把新的PCB插入进程链表,以确保进程之间的亲属关系。把新的PCB插入pidhash哈希表。把子进程PCB的状态域设置成TASK_RUNNING,并调用wake_up_process()把子进程插入到运行队列链表。让父进程和子进程平分剩余的时间片。返回子进程的PID,这个PID最终由用户态下的父进程读取,线程独立执行的一个函数,Linux把线程和进程一视同仁,不过线程本身拥有的资源少,共享进程的资源,如地址空间。Linux内核线程 在内核态下创建、独立执行的一个内核函数:,int kernel_thread(int(*fn)(void*),void*arg,unsigned long flags)pid_t p;p=clone(0,flags|CLONE_VM);if(p)/*父*/return p;else/*子*/fn(arg);exit();,内核线程周期执行的任务,内核线程是通过系统调用clone()来实现的,使用CLONE_VM标志说明内核线程与调用它的进程(current)具有相同的进程地址空间.由于调用进程是在内核中调用kernel_thread(),因此当系统调用返回时,子进程也处于内核态中,而子进程随后调用fn,当fn退出时,子进程调用exit()退出,所以子进程是在内核态运行的.由于内核线程是在内核态运行的,因此内核线程可以访问内核中数据,调用内核函数.运行过程中不能被抢占等等.内核线程也可以叫内核任务,它们周期性地执行,例如,磁盘高速缓存的刷新,网络连接的维护,页面的换入换出等等。,几个特殊身份的内核线程,没事闲逛的0号进程从无到有诞生的第一个线程,执行cpu_idle()函数(省电又少热)。既是内核线程也是1号用户进程的init。Init进程诞生后就不愿意死亡了,它创建和监控操作系统外层所有进程的活动。还有另外四个线程:,kflushd(即bdflush)线程:刷新“脏”缓冲区中的内容到磁盘以归还内存。Kupdate线程:刷新旧的“脏”缓冲区中的内容到磁盘以减少文件系统不一致的风险。Kpiod线程:把属于共享内存映射的页面交换出去。Kswapd线程:执行内存回收功能。,进程的系统调用,Fork()父亲克隆一个儿子。执行fork()之后,兵分两路,两个进程并发执行。Exec()新进程脱胎换骨,离家独立,开始了独立工作的职业生涯。Wait()等待不仅仅是阻塞自己,还准备对僵死的子进程进行善后处理。Exit()终止进程,把进程的状态置为“僵死”,并把其所有的子进程都托付给init进程,最后调用schedule()函数,选择一个新的进程运行。,进程的一生,随着一句fork,一个新进程呱呱落地,但这时它只是老进程的一个克隆。然后,随着exec,新进程脱胎换骨,离家独立,开始了独立工作的职业生涯。人有生老病死,进程也一样,它可以是自然死亡,即运行到main函数的最后一个,从容地离我们而去;也可以是中途退场,退场有2种方式,一种是调用exit函数,一种是在main函数内使用return,无论哪一种方式,它都可以留下留言,放在返回值里保留下来;甚至它还可能被谋杀,被其它进程通过另外一些方式结束它的生命。进程死掉以后,会留下一个空壳,wait站好最后一班岗,打扫战场,使其最终归于无形。这就是进程完整的一生。,与调度相关的系统调用,系统调用描述 nice()改变一个普通进程的优先级getpriority()取得一组普通进程的最大优先级setpriority()设置一组普通进程的优先级 sched_getscheduler()取得一个进程的调度策略sched_setscheduler()设置一个进程的调度策略