Linux内核实现机制概述.docx
《Linux内核实现机制概述.docx》由会员分享,可在线阅读,更多相关《Linux内核实现机制概述.docx(18页珍藏版)》请在三一办公上搜索。
1、Linux内核实现机制概述Linux2.6内核分析 Linux内核主要由5个模块构成,分别是:进程调度模块、内存管理模块、虚拟文件系统模块、进程间通信模块。 Linux经常使用散列表来实现高速缓存,高速缓存是需要快速访问的信息。 一、进程 进程的模型包括进程控制块、程序部分和数据集合三部分。 1、进程控制块PCB PCB是进程存在的唯一标识。 PCB按功能分主要包含以下四部分:进程标示符、处理机状态、进程调度信息、进程控 制信息。 进程标示符:唯一标识一个进程。 处理机状态:有处理机的各种寄存器中的内容组成,寄存器包括通用寄存器、指令寄存器、程序状态字PSW、和用户栈指针。当初立即被中断时,进
2、程运行信息必须保存在PCB中,以便运行时从断点继续执行。 进程调度信息:存放进程状态、进程优先级、进程调度所需其他信息、时间或阻塞原因。 进程控制信息:包括程序和数据的内存或者外存地址,进程同步和通信机制,资源清单、链接指针。 Linux的进程控制块PCB使用一个成为task_struct的结构体来描述。该结构体中定义了进程的几种状态: TASK_RUNNING状态。Linux的进程运行状态包括实际的运行和就绪状态,对两者的区分是根据当前是否占有CPU,结构体中current变量可以区分两者。 TASK_INTERRUPTIBLE状态。即可中断的等待状态,当进程在等待某个事件和某个资源,可中断
3、等待状态的进程可以被信号唤醒而进入就绪状态等待调度。 TASK_UNINTERRUPTIBLE状态。即不可中断等待状态,该状态进程由于硬件不能满足,不能被信号唤醒,必须等到得到所等待的资源之后才能被唤醒。 TASK_ZOMBIE状态。即僵死状态,终止进程所占有的资源全部释放之后,还保存着PCB信息,这种占有PCB但已被撤销的进程处于僵死状态。 TASK_STOPPED状态。即暂停状态,一般都是有运行状态转换来,正等待某种特殊处理,如调试跟踪的程序。 TASK_DEAD状态。新增加的状态,指已经退出但是不需要父进程回收的进程。 Linux内核创建一个进程时,首先会新建一个空的task_struc
4、t结构体,并将相应信息填入结构体中,然后将该结构体的指针添加进task数组,这个数组大小由NR_TASK指定。调度程序一直维持着一个current指针,它指向当前正在运行的程序。Task0必须指向init_task进程。 Linux中,内核将所有struct_task结构体以两种方式组织: 哈希表,将进程的PID作为哈希算法的输入,可以用一个给定PID快速查找到进程,通过find_task_pid来定位相应进程。 双向循环链表,这样可以使系统很容易遍历所有的进程。通过调用for_each_task来实现遍历。task_struct结构体中的变量list_head的作用就是将进程通过双向链表将进
5、程连接起来。链表的首部和头部都是init_task进程。 2、进程的创建 Linux提供了三种创建新进程的方法:fork、vfork、clone 三者分别对应系统调用的sys_fork、sys_vfork、sys_clone,最终三者都是通过do_fork 调用完成的。 目前Linux在创建进程时,采用“写时拷贝”技术,即在创建进程时并不将父进程所有的资源都复制给子进程,而是需要时才进行资源的拷贝,可以大大提高Linux的性能。 fork函数 调用fork后,系统会创建一个子进程,子进程和父进程不同的只有它的进程ID和父进程ID,其他都一样。地址空间不共享,由于采用“写时拷贝”技术,子进程并不
6、完全拷贝父进程的数据段和栈、堆等的复制,这些区域作为父子进程的共享区域,而且内核将他们访问权限设置为只读,如果父子进程任何一个试图修改此区域,内核就为那块内存拷贝制作一个副本。 之所以采用“写时拷贝”是因为一般fork后会调用exec调用其他的执行体。 父子进程的执行顺序不确定。 fork函数被调用一次,但是返回两次值。两次返回值的区别是,子进程的返回值是0,父进程返回值是子进程的进程ID。调用失败的话返回-1。 vfork函数 该函数与fork基本一致,只不过父子进程共享父进程的地址空间。 对于vfork创建新进程后,父进程会阻塞,子进程借用父进程的地址空间运行,直到子进程退出或者调用exe
7、c,父进程才可以运行。 vfork和fork返回值相同。 clone函数 clone函数和fork、vfork不同,它接受一个指向函数的指针和该函数的参数,在创建子进程成功时就调用这个函数执行。 3、进程终止 分为自愿终止和被动终止。 自愿终止 a.显式自愿终止:在进程中调用exit函数 b.隐式自愿终止:进程从某个程序的主函数退出 被动终止 a.当进程接收到一个它既不能处理也不能忽略的信号和异常 b.进程接收到SIGABRT或者其他终止信号。 上述进程终止主要分为两步来完成: 首先通过调用do_exit函数释放掉与进程相关的大部分资源,并使进程处于僵死状态,但是进程描述符不释放。 然后对进程
8、的处理应看子进程与父进程谁先终止。子进程先终止的话,则子进程一直处于僵死状态,直到父进程调用wait或者waitpid。调用完成后则完全释放。父进程先终止,则内核必须为子进程找到新的父进程,方法是首先给子进程在当前组内找一个线程最为父进程,不行就让init做父进程。 wait函数的两个作用:获取内核发送来的子进程终止消息和清除子进程的所有独享资源。wait函数会首先挂起调用它的进程,知道该进程的一个子进程终止,此时函数会返回该子进程的PID给父进程。 4、线程的实现 Linux内核中没有专门的实现线程的机制,而是通过用户级程序库来实现的,例如pthread库,以便将所有的线程映射到一个单独的内
9、核级进程中。Linux提供的一种不区分进程和线程的方案:通过使用一种类似于Solaris轻量级进程的方法,用户级线程被映射到内核级进程上,组成一个用户级进程的多个用户级线程被映射到共享同一个ID的多个Linux内核级进程上。这使得这些进程可以共享文件和内存等资源,使得同一组中的进程调度切换时不需要切换上下文。 5、Linux进程调度 Linux是一个抢占式多任务系统,高优先级的可以抢占低优先级的CPU运行。Linux优先级分为静态优先级和动态优先级。 Linux进程分为普通进程和实时进程两类。实时进程创建时静态优先级就已经分配而且不会改变,不为实时进程计算动态优先级,实时进程的优先级范围为09
10、9都高于普通进程100139。普通进程优先级同样有静态优先级,但是没有作用,内核为普通进程计算动态优先级,并根据优先级分配时间片,来调度进程。 Linux提供了三种调度策略: SCHED_NORMAL面向普通进程的时间片轮转策略。时间片用完后再选择一个优先级相对较高的进程进程调度。 SCHED_FIFO面向对响应时间要求比较高、运行所需时间较短的实时进程。 SCHED_RR面向对响应时间要求比较高、运行所需时间较长的实时进程。 总结调度,根据进程的分类调度可分为实时调度和非实时调度。 实时调度针对实时进程静态优先级。 对于实时进程,静态优先级决定了对CPU的抢占,当高优先级的进程到达时,会抢占
11、低优先级进程的CPU,同样可以知道实时进程总是能抢占普通进程的CPU。对于同一优先级的实时进程则又可采用两种调度算法:FIFO和RR。 例如,当前进程有A,B,C,D(5)且B早于C到达,括号内为进程的静态优先级。则采用FIFO为:D优先级最高先执行B,然后是B和C优先级相同,由于B早到达,所以先执行B再C,最后是优先级最低的A。执行顺序为DBCA.采用RR则仍然是先运行D,完毕后则交换运行B和C,运行完毕后是A。顺序为DBCBCA。 非实时调度普通进程动态优先级。 内核为普通进程计算动态优先级,根据此优先级为进程分配不同的时间片,此优先级只作为分配时间片的基础,不能够通过动态优先级高低抢占C
12、PU。每次当进程的时间片使用完后都会为其重新计算动态优先级及分配的时间片。 二、系统调用 Linux的每个系统调用都是通过一些宏、一张系统调用表、一个系统调用入口来完成。 宏 Linux为每个系统调用定义了一个唯一的编号,成为系统调用号。通过宏定义方式定义,例如#define _NR_setup 0。 Linux中系统调用号一旦分配就不可以再进行更改,否则已经编译好的木块将不能正常使用。即使删除的系统调用,也不可以把之前已经分配的系统调用号重新分配,删除的系统调用有相应的空处理。 系统调用表 系统调用表是一个函数指针数组,跳转时以系统调用号作为数组下表,找到相应的函数指针。 系统调用入口 系统
13、调用入口其实是由系统调用入口函数实现。功能是将系统调用号放入eax寄存器后移用int $0x80使处理器转向系统调用入口,查找系统调用表,进而执行内核调用真正的函数。 Linux系统调用实际是软中断。系统调用过程中,Linux首先通过执行相应的机器代码指令int $0x80产生一个软中断的异常处理信号,使系统自动从用户态切换到内核态。 三、中断机制 Linux中断主要分为硬中断和软中断两类。 IRQ主要分为:短类型IRQ和长类型IRQ。短类型IRQ需要很短的时间,在此期间机器的其他部分被锁定,而且不能发生其他中断被处理。长类型IRQ需要较长的时间,期间可能发生其他中断。 当用户程序被来自外部信
14、号中断后,立即保存现场工作,包括保存返回地址和用户寄存器等数据,然后查找中断向量表,找出相应的中断处理程序。系统将中断分为三种:捕俘、系统调用和外中断。捕俘:通过捕俘处理程序入口表查找到用户编写的处理程序执行。系统调用:软中断,通过系统调用表找到操作系统核心提供的服务例程。外中断:直接调用核心提供的外中断处理程序运行。 1、硬中断过程 Linux中,若一个硬件想向CPU发送中断信号,必须首先获得一个可用的“中断请求线”,产生一个中断信号后以电信号发送给中断控制器,接着CPU根据中断控制器的状态位判定中断的来源,获得中断号,根据中断号查找中断向量表,从表中获得中断处理函数的地址,然后跳转到中断函
15、数入口地址处,执行这个函数。 2、中断处理程序硬中断 中断处理程序主要做的工作: a. 保护未被硬件保护的一些必须的寄存器 b. 识别各个中断源,分析产生中断的原因 c. 处理发生的中断事件 d. 恢复正常的工作 Linux规定中断处理程序是不可重入的,指的是同一中断线上不可以再发生新的中断,因为所有的处理器都将原中断所在的中断线已经屏蔽。 Linux中同样规定了同一中断程序不能够并行,这样同一个中断处理程序不可以被同时调用来处理嵌套的中断。 Linux中将中断处理程序分为两部分:上半部和下半部。 上半部主要用来处理那些具有严格时限要求的任务。上半部可以看做是一个用来“登记中断”功能的函数,将
16、中断例程的下半部挂到下半部执行队列中。上半部要求执行很快,主要是因为上半部完全屏蔽中断下执行,即不可中断。 下半部主要用于处理那些可以稍后执行的任务。下半部是可中断的,当发生其他中断时,下半部可中断等待另外一个中断的上半部执行完毕后再继续执行。 3、下半部机制 Linux中提供了三种机制来实现下半部机制。 软中断 软中断是一组静态定义的下半部结构,使用数组来组织软中断结构体,共有32个。两个相同的软中断可以同时执行,必须在编译期间进行静态注册。 软中断机制一般都保留给系统中对时间要求最严格以及重要的下半部来使用。Linux2.6中只有两个子系统是通过软中断来实现的:网络子系统和SCSI。 ta
17、sklet tasklet要比软中断机制方便且简单,而且它本身也是基于软中断实现,属于软中断,既可以静态的创建tasklet,也可以动态的创建tasklet。 Linux中tasklet分为两类:HI_SOFTIRQ和TASKLET_IRQ,前者比后者的优先级要高,优先调用前者。在中断数组irq_desc中会分配两项给tasklet,即两种类型各占数组中一项。两者分别以一个链表来组织。 工作队列(work queue) 工作队列与前两者最大的不同之处是它是唯一一个能在进程上下文中运行的下半部机制,意味着它能允许睡眠。 工作队列的实质是将推后的工作交给一个内核线程来完成,核心思想即时创建一个内核
18、线程,Linux中已经默认提供了一种命名为enents一类工作者线程来实现工作队列。 4、中断的数据结构 Linux内核中定义了一个数组irq_desc数组来管理中断。数组中的每一项对应一个中断源。数组中的每个成员都为irq_desc_t结构体,即数组中的每一项对应着中断向量表中的一项。 irq_desc_t结构体 irq_desc_t结构体用来描述中断源。其中结构体中的handler指向hw_interrupt_type结构体的指针,action变量指向由irqaction结构体组成的单向链表的头的指针。 irqaction结构体 该结构体中指明内核接收到特定IRQ后该才去的动作。结构体中变
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- Linux 内核 实现 机制 概述
链接地址:https://www.31ppt.com/p-3160756.html