首页 > 技术文章 > 操作系统学习笔记「进程调度」

LemonSqueezz 2021-02-25 09:57 原文

调度的基本概念

调度:当有一堆任务要处理,但由于资源有限,无法同时处理。调度就是决定处理这些任务顺序规则

调度的三个层次

  • 高级调度(作业调度)

    高级调度是外存和内存之间的调度。每个作业只调入一次,调出一次。

    作业调度时会建立相应的PCB,作业调出时才撤销PCB

    ⚠️高级调度的时机由操作系统来决定

  • 中级调度(内存调度)

    为了提高内存利用率系统吞吐量,引入虚拟存储技术,将暂时不能运行的进程调至外存等待,等它重新具备了运行条件且内存有稍有空闲时,再重新调入内存。

    ⚠️暂时调到外存等待的进程状态为挂起状态。但是PCB并不会一起调到外存,而是常驻内存中,用于记录进程数据在外存中的存放位置、进程状态等信息

  • 低级调度(进程调度)

工作 调度发生的阶段 发生频率 对进程状态的影响
高级调度(作业调度) 按照规则,从后备队列中选择适合的作业将其调入内存,并为其创建进程 外存-->内存(面向作业) 最低 无--> 创建态--> 就绪态​
中级调度(内存调度) 按照规则,从挂起队列中选择合适的进程将其数据调回内存 外存-->内存(面向进程) 中等 挂起态--> 就绪态(阻塞挂起-->阻塞态)
低级调度(进程调度) 按照规则,从就绪队列中选择一个进程为其分配处理机 内存-->CPU 最高 就绪态--> 允许态

进程的挂起态和七状态模

graph LR 创建态 --> 就绪态 就绪态 --> 运行态 运行态 --> 终止态 运行态 --> 就绪态 创建态 --> 就绪挂起 就绪挂起 --激活--> 就绪态 就绪态 --挂起--> 就绪挂起 运行态--> 阻塞态 阻塞态 --> 就绪态 运行态 --> 就绪挂起 阻塞态 --挂起--> 阻塞挂起 阻塞挂起 --激活--> 阻塞态 阻塞挂起 --事件出现--> 就绪挂起

暂时调到外存等待的进程状态称为挂起状态(suspend)

挂起态又可以进一步细分为就绪挂起阻塞挂起两种状态

⚠️“挂起”和“阻塞”:两种状态都是暂时不能活的CPU服务,但是挂起态是将进程映像调到外存,而阻塞态下进程映像还在内存中

进程调度的时机

进程调度(低级调度),就是按照某种算法从就绪队列中选择一个进程为其分配处理机

需要进行进程调度与切换的情况

  • 当前运行的进程主动放弃处理机

    • 进程正常终止
    • 运行过程中发生异常而终止
    • 进程主动请求阻塞(如等待I/O)

    有的系统中,只允许进程主动放弃处理机

  • 当前运行的进程被动放弃处理机

    • 分给进程的时间片用完
    • 有更紧急的事需要处理( 如I/O中断)
    • 有更高优先级的进程进入就绪队列

    有的系统中,进程可以主动放弃处理机,当有更紧急的任务需要处理时,也会强制剥夺处理机(被动放弃)

不能进行进程调度与切换的情况

  1. 在处理中断的过程中。中断处理过程复杂,与硬件密切相关,很难做到在中断处理过程中进行进程切换。
  2. 进程在操作系统内核程序临界区中。
  3. 在原子操作过程中(原语)。原子操作不可中断,要一气呵成(如之前讲过的修改PCB中进程状态标志,并把PCB放到相应队列)

✅进程在操作系统内核程序临界区中不能进行调度与切换
❌进程处于临界区时不能进行处理机调度

进程切换与过程

狭义的进程调度进程切换的区别:

  • 狭义的进程调度指的是从就绪队列中选中一个要运行的进程

    这个进程可以是刚刚被暂停执行的进程,也可能是另一个进程,后一种情况就需要进程切换

  • 进程切换是指一个进程让出处理机,由另一个进程占用处理机的过程

广义的进程调度包含了选择一个进程和进程切换两个步骤

进程切换的过程主要完成:

  1. 对原来运行进程各种数据的保存
  2. 对新的进程各种数据的恢复

⚠️进程切换是有代价的,因此如果过于频繁的进行进程调度、切换,必然会使整个系统的效率降低,使系统大部分时间都花在了进程切换上,而真正用于执行进程的时间减少。

进程调度的方式

  • 非剥夺调度方式

    又称非抢占方式。只允许进程主动放弃处理机。在运行过程中即便有更紧迫的任务到达,当前进程依然会继续使用处理机,直到该进程终止或主动要求进入阻塞态。

  • 剥夺调度方式

    又称抢占方式。当一个进程正在处理机上执行时,如果有一个更重要或更紧迫的进程需要使用处理机,则立即暂停正在执行的进程,将处理机分配给更重要紧迫的那个进程

抢占方式可以优先处理更紧急的进程,也可实现让各进程按时间片轮流执行的功能(通过时钟中断)。适合于分时操作系统、实时操作系统


调度算法的评价指标

CPU利用率

由于早期的CPU造价极其昂贵,因此人们会希望让CPU尽可能多地工作

CPU利用率:指CPU“忙碌”的时间占总时间的比例

\[利用率 = \frac{忙碌的时间}{总时间} \]

例题:

某计算机只支持单道程序,某个作业刚开始需要在CPU上运行5秒,再用打印机打印输出5秒,之后再执行5秒才能结束。在此过程中,CPU利用率、打印机利用率分别是多少?

展开查看答案

CPU利用率 = (5+5)/(5+5+5) = 66.66%

打印机利用率 = 5 /15 = 33.33%

系统吞吐量

系统吞吐量:单位时间内完成作业的数量

\[系统吞吐量 = \frac{总共完成了多少道作业}{总共花了多少时间} \]

周转时间

周转时间:从作业被提交给系统开始,到作业完成为止的这段时间间隔

包括四个部分:

  • 作业在外存后备队列上等待作业调度(高级调度)的时间
  • 进程在就绪队列上等待进程调度(低级调度)的时间
  • 进程在CPU上执行的时间
  • 进程等待I/O操作完成的时间
  1. 周转时间、平均周转时间

    \[(作业)周转时间 = 作业完成时间 - 作业提交时间 \]

    对于用户来说,更关心自己的单个作业的周转时间

    \[平均周转时间 = \frac{各作业周转时间之和}{作业数} \]

    对于操作系统来说,更关心系统的整体表现,因此更关心所有作业周转时间的平均值

  2. 带权周转时间、平均带权周转时间

    \[带权周转时间 = \frac{作业周转时间}{作业实际运行时间} = \frac{作业完成时间 - 作业提交时间}{作业实际运行时间} \]

    带权周转时间必然$\ge$1

    带权周转时间与周转时间都不是越小越好

    \[平均带权周转时间 = \frac{各作业带权周转时间之和}{作业数} \]

对于周转时间相同的两个作业,实际运行时间长的作业在相同时间内被服务的时间更多带权周转时间更小,用户满意度更高

对于实际运行时间相同的两个作业,周转时间短的带权周转时间更小,用户满意度更高

等待时间

等待时间:指进程/作业处于等待处理机状态时间之和,等待时间越长,用户满意度越低。

平均等待时间:各个进程/作业等待时间的平均值

  1. 作业在后备队列等待被服务(调度)
  2. 作业调入内存后,建立对应的进程。这个进程会有等待被服务的时候
  • 对于进程来说,等待时间就是指进程建立后等待被服务的时间之和,等待I/O完成的期间其实进程也是在被服务的,所以不计入等待时间。
  • 对于作业来说,不仅要考虑建立进程后的等待时间,还要加上作业在外存后备队累中等待的时间

调度算法只会影响作业/进程的等待时间。

一个作业总共需要被CPU服务多久,被I/O设备服务多久一般是确定不变的

响应时间

响应时间:从用户提交请求首次产生响应所用的时间


调度算法

饥饿:某进程/作业长期得不到服务

先来先服务FCFS

  • 算法思想: 主要从“公平” 的角度考虑

  • 算法规则:按照作业到达的先后顺序进行服务

  • 既可用于作业调度,也可用与进程调度

    • 用于作业调度时,考虑的是哪个作业先到达后备队列
    • 用于进程调度时,考虑的是哪个进程先到达就绪队列
  • 非抢占算法

  • 优点:公平、算法实现简单

  • 缺点:排在长作业(进程)后面的短作业需要等待很长时间,带权周转时间很大,对短作业来说的用户体验不好。

  • 不会导致饥饿

FCFS算法对长作业有利,对短作业不利

短作业有限SJF

  • 算法思想:追求最少的平均等待时间,最少的平均周转时间、最少的平均带权周转时间

  • 算法规则:服务时间最短的作业优先得到服务

  • 既可用于作业调度,也可用与进程调度

    用于进程调度时称为“短进程有限SPF,Shortest Process First算法”

  • SJF和SPF是非抢占式的算法。但是也有抢占式的版本——最短剩余时间有限算法SRTN,Shortest Remaining Time Next

    最短剩余时间有限算法SRTN,Shortest Remaining Time Next

    • 算法思想:每当有进程加入,就绪队列改变时就需要调度,如果新到达的进程剩余时间比当前的运行的进程剩余时间更短,则由新进程抢占处理机,当前运行进程重新回到就绪队列。另外,当一个进程完成时也需要调度
  • 优点:“最短的”平均等待时间、平均周转时间

    所有进程几乎同时到达时,采用SJF调度算法的平均等待时间、平均周转时间最少

    ⚠️虽然严格来说,SJF的平均等待时间、平均周转时间并不一定最少,但是相对于其他算法(FCFS),SJF依然可以获得较少的平均等待时间、平均周转时间

  • 缺点

    • <不公平>对短作业有利,对长作业不利
    • 作业/进程的运行时间是由用户提供的,并不一定真实,不一定能做到真正的短作业优先
  • 会导致饥饿。如果源源不断地有短作业进来,可能使长作业长时间得不到服务,产生饥饿。如果一直得不到服务,则“饿死

高响应比优先HRRN

  • FCFS没有考虑到作业的运行时间,因此导致了对短作业不友好的问题
  • SJF完全不考虑各个作业的等待时间,因此导致了对长作业不友好的问题*,甚至还会造成饥饿
  • 算法思想:综合考虑作业的等待时间和要求服务的时间

  • 算法规则:在每次调度时先计算各个作业的响应比,选择响应比最高的作业为其服务

    \[响应比 = \frac{等待时间 + 要求服务时间}{要求服务时间} \]

  • 可用于作业调度,也可用于进程调度

  • 非抢占式的算法

    因此只有当前运行的作业主动放弃处理机时,才需要调度,才需要计算响应比

  • 优点综合考虑了等待时间和运行时间

    • 等待时间相同时,要求服务时间短的优先
    • 要求服务时间相同时,等待时间长的优先
  • 缺点:对于长作业来说,随着等待时间越来越久,其响应比也会越来越大,从而避免了长作业饥饿的问题

  • 不会导致饥饿


算法 思想和规则 是否可抢占 优点 缺点 是否会导致饥饿 是否考虑到等待时间和运行时间
FCFS 按照作业到达的先后顺序进行服务 公平、实现简单 对短作业不利 等待时间✅运行时间❌ 不会
SJF 服务时间最短的作业优先得到服务 “最短的”平均等待/周转时间 对长作业不利,可能导致饥饿;难以做到真正的短作业优先 等待时间❌运行时间✅
HRRN 综合考虑作业的等待时间和要求服务的时间 上述两种算法的权衡折中,综合考虑的等待时间和运行时间 等待时间✅运行时间✅ 不会

这几种算法主要关心用户的公平性、平均周转时间、平均等待时间等评价系统整体性能等指标,但是不关心“响应时间”,也不区分任务的紧急程度

这三种算法只适用于早期的批处理系统。FCFS算法也常结合其他的算法使用


时间片轮转RR,Round-Robin

轮流让就绪队列中的进程依次执行一个时间片(每次选择的都是排在就绪队列队头的进程)

RR算法常用于分时操作系统更注重“响应时间”

⚠️RR算法中的时间片划分

  • 如果时间片太大,则每个进程都可以在一个时间片内完成,则时间片轮转调度算法退化为先来先服务调度算法,并且会增大进程响应时间
  • 如果时间片太小,会导致进程切换过于频繁(进程调度、切换是有时间代价的),系统会花大量的时间来处理进程切换,从而导致实际用于进程执行的时间比例少
  • 算法思想:公平地、轮流地为各个进程服务,让每个进程在一定时间间隔内都可以得到响应

  • 算法规则:按照各进程到达就绪队列的顺序,轮流让各个进程执行一个时间片。若进程未在一个时间片内执行完,则剥离处理机,将进程重新放到就绪队列队尾重新排队。

  • 用于进度调度

    只有作业放入内存建立了相应的进程后码才能被分配处理机时间片

  • 抢占式算法

    由时钟装置发出时钟中断来通知CPU时间片已到

  • 优点:公平;响应快(适用于分时操作系统

  • 缺点:由于高频率的进程切换,因此有一定开销;不区分任务的紧急程度

  • 不会导致饥饿

优先级调度

每次调度时选择当时已到达优先级最高的进程。当前进程主动放弃处理机时发生调度。

就绪队列发生改变时也需要检查是否会发生抢占

就绪队列

  • 就绪队列未必只有一个,可以按照不同优先级来组织。
  • 可以把优先级高的进程排在更靠近队头的位置

根据优先级是否可以动态改变,可将优先级分为静态优先级动态优先级

  • 静态优先级:创建进程时确定,之后一直不变
  • 动态优先级:创建进程时有一个初始值,之后会根据情况动态地调整优先级

⚠️可以从追求公平、提升资源利用率的角度考虑:

  • 如果某进程在就绪队列中等待了很长时间,则可以适当提高其优先级
  • 如果某进程占用处理机运行了很长时间,则可以适当降低其优先级

通常:

  • 系统进程优先级高于用户进程
  • 前台进程优先级高于后台进程。

操作系统更偏好I/O型进程I/O繁忙型进程),而不是计算型进程CPU繁忙型进程

⚠️I/O设备和CPU设备可以并行工作。如果优先让I/O繁忙型进程优先运行的话,则越有可能让I/O设备尽早投入工作,则资源利用率、系统吞吐量都会得到提升

  • 算法思想:根据任务的紧急程度来决定处理顺序

  • 算法规则:调度时选择优先级最高的作业/进程

  • 既可用于作业调度,也可用于进程调度

    甚至,还会用于I/O调度

  • 抢占式、非抢占式都有

    非抢占式只需要在进程主动放弃处理机时进行调度

    抢占式还需在就绪队列变化时,检查是否会发生抢占

  • 优点:用优先级区分紧急程度、重要程度,适用于实时操作系统。可灵活地调整对各种作业/进程的偏好程度

  • 缺点:若源源不断地有高优先级进程到来,则可能导致饥饿

  • 会导致饥饿

多级反馈队列

  • 算法思想:对其他调度算法的折中权衡

  • 算法规则

    • 设置多级就绪队列,各级优先队列优先级高到低时间片小到大
    • 新进程到达时先进入第1级队列,按FCFS原则排队等待被分配时间片
      • 用完时间片仍未结束作业,则进程进入下一级队列队尾
      • 如果此时已经时在最下级的队列,则重新放回该队列队尾
    • 只有第k级队列为空时,才会为k+1级队头的进程分配时间片
    • 被抢占处理机的进程重新放回原队列队尾
  • 用于进程调度

  • 抢占式算法

    在k级队列的进程运行过程中,若更上级的队列(1 ~ k-1级)中进入了一个新进程,则由新进程处于优先级更高的队列中,因此新进程会抢占处理机,原来运行的进程放回k级队列队尾

  • 优点

    • 对各类型进程相对公平(FCFS的优先)

    • 每个新到达的进程都可以很快就得到响应(RR的优点)

    • 短进程只用较少的时间就可完成(SPF的优点)

    • 不必实现估计进程的运行时间(避免用户作假)

    • 可以灵活地调整对各类进程的偏好程度,比如CPU密集型进程、I/O密集型进程

      可以将因I/O而阻塞的进程重新放回原队列,这样I/O型进程就可以保持较高优先级

  • 会导致饥饿


算法 思想 是否可以抢占 优点 缺点 是否会导致饥饿
时间片轮转 公平地、轮流地为各个进程服务,让每个进程在一定时间间隔内都可以得到响应 抢占式 公平,适用于分时系统 频繁切换有开销,不区分优先级
优先级调度 根据任务的紧急程度来决定处理顺序 抢占式,也有非抢占式 区分优先级,适用于实时系统 可能导致饥饿
多级反馈队列 对其他调度算法的折中权衡 抢占式 平衡优秀 一般不说它有缺点,不过可能导致饥饿

这三种算法适合用于交互式系统


推荐阅读