首页 > 技术文章 > 第十三周

KG35 2015-12-06 22:53 原文

第十二章 并发编程

程序级并发——进程

函数级并发——线程

三种基本的构造并发程序的方法:

进程

每个逻辑控制流是一个进程,由内核进行调度,进程有独立的虚拟地址空间

I/O多路复用

逻辑流被模型化为状态机,所有流共享同一个地址空间

线程

运行在单一进程上下文中的逻辑流,由内核进行调度,共享同一个虚拟地址空间

第一节 基于进程的并发编程

构造并发程序最简单的方法——用进程

常用函数如下:

  • fork
  • exec
  • waitpid

构造并发服务器?

在父进程中接受客户端连接请求,然后创建一个新的子进程来为每个新客户端提供服务。

需要注意的事情:

1.父进程需要关闭它的已连接描述符的拷贝(子进程也需要关闭)

2.必须要包括一个SIGCHLD处理程序来回收僵死子进程的资源

3.父子进程之间共享文件表,但是不共享用户地址空间,这个在以前的学习过程中提到过

关于独立地址空间

1.优点:防止虚拟存储器被错误覆盖

2.缺点:开销高,共享状态信息才需要IPC机制

第二节 基于I/O多路复用的并发编程

就是使用select函数要求内核挂起进程,只有在一个或多个I/O事件发生后,才将控制返回给应用程序。

select函数处理类型为fd_set的集合,即描述符集合,并在逻辑上描述为一个大小为n的位向量,每一位b[k]对应描述符k,但当且仅当b[k]=1,描述符k才表明是描述符集合的一个元素。

描述符能做的三件事:

  • 分配他们
  • 将一个此种类型的变量赋值给另一个变量
  • 用FD_ZERO、FD_SET、FD_CLR和FD_ISSET宏指令来修改和检查它们

什么时候可以读?

当且仅当一个从该描述符读取一个字节的请求不会阻塞时

注意:

每次调用select函数时都需要更新读集合

一、基于I/O多路复用的并发事件驱动服务器

事件驱动程序:将逻辑流模型化为状态机。

状态机:

  • 状态
  • 输入事件
  • 转移

对于状态机的理解,参考EDA课程中学习的状态转换图的画法和状态机。

整体的流程是:

  • select函数检测到输入事件
  • add_client函数创建新状态机
  • check_clients函数执行状态转移(在课本的例题中是回送输入行),并且完成时删除该状态机。

几个需要注意的函数:

  • init_pool:初始化客户端池
  • add_client:添加一个新的客户端到活动客户端池中
  • check_clients:回送来自每个准备好的已连接描述符的一个文本行

二、I/O多路复用技术的优劣

1.优点

  • 相较基于进程的设计,给了程序员更多的对程序程序的控制
  • 运行在单一进程上下文中,所以每个逻辑流都可以访问该进程的全部地址空间,共享数据容易实现
  • 可以使用GDB调试
  • 高效

2.缺点

  • 编码复杂
  • 不能充分利用多核处理器

第三节 基于线程的并发编程

这种模式混合了以上两种方法

线程:就是运行在进程上下文中的逻辑流。

每个线程都有它自己的线程上下文

  • 一个唯一的整数线程ID——TID
  • 栈指针
  • 程序计数器
  • 通用目的寄存器
  • 条件码

一、线程执行模型

1.主线程

在每个进程开始生命周期时都是单一线程——主线程,与其他进程的区别仅有:它总是进程中第一个运行的线程。

2.对等线程

某时刻主线程创建,之后两个线程并发运行。

每个对等线程都能读写相同的共享数据。

3.主线程切换到对等线程的原因:

  • 主线程执行一个慢速系统调用,如read或sleep
  • 被系统的间隔计时器中断

切换方式是上下文切换

对等线程执行一段时间后会控制传递回主线程,以此类推

4.线程和进程的区别

  • 线程的上下文切换比进程快得多
  • 组织形式:
    • 进程:严格的父子层次
    • 线程:一个进程相关线程组成对等(线程)池,和其他进程的线程独立开来。一个线程可以杀死它的任意对等线程,或者等待他的任意对等线程终止。

二、Posix线程

Posix线程是C程序中处理线程的一个标准接口。基本用法是:

  • 线程的代码和本地数据被封装在一个线程例程
  • 每个线程例程都以一个通用指针为输入,并返回一个通用指针。

这里需要提到一个万能函数的概念。

万能函数:

void func(void parameter) typedef void (uf)(void para)

即,输入的是指针,指向真正想要传到函数里的数据,如果只有一个就直接让指针指向这个数据,如果是很多就将它们放到一个结构体中,让指针指向这个结构体。后面这个方法就是万能函数的使用思想。

线程例程也是这样的。

三、创建线程

1.创建线程:pthread_create函数

#include <pthread.h>
typedef void *(func)(void *);

int pthread_create(pthread_t *tid, pthread_attr_t *attr, func *f, void *arg);

成功返回0,出错返回非0

创建一个新的线程,带着一个输入变量arg,在新线程的上下文运行线程例程f

attr默认为NULL

参数tid中包含新创建线程的ID

2.查看线程ID——pthread_self函数

#include <pthread.h>

pthread_t pthread_self(void);

返回调用者的线程ID(TID)

四、终止线程

1.终止线程的几个方式:

  • 隐式终止:顶层的线程例程返回
  • 显示终止:调用pthread_exit函数 *如果主线程调用,会先等待所有其他对等线程终止,再终止主线程和整个进程,返回值为pthread_return
  • 某个对等线程调用Unix的exit函数,会终止进程与其相关线程
  • 另一个对等线程通过以当前线程ID作为参数调用pthread_cancle来终止当前线程

2.pthread_exit函数

#include <pthread.h>

void pthread_exit(void *thread_return);

若成功返回0,出错为非0

3.pthread_cancle函数

#include <pthread.h>

void pthread_cancle(pthread_t tid);

若成功返回0,出错为非0

五、回收已终止线程的资源

用pthread_join函数:

#include <pthread.h>

int pthread_join(pthread_t tid,void **thrad_return);

这个函数会阻塞,知道线程tid终止,将线程例程返回的(void*)指针赋值为thread_return指向的位置,然后回收已终止线程占用的所有存储器资源

六、分离线程

在任何一个时间点上,线程是可结合的,或是分离的。

1.可结合的线程

  • 能够被其他线程收回其资源和杀死
  • 被收回钱,它的存储器资源没有被释放
  • 每个可结合线程要么被其他线程显式的收回,要么通过调用pthread_detach函数被分离

2.分离的线程

  • 不能被其他线程回收或杀死
  • 存储器资源在它终止时由系统自动释放

3.pthread_detach函数

#include <pthread.h>

void pthread_detach(pthread_t tid);

若成功返回0,出错为非0

这个函数可以分离可结合线程tid。

线程能够通过以pthread_self()为参数的pthread_detach调用来分离他们自己。

每个对等线程都应该在他开始处理请求之前分离他自身,以使得系统能在它终止后回收它的存储器资源。

七、初始化线程:pthread_once函数

#include <pthread.h>
pthread_once_t once_control = PTHREAD_ONCE_INIT;

int pthread_once(pthread_once_t *once_control, void (*init_routine)(void));

总是返回0

八、基于线程的并发服务器中的注意事项

1.调用pthread_create时,如何将已连接描述符传递给对等进程?

传递指针。

2.竞争问题?

见第七节。

3.避免存储器泄露?

必须分离每个线程,使它终止时它的存储器资源能被收回。

推荐阅读