首页 > 技术文章 > C++多线程学习之(一)——并发与多线程

yuely 2018-03-16 17:22 原文

1 并发

计算机领域的并发指的是在单个系统里同时执行多个独立的任务,而非顺序地进行一些活动。

1.1 并发的途径

多进程并发:将应用程序分为多个独立的进程,它们在同一时刻运行,就像同时进行网页浏览和文字处理一样。独立的进程可以通过进程间常规的通信渠道传递讯息。

  • 缺点:操作系统会在进程间提供了一定的保护措施,以避免一个进程去修改另一个进程的数据。这导致进程之间的通信通常不是设置复杂,就是速度慢;

      运行多个进程需要时间启动进程,操作系统需要内部资源来管理进程。

  • 优点:操作系统在进程间提供附加的保护操作和更高级别的通信机制,意味着可以更容易编写安全的并发代码

      可以使用远程连接的方式,在不同的机器上运行独立的进程。

多线程并发:并发的另一个途径是在单个进程中运行多个线程。线程类似于轻量级的进程,每个线程相互独立运行,且线程可以在不同的指令序列中运行。

  • 缺点:缺少线程间的数据保护,如果数据要被多个线程访问,我们必须确保每个线程所访问的的数据是一致的,因此需要对线程通信做大量的工作。
  • 优点:进程中所有线程共享地址空间,并且缺少数据保护,使得操作系统的记录工作量减小,所以使用多线程的相关开销远远小于使用多个进程;单一进程中的多线程间的通信开销较小。

1.2 利用并发提高性能的方式

  • 任务并行(易并行):将一个单个任务分成几部分,并且各自并行运行,从而降低总运行时间。此种方法具有良好的可扩展性,当可用硬件线程的数量增加时,算法的并行性也随之增加。当可用硬件线程的数量增加时,算法的并行性也会随之增加。如果算法中有不易并行的部分,你可以把算法划分成固定(不可扩展)数量的并行任务。
  • 数据并行(可并行):每个线程在不同的数据部分上执行相同的操作。处理一个数据块仍然需要同样的时间,但在相同的时间内处理了更多的数据。这种方法所带来的吞吐量提升,可以让某些新功能成为可能。

2 多线程示例

经典的例子:打印出Hello World。

单线程中运行Hello World程序:

1 #include <iostream> 
2 int main()
3 {
4     std::cout << "Hello World!" << std::endl;
5

利用多线程,启动一个独立的线程显示Hello World:

 1 #include <iostream>
 2 #include <thread>
 3 void hello()
 4 {
 5     std::cout << "Hello World!" << std::endl;
 6 }
 7 
 8 int main()
 9 {
10     std::thread t(hello);
11     t.join();
12 }

 比较两个程序,可以看出一些差别:首先,增加了头文件 #include <thread> ,标准C++库中对多线程支持的声明在新的头文件中,管理线程的函数和类在 <thread> 中声明,而保护共享数据的函数和类在其它头文件中声明。其次,打印信息的代码被移动到了一个独立的函数中。因为每个线程都必须具有一个初始函数,新线程的执行从这里开始。对于应用程序而言,初始线程是 main() ,但是对于其它线程,可以在 std::thread 对象的构造函数中指定。除此之外,与直接写入标准输出或是从 main() 调用 hello() 不同,该程序启动了一个全新的线程来实现,将线程数量一分为二——初始线程始于 main(),而新线程始于 hello()。新的线程启动之后,初始线程继续执行,如果它不等新线程结束,它就将自顾自地继续运行到 main()的结束,从而结束程序,有可能发生在新线程运行之前。

本示例仅仅为了将一条信息写入标准输出而做了大量的工作,一般来说并不值得为了如此简单的任务而使用多线程,尤其是在此期间初始线程并没做什么。因为操作系统需要分配内核相关资源和堆栈空间,所以在启动线程时存在固有的开销,然后才能把新线程加入调度器中,所有这一切都需要时间。如果在线程上的任务完成得很快,那么任务实际执行的时间要比启动线程的时间小很多,这就会导致应用程序的整体性能还不如直接使用“产生线程”的方式。

推荐阅读