iOS多线程编程——GCD与NSOperation总结

很长时间以来,我个人(可能还有很多同学),对多线程编程都存在一些误解。一个很明显的表现是,很多人有这样的看法: 

新开一个线程,能提高速度,避免阻塞主线程

毕竟多线程嘛,几个线程一起跑任务,速度快,还不阻塞主线程,简直完美。

在某些场合,我们还见过另一个“高深”的名词——“异步”。这东西好像和多线程挺类似,经过一番百度(阅读了很多质量层次不齐的文章)之后,很多人也没能真正搞懂何为“异步”。

于是,带着对“多线程”和“异步”的懵懂,很多人又开开心心踏上了多线程编程之旅,比如文章待会儿会提到的GCD。

何为多线程

其实,如果不考虑其他任何因素和技术,多线程有百害而无一利,只能浪费时间,降低程序效率。

是的,我很清醒的写下这句话。

试想一下,一个任务由十个子任务组成。现在有两种方式完成这个任务:
1. 建十个线程,把每个子任务放在对应的线程中执行。执行完一个线程中的任务就切换到另一个线程。
2. 把十个任务放在一个线程里,按顺序执行。

操作系统的基础知识告诉我们,线程,是执行程序最基本的单元,它有自己栈和寄存器。说得再具体一些,线程就是“一个CPU执行的一条无分叉的命令列”

对于第一种方法,在十个线程之间来回切换,就意味着有十组栈和寄存器中的值需要不断地被备份、替换。
而对于对于第二种方法,只有一组寄存器和栈存在,显然效率完胜前者。

并发与并行

通过刚刚的分析我们看到,多线程本身会带来效率上的损失。准确来说,在处理并发任务时,多线程不仅不能提高效率,反而还会降低程序效率。

所谓的“并发”,英文翻译是concurrent。要注意和“并行(parallelism)”的区别。

并发指的是一种现象,一种经常出现,无可避免的现象。它描述的是“多个任务同时发生,需要被处理”这一现象。它的侧重点在于“发生”。

比如有很多人排队等待检票,这一现象就可以理解为并发。

并行指的是一种技术,一个同时处理多个任务的技术。它描述了一种能够同时处理多个任务的能力,侧重点在于“运行”。

比如景点开放了多个检票窗口,同一时间内能服务多个游客。这种情况可以理解为并行。

并行的反义词就是串行,表示任务必须按顺序来,一个一个执行,前一个执行完了才能执行后一个。

我们经常挂在嘴边的“多线程”,正是采用了并行技术,从而提高了执行效率。因为有多个线程,所以计算机的多个CPU可以同时工作,同时处理不同线程内的指令。

并发是一种现象,面对这一现象,我们首先创建多个线程,真正加快程序运行速度的,是并行技术。也就是让多个CPU同时工作。而多线程,是为了让多个CPU同时工作成为可能。

同步与异步

同步方法就是我们平时调用的哪些方法。因为任何有编程经验的人都知道,比如在第一行调用foo()方法,那么程序运行到第二行的时候,foo方法肯定是执行完了。

所谓的异步,就是允许在执行某一个任务时,函数立刻返回,但是真正要执行的任务稍后完成。

比如我们在点击保存按钮之后,要先把数据写到磁盘,然后更新UI。同步方法就是等到数据保存完再更新UI,而异步则是立刻从保存数据的方法返回并向后执行代码,同时真正用来保存数据的指令将在稍后执行。

区别和联系

假设现在有三个任务需要处理。假设单个CPU处理它们分别需要3、1、1秒。

并行与串行,其实讨论的是处理这三个任务的速度问题。如果三个CPU并行处理,那么一共只需要3秒。相比于串行处理,节约了两秒。

而同步/异步,其实描述的是任务之间先后顺序问题。假设需要三秒的那个是保存数据的任务,而另外两个是UI相关的任务。那么通过异步执行第一个任务,我们省去了三秒钟的卡顿时间。

对于同步执行的三个任务来说,系统倾向于在同一个线程里执行它们。因为即使开了三个线程,也得等他们分别在各自的线程中完成。并不能减少总的处理时间,反而徒增了线程切换(这就是文章开头举的例子)

对于异步执行的三个任务来说,系统倾向于在三个新的线程里执行他们。因为这样可以最大程度的利用CPU性能,提升程序运行效率。

总结

于是我们可以得出结论,在需要同时处理IO和UI的情况下,真正起作用的是异步,而不是多线程。可以不用多线程(因为处理UI非常快),但不能不用异步(否则的话至少要等IO结束)。

注意到我把“倾向于”这三个加粗了,也就是说异步方法并不一定永远在新线程里面执行,反之亦然。在接下来关于GCD的部分会对此做出解释。

GCD简介

GCD以block为基本单位,一个block中的代码可以为一个任务。下文中提到任务,可以理解为执行某个block

同时,GCD中有两大最重要的概念,分别是“队列”和“执行方式”。

使用block的过程,概括来说就是把block放进合适的队列,并选择合适的执行方式去执行block的过程。

三种队列:

  1. 串行队列(先进入队列的任务先出队列,每次只执行一个任务)
  2. 并行队列(依然是“先入先出”,不过可以形成多个任务并发)
  3. 主队列(这是一个特殊的串行队列,而且队列中的任务一定会在主线程中执行)

两种执行方式:

  1. 同步执行
  2. 异步执行

关于同步异步、串行并行和线程的关系,下面通过一个表格来总结

可以看到,同步方法不一定在本线程,异步方法方法也不一定新开线程(考虑主队列)。

然而事实上,在本文一开始就揭开了“多线程”的神秘面纱,所以我们在编程时,更应该考虑的是:

同步 Or 异步

以及

串行 Or 并行

而非仅仅考虑是否新开线程。

当然,了解任务运行在那个线程中也是为了更加深入的理解整个程序的运行情况,尤其是接下来要讨论的死锁问题。

GCD的死锁问题

在使用GCD的过程中,如果向当前串行队列中同步派发一个任务,就会导致死锁。

这句话有点绕,我们首先举个例子看看:

这段代码就会导致死锁,因为我们目前在主队列中,又将要同步地添加一个block到主队列(串行)中。

理论分析

我们知道dispatch_sync表示同步的执行任务,也就是说执行dispatch_sync后,当前队列会阻塞。而dispatch_sync中的block如果要在当前队列中执行,就得等待当前队列程执行完成。

在上面这个例子中,主队列在执行dispatch_sync,随后队列中新增一个任务block。因为主队列是同步队列,所以block要等dispatch_sync执行完才能执行,但是dispatch_sync是同步派发,要等block执行完才算是结束。在主队列中的两个任务互相等待,导致了死锁。

解决方案

其实在通常情况下我们不必要用dispatch_sync,因为dispatch_async能够更好的利用CPU,提升程序运行速度。

只有当我们需要保证队列中的任务必须顺序执行时,才考虑使用dispatch_sync。在使用dispatch_sync的时候应该分析当前处于哪个队列,以及任务会提交到哪个队列。

GCD任务组

了解完队列之后,很自然的会有一个想法:我们怎么知道所有任务都已经执行完了呢?

在单个串行队列中,这个不是问题,因为只要把回调block添加到队列末尾即可。

但是对于并行队列,以及多个串行、并行队列混合的情况,就需要使用dispatch_group了。

首先我们要通过dispatch_group_create()方法生成一个组。

接下来,我们把dispatch_async方法换成dispatch_group_async。这个方法多了一个参数,第一个参数填刚刚创建的分组。

想问dispatch_sync对应的分组方法是什么的童鞋面壁思过三秒钟,思考一下group出现的目的和dispatch_sync的特点。

最后调用dispatch_group_create方法。这个方法表示把第三个参数block传入第二个参数队列中去。而且可以保证第三个参数block执行时,group中的所有任务已经全部完成。

dispatch_group

dispatch_group_wait方法是一个很有用的方法,它的完整定义如下:

dispatch_group_wait(group: dispatch_group_t, _ timeout: dispatch_time_t) -> Int

第一个参数表示要等待的group,第二个则表示等待时间。返回值表示经过指定的等待时间,属于这个group的任务是否已经全部执行完,如果是则返回0,否则返回非0。

第二个dispatch_time_t类型的参数还有两个特殊值:DISPATCH_TIME_NOWDISPATCH_TIME_FOREVER

前者表示立刻检查属于这个group的任务是否已经完成,后者则表示一直等到属于这个group的任务全部完成。

dispatch_after方法

通过GCD还可以进行简单的定时操作,比如在1秒后执行某个block。代码如下:

dispatch_after方法有三个参数。第一个表示时间,也就是从现在起往后三秒钟。第二三个参数分别表示要提交的任务和提交到哪个队列。

需要注意的是和dispatch_after仅表示在指定时间后提交任务,而非执行任务。如果任务提交到主队列,它将在main runloop中执行,对于每隔1/60秒执行一次的RunLoop,任务最多有可能在3+1/60秒后执行。

NSOperation

NSOperationNSOperationQueue主要涉及这几个方面:

  1. NSOperation和和NSOperationQueue用法介绍
  2. NSOperation的暂停、恢复和取消
  3. 通过KVO对NSOperation的状态进行检测
  4. 多个NSOperation的之间的依赖关系

从简单意义上来说,NSOperation是对GCD中的block进行的封装,它也表示一个要被执行的任务。

与GCD中的block类似,NSOperation对象有一个start()方法表示开始执行这个任务。

不仅如此,NSOperation表示的任务还可以被取消。它还有三种状态isExecutedisFinishedisCancelled以方便我们通过KVC对它的状态进行监听。

想要开始执行一个任务可以这么写:

以上代码会得到这样的执行结果:

首先我们创建了一个NSBlockOperation,并且设置好它的block,也就是将要执行的任务。这个任务会在主线程中执行。

NSBlockOperation是因为NSOperation是一个基类,不应该直接生成NSOperation对象,而是应该用它的子类。NSBlockOperation是苹果预定义的子类,它可以用来封装一个或多个block,后面会介绍如何自己创建NSOperation的子类。

同时,还可以调用addExecutionBlock方法追加几个任务,这些任务会并行执行(也就是说很有可能运行在别的线程里)。

最后,调用start方法让NSOperation方法运行起来。start是一个同步方法。

NSOperationQueue

刚刚我们知道,默认的NSOperation是同步执行的。简单的看一下NSOperation类的定义会发现它有一个只读属性asynchronous

这意味着如果想要异步执行,就需要自定义NSOperation的子类。或者使用NSOperationQueue

NSOperationQueue类似于GCD中的队列。我们知道GCD中的队列有三种:主队列串行队列并行队列NSOperationQueue更简单,只有两种:主队列非主队列

我们自己生成的NSOperationQueue对象都是非主队列,主队列可以用NSOperationQueue.mainQueue取得。

NSOperationQueue的主队列是串行队列,而且其中所有NSOperation都会在主线程中执行。

对于非主队列来说,一旦一个NSOperation被放入其中,那这个NSOperation一定是并发执行的。因为NSOperationQueue会为每一个NSOperation创建线程并调用它的start方法。

NSOperationQueue有一个属性叫maxConcurrentOperationCount,它表示最多支持多少个NSOperation并发执行。如果maxConcurrentOperationCount被设为1,就以为这个队列是串行队列。

因此,NSOperationQueue和GCD中的队列有这样的对应关系:

回到开头的问题,如何利用NSOperationQueue实现异步操作呢,代码如下:

得到运行结果如下:

使用NSOperationQueue来执行任务与之前的区别在于,首先创建一个非主队列。然后用addOperation方法替换之前的start方法。刚刚已经说过,NSOperationQueue会为每一个NSOperation建立线程并调用他们的start方法。

观察一下运行结果,所有的NSOperation都没有在主线程执行,从而成功的实现了异步、并行处理。

NSOperation新特性

在学习NSOperation的时候,我们总是用GCD的概念去解释。但是NSOperation作为对GCD更高层次的封装,它有着一些GCD无法实现(或者至少说很难实现)的特性。由于NSOperationNSOperationQueue良好的封装,这些新特性的使用都非常简单。

取消任务

如果我们有两次网络请求,第二次请求会用到第一次的数据。如果此时网络情况不好,第一次请求超时了,那么第二次请求也没有必要发送了。当然,用户也有可能人为地取消某个NSOperation

当某个NSOperation被取消时,我们应该尽可能的清除NSOperation内部的数据并且把cancelledfinished设为true,把executing设为false

设置依赖

依然考虑刚刚所说的两次网络请求的例子。因为第二次请求会用到第一次的数据,所以我们要保证发出第二次请求的时候第一个请求已经执行完。但是我们同时还希望利用到NSOperationQueue的并发特性(因为可能不止这两个任务)。

这时候我们可以设置NSOperation之间的依赖关系。语法非常简洁:

需要注意的是NSOperation之间的相互依赖会导致死锁

NSOperationQueue暂停与恢复

这个更加简单,只要修改suspended属性即可

NSOperation优先级

GCD中,任务(block)是没有优先级的,而队列具有优先级。和GCD相反,我们一般考虑NSOperation的优先级

NSOperation有一个NSOperationQueuePriority枚举类型的属性queuePriority

需要注意的是,NSOperationQueue也不能完全保证优先级高的任务一定先执行。

NSOperation和GCD如何选择

其实经过这两篇文章的分析,我们大概对NSOperationGCD都有了比较详细的了解,同时在亲自运用这两者的过程中有了自己的理解。

GCD以block为单位,代码简洁。同时GCD中的队列、组、信号量、source、barriers都是组成并行编程的基本原语。对于一次性的计算,或是仅仅为了加快现有方法的运行速度,选择轻量化的GCD就更加方便。

NSOperation可以用来规划一组任务之间的依赖关系,设置它们的优先级,任务能被取消。队列可以暂停、恢复。NSOperation还可以被子类化。这些都是GCD所不具备的。

所以我们要记住的是:

NSOperation和GCD并不是互斥的,有效地结合两者可以开发出更棒的应用

GCD进阶

NSOperation有自己独特的优势,GCD也有一些强大的特性。接下来我们由浅入深,讨论以下几个部分:

  • dispatch_suspenddispatch_resume
  • dispathc_once
  • dispatch_barrier_async
  • dispatch_semaphore

dispatch_suspend和dispatch_resume

我们知道NSOperationQueue有暂停(suspend)和恢复(resume)。其实GCD中的队列也有类似的功能。用法也非常简单:

这些函数不会影响到队列中已经执行的任务,队列暂停后,已经添加到队列中但还没有执行的任务不会执行,直到队列被恢复。

dispathc_once

首先我们来看一下最简单的dispathc_once函数,这在单例模式中被广泛使用。

  • dispathc_once函数可以确保某个block在应用程序执行的过程中只被处理一次,而且它是线程安全的。所以单例模式可以很简单的实现,以OC中Manager类为例

这段代码中我们创建一个值为nil的sharedManagerInstance静态对象,然后把它的初始化代码放到dispatch_once中完成。

这样,只有第一次调用sharedInstance方法时才会进行对象的初始化,以后每次只是返回sharedManagerInstance而已。

dispatch_barrier_async

我们知道数据在写入时,不能在其他线程读取或写入。但是多个线程同时读取数据是没有问题的。所以我们可以把读取任务放入并行队列,把写入任务放入串行队列,并且保证写入任务执行过程中没有读取任务可以执行。

这样的需求比较常见,GCD提供了一个非常简单的解决办法——dispatch_barrier_async

假设我们有四个读取任务,在第二三个任务之间有一个写入任务,代码大概是这样:

如果代码这样写,由于这几个block是并发执行,就有可能在前两个block中读取到已经修改了的数据。如果是有多写入任务,那问题更严重,可能会有数据竞争。

如果使用dispatch_barrier_async函数,代码就可以这么写:

dispatch_barrier_async会把并行队列的运行周期分为这三个过程:

  1. 首先等目前追加到并行队列中所有任务都执行完成
  2. 开始执行dispatch_barrier_async中的任务,这时候即使向并行队列提交任务,也不会执行
  3. dispatch_barrier_async中的任务执行完成后,并行队列恢复正常。

总的来说,dispatch_barrier_async起到了“承上启下”的作用。它保证此前的任务都先于自己执行,此后的任务也迟于自己执行。正如barrier的含义一样,它起到了一个栅栏、或是分水岭的作用。

这样一来,使用并行队列和dispatc_barrier_async方法,就可以高效的进行数据和文件读写了。

dispatch_semaphore

首先介绍一下信号量(semaphore)的概念。信号量是持有计数的信号,不过这么解释等于没解释。我们举个生活中的例子来看看。

假设有一个房子,它对应进程的概念,房子里的人就对应着线程。一个进程可以包括多个线程。这个房子(进程)有很多资源,比如花园、客厅等,是所有人(线程)共享的。

但是有些地方,比如卧室,最多只有两个人能进去睡觉。怎么办呢,在卧室门口挂上两把钥匙。进去的人(线程)拿着钥匙进去,没有钥匙就不能进去,出来的时候把钥匙放回门口。

这时候,门口的钥匙数量就称为信号量(Semaphore)。很明显,信号量为0时需要等待,信号量不为零时,减去1而且不等待。

在GCD中,创建信号量的语法如下:

这句代码通过dispatch_semaphore_create方法创建一个信号量并设置初始值为2。然后就可以调用dispatch_semaphore_wait方法了。

dispatch_semaphore_wait方法表示一直等待直到信号量的值大于等于一,当这个方法执行后,会把第一个信号量参数的值减1。

第二个参数是一个dispatch_time_t类型的时间,它表示这个方法最大的等待时间。这在第一章中已经讲过,比如
DISPATCH_TIME_FOREVER表示永久等待。

返回值也和dispatch_group_wait方法一样,返回0表示在规定的等待时间内第一个参数信号量的值已经大于等于1,否则表示已超过规定等待时间,但信号量的值还是0。

dispatch_semaphore_wait方法返回0,因为此时的信号量的值大于等于一,任务获得了可以执行的权限。这时候我们就可以安全的执行需要进行排他控制的任务了。

任务结束时还需要调用
dispatch_semaphore_signal()方法,将信号量的值加1。这类似于之前所说的,从卧室出来要把锁放回门上,否则后来的人就无法进入了。

我们来看一个完整的例子:

如果你想知道不用信号量会出什么问题,可以看我的另一篇文章Swift数组append方法研究

1 7 收藏 评论

相关文章

可能感兴趣的话题



直接登录
跳到底部
返回顶部