Windows核心编程008.pdf
《Windows核心编程008.pdf》由会员分享,可在线阅读,更多相关《Windows核心编程008.pdf(18页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、下载第8章用户方式中线程的同步当所有的线程在互相之间不需要进行通信的情况下就能够顺利地运行时,M i c r o s o f tWi n d o w s的运行性能最好。但是,线程很少能够在所有的时间都独立地进行操作。通常情况下,要生成一些线程来处理某个任务。当这个任务完成时,另一个线程必须了解这个情况。系统中的所有线程都必须拥有对各种系统资源的访问权,这些资源包括内存堆栈,串口,文件,窗口和许多其他资源。如果一个线程需要独占对资源的访问权,那么其他线程就无法完成它们的工作。反过来说,也不能让任何一个线程在任何时间都能访问所有的资源。如果在一个线程从内存块中读取数据时,另一个线程却想要将数据写入
2、同一个内存块,那么这就像你在读一本书时另一个人却在修改书中的内容一样。这样,书中的内容就会被搞得乱七八糟,结果什么也看不清楚。线程需要在下面两种情况下互相进行通信:当有多个线程访问共享资源而不使资源被破坏时。当一个线程需要将某个任务已经完成的情况通知另外一个或多个线程时。线程的同步包括许多方面的内容,下面几章将分别对它们进行介绍。值得高兴的是,Wi n d o w s提供了许多方法,可以非常容易地实现线程的同步。但是,要想随时了解一连串的线程想要做什么,那是非常困难的。我们的头脑的工作不是异步的,我们希望以一种有序的方式来思考许多事情,每次前进一步。不过多线程环境不是这样运行的。我是在大约1
3、9 9 2年的时候开始从事多线程的编程工作的。最初,我犯过许多编程错误,在我出版的书籍和杂志文章中实际上都存在着与线程同步相关的错误。现在我的编程工作熟练了许多,但是并未做到完美无缺。希望本书中的全部内容不存在任何错误(尽管现在我知道我可以做得更好些)。要搞好线程的同步,唯一的办法是通过实践。下面几章将要介绍系统是如何运行的,并展示如何实现线程的正确同步,不过应该面对这样一个问题:即取得经验的同时,难免要犯错误。8.1 原子访问:互锁的函数家族线程同步问题在很大程度上与原子访问有关,所谓原子访问,是指线程在访问资源时能够确保所有其他线程都不在同一时间内访问相同的资源。让我们来看一看下面这个简单
4、例子:在这个代码中,声明了一个全局变量 g _ x,并将它初始化为0。现在,假设创建两个线程,一个线程执行T h r e a d F u n c 1,另一个线程执行T h r e a d F u n c 2。这两个函数中的代码是相同的,它们都将1添加给全局变量g _ x。因此,当两个线程都停止运行时,你可能希望在 g _ x中看到2这个值。但是你真的看到了吗?回答是,也许看到了。根据代码的编写方法,你无法说明 g _ x中最终包含了什么东西。下面我们来说明为什么会出现这种情况。假设编译器生成了下面这行代码,以便将g _ x递增1:两个线程不可能在完全相同的时间内执行这个代码。因此,如果一个线程
5、在另一个线程的后面执行这个代码,那么下面就是实际的执行情况:当两个线程都将g _ x的值递增之后,g _ x中的值就变成了2。这很好,并且正是我们希望的:即取出零(0),两次将它递增1,得出的值为2。太好了。不过不要急,Wi n d o w s是个抢占式多线程环境。一个线程可以随时中断运行,而另一个线程则可以随时继续执行。这样,上面的代码就无法完全按编写的那样来运行。它可能按下面的形式运行:如果代码按这种形式来运行,g _ x中的最后值就不是2,而是你预期的1。这使人感到非常担心,因为你对调度程序的控制能力非常小。实际上,如果有 1 0 0个线程在执行相同的线程函数,当它们全部退出之后,g _
6、 x中的值可能仍然是1。显然,软件开发人员无法在这种环境中工作。我们希望在所有情况下两次递增0产生的结果都是2。另外,不要忘记,编译器生成代码的方法,哪个C P U在执行这个代码,以及主计算机中安装了多少个 C P U等因素,决定了产生的结果可能是不同的。这就是该环境的运行情况,我们对此无能为力。但是,Wi n d o w s确实提供了一些函数,如果正确地使用这些函数,就能确保产生应用程序的代码得到的结果。为了解决上面的问题,需要某种比较简单的方法。我们需要一种手段来保证值的递增能够以原子操作方式来进行,也就是不中断地进行。互锁的函数家族提供了我们需要的解决方案。互锁的函数尽管用处很大,而且很
7、容易理解,却有些让人望而生畏,大多数软件开发人员用得很少。所有的函数都能以原子操作方式对一个值进行操作。让我们看一看下面这个 I n t e r l o c k e dE x c h a n g e A d d函数:第 8章用户方式中线程的同步计计173下载这是个最简单的函数了。只需调用这个函数,传递一个长变量地址,并指明将这个值递增多少即可。但是这个函数能够保证值的递增以原子操作方式来完成。因此可以将上面的代码重新编写为下面的形式:通过这个小小的修改,g _ x就能以原子操作方式来递增,因此可以确保g _ x中的值最后是2。这样是不是感到好一些?注意,所有线程都应该设法通过调用这些函数来修改
8、共享的长变量,任何线程都不应该通过调用简单的C语句来修改共享的变量:互锁函数是如何运行的呢?答案取决于运行的是何种 C P U平台。对于x 8 6家族的C P U来说,互锁函数会对总线发出一个硬件信号,防止另一个 C P U访问同一个内存地址。在A l p h a平台上,互锁函数能够执行下列操作:1)打开C P U中的一个特殊的位标志,并注明被访问的内存地址。2)将内存的值读入一个寄存器。3)修改该寄存器。4)如果C P U中的特殊位标志是关闭的,则转入第二步。否则,特殊位标志仍然是打开的,寄存器的值重新存入内存。你也许会问,执行第4步时C P U中的特殊位标志是如何关闭的呢?答案是:如果系统
9、中的另一个C P U试图修改同一个内存地址,那么它就能够关闭 C P U的特殊位标志,从而导致互锁函数返回第二步。不必清楚地了解互锁函数是如何工作的。重要的是要知道,无论编译器怎样生成代码,无论计算机中安装了多少个C P U,它们都能保证以原子操作方式来修改一个值。还必须保证传递给这些函数的变量地址正确地对齐,否则这些函数就会运行失败(第 1 3章将介绍数据对齐问题)。对于互锁函数,需要了解的另一个重要问题是,它们运行的速度极快。调用一个互锁函数174计计第二部分编程的具体方法下载通常会导致执行几个C P U周期(通常小于5 0),并且不会从用户方式转换为内核方式(通常这需要执行1 0 0 0
10、个C P U周期)。当然,可以使用I n t e r l o c k e d E x c h a n g e A d d减去一个值只要为第二个参数传递一个负值。I n t e r l o c k e d E x c h a n g e A d d将返回在*p l A d d e n d中的原始值。下面是另外两个互锁函数:I n t e r l o c k e d E x c h a n g e和I n t e r l o c k e d E x c h a n g e P o i n t e r能够以原子操作方式用第二个参数中传递的值来取代第一个参数中传递的当前值。如果是 3 2位应用程序,两
11、个函数都能用另一个3 2位值取代一个3 2位值。但是,如果是个6 4位应用程序,那么I n t e r l o c k e d E x c h a n g e能够取代一个3 2位值,而I n t e r l o c k e d E x c h a n g e P o i n t e r则取代6 4位值。两个函数都返回原始值。当实现一个循环锁时,I n t e r l o c k e d E x c h a n g e是非常有用的:w h i l e循环是循环运行的,它将g _ f R e s o u r c e I n U s e中的值改为T R U E,并查看它的前一个值,以了解它是否是T
12、R U E。如果这个值原先是FA L S E,那么该资源并没有在使用,而是调用线程将它设置为在用状态并退出该循环。如果前一个值是T R U E,那么资源正在被另一个线程使用,w h i l e循环将继续循环运行。如果另一个线程要执行类似的代码,它将在 w h i l e循环中运行,直到g _ f R e s o u r c e I n U s e重新改为FA L S E。调用函数结尾处的I n t e r l o c k e d E x c h a n g e,可显示应该如何将g _ f R e s o u r c e I n U s e重新设置为FA L S E。当使用这个方法时必须格外小心
13、,因为循环锁会浪费 C P U时间。C P U必须不断地比较两个值,直到一个值由于另一个线程而“奇妙地”改变为止。另外,该代码假定使用循环锁的所有线程都以相同的优先级等级运行。也可以把执行循环锁的线程的优先级提高功能禁用(通过调用S e t P r o c e s s P r i o r i t y B o o s t或s e t T h r e a d P r i o r i t y B o o s t函数来实现之)。此外,应该保证将循环锁变量和循环锁保护的数据维护在不同的高速缓存行中(本章后面部分介绍)。如果循环锁变量与数据共享相同的高速缓存行,那么使用该资源的 C P U将与试图访问该资
14、源的任何C P U争用高速缓存行。第 8章用户方式中线程的同步计计175下载应该避免在单个C P U计算机上使用循环锁。如果一个线程正在循环运行,它就会浪费前一个C P U时间,这将防止另一个线程修改该值。我在上面的 w h i l e循环中使用了S l e e p,从而在某种程度上解决了浪费C P U时间的问题。如果使用 S l e e p,你可能想睡眠一个随机时间量;每次请求访问该资源均被拒绝时,你可能想进一步延长睡眠时间。这可以防止线程浪费 C P U时间。根据情况,最好是全部删除对S l e e p的调用。或者使用对S w i t c h To T h r e a d(Windows
15、98中没有这个函数)的调用来取代它。勇于试验和不断纠正错误,是学习的最好方法。循环锁假定,受保护的资源总是被访问较短的时间。这使它能够更加有效地循环运行,然后转为内核方式并进入等待状态。许多编程人员循环运行一定的次数(比如 4 0 0次),如果对资源的访问仍然被拒绝,那么该线程就转为内核方式,在这种方式下,它要等待(不消耗 C P U时间),直到该资源变为可供使用为止。这就是关键部分实现的方法。循环锁在多处理器计算机上非常有用,因为当一个线程循环运行的时候,另一个线程可以在另一个C P U上运行。但是,即使在这种情况下,也必须小心。不应该让线程循环运行太长的时间,也不能浪费更多的C P U时间
16、。本章后面将进一步介绍循环锁。第1 0章将介绍如何使用循环锁。下面是最后两个互锁函数:这两个函数负责执行一个原子测试和设置操作。如果是 3 2位应用程序,那么两个函数都在3 2位值上运行,但是,如果是6 4位应用程序,I n t e r l o c k e d C o m p a r e E x c h a n g e函数在3 2位值上运行,而I n t e r l o c k e d C o m p a r e E x c h a n g e P o i n t e r函数则在6 4位值上运行。在伪代码中,它的运行情况如下面所示:该函数对当前值(p l D e s t i n a t i o
17、 n参数指向的值)与l C o m p a r a n d参数中传递的值进行比较。如果两个值相同,那么*p l D e s t i n a t i o n改为l E x c h a n g e参数的值。如果*p l D e s t i n a t i o n中的值与l E x c h a n g e的值不匹配,*p l D e s t i n a t i o n保持不变。该函数返回*p l D e s t i n a t i o n中的原始值。记住,所有这些操作都是作为一个原子执行单位来进行的。没有任何互锁函数仅仅负责对值进行读取操作(而不改变这个值),因为这样的函数根本是不需要的。如果线程只
18、是试图读取值的内容,而这个值始终都由互锁函数来修改,那么被读取的值总是一个很好的值。虽然你不知道你读取的是原始值还是更新值,但是你知道它是这两个值中的一个。对于大多数应用程序来说,这一点很重要。此外,当要对共享内存区域(比如176计计第二部分编程的具体方法下载内存映象文件)中的值的访问进行同步时,互锁函数也可以供多进程中的线程使用(第 9章中包含了几个示例应用程序,以显示如何正确地使用互锁函数)。虽然Wi n d o w s还提供了另外几个互锁函数,但是上面介绍的这些函数能够实现其他函数能做的一切功能,甚至更多。下面是两个其他的函数:I n t e r l o c k e d E x c h
19、a n g e A d d函数能够取代这些较老的函数。新函数能够递增或递减任何值,老的函数只能加1或减1。8.2 高速缓存行如果想创建一个能够在多处理器计算机上运行的高性能应用程序,必须懂得 C P U的高速缓存行。当一个C P U从内存读取一个字节时,它不只是取出一个字节,它要取出足够的字节来填入高速缓存行。高速缓存行由 3 2或6 4个字节组成(视C P U而定),并且始终在第3 2个字节或第6 4个字节的边界上对齐。高速缓存行的作用是为了提高 C P U运行的性能。通常情况下,应用程序只能对一组相邻的字节进行处理。如果这些字节在高速缓存中,那么 C P U就不必访问内存总线,而访问内存总
20、线需要多得多的时间。但是,在多处理器环境中,高速缓存行使得内存的更新更加困难,下面这个例子就说明了这一点:1)CPU1读取一个字节,使该字节和它的相邻字节被读入C P U 1的高速缓存行。2)CPU2读取同一个字节,使得第一步中的相同的各个字节读入C P U 2的高速缓存行。3)CPU1修改内存中的该字节,使得该字节被写入C P U 1的高速缓存行。但是该信息尚未写入R A M。4)CPU2再次读取同一个字节。由于该字节已经放入C P U 2的高速缓存行,因此它不必访问内存。但是C P U 2将看不到内存中该字节的新值。这种情况会造成严重的后果。当然,芯片设计者非常清楚这个问题,并且设计它们的
21、芯片来处理这个问题。尤其是,当一个C P U修改高速缓存行中的字节时,计算机中的其他 C P U会被告知这个情况,它们的高速缓存行将变为无效。因此,在上面的情况下,C P U 2的高速缓存在C P U 1修改字节的值时变为无效。在第 4步中,C P U 1必须将它的高速缓存内容迅速转入内存,C P U 2必须再次访问内存,重新将数据填入它的高速缓存行。如你所见,高速缓存行能够帮助提高运行的速度,但是它们也可能是多处理器计算机上的一个不利因素。这一切意味着你应该将高速缓存行存储块中的和高速缓存行边界上的应用程序数据组合在一起。这样做的目的是确保不同的C P U能够访问至少由高速缓存行边界分开的不
22、同的内存地址。还有,应该将只读数据(或不常读的数据)与读写数据分开。同时,应该将同一时间访问的数据组合在一起。下面是设计得很差的数据结构的例子:下面是该结构的改进版本:第 8章用户方式中线程的同步计计177下载上面定义的C A C H E _ A L I G N宏是不错的,但是并不很好。问题是必须手工将每个成员变量的字节值输入该宏。如果增加、移动或删除数据成员,也必须更新对 C A C H E _ PA D宏的调用。将来,M i c r o s o f t的C/C+编译器将支持一种新句法,该句法可以更容易地调整数据成员。它的形式类似_ _ d e c l s p e c(a l i g n(3
23、 2)。注意最好是始终都让单个线程来访问数据(函数参数和局部变量是确保做到这一点的最好方法),或者始终让单个C P U访问这些数据(使用线程亲缘性)。如果采取其中的一种方法,就能够完全避免高速缓存行的各种问题。8.3 高级线程同步当必须以原子操作方式来修改单个值时,互锁函数家族是相当有用的。你肯定应该先试试它们。但是大多数实际工作中的编程问题要解决的是比单个3 2位或6 4位值复杂得多的数据结构。为了以原子操作方式使用更加复杂的数据结构,必须将互锁函数放在一边,使用 Wi n d o w s提供的其他某些特性。前面强调了不应该在单处理器计算机上使用循环锁,甚至在多处理器计算机上,也应该小心地使
24、用它们。原因是C P U时间非常宝贵,决不应该浪费。因此需要一种机制,使线程在等待访问共享资源时不浪费C P U时间。当线程想要访问共享资源,或者得到关于某个“特殊事件”的通知时,该线程必须调用一个操作系统函数,给它传递一些参数,以指明该线程正在等待什么。如果操作系统发现资源可供使用,或者该特殊事件已经发生,那么函数就返回,同时该线程保持可调度状态(该线程可以不必立即执行,它处于可调度状态,可以使用前一章介绍的原则将它分配给一个 C P U)。178计计第二部分编程的具体方法下载如果资源不能使用,或者特殊事件还没有发生,那么系统便使该线程处于等待状态,使该线程无法调度。这可以防止线程浪费 C
25、P U时间。当线程处于等待状态时,系统作为一个代理,代表你的线程来执行操作。系统能够记住你的线程需要什么,当资源可供使用的时候,便自动使该线程退出等待状态,该线程的运行将与特殊事件实现同步。从实际情况来看,大多数线程几乎总是处于等待状态。当系统发现所有线程有若干分钟均处于等待状态时,系统的强大的管理功能就会发挥作用。要避免使用的一种方法如果没有同步对象,并且操作系统不能发现各种特殊事件,那么线程就不得不使用下面要介绍的一种方法使自己与特殊事件保持同步。不过,由于操作系统具有支持线程同步的内置特性,因此决不应该使用这种方法。运用这种方法时,一个线程能够自己与另一个线程中的任务的完成实现同步,方法
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- Windows 核心 编程 008
限制150内