复合资料文档文件格式解析-修复照片文件必备学习知识.doc
.复合文档文件格式研究复合文档(Compound Document)是一种不仅包含文本而且包括图形、电子表格数据、声音、视频图象以及其它信息的文档。可以把复合文档想象成一个所有者,它装着文本、图形以及多媒体信息如声音和图象。目前建立复合文档的趋势是使用面向对象技术,在这里,非标准信息如图像和声音可以作为独立的、自包含式对象包含在文档中。Microsoft Windows就是使用这种技术,叫做“OLE2 storage file format”或“Microsoft Office compatible storage file format”。当然Excel、Word等都是用这种格式存储的。本文主要研究复合文档的二进制结构,本文的目的就是为另一篇文章Excel文件格式研究(创作中)做准备的。本文是在英文资料的基础上完成的,文中某些术语的翻译可能不够标准,但都会给出英文原名。关于这方面的中文资料网上几乎找不到,如果您有的话,请发到我的邮箱,谢谢。由于本人水平有限,文中错误难免,欢迎大家批评指正。目 录第一章 仓库与流(Storages and Streams第二章 扇区与扇区链(Sectors and Sector Chains第三章 复合文档头(Compound Document Header第四章 扇区配置(Sector Allocation第五章 短流(Short-Streams第六章 目录(Directory第七章 文件实例剖析第一章仓库与流复合文档的原理就像一个文件系统(文件系统:如FAT与NTFS)。复合文档将数据分成许多流(Streams),这些流又存储在不同的仓库(Storages)里。将复合文档想象成你的D盘,D盘用的是NTFS(NT File System)格式,流就相当于D盘里的文件,仓库就相当于D盘里的文件夹。流和仓库的命名规则与文件系统相似,同一个仓库下的流及仓库不能重名,不同仓库下可以有同名的流。每个复合文档都有一个根仓库(root storage)第二章扇区与扇区链2.1 扇区与扇区标识所有的流又分成更小的数据块,叫做数据扇区(sectors)。Sectors 可能包含控制数据或用户数据。整个文件由一个头(Header)结构以及其后的所有Sectors组成。Sectors的大小在头中确定,且每个Sectors的大小都相同。以下为示意图:HEADERSECTOR 0SECTOR 1SECTOR 2SECTOR 3SECTOR 4SECTOR 5SECTOR 6Sectors 简单的以其在文件中的顺序列举,一个扇区的索引(从0开始)叫做扇区标识(SID:sector identifier)。SID是一个有符号的32位的整型值。如果一个SID的值非负,就表示真正存在的那个Sector;如果为负,就表示特殊的含义。下表给出有效的特殊SID:SIDNameMeaning-1Free SID空闲sector,可存在于文件中,但不是任何流的组成部分。-2End Of Chain SIDSID链的结束标记 (见2.2节)-3SAT SID此Sector用于存放扇区配置表(SAT)(见4.2节)-4MSAT SID此Sector用于存放主扇区配置表(MSAT)(见4.1节)2.2 扇区链与扇区标识链用于存储流数据的所有Sectors的列表叫做扇区链(Sector Chain)。这些 Sectors 可以是无序的。因此用于指定一个流的 Sectors 的顺序的SID 数组就称为 SID chain 。一个 SID chain 总是以 End Of Chain SID(2)为结束标记。例:一个流由4个Sector组成,其链为1, 6, 3, 5, 2流的SID链是通过扇区配置表构建的(见4.2节),但短流和以下两种内部流除外:1主扇区配置表,其从自身构建SID链(每个扇区包含下一个扇区的SID)。2扇区配置表,其通过主扇区配置表构建链。第三章复合文档头3.1 复合文档头的内容复合文档头在文件的开始,且其大小必定为512字节。这意味着第一个Sector的开始相对文件的偏移量为512字节。复合文档头的结构如下:OffsetSizeContents08复合文档文件标识:D0H CFH 11H E0H A1H B1H 1AH E1H816此文件的唯一标识(不重要, 可全部为0)242文件格式修订号 (一般为003EH)262文件格式版本号(一般为0003H)282字节顺序规则标识(见3.2)::FEH FFH = Little-EndianFFH FEH = Big-Endian302复合文档中sector的大小(ssz),以2的幂形式存储, sector实际大小为s_size = 2ssz 字节(一般为9即512字节, 最小值为7即128字节)322short-sector的大小(见5.1),以2的幂形式存储, short-sector实际大小为s_s_size = 2sssz 字节(一般为6即64字节,最大为sector的大小)3410Not used444用于存放扇区配置表(SAT)的sector总数484用于存放目录流的第一个sector的SID (见6)524Not used564标准流的最小大小(一般为4096 bytes), 小于此值的流即为短流。604用于存放短扇区配置表(SSAT)的第一个sector的SID (见5.2),或为2 (End Of Chain SID)如不存在。644用于存放短扇区配置表(SSAT)的sector总数684用于存放主扇区配置表(MSAT)的第一个sector的SID (见4.1),或为2 (End Of Chain SID) 若无附加的sectors724用于存放主扇区配置表(MSAT)的sector总数76436存放主扇区配置表(MSAT)的第一部分,包含109个SID。3.2 字节顺序(Byte Order)文件数据的二进制存储有两种方法Little-Endian 和 Big-Endian,但实际应用中只使用Little-Endian方法即:低位8字节存放在地址的低位,高位8字节存放在地址的高位。例:一个32位的整数13579BDFH(转为十进制即324508639),以Little-Endian存放为DFH 9BH 57H13H,以Big-Endian 存放为 13H 57H 9BH DFH。(H下标表示十六进制)3.3 扇区偏移量从头中的信息可以计算出一个sector的偏移量(offset),公式为:sec_pos(SID) = 512 + SID * s_size = 512 + SID * 2 ssz例:ssz = 10 and SID = 5:sec_pos(SID) = 512 + SID * 2 ssz = 512 + 5 * 210 = 512 + 5 * 1024 = 5632.第四章扇区配置4.1 主扇区配置表主扇区配置表(MSAT:master sector allocation table)是一个SID数组,指明了所有用于存放扇区配置表(SAT:sector allocation table)的sector的SID。MSAT的大小(SID个数)就等于存放SAT的sector数,在头中指明。MSAT的前109个SID也存放于头中,如果一个MSAT的SID数多余109个,那么多出来的SID将存放于sector中,头中已经指明了用于存放MSAT的第一个sector的SID。在用于存放MSAT的sector中的最后一个SID指向下一个用于存放MSAT的sector,如果没有下一个则为End Of Chain SID(-2)。存放MSAT的sector的内容:(s_size表示sector的大小)OffsetSizeContents0s_size4MSAT的(s_size4) / 4个SID的数组s_size44下一个用于存放MSAT的sector的SID,或2(已为最后一个)最后一个存放MSAT的sector可能未被完全填满,空闲的地方将被填上Free SID(-1)。例:一个复合文档需要300个sector用于存放SAT,头中指定sector的大小为512字节,这说明一个sector可存放128个SID。MAST有300个SID,前109个放于头中,其余的191个将要占用2个sector来存放。此例假定第一个存放MSAT的sector为sector 1,则sector 1包含127个SID。第128个SID指向一个用于存放MSAT的sector,假定为sector 6,则sector 6包含剩下的64个SID(最后一个SID为2,其他的值为1)。4.2 扇区配置表扇区配置表(SAT:sector allocation table)是一个SID数组,包含所有用户流(短流除外)和内部控制流(the short-stream container stream, 见5.1, the short-sector allocation table, 见5.2, and the directory, 见7)的SID链。SAT的大小(SID个数)就等于复合文档中所存在的sector的个数。SAT的建立就是通过按顺序读取MSAT中指定的sector中的内容。存放SAT的sector的内容:(s_size表示sector的大小)OffsetSizeContents0s_sizeSAT的s_size / 4个SID的数组当通过SAT为一个流创建SID链时,SAT数组的当前位置(array index)表示的就是当前的sector,而该位置存放的SID则指向下一个sector。SAT可能在任意位置包含Free SID(1),这些sector将不被流使用。如果该位置包含End Of Chain SID(2)表示一个流的结束。如果sector用于存放SAT则为SAT SID(3),同样用于存放MSAT则为MSAT SID(4)。一个SID链的起点从用户流的目录入口(directory entry,见6.2节)或头(内部控制流)或目录流本身获得。例:一个复合文档包含一个用于存放SAT的sector(sector 1)和2个流。Sector 1的内容如下图:在位置1其值为3,表明Sector 1是SAT的一部分。其中一个流为内部目录流,假定头中指定其开始为Sector 0,SAT中位置0的值为2,位置2的值为3,位置3 的值为2。因此目录流的SID链为0, 2, 3, 2,即此目录流存放于3个sector中。目录中包含一个用户流的入口假定为sector 10,从图中可看出此流的SID链为10, 6, 7, 8, 9, 2。第五章短流5.1 短流存放流当一个流的大小小于指定的值(在头中指定),就称为短流(short-stream)。短流并不是直接使用sector存放数据,而是内含在一种特殊的内部控制流短流存放流(short-stream container stream)中。短流存放流象其他的用户流一样:先从目录中的根仓库入口(root storage entry)获得第一个使用的sector,其SID链从SAT中获得。然后此流将其所占用的sectors分成short-sector,以便用来存放短流。此处也许较难理解,我们来打个比方:既然流组成符合文档,而短流组成短流存放流,这两者是相似的。把短流存放流当作复合文档,那么短流对应流,short-sector对应sector,唯一的不同是复合文档有一个头结构,而短流存放流没有。short-sector的大小在头中已经指定,因此可根据SID计算short-sector相对于短流存放流的偏移量(offset)。公式为:short_s_pos(SID) = SID ? short_s_size = SID ? 2 sssz例:sssz = 6 and SID = 5:short_s_pos(SID) = SID ? 2 sssz = 5 ? 26 = 5 ? 64 = 320.5.2 短扇区配置表短扇区配置表(SSAT:short-sector allocation table)是一个SID数组,包含所有短流的SID链。与SAT很相似。用于存放SSAT的第一个sector的SID在头中指定,其余的SID链从SAT中获得。OffsetSizeContents0s_sizeSSAT的s_size / 4个SID的数组SSAT的用法与SAT类似,不同的是其SID链引用的是short-sector。六章目录6.1 目录结构目录(directory)是一种内部控制流,由一系列目录入口(directory entry)组成。每一个目录入口都指向复合文档的一个仓库或流。目录入口以其在目录流中出现的顺序被列举,一个以0开始的目录入口索引称为目录入口标识(DID: directory entry identifier)。如下图所示:DIRECTORY ENTRY 0DIRECTORY ENTRY 1DIRECTORY ENTRY 2DIRECTORY ENTRY 3|目录入口的位置不因其指向的仓库或流的存在与否而改变。如果一个仓库或流被删除了,其相应的目录入口就标记为空。在目录的开始有一个特殊的目录入口,叫做根仓库入口(root storage entry),其指向根仓库。目录将每个仓库的直接成员(仓库或流)放在一个独立的红黑树(red-black tree)中。红黑树是一种树状的数据结构,本文仅简单介绍一下,详细情况请参考有关资料。建构一个Red-Black tree的规则:1. 每个节点(node)的颜色属性不是红就是黑。2. 根节点一定是黑的。3. 如果某个节点是红的,那它的子节点一定是黑的。4. 从根节点到每个叶节点的路径(path)必须有相同数目的黑节点。注意并不总是执行上述规则。安全的方法是忽略节点的颜色。例:以第一章中的图为例1.根仓库入口描述根仓库,它不是任何仓库入口的成员,因此无需构建红黑树。2.根仓库的所有直接成员(“Storage1”, “Storage2”, “Stream1”, “Stream2”, “Stream3”, 和 “Stream4”)将组成一棵红黑树,其根节点的DID存放于根仓库入口中。3.仓库Storage1只有一个成员Stream1,Stream1构成一棵红黑树,此树只有一个节点。Storage1的目录入口包含Stream1的DID。4. 仓库Storage2包含3个成员“Stream21”, “Stream22”, 和“Stream23”。这3个成员将构建一棵红黑树,其根节点的DID存放于Storage2的目录入口中。这种存放规则将导致每个目录入口都包含3个DID:1.在包含此目录入口的红黑树中,此目录入口的左节点的DID。2.在包含此目录入口的红黑树中,此目录入口的右节点的DID。3.若此目录入口表示一个仓库,则还包含此仓库的直接成员所组成的另一颗红黑树的根节点的DID。在构建红黑树的过程中,一个节点究竟作为左还是右,是通过比较其名字来判断的。一个节点比另一个小是指其名字的长度更短,如长度一样,则逐字符比较。规定:左节点根节点右节点。6.2 目录入口一个目录入口的大小严格地为128字节,计算其相对目录流的偏移量的公式为:dir_entry_pos(DID) = DID ? 128。目录入口的内容:OffsetSizeContents064此入口的名字(字符数组), 一般为16位的Unicode字符,以0结束。(因此最大长度为31个字符)642用于存放名字的区域的大小,包括结尾的0。(如:一个名字右5个字符则此值为(5+1)?2 = 12)661入口类型: 00H = Empty 03H = LockBytes (unknown) 01H = User storage 04H = Property (unknown) 02H = User stream 05H = Root storage671此入口的节点颜色: 00H = Red 01H = Black684其左节点的DID (若此入口为一个user storage or stream),若没有左节点就为1。724其右节点的DID (若此入口为一个user storage or stream),若没有右节点就为1。764其成员红黑树的根节点的DID (若此入口为storage), 其他为1。8016唯一标识符(若为storage)(不重要, 可能全为0)964用户标记(不重要, 可能全为0)1008创建此入口的时间标记。大多数情况都不写。1088最后修改此入口的时间标记。大多数情况都不写。1164若此为流的入口,指定流的第一个sector或short-sector的SID,若此为根仓库入口,指定短流存放流的第一个sector的SID,其他情况,为0。1204若此为流的入口,指定流的大小(字节)若此为根仓库入口,指定短流存放流的大小(字节)其他情况,为0。1244Not used时间标记(time stamp) 是一个符号的64位的整数,表示从1601-01-01 00:00:00开始的时间值。此值的单位为107秒。 当计算时间标记是要注意闰年。例:时间标记值为01AE408B10149C00H计算步骤公式结果转为十进制t0= 121,105,206,000,000,000化成秒的余数rfrac = t0 mod 10的7次方rfrac = 0化成秒的整数t1 = t0 / 10的7次方t1 = 12,110,520,600化成分的余数rsec = t1 mod 60rsec = 0化成分的整数t2 = t1 / 60t2 = 201,842,010化成小时的余数rmin = t2 mod 60rmin = 30化成小时的整数t3 = t2 / 60t3 = 3,364,033化成天的余数rhour = t3 mod 24rhour = 1化成天的整数t4 = t3 / 24t4 = 140,168距1601-01-01的整年ryear = 1601 + t4含的年ryear = 1601 + 383 = 1984到1984年还剩的天数t5 = t4 (1601-01-01到1984-01-01的天数)t5 =140,168 139,887 = 281距1984-01-01的月数rmonth = 1 + t5含的月数rmonth = 1 + 9 = 10到10月还剩的天数t6 = t5 (1984-01-01到1984-10-01的天数)t6 = 281 274 = 710月最终天数rday = 1 + t6rday = 1 + 7 = 8最后的结果为1984-10-8 01:30:00。猜猜看这是什么日子.第七章 Excel文件实例剖析这章我们以一个Excel文件作为实例来分析其二进制结构。看实例永远是最好的学习方法,呵呵。1.复合文档头首先,读取此文件头,假定此Excel文件的头(512字节)内容如下:00000000H D0 CF 11 E0 A1 B1 1A E1 00 00 00 00 00 00 00 0000000010H 00 00 00 00 00 00 00 00 3B 00 03 00 FE FF 09 0000000020H 06 00 00 00 00 00 00 00 00 00 00 00 01 00 00 0000000030H 0A 00 00 00 00 00 00 00 00 10 00 00 02 00 00 0000000040H 01 00 00 00 FE FF FF FF 00 00 00 00 00 00 00 0000000050H FF FF FF FF FF FF FF FF FF FF FF FF FF FF FF FF00000060H FF FF FF FF FF FF FF FF FF FF FF FF FF FF FF FF00000070H FF FF FF FF FF FF FF FF FF FF FF FF FF FF FF FF00000080H FF FF FF FF FF FF FF FF FF FF FF FF FF FF FF FF00000090H FF FF FF FF FF FF FF FF FF FF FF FF FF FF FF FF000000A0H FF FF FF FF FF FF FF FF FF FF FF FF FF FF FF FF000000B0H FF FF FF FF FF FF FF FF FF FF FF FF FF FF FF FF000000C0H FF FF FF FF FF FF FF FF FF FF FF FF FF FF FF FF000000D0H FF FF FF FF FF FF FF FF FF FF FF FF FF FF FF FF000000E0H FF FF FF FF FF FF FF FF FF FF FF FF FF FF FF FF000000F0H FF FF FF FF FF FF FF FF FF FF FF FF FF FF FF FF00000100H FF FF FF FF FF FF FF FF FF FF FF FF FF FF FF FF00000110H FF FF FF FF FF FF FF FF FF FF FF FF FF FF FF FF00000120H FF FF FF FF FF FF FF FF FF FF FF FF FF FF FF FF00000130H FF FF FF FF FF FF FF FF FF FF FF FF FF FF FF FF00000140H FF FF FF FF FF FF FF FF FF FF FF FF FF FF FF FF00000150H FF FF FF FF FF FF FF FF FF FF FF FF FF FF FF FF00000160H FF FF FF FF FF FF FF FF FF FF FF FF FF FF FF FF00000170H FF FF FF FF FF FF FF FF FF FF FF FF FF FF FF FF00000180H FF FF FF FF FF FF FF FF FF FF FF FF FF FF FF FF00000190H FF FF FF FF FF FF FF FF FF FF FF FF FF FF FF FF000001A0H FF FF FF FF FF FF FF FF FF FF FF FF FF FF FF FF000001B0H FF FF FF FF FF FF FF FF FF FF FF FF FF FF FF FF000001C0H FF FF FF FF FF FF FF FF FF FF FF FF FF FF FF FF000001D0H FF FF FF FF FF FF FF FF FF FF FF FF FF FF FF FF000001E0H FF FF FF FF FF FF FF FF FF FF FF FF FF FF FF FF000001F0H FF FF FF FF FF FF FF FF FF FF FF FF FF FF FF FF1)前8个字节是固定的标识,表示这是一个复合文档文件。2)接着16个字节是唯一标识,其后的4个字节表示修订号和版本号,可不用管它。3)接下来的2个字节是字节顺序(Byte Order)标识符,总是FEH FFH。4)接着的2个字节表示sector的大小,再2个字节表示short-sector的大小。分别是29=512字节和26=64字节。5)接着的10个字节无有效数据,可忽略。6)接着的4个字节表示用于存放扇区配置表(SAT)的sector总数,此例为1个。7)接着的4个字节表示用于存放目录流的第一个sector的SID,这里为sector 10。8)接着的4个字节无有效数据,可忽略。9)接着的4个字节表示标准流的最小大小,这里为00001000H = 4096字节。10)接着的4个字节表示用于存放短扇区配置表(SSAT)的第一个sector的SID,其后4个字节表示用于存放短扇区配置表(SSAT)的sector总数,这里SSAT从sector 2开始,并只占用1个sector。11)接着的4个字节表示用于存放主扇区配置表(MSAT)的第一个sector的SID,其后的4个字节表示用于存放主扇区配置表(MSAT)的sector总数,这里SID为2,说明没有附加的sector用于存放MSAT。12)最后的436个字节包含MSAT的前109个SID。只有第一个SID有效,因为上面已经说了SAT只占用1个sector。从这里可看出为sector 0。其他的SID标记为Free SID值为1。2. 主扇区配置表头中已经包含整个MSAT,其SID链为0,2。3. 扇区配置表在此例中扇区配置表仅占用sector 0,它开始于文件偏移量为00000200H = 512字节处。假定内容如下:00000200H FD FF FF FF FF FF FF FF FE FF FF FF 04 00 00 0000000210H 05 00 00 00 06 00 00 00 07 00 00 00 08 00 00 0000000220H 09 00 00 00 FE FF FF FF 0B 00 00 00 FE FF FF FF00000230H FF FF FF FF FF FF FF FF FF FF FF FF FF FF FF FF00000240H FF FF FF FF FF FF FF FF FF FF FF FF FF FF FF FF00000250H FF FF FF FF FF FF FF FF FF FF FF FF FF FF FF FF00000260H FF FF FF FF FF FF FF FF FF FF FF FF FF FF FF FF00000270H FF FF FF FF FF FF FF FF FF FF FF FF FF FF FF FF00000280H FF FF FF FF FF FF FF FF FF FF FF FF FF FF FF FF00000290H FF FF FF FF FF FF FF FF FF FF FF FF FF FF FF FF000002A0H FF FF FF FF FF FF FF FF FF FF FF FF FF FF FF FF000002B0H FF FF FF FF FF FF FF FF FF FF FF FF FF FF FF FF000002C0H FF FF FF FF FF FF FF FF FF FF FF FF FF FF FF FF000002D0H FF FF FF FF FF FF FF FF FF FF FF FF FF FF FF FF000002E0H FF FF FF FF FF FF FF FF FF FF FF FF FF FF FF FF000002F0H FF FF FF FF FF FF FF FF FF FF FF FF FF FF FF FF00000300H FF FF FF FF FF FF FF FF FF FF FF FF FF FF FF FF00000310H FF FF FF FF FF FF FF FF FF FF FF FF FF FF FF FF00000320H FF FF FF FF FF FF FF FF FF FF FF FF FF FF FF FF00000330H FF FF FF FF FF FF FF FF FF FF FF FF FF FF FF FF00000340H FF FF FF FF FF FF FF FF FF FF FF FF FF FF FF FF00000350H FF FF FF FF FF FF FF FF FF FF FF FF FF FF FF FF00000360H FF FF FF FF FF FF FF FF FF FF FF FF FF FF FF FF00000370H FF FF FF FF FF FF FF FF FF FF FF FF FF FF FF FF00000380H FF FF FF FF FF FF FF FF FF FF FF FF FF FF FF FF00000390H FF FF FF FF FF FF FF FF FF FF FF FF FF FF FF FF000003A0H FF FF FF FF FF FF FF FF FF FF FF FF FF FF FF FF000003B0H FF FF FF FF FF FF FF FF FF FF FF FF FF FF FF FF000003C0H FF FF FF FF FF FF FF FF FF FF FF FF FF FF FF FF000003D0H FF FF FF FF FF FF FF FF FF FF FF FF FF FF FF FF000003E0H FF FF FF FF FF FF FF FF FF FF FF FF FF FF FF FF000003F0H FF FF FF FF FF FF FF FF FF FF FF FF FF FF FF FF因此可构建SAT的SID数组为:Array indexindex0123456789101112SID array-3-1-2456789-211-2-1可看出sector 0被标记为SAT SID(3),sector 1和sector 12及其后的所有sector都未被使用。4. 短扇区配置表在头中我们知道SSAT从sector 2开始只占用一个sector。从SAT中可看出位置2的值为2,表示结束,故SSAT的SID链为2, 2 开始于文件偏移量为00000600H = 1536字节处。假定内容如下:00000600H 01 00 00 00 02 00 00 00 03 00 00 00 04 00 00 0000000610H 05 00 00 00 06 00 00 00 07 00 00 00 08 00 00 0000000620H 09 00 00 00 0A 00 00 00 0B 00 00 00 0C 00 00 0000000630H 0D 00 00 00 0E 00 00 00 0F 00 00 00 10 00 00 0000000640H 11 00 00 00 12 00 00 00 13 00 00 00 14 00 00 0000000650H 15 00 00 00 16 00 00 00 17 00 00 00 18 00 00 0000000660H 19 00 00 00 1A 00 00 00 1B 00 00 00 1C 00 00 0000000670H 1D 00 00 00 1E 00 00 00 1F 00 00 00 20 00 00 0000000680H 21 00 00 00 22 00 00 00 23 00 00 00 24 00 00 0000000690H 25 00 00 00 26 00 00 00 27 00 00 00 28 00 00 00000006A0H 29 00 00 00 2A 00 00 00 2B 00 00 00 2C 00 00 00000006B0H 2D 00 00 00 FE FF FF FF 2F 00 00 00 FE FF FF FF000006C0H FE FF FF FF 32 00 00 00 33 00 00 00 34 00 00 00000006D0H 35 00 00 00 FE FF FF FF FF FF FF FF FF FF FF FF000006E0H FF FF FF FF FF FF FF FF FF FF FF FF FF FF FF FF000006F0H FF FF FF FF FF FF FF FF FF FF FF FF FF FF FF FF00000700H FF FF FF FF FF FF FF FF FF FF FF FF FF FF FF FF00000710H FF FF FF FF FF FF FF FF FF FF FF FF FF FF FF FF00000720H FF FF FF FF FF FF FF FF FF FF FF FF FF FF FF FF00000730H FF FF FF FF FF FF FF FF FF FF FF FF FF FF FF FF00000740H FF FF FF FF FF FF FF FF FF FF FF FF FF FF FF FF00000750H FF FF FF FF FF FF FF FF FF FF FF FF FF FF FF FF00000760H FF FF FF FF FF FF FF FF FF FF FF FF FF FF FF FF00000770H FF FF FF FF FF FF FF FF FF FF FF FF FF FF FF FF00000780H FF FF FF FF FF FF FF FF FF FF FF
收藏
- 资源描述:
-
.\
复合文档文件格式研究
复合文档(Compound Document)是一种不仅包含文本而且包括图形、电子表格数据、声音、视频图象以及其它信息的文档。可以把复合文档想象成一个所有者,它装着文本、图形以及多媒体信息如声音和图象。目前建立复合文档的趋势是使用面向对象技术,在这里,非标准信息如图像和声音可以作为独立的、自包含式对象包含在文档中。Microsoft Windows就是使用这种技术,叫做“OLE2 storage file format”或“Microsoft Office compatible storage file format”。
当然Excel、Word等都是用这种格式存储的。本文主要研究复合文档的二进制结构,本文的目的就是为另一篇文章《Excel文件格式研究》(创作中)做准备的。
本文是在英文资料的基础上完成的,文中某些术语的翻译可能不够标准,但都会给出英文原名。关于这方面的中文资料网上几乎找不到,如果您有的话,请发到我的邮箱,谢谢。由于本人水平有限,文中错误难免,欢迎大家批评指正。
目 录
第一章 仓库与流(Storages and Streams
第二章 扇区与扇区链(Sectors and Sector Chains
第三章 复合文档头(Compound Document Header
第四章 扇区配置(Sector Allocation
第五章 短流(Short-Streams
第六章 目录(Directory
第七章 文件实例剖析
第一章仓库与流
复合文档的原理就像一个文件系统(文件系统:如FAT与NTFS)。复合文档将数据分成许多流(Streams),这些流又存储在不同的仓库(Storages)里。将复合文档想象成你的D盘,D盘用的是NTFS(NT File System)格式,流就相当于D盘里的文件,仓库就相当于D盘里的文件夹。
流和仓库的命名规则与文件系统相似,同一个仓库下的流及仓库不能重名,不同仓库下可以有同名的流。每个复合文档都有一个根仓库(root storage)
第二章扇区与扇区链
2.1 扇区与扇区标识
所有的流又分成更小的数据块,叫做数据扇区(sectors)。Sectors 可能包含控制数据或用户数据。
整个文件由一个头(Header)结构以及其后的所有Sectors组成。Sectors的大小在头中确定,且每个Sectors的大小都相同。
以下为示意图:
HEADER
SECTOR 0
SECTOR 1
SECTOR 2
SECTOR 3
SECTOR 4
SECTOR 5
SECTOR 6
┆
Sectors 简单的以其在文件中的顺序列举,一个扇区的索引(从0开始)叫做扇区标识(SID:sector identifier)。SID是一个有符号的32位的整型值。
如果一个SID的值非负,就表示真正存在的那个Sector;如果为负,就表示特殊的含义。下表给出有效的特殊SID:
SID
Name
Meaning
-1
Free SID
空闲sector,可存在于文件中,但不是任何流的组成部分。
-2
End Of Chain SID
SID链的结束标记 (见2.2节)
-3
SAT SID
此Sector用于存放扇区配置表(SAT)(见4.2节)
-4
MSAT SID
此Sector用于存放主扇区配置表(MSAT)(见4.1节)
2.2 扇区链与扇区标识链
用于存储流数据的所有Sectors的列表叫做扇区链(Sector Chain)。这些 Sectors 可以是无序的。因此用于指定一个流的 Sectors 的顺序的SID 数组就称为 SID chain 。一个 SID chain 总是以 End Of Chain SID(-2)为结束标记。
例:一个流由4个Sector组成,其链为[1, 6, 3, 5, –2]
流的SID链是通过扇区配置表构建的(见4.2节),但短流和以下两种内部流除外:
1主扇区配置表,其从自身构建SID链(每个扇区包含下一个扇区的SID)。
2扇区配置表,其通过主扇区配置表构建链。
第三章复合文档头
3.1 复合文档头的内容
复合文档头在文件的开始,且其大小必定为512字节。这意味着第一个Sector的开始相对文件的偏移量为512字节。
复合文档头的结构如下:
Offset
Size
Contents
0
8
复合文档文件标识:D0H CFH 11H E0H A1H B1H 1AH E1H
8
16
此文件的唯一标识(不重要, 可全部为0)
24
2
文件格式修订号 (一般为003EH)
26
2
文件格式版本号(一般为0003H)
28
2
字节顺序规则标识(见3.2)::FEH FFH = Little-Endian
FFH FEH = Big-Endian
30
2
复合文档中sector的大小(ssz),以2的幂形式存储, sector实际大小为s_size = 2ssz 字节(一般为9即512字节, 最小值为7即128字节)
32
2
short-sector的大小(见5.1),以2的幂形式存储, short-sector实际大小为s_s_size = 2sssz 字节(一般为6即64字节,最大为sector的大小)
34
10
Not used
44
4
用于存放扇区配置表(SAT)的sector总数
48
4
用于存放目录流的第一个sector的SID (见6)
52
4
Not used
56
4
标准流的最小大小(一般为4096 bytes), 小于此值的流即为短流。
60
4
用于存放短扇区配置表(SSAT)的第一个sector的SID (见5.2),或为–2 (End Of Chain SID)如不存在。
64
4
用于存放短扇区配置表(SSAT)的sector总数
68
4
用于存放主扇区配置表(MSAT)的第一个sector的SID (见4.1),或为–2 (End Of Chain SID) 若无附加的sectors
72
4
用于存放主扇区配置表(MSAT)的sector总数
76
436
存放主扇区配置表(MSAT)的第一部分,包含109个SID。
3.2 字节顺序(Byte Order)
文件数据的二进制存储有两种方法Little-Endian 和 Big-Endian,但实际应用中只使用Little-Endian方法即:低位8字节存放在地址的低位,高位8字节存放在地址的高位。
例:一个32位的整数13579BDFH(转为十进制即324508639),以Little-Endian存放为DFH 9BH 57H13H,以Big-Endian 存放为 13H 57H 9BH DFH。(H下标表示十六进制)
3.3 扇区偏移量
从头中的信息可以计算出一个sector的偏移量(offset),公式为:
sec_pos(SID) = 512 + SID * s_size = 512 + SID * 2 ssz
例:ssz = 10 and SID = 5:
sec_pos(SID) = 512 + SID * 2 ssz = 512 + 5 * 210 = 512 + 5 * 1024 = 5632.
第四章扇区配置
4.1 主扇区配置表
主扇区配置表(MSAT:master sector allocation table)是一个SID数组,指明了所有用于存放扇区配置表(SAT:sector allocation table)的sector的SID。MSAT的大小(SID个数)就等于存放SAT的sector数,在头中指明。
MSAT的前109个SID也存放于头中,如果一个MSAT的SID数多余109个,那么多出来的SID将存放于sector中,头中已经指明了用于存放MSAT的第一个sector的SID。在用于存放MSAT的sector中的最后一个SID指向下一个用于存放MSAT的sector,如果没有下一个则为End Of Chain SID(-2)。
存放MSAT的sector的内容:(s_size表示sector的大小)
Offset
Size
Contents
0
s_size-4
MSAT的(s_size-4) / 4个SID的数组
s_size-4
4
下一个用于存放MSAT的sector的SID,或-2(已为最后一个)
最后一个存放MSAT的sector可能未被完全填满,空闲的地方将被填上Free SID(-1)。
例:一个复合文档需要300个sector用于存放SAT,头中指定sector的大小为512字节,这说明一个sector可存放128个SID。MAST有300个SID,前109个放于头中,其余的191个将要占用2个sector来存放。此例假定第一个存放MSAT的sector为sector 1,则sector 1包含127个SID。第128个SID指向一个用于存放MSAT的sector,假定为sector 6,则sector 6包含剩下的64个SID(最后一个SID为-2,其他的值为-1)。
4.2 扇区配置表
扇区配置表(SAT:sector allocation table)是一个SID数组,包含所有用户流(短流除外)和内部控制流(the short-stream container stream, 见5.1, the short-sector allocation table, 见5.2, and the directory, 见7)的SID链。SAT的大小(SID个数)就等于复合文档中所存在的sector的个数。
SAT的建立就是通过按顺序读取MSAT中指定的sector中的内容。
存放SAT的sector的内容:(s_size表示sector的大小)
Offset
Size
Contents
0
s_size
SAT的s_size / 4个SID的数组
当通过SAT为一个流创建SID链时,SAT数组的当前位置(array index)表示的就是当前的sector,而该位置存放的SID则指向下一个sector。
SAT可能在任意位置包含Free SID(-1),这些sector将不被流使用。如果该位置包含End Of Chain SID(-2)表示一个流的结束。如果sector用于存放SAT则为SAT SID(-3),同样用于存放MSAT则为MSAT SID(-4)。
一个SID链的起点从用户流的目录入口(directory entry,见6.2节)或头(内部控制流)或目录流本身获得。
例:一个复合文档包含一个用于存放SAT的sector(sector 1)和2个流。
Sector 1的内容如下图:
在位置1其值为-3,表明Sector 1是SAT的一部分。
其中一个流为内部目录流,假定头中指定其开始为Sector 0,SAT中位置0的值为2,位置2的值为3,位置3 的值为-2。因此目录流的SID链为[0, 2, 3, –2],即此目录流存放于3个sector中。
目录中包含一个用户流的入口假定为sector 10,从图中可看出此流的SID链为[10, 6, 7, 8, 9, –2]。
第五章短流
5.1 短流存放流
当一个流的大小小于指定的值(在头中指定),就称为短流(short-stream)。
短流并不是直接使用sector存放数据,而是内含在一种特殊的内部控制流——短流存放流(short-stream container stream)中。
短流存放流象其他的用户流一样:先从目录中的根仓库入口(root storage entry)获得第一个使用的sector,其SID链从SAT中获得。然后此流将其所占用的sectors分成short-sector,以便用来存放短流。此处也许较难理解,我们来打个比方:既然流组成符合文档,而短流组成短流存放流,这两者是相似的。把短流存放流当作复合文档,那么短流对应流,short-sector对应sector,唯一的不同是复合文档有一个头结构,而短流存放流没有。short-sector的大小在头中已经指定,因此可根据SID计算short-sector相对于短流存放流的偏移量(offset)。公式为:
short_s_pos(SID) = SID ? short_s_size = SID ? 2 sssz
例:sssz = 6 and SID = 5:
short_s_pos(SID) = SID ? 2 sssz = 5 ? 26 = 5 ? 64 = 320.
5.2 短扇区配置表
短扇区配置表(SSAT:short-sector allocation table)是一个SID数组,包含所有短流的SID链。与SAT很相似。
用于存放SSAT的第一个sector的SID在头中指定,其余的SID链从SAT中获得。
Offset
Size
Contents
0
s_size
SSAT的s_size / 4个SID的数组
SSAT的用法与SAT类似,不同的是其SID链引用的是short-sector。
六章目录
6.1 目录结构
目录(directory)是一种内部控制流,由一系列目录入口(directory entry)组成。每一个目录入口都指向复合文档的一个仓库或流。目录入口以其在目录流中出现的顺序被列举,一个以0开始的目录入口索引称为目录入口标识(DID: directory entry identifier)。
如下图所示:
DIRECTORY ENTRY 0
DIRECTORY ENTRY 1
DIRECTORY ENTRY 2
DIRECTORY ENTRY 3
|
目录入口的位置不因其指向的仓库或流的存在与否而改变。如果一个仓库或流被删除了,其相应的目录入口就标记为空。在目录的开始有一个特殊的目录入口,叫做根仓库入口(root storage entry),其指向根仓库。
目录将每个仓库的直接成员(仓库或流)放在一个独立的红黑树(red-black tree)中。红黑树是一种树状的数据结构,本文仅简单介绍一下,详细情况请参考有关资料。
建构一个Red-Black tree的规则:
1. 每个节点(node)的颜色属性不是红就是黑。
2. 根节点一定是黑的。
3. 如果某个节点是红的,那它的子节点一定是黑的。
4. 从根节点到每个叶节点的路径(path)必须有相同数目的黑节点。
注意并不总是执行上述规则。安全的方法是忽略节点的颜色。
例:以第一章中的图为例
1.根仓库入口描述根仓库,它不是任何仓库入口的成员,因此无需构建红黑树。
2.根仓库的所有直接成员(“Storage1”, “Storage2”, “Stream1”, “Stream2”, “Stream3”, 和 “Stream4”)将组成一棵红黑树,其根节点的DID存放于根仓库入口中。
3.仓库Storage1只有一个成员Stream1,Stream1构成一棵红黑树,此树只有一个节点。Storage1的目录入口包含Stream1的DID。
4. 仓库Storage2包含3个成员“Stream21”, “Stream22”, 和“Stream23”。这3个成员将构建一棵红黑树,其根节点的DID存放于Storage2的目录入口中。
这种存放规则将导致每个目录入口都包含3个DID:
1.在包含此目录入口的红黑树中,此目录入口的左节点的DID。
2.在包含此目录入口的红黑树中,此目录入口的右节点的DID。
3.若此目录入口表示一个仓库,则还包含此仓库的直接成员所组成的另一颗红黑树的根节点的DID。
在构建红黑树的过程中,一个节点究竟作为左还是右,是通过比较其名字来判断的。一个节点比另一个小是指其名字的长度更短,如长度一样,则逐字符比较。
规定:左节点<根节点<右节点。
6.2 目录入口
一个目录入口的大小严格地为128字节,计算其相对目录流的偏移量的公式为:dir_entry_pos(DID) = DID ? 128。
目录入口的内容:
Offset
Size
Contents
0
64
此入口的名字(字符数组), 一般为16位的Unicode字符,以0结束。(因此最大长度为31个字符)
64
2
用于存放名字的区域的大小,包括结尾的0。(如:一个名字右5个字符则此值为(5+1)?2 = 12)
66
1
入口类型: 00H = Empty 03H = LockBytes (unknown) 01H = User storage 04H = Property (unknown) 02H = User stream 05H = Root storage
67
1
此入口的节点颜色: 00H = Red 01H = Black
68
4
其左节点的DID (若此入口为一个user storage or stream),若没有左节点就为-1。
72
4
其右节点的DID (若此入口为一个user storage or stream),若没有右节点就为-1。
76
4
其成员红黑树的根节点的DID (若此入口为storage), 其他为-1。
80
16
唯一标识符(若为storage)(不重要, 可能全为0)
96
4
用户标记(不重要, 可能全为0)
100
8
创建此入口的时间标记。大多数情况都不写。
108
8
最后修改此入口的时间标记。大多数情况都不写。
116
4
若此为流的入口,指定流的第一个sector或short-sector的SID,若此为根仓库入口,指定短流存放流的第一个sector的SID,其他情况,为0。
120
4
若此为流的入口,指定流的大小(字节)若此为根仓库入口,指定短流存放流的大小(字节)其他情况,为0。
124
4
Not used
时间标记(time stamp) 是一个符号的64位的整数,表示从1601-01-01 00:00:00开始的时间值。此值的单位为10-7秒。
当计算时间标记是要注意闰年。
例:时间标记值为01AE408B10149C00H
计算步骤
公式
结果
转为十进制
t0= 121,105,206,000,000,000
化成秒的余数
rfrac = t0 mod 10的7次方
rfrac = 0
化成秒的整数
t1 = t0 / 10的7次方
t1 = 12,110,520,600
化成分的余数
rsec = t1 mod 60
rsec = 0
化成分的整数
t2 = t1 / 60
t2 = 201,842,010
化成小时的余数
rmin = t2 mod 60
rmin = 30
化成小时的整数
t3 = t2 / 60
t3 = 3,364,033
化成天的余数
rhour = t3 mod 24
rhour = 1
化成天的整数
t4 = t3 / 24
t4 = 140,168
距1601-01-01的整年
ryear = 1601 + t4含的年
ryear = 1601 + 383 = 1984
到1984年还剩的天数
t5 = t4 – (1601-01-01到1984-01-01的天数)
t5 =140,168 – 139,887 = 281
距1984-01-01的月数
rmonth = 1 + t5含的月数
rmonth = 1 + 9 = 10
到10月还剩的天数
t6 = t5 – (1984-01-01到1984-10-01的天数)
t6 = 281 – 274 = 7
10月最终天数
rday = 1 + t6
rday = 1 + 7 = 8
最后的结果为1984-10-8 01:30:00。猜猜看这是什么日子.........
第七章 Excel文件实例剖析
这章我们以一个Excel文件作为实例来分析其二进制结构。看实例永远是最好的学习方法,呵呵。
1.复合文档头
首先,读取此文件头,假定此Excel文件的头(512字节)内容如下:
00000000H D0 CF 11 E0 A1 B1 1A E1 00 00 00 00 00 00 00 00
00000010H 00 00 00 00 00 00 00 00 3B 00 03 00 FE FF 09 00
00000020H 06 00 00 00 00 00 00 00 00 00 00 00 01 00 00 00
00000030H 0A 00 00 00 00 00 00 00 00 10 00 00 02 00 00 00
00000040H 01 00 00 00 FE FF FF FF 00 00 00 00 00 00 00 00
00000050H FF FF FF FF FF FF FF FF FF FF FF FF FF FF FF FF
00000060H FF FF FF FF FF FF FF FF FF FF FF FF FF FF FF FF
00000070H FF FF FF FF FF FF FF FF FF FF FF FF FF FF FF FF
00000080H FF FF FF FF FF FF FF FF FF FF FF FF FF FF FF FF
00000090H FF FF FF FF FF FF FF FF FF FF FF FF FF FF FF FF
000000A0H FF FF FF FF FF FF FF FF FF FF FF FF FF FF FF FF
000000B0H FF FF FF FF FF FF FF FF FF FF FF FF FF FF FF FF
000000C0H FF FF FF FF FF FF FF FF FF FF FF FF FF FF FF FF
000000D0H FF FF FF FF FF FF FF FF FF FF FF FF FF FF FF FF
000000E0H FF FF FF FF FF FF FF FF FF FF FF FF FF FF FF FF
000000F0H FF FF FF FF FF FF FF FF FF FF FF FF FF FF FF FF
00000100H FF FF FF FF FF FF FF FF FF FF FF FF FF FF FF FF
00000110H FF FF FF FF FF FF FF FF FF FF FF FF FF FF FF FF
00000120H FF FF FF FF FF FF FF FF FF FF FF FF FF FF FF FF
00000130H FF FF FF FF FF FF FF FF FF FF FF FF FF FF FF FF
00000140H FF FF FF FF FF FF FF FF FF FF FF FF FF FF FF FF
00000150H FF FF FF FF FF FF FF FF FF FF FF FF FF FF FF FF
00000160H FF FF FF FF FF FF FF FF FF FF FF FF FF FF FF FF
00000170H FF FF FF FF FF FF FF FF FF FF FF FF FF FF FF FF
00000180H FF FF FF FF FF FF FF FF FF FF FF FF FF FF FF FF
00000190H FF FF FF FF FF FF FF FF FF FF FF FF FF FF FF FF
000001A0H FF FF FF FF FF FF FF FF FF FF FF FF FF FF FF FF
000001B0H FF FF FF FF FF FF FF FF FF FF FF FF FF FF FF FF
000001C0H FF FF FF FF FF FF FF FF FF FF FF FF FF FF FF FF
000001D0H FF FF FF FF FF FF FF FF FF FF FF FF FF FF FF FF
000001E0H FF FF FF FF FF FF FF FF FF FF FF FF FF FF FF FF
000001F0H FF FF FF FF FF FF FF FF FF FF FF FF FF FF FF FF
1)前8个字节是固定的标识,表示这是一个复合文档文件。
2)接着16个字节是唯一标识,其后的4个字节表示修订号和版本号,可不用管它。
3)接下来的2个字节是字节顺序(Byte Order)标识符,总是FEH FFH。
4)接着的2个字节表示sector的大小,再2个字节表示short-sector的大小。分别是2^9=512字节和2^6=64字节。
5)接着的10个字节无有效数据,可忽略。
6)接着的4个字节表示用于存放扇区配置表(SAT)的sector总数,此例为1个。
7)接着的4个字节表示用于存放目录流的第一个sector的SID,这里为sector 10。
8)接着的4个字节无有效数据,可忽略。
9)接着的4个字节表示标准流的最小大小,这里为00001000H = 4096字节。
10)接着的4个字节表示用于存放短扇区配置表(SSAT)的第一个sector的SID,其后4个字节表示用于存放短扇区配置表(SSAT)的sector总数,这里SSAT从sector 2开始,并只占用1个sector。
11)接着的4个字节表示用于存放主扇区配置表(MSAT)的第一个sector的SID,其后的4个字节表示用于存放主扇区配置表(MSAT)的sector总数,这里SID为-2,说明没有附加的sector用于存放MSAT。
12)最后的436个字节包含MSAT的前109个SID。只有第一个SID有效,因为上面已经说了SAT只占用1个sector。从这里可看出为sector 0。其他的SID标记为Free SID值为-1。
2. 主扇区配置表
头中已经包含整个MSAT,其SID链为[0,-2]。
3. 扇区配置表
在此例中扇区配置表仅占用sector 0,它开始于文件偏移量为00000200H = 512字节处。假定内容如下:
00000200H FD FF FF FF FF FF FF FF FE FF FF FF 04 00 00 00
00000210H 05 00 00 00 06 00 00 00 07 00 00 00 08 00 00 00
00000220H 09 00 00 00 FE FF FF FF 0B 00 00 00 FE FF FF FF
00000230H FF FF FF FF FF FF FF FF FF FF FF FF FF FF FF FF
00000240H FF FF FF FF FF FF FF FF FF FF FF FF FF FF FF FF
00000250H FF FF FF FF FF FF FF FF FF FF FF FF FF FF FF FF
00000260H FF FF FF FF FF FF FF FF FF FF FF FF FF FF FF FF
00000270H FF FF FF FF FF FF FF FF FF FF FF FF FF FF FF FF
00000280H FF FF FF FF FF FF FF FF FF FF FF FF FF FF FF FF
00000290H FF FF FF FF FF FF FF FF FF FF FF FF FF FF FF FF
000002A0H FF FF FF FF FF FF FF FF FF FF FF FF FF FF FF FF
000002B0H FF FF FF FF FF FF FF FF FF FF FF FF FF FF FF FF
000002C0H FF FF FF FF FF FF FF FF FF FF FF FF FF FF FF FF
000002D0H FF FF FF FF FF FF FF FF FF FF FF FF FF FF FF FF
000002E0H FF FF FF FF FF FF FF FF FF FF FF FF FF FF FF FF
000002F0H FF FF FF FF FF FF FF FF FF FF FF FF FF FF FF FF
00000300H FF FF FF FF FF FF FF FF FF FF FF FF FF FF FF FF
00000310H FF FF FF FF FF FF FF FF FF FF FF FF FF FF FF FF
00000320H FF FF FF FF FF FF FF FF FF FF FF FF FF FF FF FF
00000330H FF FF FF FF FF FF FF FF FF FF FF FF FF FF FF FF
00000340H FF FF FF FF FF FF FF FF FF FF FF FF FF FF FF FF
00000350H FF FF FF FF FF FF FF FF FF FF FF FF FF FF FF FF
00000360H FF FF FF FF FF FF FF FF FF FF FF FF FF FF FF FF
00000370H FF FF FF FF FF FF FF FF FF FF FF FF FF FF FF FF
00000380H FF FF FF FF FF FF FF FF FF FF FF FF FF FF FF FF
00000390H FF FF FF FF FF FF FF FF FF FF FF FF FF FF FF FF
000003A0H FF FF FF FF FF FF FF FF FF FF FF FF FF FF FF FF
000003B0H FF FF FF FF FF FF FF FF FF FF FF FF FF FF FF FF
000003C0H FF FF FF FF FF FF FF FF FF FF FF FF FF FF FF FF
000003D0H FF FF FF FF FF FF FF FF FF FF FF FF FF FF FF FF
000003E0H FF FF FF FF FF FF FF FF FF FF FF FF FF FF FF FF
000003F0H FF FF FF FF FF FF FF FF FF FF FF FF FF FF FF FF
因此可构建SAT的SID数组为:
Array index
index
0
1
2
3
4
5
6
7
8
9
10
11
12
…
SID array
-3
-1
-2
4
5
6
7
8
9
-2
11
-2
-1
…
可看出sector 0被标记为SAT SID(-3),sector 1和sector 12及其后的所有sector都未被使用。
4. 短扇区配置表
在头中我们知道SSAT从sector 2开始只占用一个sector。从SAT中可看出位置2的值为-2,表示结束,故SSAT的SID链为[2, –2] 开始于文件偏移量为00000600H = 1536字节处。
假定内容如下:
00000600H 01 00 00 00 02 00 00 00 03 00 00 00 04 00 00 00
00000610H 05 00 00 00 06 00 00 00 07 00 00 00 08 00 00 00
00000620H 09 00 00 00 0A 00 00 00 0B 00 00 00 0C 00 00 00
00000630H 0D 00 00 00 0E 00 00 00 0F 00 00 00 10 00 00 00
00000640H 11 00 00 00 12 00 00 00 13 00 00 00 14 00 00 00
00000650H 15 00 00 00 16 00 00 00 17 00 00 00 18 00 00 00
00000660H 19 00 00 00 1A 00 00 00 1B 00 00 00 1C 00 00 00
00000670H 1D 00 00 00 1E 00 00 00 1F 00 00 00 20 00 00 00
00000680H 21 00 00 00 22 00 00 00 23 00 00 00 24 00 00 00
00000690H 25 00 00 00 26 00 00 00 27 00 00 00 28 00 00 00
000006A0H 29 00 00 00 2A 00 00 00 2B 00 00 00 2C 00 00 00
000006B0H 2D 00 00 00 FE FF FF FF 2F 00 00 00 FE FF FF FF
000006C0H FE FF FF FF 32 00 00 00 33 00 00 00 34 00 00 00
000006D0H 35 00 00 00 FE FF FF FF FF FF FF FF FF FF FF FF
000006E0H FF FF FF FF FF FF FF FF FF FF FF FF FF FF FF FF
000006F0H FF FF FF FF FF FF FF FF FF FF FF FF FF FF FF FF
00000700H FF FF FF FF FF FF FF FF FF FF FF FF FF FF FF FF
00000710H FF FF FF FF FF FF FF FF FF FF FF FF FF FF FF FF
00000720H FF FF FF FF FF FF FF FF FF FF FF FF FF FF FF FF
00000730H FF FF FF FF FF FF FF FF FF FF FF FF FF FF FF FF
00000740H FF FF FF FF FF FF FF FF FF FF FF FF FF FF FF FF
00000750H FF FF FF FF FF FF FF FF FF FF FF FF FF FF FF FF
00000760H FF FF FF FF FF FF FF FF FF FF FF FF FF FF FF FF
00000770H FF FF FF FF FF FF FF FF FF FF FF FF FF FF FF FF
00000780H FF FF FF FF FF FF FF FF FF FF FF
展开阅读全文