BMP 文件格式分析
简介
BMP(Bitmap-File)图形文件是 Windows 采用的图形文件格式,在 Windows 环境下运行的所
有图象处理软件都支持 BMP 图象文件格式。Windows 系统内部各图像绘制操作都是以 BMP
为基础的。Windows 3.0 以前的 BMP 图文件格式与显示设备有关,因此把这种 BMP 图象文件
格式称为设备相关位图 DDB(device-dependent bitmap)文件格式。Windows 3.0 以后的
BMP 图象文件与显示设备无关,因此把这种 BMP 图象文件格式称为设备无关位图
DIB(device-independent bitmap)格式(注:Windows 3.0 以后,在系统中仍然存在 DDB
位图,象 BitBlt()这种函数就是基于 DDB 位图的,只不过如果你想将图像以 BMP 格式保存到
磁盘文件中时,微软极力推荐你以 DIB 格式保存),目的是为了让 Windows 能够在任何类型
的显示设备上显示所存储的图象。BMP 位图文件默认的文件扩展名是 BMP 或者 bmp(有时它
也会以.DIB 或.RLE 作扩展名)。
文件结构
位图文件可看成由 4 个部分组成:位图文件头(bitmap-file header)、位图信息头
(bitmap-information header)、彩色表(color table)和定义位图的字节阵列,它具有如下所
示的形式。
位图文件的组成
结构名称
符号
位图文件头(bitmap-file
header)
位图信息头
(bitmap-information
header)
彩色表(color table)
图象数据阵列字节
位图文件结构可综合在表 6-01 中。
表01 位图文件结构内容摘要
BITMAPFILEHEADER bmfh
BITMAPINFOHEADER bmih
RGBQUAD
BYTE
aColors[]
aBitmapBits[]
偏移量 域的名称
大小
内容
0000h 文件标识
2
两字节的内容用来识别位图的类型:
图
象
文
件
头
bytes
‘BM’ : Windows 3.1x, 95, NT, …
‘BA’ :OS/2 Bitmap Array
‘CI’ :OS/2 Color Icon
‘CP’ :OS/2 Color Pointer
‘IC’ : OS/2 Icon
‘PT’ :OS/2 Pointer
注:因为 OS/2 系统并没有被普及开,
所以在编程时,你只需判断第一个标识
“BM”就行。
0002h File Size
0006h Reserved
1
dword
1
dword
用字节表示的整个文件的大小
保留,必须设置为 0
000Ah
Bitmap Data
Offset
1
dword
从文件开始到位图数据开始之间的数
据(bitmap data)之间的偏移量
000Eh
Bitmap
Header Size
1
dword
位图信息头(Bitmap Info Header)的
长度,用来描述位图的颜色、压缩方法
等。下面的长度表示:
28h - Windows 3.1x, 95, NT, …
0Ch - OS/2 1.x
F0h - OS/2 2.x
注:在 Windows95、98、2000 等操
作系统中,位图信息头的长度并不一定
是 28h,因为微软已经制定出了新的
BMP 文件格式,其中的信息头结构变化
比较大,长度加长。所以最好不要直接
使用常数 28h,而是应该从具体的文件
中读取这个值。这样才能确保程序的兼
容性。
0012h Width
0016h Height
001Ah Planes
1
dword
1
dword
1
word
图
象
信
息
头
001Ch Bits Per Pixel
1
word
001Eh Compression
1
dword
位图的宽度,以象素为单位
位图的高度,以象素为单位
位图的位面数(注:该值将总是 1)
每个象素的位数
1 - 单色位图(实际上可有两种颜色,
缺省情况下是黑色和白色。你可以自己
定义这两种颜色)
4 - 16 色位图
8 - 256 色位图
16 - 16bit 高彩色位图
24 - 24bit 真彩色位图
32 - 32bit 增强型真彩色位图
压缩说明:
0 - 不压缩 (使用 BI_RGB 表示)
1 - RLE 8-使用 8 位 RLE 压缩方式(用
BI_RLE8 表示)
2 - RLE 4-使用 4 位 RLE 压缩方式(用
BI_RLE4 表示)
3 - Bitfields-位域存放方式(用
BI_BITFIELDS 表示)
0022h
Bitmap Data
Size
1
dword
用字节数表示的位图数据的大小。该数
必须是 4 的倍数
0026h HResolution
1
dword
用象素/米表示的水平分辨率
002Ah VResolution
1
用象素/米表示的垂直分辨率
位图使用的颜色数。如 8-比特/象素表
示为 100h 或者 256.
指定重要的颜色数。当该域的值等于颜
色数时(或者等于 0 时),表示所有颜
色都一样重要
调色板规范。对于调色板中的每个表
项,这 4 个字节用下述方法来描述 RGB
的值:
1 字节用于蓝色分量
1 字节用于绿色分量
1 字节用于红色分量
1 字节用于填充符(设置为 0)
该域的大小取决于压缩方法及图像的
尺寸和图像的位深度,它包含所有的位
图数据字节,这些数据可能是彩色调色
板的索引号,也可能是实际的 RGB 值,
这将根据图像信息头中的位深度值来
决定。
002Eh Colors
0032h
Important
Colors
dword
1
dword
1
dword
Palette
N * 4
byte
Bitmap Data
xxx
bytes
调
色
板
数
据
图
象
数
据
根据
BMP
版本的
不同而
不同
根据
BMP
版本及
调色板
尺寸的
不同而
不同
构件详解
1. 位图文件头
位图文件头包含有关于文件类型、文件大小、存放位置等信息,在 Windows
3.0 以上版本的位图文件中用 BITMAPFILEHEADER 结构来定义:
typedef struct tagBITMAPFILEHEADER { /* bmfh */
UINT bfType;
DWORD bfSize;
UINT bfReserved1;
UINT bfReserved2;
DWORD bfOffBits;
} BITMAPFILEHEADER;
其中:
?
bfType
说明文件的类型.(该值必需是0x4D42,也就是字符'BM'。我们不需要判
断OS/2 的位图标识,这么做现在来看似乎已经没有什么意义了,而且如
果要支持OS/2 的位图,程序将变得很繁琐。所以,在此只建议你检察'BM'
标识)?
bfSize
说明文件的大小,用字节为单位
bfReserved1
保留,必须设置为0
bfReserved2
保留,必须设置为0
说明从文件头开始到实际的图象数据之间的字节的偏移量。这个参数是非
bfOffBits
常有用的,因为位图信息头和调色板的长度会根据不同情况而变化,所以
你可以用这个偏移值迅速的从文件中读取到位数据。
2. 位图信息头
位图信息用 BITMAPINFO 结构来定义,它由位图信息头
(bitmap-information header)和彩色表(color table)组成,前者用
BITMAPINFOHEADER 结构定义,后者用 RGBQUAD 结构定义。
BITMAPINFO 结构具有如下形式:
typedef struct tagBITMAPINFO { /* bmi */
BITMAPINFOHEADER bmiHeader;
RGBQUAD bmiColors[1];
} BITMAPINFO;
其中:
?
bmiHeader
说明BITMAPINFOHEADER 结构,其中包含了有关位图的尺寸及位格式
等信息
bmiColors
说明彩色表RGBQUAD 结构的阵列,其中包含索引图像的真实RGB 值。
BITMAPINFOHEADER 结构包含有位图文件的大小、压缩类型和颜色格式,
其结构定义为:
typedef struct tagBITMAPINFOHEADER { /* bmih */
DWORD biSize;
LONG biWidth;
LONG biHeight;
WORD biPlanes;
WORD biBitCount;
DWORD biCompression;
DWORD biSizeImage;
LONG biXPelsPerMeter;
LONG biYPelsPerMeter;
DWORD biClrUsed;
DWORD biClrImportant;
} BITMAPINFOHEADER;
其中:
?
biSize
说明BITMAPINFOHEADER 结构所需要的字数。注:这个值并不一定
是BITMAPINFOHEADER 结构的尺寸,它也可能是
sizeof(BITMAPV4HEADER)的值,或是sizeof(BITMAPV5HEADER)
的值。这要根据该位图文件的格式版本来决定,不过,就现在的情况来
看,绝大多数的BMP 图像都是BITMAPINFOHEADER 结构的(可能
是后两者太新的缘故吧:-)。
biWidth
说明图象的宽度,以象素为单位
biHeight
说明图象的高度,以象素为单位。注:这个值除了用于描述图像的高度
之外,它还有另一个用处,就是指明该图像是倒向的位图,还是正向的
位图。如果该值是一个正数,说明图像是倒向的,如果该值是一个负数,
则说明图像是正向的。大多数的BMP 文件都是倒向的位图,也就是时,
高度值是一个正数。(注:当高度值是一个负数时(正向图像),图像
将不能被压缩(也就是说biCompression 成员将不能是BI_RLE8 或
BI_RLE4)。
biPlanes
为目标设备说明位面数,其值将总是被设为1
biBitCount
说明比特数/象素,其值为1、4、8、16、24、或32
说明图象数据压缩的类型。其值可以是下述值之一:
biCompression
BI_RGB:没有压缩;
BI_RLE8:每个象素 8 比特的 RLE 压缩编码,压缩格式由 2
字节组成(重复象素计数和颜色索引);
BI_RLE4:每个象素 4 比特的 RLE 压缩编码,压缩格式由 2
字节组成
BI_BITFIELDS:每个象素的比特由指定的掩码决定。
biSizeImage
说明图象的大小,以字节为单位。当用 BI_RGB 格式时,可
设置为 0
biXPelsPerMeter
说明水平分辨率,用象素/米表示
biYPelsPerMeter
说明垂直分辨率,用象素/米表示
biClrUsed
说明位图实际使用的彩色表中的颜色索引数(设为 0 的话,
则说明使用所有调色板项)
biClrImportant
说明对图象显示有重要影响的颜色索引的数目,如果是0,表示都重要。
现就 BITMAPINFOHEADER 结构作如下说明:
(1) 彩色表的定位
应用程序可使用存储在 biSize 成员中的信息来查找在 BITMAPINFO 结构中
的彩色表,如下所示:
pColor = ((LPSTR) pBitmapInfo + (WORD)
(pBitmapInfo->bmiHeader.biSize))
(2) biBitCount
biBitCount=1 表示位图最多有两种颜色,缺省情况下是黑色和白色,你也可
以自己定义这两种颜色。图像信息头装调色板中将有两个调色板项,称为索引 0
和索引 1。图象数据阵列中的每一位表示一个象素。如果一个位是 0,显示时就
使用索引 0 的 RGB 值,如果位是 1,则使用索引 1 的 RGB 值。
biBitCount=4 表示位图最多有 16 种颜色。每个象素用 4 位表示,并用这 4
位作为彩色表的表项来查找该象素的颜色。例如,如果位图中的第一个字节为
0x1F,它表示有两个象素,第一象素的颜色就在彩色表的第 2 表项中查找,而
第二个象素的颜色就在彩色表的第 16 表项中查找。此时,调色板中缺省情况下
会有 16 个 RGB 项。对应于索引 0 到索引 15。
biBitCount=8 表示位图最多有 256 种颜色。每个象素用 8 位表示,并用这
8 位作为彩色表的表项来查找该象素的颜色。例如,如果位图中的第一个字节为
0x1F,这个象素的颜色就在彩色表的第 32 表项中查找。此时,缺省情况下,
调色板中会有 256 个 RGB 项,对应于索引 0 到索引 255。
biBitCount=16 表示位图最多有 216 种颜色。每个色素用 16 位(2 个字节)
表示。这种格式叫作高彩色,或叫增强型 16 位色,或 64K 色。它的情况比较
复杂,当 biCompression 成员的值是 BI_RGB 时,它没有调色板。16 位
中,最低的 5 位表示蓝色分量,中间的 5 位表示绿色分量,高的 5 位表示红色
分量,一共占用了 15 位,最高的一位保留,设为 0。这种格式也被称作 555 16
位位图。如果 biCompression 成员的值是 BI_BITFIELDS,那么情况就
复杂了,首先是原来调色板的位置被三个 DWORD 变量占据,称为红、绿、蓝
掩码。分别用于描述红、绿、蓝分量在 16 位中所占的位置。在 Windows 95
(或 98)中,系统可接受两种格式的位域:555 和 565,在 555 格式下,红、
绿、蓝的掩码分别是:0x7C00、0x03E0、0x001F,而在 565 格式下,
它们则分别为:0xF800、0x07E0、0x001F。你在读取一个像素之后,可
以分别用掩码“与”上像素值,从而提取出想要的颜色分量(当然还要再经过适
当的左右移操作)。在 NT 系统中,则没有格式限制,只不过要求掩码之间不能
有重叠。(注:这种格式的图像使用起来是比较麻烦的,不过因为它的显示效果
接近于真彩,而图像数据又比真彩图像小的多,所以,它更多的被用于游戏软件)。
biBitCount=24 表示位图最多有 224 种颜色。这种位图没有调色板
(bmiColors 成员尺寸为 0),在位数组中,每 3 个字节代表一个象素,分别
对应于颜色 R、G、B。
biBitCount=32 表示位图最多有 232 种颜色。这种位图的结构与 16 位位图
结构非常类似,当 biCompression 成员的值是 BI_RGB 时,它也没有调色
板,32 位中有 24 位用于存放 RGB 值,顺序是:最高位—保留,红 8 位、绿
8 位、蓝 8 位。这种格式也被成为 888 32 位图。如果 biCompression 成
员的值是 BI_BITFIELDS 时,原来调色板的位置将被三个 DWORD 变量占
据,成为红、绿、蓝掩码,分别用于描述红、绿、蓝分量在 32 位中所占的位置。
在 Windows 95(or 98)中,系统只接受 888 格式,也就是说三个掩码的值
将只能是:0xFF0000、0xFF00、0xFF。而在 NT 系统中,你只要注意使
掩码之间不产生重叠就行。(注:这种图像格式比较规整,因为它是 DWORD
对齐的,所以在内存中进行图像处理时可进行汇编级的代码优化(简单))。