(请保留->发布地址: http://yiiyee.cn/blog/author/luobing/ )
隔离卡的界面开发中,PCX实际上用得最多。主要是因为它采用了RLE压缩,在颜色不多的情况下,能够比较小。这也逼着我使用各种工具,比如PS、ACDSEE甚至是画图软件,来调整其色彩数,以减少图像尺寸。
毕竟隔离卡的ROM只有64K可用,因此常用的是256色PCX。PCX其实也支持24位真彩色,本篇中我尝试在UEFI Shell下显示24位真彩色PCX文件。
1 PCX格式介绍
PCX文件包含三部分:
- 文件头128字节,包含各种信息;
- 压缩图像数据部分,任意大小;
- 结尾一般带有256色的调色板,供768字节;
文件头如下:
PCX的格式相对比较古老了,这里有篇文档可以参考一下:http://techheap.packetizer.com/compression/graphics/pcxfmt.html。
我们需要处理的PCX文件版本为5,也即支持24位真彩色的图像。如果为256色的图像,在文件768字节为调色板数据,以RGB的顺序存储,每三个字节构成一个颜色;如果是24位真彩色,则没有调色板数据,除去文件头,就是数据区了。
图1中的偏移3和偏移65,决定了图像的类别。我们比较关注的24位真彩色,其像素位为8,平面数为3。
偏移4开始的8个字节,每两个字节为一个坐标,分别为Xmin、Ymin、Xmax、Ymax。这是坐标位置,则图像大小为(Xmax-Xmin+1)*(Ymax-Ymin+1)。
2 PCX编码
PCX采用的是游程编码(Run Length Encoding,RLE),这是一种用来缩减重复字符串大小的技术。典型的RLE是重复的连续字节用两个字节来存储:一个重复的个数,一个是字节值。
当然,PCX不是直接采用这种方式编码的。这会导致最差情况下,数据存储增长一倍了(比如没有连续的色彩)。设计者在设计的时候,采用了某种折中的方式。
以像素位为8bit的图案为例,其原理如下:
- 在压缩的PCX位图数据中,分为两种数据:一种是记录数据(某一pixel值的个数),一种是真实数据(pixel值)。
- PCX的位图数据里,每个数据8个bit:如果最高两位为11(0xC0),此数据为记录数据,记录的是下一个数据作为pixel值将在原图中连续出现的次数(与0xC0的差值)。比如0XC3,0x64解码后为0x64,0x64。
- 如果原图中的pixel值本身就大于0xC0,那么在读压缩数据时会无法判断此数据是记录数据还是真实数据。解决办法是,原图中如果大于192的pixel值就算只有1个,在压缩数据中也要用一个记录数据去记录它。这样不管如何,读到高位为11的数据,皆为记录数据。
- 如果原图中的单个pixel值本身小于0xC0,则直接存储。
另外,需要特别注意的是,PCX是以行为编码单位的。观察其结构,可以知道其每行字节数一定是偶数。那么在编码的时候,针对奇数长度的图像宽度,必须以0补足。比如5×3的PCX图像,其每行字节数为6,每行末尾会加上0补足。
256色的存储,像素值填写的是调色板索引,按照上述的规则编码就可以了,比较好理解。网上也有很多例子,都是以256色为例,我们就不展开叙述了。24位真彩色的稍微有点绕,着重解释一下。
图2演示了编码的过程,对宽度为奇数的图像,添加0后使得每行像素数目为偶数。宽度为偶数的图像则可以省去这一步骤,直接进行进行编码。编码时按照R、G、B的顺序,对每行进行处理。
解码时,将上述过程反过来进行即可。
3 编写代码
根据上面的介绍,可以编写相关的代码了。
和BMP不同,UEFI没有提供相关的支持。对256色PCX的解码与显示,在Foxdisk的源代码中已经给出了(工具代码中也有)。我们主要对24位真彩色进行解码显示。 如下为PCX的数据结构,对图1的结构做了部分简化。
需要关注的是图中红线标出的字段。图像的尺寸可以从xMin、yMin、xMax、yMax中计算得出,公式为(xMax-xMin+1)*(yMax-yMin+1);PCX文件(24位真彩色)数据区字符个数可以从BytesPerLine算出,公式为BytesPerLine * (yMax-yMin+1)。
从这几个关键的数据中,可以将PCX文件解码到内存中,输出到屏幕上。
我写了两个函数来实现,decompressPCX24bits()和decompressPCX24bits_fast()。前一个函数是从文件中一个个将数据读出,再解码;后一个函数则将PCX文件先读出到内存中,再来解码。
前一个函数在运行过程中,有2-3秒的延迟。我估计与文件IO有关,一个个字节单独从文件中读出,特别费时间。所以我编写了后一个函数,一次性先将PCX文件读到内存中,减少IO次数。至于硬盘I/O的过程中,UEFI 硬盘驱动是使用了DMA还是直接CPU按块读取的,我暂时就不深究了。 内存访问肯定比硬盘IO快很多,所以后一个函数没有什么延迟。演示效果如下:
4 One More Thing
在开发过程中,发现一件奇怪的事情。
编写decompressPCX24bits_fast()的过程中,有这么一句话:
count = bPixel & 0x3F;
bPixel = *tempFileImage++;
导致程序无法编译通过,提示_memset外部函数无法链接。去掉这段话就编译通过了。
观察下百度云上提供的代码,可以发现整个函数中都没有用到memset(),而且这是Stdlib中的函数,怎么会编译成这样?
这件事情困扰了我两天了,也导致这篇博客延后了三天才完成。
具体怎么回事,下一篇中我试着解答一下。
百度云链接:https://pan.baidu.com/s/1gccSosw8_UAGTI5gZPnLCA
提取码:dx23
文件在 16 Display PCX 下
2,532 total views, 2 views today