UEFI开发探索25 – 图像显示(PCX)

(请保留->发布地址： http://yiiyee.cn/blog/author/luobing/ )

隔离卡的界面开发中，PCX实际上用得最多。主要是因为它采用了RLE压缩，在颜色不多的情况下，能够比较小。这也逼着我使用各种工具，比如PS、ACDSEE甚至是画图软件，来调整其色彩数，以减少图像尺寸。

毕竟隔离卡的ROM只有64K可用，因此常用的是256色PCX。PCX其实也支持24位真彩色，本篇中我尝试在UEFI Shell下显示24位真彩色PCX文件。

1 PCX格式介绍

PCX文件包含三部分：

文件头128字节，包含各种信息；
压缩图像数据部分，任意大小；
结尾一般带有256色的调色板，供768字节；

文件头如下：

PCX的格式相对比较古老了，这里有篇文档可以参考一下：http://techheap.packetizer.com/compression/graphics/pcxfmt.html。

我们需要处理的PCX文件版本为5，也即支持24位真彩色的图像。如果为256色的图像，在文件768字节为调色板数据，以RGB的顺序存储，每三个字节构成一个颜色；如果是24位真彩色，则没有调色板数据，除去文件头，就是数据区了。

图1中的偏移3和偏移65，决定了图像的类别。我们比较关注的24位真彩色，其像素位为8，平面数为3。

偏移4开始的8个字节，每两个字节为一个坐标，分别为Xmin、Ymin、Xmax、Ymax。这是坐标位置，则图像大小为（Xmax-Xmin+1）*（Ymax-Ymin+1）。

2 PCX编码

PCX采用的是游程编码(Run Length Encoding,RLE)，这是一种用来缩减重复字符串大小的技术。典型的RLE是重复的连续字节用两个字节来存储：一个重复的个数，一个是字节值。

当然，PCX不是直接采用这种方式编码的。这会导致最差情况下，数据存储增长一倍了（比如没有连续的色彩）。设计者在设计的时候，采用了某种折中的方式。

以像素位为8bit的图案为例，其原理如下：

在压缩的PCX位图数据中，分为两种数据：一种是记录数据(某一pixel值的个数)，一种是真实数据(pixel值)。
PCX的位图数据里，每个数据8个bit：如果最高两位为11(0xC0)，此数据为记录数据，记录的是下一个数据作为pixel值将在原图中连续出现的次数(与0xC0的差值)。比如0XC3,0x64解码后为0x64,0x64。
如果原图中的pixel值本身就大于0xC0，那么在读压缩数据时会无法判断此数据是记录数据还是真实数据。解决办法是，原图中如果大于192的pixel值就算只有1个，在压缩数据中也要用一个记录数据去记录它。这样不管如何，读到高位为11的数据，皆为记录数据。
如果原图中的单个pixel值本身小于0xC0，则直接存储。

另外，需要特别注意的是，PCX是以行为编码单位的。观察其结构，可以知道其每行字节数一定是偶数。那么在编码的时候，针对奇数长度的图像宽度，必须以0补足。比如5×3的PCX图像，其每行字节数为6，每行末尾会加上0补足。

256色的存储，像素值填写的是调色板索引，按照上述的规则编码就可以了，比较好理解。网上也有很多例子，都是以256色为例，我们就不展开叙述了。24位真彩色的稍微有点绕，着重解释一下。

图2演示了编码的过程，对宽度为奇数的图像，添加0后使得每行像素数目为偶数。宽度为偶数的图像则可以省去这一步骤，直接进行进行编码。编码时按照R、G、B的顺序，对每行进行处理。

解码时，将上述过程反过来进行即可。

3 编写代码

根据上面的介绍，可以编写相关的代码了。

和BMP不同，UEFI没有提供相关的支持。对256色PCX的解码与显示，在Foxdisk的源代码中已经给出了（工具代码中也有）。我们主要对24位真彩色进行解码显示。如下为PCX的数据结构，对图1的结构做了部分简化。

需要关注的是图中红线标出的字段。图像的尺寸可以从xMin、yMin、xMax、yMax中计算得出，公式为(xMax-xMin+1)*(yMax-yMin+1)；PCX文件（24位真彩色）数据区字符个数可以从BytesPerLine算出，公式为BytesPerLine * (yMax-yMin+1)。

从这几个关键的数据中，可以将PCX文件解码到内存中，输出到屏幕上。

我写了两个函数来实现，decompressPCX24bits()和decompressPCX24bits_fast()。前一个函数是从文件中一个个将数据读出，再解码；后一个函数则将PCX文件先读出到内存中，再来解码。

前一个函数在运行过程中，有2-3秒的延迟。我估计与文件IO有关，一个个字节单独从文件中读出，特别费时间。所以我编写了后一个函数，一次性先将PCX文件读到内存中，减少IO次数。至于硬盘I/O的过程中，UEFI 硬盘驱动是使用了DMA还是直接CPU按块读取的，我暂时就不深究了。内存访问肯定比硬盘IO快很多，所以后一个函数没有什么延迟。演示效果如下：

4 One More Thing

在开发过程中，发现一件奇怪的事情。

编写decompressPCX24bits_fast()的过程中，有这么一句话：

count = bPixel & 0x3F;
bPixel = *tempFileImage++;

导致程序无法编译通过，提示_memset外部函数无法链接。去掉这段话就编译通过了。

观察下百度云上提供的代码，可以发现整个函数中都没有用到memset()，而且这是Stdlib中的函数，怎么会编译成这样？

这件事情困扰了我两天了，也导致这篇博客延后了三天才完成。

具体怎么回事，下一篇中我试着解答一下。

百度云链接：https://pan.baidu.com/s/1gccSosw8_UAGTI5gZPnLCA
提取码：dx23
文件在 16 Display PCX 下

2,818 total views, 1 views today

发表评论 取消回复

发表评论取消回复