lzw算法

LZW算法详解

可紊 提交于 2020-01-28 16:55:43
1. LZW算法简介 LZW算法又叫“串表压缩算法”就是通过建立一个字符串表,用较短的代码来表示较长的字符串来实现压缩,是一种无损压缩算法。 LZW压缩有三个重要的对象:数据流(CharStream)、编码流(CodeStream)和编译表(String Table)。在编码时,数据流是输入对象(文本文件的据序列),编码流就是输出对象(经过压缩运算的编码数据);在解码时,编码流则是输入对象,数据流是输出对象;而编译表是在编码和解码时都须要用借助的对象。 其中在编码和解码时编译表(下面称为字典),是中间产物,在编码和解码后删除即可。 2. LZW编码算法手动模拟 现在我们先假设一个简单的场景以便我们理解,假设我们现在对 ILOVEYOUILOVEYOU 这一串只有 大写字母A-Z的序列进行压缩。 因为这段序列中只有字母A-Z那么我们只需要下面这个字典就可以一定可以编码这个序列。 Code 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 Seq A B C D E F G H I J K L M N O P Q R S T U V W X Y Z 现在我们设想如果字典里有我们要编码的序列的子序列的话,例如字典中有(27,“YOU”)这一项,那么我们编码序列的长度与原来相比肯定更优

TIFF图像文件(四):LZW压缩

只谈情不闲聊 提交于 2019-12-17 13:51:21
LZW压缩算法是Unisys的专利,由Lempel-Ziv-Welch三人发明,有效期到2003年。 LZW思路: ASCII字符有255个,每个用8bits表示,如果要表示2个字符,就用16bits;3个字符就用24bits,依此类推。假设我们对ASCII码扩展成12位,可以有4096个字符,并自己定义255以后的含义,如ab定义成258,abc定义成259,那么ab只用12位,较原来节约4位;abc也只用12位,较原来24bits节约12位,可以想象,代替的字符串越长,位数越节约。一般LZW压缩比为2:1或3:1。这是以前系统内存以及存储能力较小,为提高计算和存储能力而设计的。到现在,计算机性能突飞猛进,其优势就不复存在。 LZW核心是在于其压缩算法——动态生成压缩字典,自动还原压缩字典进行解压,压缩数据内含压缩字典,边压缩边生成压缩字典,但不保存;解压时,边解压边还原压缩字典,进行解压。 压缩 生成压缩字典就是如何将255个的ASCII码动态扩展成4096个字符码的过程。 (1)形成关键字为255个ascii码,值为0~255的初始字典,设定clearcode=256,endcode=257。(clearcode是为了在解压时避免扩展字典容量超过4096时,告诉程序以后的压缩数据的压缩字典重新计算;endcode表示结束) (2)读取一个字符(input),和根字符(root