论文研究-基于PDC编码的中文文本压缩算法.pdf - 源码 - 源码 - 免费下载

论文研究-基于PDC编码的中文文本压缩算法.pdf

文件大小： 487k

源码售价： 10 个金币积分规则积分充值

资源说明：针对中文文本结构的特点以及传统压缩算法对中文文本压缩的不足，提出并实现了一个基于PDC编码的中文文本压缩算法。该算法采用的是字典压缩方式。根据单个汉字在中文文本出现的概率，采用Huffman编码方式进行前缀变长编码；定义由某个汉字为前缀的词组和短语的深度；对具有相同前缀和相同深度的词组和短语进行局部的定长编码，构成一部压缩编码字典。通过对相同文本分别使用该算法和传统的LZW和LZSS编码算法压缩后得到的数据结果对比，压缩率有2.53%~40.48%的提高，表明该压缩算法有较好的压缩效果。

部分文件列表（点击文件名可查看文件内容）

					
									本源码包内暂不包含可直接显示的源代码文件，请下载源码包。