资料压缩比

资料压缩比,或简称作压缩比,是电脑科学资讯理论中用来评断资料压缩演算法好坏的指标之一。通常可借由资料压缩比得知资料被压缩的程度,进而判断缩压演算法的优劣。

定义

资料压缩比的定义如下:

资料压缩比 

 为资料压缩前的位元数(资料量大小), 为资料压缩后的位元数。

此外,也有人定义节省空间比率:

节省空间率 

举例而言,假设一张灰阶图片每个画素均用16位元表示(16 bit/pixel or 16 bpp),而压缩后的图片每个画素均用4位元表示,则资料压缩比为16/4 = 4,换言之,此压缩演算法减少了1-(4/16) = 75%的资料量。

一般而言,任何资料压缩演算法,无论是有损压缩演算法或是无损压缩演算法,其资料压缩比理论上必大于1。因为资料压缩后的位元数理论上应小于资料压缩前的位元数,不然就没有达到减少资料量的效果了。资料压缩比越大代表著资料被压缩的越小。

然而,当资料压缩比越大时并不代表资料压缩演算法越好,因为资料压缩比可借由牺牲重建资料的品质来提升。所以资料压缩比大的演算法可能意味著重建资讯会有很严重的失真情形。

要评估资料压缩演算法的好坏,需同时考虑资料压缩比、重建资料品质与演算法计算复杂度...等等。

无损压缩

无损压缩是资料压缩演算法的其中一个类别,无损压缩指的是资料在进行压缩时不会受损,在解压缩后仍可回到原样,它的好处是能将档案还原回原貌,不会有失真的情形发生。但相对的,无损压缩能获得的资料压缩比会比较小。

有损压缩

有损压缩,或称为破坏性资料压缩,也是资料压缩演算法的其中一个类别,它指的是资料在进行压缩时会受损,以至解压缩后的资料无法还原回原貌,会有失真的情形。它的道理简单来说就是牺牲掉一些讯息以换取更小的资料量。与无损压缩相比,有损压缩演算法的优点是能有较大资料压缩比,但缺点是解压缩后的资料会有失真的情形。常见的有损资料压缩有JPEGMP3......等等。

参考资料