compression - 非字节对齐数据的 gzip 压缩
问题描述
位打包对 gzip 的性能有害吗?假设我有 7 位值并按以下方式打包:
Byte1 Byte2 Byte3 Byte4
[aaaaaaab][bbbbbbcc][cccccddd][dddd...
据我了解,LZ 压缩以字节为基础。7 位中的任何重复模式都将被掩盖。
是否建议为字节对齐添加额外的位以帮助 LZ?
Byte1 Byte2 Byte3 Byte4
[aaaaaaa0][bbbbbbb0][ccccccc0][ddddddd0][...
文献中有这方面的结果吗?
解决方案
可能,是的。如果您的 a、b、c、d 的频率具有重复模式或统计偏差,那么最好填充零位。
知道的方法是简单地测试它。
推荐阅读
- java - 前 K 个频繁元素
- facebook - 使用 AD GraphAPI 在 AD B2C 中创建 Facebook 类型用户
- javascript - 如何仅在鼠标悬停时在树节点的右端显示一个小图标
- android - [[11.0.4,11.0.4]] 的各种其他库正在请求库 com.google.android.gms:play-services-location,但解析为 16.0.0
- javascript - 错误:找不到相对于目录的预设“”
- python - 使用 for/while 循环在数字列表中查找最大值
- node.js - 创建同步的类别和频道
- java - 过滤时列表中的 Nullpointer 异常 - Java
- android - 无法解决:play-services-tasks-license
- sql - 需要存储过程从这两个表中计算