file - Gzip 文件:提取无法按预期工作
问题描述
使用 gzip 文件时,我遇到了这个非常奇怪的问题。我正在尝试下载此文件https://www.sec.gov/Archives/edgar/daily-index/2014/QTR2/master.20140402.idx.gz
当我查看存档中文件的内容时,它是完美的。
但是,当我解压缩内容并尝试查看它们时,一切都是胡言乱语。
文件有问题还是我在这里看不到任何东西?
解决方案
如果我没记错的话,一个 idx 文件就是一个 Java 文件。它也可以是纯文本存档格式,在这种情况下就是这样。
在 Linux 上,尝试运行
gunzip master.20140402.idx.gz
这会将其提取到一个 idx 文件中,您应该可以使用任何文本阅读器(例如 vi)打开该文件,因为 vi 几乎可以打开任何东西。
在 Windows 上,您可以从命令行使用 WinZip,其中:
wzunzip -d master.20140402.idx.gz
然后,您可以使用 IE、Edge 或 Wordpad 之类的工具来尝试检查文件,这些文件应该会自动加载可读的环境。
编辑:
因此,我下载了该文件,并且能够使用我上面的命令在 vi、IE 和 Wordpad 中提取和查看它,所以如果您看到乱码,请尝试重新下载它。它应该是 .gz 格式的 104kb,并提取 533kb。
推荐阅读
- android - Expo - 当应用程序关闭时运行后台任务
- database-design - Back4App 支持用户数据隔离
- python - Seaborn 箱线图在图上截断
- postgresql - tksheet 和 postgresql 数据库(如何从 tksheet 更新数据库)
- reactjs - 为什么显示 flex 对 reactJS 中的 body 没有影响?
- c++ - 使用 Flatbuffers 有效存储来自不同类的 c++ 对象列表的好方法是什么?
- swift - 当通过算法不断改变视图的状态时,如何动态地重新渲染视图?
- java - Java Spring Application - 关于在同一服务器中使用 Shell 脚本在 application-env.properties 文件中分配变量值
- apache-spark - 测试 Sedona VIZ 示例时出错
- python - 如何使它不重复?