首页 > 解决方案 > Gzip 文件:提取无法按预期工作

问题描述

使用 gzip 文件时,我遇到了这个非常奇怪的问题。我正在尝试下载此文件https://www.sec.gov/Archives/edgar/daily-index/2014/QTR2/master.20140402.idx.gz

当我查看存档中文件的内容时,它是完美的。

但是,当我解压缩内容并尝试查看它们时,一切都是胡言乱语。

文件有问题还是我在这里看不到任何东西?

标签: filezipgzipgunzip

解决方案


如果我没记错的话,一个 idx 文件就是一个 Java 文件。它也可以是纯文本存档格式,在这种情况下就是这样。

在 Linux 上,尝试运行

gunzip master.20140402.idx.gz

这会将其提取到一个 idx 文件中,您应该可以使用任何文本阅读器(例如 vi)打开该文件,因为 vi 几乎可以打开任何东西。

在 Windows 上,您可以从命令行使用 WinZip,其中:

wzunzip -d master.20140402.idx.gz

然后,您可以使用 IE、Edge 或 Wordpad 之类的工具来尝试检查文件,这些文件应该会自动加载可读的环境。

编辑:

因此,我下载了该文件,并且能够使用我上面的命令在 vi、IE 和 Wordpad 中提取和查看它,所以如果您看到乱码,请尝试重新下载它。它应该是 .gz 格式的 104kb,并提取 533kb。


推荐阅读