首页 > 解决方案 > Ruby - 解包混合类型的数组

问题描述

我正在尝试用来unpack解码二进制文件。二进制文件具有以下结构:

ABCDEF\tFFFABCDEF\tFFFF....

在哪里

ABCDEF -> String of fixed length
\t -> tab character
FFF -> 3 Floats
.... -> repeat thousands of times

当类型都相同或只有数字和固定长度的数组时,我知道该怎么做,但我在这种情况下很挣扎。例如,如果我有一个浮动列表,我会做

s.unpack('F*')

或者如果我有整数和浮点数

[1, 3.4, 5.2, 4, 2.3, 7.8]

我会做

s.unpack('CF2CF2')

但在这种情况下,我有点失落。我希望使用带括号的格式字符串,例如 `(CF2)*',但它不起作用。

如果这很重要,我需要使用 Ruby 2.0.0-p247

例子

ary = ["ABCDEF\t", 3.4, 5.6, 9.1, "FEDCBA\t", 2.5, 8.9, 3.1]
s = ary.pack('P7fffP7fff')

然后

s.scan(/.{19}/)
["\xA8lf\xF9\xD4\x7F\x00\x00\x9A\x99Y@33\xB3@\x9A\x99\x11", "A\x80lf\xF9\xD4\x7F\x00\x00\x00\x00 @ff\x0EAff"]

最后

s.scan(/.{19}/).map{ |item| item.unpack('P7fff') }
Error: #<ArgumentError: no associated pointer>
<main>:in `unpack'
<main>:in `block in <main>'
<main>:in `map'
<main>:in `<main>'

标签: rubybinaryfilesbinary-datapackunpack

解决方案


您可以以 19 字节的小块读取文件并用于'A7fff'打包和解包。不要使用指向结构 ('p''P') 的指针,因为它们需要超过 19 个字节来编码您的信息。您也可以使用'A6xfff'忽略第 7 个字节并获取一个包含 6 个字符的字符串。

这是一个示例,类似于以下文档IO.read

data = [["ABCDEF\t", 3.4, 5.6, 9.1], 
        ["FEDCBA\t", 2.5, 8.9, 3.1]]
binary_file = 'data.bin'
chunk_size = 19
pattern = 'A7fff'

File.open(binary_file, 'wb') do |o|
  data.each do |row|
    o.write row.pack(pattern)
  end
end

raise "Something went wrong. Please check data, pattern and chunk_size." unless File.size(binary_file) == data.length * chunk_size

File.open(binary_file, 'rb') do |f|
  while record = f.read(chunk_size)
    puts '%s %g %g %g' % record.unpack(pattern)
  end
end
# =>
#    ABCDEF   3.4 5.6 9.1
#    FEDCBA   2.5 8.9 3.1

如果您的文件很大,您可以使用多个19来加快处理速度。


推荐阅读