首页 > 解决方案 > 高效的字节查找表

问题描述

我需要将原始字节解包为位。现在我有一个原始数据和一个查找表。迭代输入数据以生成输出的最有效方法是什么?或者也许还有另一种方法可以做到这一点?

#Look up table looks something like this.
lookup = {
  0: b'\x00\x00\x00\x00\x00\x00\x00\x00',
  1: b'\x00\x00\x00\x00\x00\x00\x00\x01',
  2: b'\x00\x00\x00\x00\x00\x00\x01\x00',
  ...
  255: b'\x01\x01\x01\x01\x01\x01\x01\x01',
}

def remap(data):
  out = [lookup(byte) for byte in data]
  row = b''.join(out)

以下是最耗时的函数:

ncalls  tottime  percall  cumtime  percall filename:lineno(function)
44000    2.843    0.000    2.843    0.000 main.py:59(<listcomp>)
44007    0.593    0.000    0.593    0.000 {method 'join' of 'bytes' objects}

标签: pythonperformancelookup

解决方案


事实证明我的猜测是完全错误的。但这些评论有有趣的解读,说明为什么会这样。


在这里,我给出了两个微不足道的改进,希望可以稍微提高运行时性能。

首先,您的查找表将自然数作为键。这是一个列表。

lookup = [
  b'\x00\x00\x00\x00\x00\x00\x00\x00',
  b'\x00\x00\x00\x00\x00\x00\x00\x01',
  b'\x00\x00\x00\x00\x00\x00\x01\x00',
  ...
  b'\x01\x01\x01\x01\x01\x01\x01\x01',
]

其次,不要构造列表然后输入它来加入,而是使用generator.

def remap(data):
    return b''.join(lookup[byte] for byte in data)

但是您可能还想在这个问题中测试想法:

在python中将整数转换为二进制


也许这也符合您的需要,但它提供了列表而不是 bstring。

https://docs.scipy.org/doc/numpy-1.13.0/reference/generated/numpy.unpackbits.html#numpy.unpackbits


推荐阅读