entropy - 如何计算包含在位串中的信息(或熵)?
问题描述
如何计算包含在位串中的信息(或熵)?
香农的熵方程不是解决方案,它只计算 1 和 0,因此对于字符串:010101... 我得到最大熵,即使字符串是高度有序的,因此它包含少量信息。
自动编码器很有帮助,但你无法判断它们“窃取”了多少信息,换句话说,它们过度拟合了多少。例如,如果我在输入长度为 N-1 的 N 位长字符串上训练它,它只会记住每一位,从而产生 0 信息作为输出。
我知道压缩算法可以做的最好的事情是达到最大熵,结果信息是输出字符串的长度,但我认为这不能很好地概括,再加上这样的算法会是什么?
它与在 n = 1...N 的 n 元组上计算的香农熵有关吗?
我最好的猜测是使用一个 n 位长的子字符串“i”将跟随另一个(“j”)的概率矩阵。
有人可以帮忙吗?
解决方案
推荐阅读
- linux - 如何让本地生成的数据包通过 PREROUTING 链?
- javascript - 试图提取此 html 的一部分。不明白为什么
- express - 将 Stripe webhook 与 graphql-yoga 和 Prisma 一起使用
- amazon-web-services - 试图将文件夹复制到 AWS EC2 实例中:找不到目录?
- mysql - MySQL 中的 GROUP BY 优先级
- angular - APP_INITIALIZER 在 angular6 库中不起作用
- xml - 将不同的两个元素属性拆分为多个重复行
- javascript - Graphql突变返回null,但数据库已更新
- android - nosuchmethod 错误,但是当我使用 android 中提供的方法时存在
- python - 装饰器作为类