首页 > 解决方案 > 磁盘上的存储大小可以比压缩后的大小减少 20%

问题描述

https://docs.microsoft.com/en-us/power-bi/connect-data/service-dataset-modes-understand

它写道:“刷新时,数据被压缩和优化,然后由 VertiPaq 存储引擎存储到磁盘。当从磁盘加载到内存中时,可以看到 10 倍压缩。因此,可以合理地预期 10 GB 的源数据可以压缩到大约 1 GB 大小。磁盘上的存储大小可以比压缩后的大小减少 20%。”

  1. 因此,源数据在存储到磁盘时会被压缩。压缩量是多少?

  2. 当数据从磁盘加载到内存时,会进行 10 倍压缩。

  3. 以下是什么意思:磁盘上的存储大小可以比压缩后的大小减少 20%。

标签: powerbi

解决方案


假设您的源是 10 GB 的未压缩文本格式,例如 CSV 文件。

当您将该文件加载到 Power BI 中时,VertiPaq 引擎会以一种特别有效的格式压缩该数据,如果大多数列没有与行数几乎一样多的不同值(低基数)。此处此处有关压缩的更多详细信息。压缩后,模型可能只需要 1 GB 的工作内存,因为它的格式更有效。查看这篇文章,了解有关减小文件大小的提示。

当您将 PBIX 文件保存到磁盘时,会进行更多压缩,因为内存中保持快速运行所需的一些空间不需要显式存储到磁盘,因此保存的 PBIX 可能只有 800 MB即使任务管理器显示它消耗 1 GB RAM,您的硬盘驱动器也是如此。


推荐阅读