snowflake-cloud-data-platform - 如何在雪花的层次结构中处理或存储多值维度?
问题描述
我有一个场景,我在 tableau 报告中具有多值维度及其层次结构,我必须保留数据,以便 tableau 不会使任何有线 sql 或数据加载也变得简单和未来可扩展。
我的尺寸如下:
|----------+------------------------------------------------------+-----------------------|
| Product | Product_category | Product_Weight_GM |
|----------+------------------------------------------------------+-----------------------|
| Rice Bag | medium grains,small grain,long grain,small grain | 1000,5000,10000,25000 |
| Wheat | small grain,medium grains,normal grain,medium grains | 100,200,500,800 |
|----------+------------------------------------------------------+-----------------------|
所以产品重量是一个层次结构,我可以通过维度模型的策略来实现。
解决方案
这些数据对我来说似乎不是分层的。我可以看到的每个(粒度?)之间没有定义关系。此外,您似乎在每行中多次列出了一些晶粒尺寸,这似乎不正确。如果没有更多关于“产品”是什么的背景,那么我会建议像他这样的东西:
|----------+------------------+-------------------|
| Product | Product_category | Product_Weight_GM |
|----------+------------------+-------------------|
| Rice Bag | medium grains | 1000 |
| Rice Bag | small grain | 5000 |
| Rice Bag | long grain | 10000 |
| Rice Bag | small grain | 25000 |
| Wheat | small grain | 100 |
| Wheat | medium grains | 200 |
| Wheat | normal grain | 500 |
| Wheat | medium grains | 800 |
|----------+------------------+-------------------|
推荐阅读
- javascript - 如何使用 javascript 推送评论?
- r - 选择另一个标记后,如何清除已添加到传单地图的标记?
- iis - 诊断在 IIS 上运行的网站中的零星锁定
- java - 当我尝试在 JPQL 中使用 Case 语句时出现问题
- python - 比较不同 pandas 数据集中的 2 列,如果值存在于第二个数据集中,则替换值
- javascript - 如何与 momentjs 约会?
- c++ - 插入 unordered_map 时的 bad_alloc
- automated-tests - 如何使用绝对路径而不是类路径来读取文件
- c# - 在 Jpath 中转义单引号
- python-3.x - 无法从命令行运行 tensorboard 来评估我的模型的效率