azure-data-factory - 为什么数据流接收器缓存没有所有数据预览结果?
问题描述
当使用缓存接收器与数据集接收器时,我发现数据流结果存在显着差异。我重新创建了一个简单的示例来演示。
我将一个简单的 JSON 文件上传到 Azure Data Lake Storage Gen 2:
{
"data": [
{
"id": 123,
"name": "ABC"
},
{
"id": 456,
"name": "DEF"
},
{
"id": 789,
"name": "GHI"
}
]
}
我创建了一个简单的数据流来加载这个 JSON 文件,将其展平,然后通过接收器返回它。我主要对使用 Cache Sink 感兴趣,因为输出很小,我最终将需要输出用于下一个管道步骤。(已检查写入活动输出。)
您可以看到数据预览显示了所有 3 行。(在这个例子中我有两个接收器只是因为我在说明它们不匹配。)
接下来,我创建一个管道来运行数据流:
现在,当我调试它时,数据流输出只显示 1 条记录:
"output": {
"TestCacheSink": {
"value": [
{
"id": 123,
"name": "ABC"
}
],
"count": 1
}
},
但是,第二个数据集接收器包含所有 3 条记录:
{"id":123,"name":"ABC"}
{"id":456,"name":"DEF"}
{"id":789,"name":"GHI"}
我希望缓存接收器的输出也有 3 条记录。 为什么会有差异?
解决方案
推荐阅读
- ios - App Crash (SIGABRT) 仅在 AppStore Review 中,不在 Sim 或我的硬件中
- python - 如何将线性字符串变成特里?
- javascript - 如何在javascript中清空数组数组?
- java - 为什么这不会从我的 java 列表中删除重复项?
- pandas - 使用 Datetime 转换 pandas 数据框列(字符串)
- angular - 无法投影
s 到自定义组件中 - node.js - 显示特定帖子 ID 的聊天消息
- c# - 参考另一个模型的模型中的 MVC List<> 错误
- javascript - 从日期时间选择器到验证
- three.js - 使用 Three.js 将边缘线添加到 3D 对象