azure-data-explorer - 'distributed=true' 属性似乎不适用于从查询中提取
问题描述
我正在以下列方式从查询中执行摄取:-
.append async mytable with(distributed=true) <| myquery
由于这是使用 'async' ,我得到了一个 OperationId 来跟踪进度。因此,当我.show operations
针对 OperationsId 发出命令时,我在结果集中得到 2 行。两行的“状态”列值都是“进行中”。其中一行的“NodeId”列值为空白,而另一行为KENGINE000001
. 我的集群有 10 多个工作节点。由于我使用的是 Distribute=true 选项,我是否应该因为这个命令而获得 ~ 10 行?而且我的数据负载也很重,所以它确实是分布式摄取的候选者。所以要么这个属性不起作用,要么我没有正确解释它的用法?
解决方案
由于我使用的是 Distribute=true 选项,我是否应该因为这个命令而获得 ~ 10 行?
不
所以要么这个属性不起作用,要么我没有正确解释它的用法?
可能是后者,或者来自 的输出的错误期望.show operations
,见上文。
async
您可以使用以下命令跟踪命令的状态/状态.show operations <operation_id>
- 如果它在 1 小时后没有达到最终状态(“完成”、“失败”、“节流”等),那是出乎意料的 - 您应该为此打开支持票。
无论如何 - 尝试使用单个命令摄取大量数据(多 GB 或更多)是不明智的,即使它是分布式的。
- 如果这是您尝试做的事情,您应该考虑将摄取分成多个命令,每个命令处理数据的子集。
- 请参阅此处的“备注”部分:https ://docs.microsoft.com/en-us/azure/data-explorer/kusto/management/data-ingestion/ingest-from-query
推荐阅读
- r - 我需要在 OAuth 中添加哪些范围才能按地理位置搜索 YouTube 内容?
- java - Glide 无法从 Room DB 加载图片。大小为 [0x0] 的 null 加载失败
- google-sheets - Sheets中的Arrayformula循环依赖问题
- apache-kafka-streams - 监控 Kafka Streams 中的延迟
- symfony - 如果发现 Symfony 弃用,如何使 Jenkins 构建失败(或将其标记为不稳定)
- angular - 是否可以缩短角度库中的样式导入?
- excel - VBA Excel:加快表的前滚过程
- android - Android BottomSheet 处理活动娱乐上的娱乐
- ros - 如何使用一个凉亭同时创建两张地图?
- amazon-kendra - Kendra 似乎没有在爬取我们的网站(不完全同步)