python - 管道在kedro中找不到节点
问题描述
我正在关注管道教程,创建所有需要的文件,启动了 kedro,kedro run --node=preprocessing_data
但遇到了这样的错误消息:
ValueError: Pipeline does not contain nodes named ['preprocessing_data'].
如果我在没有参数的情况下运行 kedro node
,我会收到
kedro.context.context.KedroContextError: Pipeline contains no nodes
文件内容:
src/project/pipelines/data_engineering/nodes.py
def preprocess_data(data: SparkDataSet) -> None:
print(data)
return
src/project/pipelines/data_engineering/pipeline.py
def create_pipeline(**kwargs):
return Pipeline(
[
node(
func=preprocess_data,
inputs="data",
outputs="preprocessed_data",
name="preprocessing_data",
),
]
)
src/project/pipeline.py
def create_pipelines(**kwargs) -> Dict[str, Pipeline]:
de_pipeline = de.create_pipeline()
return {
"de": de_pipeline,
"__default__": Pipeline([])
}
解决方案
我认为您似乎需要在__default__
. 例如
def create_pipelines(**kwargs) -> Dict[str, Pipeline]:
de_pipeline = de.create_pipeline()
return {
"de": data_engineering_pipeline,
"__default__": data_engineering_pipeline
}
然后kedro run --node=preprocessing_data
为我工作。
推荐阅读
- r - 如何对时间序列进行二次采样(GPS 位置突发)
- r - 这里的 goto 语句(来自例如 c++)的 r 等价物是什么?
- jena - 耶拿 org.apache.jena.sparql.core.GraphView 的目的是什么
- c# - 使用 linq 分隔特殊字符所在的字符串
- javascript - 将 snap svg 画布信息保存到 xml
- c# - 使用 Bluebeam 的 Revit 打印 PDF
- javascript - 如何使按钮单击然后使用reactjs打开图像
- javascript - 如何根据当前项目在 Object.keys 循环内运行 Firebase 查询,而不会导致“等待必须在异步函数错误内”
- for-loop - 批处理文件 - 如果文件夹为空,如何退出循环
- huggingface-transformers - 是否有“未经训练”的 gpt 模型文件夹?