talend - 我能够使用 Talend 作业创建 .csv 文件,并且我想使用 tSystem 组件将 .csv 转换为 .parquet 文件?
问题描述
我有一个创建 .csv 文件的 Talend 作业,现在我想使用 Talend v6.5.1 转换 .parquet 格式。我能想到的唯一选择是 tSystem 组件从本地或 .csv 临时登陆的目录调用 python 脚本。我知道我可以使用 pandas 或 pyspark 轻松转换它,但我不确定相同的代码是否适用于 Talend 中的 tSystem。您能否提供建议或说明-
代码:
import pandas as pd
DF = pd.read_csv("Path")
DF1 = to_parquet(DF)
解决方案
如果您的文件系统上有外部脚本,您可以尝试
"python \"myscript.py\" "
这是 talend 论坛上有关此问题的链接: https ://community.talend.com/t5/Design-and-Development/how-to-execute-a-python-script-file-with-an-argument-using /mp/23975#M3722
推荐阅读
- vue.js - 来自本地机器的 v-binded 图像不会显示,但来自 web 会
- javascript - 当预期结果发生变化时,Electron ipcMain.handle() 不会触发
- scala - 使用并行集合的scala http请求
- c - 插入到 C 语言中的结构或链表中的互斥锁实际上是如何工作的。什么是内部细节?
- c++ - 在丢失元素的情况下使用 .resize()
- apache - Windows 的 nginx 上的 HTTP/2 问题?
- c# - C# 使用 .FindByExp 形成 Linq 查询
- node.js - 找不到节点 repl 模块
- javascript - Delete rows based on the dates present in the adjacent rows
- elasticsearch - MetricBeat kubernetes.apiserver:获取指标时出错