python - 将熊猫数据框导出到配置单元表的最佳方法是什么?
问题描述
我在这里(以及许多其他地方)寻求帮助:
但我认为我并不完全理解所提出的建议,因为我对其中任何一个都失败了
我想做的是:
- 从 hive 表中从 schema1 提取数据到 python 数据框。
- 对列进行一些操作并保存为 pandas 数据框。
- 将 pandas 数据框导出到配置单元表 schema2。
我将第 1-2 点提出如下:
- 从 hive 表中提取数据到 python 数据框。
transport = puretransport.transport_factory(host='my_host_name',
port=10000,
username='my_username',
password='my_password',
use_ssl=True)
engine = db.create_engine(f"hive://my_username@/schema1",
connect_args={'thrift_transport': transport})
print("Selecting data from table", end=" ")
tab1 = []
for chunk in pd.read_sql_query(
"""select * from schema1.my_table""", con=engine, chunksize=5):
tab1.append(chunk)
df = pd.concat(tab1)
print("DONE")
- 对列进行一些操作并保存为 pandas 数据框。
my_code_returning_dataframe...
- 将 pandas 数据框导出到配置单元表 schema2。
what_should_i_do_there?
预先感谢您的任何帮助。
解决方案
推荐阅读
- python - 即使机器人重新加载,也会保留记忆角色反应消息的系统
- typescript - 打字稿的苗条事件参数类型
- javascript - 如何检查安卓设备上的元素
- javascript - 向 Spotify 发出 GET 请求
- python - 由其角点定义的边界框对象的嵌套属性
- reactjs - 类型'IntrinsicAttributes & RefAttributes 上不存在属性'item'
>'.ts(2322) - c++ - 矩阵C ++每行中的最小元素
- python - Python,打开一张照片 WIndows Live Photo Gallery 并在最后关闭它
- javascript - 在云功能冷启动期间,node_modules 文件夹的大小是否重要?
- python - Maya中的对象及时旋转