python - 如何选择在 Kedro CSVLocalDataSet 中加载哪些列?
问题描述
我有一个csv
看起来像的文件
a,b,c,d
1,2,3,4
5,6,7,8
我想将它作为 Kedro 加载CSVLocalDataSet
,但我不想读取整个文件。我只想要几列(比如说a
和b
例如)。
我有什么方法可以指定要读取/加载的列列表吗?
解决方案
CSVLocalDataSet 使用pandas.read_csv,它采用“usecols”参数。它可以通过使用load_args
dataset 参数轻松代理(所有数据集都支持通过load_args
和传递的附加参数save_args
):
my_cool_data:
type: CSVLocalDataSet
filepath: data/path.csv
load_args:
usecols: ['a', 'b']
另请注意,相同的参数适用于任何基于 pandas 的数据集。
推荐阅读
- naudio - 录音的分贝比“无声”录音低
- javascript - 如何在悬停时在图像上添加带有文本的有色蒙版
- javascript - Javascript - 对象数组唯一且适当的过滤
- scroll - Flutter:在滚动时更改小部件不透明度和颜色的最佳方法
- java - 在使用两个分数进行简单操作时遇到问题
- python-3.x - 我刚刚使用 conda 将 python 从 3.6 更新到 3.7,现在 conda 不起作用
- python - 通过贝宝登录导航时,Selenium webdriver 停止且没有错误消息
- python - libnotify 通知控制台,而不是 $DISPLAY?
- excel - 在excel中,我如何将“AB”视为与“BA”相同的类别
- node.js - 我在本地 nodejs 应用程序上运行 redis(docker image)