python-3.x - 在将制表符分隔的文件导入数据框时定义 dtypes
问题描述
由于某些数据不明确(例如,应解释为字符串而不是整数的客户编号),我正在使用 dtype 选项 (pd.read_table('BSC.csv', dtype=str)。
它工作正常,因为 Pandas 不再抱怨模棱两可的类型。然而,当我将数据帧存储在 HDFStore 中时,我收到了一个抱怨,即使用无类型对象会导致性能损失。我使用 .dtypes 查看了我的数据框,发现所有类型都移回了“对象”。
我查看了 Pandas.read_table 文档,但没有找到任何可以在导入后将类型冻结为字符串的设置。这是否意味着唯一的选择是在存储数据帧之前使用 .apply(to_string) 步骤?
解决方案
推荐阅读
- c++ - 为什么编译器不能优化这个 std::string 构造?
- jquery - 如何获取特定的html元素
- hive - HIVE Select 与 Concat 一样不起作用
- node.js - 从节点服务器流式传输图像数据会导致文件损坏 (gridfs-stream)
- python - 每第 N 次迭代写入不同的文件?
- r - .Rprofile 没有来源
- swift - 为什么更新视图时我的数组是空的?(迅速)
- server-side - Gtag.js optmize server_side 实现不起作用
- php - 我正在使用 foreach 遍历一个数组并向每个号码发送短信,但不能这样做。它只发送给一个
- javafx - 向应用程序中的多个场景添加 CSS