首页 > 解决方案 > 从银行读取 html 导出时出错。R$0,64 读作 64 类型 numpy.float64

问题描述

我正在开发一个程序来读取银行的 HTML 导出,以使用 Python 创建一个包含费用的数据框。使用 读取 HTML 文件时df = pd.read_html(io='jan-2020.html'),credits 列将信息读取为 NumPy.float64 并误解了语言环境,因此,0,64(64 美分,逗号作为分隔符)被读取到数据帧中,为 64(64 巴西雷亚尔)而不是0.64(64 美分)。另一个例子,2.650,73 的信用被读作 2.65073(分隔百分位数部分的逗号被简单地忽略)。我认为这与我正在使用的系统的不同区域设置(macOS Catalina 10.15.7)和导出文件的银行系统(巴西银行)有关。如果我跑locale.getlocale()在我的计算机上,我从系统中得到以下答案: ('en_US', 'UTF-8') 如何纠正?我的意思是,如何读取 HTML 导出文件并正确读取正确读取的值(0,64 被读取为 0.64)等等?有趣的是,HTML 导出中下一列中的值被读取为“ str ”,但我已经弄清楚了。

标签: python-3.xpandasdataframelocale

解决方案


推荐阅读