python-3.x - 从银行读取 html 导出时出错。R$0,64 读作 64 类型 numpy.float64
问题描述
我正在开发一个程序来读取银行的 HTML 导出,以使用 Python 创建一个包含费用的数据框。使用 读取 HTML 文件时df = pd.read_html(io='jan-2020.html')
,credits 列将信息读取为 NumPy.float64 并误解了语言环境,因此,0,64(64 美分,逗号作为分隔符)被读取到数据帧中,为 64(64 巴西雷亚尔)而不是0.64(64 美分)。另一个例子,2.650,73 的信用被读作 2.65073(分隔百分位数部分的逗号被简单地忽略)。我认为这与我正在使用的系统的不同区域设置(macOS Catalina 10.15.7)和导出文件的银行系统(巴西银行)有关。如果我跑locale.getlocale()
在我的计算机上,我从系统中得到以下答案: ('en_US', 'UTF-8') 如何纠正?我的意思是,如何读取 HTML 导出文件并正确读取正确读取的值(0,64 被读取为 0.64)等等?有趣的是,HTML 导出中下一列中的值被读取为“ str ”,但我已经弄清楚了。
解决方案
推荐阅读
- php - 显示来自 3 个表 Laravel 的数据
- angular6 - Angular6 datepicker ng改变
- python-3.x - python 3.7.0 mypy 0.641 使用 UserList 扩展 python 列表?
- scikit-learn - 加载并使用保存的 Keras model.h5
- python - 如何在 seaborn 中加载 3D numpy 数组作为数据框
- visual-studio - 可以找到MSBuild 15.0的注册表
- excel - 有没有办法模拟系统日期?
- php - 从eval()中的数组动态替换数据?
- xaml - Xamarin 在图像周围形成自定义框架形状
- javascript - 如何在表格中创建效果行跨度