首页 > 解决方案 > Pandas html 到 df - 数字中的逗号

问题描述

我是 Python 的新手。我需要从波兰语网页下载一些表格。我对数字中的逗号有疑问,因为熊猫似乎删除了它们?例如:

import pandas as pd
x = pd.read_html('https://www.gpw.pl/wskazniki', encoding='utf-8', decimal=",")[1]

C/WK列中"021"的结果是"0,21"。如何正确下载或更改为"0.21". 谢谢

标签: pythonpandasdataframe

解决方案


问题在于千位分隔符,它也默认为 common。

要读取数据并正确解析,请使用:

pd.read_html('https://www.gpw.pl/wskazniki',encoding = 'utf-8', decimal=',', thousands='.')[1]

结果是: 在此处输入图像描述


推荐阅读