首页 > 解决方案 > 如何在不更改变音符号的情况下将数据帧转换为字节?

问题描述

我有一个带有变音符号的数据框。当我将数据帧编码为字节时,它会更改所有变音符号,无论将编码设置为“utf-8”。

这是一个小例子:

data = {"Land" : ["Österreich", "Dänemark", "Detuschland"], "Column2" : ["äöü", "ÄÖÜ", "ß$'"]}
df = pd.DataFrame(data)
df

在此处输入图像描述

byteData = df.to_csv(index=False, encoding='utf-8').encode()
byteData

Output: b"Land,Column2\r\n\xc3\x96sterreich,\xc3\xa4\xc3\xb6\xc3\xbc\r\nD\xc3\xa4nemark,\xc3\x84\xc3\x96\xc3\x9c\r\nDetuschland,\xc3\x9f$'\r\n"

有没有办法防止这种情况?

标签: pythonpandasdataframebytesio

解决方案


尝试encoding='cp1252'改用 ;)


推荐阅读