首页 > 解决方案 > 从 bs4 标签正确解码字符串

问题描述

我正在尝试正确解码这个刮掉的字符串,但我不知道在刮掉它时字符串编码在什么编解码器中:

这是字符串:

s_tag = BeautifulSoup('<b>mặt trong, phía trong, phần trong, bên trong</b>')

但是,当它以这种方式获取字符串时, print(s_tag.string) 我将其作为输出 ->lá»n trong ra ngoà i 如您所见,某些字符已被转换。和utf-encoding is utf-8语言是越南语

我很难找到该怎么做,因为我不知道去哪里找

任何帮助都会很棒

标签: pythonunicodebeautifulsoupdecode

解决方案


推荐阅读