python - 从 bs4 标签正确解码字符串
问题描述
我正在尝试正确解码这个刮掉的字符串,但我不知道在刮掉它时字符串编码在什么编解码器中:
这是字符串:
s_tag = BeautifulSoup('<b>mặt trong, phía trong, phần trong, bên trong</b>')
但是,当它以这种方式获取字符串时,
print(s_tag.string)
我将其作为输出 ->lá»n trong ra ngoà i
如您所见,某些字符已被转换。和utf-encoding is utf-8
语言是越南语
我很难找到该怎么做,因为我不知道去哪里找
任何帮助都会很棒
解决方案
推荐阅读
- javascript - 如何将带空格的字符串编码为html有效ID?
- python - 我正在尝试制作一个不和谐的音乐机器人,但是当我将它输入不和谐时,这些命令都不起作用
- python-3.x - Anaconda3 Spyder 没有启动
- python - 如何让 Sphinx 识别 `:param` 元素?
- javascript - 旋转画布 JS 中的特定元素
- ios - 您可以将 Firebase 添加到 Swift 包中的单元测试中吗?
- laravel - 即使在锚标记的 href 中设置了正确的 id,我的控制器也会在后面加上一个 id
- json - 需要帮助 RxSwift MVVM:无法在线将数据 JSON 加载到表格视图单元格
- c++ - Need help fixing this C++ code (Quadratic Formula solver)
- java - 如何替换html字符串上的常量值?