python - 在python中转换为纯文本
问题描述
我有一个数据"albums"
框列"Album"
(例如,除了我拥有的文本之外,似乎还有一些编码,例如代替文本中的撇号。"Album 2"
utf-8
"Précis"
"Pr\xc3\xa9cis."
HTML
"\'"
有没有一种简单的方法可以将所有内容转换为纯文本,而无需搜索和替换每个可能的 utf/unicode/html?
解决方案
因为\xc3\xa9
你需要组合encode()
和decode()
与raw_unicode_escape
print( "Pr\xc3\xa9cis.".encode('raw_unicode_escape').decode() )
文档:编解码器Python 特定编码
并为'
您需要html.unescape
import html
print(html.unescape("'"))
文档:html
推荐阅读
- python - 从 JSON 变量中提取值
- javascript - 初始化将在 React 中接收数字的空状态
- angular - NgFor 仅支持绑定到 Iterables,例如 Arrays angular8
- postgresql - Postgres 在哪里被忽略?
- xcode - Xcode 11 中的差异在哪里?
- c# - 从 ASP.NET SOAP 服务检索 XML 数据到 ASP.NET aspx 页面
- python - Django 性能,APIView 与 ViewSet
- angular - Angular Forms - 从 ValueChange 获取变化
- apache-camel - 在 Apache Camel 路由中定义非空映射变量
- google-apps-script - 从一个工作表复制查询函数的结果,并将其附加到不同文件中另一个工作表的末尾