首页 > 解决方案 > 如何转换 subprocess.Popen() 返回的字符串的编码?

问题描述

我正在尝试使用 subprocess.Popen() 执行命令并使用以下代码提取结果。

proc = subprocess.Popen([command], stdout=subprocess.PIPE, shell=True)
(out, err) = proc.communicate()
gadgets = out.split('\n')

结果是一个字符串,可以根据结果中的换行符拆分成多行。为简单起见,我们假设代码片段中的 gadgets 变量是两个字符串的列表。当我使用 python print() 函数从控制台上的列表中打印单个项目时,我得到如下正常的 ascii 文本。

for item in gadgets:
    print(item)

输出:

syscall; 
xlatb; ret;

但是,当我打印列表时,我得到了不同类型的字符。输出如下:

print(gadgets)

输出:

['\x1b[1;33msyscall\x1b[0m\x1b[1;34m; \x1b[0m', '\x1b[1;33mxlatb\x1b[0m\x1b[1;34m; \x1b[0m\x1b[1;33mret\x1b[0m\x1b[1;34m; \x1b[0m']

我相信 print() 函数会以某种方式更改编码并在控制台上为各个项目打印正常的 ascii 文本。谁能告诉我在这种情况下 print() 函数使用哪种编码?谢谢!

标签: pythonstringcharacter-encodingdecodeencode

解决方案


第二个输出具有用于颜色的 ANSI 转义字符。从第二个输出中删除 ANSI 转义字符将提供第一个输出。

此链接 [ https://stackoverflow.com/a/14693789/3114833]描述了删除 ANSI 转义字符的方法。以下代码是从链接中复制的。

import re

ansi_escape = re.compile(r'\x1B\[[0-?]*[ -/]*[@-~]')
ansi_escape.sub('', sometext)

推荐阅读