python - 使用python的文本文件标题中的条目列表
问题描述
我有一个 .txt 文件,其中有文本标题和数字数据。我正在使用 python 2.7,并在我的工作中使用 pandas 和 numpy。文件结构如下图所示:
这个文件的数据可以从这里得到。在这个文件中,我想获取所有标签的列表。例如,在上图中,我希望列表如下所示:
[Tag1, Tag1, Tag1, Tag5, Tag5, Tag6, Tag6]
目前,我正在使用以下方式读取文件:
df = pd.read_csv('dum.txt',sep='\t', header=[0,1], index_col=0)
当我尝试时lst = df.columns.levels[1]
,我得到Index([u'Tag1', u'Tag5', u'Tag6'], dtype='object', name=u'Tag')
的不是我想要的列表,而是我的输出。
如何获取问题中的标签列表,即[Tag1, Tag1, Tag1, Tag5, Tag5, Tag6, Tag6]
?提前致谢。
解决方案
您可以使用get_level_values(1)
代替levels[1]
,然后使用转换为列表tolist()
:
>>> df.columns.get_level_values(1).tolist()
['Tag1', 'Tag1', 'Tag1', 'Tag5', 'Tag5', 'Tag6', 'Tag6']
原因是levels[1]
,如您所见,这将为您提供所有独特级别的列表,而get_level_values
实际上将返回:
返回请求级别的标签值向量,等于索引的长度
推荐阅读
- python - 在 Python 中使用 datetime 生成一个简单的日期列表
- r - R:通过与另一个函数组合来设置函数的参数
- excel - MS Access VBA 将过滤后的表单导出到 Excel
- python - 将两个excel文件文件夹合二为一
- php - 检测 Word 文档
- c++ - 即使在 C++ 中尝试访问字符串中的非法元素后,也没有 Out_Of_Bounds 错误
- git - 发布新版本时如何使用 git subtrees/branches 排除目录的建议
- javascript - 无法标记通过 javascript 动态检查的复选框
- python - 如何使用数据增强进行图像分类的卷积神经网络在 keras 中获得可重现的结果?
- java - 通过java程序读取另一个软件文件