python - 重置索引后无法过滤索引列中包含特定值的行
问题描述
我正在组织一些计划的数据,其中包含计划阶段的信息,P(初步)或 F(最终)。我正在使用pandas 文档中示例中显示的方法。
df1 = pd.read_excel('FilePath', sheetname = 'ForFilter')
df1
landuse_SUB_ID TYPE RECD_DATE PHASE LAND_USE CPACTIONDA
0 24 1 2000-04-07 P ROW 2000-05-04
1 24 1 2000-04-07 P NONE 2000-05-04
2 25 1 2000-08-10 P COMM 2000-09-08
3 34 1 2000-04-14 F REC 2000-04-14
4 34 1 2000-04-14 F SFD 2000-04-14
5 35 1 2000-01-20 P NONE 2000-02-02
6 42 1 2000-04-04 P SFD 2000-05-01
7 42 1 2000-12-06 P SFD 2001-01-03
8 43 1 2000-09-07 P NONE 2000-09-21
9 51 1 2000-11-10 P NONE 2000-11-28
10 53 1 2000-02-22 F SFD 2000-02-22
在使用示例中的方法(使用like
and regex
)之后,在我看来这些方法只能过滤索引列中的值。因此我更改了索引:
df1_filter1 = df1.set_index('PHASE')
landuse_SUB_ID TYPE RECD_DATE LAND_USE CPACTIONDA
PHASE
P 24 1 2000-04-07 ROW 2000-05-04
P 24 1 2000-04-07 NONE 2000-05-04
P 25 1 2000-08-10 COMM 2000-09-08
F 34 1 2000-04-14 REC 2000-04-14
F 34 1 2000-04-14 SFD 2000-04-14
P 35 1 2000-01-20 NONE 2000-02-02
P 42 1 2000-04-04 SFD 2000-05-01
P 42 1 2000-12-06 SFD 2001-01-03
P 43 1 2000-09-07 NONE 2000-09-21
P 51 1 2000-11-10 NONE 2000-11-28
F 53 1 2000-02-22 SFD 2000-02-22
现在数据框Phase
用作索引,我使用like
过滤方法df1_filter1
:
df1_filter1.filter(like = 'F', axis = 0)
我得到错误
“ValueError:无法从重复轴重新索引”
这对我来说似乎是一个非常简单的操作,所以我只是想知道我做错了什么导致了这个错误。对于我的问题,什么是最好的方法(最少的步骤和最干净的代码)。
解决方案
filter
可能直观地感觉是正确的功能,但您几乎可以肯定应该使用它loc
来过滤您的数据(在上面的示例链接中,它在一个黄色的大框中显示“另见:loc”)。对于这个简单的示例,您还可以使用布尔索引:
>>> df1.loc[df1['PHASE'] == 'F'] # or boolean indexing via df1[df1['PHASE'] == 'F']
landuse_SUB_ID TYPE RECD_DATE PHASE LAND_USE CPACTIONDA
3 34 1 2000-04-14 F REC 2000-04-14
4 34 1 2000-04-14 F SFD 2000-04-14
10 53 1 2000-02-22 F SFD 2000-02-22
推荐阅读
- r - Add a new vector to a nested list
- python - Docker:如何容器化从终端获取输入的控制台应用程序
- ruby - Windows 上的 Ruby PATH 噩梦——PATH 变量不起作用
- php - 如何修复 json 对象错误地添加到数据库?
- javascript - 将此代码段从 Perl 转换为 Javascript
- jquery - 如何使用 Jquery tablesorter 对包含 Kbps Mbps Gbps 的列进行排序?
- python - 如何在python中获取pandas的x和y值对
- r - Cowplot Package: How to align legends vertically downwards after arranging many plots into one plot using plot_grid() in R
- php - 如何消除 Json 编码 Yii2 中的 null 值?
- java - 如何调用堆栈中所有对象的 toString() 方法?