python - 有条件地提取数据帧行时列表索引超出范围
问题描述
提取部分令牌数据帧会引发列表索引超出范围错误。
编辑以显示完整代码
tokens['len'] = tokens['token_raw'].apply(lambda x: len(x))
txt = "this is a sample text"
input_df = pd.DataFrame(txt.lower().split(), columns=['input_text'])
input_df = input_df['input_text'].apply(lambda x: flag_nonword(x))
def flag_nonword(w):
input_len = len(w)+3
tokens_ext = tokens.loc[tokens['len'] < input_len ]
tokens_ext.sort_values('len',ascending=True, inplace = True)
tokens_ext['ed'] = tokens_ext['token_raw'].apply(lambda x:
nltk.edit_distance(w,x))
tokens_ext.sort_values(by=['ed', 'freq'], ascending=[True, False])
return list(tokens_ext.iloc[:6,0])
解决方案
或者两个iloc
s:
def flag_nonword(w):
input_len = len(w)+3
tokens_ext = tokens.loc[tokens['len'] < input_len]
return list(tokens.iloc[:,0].iloc[:6])
推荐阅读
- linux - 某些 xbindkeys 绑定无法通过 .xprofile 工作,需要手动重启进程
- javascript - 如何为 Vue-router 使用 html 索引?
- python - 使用方法链接从同一数据框中的多列中减去一列
- amazon-web-services - 如何解决 Terraform 资源错误 UnauthorizedOperation: This operation does not support shared VPCs
- python - 在每个 epoch 中如何进行数据扩充?
- python - python格式说明符内的变量
- java - 在Java中将数据字符串转换为浮点数
- python - 明智地合并元组列表并将其转换为列表列表
- security - Dependabot/Snyk 工具,例如 Rust 和/或 Elixir 语言
- typescript - 在 TypeScript 中将对象转换为键/值对象