python - 如果句子列中少于 4 个字符,如何删除数据框行?
问题描述
假设我已经在我的数据框中标记了这样的句子:
+-----------------------------------------+-----------+
| sentence | sentiment |
+-----------------------------------------+-----------+
| [i, like, this, app, it, s, awesome] | positive |
| [way, to, many, ads, pop, up, hate, it] | negative |
| [ye] | negative |
| [p] | positive |
| [niceeeee] | positive |
| [i, do, not, like, the, design] | negative |
| [very, useful, recommended] | positive |
| [ugly] | negative |
| [xxx] | negative |
| [yes] | positive |
+-----------------------------------------+-----------+
如果句子列少于 4 个字符,我想通过删除 df 行从数据框中清除不必要的数据,因此最终结果将是这样的:
+-----------------------------------------+-----------+
| sentence | sentiment |
+-----------------------------------------+-----------+
| [i, like, this, app, it, s, awesome] | positive |
| [way, to, many, ads, pop, up, hate, it] | negative |
| [niceeeee] | positive |
| [i, do, not, like, the, design] | negative |
| [very, useful, recommended] | positive |
| [ugly] | negative |
+-----------------------------------------+-----------+
有没有人可以提供程序代码来解决这个问题?我将非常感谢您的帮助,这将有助于我的论文工作,感谢您的关注
解决方案
您可以apply
为此使用功能
char_limit=4
df[df['sentence'].apply(lambda x : len("".join(x))>=char_limit)]
推荐阅读
- c# - 装箱/拆箱,更改装箱值的引用副本不会反映到装箱值
- sql - 嵌套选择以计算项目并将它们汇总到 MS Access 的新列中
- apache-spark - 过滤包含 udf 转换表的数据帧时 Spark 失败
- python - ImportError:缺少必需的依赖项 ['numpy']。没有什么帮助
- allure - 如何将硒与魅力融为一体
- woocommerce - 在结帐页面上显示产品图片+名称
- c++ - typedef 是否应该同时在类定义和类声明中?
- c++ - 替换/覆盖 Windows CRT 以进行低级调试
- c# - 负载均衡器环境中的替代 SignalR Redis 实现
- java - 有没有办法将我的文件系统用作缓存?