python - 在电子表格中我称为“Bio”的列中删除带有“hate”一词的行
问题描述
我想在下面的代码中添加一行我在 Phyton 中使用的代码,这样它将删除第一列中所有带有单词“hate”的行,即“Bio”:
import pandas as pd
from datetime import datetime
INPUT_FILE = 'Sample spreadsheet.xlsx'
OUTPUT_FILE = 'Output.xlsx'
df = pd.read_excel(INPUT_FILE)
df.dropna(subset=['Location', 'Full name'], inplace=True)
df = df[(df['Followers'] > 200) & (df['Friends'] > 200) & (df['Last tweet'] > '2011-04-12') & (df['Created'] < '2018-12-31')]
with pd.ExcelWriter(OUTPUT_FILE) as writer:
df.to_excel(writer)
解决方案
我会在调用 contains 之前添加小写字母!这意味着 Hate, hat, HATE 会被抓住:
import pandas as pd
df = pd.DataFrame({'foo':[1,2],
'bio':['i love pandas',
'i HATE ms excel']})
# normalize words to lowercase
#df = df[~ df['bio'].str.lower().str.contains('hate')]
df = df[~ df['bio'].str.contains('hate',case=False)]
熊猫文档:https ://pandas.pydata.org/pandas-docs/stable/reference/api/pandas.Series.str.contains.html
结果:
推荐阅读
- java - 无法使用 FileProvider 读取文件
- mysql - 使用 LOAD DATA 导入 CSV 得到错误值
- r - 一个 lm() 动态函数 - R
- symfony - Symfony 重写 nginx
- laravel - 如何获得公里距离矩阵中的最短路径?
- reactjs - 在 React 渲染元素中保留空间
- amazon-web-services - AWS RDS:未设置新的主密码
- java - XML ItemWriter 以 XML 格式写入数据
- r - 如何通过ggplot2在笛卡尔坐标系中绘制矢量?
- c# - Azure devops 错误在端口上启动 ChromeDriver 2.36.540470。只允许本地连接