python-3.x - 如何在 Pandas、python 中搜索 csv 中的特定文本
问题描述
您好我想在标题栏中找到帐户文本@,并将其保存在新的csv中。熊猫可以做到,我尝试过,但没有成功。这是我的 csv http://www.sharecsv.com/s/c1ed9790f481a8d452049be439f4e3d8/Newnormal.csv
这是我的代码:
import pandas as pd
data = pd.read_csv("Newnormal.csv")
data.dropna(inplace = True)
sub ='@'
data["Indexes"]= data["title"].str.find(sub)
print(data)
我想要这样的结果
从,到,标题 Xavier5501,KudiiThaufeeq,RT @KudiiThaufeeq:皇家强奸,皇家骚扰,皇家鸡尾酒会,皇家佩多,皇家竞标,皇家 Maalee Bayaan,皇家奴隶制..et
谢谢你。
解决方案
- 将记录减少到仅标题中带有“@”的记录
- 定义新列,它是“@”和“:”之间的文本
- 你留下了一些记录,这些记录将 NaN 留在列中。我刚刚过滤掉了这些
df = pd.read_csv("Newnormal.csv")
df = df[df["title"].str.contains("@")==True]
df["to"] = df["title"].str.extract(r".*([@][A-Z,a-z,0-9,_]+[:])")
df = df[["from","to","title"]]
df[~df["to"].isna()].to_csv("ToNewNormal.csv", index=False)
df[~df["to"].isna()]
输出
from to title
1 Xavier5501 @KudiiThaufeeq: RT @KudiiThaufeeq: Royal Rape, Royal Harassmen...
2 Suzane24979006 @USAID_NISHTHA: RT @USAID_NISHTHA: Don't step outside your hou...
3 sandeep_sprabhu @USAID_NISHTHA: RT @USAID_NISHTHA: Don't step outside your hou...
4 oliLince @Timothy_Hughes: RT @Timothy_Hughes: How to Get a Salesforce Th...
7 rismadwip @danielepermana: RT @danielepermana: Pak kasus covid per hari s...
... ... ... ...
992 Reptoid_Hunter @sapiofoxy: RT @sapiofoxy: I literally can't believe we ha...
994 KPCResearch @sapiofoxy: RT @sapiofoxy: I literally can't believe we ha...
995 GreySparkUK @VoxSmartGlobal: RT @VoxSmartGlobal: The #newnormal will see mo...
997 Gabboa10 @HuShameem: RT @HuShameem: One of @PGO_MV admin staff test...
999 wanjirunjendu @ntvkenya: RT @ntvkenya: AAK's Mugure Njendu shares insig...
推荐阅读
- javascript - 使用 JQuery 自动填充输入字段
- wpf - 如果使用快捷键,如何在 WPF 中设置按钮大小?
- r - 将具有一列的数据框转换为R中的多列
- php - 通过 LinkedIn API V2 创建广告创意不起作用
- python - 神经网络训练最好使用预芯片或随机芯片图像?
- amazon-web-services - DynamoDB - 减少查询数量
- c# - C# 使用 WebRequest 构建网站表单响应
- ssl - 迁移到 cert-manager 后如何使用 kube-lego 中的现有证书?
- ios - 使用 Combine 框架中的 CombineLatest 时出现“额外参数”错误
- unity3d - 2D Unity 多人游戏中角色不在屏幕上