python - 如何矢量化这个熊猫函数?
问题描述
我需要帮助来矢量化这个函数。这是一个使用 vadersentiment 分析库的函数,用于确定数据集中推文的情绪。
任何帮助深表感谢。
analyzer = SentimentIntensityAnalyzer()
def sentiment_analysis(text):
return analyzer.polarity_scores(str(text))["compound"]
df["sentiment_polarity"] = df.apply(lambda row: sentiment_analysis(row.text), axis=1)
这是df.info()
输出:
<class 'pandas.core.frame.DataFrame'>
RangeIndex: 279962 entries, 0 to 279961
Data columns (total 13 columns):
user_name 279952 non-null object
user_location 219297 non-null object
user_description 264045 non-null object
user_created 279950 non-null object
user_followers 279943 non-null float64
user_friends 279943 non-null object
user_favourites 279943 non-null object
user_verified 279943 non-null object
date 279941 non-null object
text 279943 non-null object
hashtags 218317 non-null object
source 277538 non-null object
is_retweet 279929 non-null object
dtypes: float64(1), object(12)
memory usage: 27.8+ MB
提前致谢
解决方案
推荐阅读
- php - 我需要清理 $_SERVER['argv'] 吗?如何?
- r - R reactiveFileReader 从 aws s3 存储桶读取
- firebase - 如何从 Firebase 中显示分数
- python - 将 uint32 的元组转换为 uint8 的 3d numpy 数组的最佳方法
- python - 如何更改 TokenObtainPairView 的错误响应信息?
- java - 将 Spring Integration Cafe 演示从 xml 配置转换为 Java 8 DSL
- ios - 如何遍历坐标数组来绘制CGPath?
- python - 如何将 StanfordNLP 工具(POSTagger 和 Parser)与已经标记化的文件一起使用?
- r - dplyr mutate 应用自定义函数
- sql - 我们的 INSERT 使用 REPEATABLEREAD 提示。这有什么影响?