首页 > 解决方案 > 如何矢量化这个熊猫函数?

问题描述

我需要帮助来矢量化这个函数。这是一个使用 vadersentiment 分析库的函数,用于确定数据集中推文的情绪。

任何帮助深表感谢。

analyzer = SentimentIntensityAnalyzer()
def sentiment_analysis(text):
    return analyzer.polarity_scores(str(text))["compound"]
df["sentiment_polarity"] = df.apply(lambda row: sentiment_analysis(row.text), axis=1)

这是df.info()输出:

<class 'pandas.core.frame.DataFrame'>
RangeIndex: 279962 entries, 0 to 279961
Data columns (total 13 columns):
user_name           279952 non-null object
user_location       219297 non-null object
user_description    264045 non-null object
user_created        279950 non-null object
user_followers      279943 non-null float64
user_friends        279943 non-null object
user_favourites     279943 non-null object
user_verified       279943 non-null object
date                279941 non-null object
text                279943 non-null object
hashtags            218317 non-null object
source              277538 non-null object
is_retweet          279929 non-null object
dtypes: float64(1), object(12)
memory usage: 27.8+ MB

提前致谢

标签: pythonpandasdataframevectorization

解决方案


推荐阅读