首页 > 解决方案 > 无法替换熊猫数据框中的无值

问题描述

我有一个熊猫数据框。它有一些 None 值。我正在尝试用空字符串替换它们。这是我已经编写的代码。

data = pd.read_csv("./Drugs/drugsComTrain_raw.csv", skipinitialspace = True)
data["condition"] = data["condition"].fillna(value=np.nan, inplace=True)
data["condition"] = data["condition"].replace(np.nan, "Empty", inplace=True)

但它没有发生。因为当我尝试将数据放入矢量化器时,似乎 None 值仍然存在。下面是给定我收到错误的代码

def preprocess_text(text):
    print(f"text: {text}")
    print(f"type: {type(text)}")
    tokeniser = RegexpTokenizer(r'\w+')
    tokens = tokeniser.tokenize(text)

    lemmatiser = WordNetLemmatizer()
    lemmas = [lemmatiser.lemmatize(token.lower(), pos='v') for token in tokens]

    keywords= [lemma for lemma in lemmas if lemma not in stopwords.words('english')]
    return keywords

vectoriser = TfidfVectorizer(analyzer=preprocess_text)
condition = pd.DataFrame(vectoriser.fit_transform(data["condition"]).toarray())

这是我得到的错误。

在此处输入图像描述

标签: pythonpython-3.xpandasreplacenonetype

解决方案


推荐阅读