python - 无法替换熊猫数据框中的无值
问题描述
我有一个熊猫数据框。它有一些 None 值。我正在尝试用空字符串替换它们。这是我已经编写的代码。
data = pd.read_csv("./Drugs/drugsComTrain_raw.csv", skipinitialspace = True)
data["condition"] = data["condition"].fillna(value=np.nan, inplace=True)
data["condition"] = data["condition"].replace(np.nan, "Empty", inplace=True)
但它没有发生。因为当我尝试将数据放入矢量化器时,似乎 None 值仍然存在。下面是给定我收到错误的代码
def preprocess_text(text):
print(f"text: {text}")
print(f"type: {type(text)}")
tokeniser = RegexpTokenizer(r'\w+')
tokens = tokeniser.tokenize(text)
lemmatiser = WordNetLemmatizer()
lemmas = [lemmatiser.lemmatize(token.lower(), pos='v') for token in tokens]
keywords= [lemma for lemma in lemmas if lemma not in stopwords.words('english')]
return keywords
vectoriser = TfidfVectorizer(analyzer=preprocess_text)
condition = pd.DataFrame(vectoriser.fit_transform(data["condition"]).toarray())
这是我得到的错误。
解决方案
推荐阅读
- sorting - 从最近到最远对点进行排序
- java - 我们如何在 Helidon SE 中使用 REST 和 SOAP 服务
- python - 如何在一段时间内或for循环python中转换汉明数字代码
- logging - 启用使用nestjs登录typeorm
- azure-active-directory - Can I configure the SSO SAML with an App Registration (not Enterprise Application)?
- python - 当我添加 if 条件时,通过 ctypes 在 python 中使用的 C 函数会变慢
- c++ - 我如何通过提供一个在 C++ 中返回其类型的函数来确定基类是什么?
- python - sphinx_rtd_theme 自 1.4.0 版以来不再是硬依赖。即使安装了主题
- php - Yii2 Mpdf - _MPDF_SYSTEM_TTFONTS 升级后不起作用
- javascript - 按下按钮时如何将我的函数输出到我的html中?