python - TypeError:需要字符串或类似字节的对象
问题描述
我正在尝试标记推文,但出现错误:TypeError: expected string or bytes-like object
我正在清理用于 ml 的推文,所以是结转标记化。
# remove twitter handles (@user)
def remove_pattern(input_txt, pattern):
r = re.findall(pattern, input_txt)
for i in r:
input_txt = re.sub(i, '', input_txt)
return input_txt
# remove twitter handles and create new column with clean tweet
data_df['cleaned_tweet'] = np.vectorize(remove_pattern)(data_df['text'], "@[\w]*")
解决方案
这是因为 twitter 文本不是字符串,它是一个对象,你必须将对象转换为字符串,写:input_txt =str(input_txt)
。
推荐阅读
- excel - Excel VBA比较,添加行并填写
- javascript - 检查函数是否是类的方法?
- azure - 如何在 Azure Spark 群集中使用 pyspark 覆盖文件
- ios - 如何在 BOX Content SDK for iOS 中实现 BOXContentCacheClientProtocol
- google-apps-script - Google 脚本用户对此配置文件没有足够的权限。谷歌分析
- javascript - 无法访问函数内部的状态
- php - 错误:没有名称为“homebrew/php/php55”的可用公式
- jenkins - 如何避免重复适用于 Jenkinsfile 管道中多个步骤的条件?
- google-apps-script - Google Apps 脚本图表 vAxis.title 不起作用
- java - 如何在 Apache Lucene 中将 PhraseQuery 与 RangeQuery 结合使用?