首页 > 解决方案 > TypeError:需要字符串或类似字节的对象

问题描述

我正在尝试标记推文,但出现错误:TypeError: expected string or bytes-like object

我正在清理用于 ml 的推文,所以是结转标记化。

# remove twitter handles (@user)
def remove_pattern(input_txt, pattern):
    r = re.findall(pattern, input_txt)
    for i in r:
        input_txt = re.sub(i, '', input_txt)

    return input_txt  

# remove twitter handles and create new column with clean tweet
data_df['cleaned_tweet'] = np.vectorize(remove_pattern)(data_df['text'], "@[\w]*")

标签: python

解决方案


这是因为 twitter 文本不是字符串,它是一个对象,你必须将对象转换为字符串,写:input_txt =str(input_txt)


推荐阅读