python - TypeError:预期的字符串或类似字节的对象“
问题描述
def preprocess_text(sen): # 移除 html 标签 sentence = remove_tags(sen)
# Remove punctuations and numbers
sentence = re.sub('[^a-zA-Z]', ' ', sentence)
# Single character removal
sentence = re.sub(r"\s+[a-zA-Z]\s+", ' ', sentence)
# Removing multiple spaces
sentence = re.sub(r'\s+', ' ', sentence)
return sentence
TAG_RE = re.compile(r'<[^>]+>')
def remove_tags(text): return TAG_RE.sub('', text)
评论 = [] 句子 = list(renamed_df['CanonSkillClusters']) 句子中的 sen:reviews.append(preprocess_text(sen)) print(renamed_df.columns.values)
解决方案
推荐阅读
- scala - 如何使用 jena elephas 和 spark 运行 sparql
- android - 在 .sh 文件中使用命令 echo 在 TWRP 恢复中不起作用。如何在 TWRP 中使用脚本 .sh 显示消息
- sql - T-SQL Select where "IN" 非常糟糕 性能影响
- php - 如何在 Webuzo VPS 中使用 PHPMailer
- laravel-5 - What is not equal to in Laravel?
- sql - SQL regular expression for date
- asynchronous - Async.Start 与 timeout 和 cancelToken?
- azure-active-directory - 在 Graph API beta 端点上创建 Azure AD 应用程序时出错
- php - Yajra 数据表同时使用搜索和自定义过滤器
- php - 如何通过 Php 解密 SHA512 密码?