python - 如何解决这个问题以进行 yelp/python 抓取?
问题描述
这是我的任务
从 Yelp 中获取至少 400 条完整的评论和评分,以获得评价参差不齐的餐厅。重新编码评级。1-3 = 阴性,4-5 = 阳性。清理和预处理数据(删除标点符号,删除停用词,将所有单词转换为小写)。将数据按 70/30 拆分并开发朴素贝叶斯、决策树和逻辑回归模型(10 分)。报告每个模型的召回率、精度、F1、准确率和 AUC(5 分)。选择比较模型的最佳指标并解释你的理由。确定最佳模型
我把这段代码放在:
from sklearn.naive_bayes import GaussianNB
from sklearn.metrics import recall_score, precision_score, f1_score, accuracy_score
from sklearn.metrics import roc_curve
from sklearn.metrics import auc
nb = GaussianNB()
nb.fit(X_train_feats, y_train)
y_pred_nb = nb.predict(X_test_feats)
y_pred_nb_prob = nb.predict_proba(X_test_feats)[:, 1]
fpr_nb, tpr_nb, _ = roc_curve(y_test, y_pred_nb_prob)
roc_auc_nb = auc(fpr_nb, tpr_nb)
我收到一个错误:索引 1 超出轴 1 的范围,大小为 1
我该如何解决?
解决方案
将 [:, 1] 更改为 [:, 0] 应该可以工作,但这取决于您从哪一行得到错误。
推荐阅读
- c - 如何在不使用 goto 关键字的情况下编写 C 代码?
- python - 结合 Conda 环境文件和 Pip 时,运行 Pip 安装时 Conda 环境是否处于活动状态?
- django - 如何在 Atom 文本编辑器中为 django 模板文件启用语法突出显示?
- python - Python Asyncio 没有使用 asyncio.run_coroutine_threadsafe 运行新的协程
- php - PHP elseif 不起作用。(将运算符与整数进行比较)
- amazon-web-services - 为 AWS S3 存储桶设置用户权限
- python - 高性能插入或更新 SQLALCHEMY python
- xamarin.android - 将应用程序更新到 API29 后的 md5/crc64 问题
- express - How can I make Sendgrid send the confirmation email?
- angular - 如何计算其他用户的帖子数量?