首页 > 解决方案 > 如何解决这个问题以进行 yelp/python 抓取?

问题描述

这是我的任务

从 Yelp 中获取至少 400 条完整的评论和评分,以获得评价参差不齐的餐厅。重新编码评级。1-3 = 阴性,4-5 = 阳性。清理和预处理数据(删除标点符号,删除停用词,将所有单词转换为小写)。将数据按 70/30 拆分并开发朴素贝叶斯、决策树和逻辑回归模型(10 分)。报告每个模型的召回率、精度、F1、准确率和 AUC(5 分)。选择比较模型的最佳指标并解释你的理由。确定最佳模型

我把这段代码放在:

from sklearn.naive_bayes import GaussianNB
from sklearn.metrics import recall_score, precision_score, f1_score, accuracy_score
from sklearn.metrics import roc_curve
from sklearn.metrics import auc

nb = GaussianNB()

nb.fit(X_train_feats, y_train)

y_pred_nb = nb.predict(X_test_feats)
y_pred_nb_prob = nb.predict_proba(X_test_feats)[:, 1]

fpr_nb, tpr_nb, _ = roc_curve(y_test, y_pred_nb_prob)
roc_auc_nb = auc(fpr_nb, tpr_nb)

我收到一个错误:索引 1 超出轴 1 的范围,大小为 1

我该如何解决?

标签: pythonyelp

解决方案


将 [:, 1] 更改为 [:, 0] 应该可以工作,但这取决于您从哪一行得到错误。


推荐阅读