python - 如何针对多个字符串测试 NLP 模型
问题描述
我已经在一组字符串上使用逻辑回归训练了一个分类器模型,该模型将字符串分类为 0 或 1。我目前有它一次只能测试一个字符串。如何让我的模型一次运行多个句子,可能来自 .csv 文件,这样我就不必单独输入每个句子?
def train_model(分类器,feature_vector_train,标签,feature_vector_valid,valid_y,is_neural_net=False):classifier.fit(feature_vector_train,标签)
# predict the labels on validation dataset
predictions = classifier.predict(feature_vector_valid)
if is_neural_net:
predictions = predictions.argmax(axis=-1)
return classifier , metrics.accuracy_score(predictions, valid_y)
然后
model, accuracy = train_model(linear_model.LogisticRegression(), xtrain_count, train_y, xtest_count,test_y)
目前我如何测试我的模型
sent = ['here I copy a string']
将文本转换为计算词袋向量
count_vect = CountVectorizer(analyzer='word', token_pattern=r'\w{1,}',ngram_range=(1, 2))
x_feature_vector = count_vect.transform(sent)
pred = model.predict(x_feature_vector)
我得到了句子和它的预测
我希望模型一次对我所有的新句子进行分类,并对每个句子进行分类。
解决方案
更简单的方法将是
vecs=count_vec.transform(test['column_name_on_which_you_want_to_predict'])
pred=model.predict(vecs)
data=pd.DataFrame({'Text':column_name,'SECTION':pred})
您可以根据需要导出它。
推荐阅读
- c# - 如何从 TpmPublic.GetTpm2BRepresentation() 的结果重新创建 TpmPublic 实例
- excel - 编译错误“参数数量错误或属性分配无效”将文件夹对象传递给递归子
- excel - EXCEL:在特定文本后修剪
- node.js - 在 Amazon EC2 实例上的 docker-compose 中运行的 React/Node 持续出现 CORS 错误
- php - array_replace_recursive 覆盖键而不是附加键
- azure - 仅通知团队机器人的服务 URL
- c# - Gremlin.NET 是否支持提交异步字节码?
- javascript - Object.create() 混乱 - 你如何访问/销毁对象?
- javascript - 为什么 .vue 中声明的基于 ts-class 的 vue-component 的静态方法只能在 .vue 的脚本块中工作?
- ios - 与“iPhone”启动应用程序 Xcode 11.3.1 上的调试器失去连接