text - 我无法使用 text2vec 为我的测试数据创建 tf-idf 矩阵
问题描述
我正在按照本教程进行操作,就像我做训练集一样,但它一直在说同样的事情。有人知道这有什么问题吗?
> #Construct sample document-term matrix con el vectorizer inicial
> sample.it <- itoken(rawsample$Abstract,
+ preprocessor = prep_fun,
+ tokenizer = tok_fun,
+ ids = rawsample$id,
+ progressbar = F)
> sample.dtm <- create_dtm (sample.it, vectorizer, vtype = "dgTMatrix", progressbar = FALSE)
> sample.tfidf <- TfIdf$new() #define tfidf model
> sample.tfidf <- fit_transform(sample.dtm, tfidf)
Error in fit_transform.Matrix(sample.dtm, tfidf) :
inherits(model, "mlapiTransformation") is not TRUE
> sample.tfidf = create_dtm(sample.it, vectorizer, vtype = "dgTMatrix", progressbar = FALSE) %>%
+ transform(tfidf)
Error in transform.Matrix(., tfidf) :
inherits(model, "mlapiTransformation") is not TRUE
解决方案
sample.tfidf <- TfIdf$new() #define tfidf model
sample.tfidf <- fit_transform(sample.dtm, tfidf)
你在哪里定义tfidf
?可能你需要类似的东西:
model = TfIdf$new() #define tfidf model
sample.tfidf = fit_transform(sample.dtm, model)
推荐阅读
- javascript - 如何使用 JSTL 标签获取多个值?
- python - 禁止直接分配到多对多集合的前端。在 django 中使用 foods.set()
- msbuild - 在 WiX Build 过程中自动生成 WXI 文件
- sql - BigQuery - JSON_EXTRACT 仅提取第一个条目
- javascript - 如何在反应中渲染我的多维对象数组
- python - 熊猫:将行取消堆叠到新列中
- javascript - 来自minio的数据流的数据是多次来的
- android - 如何在多部分中给出文件路径?
- javascript - 获取数据并将其显示为下拉菜单
- python - Python - 从 CSV 获取特定内容的快速方法