r - 挖掘金融文章R
问题描述
我正在使用 tidytext 挖掘一些金融文章,我从路透社下载数据,但是当我试图将每个语料库转换为数据框时,我收到一些关于 unnest 命令没有将函数作为输入的错误......
你有什么选择可以把它变成一个小标题吗?
library(tm.plugin.webmining)
library(purrr)
company <- c("Microsoft", "Apple", "Google", "Amazon", "Facebook",
"Twitter", "IBM", "Yahoo", "Netflix")
symbol <- c("MSFT", "AAPL", "GOOG", "AMZN", "FB", "TWTR", "IBM", "YHOO", "NFLX")
download_articles <- function(symbol) {
WebCorpus(ReutersNewsSource(paste0("NASDAQ:", symbol)))
}
stock_articles <- data_frame(company = company, symbol = symbol) %>%
mutate(corpus = map(symbol, download_articles))
stock_articles
stock_tokens <- stock_articles %>%
unnest(map(corpus, tidy)) %>%
unnest_tokens(word, text) %>%
select(company, datetimestamp, word, id, heading)
stock_tokens
解决方案
我正在尝试将 stock_articles 的语料库列转换为常规数据框
它是一个带有 WebCorpus 类型变量的列表列,所以我试图整理每个观察结果,然后使用 unnest 将它变成一个列
[1]:https ://github.com/leytigorges/miningfinancial在这里您可以找到包含数据的文件(mydata)
推荐阅读
- javascript - 我正在尝试执行 regexp 命令,但它不起作用。我怎样才能使它可行?
- android - 如何使用颤振读取excel文件中的逐行详细信息?
- java - 如何在java中获取数据库表列名
- vb.net - 如何从 ComboBox 和 TextBox 获取值到 Argument 行?
- c# - RichTextBox 设置/更改下划线颜色(\ulcN)和下划线样式(例如\ulwave)以供选择
- azure - Azure API 管理 - 当 APM 落后于 WAF 时如何获取原始 IP
- wpf - 上下文菜单项未触发 Click 事件
- java - 回收视图不显示来自适配器的数据
- ios - 替换对象数组中的特定值 swift 5
- regex - 如何使用 ansible regexp 将新字符串插入到 telegraf.conf 的 inputs.ping