首页 > 解决方案 > 挖掘金融文章R

问题描述

我正在使用 tidytext 挖掘一些金融文章,我从路透社下载数据,但是当我试图将每个语料库转换为数据框时,我收到一些关于 unnest 命令没有将函数作为输入的错误......

你有什么选择可以把它变成一个小标题吗?

library(tm.plugin.webmining)
library(purrr)
company <- c("Microsoft", "Apple", "Google", "Amazon", "Facebook",
             "Twitter", "IBM", "Yahoo", "Netflix")

symbol <- c("MSFT", "AAPL", "GOOG", "AMZN", "FB", "TWTR", "IBM", "YHOO", "NFLX")

download_articles <- function(symbol) {
  WebCorpus(ReutersNewsSource(paste0("NASDAQ:", symbol)))
}

stock_articles <- data_frame(company = company, symbol = symbol) %>%
  mutate(corpus = map(symbol, download_articles))

stock_articles

stock_tokens <- stock_articles %>%
  unnest(map(corpus, tidy)) %>%
  unnest_tokens(word, text) %>%
  select(company, datetimestamp, word, id, heading)
stock_tokens

标签: rtidytext

解决方案


我正在尝试将 stock_articles 的语料库列转换为常规数据框

它是一个带有 WebCorpus 类型变量的列表列,所以我试图整理每个观察结果,然后使用 unnest 将它变成一个列

[1]:https ://github.com/leytigorges/miningfinancial在这里您可以找到包含数据的文件(mydata)


推荐阅读