首页 > 解决方案 > 类型提供者'ProviderImplementation.HtmlProvider'报错:cookie的'Value'='XXXX'部分无效

问题描述

我正在使用 HtmlProvider 来抓取股票公司新闻,例如https://www.nasdaq.com/symbol/{STOCK_SYMBOL_HERE}/news-headlines,但我在这行代码中遇到错误

let [<Literal>] stockNewsUrl = "https://www.nasdaq.com/symbol/AAPL/news-headlines"
let news = new HtmlProvider<stockNewsUrl>()

第二行有波浪线,错误是Error FS3033 The type provider 'ProviderImplementation.HtmlProvider' reported an error: Cannot read sample HTML from 'https://www.nasdaq.com/symbol/AAPL/news-headlines': The 'Value'='AAPL,technology' part of the cookie is invalid.

标签: f#fsharp.data.typeproviders

解决方案


看起来这失败了,因为 F# Data 以 Nasdaq 服务不喜欢的格式发送 cookie。一个简单的解决方法是下载页面一次以在编译时提供示例,然后在运行时使用其他方式下载页面。

type Nasdaq = HtmlProvider<"c:/temp/nasdaq.html">

let wc = new WebClient()
let downloaded = wc.DownloadString("https://www.nasdaq.com/symbol/AAPL/news-headlines")

let ns = Nasdaq.Load(downloaded)

这可行,但有两个问题:

  • 该页面不包含任何表格/列表,因此该ns值不会让您很好地静态访问任何有用的东西
  • 当我尝试使用下载数据时出现超时异常WebClient,所以也许这也不起作用(但可能只是我在代理或其他东西后面..)

推荐阅读