首页 > 解决方案 > 网络抓取:如何将搜索引擎结果与 R 中的数据集值匹配?

问题描述

我正在尝试将我的数据集与来自以下链接的搜索引擎结果进行匹配:ftp: //ftp.uspto.gov/pub/patdata/

我想做的是:

  1. 弄清楚如何在搜索引擎中查找我的数据集中的每个值

  2. 生成与我在网站的“术语 1”字段(来自我的数据集值)中输入的任何值相关联的搜索结果总数,仅在网站的“字段 1”字段中过滤“受让人姓名”

到目前为止,我用我的代码得到的最远的是:

library(RSelenium)
remDr = remoteDriver(remoteServerAddr = "localhost", port = 4445L, browserName = "chrome")
remDr$open()
remDr$navigate("http://patft.uspto.gov/netahtml/PTO/search-bool.html")

标签: rrselenium

解决方案


推荐阅读