r - 网络抓取:如何将搜索引擎结果与 R 中的数据集值匹配?
问题描述
我正在尝试将我的数据集与来自以下链接的搜索引擎结果进行匹配:ftp: //ftp.uspto.gov/pub/patdata/
我想做的是:
弄清楚如何在搜索引擎中查找我的数据集中的每个值
生成与我在网站的“术语 1”字段(来自我的数据集值)中输入的任何值相关联的搜索结果总数,仅在网站的“字段 1”字段中过滤“受让人姓名”
到目前为止,我用我的代码得到的最远的是:
library(RSelenium)
remDr = remoteDriver(remoteServerAddr = "localhost", port = 4445L, browserName = "chrome")
remDr$open()
remDr$navigate("http://patft.uspto.gov/netahtml/PTO/search-bool.html")
解决方案
推荐阅读
- laravel - 如何在 ubuntu 上设置虚拟主机
- javascript - 如何在不向主容器添加滚动的情况下将滚动设置为兄弟孩子
- spring-boot - spring boot 项目作为另一个 spring-boot 项目中的依赖项
- php - Linux命令不能从PHP网站工作,但可以从终端工作
- python - mypy:对没有运行时成本的类型提出更高的要求
- amazon-dynamodb - 使用 kcl 从 Kinesis 消费数据时无需 Dynamodb 客户端
- javascript - 在新选项卡中使用通过 Web 服务从外部应用程序传输的对象填充 Java Spring 表单
- python - 如何使用带有缓冲区/大小提示 Python 的文件 I/O 防止数据丢失/错误计数
- excel - 使用输入表单上的文本框设置行中单元格的值
- dynamic - Anylogic流体批次,动态改变批次属性(批次大小,插入批次)