r - 使用 R 进行 HTML 抓取 - 抓取特定节点时出错
问题描述
我正在尝试从网页上抓取职位描述 - https://www.indeed.com/cmp/HP/jobs
我也是使用 HTML 和 CSS 选择器进行抓取的新手,所以如果我做了一些愚蠢的事情,我深表歉意。
我有以下代码
test_url <- read_html("https://www.indeed.com/cmp/HP/jobs")
job_description <- test_url %>%
html_nodes(".cmp-JobDetailDescription") %>%
html_text()
我使用 CSS 选择器来查找节点,但由于某种原因我无法获得职位描述。
我必须在代码中进行哪些更改才能提取该 url 中的所有职位描述?
先感谢您
解决方案
推荐阅读
- node.js - 带有 CSS 和 JS 文件的文件未在服务器上提供并打印 ��U�v�8��+
- python - 在 Python3.8 中,无法在 if 语句中获取要检查的变量
- python - numpy中获得n对距离的最快方法
- android - 具有 SavedStateHandle 的 ViewModel - 反序列化具有自定义数据类的 LiveData 时出现异常
- python - 如何将对象转换为在熊猫中浮动
- vue.js - 如何使用 VueJS 创建和销毁组件数据?
- typescript - 如何将辅助方法添加到 typeORM 实体?
- mysql - Mysql:在更新查询中使用嵌套选择查询会产生死锁
- python - Python:df['Col'].apply(lambda row: len(row)) 和 df.apply(lambda row: len(row['Col']), axis=1) 有什么区别?
- arduino - 无法在 Arduino IDE 中编辑示例草图