php - Google Scholar 检测到我想用 PHP 中的 curl 抓取它
问题描述
我正在尝试在 PHP 中使用 curl 来抓取 Google Scholar。我已经为 curl 定义了一个用户代理,并且通过创建一个 cookie 目录启用了 CURLOPT_COOKIEFILE 和 CURLOPT_COOKIEJAR。然而,谷歌会自动检测到我正在抓取它。我认为这可能是因为 curl 无法解析 JavaScript 代码,但我不确定。
是否可以在 PHP 中使用 curl 抓取 Google Scholar?我需要使用无头浏览器吗?如果是,我如何配置无头浏览器以在 PHP 中使用 curl?我可以在 PHP 旁边使用不同的编程语言并以某种方式使它们一起工作以向用户提供图形输出吗?
提前致谢
解决方案
推荐阅读
- java - javapoet如何生成注释和使用lombok?
- python - 连接两列值并根据 Python 中的特定列创建连续的唯一 ID
- dataset - 我试图上传我的 csv 文件数据集,但 weka 无法识别它
- sql - 减少数量直到我用完所有数量
- c++ - 在运行时 C++ 设置类字段大小
- multithreading - Recursive impl Extend for HashMap<_, HashSet<_>> 在哪里组合集合,而不是覆盖?
- jquery - jQuery:使用输入的值作为匹配数组的名称
- google-sheets - 谷歌工作表 - 取消数据透视表并跳过空白单元格
- javascript - 如何在AngularJs中使函数参数可选?
- ssl - 匿名 TLS 中的凭据