javascript - PHP - 抓取 javascript 网站
问题描述
我正在尝试使用 php curl 检查任何列入黑名单的关键字的网站内容。但是使用 curl 我不会得到 JS 脚本生成的内容。我必须扫描数千个网站,效率是这里的重点。我需要获取 js 内容。到目前为止,我遇到了 Phantomjs-php。是否有任何其他 js 脚本会占用更少的资源来与 php.ini 一起使用。我只需要获取 html 内容。对此的任何见解都非常感谢,因为我是获取 JS 生成内容的新手。
谢谢林恩
解决方案
我很确定Codeception会为您解决问题。
您可以将其配置为与无头浏览器一起使用,就像 phantom.js 和 puppeteer 一样,并查看您的 js 生成的内容。您想要做的样本验收测试如下所示:
$I->amOnPage('/login');
$I->fillField('username', 'davert');
$I->fillField('password', 'qwerty');
$I->click('LOGIN');
$I->see('Welcome, Davert!');
推荐阅读
- spring-boot - 当我提交 jsf 表单时,应用程序显示 403 错误页面。为什么这个?
- uwp - 微软的 MediaPlayerElement 何时全面支持 webm 文件?
- c++ - 如何修复valgrind中仍然可以访问的错误?
- sql - SQL Server 中的子字符串有问题
- c# - 我如何设计一个通用类来反序列化这个 XML?
- uri - HaProxy 在请求中用 + 字符替换所有空格
- c - 当其中一个从另一个定义返回时如何使用##连接
- cloud-foundry - CF Bosh Director 多数据中心高可用性
- python - 如何避免在 Python 中使用 Excel 中的“全部刷新”选择文件
- python - scrapy 不适用于 youtube 搜索查询?返回 404