c# - 我想创建一个 webscraper,它将从 angular 网站上抓取 html
问题描述
我正在开发一个 Web 刮板,它将从 Angular 网站中刮取。
我为此目的使用 HttpClient 类,但我没有在页面的正文标记中获取 html 标记,而是获取<ng-view> </ng-view>
标记。谁能解释发生了什么以及如何获取 HTML 代码而不是ng-view
标签?
解决方案
据我所知,这是不可能的。您可以“抓取”的只是提供给浏览器的初始标记。所有其他内容将通过运行 JavaScript 获得,该 JavaScript 会回调服务器以获取更多数据。
除非您准备好编写一个完整的、功能齐全的 JavaScript 引擎,否则我会说初始页面就是您所获得的全部内容。
推荐阅读
- c# - Read SqlDataReader after Exception -- LIKE SSMS Result Pane
- mysql - count by name the number of all values, within a given DB SQL column
- mysql - 主机数据库服务器更改后,Wordpress 主题页面消失了
- javascript - 导出 vuejs 组件以重用
- sql - 如何按国家/地区查询 PostGIS 中的数据?
- python - 如何随机旋转二维数组中的正方形?
- java - 发生超时弹出时的 Selenium 测试背景屏幕
- java - 即使应用程序未运行,如何每 10 分钟在后台获取位置信息?
- java - 尝试将对象从项目传递到 API 休息时出现 NoClassDefFoundError
- javascript - 清除 Blockly 工作区而不将项目移动到垃圾箱