java - 为什么我无法使用 java 代码阅读一些 https 页面?
问题描述
我写了一个像我在这里看到的 java 程序 How to read the https page content using java? 但对于某些网站,代码不起作用。
我收到错误服务器返回 HTTP 响应代码:403 用于 URL:https ://research.investors.com/stock-quotes/nyse-sailpoint-tech-holdings-sail.htm
它适用于 url = "https://maven.apache.org/guides/mini/guide-repository-ssl.html";
有人能帮我吗 ?
解决方案
403 Forbidden 请求包含有效数据并被服务器理解,但服务器拒绝操作。这可能是由于用户没有资源的必要权限或需要某种帐户,或尝试了禁止的操作(例如,创建仅允许一个重复记录)。如果请求通过回答 WWW-Authenticate 标头字段质询提供了身份验证,但服务器不接受该身份验证,则通常也使用此代码。该请求不应重复。
因此,您想要抓取的网站可能只是限制了像您这样的请求(我的意思是请求,不是来自浏览器的请求)。
但是你可以试试Selenium。
推荐阅读
- c++ - 在 C++17/20 中迭代元组
- python - 来自命令行的 Python modulenotfounderror
- git - 将损坏或删除的提交添加到远程 git 服务器
- python - loglog图中的寄生虫x轴
- android - sqlite中的计时器?
- c++ - 为什么 std::cin.clear() 在这个简单的程序中不起作用?
- javascript - 是否可以在不使用 Promise 的情况下从异步函数内的回调返回值?
- asp.net - 重定向目标返回 Not Found 错误
- python - sqlalchemy,我可以绕过创建表类吗?
- angular - 无法让 FullCalendar v4 与 Angular 和 Angular Cli 一起使用