首页 > 解决方案 > 为什么我无法使用 java 代码阅读一些 https 页面?

问题描述

我写了一个像我在这里看到的 java 程序 How to read the https page content using java? 但对于某些网站,代码不起作用。

我收到错误服务器返回 HTTP 响应代码:403 用于 URL:https ://research.investors.com/stock-quotes/nyse-sailpoint-tech-holdings-sail.htm

它适用于 url = "https://maven.apache.org/guides/mini/guide-repository-ssl.html";

有人能帮我吗 ?

标签: javahttpshttpsurlconnection

解决方案


403 Forbidden 请求包含有效数据并被服务器理解,但服务器拒绝操作。这可能是由于用户没有资源的必要权限或需要某种帐户,或尝试了禁止的操作(例如,创建仅允许一个重复记录)。如果请求通过回答 WWW-Authenticate 标头字段质询提供了身份验证,但服务器不接受该身份验证,则通常也使用此代码。该请求不应重复。

因此,您想要抓取的网站可能只是限制了像您这样的请求(我的意思是请求,不是来自浏览器的请求)。

但是你可以试试Selenium


推荐阅读