java - Java - 从 url 读取页面源不起作用
问题描述
我正在使用下面的代码从 url 读取页面源。它几乎适用于所有 url,但不适用于这个 url,只返回 url 本身。
public static String getURLSource(String url) throws IOException
{
URL urlObject = new URL(url);
URLConnection urlConnection = urlObject.openConnection();
//urlConnection.setRequestProperty("User-Agent", "Mozilla/5.0 (Windows NT 6.1; WOW64) AppleWebKit/537.11 (KHTML, like Gecko) Chrome/23.0.1271.95 Safari/537.11");
return toString(urlConnection.getInputStream());
}
private static String toString(InputStream inputStream) throws IOException
{
try (BufferedReader bufferedReader = new BufferedReader(new InputStreamReader(inputStream, "UTF-8")))
{
String inputLine;
StringBuilder stringBuilder = new StringBuilder();
while ((inputLine = bufferedReader.readLine()) != null)
{
stringBuilder.append(inputLine);
}
return stringBuilder.toString();
}
}
有什么问题,如何修改代码才能正常工作?谢谢。
解决方案
您必须使用 HttpsURLConnection,因为它是 https。
推荐阅读
- flutter - 模仿 iOS 13 全屏对话框
- java - 使用 InputStream 下载大文件
- python-3.x - 如何合并具有相同长度的二维列表
- flutter - 在颤动中溢出 230 像素
- database - 如何在二级索引而不是主索引上执行 transaction.insert_or_update?
- python - 同一项目的内存分配
- java - How to get Integer#parseInt to return a value in case of overload
- flutter - 当图像 url 在颤动中失败时应用程序崩溃
- c - 为什么 execve 返回的结果与用户不同
- angular - 如何将数据传递给精确的兄弟组件?