首页 > 解决方案 > Java - 从 url 读取页面源不起作用

问题描述

我正在使用下面的代码从 url 读取页面源。它几乎适用于所有 url,但不适用于这个 url,只返回 url 本身。

public static String getURLSource(String url) throws IOException
{
    URL urlObject = new URL(url);
    URLConnection urlConnection = urlObject.openConnection();
    //urlConnection.setRequestProperty("User-Agent", "Mozilla/5.0 (Windows NT 6.1; WOW64) AppleWebKit/537.11 (KHTML, like Gecko) Chrome/23.0.1271.95 Safari/537.11");

    return toString(urlConnection.getInputStream());
}

private static String toString(InputStream inputStream) throws IOException
{
    try (BufferedReader bufferedReader = new BufferedReader(new InputStreamReader(inputStream, "UTF-8")))
    {
        String inputLine;
        StringBuilder stringBuilder = new StringBuilder();
        while ((inputLine = bufferedReader.readLine()) != null)
        {
            stringBuilder.append(inputLine);
        }

        return stringBuilder.toString();
    }
}

有什么问题,如何修改代码才能正常工作?谢谢。

标签: javaurlconnectionbufferedreader

解决方案


您必须使用 HttpsURLConnection,因为它是 https。


推荐阅读