首页 > 解决方案 > URLDecode.decode 方法在 Java 中无法按预期工作

问题描述

我试图解码 URL 编码的帖子正文并遇到了这个问题。

我正在使用这种方法进行解码(它也解码了多个编码的 url):

public static String decodeUrl(String url)
    {
        try {
            String prevURL="";
            String decodeURL=url;
            while(!prevURL.equals(decodeURL))
            {
                prevURL=decodeURL;
                decodeURL= URLDecoder.decode( decodeURL, "UTF-8" );
            }
            return decodeURL;
        } catch (UnsupportedEncodingException e) {
            return "Issue while decoding" +e.getMessage();
        }
    }

当输入网址为“a%20%2B%20b%20%3D%3D%2013%25!”时 ,在调试时,控件不知何故不会出现在一行之后decodeURL =。也没有引发异常。

问题是控制不会超出“decodeURL”这一行。

什么可能导致问题?请使用调试器来模拟这个问题。

标签: javaurlurlencodeurl-encoding

解决方案


刚刚在 Java 8u151 上进行了测试。这会在循环的第二次旋转时引发 IllegalArgumentException:“URLDecoder:不完整的尾随转义 (%) 模式”。这是因为在第一次解码后你有“a + b == 13%!”,而在第二次解码期间,% 应该引入一个编码序列,但它没有。我认为这是预期的行为,即使其他语言的标准库不同意。例如 Python 3.6:

>>> from urllib.parse import unquote
>>> result = unquote('a%20%2B%20b%20%3D%3D%2013%25!')
>>> result
'a + b == 13%!'
>>> unquote(result)
'a + b == 13%!'

推荐阅读