java - URLDecode.decode 方法在 Java 中无法按预期工作
问题描述
我试图解码 URL 编码的帖子正文并遇到了这个问题。
我正在使用这种方法进行解码(它也解码了多个编码的 url):
public static String decodeUrl(String url)
{
try {
String prevURL="";
String decodeURL=url;
while(!prevURL.equals(decodeURL))
{
prevURL=decodeURL;
decodeURL= URLDecoder.decode( decodeURL, "UTF-8" );
}
return decodeURL;
} catch (UnsupportedEncodingException e) {
return "Issue while decoding" +e.getMessage();
}
}
当输入网址为“a%20%2B%20b%20%3D%3D%2013%25!”时 ,在调试时,控件不知何故不会出现在一行之后decodeURL =
。也没有引发异常。
问题是控制不会超出“decodeURL”这一行。
什么可能导致问题?请使用调试器来模拟这个问题。
解决方案
刚刚在 Java 8u151 上进行了测试。这会在循环的第二次旋转时引发 IllegalArgumentException:“URLDecoder:不完整的尾随转义 (%) 模式”。这是因为在第一次解码后你有“a + b == 13%!”,而在第二次解码期间,% 应该引入一个编码序列,但它没有。我认为这是预期的行为,即使其他语言的标准库不同意。例如 Python 3.6:
>>> from urllib.parse import unquote
>>> result = unquote('a%20%2B%20b%20%3D%3D%2013%25!')
>>> result
'a + b == 13%!'
>>> unquote(result)
'a + b == 13%!'