首页 > 解决方案 > 为什么发送和接收 POST 请求之间的字符编码不匹配?

问题描述

我有一个 java servlet,它接收带有应该以 UTF-8 编码的数据的 POST 请求,但它似乎是以 ISO-8859-1 编码的。

为了进一步说明,这里是一些代码示例:

在 Java 中,使用 Apache HttpClient 发送 PostRequest 时:

PostMethod postMethod = new PostMethod(url);
postMethod.getParams().setContentCharset("UTF-8");

String bar = "\u200B\u200B\u200B\u200B\u200B\u200B\u200B";
postMethod.addParameter("body", bar);

HttpClient httpClient = new HttpClient();
int status = httpClient.executeMethod(postMethod);

在接收端(在doPostHttpServlet的方法中):

String body = new String(req.getParameter("body").getBytes(), req.getCharacterEncoding());

在上面的示例中,当我有一个发送请求的调试断点时,bar.getBytes(StandardCharsets.UTF_8) = [-30, -128, -117, -30, -128, -117, -30, -128, -117, -30, -128, -117, -30, -128, -117, -30, -128, -117, -30, -128, -117]. 但是当我在接收端检查字符串时,即使请求设置为 UTF-8 编码,如果我执行bar.getBytes(StandardCharsets.ISO_8859_1).

所以基本上,当我发送字符串时,它作为 UTF-8 被放入参数中,但它被作为 ISO 读出。为了获得正确的处理值,我必须使用String utf8String = new String(bar.getBytes(StandardCharsets.ISO_8859_1), StandardCharsets.UTF-8)

为什么会这样?是否有一些我在某处遗漏的配置?需要注意的是,发送者和接收者在不同的tomcat实例中,可能在同一台机器上,但不一定。

标签: javaservletsapache-httpclient-4.x

解决方案


你已经试过了吗?

postMethod.setRequestHeader("Content-Type", "application/x-www-form-urlencoded;charset=utf-8")

推荐阅读