首页 > 技术文章 > servlet 中字符集的处理

pyfreshman 2015-09-24 23:52 原文

Servlet运行的步骤

Servlet作为Web服务器的补充功能在运行时需要受到Servlet容器的管理,其运行的流程如下:

  1. 浏览器依据IP建立与容器的连接
  2. 浏览器将请求数据打包
  3. 容器解析请求数据包,封装request和response对象
  4. 容器依据请求资源路径找到Servlet创建对象
  5. 容器将request和response对象作为参数传入service方法,并调用
  6. 容器将响应数据打包发给浏览器
  7. 浏览器取出结果,生成页面

解决输出内容的乱码问题

在service()方法中第一行的位置上添加如下代码

response.setContentType("text/html;charset=utf-8")

其中charset可以使用其他支持中文的字符集,如GBK。setContentType()有两个作用:

  1. 通知容器,在调用out.println方法输出时,使用指定的字符集
  2. 生成一个消息头(content-type),通知浏览器,服务器返回的数据类型和字符集

使用该段代码修改默认的编码方式时,一定要保证在调用print之前编写,所以该段代码尽量放在service方法的第一行的位置。在charset之前使用的是分号隔开,如果写错,则会出现保存文件的界面,原因是浏览器不能识别消息头的值,于是让用户来处理

 1 package com.yunhua.servlet;
 2 
 3 import java.io.IOException;
 4 import java.io.PrintWriter;
 5 
 6 import javax.servlet.http.HttpServlet;
 7 import javax.servlet.http.HttpServletRequest;
 8 import javax.servlet.http.HttpServletResponse;
 9 
10 public class ServletTest extends HttpServlet {
11     public void service(HttpServletRequest request, HttpServletResponse response) {
12         response.setContentType("text/html;charset=utf-8");//放在第一行
13         PrintWriter out = null;
14         try {
15             out = response.getWriter();
16         } catch (IOException e) {
17             // TODO Auto-generated catch block
18             e.printStackTrace();
19         } finally {
20             out.print("中文");
21             out.close();
22         }
23     }
24 }

为什么表单提交中文会出现乱码

    当表单提交时,浏览器会对表单中的中文参数值进行编码,而使用的编码是打开页面时所使用的字符集,如当前页面使用的UTF-8的字符集进行显示的,那么表单提交的数据就会以UTF-8的方式进行编码后传输,而Web服务器在默认情况下对提交的表单数据会使用ISO-8859-1的字符集来解码,编码与解码的方式不一致就产生了表单提交时的中文乱码问题。

如何解决表单提交时的中文乱码问题

步骤一、确保表单所在的页面按照指定的字符集打开

在HTML页面中使用meta标记可以确保浏览器按照指定的字符集进行解码页面,并限定表单提交时的数据编码方式

1 <meta http-equiv="content-type" content="text/html;charset=utf-8">


在服务器端需要在调用getParameter方法读取参数之前,告诉浏览器如何解码,使用如下代码即可完成该设置:

1 request.setCharacterEncoding("utf-8");

注意该方法一定要要放在所有request.getParameter方法之前。

这种方式只针对POST请求有效。

 

解决GET方式提交时的中文乱码问题

步骤一、确保表单所在的页面按照指定的字符集打开

在HTML页面中使用meta标记可以确保浏览器按照指定的字符集进行解码页面,并限定表单提交时的数据编码方式

<meta http-equiv="content-type" content="text/html;charset=utf-8">

步骤二、完成ISO-8859-1到UTF-8格式的转换

1 String username = request.getParameter(“username”);
2 username = new String(username.getBytes(“iso-8859-1”),“UTF-8”);

  由于GET方式提交的任何数据在服务器端一定会以ISO-8859-1的方式进行解码,所以服务器端可以先按ISO-8859-1的方式获取字节数组,在将该数组转变成UTF-8对应的字符串形式。

 1 package com.yunhua.servlet;
 2 
 3 import java.io.IOException;
 4 import java.io.PrintWriter;
 5 
 6 import javax.servlet.http.HttpServlet;
 7 import javax.servlet.http.HttpServletRequest;
 8 import javax.servlet.http.HttpServletResponse;
 9 
10 public class ServletTest extends HttpServlet {
11     public void service(HttpServletRequest request, HttpServletResponse response) {
12         response.setContentType("text/html;charset=utf-8");//放在第一行
13         PrintWriter out = null;
14         try {
15             request.setCharacterEncoding("UTF-8");         //放在前面拦截post请求的数据
16             //将iso-8859-1装换成指定字符集
17             String param = new String(request.getParameter("").getBytes("iso-8859-1"), "UTF-8");
18             out = response.getWriter();
19         } catch (IOException e) {
20             // TODO Auto-generated catch block
21             e.printStackTrace();
22         } finally {
23             out.print("中文");
24             out.close();
25         }
26     }
27 }

 

推荐阅读