java web项目各种乱码的解决方案

您所在的位置:网站首页 键盘轴体排行榜最新 java web项目各种乱码的解决方案

java web项目各种乱码的解决方案

2024-01-04 17:56| 来源: 网络整理| 查看: 265

原创作品,允许转载,转载时请务必以超链接形式标明文章  原始出处 、作者信息和本人声明。否则将追究法律责任。 作者: 永恒の_☆ 地址: http://blog.csdn.net/chenghui0317/article/details/10299103 一、前言

    目前web项目中,很多乱码情况没有得到统一解决,或多或少影响开发效率和延长开发时间, 所以总结一下关于java web项目各种乱码情况的解决方案。

二、准备条件     1、一个普通的web项目 webProject;

     2、一个web服务器 Tomcat。

三、分析各种乱码的情况

     1、项目的编码格式和页面文件的编码格式不一样是否有冲突?

      答:webProject项目的编码格式是“GBK” ,项目下的页面中的编码格式是“UTF-8”,实践发现,项目的编码格式和页面的编码格式不一样不会有任何问题,显示的中文没有乱码。    

     查看项目的编码格式可以在 项目-->右键-->Properties--> Text file encoding 框内显示的具体值就是项目编码格式。 

     查看页面文件的编码格式可以在 页面-->右键-->Properties--> Text file encoding 框内显示的具体值就是页面文件的编码格式。

     2、页面的文件编码格式和页面内容的编码格式不一样是否有冲突?

      答:将页面文件编码格式改为“UTF-8”,页面的内容的编码格式改为“GBK”,具体如下:

[html]  view plain  copy           Insert title here      测试中文是否乱码!@#!@#       结果发现 乱码了,具体效果如下:

所以页面的文件的编码格式必须和页面内容的编码格式一样,否则显示肯定乱码。

     另外,如果页面中格式在eclipse显示 是好的,这个时候改变文件的编码格式也会乱码,如果非要改变文件编码的格式,可以这样: 先将显示正确的内容复制一份 然后修改文件的编码格式,这个时候文件内显示的是乱码,然后将复制的内容直接覆盖在这个页面中就好了。

     如果给将上面代码的pageEncoding改为"UTF-8"了发现显示正常了,所以可不可以这么说,页面显示是否乱码与charset指定的值无关?

     但是如果将上面代码的pageEncoding="UTF-8“这个属性直接去掉,然后显示效果,发现乱码了。 如果把contentType属性的值改为 contentType="text/html; charset=UTF-8" 试试效果,具体如下:

所以可以这么理解:在没有指定pageEncoding属性的时候, charset 将会被忽略,如果没有指定pageEncoding属性,那么页面就会按照charset的编码值来显示具体效果。

     如果charset指定的值是GBK ,这个时候由于没有pageEncoding 所以页面内容按照GBk编码显示,但是与文件编码格式不符合 ,索引导致乱码。具体效果如下:

     现在又有另外一种情况,如果pageEncoding指定了UTF-8 ,但是charset指定的是 GBK ,GB2312  这个时候页面显示不会乱码。

     但是如果charset指定的是iso-8859-1,这个时候页面显示就是乱码了,具体效果如下:

     但是如果charset指定的是big5,这个是页面显示只是部分乱码,具体效果如下:

所以BIG5只会会繁体或者没有繁体格式的文字敏感。

     现在再实验一下,把contentType属相也去掉,指定meta标签中content属性中的charset=UTF-8 ,具体效果如下:

一种另外格式的乱码显示出来了。。。

综上所述:在jsp中如果要显示正确的内容,并且保证其显示不乱码,必须要指定contentType 或者 pageEncoding 的属性与文件编码格式一致。并且如果他们都存在,那么pageEncoding必须与文件编码格式一致,contentType必须是中文编码格式才行。

    3、通过URL传递中文参数的时候接收的乱码怎么解决?

     答:新建一个servlet 名叫encodeServlet,在encode.jsp中添加超链接传递一个参数  跳转到该serlvet。

超链接如下:

[html]  view plain  copy go to servlet  

servlet接收参数,具体get方法处理方式如下:

[java]  view plain  copy     /**      * @see HttpServlet#doGet(HttpServletRequest request, HttpServletResponse response)      */      protected void doGet(HttpServletRequest request, HttpServletResponse response) throws ServletException, IOException {          String param = request.getParameter("param");                    request.getRequestDispatcher("../encode.jsp?param="+param).forward(request, response);      }   调试之后发现,参数乱码了:

     这是因为参数通过url传递的时候是以http超文本协议传递的,它的格式是 iso-8859-1 ,所以可以设置tomcat服务器全局URL请求的格式,这样子所有的请求都会按照这个编码格式传递参数了。具体如下:

在tomcat安装目录的conf/server.xml中找到protocol="HTTP/1.1"的属性配置的连接器,在里面添加URIEncoding属性,具体如下:

URIEncoding ,顾名思义,它只针对 URL传递的请求,即get请求。。

     并且如果这么设置之后就不能再使用 param = new String(param.getBytes("iso-8859-1"),"UTF-8");转码了  这样反而又变乱码了。

     另外还可以在接收到参数之后,重新指定编码也可以,具体如下:

[java]  view plain  copy String param = request.getParameter("param");  param = new String(param.getBytes("iso-8859-1"),"UTF-8");   调试页面,发现并没有成功,具体效果如下:

没有效果,,,为什么,?因为页面的内容编码是UTF-8的,但是URL它传递的时候只能传递iso-8859-1 的编码,如果直接传递UTF-8编码的内容,那么无论后台怎么转换都没有效果。 即使在servlet中重新指定charset 也无济于事。

     但是如果直接在地址栏输入: http://localhost:8080/webProject/servlet/encodeServlet?param=中文

并且修改一些代码,具体修改如下:

[java]  view plain  copy response.setContentType("text/html;charset=UTF-8");  String param = request.getParameter("param");  param = new String(param.getBytes("iso-8859-1"),"UTF-8");   然后运行效果如下:

这样子是没问题的。。

     但是如果非要使用new String()重新编码来实现接收中文怎么办呢?,可以修改源码,具体如下:

[java]  view plain  copy request.setCharacterEncoding("UTF-8");  String param = request.getParameter("param");  param = new String(param.getBytes("iso-8859-1"),"UTF-8");   设置字符编码格式 即可,具体效果如下:

实践证明,不管是超链接 跳转到servlet 还是直接在url输入中文跳转到servlet 只使用request.setCharacterEncoding("UTF-8"); 统一编码格式 都可以实现接收正确的参数。。

最开始一直以为request.setCharacterEncoding("UTF-8"); 只能处理post请求的参数,get请求的一样可以。

     既然这么有效果,那么为了避免重复的使用这行代码或者忘记使用而导致乱码,可以使用一个过滤器 统一处理任何请求的编码格式。一劳永逸。

具体FIlter代码如下:

[java]  view plain  copy package com.struts2.util;    import java.io.IOException;    import javax.servlet.Filter;  import javax.servlet.FilterChain;  import javax.servlet.FilterConfig;  import javax.servlet.ServletException;  import javax.servlet.ServletRequest;  import javax.servlet.ServletResponse;    import org.apache.log4j.Logger;    public class CharacterFilter implements Filter {        private Logger logger = Logger.getLogger(this.getClass());      String encoding = null;      @Override      public void destroy() {          logger.info("***************the CharacterFilter class' destroy() is invoking .***************");      }        @Override      public void doFilter(ServletRequest request, ServletResponse response,              FilterChain filterChain) throws IOException, ServletException {          request.setCharacterEncoding(encoding);          response.setCharacterEncoding(encoding);          filterChain.doFilter(request, response);      }        @Override      public void init(FilterConfig filterConfig) throws ServletException {          logger.info("***************the CharacterFilter class' init() is invoking .***************");          encoding = filterConfig.getInitParameter("encoding");      }    }   然后web.xml的配置如下:

[html]  view plain  copy     characterFitler    com.struts2.util.CharacterFilter          encoding      UTF-8            characterFitler    /*    

     但是但是,实际开发中,上面的配置在处理get请求的时候 有些时候可以指定编码成功,有的时候指定编码失败, 成功率大概60-70%之间,至今不知道为何会这样。。。

解决方案:

使用js函数编码之后,然后后台解码即可,具体前台代码如下:

[html]  view plain  copy         Insert title here      测试中文是否乱码!@#!@#  go to servlet    function goTo(){      var param = encodeURI(encodeURI("中文"));  //这里编码必须调用两次,因为传递后台后java程序会解码一次,然后自己还要解码一次,      location.href="/servlet/encodeServlet?param="+param;  }         后台解码代码如下:

[java]  view plain  copy //request.setCharacterEncoding("UTF-8");  //response.setContentType("text/html;charset=UTF-8");  String param = request.getParameter("param");  //param = new String(param.getBytes("iso-8859-1"),"UTF-8");//这个用于直接处理转换get请求的编码  //param = URLEncoder.encode(param);//这个是用于编码的方法  param = URLDecoder.decode(param);//这个是用于解码的方法   ok ,这样子解决了js函数请求后台出现乱码的情况。

     另外在利用PrintWriter输出的时候 出现乱码了,具体代码如下:

[java]  view plain  copy PrintWriter out = response.getWriter();  out.print("接收的参数是:"+param);    out.close();   具体效果如下所示:

这里可以在servlet请求的顶部加上response.setContentType("text/html;charset=UTF-8"); 设置内容编码格式 即可输出正确的效果,具体如下图:

综上所述:

(1)在参数的时候出现乱码,如果是get请求可以统一设置tomcat的uri编码处理格式,这样所有的url发送的请求都是以指定格式发送。

(2)request.setCharacterEncoding("UTF-8");主要用户 get/post请求中设置整个servlet的编码格式,好处是防止传递的中文参数乱码。

(3)response.setContentType("text/html;charset=UTF-8"); 主要用于指定当前请求中的内容格式,好处是防止输出内容的时候防止中文乱码。

(4)如果在处理中文乱码中以上方法都解决不了,那就要使用js前段编码两次,后台解码的方式处理。

    4、是否有其他框架的配置直接解决中文乱码情况?

     如果项目中使用了struts2 ,可以在sturts.xml中配置一个常量,指定所有post请求的编码,具体如下:

[html]  view plain  copy   

     如果在项目中使用了spring,可以在web.xml中配置一个过滤器也可以解决编码乱码的问题,具体如下:

[html]  view plain  copy     encodingFilter    org.springframework.web.filter.CharacterEncodingFilter          encoding      UTF-8              forceEncoding      true            encodingFilter    /*    


【本文地址】


今日新闻


推荐新闻


CopyRight 2018-2019 办公设备维修网 版权所有 豫ICP备15022753号-3