Posted on 2007-08-24 11:25
hilor 閱讀(564)
評論(0) 編輯 收藏
影響JSP編碼的兩個屬性:
contentType 和 pageEncoding ;
首先,我們先了解一下JSP的編碼規(guī)則,從中可以理解到contentType和pageEncoding的作用域.
contentType的charset是指服務器發(fā)送給客戶端時的內(nèi)容編碼.而pageEncoding是jsp文件本身的編碼.
JSP要經(jīng)過兩次的“編碼”,第一階段會用pageEncoding,第二階段會用utf-8至utf-8,第三階段就是由Tomcat出來的網(wǎng)頁, 用的是contentType。
第一階段是jsp編譯成.java,它會根據(jù)pageEncoding的設(shè)定讀取jsp,結(jié)果是由指定的編碼方案翻譯成統(tǒng)一的UTF-8 JAVA源碼(即.java),如果pageEncoding設(shè)定錯了,或沒有設(shè)定,出來的就是中文亂碼。
第二階段是由JAVAC的JAVA源碼至java byteCode的編譯,不論JSP編寫時候用的是什么編碼方案,經(jīng)過這個階段的結(jié)果全部是UTF-8的encoding的java源碼。
JAVAC用UTF-8的encoding讀取java源碼,編譯成UTF-8 encoding的二進制碼(即.class),這是JVM對常數(shù)字串在二進制碼(java encoding)內(nèi)表達的規(guī)范。
第三階段是Tomcat(或其的application container)載入和執(zhí)行階段二的來的JAVA二進制碼,輸出的結(jié)果,也就是在客戶端見到的,這時隱藏在階段一和階段二的參數(shù)contentType就發(fā)揮了功效
contentType的設(shè)定.
pageEncoding 和contentType的預設(shè)都是 ISO8859-1. 而隨便設(shè)定了其中一個, 另一個就跟著一樣了(TOMCAT4.1.27是如此). 但這不是絕對的, 這要看各自JSPC的處理方式. 而pageEncoding不等于contentType, 更有利亞洲區(qū)的文字 CJKV系JSP網(wǎng)頁的開發(fā)和展示, (例pageEncoding=GB2312 不等于 contentType=utf-8)。
從此我們可以看出, pageEncoding影響的是JSP編繹成.java文件(即servlet文件)階段,此時如果pageEncoding設(shè)定錯了,用一般的編繹器編繹出來的.java文件中就會出現(xiàn)中文亂碼. 而用eclipse的話會提示你編碼錯誤..
而contentType影響的是最后一個階段,即由Tomcat(或其的application container)載入和執(zhí)行階段二的來的JAVA二進制碼(也就是.class文件)的階段,我們在客戶端看到的結(jié)果就是此階段產(chǎn)生的, 這時的編碼就是根據(jù)contentType來設(shè)定. 光從客戶端來說,pageEncoding 和contentType設(shè)置的不一樣,例pageEncoding=GB2312,contentType的charset=UTF-8,此時客戶端顯示的JSP頁面都能夠正常顯示中文亂碼.
但是更重要的是與服務器的交互... 當從一個JSP頁面發(fā)送請求至服務器端時, header中會發(fā)送什么數(shù)據(jù)呢?
header中發(fā)送的編碼設(shè)定是由contentType指定的.. 此時如果contentType指定的編碼與服務器的編碼不一致時,在服務器端就會產(chǎn)生中文亂碼!
這是我經(jīng)過多次實驗得出的結(jié)果-_-||| 希望大家不會再為JSP的中文亂碼問題頭痛.. (統(tǒng)一編碼為UTF-8是王道)
在開發(fā)J2EE WEB應用時最好使用過濾器來杜絕中文亂碼的問題. 附過濾器源碼:
import java.io.IOException;

import javax.servlet.Filter;
import javax.servlet.FilterChain;
import javax.servlet.FilterConfig;
import javax.servlet.ServletException;
import javax.servlet.ServletRequest;
import javax.servlet.ServletResponse;


public class SetCharacterEncodingFilter implements Filter
{
private String encoding;

public void init(FilterConfig filterConfig) throws ServletException
{
// TODO Auto-generated method stub
this.encoding=filterConfig.getInitParameter("encoding");
}

public void doFilter(ServletRequest request, ServletResponse response,

FilterChain chain) throws IOException, ServletException
{
// TODO Auto-generated method stub
request.setCharacterEncoding(this.encoding);
chain.doFilter(request,response);
}


public void destroy()
{
// TODO Auto-generated method stub

}

}
在web.xml中添加以下代碼:
<filter>
<filter-name>SetCharacterEncodingFilter</filter-name>
<filter-class>org.hilor.servlet.SetCharacterEncodingFilter</filter-class>
<init-param>
<param-name>encoding</param-name>
<param-value>UTF-8</param-value>
</init-param>
</filter>

<filter-mapping>
<filter-name>SetCharacterEncodingFilter</filter-name>
<url-pattern>/*</url-pattern>
</filter-mapping>
這樣在所有的request請求的時候就會轉(zhuǎn)換成UTF-8編碼.