Posted on 2007-08-24 11:25
hilor 閱讀(564)
評論(0) 編輯 收藏
影響JSP編碼的兩個(gè)屬性:
contentType 和 pageEncoding ;
首先,我們先了解一下JSP的編碼規(guī)則,從中可以理解到contentType和pageEncoding的作用域.
contentType的charset是指服務(wù)器發(fā)送給客戶端時(shí)的內(nèi)容編碼.而pageEncoding是jsp文件本身的編碼.
JSP要經(jīng)過兩次的“編碼”,第一階段會(huì)用pageEncoding,第二階段會(huì)用utf-8至utf-8,第三階段就是由Tomcat出來的網(wǎng)頁, 用的是contentType。
第一階段是jsp編譯成.java,它會(huì)根據(jù)pageEncoding的設(shè)定讀取jsp,結(jié)果是由指定的編碼方案翻譯成統(tǒng)一的UTF-8 JAVA源碼(即.java),如果pageEncoding設(shè)定錯(cuò)了,或沒有設(shè)定,出來的就是中文亂碼。
第二階段是由JAVAC的JAVA源碼至java byteCode的編譯,不論JSP編寫時(shí)候用的是什么編碼方案,經(jīng)過這個(gè)階段的結(jié)果全部是UTF-8的encoding的java源碼。
JAVAC用UTF-8的encoding讀取java源碼,編譯成UTF-8 encoding的二進(jìn)制碼(即.class),這是JVM對常數(shù)字串在二進(jìn)制碼(java encoding)內(nèi)表達(dá)的規(guī)范。
第三階段是Tomcat(或其的application container)載入和執(zhí)行階段二的來的JAVA二進(jìn)制碼,輸出的結(jié)果,也就是在客戶端見到的,這時(shí)隱藏在階段一和階段二的參數(shù)contentType就發(fā)揮了功效
contentType的設(shè)定.
pageEncoding 和contentType的預(yù)設(shè)都是 ISO8859-1. 而隨便設(shè)定了其中一個(gè), 另一個(gè)就跟著一樣了(TOMCAT4.1.27是如此). 但這不是絕對的, 這要看各自JSPC的處理方式. 而pageEncoding不等于contentType, 更有利亞洲區(qū)的文字 CJKV系JSP網(wǎng)頁的開發(fā)和展示, (例pageEncoding=GB2312 不等于 contentType=utf-8)。
從此我們可以看出, pageEncoding影響的是JSP編繹成.java文件(即servlet文件)階段,此時(shí)如果pageEncoding設(shè)定錯(cuò)了,用一般的編繹器編繹出來的.java文件中就會(huì)出現(xiàn)中文亂碼. 而用eclipse的話會(huì)提示你編碼錯(cuò)誤..
而contentType影響的是最后一個(gè)階段,即由Tomcat(或其的application container)載入和執(zhí)行階段二的來的JAVA二進(jìn)制碼(也就是.class文件)的階段,我們在客戶端看到的結(jié)果就是此階段產(chǎn)生的, 這時(shí)的編碼就是根據(jù)contentType來設(shè)定. 光從客戶端來說,pageEncoding 和contentType設(shè)置的不一樣,例pageEncoding=GB2312,contentType的charset=UTF-8,此時(shí)客戶端顯示的JSP頁面都能夠正常顯示中文亂碼.
但是更重要的是與服務(wù)器的交互... 當(dāng)從一個(gè)JSP頁面發(fā)送請求至服務(wù)器端時(shí), header中會(huì)發(fā)送什么數(shù)據(jù)呢?
header中發(fā)送的編碼設(shè)定是由contentType指定的.. 此時(shí)如果contentType指定的編碼與服務(wù)器的編碼不一致時(shí),在服務(wù)器端就會(huì)產(chǎn)生中文亂碼!
這是我經(jīng)過多次實(shí)驗(yàn)得出的結(jié)果-_-||| 希望大家不會(huì)再為JSP的中文亂碼問題頭痛.. (統(tǒng)一編碼為UTF-8是王道)
在開發(fā)J2EE WEB應(yīng)用時(shí)最好使用過濾器來杜絕中文亂碼的問題. 附過濾器源碼:
import java.io.IOException;

import javax.servlet.Filter;
import javax.servlet.FilterChain;
import javax.servlet.FilterConfig;
import javax.servlet.ServletException;
import javax.servlet.ServletRequest;
import javax.servlet.ServletResponse;


public class SetCharacterEncodingFilter implements Filter
{
private String encoding;

public void init(FilterConfig filterConfig) throws ServletException
{
// TODO Auto-generated method stub
this.encoding=filterConfig.getInitParameter("encoding");
}

public void doFilter(ServletRequest request, ServletResponse response,

FilterChain chain) throws IOException, ServletException
{
// TODO Auto-generated method stub
request.setCharacterEncoding(this.encoding);
chain.doFilter(request,response);
}


public void destroy()
{
// TODO Auto-generated method stub

}

}
在web.xml中添加以下代碼:
<filter>
<filter-name>SetCharacterEncodingFilter</filter-name>
<filter-class>org.hilor.servlet.SetCharacterEncodingFilter</filter-class>
<init-param>
<param-name>encoding</param-name>
<param-value>UTF-8</param-value>
</init-param>
</filter>

<filter-mapping>
<filter-name>SetCharacterEncodingFilter</filter-name>
<url-pattern>/*</url-pattern>
</filter-mapping>
這樣在所有的request請求的時(shí)候就會(huì)轉(zhuǎn)換成UTF-8編碼.