<rt id="bn8ez"></rt>
<label id="bn8ez"></label>

  • <span id="bn8ez"></span>

    <label id="bn8ez"><meter id="bn8ez"></meter></label>

    隨筆 - 1, 文章 - 44, 評論 - 2, 引用 - 0
    數(shù)據(jù)加載中……

    深入剖析Java編程中的中文問題及建議最優(yōu)解決方法

    說明:本文為作者原創(chuàng),作者聯(lián)系地址為: josserchai@yahoo.com 。由于 Java 編程中的中文

    問題是一個老生常談的問題,在閱讀了許多關(guān)于 Java 中文問題解決方法之后,結(jié)合作者的編程實踐,我發(fā)現(xiàn)過去談的許多方法都不能清晰地說明問題及解決問題,尤其是跨平臺時的中文問題。于是我給出此篇文章,內(nèi)容包括對控制臺運行的 class Servelets JSP EJB 類中的中文問題我剖析和建議解決辦法。希望大家指教。任何引用本文請注明出處!! Abstra

    ct :本文深入分析了 Java 程序設(shè)計中 Java 編譯器對 java 源文件和 JVM class 類文件的編碼 / 解碼過程,通過此過程的解析透視出了 Java 編程中中文問題產(chǎn)生的根本原因,最后給出了建議的最優(yōu)化的解決 Java 中文問題的方法。

    1 、中文問題的來源

    ??? 計算機最初的操作系統(tǒng)支持的編碼是單字節(jié)的字符編碼,于是,在計算機中一切處理程

    序最初都是以單字節(jié)編碼的英文為準(zhǔn)進行處理。隨著計算機的發(fā)展,為了適應(yīng)世界其它民族

    的語言(當(dāng)然包括我們的漢字),人們提出了 UNICODE 編碼,它采用雙字節(jié)編碼,兼容英文字符和其它民族的雙字節(jié)字符編碼,所以,目前,大多數(shù)國際性的軟件內(nèi)部均采用 UNICODE 編碼,在軟件運行時,它獲得本地支持系統(tǒng)(多數(shù)時間是操作系統(tǒng))默認(rèn)支持的編碼格式,然后再將軟件內(nèi)部的 UNICODE 轉(zhuǎn)化為本地系統(tǒng)默認(rèn)支持的格式顯示出來。 Java JDK JVM 即是如此,我這里說的 JDK 是指國際版的 JDK ,我們大多數(shù)程序員使用的是國際化的 JDK 版本,以下所有的 JDK 均指國際化的 JDK 版本。我們的漢字是雙字節(jié)編碼語言,為了能讓計算機處理中文,我們自己制定的 gb2312 GBK GBK2K 等標(biāo)準(zhǔn)以適應(yīng)計算機處理的需求。所以,大部分的操作系統(tǒng)為了適應(yīng)我們處理中文的需求,均定制有中文操作系統(tǒng),它們采用的是 GBK,GB2312 編碼格式以正確顯示我們的漢字。如:中文 Win2K 默認(rèn)采用的是 GBK 編碼顯示,在中文 WIN2k 中保存文件時默認(rèn)采用的保存文件的編碼格式 GBK ,即,所有在中文 WIN2K 中保存的文件它的內(nèi)部編碼默認(rèn)均采用 GBK 編碼,注意: GBK 是在 GB2312 基礎(chǔ)上擴充來的

    ??? 由于 Java 語言內(nèi)部采用 UNICODE 編碼,所以在 JAVA 程序運行時,就存在著一個 UNICODE 編碼和對應(yīng)的操作系統(tǒng)及瀏覽器支持的編碼格式轉(zhuǎn)換輸入、輸出的 問題,這個轉(zhuǎn)換過程有著一系列的步驟,如果其中任何一步出錯,則顯示出來的漢字就會出是亂碼,這就是我們常見的 JAVA 中文問題。

    ??? 同時, Java 是一個跨平臺的編程語言,也即我們編寫的程序不僅能在中文 windows 上運行,也能在中文 Linux 等系統(tǒng)上運行,同時也要求能在英文等系統(tǒng)上運行(我們經(jīng)常看到有人把在中文 win2k 上編寫的 JAVA 程序,移植到英文 Linux 上運行)。這種移植操作也會帶來中文問題。

    ??? 還有,有人使用英文的操作系統(tǒng)和英文的 IE 等瀏覽器,來運行帶中文字符的程序和瀏覽中文網(wǎng)頁,它們本身就不支持中文,也會帶來中文問題。

    幾乎所有的瀏覽器默認(rèn)在傳遞參數(shù)時都是以 UTF-8 編碼格式來傳遞,而不 是按中文編碼傳遞,所以,傳遞中文參數(shù)時也會有問題,從而帶來亂碼現(xiàn)象。

    總之,以上幾個方面是 JAVA 中的中文問題的主要來源,我們把以上原因造成的程序不能正確運行而產(chǎn)生的問題稱作: JAVA 中文問題。

    ?

    2 JAVA 編碼轉(zhuǎn)換的詳細(xì)過程

    ??? 我們常見的 JAVA 程序包括以下類別:

    ???? * 直接在 console 上運行的類 ( 包括可視化界面的類 )

    ???? *JSP 代碼類(注: JSP Servlets 類的變型)

    ???? *Servelets

    ???? *EJB

    ???? * 其它不可以直接運行的支持類

    ? ?? 這些類文件中,都有可能含有中文字符串,并且我們常用前三類 JAVA 程序和用戶直接交互,用于輸出和輸入字符,如:我們在 JSP Servlet 中得到客戶端送來的字符,這些字符也包括中文字符。無論這些 JAVA 類的作用如何,這些 JAVA 程序的生命周期都是這樣的:

    ??? * 編程人員在一定的操作系統(tǒng)上選擇一個合適的編輯軟件來實現(xiàn)源程序代碼并以 .java

    展名保存在操作系統(tǒng)中,例如我們在中文 win2k 中用記事本編輯一個 java 源程序;

    ???? * 編程人員用 JDK 中的 javac.exe 來編譯這些源代碼,形成 .class (JSP 文件是由容器調(diào)用 JDK 來編譯的 )

    ???? * 直接運行這些類或?qū)⑦@些類布署到 WEB 容器中去運行,并輸出結(jié)果。

    ?

    ??? 那么,在這些過程中, JDK JVM 是如何將這些文件如何編碼和解碼并運行的呢?

    這里,我們以中文 win2k 操作系統(tǒng)為例說明 JAVA 類是如何來編碼和被解碼的。

    ?

    ??? 第一步,我們在中文 win2k 中用編輯軟件如記事本編寫一個 Java 源程序文件 ( 包括以上五類 JAVA 程序 ) ,程序文件在保存時默認(rèn)采用了操作系統(tǒng)默認(rèn)支持 GBK 編碼格式 ( 操作系統(tǒng)默認(rèn)支持的格式為 file.encoding 格式 ) 形成了一個 .java 文件,也即, java 程序在被編譯前,我們的 JAVA 源程序文件是采用操作系統(tǒng)默認(rèn)支持的 file.encoding 編碼格式保存的 java 源程序中含有中文信息字符和英文程序代碼;要查看系統(tǒng)的 file.encoding 參數(shù),可以用以下代

    碼:

    public class ShowSystemDefaultEncoding {

    public static void main(String[] args) {

    String encoding = System.getProperty("file.encoding");

    System.out.println(encoding);

    }}

    ??? 第二步,我們用 JDK javac.exe 文件編譯我們的 Java 源程序,由于 JDK 是國際版的,在編譯的時候,如果我們沒有用 -encoding 參數(shù)指定我們的 JAVA 源程序的編碼格式, javac.

    exe 首先獲得我們操作系統(tǒng)默認(rèn)采用的編碼格式 ,也即在編譯 java 程序時,若我們不指定源

    程序文件的編碼格式, JDK 首先獲得操作系統(tǒng)的 file.encoding 參數(shù) ( 它保存的就是操作系統(tǒng)

    默認(rèn)的編碼格式,如 WIN2k ,它的值為 GBK) 然后 JDK 就把我們的 java 源程序從 file.encodi

    ng 編碼格式轉(zhuǎn)化為 JAVA 內(nèi)部默認(rèn)的 UNICODE 格式放入內(nèi)存中。然后, javac 把轉(zhuǎn)換后的 unicode 格式的文件進行編譯成 .class 類文件,此時 .class 文件是 UNICODE 編碼的,它暫放在內(nèi)存中,緊接著, JDK 將此以 UNICODE 編碼的編譯后的 class 文件保存到我們的

    操作系統(tǒng)中形成我們見到的 .class文件。 對我們來說,我們最終獲得的.class文件是內(nèi)容以UNICODE編碼格式保存的類文件 ,它內(nèi)部包含我們源程序中的中文字符串,只不過此時它己經(jīng)由 file.encoding 格式轉(zhuǎn)化為 UNICODE 格式了。

    ??? 這一步中,對于 JSP 源程序文件是不同的,對于 JSP ,這個過程是這樣的:即 WEB 容器調(diào)用 JSP 編譯器, JSP 編譯器先查看 JSP 文件中是否設(shè)置有文件編碼格式,如果 JSP 文件中沒有設(shè)置 JSP 文件的編碼格式,則 JSP 編譯器調(diào)用 JDK 先把 JSP 文件用 JVM 默認(rèn)的字符編碼格式 ( 也即 WEB 容器所在的操作系統(tǒng)的默認(rèn)的 file.encoding) 轉(zhuǎn)化為臨時的 Servlet 類,然后再把它編譯成 UNICODE 格式的 class 類,并保存在臨時文件夾中。如:在中文 win2k 上, WEB 容器就把 JSP 文件從 GBK 編碼格式轉(zhuǎn)化為 UNICODE 格式,然后編譯成臨時保存的 Servlet 類,以響應(yīng)用戶的請求。

    ??? 第三步,運行第二步編譯出來的類,分為三種情況:

    ??? A 直接在 console 上運行的類

    ??? B EJB 類和不可以直接運行的支持類 ( JavaBean )

    ??? C JSP 代碼和 Servlet

    ??? D JAVA 程序和數(shù)據(jù)庫之間

    下面我們分這四種情況來看。

    ?

    ??? A 、直接在 console 上運行的類

    ??? 這種情況,運行該類首先需要 JVM 支持,即操作系統(tǒng)中必須安裝有 JRE 運行過程是這樣的:首先 java 啟動 JVM 此時JVM讀出操作系統(tǒng)中保存class文件并把內(nèi)容讀入內(nèi)存中,此時內(nèi)存中為 UNICODE格式的 class ,然后 JVM 運行它,如果此時此類需要接收用戶輸入,則類會默認(rèn)用file.encoding編碼格式對用戶輸入的串進行編碼并轉(zhuǎn)化為unicode保存入內(nèi)存 (用戶可以設(shè)置輸入流的編碼格式)。程序運行后,產(chǎn)生的字符串(UNICODE編碼的)再回交給JVM,最后 JRE把此字符串再轉(zhuǎn)化為 file.encoding格式 ( 用戶可以設(shè)置輸出流的編碼格式 ) 傳遞給操作系統(tǒng)顯示接口并輸出到界面上。

    ??? 對于這種直接在 console 上運行的類,它的轉(zhuǎn)化過程可用圖 1 更加明確的表示出來:

    ??? 1

    以上每一步的轉(zhuǎn)化都需要正確的編碼格式轉(zhuǎn)化,才能最終不出現(xiàn)亂碼現(xiàn)象。

    ?

    ??? B EJB 類和不可以直接運行的支持類 ( JavaBean )

    ??? 由于 EJB 類和不可以直接運行的支持類,它們一般不與用戶直接交互輸入和輸出,它們常常與其它的類進行交互輸入和輸出,所以它們在第二步被編譯后,就形成了內(nèi)容是 UNICODE 編碼的類保存在操作系統(tǒng)中了,以后只要它與其它的類之間的交互在參數(shù)傳遞過程中沒有丟失,則它就會正確的運行。這種 EJB 類和不可以直接運行的支持類 , 它的轉(zhuǎn)化過程可用圖 2 更加明確的表示出來:

    2

    ?

    ??? C JSP 代碼和 Servlet

    ??? 經(jīng)過第二步后, JSP 文件也被轉(zhuǎn)化為 Servlets 類文件,只不過它不像標(biāo)準(zhǔn)的 Servlets

    校存在于 classes 目錄中,它存在于 WEB 容器的臨時目錄中,故這一步中我們也把它做為 Servlets 來看。

    ??? 對于 Servlets ,客戶端請求它時, WEB 容器調(diào)用它的 JVM 來運行 Servlet ,首先, JVM Servlet class 類從系統(tǒng)中讀出并裝入內(nèi)存中,內(nèi)存中是以 UNICODE 編碼的 Servlet 類的代碼,然后 JVM 在內(nèi)存中運行該 Servlet 類,如果 Servlet 在運行的過程中,需要接受從

    客戶端傳來的字符如:表單輸入的值和 URL 中傳入的值, 此時如果程序中沒有設(shè)定接受參數(shù)時采用的編碼格式,則 WEB 容器會默認(rèn)采 ISO-8859-1 編碼格式來接受傳入的值并在 JVM 中轉(zhuǎn)化為 UNICODE 格式的保存在 WEB 容器的內(nèi)存中 Servlet 運行后生成輸出,輸出的字符串是 UNICODE 格式的,緊接著,容器將 Servlet 運行產(chǎn)生的 UNICODE 格式的串(如 html 語法,用戶輸出的串等)直接發(fā)送到客戶端瀏覽器上并輸出給用戶,如果此時指定了發(fā)送時輸出的編碼格式,則按指定的編碼格式輸出到瀏覽器上,如果沒有指定,則默認(rèn) ISO-8859-1 編碼發(fā)送到客戶的瀏覽器上。這種 JSP 代碼和 Servlet 類,它的轉(zhuǎn)化過程可用 3 更加明確地表示出來:

    3

    ?

    ??? D Java 程序和數(shù)據(jù)庫之間

    ??? 對于幾乎所有數(shù)據(jù)庫的 JDBC 驅(qū)動程序,默認(rèn)的在 JAVA 程序和數(shù)據(jù)庫之間傳遞數(shù)據(jù)都是以 ISO-8859-1 為默認(rèn)編碼格式的,所以,我們的程序在向數(shù)據(jù)庫內(nèi)存儲包含中文的數(shù)據(jù)時, JDBC 首先是把程序內(nèi)部的 UNICODE 編碼格式的數(shù)據(jù)轉(zhuǎn)化為 ISO-8859-1 的格式,然后傳遞到數(shù)據(jù)庫中,在數(shù)據(jù)庫保存數(shù)據(jù)時,它默認(rèn)即以 ISO-8859-1 保存,所以,這是為什么我們常常在數(shù)據(jù)庫中讀出的中文數(shù)據(jù)是亂碼。

    ??? 對于 JAVA 程序和數(shù)據(jù)庫之間的數(shù)據(jù)傳遞,我們可以用圖 4 清晰地表示出來:

    4

    ?

    3 、分析常見的 JAVA 中文問題幾個必須清楚的原則

    ??? 首先,經(jīng)過上面的詳細(xì)分析,我們可以清晰地看到,任何 JAVA 程序的生命期中,其編碼轉(zhuǎn)換的關(guān)鍵過程是在于:最初編譯成 class 文件的轉(zhuǎn)碼和最終向用戶輸出的轉(zhuǎn)碼過程。

    ??? 其次,我們必須了解 JAVA 在編譯時支持的、常用的編碼格式有以下幾種:

    ??? *ISO-8859-1 8-bit, 8859_1,ISO-8859-1,ISO_8859_1 等編碼

    ??? *Cp1252 ,美國英語編碼,同 ANSI 標(biāo)準(zhǔn)編碼

    ??? *UTF-8 ,同 unicode 編碼

    ??? *GB2312 ,同 gb2312-80,gb2312-1980 等編碼

    ??? *GBK , MS936 ,它是 gb2312 的擴充

    ? ?? 及其它的編碼,如韓文、日文、繁體中文等。同時,我們要注意這些編碼間的兼容關(guān)體

    系如下:

    ??? unicode UTF-8 編碼是一一對應(yīng)的關(guān)系 GB2312 可以認(rèn)為是 GBK 的子集 ,即 GBK 編碼是在 gb2312 上擴展來的。同時, GBK 編碼包含了 20902 個漢字,編碼范圍為: 0x8140-0xfefe ,所有的字符可以一一對應(yīng)到 UNICODE2.0 中來。

    ??? 再次,對于放在操作系統(tǒng)中的 .java 源程序文件,在編譯時,我們可以指定它內(nèi)容的

    碼格式,具體來說用 -encoding 來指定。注意:如果源程序中含有中文字符,而你用 -encod

    ing 指定為其它的編碼字符,顯然是要出錯的。用 -encoding 指定源文件的編碼方式為 GBK gb2312 ,無論我們在什么系統(tǒng)上編譯含有中文字符的 JAVA 源程序都不會有問題,它都會正確地將中文轉(zhuǎn)化為 UNICODE 存儲在 class 文件中。

    然后,我們必須清楚,幾乎所有的 WEB 容器在其內(nèi)部默認(rèn)的字符編碼格式都是以 ISO-8859-1 為默認(rèn)值的,同時,幾乎所有的瀏覽器在傳遞參數(shù)時都是默認(rèn)以 UTF-8 的方式來傳遞參數(shù)的。所以,雖然我們 Java 源文件在出入口的地方指定了正確的編碼方式,但其在容器內(nèi)部運行時還是以 ISO-8859-1 處理的。

    4 、中文問題的分類及其建議最優(yōu)解決辦法

    ??? 了解以上 JAVA 處理文件的原理之后,我們就可以提出了一套建議最優(yōu)的解決漢字問題的辦法。

    ??? 我們的目標(biāo)是:我們在中文系統(tǒng)中編輯的含有中文字符串或進行中文處理的 JAVA 源程序經(jīng)編譯后可以移值到任何其它的操作系統(tǒng)中正確運行,或拿到其它操作系統(tǒng)中編譯后能正確運行,能正確地傳遞中文和英文參數(shù),能正確地和數(shù)據(jù)庫交流中英文字符串。

    ??? 我們的具體思路是: JAVA 程序轉(zhuǎn)碼的入口和出口及 JAVA 程序同用戶有輸入輸出轉(zhuǎn)換的地方限制編碼方法使之正確即可

    ??? 具體解決辦法如下:

    ??? 1 針對直接在 console 上運行的類

    ??? 對于這種情況,我們建議在程序編寫時,如果需要從用戶端接收用戶的可能含有中文的

    輸入或含有中文的輸出,程序中應(yīng)該采用字符流來處理輸入和輸出,具體來說,

    應(yīng)用以下面向字符型節(jié)點流類型

    ??? 對文件: FileReader FileWrieter

    ??????? ???? 其字節(jié)型節(jié)點流類型為: FileInputStream FileOutputStream

    ??? 對內(nèi)存(數(shù)組): CharArrayReader CharArrayWriter

    ??????? ??????????? 其字節(jié)型節(jié)點流類型為: ByteArrayInputStream ByteArrayOutputStream

    ??? 對內(nèi)存(字符串): StringReader StringWriter

    ??? 對管道: PipedReader PipedWriter

    ??????? ???? 其字節(jié)型節(jié)點流類型為: PipedInputStream PipedOutputStream

    同時,應(yīng)該

    用以下面向字符型處理流來處理輸入和輸出

    ??? BufferedWriter BufferedReader

    ??????? ???? 其字節(jié)型的處理流為: BufferedInputeStream BufferedOutputStream

    ??? InputStreamReader OutputStreamWriter

    ??? ???????? 其字節(jié)型的處理流為: DataInputStream DataOutputStream

    ??? 其中 InputStreamReader InputStreamWriter 用于將字節(jié)流按照指定的字符編碼集轉(zhuǎn)換到字符流 ,如:

    ??? InputStreamReader in = new InputStreamReader(System.in "GB2312")

    ??? OutputStreamWriter out = new OutputStreamWriter (System.out "GB2312")

    ??? 例如:采用如下的示例 JAVA 編碼就達到了要求:

    //Read.java

    import java.io.*;

    public class Read {

    public static void main(String[] args) throws IOException {

    String str = "\n 中文測試,這是內(nèi)部硬編碼的串 "+"\ntest english character";

    String strin= "";

    BufferedReader stdin = new BufferedReader(new InputStreamReader(System.in,"gb23

    12")); // 設(shè)置輸入接口按中文編碼

    BufferedWriter stdout = new BufferedWriter(new OutputStreamWriter(System.out,"g

    b2312")); // 設(shè)置輸出接口按中文編碼

    stdout.write(" 請輸入 :");

    stdout.flush();

    strin = stdin.readLine();

    stdout.write(" 這是從用戶輸入的串: "+strin);

    stdout.write(str);

    stdout.flush();

    }}

    ??? 同時,在編譯程序時,我們用以下方式來進行:

    ??? javac -encoding gb2312 Read.java

    ??? 其運行結(jié)果如圖 5 所示:

    ?

    ??? 5

    ??? 2 針對 EJB 類和不可以直接運行的支持類 ( JavaBean )

    ??? 由于這種類它們本身被其它的類調(diào)用,不直接與用戶交互,故對這種類來說,我們的建

    議的處理方式是內(nèi)部程序中應(yīng)該采用字符流來處理程序內(nèi)部的中文字符串(具體如上面一節(jié)

    中一樣),同時,在編譯類時用 -encoding gb2312 參數(shù)指示源文件是中文格式編碼的即可。

    ??? 3 針對 Servlet

    ??? 針對 Servlet ,我們建議用以下方法:

    ??? 在編譯 Servlet 類的源程序時,用 -encoding 指定編碼為 GBK GB2312 ,且在向用戶輸出

    時的編碼部分用 response 對象 setContentType("text/html;charset=GBK"); gb2312 來設(shè)

    輸出編碼格式,同樣在接收用戶輸入時,我們用 request.setCharacterEncoding("GB231

    2") ;這樣無論我們的 servlet 類移植到什么操作系統(tǒng)中,只有客戶端的瀏覽器支 持中文顯示

    ,就可以正確顯示。如下是一個正確的示例:

    //HelloWorld.java

    package hello;

    import java.io.*;

    import javax.servlet.*;

    import javax.servlet.http.*;

    public class HelloWorld extends HttpServlet

    {

    public void init() throws ServletException { }

    public void doGet(HttpServletRequest request, HttpServletResponse response) thr

    ows IOException, ServletException

    {

    request.setCharacterEncoding("GB2312"); // 設(shè)置輸入編碼格式

    response.setContentType("text/html;charset=GB2312"); // 設(shè)置輸出編碼格式

    PrintWriter out = response.getWriter(); // 建議使用 PrintWriter 輸出

    out.println("<hr>");

    out.println("Hello World! This is created by Servlet! 測試中文 !");

    out.println("<hr>");

    }

    public void doPost(HttpServletRequest request, HttpServletResponse response) th

    rows IOException, ServletException

    {

    request.setCharacterEncoding("GB2312"); // 設(shè)置輸入編碼格式

    response.setContentType("text/html;charset=GB2312"); // 設(shè)置輸出編碼格式

    String name = request.getParameter("name");

    String id = request.getParameter("id");

    if(name==null) name="";

    if(id==null) id="";

    PrintWriter out = response.getWriter(); // 建議使用 PrintWriter 輸出

    out.println("<hr>");

    out.println(" 你傳入的中文字串是: " + name);

    out.println("<hr> 你輸入的 id 是: " + id);

    out.println("<hr>");

    }

    public void destroy() { }

    }

    ??? 請用 javac -encoding gb2312 HelloWorld.java 來編譯此程序。

    ??? 測試此 Servlet 的程序如下所示:

    <%@page contentType="text/html; charset=gb2312"%>

    <%request.setCharacterEncoding("GB2312");%>

    <html><head><title></title>

    <Script language="JavaScript">

    function Submit() {

    // 通過 URL 傳遞中文字符串值給 Servlet

    document.base.action = "./HelloWorld?name= 中文 ";

    document.base.method = "POST";

    document.base.submit();

    }

    </Script>

    </head>

    <body bgcolor="#FFFFFF" text="#000000" topmargin="5">

    <form name="base" method = "POST" target="_self">

    <input name="id" type="text" value="" size="30">

    <a href = "JavaScript:Submit()"> 傳給 Servlet</a>

    </form></body></html>

    ??? 其運行結(jié)果如圖 6 所示:

    ?

    ??? 6

    ??? 4 JAVA 程序和數(shù)據(jù)庫之間

    ??? 為避免 JAVA 程序和數(shù)據(jù)庫之間數(shù)據(jù)傳遞出現(xiàn)亂碼現(xiàn)象,我們建議采用以下最優(yōu)方法來處

    理:

    ??? 1 對于 JAVA 程序的處理方法按我們指定的方法處理。

    ??? 2 把數(shù)據(jù)庫默認(rèn)支持的編碼格式改為 GBK GB2312 的。

    ??? 如:在 mysql 中,我們可以在配置文件 my.ini 中加入以下語句實現(xiàn):

    ??? [mysqld] 區(qū)增加:

    ??? default-character-set=gbk

    ??? 并增加:

    ??? [client]

    ??? default-character-set=gbk

    ??? SQL Server2K 中,我們可以將數(shù)據(jù)庫默認(rèn)的語言設(shè)置為 Simplified Chinese 來達到目

    的。

    ??? 5 針對 JSP 代碼

    ??? 由于 JSP 是在運行時,由 WEB 容器進行動態(tài)編譯的,如果我們沒有指定 JSP 源文件的編碼

    格式,則 JSP 編譯器會獲得服務(wù)器操作系統(tǒng)的 file.encoding 值來對 JSP 文件編譯的,它在移

    植時最容易出問題,如在中文 win2k 中可以很好運行的 jsp 文件拿到英文 linux 中就不行,盡

    管客戶端都是一樣的,那是因為容器在編譯 JSP 文件時獲取的操作系統(tǒng)的編碼不同造成的(

    在中文 wink 中的 file.encoding 和在英文 Linux file.encoding 是不同的,且英文 Linux f

    ile.encoding 對中文不支持,所以編譯出來的 JSP 類就會有問題)。網(wǎng)絡(luò)上討論的大多數(shù)是

    此類問題,多是因為 JSP 文件移植平臺時不能正確顯示的問題,對于這類問題,我們了解了

    JAVA 中程序編碼轉(zhuǎn)換的原理,解決起來就容易多了。我們建議的解決辦法如下:

    ??? 1 、我們要保證 JSP 向客戶端輸出時是采用中文編碼方式輸出的,即無論如何我們首先在

    我們的 JSP 源代編中加入以下一行:

    ??? <%@page contentType="text/html; charset=gb2312"%>

    ??? 2 、為了讓 JSP 能正確獲得傳入的參數(shù),我們在 JSP 源文件頭加入下面一句:

    ??? <%request.setCharacterEncoding("GB2312");%>

    ??? 3 、為了讓 JSP 編譯器能正確地解碼我們的含有中文字符的 JSP 文件,我們需要在 JSP 源文

    件中指定我們的 JSP 源文件的編碼格式,具體來說,我們在 JSP 源文件頭上加入下面的一句即

    可:

    ?? ?<%@page pageEncoding="GB2312"%> <%@page pageEncoding="GBK"%>

    ??? 這是 JSP 規(guī)范 2.0 新增加的指令。

    ??? 我們建議使用此方法來解 JSP 文件中的中文問題,下面的代碼是一個正確做法的 JSP 文件

    的測試程序:

    //testchinese.jsp

    <%@page pageEncoding="GB2312"%>

    <%@page contentType="text/html; charset=gb2312"%>

    <%request.setCharacterEncoding("GB2312");%>

    <%

    String action = request.getParameter("ACTION");

    String name = "";

    String str = "";

    if(action!=null && action.equals("SENT"))

    {

    name = request.getParameter("name");

    str = request.getParameter("str");

    }

    %>

    <html>

    <head>

    <title></title>

    <Script language="JavaScript">

    function Submit()

    {

    document.base.action = "?ACTION=SENT&str= 傳入的中文 ";

    document.base.method = "POST";

    document.base.submit();

    }

    </Script>

    </head>

    <body bgcolor="#FFFFFF" text="#000000" topmargin="5">

    <form name="base" method = "POST" target="_self">

    <input type="text" name="name" value="" size="30">

    <a href = "JavaScript:Submit()"> 提交 </a>

    </form>

    <%

    if(action!=null && action.equals("SENT"))

    {

    out.println("<br> 你輸入的字符為: "+name);

    out.println("<br> 你通過 URL 傳入的字符為: "+str);

    }

    %>

    </body>

    </html>

    ??? 如圖 7 是此程序運行的結(jié)果示意圖:

    ?

    ??? 7

    5 、總結(jié)

    ??? 在上面的詳細(xì)分析中,我們清晰地給出了 JAVA 在處理源程序過程中的詳細(xì)轉(zhuǎn)換過程,為我們正確解決 JAVA 編程中的中文問題提供了基礎(chǔ)。同時,我們給出了認(rèn)為是最優(yōu)的解決 JAVA 中文問題的辦法。

    6 、參考資料

    ??? 1 、段明輝 .Java 編程技術(shù)中漢字問題的分析及解決 .

    ??????? http://www-900.ibm.com/developerWorks/cn/java/java_chinese/index.shtml

    ??? 2 周競濤 . 關(guān)于 Java 中文問題的幾條分析原則

    ??????? http://www-900.ibm.com/developerWorks/cn/java/l-javachinese/index.shtml

    ??? 7 、作者介紹

    ??????? 作者: abnerchai ,高級程序員,作者聯(lián)系方法: josserchai@yahoo.com

    posted on 2006-06-21 15:59 ASONG 閱讀(447) 評論(0)  編輯  收藏 所屬分類: JAVA

    主站蜘蛛池模板: 亚洲欧洲无卡二区视頻| 国产精品亚洲一区二区三区久久 | 最近中文字幕无免费| 91亚洲性爱在线视频| 亚洲VA综合VA国产产VA中| 久久免费视频99| 亚洲国产精品无码第一区二区三区| 久久亚洲国产精品五月天婷| 97国产免费全部免费观看| 一级片在线免费看| 亚洲乱码日产精品BD在线观看| 亚洲国产成人精品无码久久久久久综合| 亚洲免费精彩视频在线观看| 国产AV无码专区亚洲AV琪琪| 亚洲人成电影亚洲人成9999网| 国产精品四虎在线观看免费 | 欧洲乱码伦视频免费| 产传媒61国产免费| 亚洲欧洲日韩在线电影| 亚洲天堂免费在线视频| 日韩不卡免费视频| 国产在线精品免费aaa片| 久久精品国产亚洲AV天海翼| 亚洲视频免费在线播放| 久久久久亚洲AV无码专区网站 | 成人片黄网站色大片免费观看APP| 亚洲日日做天天做日日谢| 亚洲va中文字幕无码久久不卡| 国产精品另类激情久久久免费| 亚洲高清免费在线观看| 中文在线观看国语高清免费| 黑人粗长大战亚洲女2021国产精品成人免费视频 | 四虎永久免费地址在线观看| 精品国产sm捆绑最大网免费站| 狠狠躁狠狠爱免费视频无码| 亚洲Av无码国产一区二区| 亚洲国产视频一区| 久久精品夜色国产亚洲av| 国产精品亚洲产品一区二区三区| 国产成人高清精品免费软件| 欧美a级成人网站免费|