<rt id="bn8ez"></rt>
<label id="bn8ez"></label>

  • <span id="bn8ez"></span>

    <label id="bn8ez"><meter id="bn8ez"></meter></label>

    沒(méi)有眼淚
    Don't Cry!
    posts - 13,comments - 44,trackbacks - 0
    在javaweb開(kāi)發(fā)過(guò)程中g(shù)et和post亂碼是一個(gè)老生常談的話題了,相信人人都遇到過(guò)。網(wǎng)上的文章也很多,但往往是看的越多就越糊涂,有些東西只有自己了然于心才能真正地明白。下面就寫一篇文章,就亂碼產(chǎn)生的過(guò)程分析一下。
    為什么會(huì)產(chǎn)生亂碼?

    1.   為什么會(huì)產(chǎn)生亂碼?

    因?yàn)闉g覽器不允許提交非ASCII字符,如果提交了非ASCII,則瀏覽器自動(dòng)對(duì)其進(jìn)行編碼,將它們轉(zhuǎn)換為ASCII字符。根據(jù)瀏覽器的不同,轉(zhuǎn)換時(shí)使用的編碼也不同,比如有些瀏覽器會(huì)使用utf-8進(jìn)行編碼,而有些會(huì)使用gbk進(jìn)行編碼。

    2.   瀏覽器為什么不允許提交非ASCII字符?

    以下是我個(gè)人觀點(diǎn),僅供參考。

    因?yàn)闉g覽器和服務(wù)器通信,傳輸?shù)亩际亲止?jié)。而我們?cè)陧?yè)面提交的都是字符,所以瀏覽器底層就有一個(gè)將字符轉(zhuǎn)換為字節(jié)的過(guò)程,這個(gè)過(guò)程涉及到編碼,瀏覽器到底是用utf-8、gbk還是iso-8859-1將字符轉(zhuǎn)換為字節(jié)呢?我想應(yīng)該是iso-8859-1,因?yàn)檫@是西歐默認(rèn)使用的編碼。何況,也沒(méi)有任何理由使用前兩種編碼格式。但是iso-8859-1編碼是不能識(shí)別中文以及其他非ASCII字符的,所以如果字符中存在這類字符,那么將字符轉(zhuǎn)換為字節(jié)的過(guò)程中勢(shì)必會(huì)產(chǎn)生亂碼。為了避免這種情況的發(fā)生,瀏覽器自動(dòng)對(duì)非ASCII字符進(jìn)行了編碼,將這類字符轉(zhuǎn)換為ASCII字符,這樣就能避免亂碼問(wèn)題。

    3.   GETPOST提交表單,分別根據(jù)什么對(duì)非ASCII字符進(jìn)行編碼?

    GET

    情況比較復(fù)雜,不同瀏覽器也不一樣,有的使用gbk,有的使用utf-8不好一概而論。

    POST

    瀏覽器會(huì)根據(jù)網(wǎng)頁(yè)編碼對(duì)表單中的數(shù)據(jù)編碼。比如我們?cè)?/span>jsp頁(yè)面第一行所寫的:<%@page contentType="text/html;charset=UTF-8"%>。那么這個(gè)網(wǎng)頁(yè)響應(yīng)給客戶端后使用的就是utf-8編碼,那么post時(shí)使用的也是這個(gè)編碼。

    編碼后的格式可以參考java中的URLEncoder.encode方法編碼的結(jié)果。

    4.   服務(wù)器底層如何處理提交的數(shù)據(jù)。

    上面2已經(jīng)提到,客戶端和服務(wù)器端傳輸?shù)氖亲止?jié),那么服務(wù)器端接收到的原始數(shù)據(jù)就是字節(jié)。但是我們的程序通常需要從服務(wù)器獲取字符,而不是字節(jié),所以服務(wù)器端必須將字節(jié)轉(zhuǎn)換為字符。這里也涉及編碼,服務(wù)器采取什么編碼方式將字節(jié)轉(zhuǎn)換為字符?我想也是iso-8859-1,這樣和客戶端的編碼方式一致,不會(huì)產(chǎn)生亂碼,相當(dāng)于一個(gè)還原字符的過(guò)程。這里有個(gè)問(wèn)題,比如客戶端發(fā)送:name=%D6%D0%B9%FA,那么服務(wù)器端還原后也是:name=%D6%D0%B9%FA。那么我們使用request.getParameter(“name”)如何能得到正確的值呢?難道要我們自己再進(jìn)行轉(zhuǎn)換?答案是:NO。根據(jù)Servlet規(guī)范,Servlet中獲取數(shù)據(jù)的方法會(huì)按照指定的字符集解碼。指定的字符集是什么?默認(rèn)是iso-8859-1。正是因?yàn)槭褂昧?/span>iso-8859-1解碼我們發(fā)送的參數(shù),導(dǎo)致了亂碼的產(chǎn)生,這里才是產(chǎn)生亂碼的源頭。具體解碼的過(guò)程可以看看javaURLDecode.decode方法。既然知道了產(chǎn)生亂碼的原因是因?yàn)榉?wù)器默認(rèn)使用iso-8859-1解碼,那我們就得想辦法更改服務(wù)器使用的解碼編碼。好在服務(wù)器已經(jīng)提供給我們修改的方式了,我們可以在服務(wù)器中進(jìn)行配置,比如Tomcat可以在server.xml中進(jìn)行配置,比如:URIEncoding="GBK"這樣服務(wù)器就會(huì)使用gbk編碼解碼,這種方式主要針對(duì)GET提交的數(shù)據(jù),對(duì)于POST更常用的是request.setCharacterEncoding(String charset)設(shè)置解碼編碼。

    5.   為了避免亂碼,客戶端應(yīng)該如何做?

    GET

    對(duì)于含有非ASCII字符的URL自己進(jìn)行編碼,比如使用javascript中的方法進(jìn)行編碼。這樣就不需要瀏覽器為我們編碼了,從而解決了瀏覽器編碼的不確定性。

    POST

    只要正確設(shè)置網(wǎng)頁(yè)編碼即可。

    posted @ 2013-07-27 16:56 zhangchao 閱讀(4385) | 評(píng)論 (2)編輯 收藏
         摘要: 工作中經(jīng)常遇到j(luò)ava編碼問(wèn)題,由于缺乏研究,總是無(wú)法給出確切的答案,這個(gè)周末在網(wǎng)上查了一些資料,在此做些匯總。     問(wèn)題一:在java中讀取文件時(shí)應(yīng)該采用什么編碼? Java讀取文件的方式總體可以分為兩類:按字節(jié)讀取和按字符讀取。按字節(jié)讀取就是采用InputStream.read()方法來(lái)讀取字節(jié),然后保存到一個(gè)byte[]數(shù)組中,最后經(jīng)常用new Stri...  閱讀全文
    posted @ 2011-05-26 10:35 zhangchao 閱讀(40457) | 評(píng)論 (19)編輯 收藏
    主站蜘蛛池模板: 国产AV无码专区亚洲AV男同| 国产乱色精品成人免费视频| 亚洲国产第一站精品蜜芽| 另类图片亚洲校园小说区| 日韩毛片免费在线观看| 亚洲综合精品成人| 在线观看免费a∨网站| 亚洲三级高清免费| 国产美女被遭强高潮免费网站| 亚洲人成网站免费播放| 日本特黄特黄刺激大片免费| 亚洲AV永久无码精品一福利 | 国产aⅴ无码专区亚洲av| 国产在线观看xxxx免费| 久久亚洲国产精品一区二区| 午夜免费福利片观看| 亚洲沟沟美女亚洲沟沟| 欧美a级成人网站免费| 成a人片亚洲日本久久| 亚洲日韩VA无码中文字幕| a级毛片毛片免费观看久潮| 亚洲国产美国国产综合一区二区| 69av免费观看| 亚洲精品久久无码av片俺去也| 免费A级毛片无码A| a在线观看免费视频| 精品亚洲国产成AV人片传媒| 国语成本人片免费av无码| 成a人片亚洲日本久久| 国产V亚洲V天堂无码| 三年片在线观看免费大全| 无遮挡免费一区二区三区| 亚洲日韩精品A∨片无码| 1024免费福利永久观看网站| 亚洲AV无码成人精品区日韩| 亚洲色欲色欲www在线丝| 97碰公开在线观看免费视频| 高潮毛片无遮挡高清免费视频| 亚洲a一级免费视频| 日韩免费无码一区二区视频| 91成人免费观看在线观看|