<rt id="bn8ez"></rt>
<label id="bn8ez"></label>

  • <span id="bn8ez"></span>

    <label id="bn8ez"><meter id="bn8ez"></meter></label>

    Java

    BlogJava 首頁 新隨筆 聯系 聚合 管理
      8 Posts :: 0 Stories :: 1 Comments :: 0 Trackbacks

    2007年9月20日 #

    Q 什么是MIME?什么是MIME郵件?

    A MIME, 全稱為“Multipurpose Internet Mail Extensions”, 比較確切的中文名稱為“多用途互聯網郵件擴展”。它是當前廣泛應用的一種電子郵件技術規范,基本內容定義于RFC 2045-2049。

    自然,MIME郵件就是符合MIME規范的電子郵件,或者說根據MIME規范編碼而成的電子郵件。

    在MIME出臺之前,使用RFC 822只能發送基本的ASCII碼文本信息,郵件內容如果要包括二進制文件、聲音和動畫等,實現起來非常困難。MIME提供了一種可以在郵件中附加多種不 同編碼文件的方法,彌補了原來的信息格式的不足。實際上不僅僅是郵件編碼,現在MIME經成為HTTP協議標準的一個部分。

    下面舉幾個MIME郵件的例子,讓我們先對MIME編碼的格式有個直觀的印象。例1是最簡單的,只帶純文本 正文,基本上就是RFC 822格式;例2復雜一些,包含純文本和超文本正文;例3是最復雜的,包含純文本正文、超文本正文、內嵌資源和文件附件。其中,行號和行號后的空格是為了 分析方便而另外加的,“... ... ... ...”表示此處省略了大段編碼。

    例1

       1 Date: Thu, 18 Apr 2002 09:32:45 +0800
    2 From: <bhw98@sina.com>
    3 To: <bhwang@jlonline.com>
    4 Subject: Test
    5 Mime-Version: 1.0
    6 Content-Type: text/plain; charset="iso-8859-1"
    7
    8 This is a simple mail.
    9

    例2

       1 From: "bhw98" <bhw98@sina.com>
    2 Reply-To: bhw98@sina.com
    3 To: <bluesky7810@163.com>
    4 Subject: Re: help
    5 X-Mailer: Foxmail 4.2 [cn]
    6 Mime-Version: 1.0
    7 Content-Type: multipart/alternative;
    8 boundary="=====002_Dragon307572345230_====="
    9
    10
    11 This is a multi-part message in MIME format.
    12
    13 --=====002_Dragon307572345230_=====
    14 Content-Type: text/plain; charset="GB2312"
    15 Content-Transfer-Encoding: quoted-printable
    16
    17 bluesky7810=A3=AC=C4=FA=BA=C3=A3=A1
    18
    19 =A1=A1=A1=A1=D4=DA=CF=C2=C6=AA=D7=EE=BA=F3=BF=C9=D2=D4=CF=C2=D4=D8=B0=A1=A3=AC=C4=E3
    ... ... ... ...
    30 =A1=A1=A1=A1=A1=A1=A1=A1=A1=A1=A1=A1=A1=A1=A1=A1=A1=A1=A1=A1=A1=A1=A1=A1=A12003-04-07
    31
    32 --=====002_Dragon307572345230_=====
    33 Content-Type: text/html; charset="GB2312"
    34 Content-Transfer-Encoding: quoted-printable
    35
    36 <!DOCTYPE HTML PUBLIC "-//W3C//DTD HTML 4.0 Transitional//EN">
    37 <HTML><HEAD>
    38 <META content=3D"text/html; charset=3Dgb2312"=
    39 http-equiv=3DContent-Type>
    40 <META content=3D"MSHTML 5.00.2920.0" name=3DGENERATOR>
    ... ... ... ...
    79 </HTML>
    80
    81 --=====002_Dragon307572345230_=====--
    82

    例3

       1 Return-Path: <bluesky7810@163.com>
    2 Delivered-To: bhw98@sina.com
    3 Received: (qmail 75513 invoked by alias); 20 May 2002 02:19:53 -0000
    4 Received: from unknown (HELO bluesky) (61.155.118.135)
    5 by 202.106.187.143 with SMTP; 20 May 2002 02:19:53 -0000
    6 Message-ID: <007f01c3111c$742fec00$0100007f@bluesky>
    7 From: "=?gb2312?B?wLbAtrXEzOwNCg==?=" <bluesky7810@163.com>
    8 To: "bhw98" <bhw98@sina.com>
    9 Cc: <bhwang@jlonline.com>
    10 Subject: =?gb2312?B?ztK1xLbgtK6/2rPM0PI=?=
    11 Date: Sat, 20 May 2002 10:03:36 +0800
    12 MIME-Version: 1.0
    13 Content-Type: multipart/mixed;
    14 boundary="----=_NextPart_000_007A_01C3115F.80DFC5E0"
    15 X-Priority: 3
    16 X-MSMail-Priority: Normal
    17 X-Mailer: Microsoft Outlook Express 5.00.2919.6700
    18 X-MimeOLE: Produced By Microsoft MimeOLE V5.00.2919.6700
    19
    20 This is a multi-part message in MIME format.
    21
    22 ------=_NextPart_000_007A_01C3115F.80DFC5E0
    23 Content-Type: multipart/related; type="multipart/alternative";
    24 boundary="----=_NextPart_001_007B_01C3115F.80DFC5E0"
    25
    26
    27 ------=_NextPart_001_007B_01C3115F.80DFC5E0
    28 Content-Type: multipart/alternative;
    29 boundary="----=_NextPart_002_007C_01C3115F.80DFC5E0"
    30
    31 ------=_NextPart_002_007C_01C3115F.80DFC5E0
    32 Content-Type: text/plain; charset="gb2312"
    33 Content-Transfer-Encoding: quoted-printable
    34
    35 bhw98, =C4=E3=BA=C3!
    36 =D5=E2=CA=C7=CE=D2=D0=B4=B5=C4=B6=E0=B4=AE=BF=DA=CD=A8=D0=C5=B5=C4=B3=CC=D0=
    37 =F2, =C7=EB=D6=B8=BD=CC!
    38
    39
    40 ------=_NextPart_002_007C_01C3115F.80DFC5E0
    41 Content-Type: text/html; charset="gb2312"
    42 Content-Transfer-Encoding: quoted-printable
    43
    44 <!DOCTYPE HTML PUBLIC "-//W3C//DTD HTML 4.0 Transitional//EN">
    45 <HTML><HEAD><TITLE>=C7=E7=C0=CA</TITLE>
    46 <META content=3D"text/html; charset=3Dgb2312" http-equiv=3DContent-Type>
    47 <STYLE>BODY {
    48 COLOR: #0033cc; FONT-FAMILY: =CB=CE=CC=E5, Arial, Helvetica; FONT-SIZE: =
    49 9pt; MARGIN-LEFT: 10px; MARGIN-TOP: 25px
    50 }
    51 </STYLE>
    52 <META content=3D"MSHTML 5.00.2920.0" name=3DGENERATOR></HEAD>
    53 <BODY background=3Dcid:007901c3111c$72b978a0$0100007f@bluesky =
    54 bgColor=3D#ffffff>
    55 <DIV>
    56 <DIV>bhw98, =C4=E3=BA=C3!</DIV>
    57 <P>=D5=E2=CA=C7=CE=D2=D0=B4=B5=C4=B6=E0=B4=AE=BF=DA=CD=A8=D0=C5=B5=C4=B3=CC=
    58 =D0=F2, =C7=EB=D6=B8=BD=CC!</P></DIV>
    59 <P> </P></BODY></HTML>
    60
    61 ------=_NextPart_002_007C_01C3115F.80DFC5E0--
    62
    63 ------=_NextPart_001_007B_01C3115F.80DFC5E0
    64 Content-Type: image/jpeg; name="=?gb2312?B?x+fAyrGzvrAuSlBH?="
    65 Content-Transfer-Encoding: base64
    66 Content-ID: <007901c3111c$72b978a0$0100007f@bluesky>
    67
    68 /9j/4AAQSkZJRgABAgEASABIAAD/7QVoUGhvdG9zaG9wIDMuMAA4QklNA+0AAAAAABAASAAAAAEA
    69 AQBIAAAAAQABOEJJTQPzAAAAAAAIAAAAAAAAAAA4QklNBAoAAAAAAAEAADhCSU0nEAAAAAAACgAB
    70 AAAAAAAAAAI4QklNA/UAAAAAAEgAL2ZmAAEAbGZmAAYAAAAAAAEAL2ZmAAEAoZmaAAYAAAAAAAEA
    ... ... ... ...
    169 RxVw98Vawq12xQ44q0cKtHFDWKGsKt4EtiuKt4q//9k=
    170
    171 ------=_NextPart_001_007B_01C3115F.80DFC5E0--
    172
    173 ------=_NextPart_000_007A_01C3115F.80DFC5E0
    174 Content-Type: application/msword; name="readme.doc"
    175 Content-Transfer-Encoding: base64
    176 Content-Disposition: attachment; filename="readme.doc"
    177
    178 0M8R4KGxGuEAAAAAAAAAAAAAAAAAAAAAPgADAP7/CQAGAAAAAAAAAAAAAAABAAAAJgAAAAAAAAAA
    179 EAAAKAAAAAEAAAD+////AAAAACUAAAD/////////////////////////////////////////////
    180 ////////////////////////////////////////////////////////////////////////////
    ... ... ... ...
    1688 AAAAAAAAAAAAAAAAAAA=
    1689
    1690 ------=_NextPart_000_007A_01C3115F.80DFC5E0
    1691 Content-Type: application/x-zip-compressed;
    1692 name="=?gb2312?B?tuC0rr/azajQxbXE1LTC6y56aXA=?="
    1693 Content-Transfer-Encoding: base64
    1694 Content-Disposition: attachment;
    1695 filename="=?gb2312?B?tuC0rr/azajQxbXE1LTC6y56aXA=?="
    1696
    1697 UEsDBBQAAAAIAFKAoi7qOMOvLw0AAABWAAAUAAAAtuC0rr/azajQxbXE1LTC6y5kb2PtXHtwVNUZ
    1698 /+4+kk3IQoAkBkRYQkSgbrKb7IYNEMwmm6ckG0jCI0boZneTbJJ9sNlAEsdOtFqd8Z846tQ6PhB1
    1699 hrZTJoK0Vhgf1aGt4rMy6D8tdugfTjuOpcBIR9j+vvsIy4YkRNTRen87v/ud53cee+6557vn7L73
    ... ... ... ...
    3125 zajQxbXE1LTC6y5kb2NQSwUGAAAAAAEAAQBCAAAAYQ0AAA==
    3126
    3127 ------=_NextPart_000_007A_01C3115F.80DFC5E0--
    3128

    Q 在開始研究MIME郵件的時候,如何得到這樣的源碼?

    A 一些功能比較完善的郵件客戶端軟件,如微軟的Outlook Express,國產的Foxmail等,都提供了查看和保存郵件源碼(原始信息)的功能。在Foxmail中,選擇郵件列表右鍵菜單的“原始信息”進行 查看,主菜單的“文件-導出”進行保存。在Outlook Express中,對應的操作分別是“屬性”和“另存為”。所保存的.eml文件,可以調用這些程序打開。

    Q 請介紹一下MIME郵件的組成?

    A 總體來說,MIME消息由消息頭和消息體兩大部分組成。現在我們關注的是MIME郵件,因此在以下的討論中姑且稱“消息”為“郵件”。在上面的例子中,例 1的1-6行,例2的1—8行,例3的1-18行,是郵件頭;例1的8—9行,例2的10—82行,例3的20—3128行,是郵件體。郵件頭與郵件體之 間以空行進行分隔,如例1的第7行,例2的第9行,例3的第19行。郵件頭中不允許出現空行。有一些郵件不能被郵件客戶端軟件識別,顯示的是原始碼,就是 因為首行是空行。

    郵件頭包含了發件人、收件人、主題、時間、MIME版本、郵件內容的類型等重要信息。每條信息稱為一個域, 由域名后加“: ”和信息內容構成,可以是一行,較長的也可以占用多行。域的首行必須“頂頭”寫,即左邊不能有空白字符(空格和制表符);續行則必須以空白字符打頭,且第 一個空白字符不是信息本身固有的,解碼時要過濾掉。如例2的7-8行,例3的4-5行,13-14行,分別屬于一個域。

    郵件體包含郵件的內容,它的類型由郵件頭的“Content-Type”域指出。常見的簡單類型有text/plain(純文本)和text/html(超文本)。

    例2和例3中出現的multipart類型,是MIME郵件的精髓。郵件體被分為多個段,每個段又包含段頭和 段體兩部分,這兩部分之間也以空行分隔。常見的multipart類型有三種:multipart/mixed, multipart/related和multipart/alternative。從它們的名稱,不難推知這些類型各自的含義和用處。它們之間的層次關 系可歸納為下圖所示:

    +------------------------- multipart/mixed ----------------------------+
    | |
    | +----------------- multipart/related ------------------+ |
    | | | |
    | | +----- multipart/alternative ------+ +----------+ | +------+ |
    | | | | | 內嵌資源 | | | 附件 | |
    | | | +------------+ +------------+ | +----------+ | +------+ |
    | | | | 純文本正文 | | 超文本正文 | | | |
    | | | +------------+ +------------+ | +----------+ | +------+ |
    | | | | | 內嵌資源 | | | 附件 | |
    | | +----------------------------------+ +----------+ | +------+ |
    | | | |
    | +------------------------------------------------------+ |
    | |
    +----------------------------------------------------------------------+

    可以看出,如果在郵件中要添加附件,必須定義multipart/mixed段;如果存在內嵌資源,至少要定義 multipart/related段;如果純文本與超文本共存,至少要定義multipart/alternative段。什么是“至少”?舉個例子 說,如果只有純文本與超文本正文,那么在郵件頭中將類型擴大化,定義為multipart/related,甚至multipart/mixed,都是允 許的。

    multipart諸類型的共同特征是,在段頭指定“boundary”參數字符串,段體內的每個子段以此 串定界。所有的子段都以“--”+boundary行開始,父段則以“--”+boundary+“--”行結束。段與段之間也以空行分隔。在郵件體是 multipart類型的情況下,郵件體的開始部分(第一個“--”+boundary行之前)可以有一些附加的文本行,相當于注釋,解碼時應忽略。段間 也可以有一些附加的文本行,不會顯示出來,如果有興趣,不妨驗證一下。

    結合boundary定界和multipart層次關系圖,我們分析一下例2和例3的郵件體層次與段嵌套關系。

    在例2中,10-12行是附加文本行,13-82行是multipart/alternative型的段,包含兩個子段:13-30行是純文本正文,32-79行是超文本正文。

    在例3中,20-21行是附加文本行,22-3127行是multipart/mixed型的段,包含3個子 段:22-171行是multipart/related段,173-1688行與1690-3125行是兩個附件。multipart/related 段又包含兩個子段:27-61行是multipart/alternative段,63-169行是一個內嵌資源(圖片)。 multipart/alternative段又包含兩個子段:31-48行是純文本正文,40-59行是超文本正文。

    例1只有純文本正文,實際上屬于multipart層次關系圖中的一個特殊情況。如果非要避簡就繁,寫成下面的形式,也是完全符合MIME精神的。

    Date: Thu, 18 Apr 2002 09:32:45 +0800
    From: <bhw98@sina.com>
    To: <bhwang@jlonline.com>
    Subject: Test
    Mime-Version: 1.0
    Content-Type: multipart/alternative; boundary="{[(^_^)]}"

    --{[(^_^)]}
    Content-Type: text/plain; charset="iso-8859-1"
    Content-Transfer-Encoding: 7bit

    This is a simple mail.

    --{[(^_^)]}--

    Q 在郵件頭和段頭中,有哪一些常見的域?

    A 在郵件頭中,有很多從RFC 822沿用的域名,MIME也增加了一些。常見的標準域名和含義如下
    域名 含義 添加者
    Received 傳輸路徑 各級郵件服務器
    Return-Path 回復地址 目標郵件服務器
    Delivered-To 發送地址 目標郵件服務器
    Reply-To 回復地址 郵件的創建者
    From 發件人地址 郵件的創建者
    To 收件人地址 郵件的創建者
    Cc 抄送地址 郵件的創建者
    Bcc 暗送地址 郵件的創建者
    Date 日期和時間 郵件的創建者
    Subject 主題 郵件的創建者
    Message-ID 消息ID 郵件的創建者
    MIME-Version MIME版本 郵件的創建者
    Content-Type 內容的類型 郵件的創建者
    Content-Transfer-Encoding 內容的傳輸編碼方式 郵件的創建者

    非標準的、自定義域名都以X-開頭,例如X-Mailer, X-MSMail-Priority等,通常在接收和發送郵件的是同一程序時才能理解它們的意義。

    在段頭中,大致有如下一些域
    域名 含義
    Content-Type 段體的類型
    Content-Transfer-Encoding 段體的傳輸編碼方式
    Content-Disposition 段體的安排方式
    Content-ID 段體的ID
    Content-Location 段體的位置(路徑)
    Content-Base 段體的基位置

    有的域除了值之外,還帶有參數。值與參數、參數與參數之間以“;”分隔。參數名與參數值之間以“=”分隔。如 例3的28-29行,Content-Type域的值為“multipart/alternative”,此外有一個參數boundary,值為"--- -=_NextPart_002_007C_01C3115F.80DFC5E0"。又如例3的第176行,Content-Disposition域的 值為“attachment”,此外有一個參數filename,值為“readme.doc”。

    Q Content-Type以及它們的參數有哪些形式?

    A Content-Type都是“主類型/子類型”的形式。主類型有text, image, audio, video, application, multipart, message等,分別表示文本、圖片、音頻、視頻、應用、分段、消息等。每個主類型都可能有多個子類型,如text類型就包含plain, html, xml, css等子類型。以X-開頭的主類型和子類型,同樣表示自定義的類型,未向IANA正式注冊,但大多已經約定成俗了。如application/x- zip-compressed是ZIP文件類型。在Windows中,注冊表的“HKEY_CLASSES_ROOT\MIME\Database\ Content Type”內列舉了除multipart之外大部分已知的Content-Type。

    關于參數的形式,RFC里有很多補充規定,有的允許帶幾個參數,較為常見的有
    主類型 參數名 含義
    text charset 字符集
    image name 名稱
    application name 名稱
    multipart boundary 邊界

    其中字符集也能在Windows注冊表的“HKEY_CLASSES_ROOT\MIME\Database\Charset”內見到。

    Q Content-Transfer-Encoding有哪些?有什么特點?

    A Content-Transfer-Encoding共有Base64, Quoted-printable, 7bit, 8bit, Binary等幾種。其中7bit是缺省的編碼方式。電子郵件源碼最初設計為全部是可打印的ASCII碼的形式。非ASCII碼的文本或數據要編碼成要求 的格式,如上面的三個例子。Base64, Quoted-Printable是在非英語國家使用最廣使的編碼方式。Binary方式只具有象征意義,而沒有任何實用價值。

    Base64將輸入的字符串或一段數據編碼成只含有{'A'-'Z', 'a'-'z', '0'-'9', '+', '/'}這64個字符的串,'='用于填充。其編碼的方法是,將輸入數據流每次取6 bit,用此6 bit的值(0-63)作為索引去查表,輸出相應字符。這樣,每3個字節將編碼為4個字符(3×8 → 4×6);不滿4個字符的以'='填充。有的場合,以“=?charset?B?xxxxxxxx?=”表示xxxxxxxx是Base64編碼,且原文 的字符集是charset。如例3第7行"=?gb2312?B?wLbAtrXEzOwNCg==?="是由簡體中文“藍藍的天”編碼而成的。在段體內 則直接編碼,適當時機換行,MIME建議每行最多76個字符。如例3的1697-3125行,是一個ZIP文件的Base64編碼。

    Quoted-printable根據輸入的字符串或字節范圍進行編碼,若是不需編碼的字符,直接輸出;若 需要編碼,則先輸出'=',后面跟著以2個字符表示的十六進制字節值。有的場合,以“=?charset?Q?xxxxxxxx?=”表示 xxxxxxxx是Quoted-printable編碼,且原文的字符集是charset。在段體內則直接編碼,適當時機換行,換行前額外輸出一個'= '。如例3的44-59行,是HTML文本的Quoted-printable編碼。其中第45行“=C7=E7=C0=CA”原文是“晴朗”,因為 “晴”的GB2312碼是C7E7,“朗”的GB2312碼是C0CA。第48、53、57行末尾只有孤零零的'=',表示這是由編碼造成的軟回車,而非 原文固有的。

    近年來,國內多數郵件服務器已經支持8bit方式,因此只在國內傳輸的郵件,特別是在郵件頭中,可直接使用8bit編碼,對漢字不做處理。如果郵件要出國,還是老老實實地按Base64或Quoted-printable編碼才行。

    Q 什么是內嵌資源?它有哪些形式?

    A 內嵌資源也是MIME的一個發光點,它能使郵件內容變得生動活潑、豐富多彩。可在郵件的multipart/related框架內定義一些與正文關聯的圖 片、動畫、聲音甚至CSS樣式和腳本的段。通常在HTML正文內,使用超級鏈接與內嵌資源相聯系。如在例3中,HTML正文53-54行,解碼后為

    <BODY background=cid:007901c3111c$72b978a0$0100007f@bluesky bgColor=#ffffff>

    它指出用一個Content-ID為007901c3111c$72b978a0$0100007f@bluesky的圖片作為背景(cid:xxxxxxxx也是一種超級鏈接)。而64-169行恰好就是這樣一個內嵌資源。

    除了用Content-ID進行聯系外,還有另外一種常用形式:用普通超級連接和Content-Location。例如:

    在HTML正文中,

    ... ...  ... ...
    <IMG SRC="http://www.dangdang.com/images/all/anti_joyo_dm_book.gif">
    ... ... ... ...
    <IMG SRC="http://www.dangdang.com/dd2001/getimage_small.asp?id=486341">
    ... ... ... ...

    對應的內嵌資源為

    Content-Type: image/gif; name="anti_joyo_dm_book.gif"
    Content-Transfer-Encoding: base64
    Content-Location: http://www.dangdang.com/images/all/anti_joyo_dm_book.gif
    ... ... ... ...
    Content-Type: application/octet-stream; name="getimage_small.asp?id=486341"
    Content-Transfer-Encoding: base64
    Content-Location: http://www.dangdang.com/dd2001/getimage_small.asp?id=486341
    ... ... ... ...

    另外,

    Content-Location: http://www.dangdang.com/images/all/anti_joyo_dm_book.gif

    Content-Location: anti_joyo_dm_book.gif
    Content-Base: http://www.dangdang.com/images/all/

    是等效的。

    Q 郵件病毒如何利用附件和內嵌資源傳播?

    A 有的郵件附件可能帶有病毒,容易理解。附件畢竟是文件,也好預防,不輕易打開就是了。但內嵌資源是在瀏覽郵件內容時就要訪問的,若其中藏有病毒或惡意代碼,你在不知不覺中就中招了。如前兩年曾經在全球范圍內流行的Nimda病毒,功能性源碼如下:

    MIME-Version: 1.0
    Content-Type: multipart/related;
    type="multipart/alternative";
    boundary="====_ABC1234567890DEF_===="

    --====_ABC1234567890DEF_====
    Content-Type: multipart/alternative;
    boundary="====_ABC0987654321DEF_===="

    --====_ABC0987654321DEF_====
    Content-Type: text/html;
    charset="iso-8859-1"
    Content-Transfer-Encoding: 7bit

    <HTML><HEAD></HEAD><BODY bgColor=#ffffff>
    <iframe src=cid:EA4DMGBP9p height=0 width=0>
    </iframe></BODY></HTML>
    --====_ABC0987654321DEF_====--

    --====_ABC1234567890DEF_====
    Content-Type: audio/x-wav; name="readme.exe"
    Content-Transfer-Encoding: base64
    Content-ID: <EA4DMGBP9p>

    TVqQAAMAAAAEAAAA//8AALgAAAAAAAAAQAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA
    AAAA2AAAAA4fug4AtAnNIbgBTM0hVGhpcyBwcm9ncmFtIGNhbm5vdCBiZSBydW4gaW4gRE9TIG1v
    ZGUuDQ0KJAAAAAAAAAA11CFvcbVPPHG1TzxxtU88E6pcPHW1TzyZqkU8dbVPPJmqSzxytU88cbVO
    ... ... ... ... ... ... ... ...
    AAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA=

    --====_ABC1234567890DEF_====

    它將一個可執行文件作為資源嵌入了框架型頁面,卻聲明這段可執行代碼是波形聲音類型。由于當時微軟的IE(版本5.0 及以下)存在重大安全漏洞,沒有檢查Content-Type與name的擴展名是否匹配,于是就被輕易騙過了,致使點選或打開郵件時自動運行了這個 “readme.exe”,機器就感染上病毒。帶毒的機器利用地址簿向別人發送帶毒的郵件,一傳十,十傳百,Nimda蠕蟲大行其道。

    縱觀歷史,病毒剛出來時是厲害,但沒有任何一種能夠持續肆虐下去。Nimda如此,SARS亦當如此。曰:“多難興邦,眾志成城”,又曰:“非典終將倒下,城市精神永存”,相信我們定能很快戰勝“非典”!

    病毒庫升級是跟在新病毒屁股后進行的,不要過分依賴殺毒軟件。一個良好的習慣是關閉郵件預覽功能,或者設定預覽純文本部分,先查看郵件源碼,確信排除病毒嫌疑后再打開。對陌生人發來的帶超文本正文的郵件,尤其要當心。永遠不要在郵件客戶端軟件內直接打開附件。

    Q 一些垃圾郵件采取隱藏發件人的方式,如何追查它們來自哪里?

    A 從上面的郵件頭域名表中可以看出,郵件的創建者可以掌握大部分的域的內容,但Received等域由各級服務器自動添加,發件人是鞭長莫及。垃圾郵件一般 采用了群發軟件發送,郵件頭的From域(發件人地址)可以任意偽造,甚至寫成收件人地址(收到了自己并沒有發過的垃圾郵件,氣憤吧?)。查看 Received域(傳輸路徑)鏈可以找到真正的出處。每個服務器添加的Received語句都在郵件首,故最下面一個Received就包含了發件人所 用的SMTP或HTTP服務器,及最初的網關外部IP地址。

    Receive語句的基本格式是:from A by B。A為發送方,B為接收方。例如:

    Received: (qmail 45304 invoked from network); 4 May 2003 17:05:47 -0000
    Received: from unknown (HELO bjapp9.163.net) (202.108.255.197)
    by 202.106.182.244 with SMTP; 4 May 2003 17:05:47 -0000
    Received: from localhost (localhost [127.0.0.1])
    by bjapp9.163.net (Postfix) with SMTP id E1C761D84C631
    for <bhw98@sina.com>; Mon, 5 May 2003 01:07:26 +0800 (CST)
    Received: from fanyingxxxx@tom.com (unknown [211.99.162.194])
    by bjapp9.163.net (Coremail) with SMTP id OgEAAM1ItT7MNaLC.1
    for <bhw98@sina.com>; Mon, 05 May 2003 01:07:26 +0800 (CST)

    從上面的例子中不難看出,該郵件的傳輸路徑是:211.99.162.194 → bjapp9.163.net (Coremail 202.108.255.197?) → bjapp9.163.net (Postfix, 202.108.255.197?) → 202.106.182.244。恰好出現了發件人郵箱fanyingxxxx@tom.com,但多數情況不一定能列出來。

    此例的localhost [127.0.0.1],意味著bjapp9.163.net上安裝了郵件服務代理性質的軟件。

    posted @ 2007-12-01 16:36 java執著者 閱讀(1303) | 評論 (0)編輯 收藏

    Java中文問題一直困擾著很多初學者,如果了解了Java系統的中文問題原理,我們就可以對中文問題能夠采取根本的解決之道。

      最古老的解決方案是使用String的字節碼轉換,這種方案問題是不方便,我們需要破壞對象封裝性,進行字節碼轉換。

      還有一種方式是對J2EE容器進行編碼設置,如果J2EE應用系統脫離該容器,則會發生亂碼,而且指定容器配置不符合J2EE應用和容器分離的原則。

    在Java內部運算中,涉及到的所有字符串都會被轉化為UTF-8編碼來進行運算。那么,在被Java轉化之前,字符串是什么樣的字符集? Java總是根據操作系統的默認編碼字符集來決定字符串的初始編碼,而且Java系統的輸入和輸出的都是采取操作系統的默認編碼。

      因 此,如果能統一Java系統的輸入、輸出和操作系統3者的編碼字符集合,將能夠使Java系統正確處理和顯示漢字。這是處理Java系統漢字的一個原則, 但是在實際項目中,能夠正確抓住和控制住Java系統的輸入和輸出部分是比較難的。J2EE中,由于涉及到外部瀏覽器和數據庫等,所以中文問題亂碼顯得非 常突出。

      J2EE應用程序是運行在J2EE容器中。在這個系統中,輸入途徑有很多種:一種是通過頁面表單打包成請求(request) 發往服務器的;第二種是通過數據庫讀入;還有第3種輸入比較復雜,JSP在第一次運行時總是被編譯成Servlet,JSP中常常包含中文字符,那么編譯 使用javac時,Java將根據默認的操作系統編碼作為初始編碼。除非特別指定,如在Jbuilder/eclipse中可以指定默認的字符集。

      輸出途徑也有幾種:第一種是JSP頁面的輸出。由于JSP頁面已經被編譯成Servlet,那么在輸出時,也將根據操作系統的默認編碼來選擇輸出編碼,除非指定輸出編碼方式;還有輸出途徑是數據庫,將字符串輸出到數據庫。

      由此看來,一個J2EE系統的輸入輸出是非常復雜,而且是動態變化的,而Java是跨平臺運行的,在實際編譯和運行中,都可能涉及到不同的操作系統,如果任由Java自由根據操作系統來決定輸入輸出的編碼字符集,這將不可控制地出現亂碼。

      正是由于Java的跨平臺特性,使得字符集問題必須由具體系統來統一解決,所以在一個Java應用系統中,解決中文亂碼的根本辦法是明確指定整個應用系統統一字符集。

      指定統一字符集時,到底是指定ISO8859_1 、GBK還是UTF-8呢?

      (1)如統一指定為ISO8859_1,因為目前大多數軟件都是西方人編制的,他們默認的字符集就是ISO8859_1,包括操作系統Linux和數據庫MySQL等。這樣,如果指定Jive統一編碼為ISO8859_1,那么就有下面3個環節必須把握:

      開發和編譯代碼時指定字符集為ISO8859_1。

      運行操作系統的默認編碼必須是ISO8859_1,如Linux。

      在JSP頭部聲明:<%@ page contentType="text/html;charset=ISO8859_1" %>。

      (2)如果統一指定為GBK中文字符集,上述3個環節同樣需要做到,不同的是只能運行在默認編碼為GBK的操作系統,如中文Windows。

      統一編碼為ISO8859_1和GBK雖然帶來編制代碼的方便,但是各自只能在相應的操作系統上運行。但是也破壞了Java跨平臺運行的優越性,只在一定范圍內行得通。例如,為了使得GBK編碼在linux上運行,設置Linux編碼為GBK。

      那么有沒有一種除了應用系統以外不需要進行任何附加設置的中文編碼根本解決方案呢?

      將Java/J2EE系統的統一編碼定義為UTF-8。UTF-8編碼是一種兼容所有語言的編碼方式,惟一比較麻煩的就是要找到應用系統的所有出入口,然后使用UTF-8去“結扎”它。

      一個J2EE應用系統需要做下列幾步工作:

    1. 開發和編譯代碼時指定字符集為UTF-8。JBuilder和Eclipse都可以在項目屬性中設置。
    2. 使用過濾器,如果所有請求都經過一個Servlet控制分配器,那么使用Servlet的filter執行語句,將所有來自瀏覽器的請求(request)轉換為UTF-8,因為瀏覽器發過來的請求包根據瀏覽器所在的操作系統編碼,可能是各種形式編碼。關鍵一句:
      request.setCharacterEncoding("UTF-8")。
      網上有此filter的源碼,Jdon框架源碼中com.jdon.util.SetCharacterEncodingFilter
      需要配置web.xml 激活該Filter。
    3. 在JSP頭部聲明:<%@ page contentType="text/html;charset= UTF-8" %>。
    4. 在Jsp的html代碼中,聲明UTF-8:
      <meta http-equiv="Content-Type" content="text/html; charset=utf-8">
    5. 設定數據庫連接方式是UTF-8。例如連接MYSQL時配置URL如下:
      jdbc:mysql://localhost:3306/test?useUnicode=true&amp;characterEncoding=UTF-8
      注意,上述寫法是JBoss的mysql-ds.xml寫法,多虧網友提示,在tomcat中&amp;要寫成&即可。一般其他數據庫都可以通過管理設置設定UTF-8
    6. 其他和外界交互時能夠設定編碼時就設定UTF-8,例如讀取文件,操作XML等。
    筆者以前在Jsp/Servlet時就采取這個原則,后來使用Struts、Tapestry、EJB、Hibernate、Jdon等框架時,從未被亂 碼困擾過,可以說適合各種架構。希望本方案供更多初學者分享,減少Java/J2EE的第一個攔路虎,也避免因為采取一些臨時解決方案,導致中文問題一直 出現在新的技術架構中 
    posted @ 2007-09-20 11:07 java執著者 閱讀(1052) | 評論 (0)編輯 收藏

    主站蜘蛛池模板: 亚洲国产av玩弄放荡人妇| 亚洲精品二三区伊人久久| 五月天婷婷精品免费视频| 日本免费无遮挡吸乳视频电影| avtt天堂网手机版亚洲| 精品免费人成视频app| 99久久亚洲综合精品成人网| 三年片在线观看免费观看大全动漫 | 秋霞人成在线观看免费视频| 亚洲精品国产品国语在线| 成人一区二区免费视频| 亚洲日本一区二区三区在线| 成全动漫视频在线观看免费高清版下载| 亚洲深深色噜噜狠狠爱网站| 精品视频在线免费观看| 亚洲最新视频在线观看| 黄+色+性+人免费| 亚洲国产日韩综合久久精品| 日本免费的一级v一片| 一区二区三区在线观看免费| 亚洲人成人一区二区三区| 久久亚洲免费视频| 亚洲毛片基地日韩毛片基地| 在线免费观看色片| 色多多免费视频观看区一区| 亚洲中文字幕无码久久综合网| 99在线免费观看视频| 国产 亚洲 中文在线 字幕| 免费精品国产自产拍观看| 中文字幕a∨在线乱码免费看| 亚洲一区二区三区电影| 成人网站免费观看| 免费无码午夜福利片| 久久精品视频亚洲| 成年女人看片免费视频播放器| 四虎成人精品国产永久免费无码| 日本红怡院亚洲红怡院最新 | 特级毛片A级毛片免费播放| 国产亚洲福利精品一区| 无遮免费网站在线入口| 一区视频免费观看|