理解Java對象序列化
關(guān)于Java序列化的文章早已是汗牛充棟了,本文是對我個人過往學(xué)習(xí),理解及應(yīng)用Java序列化的一個總結(jié)。此文內(nèi)容涉及Java序列化的基本原理,以及多種方法對序列化形式進(jìn)行定制。在撰寫本文時,既參考了Thinking in Java, Effective Java,JavaWorld,developerWorks中的相關(guān)文章和其它網(wǎng)絡(luò)資料,也加入了自己的實(shí)踐經(jīng)驗(yàn)與理解,文、碼并茂,希望對大家有所幫助。(2012.02.14最后更新)
1. 什么是Java對象序列化 Java平臺允許我們在內(nèi)存中創(chuàng)建可復(fù)用的Java對象,但一般情況下,只有當(dāng)JVM處于運(yùn)行時,這些對象才可能存在,即,這些對象的生命周期不會比JVM的生命周期更長。但在現(xiàn)實(shí)應(yīng)用中,就可能要求在JVM停止運(yùn)行之后能夠保存(持久化)指定的對象,并在將來重新讀取被保存的對象。Java對象序列化就能夠幫助我們實(shí)現(xiàn)該功能。
使用Java對象序列化,在保存對象時,會把其狀態(tài)保存為一組字節(jié),在未來,再將這些字節(jié)組裝成對象。必須注意地是,對象序列化保存的是對象的"狀態(tài)",即它的成員變量。由此可知,對象序列化不會關(guān)注類中的靜態(tài)變量。
除了在持久化對象時會用到對象序列化之外,當(dāng)使用RMI(遠(yuǎn)程方法調(diào)用),或在網(wǎng)絡(luò)中傳遞對象時,都會用到對象序列化。Java序列化API為處理對象序列化提供了一個標(biāo)準(zhǔn)機(jī)制,該API簡單易用,在本文的后續(xù)章節(jié)中將會陸續(xù)講到。
2. 簡單示例在Java中,只要一個類實(shí)現(xiàn)了java.io.Serializable接口,那么它就可以被序列化。此處將創(chuàng)建一個可序列化的類Person,本文中的所有示例將圍繞著該類或其修改版。
Gender類,是一個枚舉類型,表示性別
public enum Gender {
MALE, FEMALE
}
如果熟悉Java枚舉類型的話,應(yīng)該知道每個枚舉類型都會默認(rèn)繼承類java.lang.Enum,而該類實(shí)現(xiàn)了Serializable接口,所以枚舉類型對象都是默認(rèn)可以被序列化的。
Person類,實(shí)現(xiàn)了Serializable接口,它包含三個字段:name,String類型;age,Integer類型;gender,Gender類型。另外,還重寫該類的toString()方法,以方便打印Person實(shí)例中的內(nèi)容。
public class Person implements Serializable {
private String name = null;
private Integer age = null;
private Gender gender = null;
public Person() {
System.out.println("none-arg constructor");
}
public Person(String name, Integer age, Gender gender) {
System.out.println("arg constructor");
this.name = name;
this.age = age;
this.gender = gender;
}
public String getName() {
return name;
}
public void setName(String name) {
this.name = name;
}
public Integer getAge() {
return age;
}
public void setAge(Integer age) {
this.age = age;
}
public Gender getGender() {
return gender;
}
public void setGender(Gender gender) {
this.gender = gender;
}
@Override
public String toString() {
return "[" + name + ", " + age + ", " + gender + "]";
}
}
SimpleSerial,是一個簡單的序列化程序,它先將一個Person對象保存到文件person.out中,然后再從該文件中讀出被存儲的Person對象,并打印該對象。
public class SimpleSerial {
public static void main(String[] args) throws Exception {
File file = new File("person.out");
ObjectOutputStream oout = new ObjectOutputStream(new FileOutputStream(file));
Person person = new Person("John", 101, Gender.MALE);
oout.writeObject(person);
oout.close();
ObjectInputStream oin = new ObjectInputStream(new FileInputStream(file));
Object newPerson = oin.readObject(); // 沒有強(qiáng)制轉(zhuǎn)換到Person類型
oin.close();
System.out.println(newPerson);
}
}
上述程序的輸出的結(jié)果為:
arg constructor
[John, 31, MALE]
此時必須注意的是,當(dāng)重新讀取被保存的Person對象時,并沒有調(diào)用Person的任何構(gòu)造器,看起來就像是直接使用字節(jié)將Person對象還原出來的。
當(dāng)Person對象被保存到person.out文件中之后,我們可以在其它地方去讀取該文件以還原對象,但必須確保該讀取程序的CLASSPATH中包含有Person.class(哪怕在讀取Person對象時并沒有顯示地使用Person類,如上例所示),否則會拋出ClassNotFoundException。
3. Serializable的作用 為什么一個類實(shí)現(xiàn)了Serializable接口,它就可以被序列化呢?在上節(jié)的示例中,使用ObjectOutputStream來持久化對象,在該類中有如下代碼:
private void writeObject0(Object obj, boolean unshared) throws IOException {

if (obj instanceof String) {
writeString((String) obj, unshared);
} else if (cl.isArray()) {
writeArray(obj, desc, unshared);
} else if (obj instanceof Enum) {
writeEnum((Enum) obj, desc, unshared);
} else if (obj instanceof Serializable) {
writeOrdinaryObject(obj, desc, unshared);
} else {
if (extendedDebugInfo) {
throw new NotSerializableException(cl.getName() + "\n"
+ debugInfoStack.toString());
} else {
throw new NotSerializableException(cl.getName());
}
}

} 從上述代碼可知,如果被寫對象的類型是String,或數(shù)組,或Enum,或Serializable,那么就可以對該對象進(jìn)行序列化,否則將拋出NotSerializableException。
4. 默認(rèn)序列化機(jī)制 如果僅僅只是讓某個類實(shí)現(xiàn)Serializable接口,而沒有其它任何處理的話,則就是使用默認(rèn)序列化機(jī)制。使用默認(rèn)機(jī)制,在序列化對象時,不僅會序列化當(dāng)前對象本身,還會對該對象引用的其它對象也進(jìn)行序列化,同樣地,這些其它對象引用的另外對象也將被序列化,以此類推。所以,如果一個對象包含的成員變量是容器類對象,而這些容器所含有的元素也是容器類對象,那么這個序列化的過程就會較復(fù)雜,開銷也較大。
5. 影響序列化 在現(xiàn)實(shí)應(yīng)用中,有些時候不能使用默認(rèn)序列化機(jī)制。比如,希望在序列化過程中忽略掉敏感數(shù)據(jù),或者簡化序列化過程。下面將介紹若干影響序列化的方法。
5.1 transient關(guān)鍵字 當(dāng)某個字段被聲明為transient后,默認(rèn)序列化機(jī)制就會忽略該字段。此處將Person類中的age字段聲明為transient,如下所示,
public class Person implements Serializable {

transient private Integer age = null;

} 再執(zhí)行SimpleSerial應(yīng)用程序,會有如下輸出:
arg constructor
[John, null, MALE]
可見,age字段未被序列化。
5.2 writeObject()方法與readObject()方法 對于上述已被聲明為transitive的字段age,除了將transitive關(guān)鍵字去掉之外,是否還有其它方法能使它再次可被序列化?方法之一就是在Person類中添加兩個方法:writeObject()與readObject(),如下所示:
public class Person implements Serializable {

transient private Integer age = null;

private void writeObject(ObjectOutputStream out) throws IOException {
out.defaultWriteObject();
out.writeInt(age);
}
private void readObject(ObjectInputStream in) throws IOException, ClassNotFoundException {
in.defaultReadObject();
age = in.readInt();
}
} 在writeObject()方法中會先調(diào)用ObjectOutputStream中的defaultWriteObject()方法,該方法會執(zhí)行默認(rèn)的序列化機(jī)制,如5.1節(jié)所述,此時會忽略掉age字段。然后再調(diào)用writeInt()方法顯示地將age字段寫入到ObjectOutputStream中。readObject()的作用則是針對對象的讀取,其原理與writeObject()方法相同。
再次執(zhí)行SimpleSerial應(yīng)用程序,則又會有如下輸出:
arg constructor
[John, 31, MALE]
必須注意地是,writeObject()與readObject()都是private方法,那么它們是如何被調(diào)用的呢?毫無疑問,是使用反射。詳情可見ObjectOutputStream中的writeSerialData方法,以及ObjectInputStream中的readSerialData方法。
5.3 Externalizable接口 無論是使用transient關(guān)鍵字,還是使用writeObject()和readObject()方法,其實(shí)都是基于Serializable接口的序列化。JDK中提供了另一個序列化接口--Externalizable,使用該接口之后,之前基于Serializable接口的序列化機(jī)制就將失效。此時將Person類修改成如下,
public class Person implements Externalizable {
private String name = null;
transient private Integer age = null;
private Gender gender = null;
public Person() {
System.out.println("none-arg constructor");
}
public Person(String name, Integer age, Gender gender) {
System.out.println("arg constructor");
this.name = name;
this.age = age;
this.gender = gender;
}
private void writeObject(ObjectOutputStream out) throws IOException {
out.defaultWriteObject();
out.writeInt(age);
}
private void readObject(ObjectInputStream in) throws IOException, ClassNotFoundException {
in.defaultReadObject();
age = in.readInt();
}
@Override
public void writeExternal(ObjectOutput out) throws IOException {
}
@Override
public void readExternal(ObjectInput in) throws IOException, ClassNotFoundException {
}

} 此時再執(zhí)行SimpleSerial程序之后會得到如下結(jié)果:
arg constructor
none-arg constructor
[null, null, null]
從該結(jié)果,一方面可以看出Person對象中任何一個字段都沒有被序列化。另一方面,如果細(xì)心的話,還可以發(fā)現(xiàn)這此次序列化過程調(diào)用了Person類的無參構(gòu)造器。
Externalizable繼承于Serializable,當(dāng)使用該接口時,序列化的細(xì)節(jié)需要由程序員去完成。如上所示的代碼,由于writeExternal()與readExternal()方法未作任何處理,那么該序列化行為將不會保存/讀取任何一個字段。這也就是為什么輸出結(jié)果中所有字段的值均為空。
另外,若使用Externalizable進(jìn)行序列化,當(dāng)讀取對象時,會調(diào)用被序列化類的無參構(gòu)造器去創(chuàng)建一個新的對象,然后再將被保存對象的字段的值分別填充到新對象中。這就是為什么在此次序列化過程中Person類的無參構(gòu)造器會被調(diào)用。由于這個原因,實(shí)現(xiàn)Externalizable接口的類必須要提供一個無參的構(gòu)造器,且它的訪問權(quán)限為public。
對上述Person類作進(jìn)一步的修改,使其能夠?qū)ame與age字段進(jìn)行序列化,但要忽略掉gender字段,如下代碼所示:
public class Person implements Externalizable {
private String name = null;
transient private Integer age = null;
private Gender gender = null;
public Person() {
System.out.println("none-arg constructor");
}
public Person(String name, Integer age, Gender gender) {
System.out.println("arg constructor");
this.name = name;
this.age = age;
this.gender = gender;
}
private void writeObject(ObjectOutputStream out) throws IOException {
out.defaultWriteObject();
out.writeInt(age);
}
private void readObject(ObjectInputStream in) throws IOException, ClassNotFoundException {
in.defaultReadObject();
age = in.readInt();
}
@Override
public void writeExternal(ObjectOutput out) throws IOException {
out.writeObject(name);
out.writeInt(age);
}
@Override
public void readExternal(ObjectInput in) throws IOException, ClassNotFoundException {
name = (String) in.readObject();
age = in.readInt();
}

} 執(zhí)行SimpleSerial之后會有如下結(jié)果:
arg constructor
none-arg constructor
[John, 31, null]
5.4 readResolve()方法 當(dāng)我們使用Singleton模式時,應(yīng)該是期望某個類的實(shí)例應(yīng)該是唯一的,但如果該類是可序列化的,那么情況可能會略有不同。此時對第2節(jié)使用的Person類進(jìn)行修改,使其實(shí)現(xiàn)Singleton模式,如下所示:
public class Person implements Serializable {
private static class InstanceHolder {
private static final Person instatnce = new Person("John", 31, Gender.MALE);
}
public static Person getInstance() {
return InstanceHolder.instatnce;
}
private String name = null;
private Integer age = null;
private Gender gender = null;
private Person() {
System.out.println("none-arg constructor");
}
private Person(String name, Integer age, Gender gender) {
System.out.println("arg constructor");
this.name = name;
this.age = age;
this.gender = gender;
}

} 同時要修改SimpleSerial應(yīng)用,使得能夠保存/獲取上述單例對象,并進(jìn)行對象相等性比較,如下代碼所示:
public class SimpleSerial {
public static void main(String[] args) throws Exception {
File file = new File("person.out");
ObjectOutputStream oout = new ObjectOutputStream(new FileOutputStream(file));
oout.writeObject(Person.getInstance()); // 保存單例對象
oout.close();
ObjectInputStream oin = new ObjectInputStream(new FileInputStream(file));
Object newPerson = oin.readObject();
oin.close();
System.out.println(newPerson);
System.out.println(Person.getInstance() == newPerson); // 將獲取的對象與Person類中的單例對象進(jìn)行相等性比較
}
}
執(zhí)行上述應(yīng)用程序后會得到如下結(jié)果:
arg constructor
[John, 31, MALE]
false
值得注意的是,從文件person.out中獲取的Person對象與Person類中的單例對象并不相等。為了能在序列化過程仍能保持單例的特性,可以在Person類中添加一個readResolve()方法,在該方法中直接返回Person的單例對象,如下所示:
public class Person implements Serializable {
private static class InstanceHolder {
private static final Person instatnce = new Person("John", 31, Gender.MALE);
}
public static Person getInstance() {
return InstanceHolder.instatnce;
}
private String name = null;
private Integer age = null;
private Gender gender = null;
private Person() {
System.out.println("none-arg constructor");
}
private Person(String name, Integer age, Gender gender) {
System.out.println("arg constructor");
this.name = name;
this.age = age;
this.gender = gender;
}
private Object readResolve() throws ObjectStreamException {
return InstanceHolder.instatnce;
}

} 再次執(zhí)行本節(jié)的SimpleSerial應(yīng)用后將有如下輸出:
arg constructor
[John, 31, MALE]
true
無論是實(shí)現(xiàn)Serializable接口,或是Externalizable接口,當(dāng)從I/O流中讀取對象時,readResolve()方法都會被調(diào)用到。實(shí)際上就是用readResolve()中返回的對象直接替換在反序列化過程中創(chuàng)建的對象,而被創(chuàng)建的對象則會被垃圾回收掉。