亚洲视频在线观看视频,国产日韩亚洲大尺度高清,亚洲国产高清视频在线观看

java中的易�؜问题攉��

Shooper.Java — Tue, 30 May 2006 15:13:00 GMT

�W�一�Q�final, finally, finalize的区别�?

final?修饰�W�（关键字）如果一个类被声明�ؓfinal�Q�意味着它不能再�z��出新的子�c�，不能作�ؓ父类被��ѝ��因此一个类不能既被声明�?abstract的，又被声明为final的。将变量或方法声明�ؓfinal�Q�可以保证它们在使用中不被改变。被声明为final的变量必��d��声明时给定初��|��而在以后的引用中只能��d��Q�不可修攏V��被声明为final的方法也同样只能使用�Q�不能重�?

finally?再异常处理时提供 finally 块来执行��M��清除操作。如果抛��Z��个异常，那么相匹配的 catch 子句��׃��执行�Q�然后控制就会进�?finally 块（如果有的话）�?
finalize?�Ҏ��名。Java 技术允�怋��?finalize() �Ҏ��在垃圾收集器��对象从内存中清除出��M��前做必要的清理工作。这个方法是由垃圾收集器在确定这个对象没有被引用时对�q�个对象调用的。它是在 Object �c�M��定义的，因此所有的�c�都�l�承了它。子�c�覆�?finalize() �Ҏ��以整理系�l�资源或者执行其他清理工作。finalize() �Ҏ��是在垃圾攉��器删除对象之前对�q�个对象调用的�?

�W�二�Q�Anonymous Inner Class (匿名内部�c? 是否可以extends(�l�承)其它�c�，是否可以implements(实现)interface(接口)?

匿名的内部类是没有名字的内部�c�R��不能extends(�l�承) 其它�c�，但一个内部类可以作�ؓ一个接口，由另一个内部类实现�?

�W�三�Q�Static Nested Class �?Inner Class的不同，说得��多��好
Nested Class �Q�一般是C++的说法）�Q�Inner Class (一般是JAVA的说�?。Java内部�c�M��C++嵌套�c�L��大的不同��在于是否有指向外部的引用上。具体可见http: //www.frontfree.net/articles/services/view.asp?id=704&page=1
注：静态内部类�Q�Inner Class�Q�意味着1创徏一个static内部�cȝ��对象�Q�不需要一个外部类对象�Q?不能从一个static内部�cȝ��一个对象访问一个外部类对象

�W�四�Q?amp;�?amp;&的区别�?
&是位�q�算�W��?amp;&是布��逻辑�q�算�W��?

�W�五�Q�HashMap和Hashtable的区别�?
都属于Map接口的类�Q�实��C��惟一键映��到特定的��g��?
HashMap �c�L��有分�c�L��者排序。它允许一�?null 键和多个 null 倹{�?
Hashtable �c�M��?HashMap�Q�但是不允许 null 键和 null 倹{��它也比 HashMap 慢，因�ؓ它是同步的�?

�W�六�Q�Collection �?Collections的区别�?
Collections是个java.util下的�c�，它包含有各种有关集合操作的静态方法�?
Collection是个java.util下的接口�Q�它是各�U�集合结构的父接口�?

�W�七�Q�什么时候用assert�?
断言是一个包含布��表辑ּ�的语句，在执行这个语句时假定该表辑ּ��?true。如果表辑ּ�计算�?false�Q�那么系�l�会报告一�?Assertionerror。它用于调试目的�Q?
assert(a > 0); // throws an Assertionerror if a <= 0
断言可以有两�U��Ş式：
assert Expression1 ;
assert Expression1 : Expression2 ;
Expression1 应该��L��产生一个布��倹{�?
Expression2 可以是得��Z��个值的��L��表达式。这个值用于生成显�C�更多调试信息的 String 消息�?
断言在默认情况下是禁用的。要在编译时启用断言�Q�需要��?source 1.4 标记�Q?
javac -source 1.4 Test.java
要在�q�行时启用断�a��Q�可使用 -enableassertions 或�?-ea 标记�?
要在�q�行旉��择��用断言�Q�可使用 -da 或�?-disableassertions 标记�?
要系�l�类中启用断�a��Q�可使用 -esa 或�?-dsa 标记。还可以在包的基��上启用或者禁用断�a��?
可以在预计正常情况下不会到达的�Q何位�|�上攄��断言。断�a�可以用于验证传递给�U�有�Ҏ��的参数。不�q�，断言不应该用于验证传递给公有�Ҏ��的参敎ͼ�因�ؓ不管是否启用了断�a��Q�公有方法都必须��查其参数。不�q�，既可以在公有�Ҏ��中，也可以在非公有方法中利用断言��试后置条�g。另外，断言不应该以��M��方式改变�E�序的状态�?

�W�八�Q�GC是什�? ��Z��么要有GC? (基础)�?
GC是垃圾收集器。Java �E�序员不用担心内存管理，因�ؓ垃圾攉��器会自动�q�行��理。要��h��垃圾攉��Q�可以调用下面的�Ҏ��之一�Q?
System.gc()
Runtime.getRuntime().gc()

�W�九�Q�String s = new String("xyz");创徏了几个String Object?
两个对象�Q�一个是“xyx�?一个是指向“xyx”的引用对象s�?

�W�十�Q�Math.round(11.5)�{�於多少? Math.round(-11.5)�{�於多少?
Math.round(11.5)�q�回�Q�long�Q?2�Q�Math.round(-11.5)�q�回�Q�long�Q?11;

�W�十一�Q�short s1 = 1; s1 = s1 + 1;有什么错? short s1 = 1; s1 += 1;有什么错?
short s1 = 1; s1 = s1 + 1;有错�Q�s1是short型，s1+1是int�?不能昑ּ�转化为short型。可修改为s1 =(short)(s1 + 1) 。short s1 = 1; s1 += 1正确�?

�W�十二，sleep() �?wait() 有什么区�? 搞线�E�的最�?
sleep()�Ҏ��是�ɾU�程停止一�D�|��间的�Ҏ��。在sleep 旉��间隔期满后，�U�程不一定立��x��复执行。这是因为在那个时刻�Q�其它线�E�可能正在运行而且没有被调度�ؓ攑ּ�执行�Q�除�?a)“醒来”的�U�程��h��更高的优先��
(b)正在�q�行的线�E�因为其它原因而阻塞�?
wait()是线�E�交互时�Q�如果线�E�对一个同步对象x 发出一个wait()调用�Q�该�U�程会暂停执行，被调对象�q�入�{�待状态，直到被唤醒或�{�待旉��到�?

�W�十三，Java有没有goto?
Goto?java中的保留字，现在没有在java中��用�?

�W�十四，数组有没有length()�q�个�Ҏ��? String有没有length()�q�个�Ҏ��Q?
数组没有length()�q�个�Ҏ��Q�有length的属性�?
String有有length()�q�个�Ҏ��?

�W�十五，Overload和Override的区别。Overloaded的方法是否可以改变返回值的�c�d��?
�Ҏ��的重写Overriding和重载Overloading是Java多态性的不同表现。重写Overriding是父�c�M��子类之间多态性的一�U�表玎ͼ�重蝲Overloading是一个类中多态性的一�U�表现。如果在子类中定义某�Ҏ��与其父类有相同的名称和参敎ͼ�我们说该�Ҏ��被重�?(Overriding)。子�cȝ��对象使用�q�个�Ҏ��Ӟ��调用子�c�M��的定义，对它而言�Q�父�c�M��的定义如同被“屏蔽”了。如果在一个类中定义了多个同名的方法，它们或有不同的参��C��数或有不同的参数�c�d��Q�则�U�Cؓ�Ҏ��的重�?Overloading)。Overloaded的方法是可以改变�q�回值的�c�d��?

�W�十六，Set里的元素是不能重复的�Q�那么用什么方法来区分重复与否�? 是用==�q�是equals()? 它们有何区别?
Set里的元素是不能重复的�Q�那么用iterator()�Ҏ��来区分重复与否。equals()是判��M��个Set是否相等�?
equals()�?=�Ҏ��军_��引用值是否指向同一对象equals()在类中被覆盖�Q��ؓ的是当两个分��ȝ��对象的内容和�c�d��盔R��的话�Q�返回真倹{�?

�W�十七，�l�我一个你最常见到的runtime exception�?
ArithmeticException, ArrayStoreException, BufferOverflowException, BufferUnderflowException, CannotRedoException, CannotUndoException, ClassCastException, CMMException, ConcurrentModificationException, DOMException, EmptyStackException, IllegalArgumentException, IllegalMonitorStateException, IllegalPathStateException, IllegalStateException,
ImagingOpException, IndexOutOfBoundsException, MissingResourceException, NegativeArraySizeException, NoSuchElementException, NullPointerException, ProfileDataException, ProviderException, RasterFORMatException, SecurityException, SystemException, UndeclaredThrowableException, UnmodifiableSetException, UnsupportedOperationException

�W�十八，error和exception有什么区�?
error 表示恢复不是不可能但很困隄��情况下的一�U�严重问题。比如说内存溢出。不可能指望�E�序能处理这��L��情况�?
exception 表示一�U�设计或实现问题。也��是��_��它表�C�如果程序运行正常，从不会发生的情况�?

�W�十九，List, Set, Map是否�l�承自Collection接口?
List�Q�Set�?

Map不是

�W�二十，abstract class和interface有什么区�?
声明�Ҏ��的存在而不��d��现它的类被叫做抽象类�Q�abstract class�Q�，它用于要创徏一个体现某些基本行为的�c�，�q��ؓ该类声明�Ҏ��Q�但不能在该�c�M��实现该类的情��c��不能创建abstract �cȝ��实例。然而可以创��Z��个变量，其类型是一个抽象类�Q��ƈ让它指向具体子类的一个实例。不能有抽象构造函数或抽象静态方法。Abstract �cȝ��子类为它们父�c�M��的所有抽象方法提供实玎ͼ�否则它们也是抽象�c�Mؓ。取而代之，在子�c�M��实现该方法。知道其行�ؓ的其它类可以在类中实现这些方法�?
接口�Q�interface�Q�是抽象�cȝ��变体。在接口中，所有方法都是抽象的。多�l�承性可通过实现�q�样的接口而获得。接口中的所有方法都是抽象的�Q�没有一个有�E�序体。接口只可以定义static final成员变量。接口的实现与子�cȝ��|��除了该实现类不能从接口定义中�l�承行�ؓ。当�c�d��现特�D�接口时�Q�它定义�Q�即��程序体�l�予�Q�所有这�U�接口的�Ҏ��。然后，它可以在实现了该接口的类的�Q何对象上调用接口的方法。由于有抽象�c�，它允�怋�用接口名作�ؓ引用变量的类型。通常的动态联�~�将生效。引用可以�{换到接口�c�d��或从接口�c�d��转换�Q�instanceof �q�算�W�可以用来决定某对象的类是否实现了接口�?

�W�二十一�Q�abstract的method是否可同时是static,是否可同时是native�Q�是否可同时是synchronized?
都不�?

�W�二十二�Q�接口是否可�l�承接口? 抽象�c�L��否可实现(implements)接口? 抽象�c�L��否可�l�承实体�c?concrete class)?
接口可以�l�承接口。抽象类可以实现(implements)接口�Q�抽象类是否可��承实体类�Q�但前提是实体类必须有明��的构造函数�?

�W�二十三�Q�启动一个线�E�是用run()�q�是start()?
启动一个线�E�是调用start()�Ҏ��Q��ɾU�程所代表的虚拟处理机处于可运行状态，�q�意味着它可以由JVM调度�q�执行。这�q�不意味着�U�程��׃��立即�q�行。run()�Ҏ��可以产生必须退出的标志来停止一个线�E��?

�W�二十四�Q�构造器Constructor是否可被override?
构造器Constructor不能被��承，因此不能重写Overriding�Q�但可以被重载Overloading�?

�W�二十五�Q�是否可以��承String�c?
String�c�L��final�c�L��不可以��ѝ�?

�W�二十六�Q�当一个线�E�进入一个对象的一个synchronized�Ҏ��后，其它�U�程是否可进入此对象的其它方�?
不能�Q�一个对象的一个synchronized�Ҏ��只能�׃��个线�E�访问�?

�W�二十七�Q�try {}里有一个return语句�Q�那么紧跟在�q�个try后的finally {}里的code会不会被执行�Q�什么时候被执行�Q�在return前还是后?
会执行，在return前执行�?

�W�二十八�Q�编�E�题: 用最有效率的�Ҏ��出2乘以8�{�於�?
有C背景的程序员特别喜欢问这�U�问题�?

2 << 3

�W�二十九�Q�两个对象值相�?x.equals(y) == true)�Q�但却可有不同的hash code�Q�这句话对不�?
不对�Q�有相同的hash code�?

�W�三十，当一个对象被当作参数传递到一个方法后�Q�此�Ҏ��可改变这个对象的属性，�q�可�q�回变化后的�l�果�Q�那么这里到底是��g��递还是引用传�?
是��g��递。Java �~�程语言只由��g��递参数。当一个对象实例作��Z��个参数被传递到�Ҏ��中时�Q�参数的值就是对该对象的引用。对象的内容可以在被调用的方法中改变�Q�但对象的引用是永远不会改变的�?

�W�三十一�Q�swtich是否能作用在byte上，是否能作用在long上，是否能作用在String�?
switch�Q�expr1�Q�中�Q�expr1是一个整数表辑ּ�。因此传递给 switch �?case 语句的参数应该是 int�?short�?char 或�?byte。long,string 都不能作用于swtich�?

�W�三十二�Q�编�E�题: 写一个Singleton出来�?
Singleton模式主要作用是保证在Java应用�E�序中，一个类Class只有一个实例存在�?
一般Singleton模式通常有几�U�种形式:
�W�一�U��Ş�? 定义一个类�Q�它的构造函��Cؓprivate的，它有一个static的private的该�c�d��量，在类初始化时实例话，通过一个public的getInstance�Ҏ��获取对它的引�?�l�而调用其中的�Ҏ��?
public class Singleton {
　　private Singleton(){}
　　//在自己内部定义自�׃��个实例，是不是很奇怪？
　　//注意�q�是private 只供内部调用
　　private static Singleton instance = new Singleton();
　　//�q�里提供了一个供外部讉K��本class的静态方法，可以直接讉K��　　
　　public static Singleton getInstance() {
　　　　return instance; 　　
　　 }
}
�W�二�U��Ş�?
public class Singleton {
　　private static Singleton instance = null;
　　public static synchronized Singleton getInstance() {
　　//�q�个�Ҏ��比上面有所改进�Q�不用每�ơ都�q�行生成对象�Q�只是第一�ơ　　　　
　　//使用时生成实例，提高了效率！
　　if (instance==null)
　　　　instance�Q�new Singleton();
return instance; 　　}
}
其他形式:
定义一个类�Q�它的构造函��Cؓprivate的，所有方法�ؓstatic的�?
一般认为第一�U��Ş式要更加安全�?

Hashtable和HashMap
Hashtable�l�承自Dictionary�c�，而HashMap是Java1.2引进的Map interface的一个实�?

HashMap允许��null作�ؓ一个entry的key或者value�Q�而Hashtable不允�?

�q�有��是�Q�HashMap把Hashtable的contains�Ҏ��L��了，�Ҏ��containsvalue和containsKey。因为contains�Ҏ��Ҏ��让�h引�v误解�?

最大的不同是，Hashtable的方法是Synchronize的，而HashMap不是�Q�在
多个�U�程讉K��Hashtable�Ӟ��不需要自�׃ؓ它的�Ҏ��实现同步�Q�而HashMap
��必��Mؓ之提供外同步�?

Hashtable和HashMap采用的hash/rehash��法都大概一��P��所以性能不会有很大的差异�?

Shooper.Java 2006-05-30 23:13 发表评论

字符�Q�字节和�~�码

Shooper.Java — Tue, 16 May 2006 15:46:00 GMT

字符�Q�字节和�~�码

[原创文章�Q��{载请保留或注明出处：http://www.regexlab.com/zh/encoding.htm]

�U�别�Q�中�U?/p>

摘要�Q�本文介�l�了字符与编码的发展�q�程�Q�相��x��늚�正确理解。�D例说明了一些实际应用中�Q�编码的实现�Ҏ��。然后，本文讲述了通常对字�W�与�~�码的几�U�误解，�׃��q�些误解而导致�ؕ码��生的原因�Q�以及消除�ؕ码的办法。本文的内容�늛�了“中文问题”，“�ؕ码问题”�?/p>
掌握�~�码问题的关键是正确地理解相��x��念，�~�码所涉及的技术其实是很简单的。因此，阅读本文旉��要慢��d��惻I��多思考�?/p>

引言

“字�W�与�~�码”是一个被�l�常讨论的话题。即使这��P��时常出现的�ؕ码仍然困扰着大家。虽然我们有很多的办法可以用来消除�ؕ码，但我们�ƈ不一定理解这些办法的内在原理。而有的�ؕ码��生的原因�Q�实际上�׃��底层代码本��n有问题所��D��的。因此，不仅是初学者会对字�W�编码感到模�p�，有的底层开发�h员同样对字符�~�码�~�Z��准确的理解�?/p>

回页�?/a>

1. �~�码问题的由来，相关概念的理�?/h4>

1.1 字符与编码的发展

从计��机对多国语�a�的支持角度看�Q�大致可以分��Z��个阶�D�：

	�pȝ��内码	说明	�pȝ��
阶段一	ASCII	计算机刚开始只支持��p��Q�其它语�a�不能够在计算��Z��存储和显�C��?/td>	英文 DOS
阶段�?/td>	ANSI�~�码 �Q�本地化�Q?/td>	��Z��计算机支持更多语�a��Q�通常使用 0x80~0xFF 范围�?2 个字节来表示 1 个字�W�。比如：汉字 '�? 在中文操作系�l�中�Q��?[0xD6,0xD0] �q�两个字节存储�?br /> 不同的国家和地区制定了不同的标准�Q�由此��生了 GB2312, BIG5, JIS �{�各自的�~�码标准。这些��?2 个字节来代表一个字�W�的各种汉字延�׾~�码方式�Q�称�?b> ANSI �~�码。在��体中文系�l�下�Q�ANSI �~�码代表 GB2312 �~�码�Q�在日文操作�pȝ��下，ANSI �~�码代表 JIS �~�码�?br /> 不同 ANSI �~�码之间互不兼容�Q�当信息在国际间交流�Ӟ��无法��属于两�U�语�a�的文字，存储在同一�D?b> ANSI �~�码的文本中�?/td>	中文 DOS�Q�中�?Windows 95/98�Q�日�?Windows 95/98
阶段�?/td>	UNICODE �Q�国际化�Q?/td>	��Z��使国际间信息交流更加方便�Q�国际组�l�制定了 UNICODE 字符�?/b>�Q��ؓ各种语言中的每一个字�W�设定了�l�一�q�且唯一的数字编��P��以满��语言、跨�q�_��q�行文本转换、处理的要求�?/td>	Windows NT/2000/XP�Q�Linux�Q�Java

字符串在内存中的存放�Ҏ��Q?/p>

�?ASCII 阶段�Q?b>单字节字�W�串使用一个字节存放一个字�W�（SBCS�Q�。比如，"Bob123" 在内存中为：

42	6F	62	31	32	33	00

B	o	b	1	2	3	\0

在��?ANSI �~�码支持多种语言阶段�Q�每个字�W��用一个字节或多个字节来表�C�（MBCS�Q�，因此�Q�这�U�方式存攄��字符也被�U�C��多字节字�W?/b>。比如，"中文123" 在中�?Windows 95 内存中�ؓ7个字节，每个汉字�?个字节，每个英文和数字字�W�占1个字节：

D6 D0 CE C4 31 32 33 00

�?/td> �?/td> 1 2 3 \0

�?UNICODE 被采用之后，计算机存攑֭��W�串�Ӟ��改�ؓ存放每个字符�?UNICODE 字符集中的序受��目前计��机一般��?2 个字节（16 位）来存放一个序��P��DBCS�Q�，因此�Q�这�U�方式存攄��字符也被�U�C��宽字节字�W?/b>。比如，字符�?"中文123" �?Windows 2000 下，内存中实际存攄��?5 个序��P��

2D 4E 87 65 31 00 32 00 33 00 00 00      �?�?x86 CPU 中，低字节在�?/font>

�?/td> �?/td> 1 2 3 \0 　

一共占 10 个字节�?/p>

回页�?/a>

1.2 字符�Q�字节，字符�?/h5>
理解�~�码的关键，是要把字�W�的概念和字节的概念理解准确。这两个概念�Ҏ��h��Q�我们在此做一下区分：

　 概念描述 举例

字符 ��Z��使用的记��P��抽象意义上的一个符受��?/td> '1', '�?, 'a', '$', '�K?, …�?/td>

字节计算��Z��存储数据的单元，一�?位的二进制数�Q�是一个很具体的存储空间�?/td> 0x01, 0x45, 0xFA, …�?/td>

ANSI
字符�?/td> 在内存中�Q�如果“字�W�”是�?ANSI �~�码形式存在的，一个字�W�可能��用一个字节或多个字节来表�C�，那么我们�U�这�U�字�W�串�?ANSI 字符�?/b>或�?b>多字节字�W�串�?/td> "中文123"
�Q�占7字节�Q?/font>

UNICODE
字符�?/td> 在内存中�Q�如果“字�W�”是以在 UNICODE 中的序号存在的，那么我们�U�这�U�字�W�串�?UNICODE 字符�?/b>或�?b>宽字节字�W�串�?/td> L"中文123"
�Q�占10字节�Q?/font>

�׃��不同 ANSI �~�码所规定的标准是不相同的�Q�因此，对于一个给定的多字节字�W�串�Q�我们必��ȝ��道它采用的是哪一�U�编码规则，才能够知道它包含了哪些“字�W�”。而对�?UNICODE 字符�?/b>来说�Q�不��在什么环境下�Q�它所代表的“字�W�”内�Ҏ��L��不变的�?/p>

回页�?/a>

1.3 字符集与�~�码

各个国家和地区所制定的不�?ANSI �~�码标准中，都只规定了各自语�a�所需的“字�W�”。比如：汉字标准�Q�GB2312�Q�中没有规定韩国语字�W�怎样存储。这�?ANSI �~�码标准所规定的内容包含两层含义：

使用哪些字符。也��是说哪些汉字，字母和符号会被收入标准中。所包含“字�W�”的集合��叫做�?b>字符�?/b>”�?

规定每个“字�W�”分别用一个字节还是多个字节存储，用哪些字节来存储�Q�这个规定就叫做�?b>�~�码”�?

各个国家和地区在制定�~�码标准的时候，“字�W�的集合”和“编码”一般都是同时制定的。因此，�q�_��我们所说的“字�W�集”，比如�Q�GB2312, GBK, JIS �{�，除了有“字�W�的集合”这层含义外�Q�同时也包含了“编码”的含义�?/p>
�?b>UNICODE 字符�?/b>”包含了各种语言中��用到的所有“字�W�”。用来给 UNICODE 字符集编码的标准有很多种�Q�比如：UTF-8, UTF-7, UTF-16, UnicodeLittle, UnicodeBig �{��?/p>

回页�?/a>

1.4 常用的编码简�?/h5>
��单介�l�一下常用的�~�码规则�Q��ؓ后边的章节做一个准备。在�q�里�Q�我们根据编码规则的特点�Q�把所有的�~�码分成三类�Q?/p>

分类 �~�码标准 说明

单字节字�W�编�?/td> ISO-8859-1 最��单的�~�码规则�Q�每一个字节直接作��Z��?UNICODE 字符。比如，[0xD6, 0xD0] �q�两个字节，通过 iso-8859-1 转化为字�W�串�Ӟ��直接得�?[0x00D6, 0x00D0] 两个 UNICODE 字符�Q�即 "?D"�?br />
反之�Q�将 UNICODE 字符串通过 iso-8859-1 转化为字节串�Ӟ��只能正常转化 0~255 范围的字�W��?/td>

ANSI �~�码 GB2312,
BIG5,
Shift_JIS,
ISO-8859-2 …�?/td> �?UNICODE 字符串通过 ANSI �~�码转化为“字节串”时�Q�根据各自编码的规定�Q�一�?UNICODE 字符可能转化成一个字节或多个字节�?br />
反之�Q�将字节串�{化成字符串时�Q�也可能多个字节转化成一个字�W�。比如，[0xD6, 0xD0] �q�两个字节，通过 GB2312 转化为字�W�串�Ӟ��得�?[0x4E2D] 一个字�W�，�?'�? 字�?br />
“ANSI �~�码”的特点�Q?br />1. �q�些“ANSI �~�码标准”都只能处理各自语言范围之内�?UNICODE 字符�?br />2. “UNICODE 字符”与“�{换出来的字节”之间的关系是�h��定的�?/td>

UNICODE �~�码 UTF-8,
UTF-16, UnicodeBig …�?/td> 与“ANSI �~�码”类似的�Q�把字符串通过 UNICODE �~�码转化成“字节串”时�Q�一�?UNICODE 字符可能转化成一个字节或多个字节�?br />
与“ANSI �~�码”不同的是：
1. �q�些“UNICODE �~�码”能够处理所有的 UNICODE 字符�?br />2. “UNICODE 字符”与“�{换出来的字节”之间是可以通过计算得到的�?/td>

我们实际上没有必要去��q��每一�U�编码具体把某一个字�W�编码成了哪几个字节�Q�我们只需要知道“编码”的概念��是把“字�W�”�{化成“字节”就可以了。对于“UNICODE �~�码”，�׃��它们是可以通过计算得到的，因此�Q�在�Ҏ��的场合，我们可以��M��解某一�U�“UNICODE �~�码”是怎样的规则�?/p>

回页�?/a>

2. 字符与编码在�E�序中的实现

2.1 �E�序中的字符与字�?/h5>
�?C++ �?Java 中，用来代表“字�W�”和“字节”的数据�c�d��Q�以及进行编码的�Ҏ��Q?/p>

�c�d��或操�?/b> C++ Java

字符 wchar_t char

字节 char byte

ANSI 字符�?/td> char[] byte[]

UNICODE 字符�?/td> wchar_t[] String

字节东y��字符�?/td> mbstowcs(), MultiByteToWideChar() string = new String(bytes, "encoding")

字符东y��字节�?/td> wcstombs(), WideCharToMultiByte() bytes = string.getBytes("encoding")

以上需要注意几点：

Java 中的 char 代表一个“UNICODE 字符�Q�宽字节字符�Q�”，�?C++ 中的 char 代表一个字节�?

MultiByteToWideChar() �?WideCharToMultiByte() �?Windows API 函数�?

回页�?/a>

2.2 C++ 中相兛_��现方�?/h5>
声明一�D�字�W�串帔R��Q?/p>

// ANSI 字符�Ԍ��内容长度 7 字节
char      sz[20] = "中文123";

// UNICODE 字符�Ԍ��内容长度 5 �?wchar_t�Q?0 字节�Q?/span>
wchar_t wsz[20] = L"\x4E2D\x6587\x0031\x0032\x0033";

UNICODE 字符串的 I/O 操作�Q�字�W�与字节的�{换操作：

// �q�行时设定当�?ANSI �~�码�Q�VC 格式
setlocale(LC_ALL, ".936");

// GCC 中格�?/span>
setlocale(LC_ALL, "zh_CN.GBK");

// Visual C++ 中��用小�?%s�Q�按�?setlocale 指定�~�码输出到文�?br />// GCC 中��用大�?%S
fwprintf(fp, L"%s\n", wsz);

// �?UNICODE 字符串按�?setlocale 指定的编码�{换成字节
wcstombs(sz, wsz, 20);
// 把字节串按照 setlocale 指定的编码�{换成 UNICODE 字符�?br />mbstowcs(wsz, sz, 20);

�?Visual C++ 中，UNICODE 字符串常量有更简单的表示�Ҏ��。如果源�E�序的编码与当前默认 ANSI �~�码不符�Q�则需要��?#pragma setlocale�Q�告诉编译器源程序��用的�~�码�Q?/p>

// 如果源程序的�~�码与当前默�?ANSI �~�码不一��_��
// 则需要此行，�~�译时用来指明当前源�E�序使用的编�?/font>
#pragma setlocale (".936")

// UNICODE 字符串常量，内容长度 10 字节
wchar_t wsz[20] = L"中文123";

以上需要注�?#pragma setlocale �?setlocale(LC_ALL, "") 的作用是不同的，#pragma setlocale 在编译时起作用，setlocale() 在运行时起作用�?/p>

回页�?/a>

2.3 Java 中相兛_��现方�?/h5>
字符串类 String 中的内容�?UNICODE 字符�Ԍ��

// Java 代码�Q�直接写中文
String string = "中文123";

// 得到长度�?5�Q�因为是 5 个字�W?/span>
System.out.println(string.length());

字符�?I/O 操作�Q�字�W�与字节转换操作。在 Java �?java.io.* 中，以“Stream”结��c�M��般是用来操作“字节串”的�c�，以“Reader”，“Writer”结��c�M��般是用来操作“字�W�串”的�c�R�?/p>

// 字符串与字节串间�怺�转化

// 按照 GB2312 得到字节�Q�得到多字节字符�Ԍ��
byte [] bytes = string.getBytes("GB2312");

// 从字节按�?GB2312 得到 UNICODE 字符�?/span>
string = newString(bytes, "GB2312");

// 要将 String 按照某种�~�码写入文本文�g�Q�有两种�Ҏ��Q?br />
// �W�一�U�办法：�?Stream �c�d��入已�l�按照指定编码�{化好的字节串
OutputStream os = new FileOutputStream("1.txt");
os.write(bytes);
os.close();

// �W�二�U�办法：构造指定编码的 Writer 来写入字�W�串
Writer ow = new OutputStreamWriter(new FileOutputStream("2.txt"), "GB2312");
ow.write(string);
ow.close();

/* 最后得到的 1.txt �?2.txt 都是 7 个字�?*/

如果 java 的源�E�序�~�码与当前默�?ANSI �~�码不符�Q�则在编译的时候，需要指明一下源�E�序的编码。比如：

E:\>javac -encoding BIG5 Hello.java

以上需要注意区分源�E�序的编码与 I/O 操作的编码，前者是在编译时起作用，后者是在运行时起作用�?/p>

回页�?/a>

3. 几种误解�Q�以及�ؕ码��生的原因和解军_��?/h4>
3.1 �Ҏ��产生的误�?/h5>

　 对编码的误解

误解一在将“字节串”�{化成“UNICODE 字符东y��时�Q�比如在��d��文本文�g�Ӟ��或者通过�|�络传输文本�Ӟ��Ҏ��“字节串”简单地作�ؓ单字节字�W�串�Q�采用每“一个字节”就是“一个字�W�”的�Ҏ��q�行转化�?br />
而实际上�Q�在非英文的环境中，应该��“字节串”作�?ANSI 字符�Ԍ��采用适当的编码来得到 UNICODE 字符�Ԍ��有可能“多个字节”才能得到“一个字�W�”�?br />
通常�Q�一直在英文环境下做开发的�E�序员们�Q�容易有�q�种误解�?/td>

误解�?/td> �?DOS�Q�Windows 98 �{�非 UNICODE 环境下，字符串都是以 ANSI �~�码的字节�Ş式存在的。这�U�以字节形式存在的字�W�串�Q�必��ȝ��道是哪种�~�码才能被正��地使用。这使我们�Ş成了一个惯性思维�Q�“字�W�串的编码”�?br />
�?UNICODE 被支持后�Q�Java 中的 String 是以字符的“序号”来存储的，不是以“某�U�编码的字节”来存储的，因此已经不存在“字�W�串的编码”这个概念了。只有在“字�W�串”与“字节串”�{化时�Q�或者，��一个“字节串”当成一�?ANSI 字符串时�Q�才有编码的概念�?br />
不少的�h都有�q�个误解�?/td>

�W�一�U�误解，往往是导致�ؕ码��生的原因。第二种误解�Q�往往��D��本来�Ҏ��U�正的�ؕ码问题变得更复杂�?/p>
在这里，我们可以看到�Q�其中所讲的“误解一”，即采用每“一个字节”就是“一个字�W�”的转化�Ҏ��Q�实际上也就�{�同于采�?iso-8859-1 �q�行转化。因此，我们常常使用 bytes = string.getBytes("iso-8859-1") 来进行逆向操作�Q�得到原始的“字节串”。然后再使用正确�?ANSI �~�码�Q�比�?string = new String(bytes, "GB2312")�Q�来得到正确的“UNICODE 字符东y��?/p>

回页�?/a>

3.2 �?UNICODE �E�序在不同语�a�环境间移植时的�ؕ�?/h5>
�?UNICODE �E�序中的字符�Ԍ��都是以某�U?ANSI �~�码形式存在的。如果程序运行时的语�a�环境与开发时的语�a�环境不同�Q�将会导�?ANSI 字符串的昄��p�|�?/p>
比如�Q�在日文环境下开发的�?UNICODE 的日文程序界面，拿到中文环境下运行时�Q�界面上��显�C�Zؕ码。如果这个日文程序界面改为采�?UNICODE 来记录字�W�串�Q�那么当在中文环境下�q�行�Ӟ��界面上将可以昄��正常的日文�?/p>
�׃��客观原因�Q�有时候我们必��d��中文操作�pȝ��下运行非 UNICODE 的日文��Y�Ӟ��q�时我们可以采用一些工��P��比如�Q�南极星�Q�AppLocale �{�，暂时的模拟不同的语言环境�?/p>

回页�?/a>

3.3 �|�页提交字符�?/h5>
当页面中的表单提交字�W�串�Ӟ��首先把字�W�串按照当前��面的编码，转化成字节串。然后再��每个字节�{化成 "%XX" 的格式提交到 Web 服务器。比如，一个编码�ؓ GB2312 的页面，提交 "�? �q�个字符串时�Q�提交给服务器的内容�?"%D6%D0"�?/p>
在服务器端，Web 服务器把收到�?"%D6%D0" 转化�?[0xD6, 0xD0] 两个字节�Q�然后再�Ҏ�� GB2312 �~�码规则得到 "�? 字�?/p>
�?Tomcat 服务器中�Q�request.getParameter() 得到��q��Ӟ��常常是因为前面提到的“误解一”造成的。默认情况下�Q�当提交 "%D6%D0" �l?Tomcat 服务器时�Q�request.getParameter() ��返�?[0x00D6, 0x00D0] 两个 UNICODE 字符�Q�而不是返回一�?"�? 字符。因此，我们需要��?bytes = string.getBytes("iso-8859-1") 得到原始的字节串�Q�再�?string = new String(bytes, "GB2312") 重新得到正确的字�W�串 "�?�?/p>

回页�?/a>

3.4 从数据库��d��字符�?/h5>
通过数据库客��L��Q�比�?ODBC �?JDBC�Q�从数据库服务器中读取字�W�串�Ӟ��客户端需要从服务器获知所使用�?ANSI �~�码。当数据库服务器发送字节流�l�客��L��Ӟ��客户端负责将字节��按照正��的�~�码转化�?UNICODE 字符丌Ӏ?/p>
如果从数据库��d��字符串时得到��q��Q�而数据库中存攄��数据又是正确的，那么往往�q�是因�ؓ前面提到的“误解一”造成的。解决的办法�q�是通过 string = new String( string.getBytes("iso-8859-1"), "GB2312") 的方法，重新得到原始的字节串�Q�再重新使用正确的编码�{化成字符丌Ӏ?/p>

回页�?/a>

3.5 电子邮�g中的字符�?/h5>
当一�D?Text 或�?HTML 通过电子邮�g传送时�Q�发送的内容首先通过一�U�指定的字符�~�码转化成“字节串”，然后再把“字节串”通过一�U�指定的传输�~�码�Q�Content-Transfer-Encoding�Q�进行�{化得到另一东y��字节串”。比如，打开一��电子邮件源代码�Q�可以看到类似的内容�Q?/p>

Content-Type: text/plain;
        charset="gb2312"
Content-Transfer-Encoding: base64

sbG+qcrQuqO17cf4yee74bGjz9W7+b3wudzA7dbQ0MQNCg0KvPKzxqO6uqO17cnnsaPW0NDEDQoNCg==

最常用�?Content-Transfer-Encoding �?Base64 �?Quoted-Printable 两种。在对二�q�制文�g或者中文文本进行�{化时�Q�Base64 得到的“字节串”比 Quoted-Printable 更短。在对英文文本进行�{化时�Q�Quoted-Printable 得到的“字节串”比 Base64 更短�?/p>
邮�g的标题，用了一�U�更��短的格式来标注“字�W�编码”和“传输编码”。比如，标题内容�?"�?�Q�则在邮件源代码中表�C�Zؓ�Q?/p>

// 正确的标题格�?/span>
Subject: =?GB2312?B?1tA=?=

其中�Q?/p>

�W�一个�??”与�?”中间的部分指定了字�W�编码，在这个例子中指定的是 GB2312�?

�?”与�?”中间的“B”代�?Base64。如果是“Q”则代表 Quoted-Printable�?

最后�?”与�?=”之间的部分�Q�就是经�q?GB2312 转化成字节串�Q�再�l�过 Base64 转化后的标题内容�?

如果“传输编码”改�?Quoted-Printable�Q�同��P��如果标题内容�?"�?�Q?/p>

// 正确的标题格�?/span>
Subject: =?GB2312?Q?=D6=D0?=

如果阅读邮�g时出��Cؕ码，一般是因�ؓ“字�W�编码”或“传输编码”指定有误，或者是没有指定。比如，有的发邮件组件在发送邮件时�Q�标�?"�?�Q?/p>

// 错误的标题格�?/span>
Subject: =?ISO-8859-1?Q?=D6=D0?=

�q�样的表�C�，实际上是明确指明了标题�ؓ [0x00D6, 0x00D0]�Q�即 "?D"�Q�而不�?"�?�?/p>

回页�?/a>

4. 几种错误理解的纠�?/h4>
误解�Q�“ISO-8859-1 是国际编码？�?/h5>
非也。iso-8859-1 只是单字节字�W�集中最��单的一�U�，也就是“字节编号”与“UNICODE 字符�~�号”一致的那种�~�码规则。当我们要把一个“字节串”�{化成“字�W�串”，而又不知道它是哪一�U?ANSI �~�码�Ӟ��先暂时地把“每一个字节”作为“一个字�W�”进行�{化，不会造成信息丢失。然后再使用 bytes = string.getBytes("iso-8859-1") 的方法可恢复到原始的字节丌Ӏ?/p>
误解�Q�“Java 中，怎样知道某个字符串的内码�Q��?/h5>
Java 中，字符串类 java.lang.String 处理的是 UNICODE 字符�Ԍ��不是 ANSI 字符丌Ӏ�我们只需要把字符串作为“抽象的�W�号的串”来看待。因此不存在字符串的内码的问题�?/p>

Shooper.Java 2006-05-16 23:46 发表评论

�l�JAVA设计开发新手的一些徏议和意见

Shooper.Java — Tue, 09 May 2006 15:57:00 GMT

作者：飞云��侠来自�Q�CSDN

　　��Z��l�朋友同事一些设计问题上的指��|��Ҏ��写此文，很多观点都是从别人的文章中获取，有些观点肯定也有偏颇�Q�有些观点也仅仅是提出�ƈ没有做详�l�论�q�ͼ�请多拍砖�Q�以便改正�?

　　�?strong>概述�?/p>
　　在工作中�Q�作��Z��个程序员或者一个设计师�Q��L��要设计一些函数库或者一个框�Ӟ��当然最�l�常的还是做��目�Q�即使是一个项目，也会被经常改动，甚至交给别�h改动�?br />　　当你做这些工作的时候，你的�q�些成果都是要给别�h了解使用的，或者说�l�以后的你��用的�Q��ؓ了别人的方便或者�ؓ了自��q��方便�Q�我们要��可能做好设计�?br />　　

　　�?strong>放正心态，��M��东西都是不断发展�?/strong>�?/p>
　　技术是日新月异的，每一天都有新的技术出来，正所�?山外有山�Q��h外有�?�Q�每一个新的轮子出来，都可能比你要设计的轮子好�Q�所以在设计的时候，应该了解一下是否已�l�有了类似的轮子�Q�是否要设计一个新的轮子�?/p>
　　即��你的轮子已经设计好了�Q�也不好认�ؓ自己的轮子一定比别�h的轮子好�Q�虽然你的轮子可能更适合你的实际使用�?/p>
　　技术在不断的发展中�Q�你以及你的朋友/同事都在不断�q�步�Q?士别三日�Q�当刮目相看"�Q�所以不要认��Z��的水�q�一定比别�h高，"��有所短，寸有所�?�Q�所以别人对你的函数�?框架提出意见�Q�提出疑问的时候，请不要惊奇，不要反感�Q�不要认为别人在"挑刺"�Q�也�怽�的函数库/框架早就不适合当前的发展了�?br />　　
　　态度军_��一切。你的领导或许更重视�q�一炏V�?br />　　
　　�?strong>必要的组成部�?单元��试�Q�文��，实例�Q�手册etc�?/p>
　　单元��试�Q�文��，API Doc�Q�手册，演示�E�序�Q�Change Log�Q�Readme�Q�build。xml�{�等

　　有一天别��Z��用了你设计的函数�?框架�Q�当你升�U�后�Q�原来的��目却不能工作了�Q�经�q�一天的调试�Q�你�l�于扑ֈ�了原因，原来是不��心写错了一个东�ѝ�?/p>
　　你肯定不希望上述的事情发生，那么请你写单元测试吧�Q�这��h��不浪费自��q��旉��Q�也不耽误别�h的工作，何乐而不为。你花在写单元测试的旉��/带来的乐��和你升�U�后�Ҏ��莫名其妙的错误的旉��和苦恼相比，肯定更有价倹{��你看到单元��试的绿条，��N��不感到高兴吗?!

　　如果你不能保证你的程序修�Ҏ��有错误，不要指望你的同事认�ؓ你的错误是可以容忍的�Q�他们在心里早就开始骂你了�Q�呵��c��写单元��试�?br />　　
　　看看��M��一个知名的框架�Q�都包含完善的文��，单元��试�Q�示例程序，用户手册�Q�那么请你也包含�q�些吧。哦�Q�对了，误��l�地写好JavaDoc�Q�它很重要�?br />　　
　　使用你的框架/函数库的人如果到处去找��用方法，��L��某个�c?但是他不知道是否有这个类)�Q�那么说明你的文��没有到位。如果你希望别�h使用你的�q�个�c�L��者功能，那么请写好文档，不要指望别�h去读你的源码然后��p��理解它是�q�什么用的�?br />　　
　　如果你做到这些，那么你的函数�?框架也有�?知名"的前提，��N��不是�?如果没有�Q�我��x��没法让别人更好地使用的�?br />　　
　　对了�Q�有了这些东西，�q�要有一个良好的目录�l�织�Q�这个也可以参考别的框架的�l�织方式�?/p>
　�?strong>借鉴成熟的设计，参考已有的��目�?/p>
　　1. 要做一个新的东西，没有��x��。不要惊�Ӟ��我肯定先找一个现有的东西来借鉴�?br />　　
　　当然前提是不要重新发明轮子，或者是你有充分条�g要重新发明一个轮子�?br />　　Struts�Q�WebWork�Q?a target="_blank">Spring�{�等都是成熟的框�Ӟ��不管你��用�v来是否符合你的习惯�?br />　　在你成�ؓ大师之前�Q�你的设计思想估计前�h都已�l�提出�ƈ实践�q�了�Q�所以要勇敢地去借鉴�?站在巨�h的肩膀�?我们能更�q�一步�?br />　　
　　例如我们厌倦了在访问数据库时��用如下的代码:

　　try
　　{
　　//your code here
　　}
　　catch(Exception e)
　　{
　　//catch Exception
　　}
　　finally
　　{
　　//must do something
　　}

　　我们��可以借鉴Spring框架的JdbcTemplate�c�，看看它是如何利用回调函数来处理的�?
　　
　　我们使用hibernate时是不是也会使用�c�M��上面的代码，那么可以参考Spring框架的HibernateTemplate�?br />　　
　　借鉴也是一�U�捷径�?br />　　
　　警告:借鉴但不要抄袭，借鉴代码要注明来源，��重他�h也是��重自己�?br />　　
　　2. 在实际的��目中，往往可以参考已�l�有的项目来做自��q��设计�?br />　　
　　例如做一个网站，我不知道如何讉K��数据库，如何布局�Q�如何分层，那么我们可以参考已�l�有的网站程序，看看别�h是如何利用SiteMesh或者tiles布局�Q�如何��用Hibernate来访问数据库或者��用已�l�封装好的JDBC�c�L��讉K��数据库，如何利用Struts�Q�WebWork或者其他访问来分层�?/p>
　　�?strong>遵守�U�定俗成的一些做�?/strong>�?

　　��Z��使别人更方便��C��用你的东西，那么在设计一些通用的函数或者类的时候，请遵守通用的做法，不要与众不同�Q�除非你的内部实现确实与众不同�?/p>
　　例如实现一个类似ArrayList的类�Q�那么请不要�q�样�?

　　public int count()
　　{
　　return list.size();
　　}
　　public Item getItem(int i)
　　{
　　return list.get(i);
　　}
　　
　　而应该这�?

　　public int size()
　　{
　　return list.size();
　　}
　　public Item get(int i)
　　{
　　return list.get(i);
　　}
　　
　　当然每个人都有自��q��x��Q�如果你非常认�ؓ你原来的方式比普通的好，那么��h��?套方式供别�h选择。它不会�l�你带来�ȝ��Q�只是一个一看就懂的做法�Q�不用怀疑，�q�样做有好处�?br />　　
　　很多�cȝ��设计都有一些约定俗成的做法�Q�那么在你设计一个新�cȝ��时候，先借鉴一下吧�Q�多看看JDK的源�?文档�Q�看看别人是怎么实现的。这更有助于推广你的成果�?br />　　　　
　　�?strong>不要�q�信权威�?

　　在��用已有的框架或者函数库�Ӟ��不要认�ؓ所有的东西都是正确的或者是最好的最好，肯定不是。没有完��的东西�Q�已�l�存在的东西在设计的时候因为种�U�局限或者因��Z��者的水��^�Q�对现在来说肯定存在不合理的设计�Q�或者过于理惛_��的设计，而不能满��_��际情��c�?br />　　
　　不迷信权威，才能到达新的境界�?/p>
　　�?strong>不要��L��排斥�Q�不了解��׃��要草率发表意见，要严�?/strong>�?/p>
　　在网上经常看到。Net和Java的比�?火拼�Q�或者是Struts VS Webwork或者是其他�{�等�Q�非�怹�多。经常看到的是一方对�Ҏ��的东西不甚了解，��开始批评，�l�果说不到点子上�Q�反而被嘲笑一番�?br />　　几种技术的比较有时候是必要的，例如技术选型的时候。但是如果一些对�q�些技术根本不了解的�h来选型�Q�来评判�Q�你能对�l�果信服�?
　　存在��是合理�Q��Q何技术都有其存在的理由，虽然有些东西早就�q�时了，但是在当时它也是应运而生的�?br />　　几种技术，都是来解军_��L��问题�Q�但是问题也有很多方面，解决方式也有很多�U�，每个人的��x��也都不一��P��思�\也不一��P��所以没有绝对符合要求的技术，但是应该有符合你的技术，不符合你的技术不�{�于也不满��别�h的要求。所以不要轻易排斥别的东�ѝ�?br />　　
　　在做技术比较的时候，如果你不了解�Q�那么请不要��L��发表意见�Q�至��你可以亲自��M��解，��d��践之后在发表你的意见岂不是更好�?br />　　
　　在发表意见的时候，也要严�}�Q�不要轻易下�l�论�Q�要�l�过求证�Q�否则一旦错误只会让�Ҏ��W�话�Q�让你的同事看不起你。例如你说Hibernate3不支持jdk1�?�Q�那么最好去好好扑ֈ�你的证据�Q�否则就会成为错误�?Hibernate3支持jdk1�?)
　　
　　作�ؓ一个技术�h员，严�}应该是我们的习惯之一�Q�无论做开发还是做设计�?/p>
　　�?strong>处理好你的异�?/strong>�?/p>
　　异常处理是Java�~�程中非帔R��要的一个部分。徏议在使用异常之前阅读或者�?br />　　
　　下面从书中摘出几条徏�?
　　* �l�对不要忽略异常
　　* 千万不要隐藏异常
　　* 仅在不正常的情况下��用异�?br />　　* 对可恢复的情况��用可��查异常，对程序错误��用运行时异常(RunTimeException)
　　* �l�方法引发的异常做文�?br />　　* 在详�l�信息里面包括失败捕获信�?br />　　* 使用finally避免资源泄漏
　　* ....
　　
　　在这里特别提出的是，在开发中要特别处理NULL的情况，否则�l�常引发NullPointException异常�Q�在Java里这是一个最令�h头疼的异�怺��?br />　　如果你的�E�序因�ؓ一个NULL��|��而报了几十个NullPointException的话�Q�不但得让�h烦死�Q�而且�q�非帔R��以找到错误所在。所以在Java中一定要注意�q�个问题�?br />　　如果你的函数不允许Null��|��那么可以截获它，抛出一个异常，或者给客户更友好的提示�Q�难道不好吗?
　　
　　让我们来看一个例�?

　　public String getName(User aUser)
　　{
　　//如果aUser为Null�Q�会发生什么情�?br />　　return aUser.getName();
　　}
　　
　　很明显，如果参数为Null�Q�就会抛出异常。应该改�?
　　public String getName(User aUser)
　　{
　　if(null=aUser)
　　{
　　return "";
　　}
　　else
　　{
　　return aUser.getName();
　　}
　　}
　　
　　或者你要求参数不能为空�Q�还可以抛出一个异常，强制使用者不能传入空倹{�?br />　　
　　�q�有�l�常被忽略的是RunTimeException和普通异常的区别�Q�在Java中，�q�是一个特�D�的异常�c�，�E�序中如果遇到这个异常，用户可以不截获它�Q�而如果是其他的普通异常，��׃��许要截获它。我们的代码�l�常�q�么�?
　　try
　　{
　　//your code here
　　}
　　catch(Exception e)
　　{
　　//do warn
　　}

　　�q�样写的话，��截获了所有异常，当然也包括了RunTimeException�?在很多情况下�Q�这是不合适的处理方式�Q�我们只应截获必要的异常�Q�而应该忽略RuntimeException�?br />　　
　　关于RunTimeException�Q�在Spring中还有更好的利用方式�Q�徏议阅读Spring框架中在事务中对异常的处理代码，例如对Jdbc抛出的SqlException的�{换�?br />　　
　　关于异常处理�Q�我提出几点��:
　　* 捕获异常而且再次抛出时要包含原来的异�怿��?br />　　* 不要忘了RunTimeException�Q�除非必要，否则不要用catch(Exception e)的方式捕��h��有异常�?br />　　* 不要用异常做��程控制�Q�异常的性能代�h比较高昂�?�Ҏ��Q�可能有��Z��同意。此处不详细讨论)
　　* 不要把异常处理都抛给别�h�Q�本函数有能力处理的��׃��要抛出�?br />　　
　　在此��读者详�l�阅��L��者�?br />　　
　　�?strong>�q�度依赖�?/p>
　　在定位错误的时候，�l�常遇到��览了七八个文�g�q�是没有扑ֈ�什么地�Ҏ��行了真正需要的函数�Q�这个时候就非常郁闷。A调用了B�Q�B调用了C�Q�C调用了D。。。。。。让人找不到�?br />　　
　　面对�q�样的程序，存在的问题不仅仅是定位错误麻烦，而且如果需要维护这��L��函数�?框架�Q�恐怕你的有非常高的�l��M能力才行�Q�否则打��L��也不�ȝ��护�?br />　　
　　那么我们自己最好不要写�q�样的程序出来给人用�?/p>
　　�?strong>滥用接口�?/p>
　　现在��行"面对接口�~�程"�Q�这本��n本来是不错，但是滥用接口的现象却�l�常发生�?br />　　"面向接口"�Q�于是所有的�c�都有一个对应的接口�Q�接口的函数声明和类一模一��P��而且一个接口只有一个类来实现它。这��L��面向接口有什么意义哪? (��Z��用Spring的事务的情况除外)
　　
　　�Ҏ��"�q�比�Ҏ��?Law of Demter)"�Q�一个对象应当对其他对象有尽可能��的了解。一个接口内应该只定义对�Ҏ��需要的�Ҏ��Q�而不要把一些没用的�Ҏ��声明攑֜�接口里面�?br />　　
　　例如如下一个类:
　　
　　public class MyCounter
　　{
　　private int n1;
　　private int n2;
　　public MyCounter(int n1�Q�int n2)
　　{
　　this。n1=n1;
　　this。n2=n2;
　　}
　　
　　public void setN1(int n1)
　　{
　　return this.n1 = n1;
　　}
　　public void setN2(int n2)
　　{
　　return this.n2 = n2;
　　}
　　public int getN1()
　　{
　　return n1;
　　}
　　public int getN2()
　　{
　　return n2;
　　}
　　
　　public int getResult()
　　{
　　return n1 + n2;
　　}
　　}

　　我们可以看到�Q�这个类的主要目的是得到计算�l�果�Q�所以正��的接口应该�c�M��:
　　　　
　　public interface Counter
　　{
　　int getResult();
　　}
　　
　　但是很多情况下，�l�常是这��L��接口:
　　　　
　　public interface Counter
　　{
　　int getResult();
　　int getN1();
　　int getN2();
　　void setN1(int n1);
　　void setN2(int n2);
　　}
　　　　
　　我们想一惻I��q�样做有2个后�?
　　1. 除了getResult之外�Q�其他的函数我们�Ҏ��用不刎ͼ�所以是多余的�?br />　　2. 如果我们要自己实��C��个Counter�Q�如果接口中仅仅定义了getResult�Q�我们仅仅需要实现它��可以了。我们自��q��c�d��能是多个数运��，有乘除加减等�{�各�U�运��，参数也有可能是一些数�l�。但是如果按照第二种�Ҏ��声明接口的话�Q�我们就必须实现后面的四个方法，如果�q�样的话�Q�实现这样东西不仅没用，而且��费旉��。我们恐怕要大声骂娘了吧�?br />　　
　　所以，接口有好的作用，但是不要滥用�?br />　　�?如果你的接口永远只有一个类实现�Q�那么可能就没有必要用接口�?br />　　�?你的接口只需要声明别人用到的函数卛_��?/p>
　　【空接口的��用�?/strong>

　　在接口��用的时候，�I�接口有2�U�情�?
　　1. �c�M��Cloneable�Q�Serializable�Q�他们往往是做一个标讎ͼ�表示需要某个功能。当然你也可以这么用�Q�来表示你的�c�d��有某个功能，实现了你的某个接口�?br />　　2. 你的接口�l�承了别的接�?非空)�Q�你的接口本�w�没有声明函数。这�U�情况一般是你不希望用户使用父接口来作�ؓ参数�c�d��Q�因��Z��们的用途可能不同，此时��可以用�I�接口来实现�?br />　　
　　�W�一�U�情冉|��们不再多��_��搜烦一下关于Cloneable�Q�Serializable的文章就会了解很多�?br />　　我们来看下面的代�?

　　public interface Text
　　{
　　String getText();
　　}
　　
　　public interface SqlText extends Text
　　{
　　}

　　可以看到�Q�Text接口是用于返回一个字�W�串。而SqlText是一个空接口�Q�它�l�承了Text接口。也��是说SqlText也是一�U�Text。但是我们可以知道，��M��一个字�W�串不一定是Sql字符�Ԍ��所以此时声明了一个SqlText接口来用于表名当前的字符串是一个Sql字符丌Ӏ�你的函数可以这样声�?

　　public void doQuery(SqlText aSqlText)

　　而不是这�?br />　　
　　public void doQuery(Text aText)

　　避免用户产生歧义的想法，一眼看去，��明白应该传入一个Sql字符丌Ӏ?br />　　
　　【��承层�ơ过多�?/strong>
　　一般来��_��l�承的层�ơ不要过多，否则使用者可能会讨厌�Q�找一个函��C��很麻烦。很多Java语言��查工具都��你的�l�承层次不要��过3层�?br />　　
　　【Has A �Q�Is A�Q�不要滥用��ѝ�?/strong>

　　"我是一个Mp3"�Q?我有一个Mp3"�Q�其实很�Ҏ��分��L。但是在实际应用中，往往存在�?我有一个Mp3"的情况当�?我是一个Mp3"�Q�或者是��Z��h��方便而放松了对自��q��要求�Q�甚臌��沾沾自喜�Q�感觉找��C��个捷径�?scud以前也干�q�这�U�事�?�?br />　　
　　以前我曾�l�这样干�q?我的逻辑�cȝ��接��承了我的数据库访问类�Q�这��h��可以直接在逻辑�c�里面访�?
　　
　　public MyLogic extends MyDBA
　　
　　aLogic.getInt("click");
　　aLogic.getString("name");
　　
　　看�v来是非常方便�Q�但是你的逻辑�c�d��牢牢�l�在了DBA上，是一�U�非�怸�好的做法。现在我�q�样声明:

　　public MyLogic
　　
　　MyDBA adba;
　　
　　adba.getInt("click");
　　adba.getString("name");

　　其实代码改动不大�Q�但是你的逻辑�c�M��在牢牢绑在DBA�w�上了，何乐而不为�?br />　　
　　其实�q�种现象在开发�h员中间可能经常见刎ͼ�我们要尽量避免。下面再来看一个例�?
　　
　　//一个保存分��信息的�c?br />　　
　　public class PageInfo
　　{
　　private int page;
　　private int pageCount;
　　private int recPerPage;
　　private int recCount;
　　
　　//get�Q�set method list...
　　}

　　一般的情况是，在Dao中进行分��|��询，计算总记录，总页数等�{�，所以需要把PageInfo传给Dao。而在逻辑�c�M��Q�把传回来的分页信息数据推到FormBean或者是Action中�?br />　　也许你会�q�么惻I��如果我的Action或者FormBean�l�承了PageInfo�Q�岂不是要省很多事�?br />　　
　　千万别这么干。�ƈ不是所有的动作都需要分��信息，你的FormBean和PageInfo没有�l�承的关�p�R��也��是说FormBean Has A PageInfo�Q�但是不是Is A PageInfo�?br />　　
　　【保持外�?行�ؓ一致�?/strong>

　　外观一致其实很�Ҏ��理解�Q�例如你用size()表示得到一个List的大��，那么在所有的List�c�M��你都用size()得到它的大小�Q�这��是外观一致�?br />　　外观一致让用户更方便��用你的函数库�Q�不用记住几个不同的表示同一个功能的函数名字。或者几个名字相同功能却不同的函数。那��很�p�糕了�?br />　　
　　行�ؓ一致相对外观一致就相对比较隑ց�刎ͼ�但是优秀的设计师肯定会让他的成果行�ؓ一��_��而不是出人意料的行�ؓ�Q�也不是一套强行规定的行�ؓ�?br />　　
　　我们来看下面的代�?
　　
　　import java.util.HashMap;
　　import java.util.Map;

　　class UserInfo
　　{
　　private String realname;
　　
　　public UserInfo(String sName)
　　{
　　this.realname = sName;
　　}
　　
　　public void setName(String sName)
　　{
　　this.realname = sName;
　　}
　　public String getName()
　　{
　　return this.realname;
　　}
　　}
　　
　　public class MyTest
　　{
　　
　　Map userInfoMap = new HashMap();
　　
　　public void setUserInfo(String sName,UserInfo aInfo)
　　{
　　userInfoMap.put(sName,aInfo);
　　
　　userInfoMap.put(aInfo.getName(),aInfo);
　　}
　　
　　public UserInfo getUserInfo(String sName)
　　{
　　return (UserInfo)userInfoMap.get(sName);
　　}
　　
　　public static void main(String args[])
　　{
　　MyTest aTest = new MyTest();
　　
　　UserInfo aUserInfo = new UserInfo("王小�?);
　　
　　aTest.setUserInfo("儿童团团�?,aUserInfo);
　　aTest.setUserInfo("三班班长",aUserInfo);
　　
　　UserInfo 儿童团团�?= aTest.getUserInfo("儿童团团�?);
　　
　　if(null!=儿童团团�?
　　{
　　System.out.println(儿童团团�?getName());
　　}
　　else
　　{
　　System.out.println("儿童团团�?Not Found");
　　}
　　
　　UserInfo 王小�?= aTest.getUserInfo("王小�?);
　　
　　if(null!=王小�?
　　{
　　System.out.println(王小�?getName());
　　}
　　else
　　{
　　System.out.println("王小�?Not Found");
　　}
　　
　　}
　　}
　　可以看到�Q�上面的代码�q�行�l�果�?王小�?�Q�也��是说儿童团团长是王��二�Q�王��二本��n也是王小二，�q�一切正常�?br />　　
　　现在我们把setUserInfo里面的第一句注释掉:
　　
　　public void setUserInfo(String sName,UserInfo aInfo)
　　{
　　//userInfoMap.put(sName,aInfo);
　　
　　userInfoMap.put(aInfo.getName(),aInfo);
　　}

　　再次�q�行上面的代码，我们发现儿童团团长不存在了，但是王小二还在。还可以看出�Q�如果找"三班班长"的话�Q�肯定也找不刎ͼ�也就是说只有依据王小二的真名才能扑ֈ�王小二，其他�Ҏ��׃��行了�?br />　　
　　从上面的setUserInfo和getUserInfo分析�Q�如果采用修改后的代码，我们的程序就出现了行��C��一��_��而这是��o��惑不解的�Q�我们set了半天，却找不到�Q�岂不是令�h恼火!
　　
　　当然上面的代码比较简单，通过��单的修改��p��做到行�ؓ一��_��但在实际�~�程中，往往因�ؓ复杂的行为操作，�l�常会造成行�ؓ不一��_��从而给开发�h员带来困惑�?/p>
　　【MVC�Q�MVC2�Q�WEB设计�~�程的分层�?/strong>

　　请阅��L��?http://forum.javaeye.com/viewtopic.php?t=11712&postdays=0&postorder=asc&start=0

　　【可扩展不等于功能强大，不要夸大其辞�?/strong>

　　现在的系�l�，因�ؓ接口或者其他方法的使用�Q�都��h��很大的扩展性。但是扩展性不�{�于功能强大�?br />　　存在一个接口，用户可以实现自己的接口，��实非常方便。但是如果你的系�l�本�w�只实现了一个接口或者根本没有实玎ͼ�那么对用��h��说就谈不上方�ѝ�?br />　　
　　例如WebWork的validators�Q�本�w�是一个接口，但是实际上本�w�实现的具体�c�d��，而且功能很差�Q�这个时候如果你说WebWork的校验器很厉宻I��那么��可能不太恰当了。当然扩展Webwork的Validator�q�是非常方便的�?br />　　
　　当然�Q�可扩展性还是需要的�Q�但是不要吹嘘，在这个��Q�w�的�q�代�Q�让我们多干点实事�?:)

　　�?0/80原则�?/strong>
　　
　　在工作中�Q�我�l�常惛_��20/80原则�Q�也��是"巴雷多原�?。例如我们可以看�?

　　旉��Q�我�?0%的时间会产生成果�?0%
　　
　　产品�Q��品的20%带来利润�?0%
　　
　　阅读�Q?0%的书��幅包括了内容的80%
　　
　　工作�Q?0%的工作给我们80%的满�?br />　　
　　演讲�Q?0%的演讲��生媄响的80%
　　
　　领导�Q?0%的�h作出80%的决�?/p>
　　从上面可以看出，很多时候它都很有说服力�?br />　　在这里我��x��到几点，但是和上面的可能出发�Ҏ��所不同:
　　
　　1、程序的80%都是在处理特�D�情况，所以我们一定要对特�D�情况重视，不要因�ؓ是特�D�情况，��׃��很重视�?0%的客户对�Ҏ��情况都很重视�?br />　　文��对特�D�情况也要详�l�描�q�ͼ�因�ؓ开发�h�?0%的时候在查找�q�些东西�Q�而对那些�l�常用到的用法却很少查阅文��?br />　　
　　2、优化问�?80%的瓶颈都出在20%的代码上�Q�所以在优化代码的时候不需要优化所有代码，只需要优�?0%的关键代码就够了。当然追求完��的人我们就不多说了�?
　　记得有一条优化的原则�?不要优化!不要优化"�Q�是非常有道理的�?br />　　
　　3、如果你20%的事情做�怺��Q�往往会导�?0%的事情都�怺��Q�或者是��D��别�h认�ؓ你把事情几乎都做�怺��?br />　　如果你对一些事情发表了一些很不严谨的看法�Q�那么别��Z��认�ؓ你在别的事情上也很不严�}�?br />　　依此�c�L��Q�代码质量，文��完整性等�{�，都会让�h产生�c�M��的推理�?br />　　
　　(当然一个代码写的很��q��人，往往文档也很乱�?
　　
　　【强制绑定是不受�Ƣ迎的�?/strong>

　　不要在程序中强制�l�定一些额外的功能�?br />　　
　　有的框架往往功能很多�Q�是"大型计算�?�Q�有很多功能�Q�但是在我需要打字的时候，�l�我打字的功能即可，不要强制我��用网�l�功能，打印功能�Q�负载均衡功能等�{��?br />　　
　　一般来��_��如果一个东西有很多功能�Q�那么做好做成可配置�Q�可插拔的，�q�样用户使用你的东西�Q�没必要在不使用高��功能的时候，��费用户的内存，��盘。开发�h员还得多copy好多lib文�g�Q�占用调试时��_��岂不是很�ȝ��?br />　　
　　不要��C��送一�Q�我不想要就别给我�?:)

　　【有时候也得考虑兼容性�?/strong>

　　一般来��_��一个公司的客户会有很多�Q�用��L��q�行环境是各�U�各��L��。jdk1.3�Q�jdk1.4甚至�q�有jdk1.2。这��h��们在�~�程的时候就必须做一些妥协，有些函数库就不能使用�?br />　　如果�q�些用户的jdk不能升��(一般来说都需要购买新的��品才能升�U?�Q�或者我们必��d��q�些情况妥协�Q�那么我们就要在开发中考虑�q�些问题�?br />　　
　　例如以前�Q�在Servlet 2.2的时候，因�ؓ没有setCharacterEncoding�Q�我们必��L��动对各种字符�q�行转换。当Servlet2.3的时候，可以使用�q�个函数了。但是�ؓ了客戯��虑�Q�我们只好没有升�U�还是��用原来的�Ҏ��?当然后来大多数用户都使用了新的App Server�Q�我们就可以使用filter来处理编码问题了)�?br />　　
　　向下兼容性确实让人头��|��JDK1.5也发布好久了�Q�不�q�我们现在也不能使用�Q�只能自己没事测试测试�?br />　　
　　在编�E�的时候，一定要讄��好IDE的兼�Ҏ��设�|�，防止我们使用了不能��用的�Ҏ��。Jbuilder�Q�Eclipse都有�c�M��的设�|��?br />　　
　　【成本与现实�Q�给用户以选择余地�?/strong>

　　全文��索，lucene�Q�like是三�U�对大文本字�D�|��索的�Ҏ��。那么你采用哪一�U�呢?
　　
　　也许你会毫不犹��U的说"全文��? (我看你像TRS公司的托 :P)�?br />　　
　　正如"强制�l�定是不受欢�q�的"里面所说的一��P��我还是觉得应该给用户以选择的余地�?br />　　
　　全文��索是要花��q��或者需要配�|�，而且一般来说数据库专用的全文检索都是不通用的，lucene是需要开发�h员开发的�Q�只有like最��单了�Q�但是太��单了�Q�而且性能也差�?br />　　
　　�q�个时候，也许我们��应该提供几�U�方式供用户选择了，用户如何选择那就看他们了。。�?br />　　
　　【结束语�?/strong>

　　实际开发设计中肯定�q�存在很多其他的问题�Q�本文不可能一一��。到此�ؓ止�?:)
　　
　　希望各位在开发设计中成�ؓ高水�q�的设计师�?:)

Shooper.Java 2006-05-09 23:57 发表评论

Shooper.Java — Tue, 09 May 2006 15:23:00 GMT

作者：happy_forever 来自�Q?/font> http://www.javafan.net

以下文章都是�l�典�Q�看不看随你的便�Q�我只希望知识掌握在更多中国人的手里�Q?/font>

中国有很多小朋友�Q�他�?8,9岁或21,2岁，通过自学也写了不��代码，他们有的代码写的很漂亮，一些技术细节相当出众，也很有钻研精��，但是他们被一些错误的认识和观点左叻I��~�Z��对系�l�，对程序的整体理解能力�Q�这些�h�Q�一个网上的朋友说得很好�Q�他们实际上只是一些Coding fans�Q�压�Ҏ��有资格称为程序员�Q�但是据我所知，不少��网�l�公司的CTO��是�q�样的coding fans,拿着吓�h的工资，做着吓�h的项目，��目的结局通常也很吓�h�?

�E�序员基本素质：

作一个真正合格的�E�序员，或者说��是可以真正合格完成一些代码工作的�E�序员，应该��h��的素质�?

1�Q�团队精��和协作能力
把它作�ؓ基本素质�Q��ƈ不是不重要，恰恰相反�Q�这是程序员应该具备的最基本的，也是最重要的安�w�立命之本。把高水�q�程序员说成独行侠的都是在呓语，��M��个�h的力量都是有限的�Q�即便如linus�q�样的天才，也需要通过�l�成强大的团队来创造奇�q�，那些遍布全球的�ؓlinux写核心的高手们，没有协作�_��是不可想象的。独行侠可以作一些赚��q��Y件发点小财，但是一旦进入一些大�pȝ��的研发团队，�q�入商业化和产品化的开发�Q务，�~�Z��q�种素质的�h��完全不合格了�?

2�Q�文档习�?
说高水��^�E�序员从来不写文��的肯定是��^臭未�q�的毛孩子，良好的文��是正规研发��程中非帔R��要的环节�Q�作��Z��码程序员�Q?0�Q�的工作旉��写技术文��是很正常的�Q�而作为高�U�程序员和系�l�分析员�Q�这个比例还要高很多。缺乏文档，一个��Y件系�l�就�~�Z��生命力，在未来的查错�Q�升�U�以及模块的复用时就都会遇到极大的麻烦�?

3�Q�规范化�Q�标准化的代码编写习�?/strong>
作�ؓ一些外国知名��Y件公司的规矩�Q�代码的变量命名�Q�代码内注释格式�Q�甚臛_��套中行羃�q�的长度和函数间的空行数字都有明��规定，良好的编写习惯，不但有助于代码的�U�L��和纠错，也有助于不同技术�h员之间的协作�?
有些coding fans叫嚣高水�q�程序员写的代码旁�h从来看不懂，�q�种叫嚣只能证明他们自己压根不配自称�E�序员。代码具有良好的可读性，是程序员基本的素质需求�?
再看看整个linux的搭建，没有规范化和标准化的代码习惯�Q�全球的研发协作是绝对不可想象的�?

4�Q�需求理解能�?/strong>
�E�序员需要理解一个模块的需求，很多��朋友写�E�序往往只关注一个功能需求，他们把性能指标全部归结到硬�Ӟ��操作�pȝ��和开发环境上�Q�而忽视了本��n代码的性能考虑�Q�有人曾�l�放�a�说写一个广告交换程序很��单，�q�种��Z��来不知道在百万甚臛_��万数量��的访问情况下的性能指标是如何实现的�Q�对于这��L��E�序员，你给他深蓝那套系�l�，他也做不出太极链的�ƈ访能力。性能需求指标中�Q�稳定性，�q�访支撑能力以及安全性都很重要，作�ؓ�E�序员需要评估该模块在系�l�运营中所处的环境�Q�将要受到的负荷压力以及各种潜在的危险和恶意��d��的可能性。就�q�一点，一个成熟的�E�序员至��需�?�?�q�的��目研发和跟�t�经验才有可能有心得�?

5�Q�复用性，模块化思维能力
�l�常可以听到一些程序员有这��L��抱怨，写了几年�E�序�Q�变成了熟练工，每天都是重复写一些没有�Q何新意的代码�Q�这其实是中国��Y件�h才最大浪费的地方�Q�一些重复性工作变成了熟练�E�序员的主要工作�Q�而这些，其实是完全可以避免的�?
复用性设计，模块化思维��是要程序员在完成�Q何一个功能模块或函数的时候，要多想一些，不要局限在完成当前��d��的简单思�\上，��x��看该模块是否可以��q��q�个�pȝ��存在�Q�是否可以通过��单的修改参数的方式在其他�pȝ��和应用环境下直接引用�Q�这样就能极大避免重复性的开发工作，如果一个��Y件研发单位和工作�l�能够在每一�ơ研发过�E�中都考虑到这些问题，那么�E�序员就不会在重复性的工作中耽误太多旉��Q�就会有更多旉��和精力投入到创新的代码工作中厅R�?
一些好的程序模块代码，即便�?0�q�代写成的，拿到现在攑ֈ�一些系�l�里面作为功能模块都能适合的很好，而现在我看到的是�Q�很多小公司软�g一升��或改�q�就动辄全部代码重写�Q�大部分重复性工作无谓的��费了时间和�_�֊��?

6�Q�测试习�?
作�ؓ一些商业化正规化的开发而言�Q�专职的��试工程师是不可��的�Q�但是�ƈ不是说有了专职的��试工程师程序员��可以不�q�行自测�Q��Y件研发作��Z��工�E�而言�Q�一个很重要的特点就是问题发现的��早�Q�解决的代�h��p��低，�E�序员在每段代码�Q�每个子模块完成后进行认真的��试�Q�就可以��量��一些潜在的问题最早的发现和解冻I��q�样�Ҏ��体系�l�徏讄��效率和可靠性就有了最大的保证�?
��试工作实际上需要考虑两方面，一斚w��是正常调用的��试�Q�也��是看程序是否能在正常调用下完成基本功能�Q�这是最基本的测试职责，可惜在很多公司这成了唯一的测试�Q务，实际上还差的�q�那�Q�第二方面就是异常调用的��试�Q�比如高压力负荷下的�E�_��性测试，用户潜在的异常输入情况下的测试，整体�pȝ��局部故障情况下该模块受影响状况的测试，频发的异常请求阻塞资源时的模块稳定测试等�{�。当然�ƈ不是�E�序员要对自��q��每段代码都需要进行这�U�完整测试，但是�E�序员必��L��醒认识自��q��代码��d��在整体项目中的地位和各种性能需求，有针�Ҏ��的�q�行相关��试�q�尽早发现和解决问题�Q�当然这需要上面提到的需求理解能力�?

7�Q�学习和�ȝ��的能�?/strong>
�E�序员是人才很容易被淘汰�Q�很�Ҏ��落伍的职业，因�ؓ一�U�技术可能仅仅在三两�q�内��h��领先性，�E�序员如果想安��n立命�Q�就必须不断跟进新的技术，学习新的技能�?
善于学习�Q�对于�Q何职业而言�Q�都是前�q�所必需的动力，对于�E�序员，�q�种要求��更加高了。但是学习也要找对目标，一些小coding fans们，他们也��|�z�乐道于他们的学习能力，一会学会了asp�Q�一会儿学会了php�Q�一会儿学会了jsp�Q�他们把�q�个作�ؓ炫耀的资本，盲目的追逐一些肤��的�Q�表面的东西和名词，做网�l�程序不懂通讯传输协议�Q�做应用�E�序不懂中断向量处理�Q�这��L��技术�h员，不管掌握了多��所谓的新语�a��Q�永�q�不会有质的提高�?
善于�ȝ��Q�也是学习能力的一�U�体玎ͼ�每次完成一个研发�Q务，完成一�D�代码，都应当有目的的跟�t�该�E�序的应用状况和用户反馈�Q�随时�ȝ��Q�找到自��q��不��Q�这样逐步提高�Q�一个程序员才可能成长�v来�?
一个不具备成长性的�E�序员，即便眼前看是个高手，��也不要选用�Q�因��Z��落伍的时候马上就��C��?
具备以上全部素质的�h�Q�应当说是够格的�E�序员了�Q�请注意以上的各�U�素质都不是由IQ军_��的，也不是大学某些课本里可以学习到的�Q�需要的仅仅是程序员对自己工作的认识�Q�是一�U�意识上的问题�?

那么作�ؓ高��E�序员，以至于系�l�分析员�Q�也��是对于一个程序项目的设计者而言�Q�除了应该具备上�q�全部素质之外，�q�需要具备以下素质：

�W�一�Q�需求分析能�?/strong>
对于�E�序员而言�Q�理解需求就可以完成合格的代码，但是对于研发��目的组�l�和��理者，他们不但要理解客户需求，更多时候还要自行制定一些需求，��Z��么这么说呢？
一般而言�Q�进行研发�Q务，也许是客��h��出需求，也许是市场和营销部门提出的需求，�q�时候对于研发部门，他们看到的不是一个完整的需求，通常而言�Q�该需求仅仅是一些功能上的要求，或者更正规些，可能获得一个完整的用户视图�Q�但是这都不够，因�ؓ客户�׃��非技术因素多一些，他们可能很难提出完整和清晎ͼ�或者说专业性的性能需求，但是对于��目�l�织者和规划者，他必��能够清醒认识到�q�些需求的存在�q�在完成需求分析报告的时候适当的提出，同时要完整和清晰的体现在设计说明书里面，以便于程序员�~�码时不会失去这些准则�?
�E�序设计者必��L��理解用户需求所处的环境�Q��ƈ针对性做出需求的分析�Q��D例而言�Q�同样一个��Y仉��过ASP�U�用方式发布和通过License方式发布�Q�性能需求可能就是有区别的，前者强调的是更好的支撑能力和稳定性，而后者则可能更强调在各种�q�_��下的普适性和安装使用的简��h��?

�W�二�Q�项目设计方法和��程处理能力
�E�序设计者必��能够掌握不��于两到三种的项目设计方法（比如自顶至下的设计方法，比如快速原型法�{�等�Q�，�q�能够根据项目需求和资源搭配来选择合适的设计�Ҏ��q�行��目的整体设计。设计方法上选择不当�Q�就会耽误研发周期�Q�浪费研发资源，甚至影响研发效果�?
一个程序设计者还需要把很多功夫用在��程囄��设计和处理上�Q�他需要做数据��图以确立数据词典；他需要加工逻辑��图以�Ş成整体的�pȝ��处理��程。一个流�E�有问题的系�l�，��q��代码多漂亮，每个模块多精��_��也不会成��Z��个好的系�l�。当�Ӟ��做好��程分析�q��择好项目设计方法，都需要在需求分析能力上��h��_��的把握�?

�W�三�Q�复用设计和模块化分解能�?/strong>
�q�个��g��又是老调重谈�Q�前面基本素质上不是已经说明了这个问题吗�Q?
作�ؓ一个从事模块�Q务的�E�序员，他需要对他所面对的特定功能模块的复用性进行考虑�Q�而作��Z��个系�l�分析�h员，他要面对的问题复杂的多，需要对整体�pȝ��按照一�U�模块化的分析能力分解�ؓ很多可复用的功能模块和函敎ͼ��q��Ҏ��一模块形成一个独立的设计需求。�D个例子，好比是汽车生产，最早每辆汽车都是独立安装的�Q�每个部仉��是量�w�定做的�Q�但是后来不一样了�Q�机器化大生产了�Q�一个汽车厂开始通过��水�U�来生��汽�R�Q�独立部件开始具有一定的复用性，在后来标准化成�ؓ大趋势，不同型号�Q�品牌甚至不同厂商的汽�R部�g也可以进行方便的换装和升�U�，�q�时候，汽�R生��的效率达到最大化。��Y件工�E�也是同��L��道理�Q�一个成熟的软�g行业�Q�在一些相关项目和�pȝ��中，不同的部件是可以随意换装的，比如微��Y的许多桌面��Y�Ӟ��在很多操作模块（如打开文�g�Q�保存文件等�{�）都是复用的同一套功能模块，而这些接口又通过一些类库提供给了桌面应用程序开发者方便挂接，�q�就是复用化的模块设计明昄��一个佐证�?
��一个大型的�Q�错�l�复杂的应用�pȝ��分解成一些相对独立的�Q�具有高度复用性的�Q��ƈ能仅仅依靠几个参数完成数据联�pȝ��模块�l�合�Q�是作�ؓ高��E�序员和�pȝ��分析员一��Ҏ��重要的工作，合适的��目设计�Ҏ��Q�清晰的��程图，是实现这一目标的重要保证�?

�W�四�Q�整体项目评估能�?/strong>
作�ؓ�pȝ��设计人员�Q�必��能够从全局出发�Q�对��目又整体的清醒认识�Q�比如公司的资源配置是否合理和到位，比如工程�q�度安排是否能最大化体现效率又不至于无法按期完成。评估项目整体和各个模块的工作量�Q�评估项目所需的资源，评估��目可能遇到的困难，都需要大量的�l�验�U�篏�Q�换�a�之，�q�是一�U�不断�ȝ��的篏计才能达到的境界。在西方一些��Y件系�l�设计的带头人都是很�q�长的，比如4�Q?0岁，甚至更老，他们在编码方面已�l�远�q�不如年��M�h那样�zȝ��Q�但是就��目评估而言�Q�他们几十年的经验积累就是最重要和宝�늚�财富。中国缺�q�么一代程序员�Q�主要还不是�~��U�年�U�的�E�序员，而是那种�q�纪的程序员基本上都是研�I�单位作出来的，都不是从专业的��品化软�g研发作出来的�Q�他们没有能�U�篏那种产品化研发的�l�验�Q�这也是没有办法的事情�?

�W�五�Q�团队组�l�管理能�?/strong>
完成一个项目工�E�，需要团队的齐心协力�Q�作为项目设计者或研发的主��h�Q�就应当有能力最大化发挥团队的整体力量，技术管理由于其专业性质�Q�不大同于一般的��Z��理�Q�因��里面设计了一些技术性的指标和因素�?
首先是工作的量化�Q�没有量化就很难做到合适的�l�效考核�Q�而程序量化又不是��单的代码行数可以计算的，因此要求技术管理�h员需要能真正评估一个模块的复杂性和工作量�?
其次是对团队协作模式的调��_��一般而言�Q�程序开发的协作通常分�ؓ��组�q�行�Q�小�l�有�ȝ��序员方式的，也有民主方式的，�Ҏ��E�序员之间的能力水��^差距�Q�以及根据项目研发的需求，选择合适的�l�队方式�Q��ƈ能将责权和成员的工作��d��紧密�l�合�Q�这��h��能最大发挥组队的效率�?
一个代码水�q�高的�h�Q�未必能成�ؓ一个合格的��目研发�ȝ��Q�这斚w��的能力欠�~�往往是容易被忽视的�?

�l�g��可以看到�Q�作��Z��个主��研发的负责人，一个项目设计者，所需要具备的素质和能力�ƈ不是�E�序代码�~�写的能力，当然一般情况下�Q�一个程序员通过不断的�ȝ��提高辑ֈ�了这�U�素质的时候，他所��h��的代码编写能力也已经相当不简单了�Q�但是请注意�q�里面的因果关系�Q�一个高水��^的项目设计者通常已经是代码编写相当优�U�的�h了，但是�q�不是一个代码相当优�U�的程序员��可以胜任项目设计的工作�Q�这里面存在的也不是智商和课本的问题�Q�还是在于一个程序员在积累经验，逐步提升的时候没有意识到应当思考哪斚w��的东西，没有有意识的��项目的�l�织和复用设计进行揣摩，没有�l�常性的文��习惯和�ȝ��习惯�Q�不改变�q�些�Q�我们的合格的项目设计者还是非常欠�~��?

另外�Q��ؓ防止有无聊的人和我较真，补充一点，本文针对目标是作商业化的软�g��目和工�E�，那些�U�研机构的编�E�高手，比如��法高手�Q�比如图象处理高手，他们的工作是研究��N��而非直接完成商业软�g�Q�当然最�l�间接成为商业��品，比如微��Y研究院在作的研究��N��Q�，因此他们��的素质可能是另外的东西，�q�些人（专家�Q�，�q�不能说是程序员�Q�不能用�E�序员的标准去衡量�?

最后补充一点东西，一个��Y仉��目研发的设计��程是怎样的呢�Q�以通常标准的设计方法�ؓ例，�Q�不�q�笔者喜�Ƣ快速原型法�Q��?

�W�一个步骤是市场调研�Q�技术和市场要结合才能体现最大�h倹{�?

�W�二个步骤是需求分�?/strong>�Q�这个阶�D�需要出三样东西�Q�用戯��图，数据词典和用��h��作手册。用戯��图是该��Y件用��P��包括�l�端用户和管理用��P��所能看到的��面样式�Q�这里面包含了很多操作方面的��程和条件。数据词典是指明数据逻辑关系�q�加以整理的东东�Q�完成了数据词典�Q�数据库的设计就完成了一半多。用��h��作手册是指明了操作流�E�的说明书。请注意�Q�用��h��作流�E�和用户视图是由需求决定的�Q�因此应该在软�g设计之前完成�Q�完成这些，��׃ؓ�E�序研发提供了约束和准��Q�很遗憾太多公司都不是这样做的，因果颠倒，��序不分�Q�开发工作和实际需求往往因此产生隔阂��p��的现象�?
需求分析，除了以上工作�Q�笔者以��Z��为项目设计者应当完整的做出��目的性能需求说明书�Q�因为往往性能需求只有懂技术的人才可能理解�Q�这��需要技术专家和需求方�Q�客��h��公司市场部门�Q�能够有真正的沟通和了解�?

�W�三个步骤是概要设计�Q�将�pȝ��功能模块初步划分�Q��ƈ�l�出合理的研发流�E�和资源要求。作为快速原型设计方法，完成概要设计��可以进入编码阶�D�了�Q�通常采用�q�种�Ҏ��是因为涉及的研发��d��属于新领域，技术主��h员一上来无法�l�出明确的详�l�设计说明书�Q�但是�ƈ不是说详�l�设计说明书不重要，事实上快速原型法在完成原型代码后�Q�根据评��结果和�l�验教训的�ȝ��Q�还要重新进行详�l�设计的步骤�?

�W�四个步骤是详细设计�Q�这是考验技术专家设计思维的重要关卡，详细设计说明书应当把具体的模块以最‘干净’的方式(黑箱�l�构�Q�提供给�~�码者，使得�pȝ��整体模块化达到最大；一份好的详�l�设计说明书�Q�可以�ɾ~�码的复杂性减低到最低，实际上，严格的讲详细设计说明书应当把每个函数的每个参数的定义都精�_��l�的提供出来�Q�从需求分析到概要设计到完成详�l�设计说明书�Q�一个��Y仉��目就应当说完成了一半了。换�a�之，一个大型��Y件系�l�在完成了一半的时候，其实�q�没有开始一行代码工作。那些把作��Y件的�E�序员简单理解�ؓ写代码的�Q�就从根子上犯了错误了�?

�W�五个步骤是�~�码�Q�在规范化的研发��程中，�~�码工作在整个项目流�E�里最多不会超�q?/2�Q�通常�?/3的时��_��所谓磨刀不误砍柴功，设计�q�程完成的好�Q�编码效率就会极大提高，�~�码时不同模块之间的�q�度协调和协作是最需要小心的�Q�也�怸�个小模块的问题就可能影响了整体进度，让很多程序员因此被迫停下工作�{�待�Q�这�U�问题在很多研发�q�程中都出现�q�。编码时的相互沟通和应急的解决手段都是相当重要的，对于�E�序员而言�Q�bug永远存在�Q�你必须永远面对�q�个问题�Q�大名鼎鼎的微��Y�Q�可曾有�q�箋三个月不发补丁的时候吗�Q�从来没有！

�W�六个步骤是��试�Q�测试有很多�U�：按照��试执行方，可以分�ؓ内部��试和外部测试；按照��试范围�Q�可以分为模块测试和整体联调�Q�按照测试条�Ӟ��可以分�ؓ正常操作情况��试和异常情冉|��试；按照��试的输入范��_��可以分�ؓ全覆盖测试和抽样��试。以上都很好理解�Q�不再解释�?
��M��Q�测试同��h��目研发中一个相当重要的步骤�Q�对于一个大型��Y�Ӟ��3个月�?�q�的外部��试都是正常的，因�ؓ永远都会又不可预料的问题存在�?
完成��试后，完成验收�q�完成最后的一些帮助文��，整体��目才算告一�D�落�Q�当然日后少不了升��Q�修补等�{�工作，只要不是想通过一锤子买卖骗钱�Q�就要不停的跟踪软�g的运营状况�ƈ持箋修补升��Q�知道这个��Y件被��d��淘汰为止�?

写这些步骤算不上卖弄什么，因�ؓ实话讲我手边是一本《��Y件工�E�》，在大学里�q�是计算��Z��业的必修评��Q�但是我知道很多�E�序员似乎从来都只是热衷于什么�?0天精通VC》之�cȝ��Q�他们有些和我一��h��击队��n�Q�没有正规学�q�这个专业，�q�有一些则早就在�؜够学分后��把�q�些真正有用的东西还�l�了老师�?

�|�上现在也很��躁�Q�一些coding fans乱嚷��P��h��视听�Q�实际上真正的技术专家很��在�|�上乱发帖子的，如笔者这样不知天高地厚的�Q�其实实在是��不上什么高手，只不�q�看不惯�q�种�Ҏ��术，对程序员的误解和胡说�Q�只好挺�w�而出�Q�做拨�ؕ反正之言�Q�也希望那些�q�沉�q�于一些错误�h士的coding fans们能认真��x��Q�走到正途上�Q�毕竟那些聪明的头脑�q�远�q�没有发挥应有的价倹{�?/font>

Shooper.Java 2006-05-09 23:23 发表评论

2D	4E	87	65	31	00	32	00	33	00	00	00	�?�?x86 CPU 中，低字节在�?/font>

�?/td>		�?/td>		1		2		3		\0

	概念描述	举例
字符	��Z��使用的记��P��抽象意义上的一个符受��?/td>	'1', '�?, 'a', '$', '�K?, …�?/td>
字节	计算��Z��存储数据的单元，一�?位的二进制数�Q�是一个很具体的存储空间�?/td>	0x01, 0x45, 0xFA, …�?/td>
ANSI 字符�?/td>	在内存中�Q�如果“字�W�”是�?ANSI �~�码形式存在的，一个字�W�可能��用一个字节或多个字节来表�C�，那么我们�U�这�U�字�W�串�?ANSI 字符�?/b>或�?b>多字节字�W�串�?/td>	"中文123" �Q�占7字节�Q?/font>
UNICODE 字符�?/td>	在内存中�Q�如果“字�W�”是以在 UNICODE 中的序号存在的，那么我们�U�这�U�字�W�串�?UNICODE 字符�?/b>或�?b>宽字节字�W�串�?/td>	L"中文123" �Q�占10字节�Q?/font>

分类	�~�码标准	说明
单字节字�W�编�?/td>	ISO-8859-1	最��单的�~�码规则�Q�每一个字节直接作��Z��?UNICODE 字符。比如，[0xD6, 0xD0] �q�两个字节，通过 iso-8859-1 转化为字�W�串�Ӟ��直接得�?[0x00D6, 0x00D0] 两个 UNICODE 字符�Q�即 "?D"�?br /> 反之�Q�将 UNICODE 字符串通过 iso-8859-1 转化为字节串�Ӟ��只能正常转化 0~255 范围的字�W��?/td>
ANSI �~�码	GB2312, BIG5, Shift_JIS, ISO-8859-2 …�?/td>	�?UNICODE 字符串通过 ANSI �~�码转化为“字节串”时�Q�根据各自编码的规定�Q�一�?UNICODE 字符可能转化成一个字节或多个字节�?br /> 反之�Q�将字节串�{化成字符串时�Q�也可能多个字节转化成一个字�W�。比如，[0xD6, 0xD0] �q�两个字节，通过 GB2312 转化为字�W�串�Ӟ��得�?[0x4E2D] 一个字�W�，�?'�? 字�?br /> “ANSI �~�码”的特点�Q?br />1. �q�些“ANSI �~�码标准”都只能处理各自语言范围之内�?UNICODE 字符�?br />2. “UNICODE 字符”与“�{换出来的字节”之间的关系是�h��定的�?/td>
UNICODE �~�码	UTF-8, UTF-16, UnicodeBig …�?/td>	与“ANSI �~�码”类似的�Q�把字符串通过 UNICODE �~�码转化成“字节串”时�Q�一�?UNICODE 字符可能转化成一个字节或多个字节�?br /> 与“ANSI �~�码”不同的是： 1. �q�些“UNICODE �~�码”能够处理所有的 UNICODE 字符�?br />2. “UNICODE 字符”与“�{换出来的字节”之间是可以通过计算得到的�?/td>

�c�d��或操�?/b>	C++	Java
字符	wchar_t	char
字节	char	byte
ANSI 字符�?/td>	char[]	byte[]
UNICODE 字符�?/td>	wchar_t[]	String
字节东y��字符�?/td>	mbstowcs(), MultiByteToWideChar()	string = new String(bytes, "encoding")
字符东y��字节�?/td>	wcstombs(), WideCharToMultiByte()	bytes = string.getBytes("encoding")

	对编码的误解
误解一	在将“字节串”�{化成“UNICODE 字符东y��时�Q�比如在��d��文本文�g�Ӟ��或者通过�\|�络传输文本�Ӟ��Ҏ��“字节串”简单地作�ؓ单字节字�W�串�Q�采用每“一个字节”就是“一个字�W�”的�Ҏ��q�行转化�?br /> 而实际上�Q�在非英文的环境中，应该��“字节串”作�?ANSI 字符�Ԍ��采用适当的编码来得到 UNICODE 字符�Ԍ��有可能“多个字节”才能得到“一个字�W�”�?br /> 通常�Q�一直在英文环境下做开发的�E�序员们�Q�容易有�q�种误解�?/td>
误解�?/td>	�?DOS�Q�Windows 98 �{�非 UNICODE 环境下，字符串都是以 ANSI �~�码的字节�Ş式存在的。这�U�以字节形式存在的字�W�串�Q�必��ȝ��道是哪种�~�码才能被正��地使用。这使我们�Ş成了一个惯性思维�Q�“字�W�串的编码”�?br /> �?UNICODE 被支持后�Q�Java 中的 String 是以字符的“序号”来存储的，不是以“某�U�编码的字节”来存储的，因此已经不存在“字�W�串的编码”这个概念了。只有在“字�W�串”与“字节串”�{化时�Q�或者，��一个“字节串”当成一�?ANSI 字符串时�Q�才有编码的概念�?br /> 不少的�h都有�q�个误解�?/td>

亚洲视频在线观看视频,国产日韩亚洲大尺度高清,亚洲国产高清视频在线观看

java中的易�؜问题攉���

字符�Q�字节和�~�码

字符�Q�字节和�~�码

引言

1. �~�码问题的由来，相关概念的理�?/h4>

1.1 字符与编码的发展

1.3 字符集与�~�码

2. 字符与编码在�E�序中的实现

3. 几种误解�Q�以及�ؕ码��生的原因和解军_���?/h4>

4. 几种错误理解的纠�?/h4>

�l�JAVA设计开发新手的一些徏议和意见

java中的易�؜问题攉��

3. 几种误解�Q�以及�ؕ码��生的原因和解军_��?/h4>