久久久精品国产亚洲成人满18免费网站,亚洲成a人片77777kkkk,亚洲精品又粗又大又爽A片

�l�我��d��的勇气！�Q�！

boddi — Wed, 15 Aug 2007 06:32:00 GMT

何去何从�Q�有点迷�?是沉寂在温柔之乡�q�是去迎接狂风暴雨！
看来自己�q�是没有自信�Q�bs..........myself

boddi 2007-08-15 14:32 发表评论

Java RMI Tutorial

boddi — Wed, 11 Oct 2006 01:51:00 GMT

�q�程�Ҏ(gu��)��调用入门指南�Q�Java RMI Tutorial�Q?/h4>

Java R MI Tutorial

�q�程�Ҏ(gu��)��调用入门指南

Stephen Suen

Java �q�程�Ҏ(gu��)��调用�Q�Remote Method Invocation, RMI�Q��得运行在一�?Java 虚拟机（Java Virtual Machine, JVM�Q�的对象可以调用�q�行另一�?JVM 之上的其他对象的�Ҏ(gu��)��Q�从而提供了�E�序间进行远�E�通讯的途径。RMI �?J2EE 的很多分布式技术的基础�Q�比�?RMI-IIOP 乃至 EJB。本文是 RMI 的一个入门指南，目的在于帮助读者快速徏立对 Java RMI 的一个感性认识，以便�q�行更深层次的学�?f��n)。事实上�Q�如果你了解 RMI 的目的在于更好的理解和学�?EJB�Q�那么本文就再合适不�q�了。通过本文所了解�?RMI 的知识和技巧，应该��_��服务于这个目的了�?

本文的最新版本将发布�?a >�E�序员咖啡馆�|�站上（��中）。欢�q�订阅我们的邮�g�l?/font>�Q�以获得关于本文的正式发布及更新信息�?/p>

目录
1. ��?/font>
2. 分布式对�?/font>
3. RMI 架构
4. RMI 对象服务
5. 实战 RMI
6. 定义�q�程接口
7. 实现�q�程接口
8. 引导�E�序
9. 客户端程�?/font>
10. �~�译�C�Z��E�序
11. �q�行�C�Z��E�序
12. 其它信息
13. 参考资�?/font>

1. ��?/font>

我们知道�q�程�q�程调用�Q�Remote Procedure Call, RPC�Q�可以用于一个进�E�调用另一个进�E�（很可能在另一个远�E�主��Z��Q�中�?span>�q�程�Q�从而提供了�q�程的分布能力。Java �?RMI 则在 RPC 的基��上向前又�q�进了一步，��x��供分布式对象间的通讯�Q�允许我们获得在�q�程�q�程中的对象�Q�称��E�对象）的引用（�U�Cؓ�q�程引用�Q�，�q�而通过引用调用�q�程对象的方法，��好像该对象是与你的客户端代码同栯��行在本地�q�程中一栗��RMI 使用了术�?�Ҏ(gu��)��"�Q�Method�Q�强调了�q�种�q�步�Q�即在分布式基础上，充分支持面向对象的特性�?/p>

RMI �q�不�?Java 中支持远�E�方法调用的唯一选择。在 RMI 基础上发展而来�?RMI-IIOP�Q�Java Remote Method Invocation over the Internet Inter-ORB Protocol�Q�，不但�l�承�?RMI 的大部分优点�Q��ƈ且可以兼容于 CORBA。J2EE �?EJB 都要求��?RMI-IIOP 而不�?RMI。尽��如此，理解 RMI ��大大有助于 RMI-IIOP 的理解。所以，即便你的兴趣�?RMI-IIOP 或�?EJB�Q�相信本文也会对你很有帮助。另外，如果你现在就�?API 感兴��，那么可以告诉你，RMI 使用 java.rmi 包，�?RMI-IIOP 则既使用 java.rmi 也��用扩展的 javax.rmi 包�?/p>

本文的随后内容将仅针�?Java RMI�?/p>

2. 分布式对�?/font>

在学�?RMI 之前�Q�我们需要了解一些基��知识。首先需要了解所谓的分布式对象（Distributed Object�Q�。分布式对象是指一个对象可以被�q�程�pȝ��所调用。对�?Java 而言�Q�即对象不仅可以被同一虚拟��Z��的其他客��L(f��ng)��序（Client�Q�调用，也可以被�q�行于其他虚拟机中的客户�E�序调用�Q�甚臛_��以通过�|�络被其他远�E�主��Z��上的客户�E�序调用�?/p>

下面的图�C��明了客户�E�序是如何调用分布式对象的：

从图上我们可以看刎ͼ�分布式对象被调用的过�E�是�q�样的：

客户�E�序调用一个被�U�Cؓ Stub �Q�有时译作存根，��Z��不��生歧义，本文��用其英文形式�Q�的客户端代理对象。该代理对象负责对客��L(f��ng)��隐藏�|�络通讯的细节。Stub 知道如何通过�|�络套接字（Socket�Q�发送调用，包括如何��调用参数�{换�ؓ适当的�Ş式以便传输等�?/p>
Stub 通过�|�络��调用传递到服务器端�Q�也��是分布对象一端的一个被�U�Cؓ Skeleton 的代理对象。同��P��该代理对象负责对分布式对象隐藏网�l�通讯的细节。Skeleton 知道如何从网�l�套接字�Q�Socket�Q�中接受调用�Q�包括如何将调用参数从网�l�传输�Ş式�{换�ؓ Java 形式�{��?/p>
Skeleton ��调用传递给分布式对象。分布式对象执行相应的调用，之后��返回��g��递给 Skeleton�Q�进而传递到 Stub�Q�最�l�返回给客户�E�序�?/p>

�q�个场景��Z��一个基本的法则�Q�即行�ؓ的定义和行�ؓ的具体实现相分离。如图所�C�，客户端代理对�?Stub 和分布式对象都实��C��相同的接口，该接口称��E�接口（Remote Interface�Q�。正是该接口定义了行为，而分布式对象本��n则提供具体的实现。对�?Java RMI 而言�Q�我们用接口�Q?font color="red">interface�Q�定义行为，用类�Q?font color="red">class�Q�定义实现�?

3. RMI 架构

RMI 的底层架构由三层构成�Q?/p>

首先�?Stub/Skeleton 层。该层提供了客户�E�序和服务程序彼此交互的接口�?/p>
然后是远�E�引用（Remote Reference�Q�层。这一层相当于在其之上�?Stub/Skeleton 层和在其之下的传输协议层之前的中间�g�Q�负责处理远�E�对象引用的创徏和管理�?/p>
最后是传输协议�Q�Transport Protocol�Q?层。该层提供了数据协议�Q�用以通过�U��\传输客户�E�序和远�E�对象间的请求和应答�?/p>

�q�些层之间的交互可以参照下面的示意图�Q?/p>

和其它分布式对象机制一��P��Java RMI 的客��L(f��ng)��序��用客��L(f��ng)��?Stub 向远�E�对象请求方法调用；服务器对象则通过服务器端�?Skeleton 接受��h��。我们深入进去，来看看其中的一些细节�?/p>

注意: 事实上，�?Java 1.2 之后�Q�RMI 不再需�?Skeleton 对象�Q�而是通过 Java 的反��机�Ӟ��Reflection�Q�来完成�Ҏ(gu��)��务器端的�q�程对象的调用。�ؓ了便于说明问题，本文以下内容仍然��Z�� Skeleton 来讲解�?/p>

当客��L(f��ng)��序调�?Stub �Ӟ��Stub 负责��方法的参数转换为序列化�Q�Serialized�Q��Ş式，我们使用一个特�D�的术语�Q�即�~�列�Q�Marshal�Q�来指代�q�个�q�程。编列的目的是将�q�些参数转换为可�U�L��的�Ş式，从而可以通过�|�络传输到远�E�的服务对象一端。不�q�的是，�q�个�q�程没有惌��中那么简单。这里我们首先要理解一个经典的问题�Q�即�Ҏ(gu��)��调用�Ӟ��参数�I�竟是传��D��是传引用呢？对于 Java RMI 来说�Q�存在四�U�情况，我们��分别加以说明�?/p>

对于基本的原始类型（整型�Q�字�W�型�{�等�Q�，��被自动的序列化�Q�以传值的方式�~�列�?/p>

对于 Java 的对象，如果该对象是可序列化的（实现�?java.io.Serializable 接口�Q�，则通过 Java 序列化机制自动地加以序列化，以传值的方式�~�列。对象之中包含的原始�c�d��以及所有被该对象引用，且没有声明�ؓ transient 的对象也��自动的序列化。当�Ӟ��q�些被引用的对象也必��L��可序列化的�?/p>

�l�大多数内徏�?Java 对象都是可序列化的�?对于不可序列化的 Java 对象�Q?font color="red">java.io.File 最典型�Q�，或者对象中包含对不可序列化�Q�且没有声明�?transient 的其它对象的引用。则�~�列�q�程��向客户�E�序抛出异常�Q�而宣告失败�?/p>
客户�E�序可以调用�q�程对象�Q�没有理��q��止调用参数本�w�也是远�E�对象（实现�?java.rmi.Remote 接口的类的实例）。此�Ӟ��RMI 采用一�U?span>模拟�?/i>传引用方式（当然不是传统意义的传引用�Q�因为本地对内存的引用到了远�E�变得毫无意义）�Q�而不是将参数直接�~�列复制到远�E�。这�U�情况下�Q�交互的双方发生的戏剧性变化值得我们注意。参数是�q�程对象�Q�意味着该参数对象可以远�E�调用。当客户�E�序指定�q�程对象作�ؓ参数调用服务器端�q�程对象的方法时�Q�RMI 的运行时机制��向服务器端的远�E�对象发送作为参数的�q�程对象的一�?Stub 对象。这��h��务器端的�q�程对象��可以回调（Callback�Q�这�?Stub 对象的方法，�q�而调用在客户端的�q�程对象的对应方法。通过�q�种�Ҏ(gu��)��Q�服务器端的�q�程对象��可以修改作为参数的客户端远�E�对象的内部状态，�q�正是传�l�意义的传引用所具备的特性。是不是有点晕？�q�里的关键是要明白，在分布式环境中，所谓服务器和客��L(f��ng)��都是相对的。被��h��的一方就是服务器�Q�而发��求的一方就是客��L(f��ng)��?

在调用参数的�~�列�q�程成功后，客户端的�q�程引用层从 Stub 那里获得了编列后的参��C��及对服务器端�q�程对象的远�E�引用（参见 java.rmi.server.RemoteRef API�Q�。该层负责将客户�E�序的请求依据底层的 RMI 数据传输协议转换��Z��输层��h��。在 RMI 中，有多�U�的可能的传输机�Ӟ��比如点对点（Point-to-Point�Q�以及广播（Multicast�Q�等。不�q�，在当前的 JMI 版本中只支持点对点协议，卌��E�引用层��生成唯一的传输层��h��Q�发往指定的唯一�q�程对象�Q�参�?java.rmi.server.UnicastRemoteObject API�Q��?/p>
在服务器端，服务器端的远�E�引用层接收传输层请求，�q�将其�{换�ؓ对远�E�对象的服务器端代理对象 Skeleton 的调用。Skeleton 对象负责��请求�{换�ؓ对实际的�q�程对象的方法调用。这是通过与编列过�E�相对的反编列（Unmarshal�Q�过�E�实现的。所有序列化的参数被转换�?Java 形式�Q�其中作为参数的�q�程对象�Q�实际上发送的是远�E�引用）被�{换�ؓ服务器端本地�?Stub 对象�?/p>
如果�Ҏ(gu��)��调用有返回值或者抛出异常，�?Skeleton 负责�~�列�q�回值或者异常，通过服务器端的远�E�引用层�Q�经传输层传递给客户端；相应圎ͼ�客户端的�q�程引用层和 Stub 负责反编列�ƈ最�l�将�l�果�q�回�l�客��L(f��ng)��序�?/p>
整个�q�程中，可能最让�h�q�h��的是�q�程引用层。这里只要明白，本地�?Stub 对象是如何��生的�Q�就不难理解�q�程引用的意义所在了。远�E�引用中包含了其所指向的远�E�对象的信息�Q�该�q�程引用��用于构造作为本��C��理对象的 Stub 对象。构造后�Q�Stub 对象内部��维护该�q�程引用。真正在�|�络上传输的实际上就是这个远�E�引用，而不�?Stub 对象�?/p>

4. RMI 对象服务

�?RMI 的基本架构之上，RMI 提供服务与分布式应用�E�序的一些对象服务，包括对象的命�?注册�Q�Naming/Registry�Q�服务，�q�程对象�Ȁ�z�（Activation�Q�服务以及分布式垃圾攉��Q�Distributed Garbage Collection, DGC�Q�。作为入门指南，本文��指介绍其中的命�?注册服务�Q�因为它是实�?RMI 所必备的。其它内容请读者自行参考其它更加深入的资料�?/p>
在前一节中�Q�如果你喜欢刨根问底�Q�可能已�l�注意到�Q�客��L(f��ng)��要调用远�E�对象，是通过其代理对�?Stub 完成的，那么 Stub 最早是从哪里得来的呢？RMI 的命�?注册服务正是解决�q�一问题的。当服务器端惛_��客户端提供基�?RMI 的服务时�Q�它需要将一个或多个�q�程对象注册到本地的 RMI 注册表中�Q�参�?font color="red">java.rmi.registry.Registry API�Q�。每个对象在注册旉��被指定一个将来用于客��L(f��ng)��序引用该对象的名�U�。客��L(f��ng)��序通过命名服务�Q�参�?java.rmi.Naming API�Q�，指定�c�M�� URL 的对象名�U�就可以获得指向�q�程对象的远�E�引用。在 Naming 中的 lookup() �Ҏ(gu��)��扑ֈ��q�程对象所在的��L��后，它将��索该��L��上的 RMI 注册表，�q�请求所需的远�E�对象。如果注册表发现被请求的�q�程对象�Q�它?y��u)��生成一个对该远�E�对象的�q�程引用�Q��ƈ��其�q�回�l�客��L(f��ng)��Q�客��L(f��ng)��则基于远�E�引用生成相应的 Stub 对象�Q��ƈ��引用传递给调用者。之后，双方��可以按照我们前面讲�q�的方式�q�行交互了�?

注意: RMI 命名服务提供�?Naming �c�dƈ不是你的唯一选择。RMI 的注册表可以与其他命名服务绑定，比如 JNDI�Q�这样你��可以通过 JNDI 来访�?RMI 的注册表了�?/p>

5. 实战 RMI

理论��M��开实践�Q�理�?RMI 的最好办法就是通过例子。开�?RMI 的分布式对象的大体过�E�包括如下几步：

定义�q�程接口。这一步是通过扩展 java.rmi.Remote 接口�Q��ƈ定义所需的业务方法实现的�?/p>

定义�q�程接口的实现类。即实现上一步所定义的接口，�l�出业务�Ҏ(gu��)��的具体实现逻辑�?/p>

�~�译�q�程接口和实现类�Q��ƈ通过 RMI �~�译�?rmic ��Z��实现�cȝ��成所需�?Stub �?Skeleton �c�R�?/p>

RMI 中各个组件之间的关系如下面这个示意图所�C�：

回忆我们上一节所讲的�Q�Stub �?Skeleton 负责代理客户和服务器之间的通讯。但我们�q�不需要自��q��成它们，相反�Q�RMI 的编译器 rmic 可以帮我们基于远�E�接口和实现�cȝ��成这些类。当客户端对象通过命名服务向服务器端的 RMI 注册表请求远�E�对象时�Q�RMI ��自动构造对应远�E�对象的 Skeleton 实例对象�Q��ƈ通过 Skeleton 对象��远�E�引用返回给客户端。在客户端，该远�E�引用将用于构�?Stub �cȝ��实例对象。之后，Stub 对象�?Skeleton 对象��可以代理客户对象和�q�程对象之间的交互了�?

我们的例子展��C��一个简单的应用场景。服务器端部�|�了一个计��引擎，负责接受来自客户端的计算��d��Q�在服务器端执行计算��d��Q��ƈ��结果返回给客户端。客��L(f��ng)��发送�ƈ调用计算引擎的计��Q务实际上是计��指定精度的 π 倹{�?/p>

重要: 本文的例子改�~�自 The Java�?Tutorial Trail:RMI。所有权利属于相应的所有�h�?/p>

6. 定义�q�程接口

定义�q�程接口与非分布式应用中定义接口的方法没有太多的区别。只要遵守下面两个要求：

�q�程接口必须直接或者间接的扩展�?java.rmi.Remote 接口。远�E�接口还可以在扩展该接口的基��上，同时扩展其它接口�Q�只要被扩展的接口的所有方法与�q�程接口的所有方法一��h��下一个要求�?/p>

在远�E�接口或者其��接口（Super-interface�Q�中声明的方法必��L��下列对�q�程�Ҏ(gu��)��的要求：

�q�程�Ҏ(gu��)��必须声明抛出 java.rmi.RemoteException 异常�Q�或者该异常的超�c�（Superclass�Q�，比如 java.io.IOException 或�?java.lang.Exception 异常。在此基��上，�q�程�Ҏ(gu��)��可以声明抛出应用特定的其它异常�?/p>

在远�E�方法声明中�Q�作为参数或者返回值的�q�程对象�Q�或者包含在其它非远�E�对象中的远�E�对象，必须声明为其对应的远�E�接口，而不是实际的实现�c�R�?/p>

注意: �?Java 1.2 之前�Q�上面关于抛出异常的要求更严��|��卛_��L��?java.rmi.RemoteExcption�Q�不允许�c�M�� java.io.IOException �q�样的超�c�R��现在之所以放宽了�q�一要求�Q�是希望可以使定义既可以用于�q�程对象�Q�也可以用于本地对象的接口变得容易一些（��x�� EJB 中的本地接口和远�E�接口）。当�Ӟ��q��ƈ没有佉K��题好多少�Q�你�q�是必须声明异常。不�q�，一�U�观点认��不是问题�Q�强制声明异常可以��开发�h员保持清醒的头脑�Q�因��E�对象和本地对象在调用时传参的语意是不同的。本地对象是传引用，而远�E�对象主要是传��|��q�意呛_��参数内部状态的修改产生的结果是不同的�?

对于�W�一个要求，java.rmi.Remote 接口实际上没有�Q何方法，而只是用作标记接口。RMI 的运行环境依赖该接口判断对象是否是远�E�对象。第二个要求则是因�ؓ分布式应用可能发生�Q何问题，比如�|�络问题�{�等�?/p>
�?1 列出了我们的�q�程接口定义。该接口只有一个方法：executeTask() 用以执行指定的计��Q务，�q�返回相应的�l�果。注意，我们用后�~� Remote 表明接口是远�E�接口�?/p>

�?1. ComputeEngineRemote �q�程接口

package rmitutorial; import java.rmi.Remote; import java.rmi.RemoteException; public interface ComputeEngineRemote extends Remote { public Object executeTask(Task task) throws RemoteException; }

�?2 列出了计��Q务接口的定义。该接口也只有一个方法：execute() 用以执行实际的计��逻辑�Q��ƈ�q�回�l�果。注意，该接口不是远�E�接口，所以没有扩�?java.rmi.Remote 接口�Q�其�Ҏ(gu��)��也不必抛�?java.rmi.RemoteException 异常。但是，因�ؓ它将用作�q�程�Ҏ(gu��)��的参敎ͼ�所以扩展了 java.io.Serializable 接口�?/p>

�?2. Task 接口

package rmitutorial; import java.io.Serializable; public interface Task extends Serializable { Object execute(); }

7. 实现�q�程接口

接下来，我们��实现前面定义的�q�程接口�?a>�?3�l�出了实现的源代码�?/p>

�?3. ComputeEngine 实现

package rmitutorial; import java.rmi.RemoteException; import java.rmi.server.UnicastRemoteObject; public class ComputeEngine extends UnicastRemoteObject implements ComputeEngineRemote { public ComputeEngine() throws RemoteException { super(); } public Object executeTask(Task task) throws RemoteException { return task.execute(); } }

�c?ComputeEngine 实现了之前定义的�q�程接口�Q�同时��承自 java.rmi.server.UnicastRemoteObject ��类�?font color="red">UnicastRemoteObject �c�L��一个便��L(f��ng)��Q�它实现了我们前面所讲的��Z�� TCP/IP 的点对点通讯机制。远�E�对象都必须从该�c�L��展（除非你想自己实现几乎所�?UnicastRemoteObject 的方法）。在我们的实现类的构造函��C��Q�调用了��类的构造函敎ͼ�当然�Q�即使你不显式的调用�q�个构徏函数�Q�它也一样会被调用。这里这样做�Q�只是�ؓ了突出强调这�U�调用而已�Q�。该构造函数的最重要的意义就是调�?UnicastRemoteObject �cȝ�� exportObject() �Ҏ(gu��)��。导出（Export�Q�对象是指�ɘq�程对象准备��q�A�Q�可以接受进来的调用的过�E�。而这个过�E�的最重要内容��是建立服务器套接字�Q�监听特定的端口�Q�等待客��L(f��ng)��的调用请求�?/p>

8. 引导�E�序

��Z��让客��L(f��ng)��序可以找到我们的�q�程对象�Q�就需要将我们的远�E�对象注册到 RMI 的注册表。这个过�E�有时被�U�Cؓ"引导"�q�程�Q�Bootstrap�Q�。我们将为此�~�写一个独立的引导�E�序负责创徏和注册远�E�对象�?a>�?4 �l�出了引导程序的源代码�?

�?4. 引导�E�序

package rmitutorial; import java.rmi.Naming; import java.rmi.RMISecurityManager; public class Bootstrap { public static void main(String[] args) throws Exception { String name = "ComputeEngine"; ComputeEngine engine = new ComputeEngine(); System.out.println("ComputerEngine exported"); Naming.rebind(name, engine); System.out.println("ComputeEngine bound"); } }

可以看到�Q�我们首先创��Z��一个远�E�对象（同时导出了该对象�Q�，之后��该对象�l�定�?RMI 注册表中�?font color="red">Naming �?rebind() �Ҏ(gu��)��接受一�?URL 形式的名字作�l�定之用。其完整格式如下�Q?/p>

protocol://host:port/object

其中�Q�协议（Protocol�Q�默认�ؓ rmi�Q�主机名默认�?localhost�Q�端口默认�ؓ 1099。注意，JDK 中提供的默认 Naming 实现只支�?rmi 协议。在我们的引导程序里面只�l�出了对象绑定的名字�Q�而其它部分均使用�~�省倹{�?/p>

9. 客户端程�?/font>

�?5 �l�出了我们的客户端程序。该�E�序接受两个参数�Q�分别是�q�程对象所在的��L��地址和希望获得的 π 值的�_�ֺ��?

�?5. Client.java

package rmitutorial; import java.math.BigDecimal; import java.rmi.Naming; public class Client { public static void main(String args[]) throws Exception { String name = "rmi://" + args[0] + "/ComputeEngine"; ComputeEngineRemote engineRemote = (ComputeEngineRemote)Naming.lookup(name); Pi task = new Pi(Integer.parseInt(args[1])); BigDecimal pi = (BigDecimal)(engineRemote.executeTask(task)); System.out.println(pi); } }

�?6. Pi.java

package rmitutorial; import java.math.*; public class Pi implements Task { private static final BigDecimal ZERO = BigDecimal.valueOf(0); private static final BigDecimal ONE = BigDecimal.valueOf(1); private static final BigDecimal FOUR = BigDecimal.valueOf(4); private static final int roundingMode = BigDecimal.ROUND_HALF_EVEN; private int digits; public Pi(int digits) { this.digits = digits; } public Object execute() { return computePi(digits); } public static BigDecimal computePi(int digits) { int scale = digits + 5; BigDecimal arctan1_5 = arctan(5, scale); BigDecimal arctan1_239 = arctan(239, scale); BigDecimal pi = arctan1_5.multiply(FOUR).subtract( arctan1_239).multiply(FOUR); return pi.setScale(digits, BigDecimal.ROUND_HALF_UP); } public static BigDecimal arctan(int inverseX, int scale) { BigDecimal result, numer, term; BigDecimal invX = BigDecimal.valueOf(inverseX); BigDecimal invX2 = BigDecimal.valueOf(inverseX * inverseX); numer = ONE.divide(invX, scale, roundingMode); result = numer; int i = 1; do { numer = numer.divide(invX2, scale, roundingMode); int denom = 2 * i + 1; term = numer.divide(BigDecimal.valueOf(denom), scale, roundingMode); if ((i % 2) != 0) { result = result.subtract(term); } else { result = result.add(term); } i++; } while (term.compareTo(ZERO) != 0); return result; } }

10. �~�译�C�Z��E�序

�~�译我们的示例程序和�~�译其它非分布式的应用没什么区别。只是编译之后，需要��?RMI �~�译器，�?rmic 生成所需 Stub �?Skeleton 实现。��?rmic 的方式是��我们的�q�程对象的实现类�Q�不是远�E�接口）的全�c�d��作�ؓ参数来运�?rmic 命��o。参考下面的�C�Z��Q?/p>

E:\classes\rmic rmitutorial.ComputeEngine

�~�译之后��生�?rmitutorial.ComputeEngine_Skel �?rmitutorial.ComputeEngine_Stub 两个�c�R�?/p>

11. �q�行�C�Z��E�序

�q�程对象的引用通常是通过 RMI 的注册表服务以及 java.rmi.Naming 接口获得的。远�E�对象需要导出（注册�Q�相应的�q�程引用到注册表服务�Q�之后注册表服务��可以监听�ƈ服务于客��L(f��ng)��对远�E�对象引用的��h��。标准的 Sun Java SDK 提供了一个简单的 RMI 注册表服务程序，�?rmiregistry 用于监听特定的端口，�{�待�q�程对象的注册，以及客户端对�q�些�q�程对象引用的检索请求�?

在运行我们的�C�Z��E�序之前�Q�首先要启动 RMI 的注册表服务。这个过�E�很��单，只要直接�q�行 rmiregistry 命��o卛_��。缺省的情况下，该服务将监听 1099 端口。如果需要指定其它的监听端口�Q�可以在命��o行指定希望监听的端口�Q�如果你指定了其它端口，需要修改示例程序以适应环境�Q�。如果希望该�E�序在后台运行，�?Unix 上可以以如下方式�q�行�Q�当�Ӟ��可以�~�省端口参数�Q�：

$ rmiregistry 1099 &

�?Windows 操作�pȝ��中可以这栯��行：

C:\> start rmiregistry 1099

我们�?rmitutorial.Bootstrap �c�d��用于启动�q�程对象�Q��ƈ��其�l�定�?RMI 注册表中。运行该�c�d��Q�远�E�对象也��进入监听状态，�{�待来自客户端的�Ҏ(gu��)��调用��h��?/p>

$ java rmitutorial.Bootstrap ComputeEngine exported ComputeEngine bound

启动�q�程对象后，打开另一个命令行�H�口�Q�运行客��L(f��ng)��。命令行的第一个参��Cؓ RMI 注册表的地址�Q�第二个参数为期望的 π 值精度。参考下面的�C�Z��Q?/p>

$ java rmitutorial.Client localhost 50 3.14159265358979323846264338327950288419716939937511

12. 其它信息

在演�C�示例程序时�Q�我们实际上是在同一��L��上运行的服务器和客户端，�q�且无论是服务器和客��L(f��ng)��所需的类都在相同的类路径上，可以同时被服务器和客��L(f��ng)��所讉K��。这忽略�?Java RMI 的一个重要细节，卛_��态类装蝲。因�?RMI 的特性（包括其它几个�Ҏ(gu��)��）�q�不适用�?J2EE �?RMI-IIOP �?EJB 技术，所以，本文��不作详�l�介�l�，误��者自行参考本文给出的参考资料。不�q�，��Z��让好奇的读者不至于�q�分失望�Q�这里简单介�l�一下动态类装蝲的基本思想�?

RMI �q�行时系�l�采用动态类装蝲机制来装载分布式应用所需的类。如果你可以直接讉K��应用所涉及的所有包括服务器端客��L(f��ng)��在内的主机，�q�且可以把分布式应用所需的所有类都安装在每个��L��?CLASSPATH 中（上面的示例就是极端情况，所有的东西都在本地��L��Q�，那么你完全不必关�?RMI �c�装载的�l�节。显�Ӟ��既然是分布式应用�Q�情况往往正相反。对�?RMI 应用�Q�客��L(f��ng)��需要装载客��L(f��ng)��自��n所需的类�Q�将要调用的�q�程对象的远�E�接口类以及对应�?Stub �c�；服务器端则要装蝲�q�程对象的实现类以及对应�?Skeleton �c�（Java 1.2 之后不需�?Skeleton �c�）。RMI 在处理远�E�调用涉及的�q�程引用�Q�参��C��及返回值时�Q�可以将一个指定的 URL �~�码到流中。交互的另一端可以通过 �?URL 获得处理�q�些对象所需的类文�g。这一点类��g�� Applet 中的 CODEBASE 的概念，交互的两端通过 HTTP 服务器发布各自控制的�c�，允许交互的另一端动态下载这些类。以我们的示例�ؓ例，客户端不必部�|?ComputeEngine_Stub 的类文�g�Q�而可以通过服务器端�?HTTP 服务器获得类文�g。同��P��服务器端也不需要客��L(f��ng)��实现的定制�Q�?Pi 的类文�g�?/p>
注意�Q�这�U�动态类装蝲��需要交互的两端加蝲定制的安全管理器�Q�参�?java.rmi.RMISecurityManager API�Q�，以及对应的策略文件�?/p>

13. 参考资�?/font>

The Java�?Tutorial Trail:RMI

David Flanagan, Jim Farley, William Crawford and Kris Magnusson, 1999, ISBN 1-56592-483-5E, O'Reilly, Java�?Enterprise in a Nutshell

Ed Roman, Scott Ambler and Tyler Jewell 2002, ISBN 0-471-41711-4, John Wiley &Sons, Inc., Matering Enterprise JavaBeans�?/i> , Second Edition

boddi 2006-10-11 09:51 发表评论

正则表达�?转蝲)

boddi — Wed, 13 Sep 2006 08:28:00 GMT

正则表达�?转蝲)
关键�?/b>�Q?正则表达�?/a>    模式匚w��    Javascript
关键字：正则表达�? 模式匚w�� Javascript
摘要�Q�收集一些常用的正则表达式�?/p>
正则表达式用于字�W�串处理�Q�表单验证等场合�Q�实用高效，但用到时��L��不太把握�Q�以致往往要上�|�查一番。我��一些常用的表达式收藏在�q�里�Q�作备忘之用。本贴随时会更新�?/p>
匚w��中文字符的正则表辑ּ��Q?[\u4e00-\u9fa5]
匚w��双字节字�W?包括汉字在内)�Q�[^\x00-\xff]
应用�Q�计��字�W�串的长度（一个双字节字符长度�?�Q�ASCII字符�?�Q?/font>
String.prototype.len=function(){return this.replace([^\x00-\xff]/g,"aa").length;}
匚w��I��的正则表辑ּ��Q�\n[\s| ]*\r
匚w��HTML标记的正则表辑ּ��Q?<(.*)>.*<\/\1>|<(.*) \/>/
匚w��首尾�I�格的正则表辑ּ��Q?^\s*)|(\s*$)
String.prototype.trim = function()
{
    return this.replace(/(^\s*)|(\s*$)/g, "");
}
利用正则表达式分解和转换IP地址�Q?/font>
下面是利用正则表辑ּ�匚w��IP地址�Q��ƈ��IP地址转换成对应数值的Javascript�E�序�Q?/font>
function IP2V(ip)
{
re=/(\d+)\.(\d+)\.(\d+)\.(\d+)/g //匚w��IP地址的正则表辑ּ�
if(re.test(ip))
{
return RegExp.$1*Math.pow(255,3))+RegExp.$2*Math.pow(255,2))+RegExp.$3*255+RegExp.$4*1
}
else
{
throw new Error("Not a valid IP address!")
}
}
不过上面的程序如果不用正则表辑ּ��Q�而直接用split函数来分解可能更��单，�E�序如下�Q?/font>
var ip="10.100.20.168"
ip=ip.split(".")
alert("IP值是�Q?+(ip[0]*255*255*255+ip[1]*255*255+ip[2]*255+ip[3]*1))
匚w��Email地址的正则表辑ּ��Q�\w+([-+.]\w+)*@\w+([-.]\w+)*\.\w+([-.]\w+)*
匚w��|�址URL的正则表辑ּ��Q�http://([\w-]+\.)+[\w-]+(/[\w- ./?%&=]*)?
~~利用正则表达式去除字串中重复的字�W�的��法�E�序~~�Q�[注：此程序不正确�Q�原因见本脓(chu��ng)回复]
var s="abacabefgeeii"
var s1=s.replace(/(.).*\1/g,"$1")
var re=new RegExp("["+s1+"]","g")
var s2=s.replace(re,"")
alert(s1+s2) //�l�果为：abcefgi

我原来在CSDN上发贴寻求一个表辑ּ�来实现去除重复字�W�的�Ҏ(gu��)��Q�最�l�没有找刎ͼ��q�是我能惛_��的最��单的实现�Ҏ(gu��)��。思�\是��用后向引用取出包括重复的字符�Q�再以重复的字符建立�W�二个表辑ּ��Q�取��C��重复的字�W�，两者串�q�。这个方法对于字�W�顺序有要求的字�W�串可能不适用�?/font>
得用正则表达式从URL地址中提取文件名的javascript�E�序�Q�如下结果�ؓpage1
s="http://www.9499.net/page1.htm"
s=s.replace(/(.*\/){0,}([^\.]+).*/ig,"$2")
alert(s)
利用正则表达式限制网��表单里的文本框输入内容�Q?/font>
用正则表辑ּ�限制只能输入中文�Q�onkeyup="value=value.replace(/[^\u4E00-\u9FA5]/g,'')" onbeforepaste="clipboardData.setData('text',clipboardData.getData('text').replace(/[^\u4E00-\u9FA5]/g,''))"
用正则表辑ּ�限制只能输入全角字符�Q?/font> onkeyup="value=value.replace(/[^\uFF00-\uFFFF]/g,'')" onbeforepaste="clipboardData.setData('text',clipboardData.getData('text').replace(/[^\uFF00-\uFFFF]/g,''))"
用正则表辑ּ�限制只能输入数字�Q�onkeyup="value=value.replace(/[^\d]/g,'') "onbeforepaste="clipboardData.setData('text',clipboardData.getData('text').replace(/[^\d]/g,''))"
用正则表辑ּ�限制只能输入数字和英文：onkeyup="value=value.replace(/[\W]/g,'') "onbeforepaste="clipboardData.setData('text',clipboardData.getData('text').replace(/[^\d]/g,''))"

boddi 2006-09-13 16:28 发表评论

javascript��技�?��强js�ȝ��)

boddi — Mon, 11 Sep 2006 05:35:00 GMT
     摘要: javascript��技�? 事�g源对�? event.srcElement.tagName event.srcElement.type 捕获释放 event.srcElement.setCapture(); event...  阅读全文

boddi 2006-09-11 13:35 发表评论

javaexcelapplication

boddi — Sat, 09 Sep 2006 05:14:00 GMT

Java Excel是一开放源码项目，通过它Java开发�h员可以读取Excel文�g的内宏V��创建新的Excel文�g、更新已�l�存在的Excel文�g。��用该API非Windows操作�pȝ��也可以通过�U�Java应用来处理Excel数据表。因为是使用Java�~�写的，所以我们在Web应用中可以通过JSP、Servlet来调用API实现对Excel数据表的讉K��?br />
现在发布的稳定版本是V2.0�Q�提供以下功能：

从Excel 95�?7�?000�{�格式的文�g中读取数据；
��d��Excel公式�Q�可以读取Excel 97以后的公式）�Q?
生成Excel数据表（格式为Excel 97�Q�；
支持字体、数字、日期的格式化；
支持单元格的阴媄操作�Q�以及颜色操作；
修改已经存在的数据表�Q?
现在�q�不支持以下功能�Q�但不久��׃��提供了：

不能够读取图表信息；
可以读，但是不能生成公式�Q��Q何类型公式最后的计算值都可以��d��Q?
应用�C�Z��

1 从Excel文�g��d��数据�?br />
Java Excel API既可以从本地文�g�pȝ��的一个文�?.xls)�Q�也可以从输入流中读取Excel数据表。读取Excel数据表的�W�一步是创徏Workbook(术语�Q�工作薄)�Q�下面的代码片段举例说明了应该如何操作：(完整代码见ExcelReading.java)

import java.io.*;
import jxl.*;
�?�?�?�?br />try
{
//构徏Workbook对象, 只读Workbook对象
//直接从本地文件创建Workbook
//从输入流创徏Workbook
   InputStream is = new FileInputStream(sourcefile);
   jxl.Workbook rwb = Workbook.getWorkbook(is);
}
catch (Exception e)
{
e.printStackTrace();
}

一旦创��Z��Workbook�Q�我们就可以通过它来讉K��Excel Sheet(术语�Q�工作表)。参考下面的代码片段�Q?br />

//获取�W�一张Sheet�?br />Sheet rs = rwb.getSheet(0);

我们既可能通过Sheet的名�U�来讉K��它，也可以通过下标来访问它。如果通过下标来访问的话，要注意的一�Ҏ(gu��)��下标�?开始，��像数组一栗��?br />
一旦得��C��Sheet�Q�我们就可以通过它来讉K��Excel Cell(术语�Q�单元格)。参考下面的代码片段�Q?br />

//获取�W�一行，�W�一列的�?br />Cell c00 = rs.getCell(0, 0);
String strc00 = c00.getContents();

//获取�W�一行，�W�二列的�?br />Cell c10 = rs.getCell(1, 0);
String strc10 = c10.getContents();

//获取�W�二行，�W�二列的�?br />Cell c11 = rs.getCell(1, 1);
String strc11 = c11.getContents();

System.out.println("Cell(0, 0)" + " value : " + strc00 + "; type : " + c00.getType());
System.out.println("Cell(1, 0)" + " value : " + strc10 + "; type : " + c10.getType());
System.out.println("Cell(1, 1)" + " value : " + strc11 + "; type : " + c11.getType());

如果仅仅是取得Cell的��|��我们可以方便地通过getContents()�Ҏ(gu��)��Q�它可以��Q何类型的Cell值都作�ؓ一个字�W�串�q�回。示例代码中Cell(0, 0)是文本型�Q�Cell(1, 0)是数字型�Q�Cell(1,1)是日期型�Q�通过getContents()�Q�三�U�类型的�q�回值都是字�W�型�?br />
如果有需要知道Cell内容的确切类型，API也提供了一�p�d��的方法。参考下面的代码片段�Q?br />

String strc00 = null;
double strc10 = 0.00;
Date strc11 = null;

Cell c00 = rs.getCell(0, 0);
Cell c10 = rs.getCell(1, 0);
Cell c11 = rs.getCell(1, 1);

if(c00.getType() == CellType.LABEL)
{
LabelCell labelc00 = (LabelCell)c00;
strc00 = labelc00.getString();
}
if(c10.getType() == CellType.NUMBER)
{
NmberCell numc10 = (NumberCell)c10;
strc10 = numc10.getValue();
}
if(c11.getType() == CellType.DATE)
{
DateCell datec11 = (DateCell)c11;
strc11 = datec11.getDate();
}

System.out.println("Cell(0, 0)" + " value : " + strc00 + "; type : " + c00.getType());
System.out.println("Cell(1, 0)" + " value : " + strc10 + "; type : " + c10.getType());
System.out.println("Cell(1, 1)" + " value : " + strc11 + "; type : " + c11.getType());

在得到Cell对象后，通过getType()�Ҏ(gu��)��可以获得该单元格的类型，然后与API提供的基本类型相匚w��Q�强制�{换成相应的类型，最后调用相应的取值方法getXXX()�Q�就可以得到��定�c�d��的倹{��API提供了以下基本类型，与Excel的数据格式相对应�Q�如下图所�C�：

每种�c�d��的具体意义，请参见Java Excel API Document�?br />
当你完成对Excel�?sh��)子表格数据的处理后�Q�一定要使用close()�Ҏ(gu��)��来关闭先前创建的对象�Q�以释放��d��数据表的�q�程中所占用的内存空��_��在读取大量数据时昑־��ؓ重要。参考如下代码片�D�：

//操作完成�Ӟ��关闭对象�Q�释攑֍�用的内存�I�间
rwb.close();

Java Excel API提供了许多访问Excel数据表的�Ҏ(gu��)��Q�在�q�里我只��要地介绍几个常用的方法，其它的方法请参考附录中的Java Excel API Document�?br />
Workbook�c�L��供的�Ҏ(gu��)��

1. int getNumberOfSheets()
获得工作薄（Workbook�Q�中工作表（Sheet�Q�的个数�Q�示例：

jxl.Workbook rwb = jxl.Workbook.getWorkbook(new File(sourcefile));
int sheets = rwb.getNumberOfSheets();

2. Sheet[] getSheets()
�q�回工作薄（Workbook�Q�中工作表（Sheet�Q�对象数�l�，�C�Z��Q?br />

jxl.Workbook rwb = jxl.Workbook.getWorkbook(new File(sourcefile));
Sheet[] sheets = rwb.getSheets();

3. String getVersion()
�q�回正在使用的API的版本号�Q�好像是没什么太大的作用�?br />

jxl.Workbook rwb = jxl.Workbook.getWorkbook(new File(sourcefile));
String apiVersion = rwb.getVersion();

Sheet接口提供的方�?br />
1) String getName()
获取Sheet的名�U�ͼ��C�Z��Q?br />

jxl.Workbook rwb = jxl.Workbook.getWorkbook(new File(sourcefile));
jxl.Sheet rs = rwb.getSheet(0);
String sheetName = rs.getName();

2) int getColumns()
获取Sheet表中所包含的��d��敎ͼ��C�Z��Q?br />

jxl.Workbook rwb = jxl.Workbook.getWorkbook(new File(sourcefile));
jxl.Sheet rs = rwb.getSheet(0);
int rsColumns = rs.getColumns();

3) Cell[] getColumn(int column)
获取某一列的所有单元格�Q�返回的是单元格对象数组�Q�示例：

jxl.Workbook rwb = jxl.Workbook.getWorkbook(new File(sourcefile));
jxl.Sheet rs = rwb.getSheet(0);
Cell[] cell = rs.getColumn(0);

4) int getRows()
获取Sheet表中所包含的总行敎ͼ��C�Z��Q?br />

jxl.Workbook rwb = jxl.Workbook.getWorkbook(new File(sourcefile));
jxl.Sheet rs = rwb.getSheet(0);
int rsRows = rs.getRows();

5) Cell[] getRow(int row)
获取某一行的所有单元格�Q�返回的是单元格对象数组�Q�示例子�Q?br />

jxl.Workbook rwb = jxl.Workbook.getWorkbook(new File(sourcefile));
jxl.Sheet rs = rwb.getSheet(0);
Cell[] cell = rs.getRow(0);

6) Cell getCell(int column, int row)
获取指定单元格的对象引用�Q�需要注意的是它的两个参敎ͼ��W�一个是列数�Q�第二个是行敎ͼ��q�与通常的行、列�l�合有些不同�?br />

jxl.Workbook rwb = jxl.Workbook.getWorkbook(new File(sourcefile));
jxl.Sheet rs = rwb.getSheet(0);
Cell cell = rs.getCell(0, 0);

2 生成新的Excel工作�?br />
下面的代码主要是向大家介�l�如何生成简单的Excel工作表，在这里单元格的内�Ҏ(gu��)��不带��M��修饰�?如：字体�Q�颜色等�{?�Q�所有的内容都作为字�W�串写入�?完整代码见ExcelWriting.java)

与读取Excel工作表相��|��首先要��用Workbook�cȝ��工厂�Ҏ(gu��)��创徏一个可写入的工作薄(Workbook)对象�Q�这里要注意的是�Q�只能通过API提供的工厂方法来创徏Workbook�Q�而不能��用WritableWorkbook的构造函敎ͼ�因�ؓ�c�WritableWorkbook的构造函��Cؓprotected�c�d��。示例代码片�D�如下：

import java.io.*;
import jxl.*;
import jxl.write.*;
�?�?�?�?br />try
{
//构徏Workbook对象, 只读Workbook对象
//Method 1�Q�创建可写入的Excel工作�?br />   jxl.write.WritableWorkbook wwb = Workbook.createWorkbook(new File(targetfile));

//Method 2�Q�将WritableWorkbook直接写入到输出流
/*
   OutputStream os = new FileOutputStream(targetfile);
   jxl.write.WritableWorkbook wwb = Workbook.createWorkbook(os);
*/
}
catch (Exception e)
{
e.printStackTrace();
}

API提供了两�U�方式来处理可写入的输出��，一�U�是直接生成本地文�g�Q�如果文件名不带全�\径的话，�~�省的文件会定位在当前目录，如果文�g名带有全路径的话�Q�则生成的Excel文�g则会定位在相应的目录�Q�另外一�U�是��Excel对象直接写入到输出流�Q�例如：用户通过��览器来讉K��Web服务器，如果HTTP头设�|�正��的话，��览器自动调用客��L(f��ng)��的Excel应用�E�序�Q�来昄��动态生成的Excel�?sh��)子表格�?br />
接下来就是要创徏工作表，创徏工作表的�Ҏ(gu��)��与创建工作薄的方法几乎一��P��同样是通过工厂模式�Ҏ(gu��)��获得相应的对象，该方法需要两个参敎ͼ�一个是工作表的名称�Q�另一个是工作表在工作薄中的位�|�，参考下面的代码片段�Q?br />

//创徏Excel工作�?br />jxl.write.WritableSheet ws = wwb.createSheet("Test Sheet 1", 0);

"�q�锅也支好了�Q�材料也准备齐全了，可以开始下锅了�Q?�Q�现在要做的只是实例化API所提供的Excel基本数据�c�d��Q��ƈ��它们添加到工作表中��可以了�Q�参考下面的代码片段�Q?br />

//1.��d��Label对象
jxl.write.Label labelC = new jxl.write.Label(0, 0, "This is a Label cell");
ws.addCell(labelC);

//��d��带有字型Formatting的对�?br />jxl.write.WritableFont wf = new jxl.write.WritableFont(WritableFont.TIMES, 18, WritableFont.BOLD, true);
jxl.write.WritableCellFormat wcfF = new jxl.write.WritableCellFormat(wf);
jxl.write.Label labelCF = new jxl.write.Label(1, 0, "This is a Label Cell", wcfF);
ws.addCell(labelCF);

//��d��带有字体颜色Formatting的对�?br />jxl.write.WritableFont wfc = new jxl.write.WritableFont(WritableFont.ARIAL, 10, WritableFont.NO_BOLD, false,
Underlinestyle.NO_UNDERLINE, jxl.format.Colour.RED);
jxl.write.WritableCellFormat wcfFC = new jxl.write.WritableCellFormat(wfc);
jxl.write.Label labelCFC = new jxl.write.Label(1, 0, "This is a Label Cell", wcfFC);
ws.addCell(labelCF);

//2.��d��Number对象
jxl.write.Number labelN = new jxl.write.Number(0, 1, 3.1415926);
ws.addCell(labelN);

//��d��带有formatting的Number对象
jxl.write.NumberFormat nf = new jxl.write.NumberFormat("#.##");
jxl.write.WritableCellFormat wcfN = new jxl.write.WritableCellFormat(nf);
jxl.write.Number labelNF = new jxl.write.Number(1, 1, 3.1415926, wcfN);
ws.addCell(labelNF);

//3.��d��Boolean对象
jxl.write.Boolean labelB = new jxl.write.Boolean(0, 2, false);
ws.addCell(labelB);

//4.��d��DateTime对象
jxl.write.DateTime labelDT = new jxl.write.DateTime(0, 3, new java.util.Date());
ws.addCell(labelDT);

//��d��带有formatting的DateFormat对象
jxl.write.DateFormat df = new jxl.write.DateFormat("dd MM yyyy hh:mm:ss");
jxl.write.WritableCellFormat wcfDF = new jxl.write.WritableCellFormat(df);
jxl.write.DateTime labelDTF = new jxl.write.DateTime(1, 3, new java.util.Date(), wcfDF);
ws.addCell(labelDTF);

�q�里有两点大家要引�v大家的注意。第一点，在构造单元格�Ӟ��单元格在工作表中的位�|�就已经��定了。一旦创建后�Q�单元格的位�|�是不能够变更的�Q�尽��单元格的内�Ҏ(gu��)��可以改变的。第二点�Q�单元格的定位是按照下面�q�样的规�?column, row)�Q�而且下标都是�?开始，例如�Q�A1被存储在(0, 0)�Q�B1被存储在(1, 0)�?br />
最后，不要忘记关闭打开的Excel工作薄对象，以释攑֍�用的内存�Q�参见下面的代码片段�Q?br />

//写入Exel工作�?br />wwb.write();

//关闭Excel工作薄对�?br />wwb.close();

�q�可能与��d��Excel文�g的操作有��少不同�Q�在关闭Excel对象之前�Q�你必须要先调用write()�Ҏ(gu��)��Q�因为先前的操作都是存储在缓存中的，所以要通过该方法将操作的内容保存在文�g中。如果你先关闭了Excel对象�Q�那么只能得��C��张空的工作薄了�?br />
3 拯��、更新Excel工作�?br />
接下来简要介�l�一下如何更��C��个已�l�存在的工作薄，主要是下面二步操作，�W�一步是构造只�ȝ��Excel工作薄，�W�二步是利用已经创徏的Excel工作薄创建新的可写入的Excel工作薄，参考下面的代码片段�Q?完整代码见ExcelModifying.java)

//创徏只读的Excel工作薄的对象
jxl.Workbook rw = jxl.Workbook.getWorkbook(new File(sourcefile));

//创徏可写入的Excel工作薄对�?br />jxl.write.WritableWorkbook  wwb = Workbook.createWorkbook(new File(targetfile), rw);

//��d��W�一张工作表
jxl.write.WritableSheet ws = wwb.getSheet(0);

//获得�W�一个单元格对象
jxl.write.WritableCell wc = ws.getWritableCell(0, 0);

//判断单元格的�c�d��, 做出相应的�{�?br />if(wc.getType() == CellType.LABEL)
{
Label l = (Label)wc;
   l.setString("The value has been modified.");
}

//写入Excel对象
wwb.write();

//关闭可写入的Excel对象
wwb.close();

//关闭只读的Excel对象
rw.close();

之所以��用这�U�方式构建Excel对象�Q�完全是因�ؓ效率的原因，因�ؓ上面的示例才是API的主要应用。�ؓ了提高性能�Q�在��d��工作表时�Q�与数据相关的一些输��Z��息，所有的格式信息�Q�如�Q�字体、颜色等�{�，是不被处理的�Q�因为我们的目的是获得行数据的��|��既��没有了修饎ͼ�也不会对行数据的��g�生什么媄响。唯一的不利之处就是，在内存中会同时保存两个同��L(f��ng)��工作表，�q�样当工作表体积比较大时�Q�会占用相当大的内存�Q�但现在好像内存的大��ƈ不是什么关键因素了�?br />
一旦获得了可写入的工作表对象，我们��可以对单元格对象进行更新的操作了，在这里我们不必调用API提供的add()�Ҏ(gu��)��Q�因为单元格已经于工作表当中�Q�所以我们只需要调用相应的setXXX()�Ҏ(gu��)��Q�就可以完成更新的操作了�?br />
��单元格原有的格式化修饰是不能去掉的�Q�我们还是可以将新的单元��g��饰加上去�Q�以使单元格的内容以不同的�Ş式表现�?br />
新生成的工作表对象是可写入的�Q�我们除了更新原有的单元格外�Q�还可以��d��新的单元格到工作表中�Q�这与示�?的操作是完全一��L(f��ng)��?br />
最后，不要忘记调用write()�Ҏ(gu��)��Q�将更新的内容写入到文�g中，然后关闭工作薄对象，�q�里有两个工作薄对象要关闭，一个是只读的，另外一个是可写入的�?br />
以上摘自IBM�|�站

boddi 2006-09-09 13:14 发表评论

boddi — Sat, 09 Sep 2006 04:23:00 GMT

使用JXL��d��Excel表格,拯��、更新Excel工作�?/b>

xymiser 原创 (参与分：41669�Q�专家分�Q?761)   发表�Q?006-01-18 22:11   版本�Q?.0   阅读�Q?b>1666��?

/**
*
��d��Excel表格,拯��、更新Excel工作薄�?lt;/p>
*
Description: 可以��d��Excel文�g的内�?更新Excel工作�?br />*

*
Copyright: Copyright (c) Corparation 2005

*
�E�序开发环境�ؓeclipse

* @author Walker
* @version 1.0
*/
package cn.com.yitong.xls;

import java.io.File;
import java.io.FileInputStream;
import java.io.InputStream;
import java.util.Vector;

import cn.com.yitong.ChartImg;
import cn.com.yitong.VireObj;
import cn.com.yitong.platform.log.YTLogger;

import jxl.CellType;
import jxl.Workbook;
import jxl.format.CellFormat;
import jxl.format.Colour;
import jxl.format.UnderlineStyle;
import jxl.write.Formula;
import jxl.write.Label;
import jxl.write.Number;
import jxl.write.WritableCell;
import jxl.write.WritableCellFormat;
import jxl.write.WritableFont;
import jxl.write.WritableImage;
import jxl.write.WritableSheet;
import jxl.write.WritableWorkbook;
import jxl.write.WriteException;
import jxl.write.biff.RowsExceededException;

public class XLSDemo
{
    private static final int TITLE_LENGTH = 7;
    private static final int SHEET_WIDTH = 32;
    private static final int SHEET_HEIGHT = 116;

    /**
     * 创徏Excel
     */
    private void makeXls()
    {
        Workbook workbook = null;
        try
        {
            // 构徏Workbook对象, 只读Workbook对象
            // 直接从本地文件创建Workbook, 从输入流创徏Workbook
            InputStream ins = new FileInputStream("D:/Workspace/testproj/source.xls");
            workbook = Workbook.getWorkbook(ins);

            // 利用已经创徏的Excel工作薄创建新的可写入的Excel工作�?br />            File outFile = new File("D:/Workspace/testproj/test.xls");
            WritableWorkbook wwb = Workbook.createWorkbook(outFile, workbook);
            // ��d��W�一张工作表
            WritableSheet dataSheet = wwb.getSheet(0);
            //  讄��ȝ��单元�?br />            dataSheet.getSettings().setVerticalFreeze(7);
            dataSheet.getSettings().setHorizontalFreeze(2);

            // ��试模拟数据
            Vector vecData = new Vector();
            for(int i = 0; i < 50; i ++)
            {
                VireObj obj = new VireObj();
                obj.setOrgNo("00" + i + "0");
                obj.setOrgName("机构" + (i + 1));
                obj.setOpenAcc((int)(100 * Math.random()));
                obj.setDestoryAcc((int)(10 * Math.random()));
                obj.setTotalAcc((int)(500 * Math.random()));
                obj.setMonthInCount((int)(500 * Math.random()));
                obj.setMonthInMoney(500 * Math.random());
                obj.setMonthOutCount((int)(500 * Math.random()));
                obj.setMonthOutMoney(500 * Math.random());

                vecData.add(obj);
            }
            // 插入数据
            insertData(wwb, dataSheet, vecData);
            // 插入模拟囑փ�数据
            Vector vecImg = new Vector();
            for(int i = 0; i < 3; i ++)
            {
                ChartImg img = new ChartImg();
                img.setImgTitle("囑փ�" + (i + 1));
                img.setImgName("D:/Workspace/testproj/images/barchart.png");
                vecImg.add(img);
            }
            // 插入图表
            insertImgsheet(wwb, vecImg);
            //写入Excel对象
            wwb.write();
            wwb.close();
        } catch (Exception e)
        {
            YTLogger.logDebug(e);
        } finally
        {
            // 操作完成�Ӟ��关闭对象�Q�释攑֍�用的内存�I�间
            workbook.close();
        }
    }

    /**
     * 插入数据
     * @param wwb WritableWorkbook : 工作��?br />     * @param dataSheet WritableSheet : 工作�?br />     * @throws RowsExceededException
     * @throws WriteException
     */
    private void insertData(WritableWorkbook wwb, WritableSheet dataSheet, Vector vecData) throws RowsExceededException, WriteException
    {
        // 获得标题单元格对象       �?br />        modiStrCell(dataSheet, 2, 0, "工商银行江苏省分行个人网上银行业务种�c?开销��h��l�报表（2005-12�Q?, null);
        // 修改数据单元格数�?br />        for(int i = 0; i < vecData.size(); i ++)
        {
            VireObj obj = (VireObj)vecData.get(i);
            modiStrCell(dataSheet, 0, TITLE_LENGTH + i, obj.getOrgNo(), null);
            modiStrCell(dataSheet, 1, TITLE_LENGTH + i, obj.getOrgName(), null);
            modiNumCell(dataSheet, 2, TITLE_LENGTH + i, obj.getOpenAcc(), null);
            modiNumCell(dataSheet, 3, TITLE_LENGTH + i, obj.getDestoryAcc(), null);
            modiNumCell(dataSheet, 4, TITLE_LENGTH + i, obj.getTotalAcc(), null);
            modiNumCell(dataSheet, 5, TITLE_LENGTH + i, obj.getMonthInCount(), null);
            modiNumCell(dataSheet, 6, TITLE_LENGTH + i, obj.getTotalInMoney(), null);
            modiNumCell(dataSheet, 7, TITLE_LENGTH + i, obj.getMonthOutCount(), null);
            modiNumCell(dataSheet, 8, TITLE_LENGTH + i, obj.getMonthOutMoney(), null);
        }
        // 删除�I��
        for (int j = vecData.size() + TITLE_LENGTH; j < SHEET_HEIGHT; j++)
        {
            dataSheet.removeRow(vecData.size() + TITLE_LENGTH);
        }
        // 插入公式
        for(int i = 2; i < SHEET_WIDTH; i ++)
        {
            modiFormulaCell(dataSheet, i, vecData.size() + TITLE_LENGTH, 8, vecData.size() + TITLE_LENGTH, null);
        }
    }

    /**
     * 修改字符单元格的�?br />     * @param dataSheet WritableSheet : 工作�?br />     * @param col int : �?br />     * @param row int : �?br />     * @param str String : 字符
     * @param format CellFormat : 单元格的样式
     * @throws RowsExceededException
     * @throws WriteException
     */
    private void modiStrCell(WritableSheet dataSheet, int col, int row, String str, CellFormat format) throws RowsExceededException, WriteException
    {
        // 获得单元格对�?br />        WritableCell cell = dataSheet.getWritableCell(col, row);
        // 判断单元格的�c�d��, 做出相应的�{�?br />        if (cell.getType() == CellType.EMPTY)
        {
            Label lbl = new Label(col, row, str);
            if(null != format)
            {
                lbl.setCellFormat(format);
            } else
            {
                lbl.setCellFormat(cell.getCellFormat());
            }
            dataSheet.addCell(lbl);
        } else if (cell.getType() == CellType.LABEL)
        {
            Label lbl = (Label)cell;
            lbl.setString(str);
        } else if (cell.getType() == CellType.NUMBER)
        {
            // 数字单元��g��?br />            Number n1 = (Number)cell;
            n1.setValue(42.05);
        }
    }

    /**
     * 修改数字单元格的�?br />     * @param dataSheet WritableSheet : 工作�?br />     * @param col int : �?br />     * @param row int : �?br />     * @param num double : 数�?br />     * @param format CellFormat : 单元格的样式
     * @throws RowsExceededException
     * @throws WriteException
     */
    private void modiNumCell(WritableSheet dataSheet, int col, int row, double num, CellFormat format) throws RowsExceededException, WriteException
    {
        // 获得单元格对�?br />        WritableCell cell = dataSheet.getWritableCell(col, row);
        // 判断单元格的�c�d��, 做出相应的�{�?br />        if (cell.getType() == CellType.EMPTY)
        {
            Number lbl = new Number(col, row, num);
            if(null != format)
            {
                lbl.setCellFormat(format);
            } else
            {
                lbl.setCellFormat(cell.getCellFormat());
            }
            dataSheet.addCell(lbl);
        } else if (cell.getType() == CellType.NUMBER)
        {
            // 数字单元��g��?br />            Number lbl = (Number)cell;
            lbl.setValue(num);
        } else if (cell.getType() == CellType.LABEL)
        {
            Label lbl = (Label)cell;
            lbl.setString(String.valueOf(num));
        }
    }

    /**
     * 修改公式单元格的�?br />     * @param dataSheet WritableSheet : 工作�?br />     * @param col int : �?br />     * @param row int : �?br />     * @param startPos int : 开始位�|?br />     * @param endPos int : �l�束位置
     * @param format
     * @throws RowsExceededException
     * @throws WriteException
     */
    private void modiFormulaCell(WritableSheet dataSheet, int col, int row, int startPos, int endPos, CellFormat format) throws RowsExceededException, WriteException
    {
        String f = getFormula(col, row, startPos, endPos);
        // 插入公式�Q�只支持插入�Q�不支持修改�Q?br />        WritableCell cell = dataSheet.getWritableCell(col, row);
        if (cell.getType() == CellType.EMPTY)
        {
            // 公式单元�?br />            Formula lbl = new Formula(col, row, f);
            if(null != format)
            {
                lbl.setCellFormat(format);
            } else
            {
                lbl.setCellFormat(cell.getCellFormat());
            }
            dataSheet.addCell(lbl);
        } else if (cell.getType() == CellType.STRING_FORMULA)
        {
            YTLogger.logWarn("Formula modify not supported!");
        }
    }

    /**
     * 得到公式
     * @param col int : �?br />     * @param row int : �?br />     * @param startPos int : 开始位�|?br />     * @param endPos int : �l�束位置
     * @return String
     * @throws RowsExceededException
     * @throws WriteException
     */
    private String getFormula(int col, int row, int startPos, int endPos)
            throws RowsExceededException, WriteException
    {
        char base = 'A';
        char c1 = base;
        StringBuffer formula = new StringBuffer(128);
        // �l�装公式
        formula.append("SUM(");
        if (col <= 25)
        {
            c1 = (char) (col % 26 + base);
            formula.append(c1).append(startPos).append(":")
                   .append(c1).append(endPos).append(")");
        } else if (col > 25)
        {
            char c2 = (char) ((col - 26) / 26 + base);
            c1 = (char) ((col - 26) % 26 + base);
            formula.append(c2).append(c1).append(startPos).append(":")
                   .append(c2).append(c1).append(endPos).append(")");
        }

        return formula.toString();
    }

    /**
     * 插入图表工作�?br />     * @param wwb WritableWorkbook : 工作��?br />     * @param vecImg Vector : 囑փ�链表
     * @throws RowsExceededException
     * @throws WriteException
     */
    private void insertImgsheet(WritableWorkbook wwb, Vector vecImg)
            throws RowsExceededException, WriteException
    {
        // 插入囑փ�
        WritableSheet imgSheet;
        if((wwb.getSheets()).length < 2)
        {
            imgSheet = wwb.createSheet("图表", 1);
        } else
        {
            imgSheet = wwb.getSheet(1);
        }

        for (int i = 0; i < vecImg.size(); i++)
        {
            ChartImg chart = (ChartImg) vecImg.get(i);
            // 插入囑փ�标题
            Label lbl = new Label(0, 2 + 20 * i, chart.getImgTitle());
            WritableFont font = new WritableFont(WritableFont.ARIAL,
                    WritableFont.DEFAULT_POINT_SIZE, WritableFont.NO_BOLD, false,
                    UnderlineStyle.NO_UNDERLINE, Colour.DARK_BLUE2);
            WritableCellFormat background = new WritableCellFormat(font);
            background.setWrap(true);
            background.setBackground(Colour.GRAY_25);
            imgSheet.mergeCells(0, 2 + 20 * i, 9, 2 + 20 * i);
            lbl.setCellFormat(background);
            imgSheet.addCell(lbl);
            // 插入囑փ�单元�?br />            insertImgCell(imgSheet, 2, 4 + 20 * i, 8, 15, chart.getImgName());
        }
    }

    /**
     * 插入囑փ�到单元格�Q�图像格式只支持png�Q?br />     * @param dataSheet WritableSheet : 工作�?br />     * @param col int : �?br />     * @param row int : �?br />     * @param width int : �?br />     * @param height int : �?br />     * @param imgName String : 囑փ�的全路径
     * @throws RowsExceededException
     * @throws WriteException
     */
    private void insertImgCell(WritableSheet dataSheet, int col, int row, int width,
            int height, String imgName) throws RowsExceededException, WriteException
    {
        File imgFile = new File(imgName);
        WritableImage img = new WritableImage(col, row, width, height, imgFile);
        dataSheet.addImage(img);
    }

    /**
     * ��试
     * @param args
     */
    public static void main(String[] args)
    {
        XLSDemo demo = new XLSDemo();
        demo.makeXls();
    }
}

boddi 2006-09-09 12:23 发表评论

jxl实例

boddi — Sat, 09 Sep 2006 03:20:00 GMT
jxl不错�Q�简单易�?br />
import jxl.*;
import jxl.write.*;
import java.io.*;
import java.io.File.*;
import java.util.*;

public class excel
{
public static void main(String[] args)
{

String targetfile = "c:/out.xls";//输出的excel文�g�?br />String worksheet = "List";//输出的excel文�g工作表名
String[] title = {"ID","NAME","DESCRIB"};//excel工作表的标题

WritableWorkbook workbook;
try
{
//创徏可写入的Excel工作�?�q�行生成的文件在tomcat/bin�?br />//workbook = Workbook.createWorkbook(new File("output.xls"));
System.out.println("begin");

OutputStream os=new FileOutputStream(targetfile);
workbook=Workbook.createWorkbook(os);

WritableSheet sheet = workbook.createSheet(worksheet, 0); //��d��W�一个工作表
//WritableSheet sheet1 = workbook.createSheet("MySheet1", 1); //可添加第二个工作
/*
jxl.write.Label label = new jxl.write.Label(0, 2, "A label record"); //put a label in cell A3, Label(column,row)
sheet.addCell(label);
*/

jxl.write.Label label;
for (int i=0; i{
//Label(列号,行号 ,内容 )
label = new jxl.write.Label(i, 0, title[i]); //put the title in row1
sheet.addCell(label);
}

//下列��d��的对字体�{�的讄��均调试通过�Q�可作参考用

//��d��数字
jxl.write.Number number = new jxl.write.Number(3, 4, 3.14159); //put the number 3.14159 in cell D5
sheet.addCell(number);

//��d��带有字型Formatting的对�?
jxl.write.WritableFont wf = new jxl.write.WritableFont(WritableFont.TIMES,10,WritableFont.BOLD,true);
jxl.write.WritableCellFormat wcfF = new jxl.write.WritableCellFormat(wf);
jxl.write.Label labelCF = new jxl.write.Label(4,4,"文本",wcfF);
sheet.addCell(labelCF);

//��d��带有字体颜色,带背景颜�?Formatting的对�?
jxl.write.WritableFont wfc = new jxl.write.WritableFont(WritableFont.ARIAL,10,WritableFont.BOLD,false,jxl.format.UnderlineStyle.NO_UNDERLINE,jxl.format.Colour.RED);
jxl.write.WritableCellFormat wcfFC = new jxl.write.WritableCellFormat(wfc);
wcfFC.setBackground(jxl.format.Colour.BLUE);
jxl.write.Label labelCFC = new jxl.write.Label(1,5,"带颜�?,wcfFC);
sheet.addCell(labelCFC);

//��d��带有formatting的Number对象
jxl.write.NumberFormat nf = new jxl.write.NumberFormat("#.##");
jxl.write.WritableCellFormat wcfN = new jxl.write.WritableCellFormat(nf);
jxl.write.Number labelNF = new jxl.write.Number(1,1,3.1415926,wcfN);
sheet.addCell(labelNF);

//3.��d��Boolean对象
jxl.write.Boolean labelB = new jxl.write.Boolean(0,2,false);
sheet.addCell(labelB);

//4.��d��DateTime对象
jxl.write.DateTime labelDT = new jxl.write.DateTime(0,3,new java.util.Date());
sheet.addCell(labelDT);

//��d��带有formatting的DateFormat对象
jxl.write.DateFormat df = new jxl.write.DateFormat("ddMMyyyyhh:mm:ss");
jxl.write.WritableCellFormat wcfDF = new jxl.write.WritableCellFormat(df);
jxl.write.DateTime labelDTF = new jxl.write.DateTime(1,3,new java.util.Date(),wcfDF);
sheet.addCell(labelDTF);

//和宾单元�?br />//sheet.mergeCells(int col1,int row1,int col2,int row2);//左上角到右下�?br />sheet.mergeCells(4,5,8,10);//左上角到右下�?br />wfc = new jxl.write.WritableFont(WritableFont.ARIAL,40,WritableFont.BOLD,false,jxl.format.UnderlineStyle.NO_UNDERLINE,jxl.format.Colour.GREEN);
jxl.write.WritableCellFormat wchB = new jxl.write.WritableCellFormat(wfc);
wchB.setAlignment(jxl.format.Alignment.CENTRE);
labelCFC = new jxl.write.Label(4,5,"单元合�ƈ",wchB);
sheet.addCell(labelCFC); //

//讄��Ҏ(gu��)��
jxl.write.WritableCellFormat wcsB = new jxl.write.WritableCellFormat();
wcsB.setBorder(jxl.format.Border.ALL,jxl.format.BorderLineStyle.THICK);
labelCFC = new jxl.write.Label(0,6,"�Ҏ(gu��)��讄��",wcsB);
sheet.addCell(labelCFC);
workbook.write();
workbook.close();
}catch(Exception e)
{
e.printStackTrace();
}
System.out.println("end");
Runtime r=Runtime.getRuntime();
Process p=null;
//String cmd[]={"notepad","exec.java"};
String cmd[]={"C:\\Program Files\\Microsoft Office\\Office\\EXCEL.EXE","out.xls"};
try{
p=r.exec(cmd);
}
catch(Exception e){
System.out.println("error executing: "+cmd[0]);
}

}
}

boddi 2006-09-09 11:20 发表评论

Java中合�q�XML文档的合�q?

boddi — Thu, 07 Sep 2006 07:25:00 GMT

Java中合�q�XML文档的设计与实现

作者：凌宗�?李先�?

出处�Q?计算��Z��信息技�?

责�Q�~�辑�Q?方舟

[ 2005-06-09 08:39 ]

　　�?�?/b>�Q�介�l�了XML应用中合�q�XML文档的方法与应用�Q�在��Z��XML的应用中�Q�有着�q�泛的应用前景�?br />
　　关键�?/b>�Q�XML文档解析�?元素

　　在XML应用中，最常用也最实用的莫�q�于XML文�g的读写。由于XML语义比较严格�Q��v始标记必��配对，所以合�q�XML文档�q�不像合�q�普通文仉��L(f��ng)��单。在JAVA中，如何合�ƈXML文档�Q�下面介�l�一�U�方法�?br />
　　设计思想

　　应用javax.xml.parsers包中的解析器解析得到两个XML文�g的根元素�Q�再采用递归的方式逐一复制被合�q�文件的元素�?

　　实现�q�程

　　��Z��d��XML文�g�Q�需�?a class="bluekey" target="_blank">导入如下JAVA包，"http://"后�ؓ注释说明�Q�笔者的环境�?a class="bluekey" target="_blank">JDK 1.3.1�Q�在JDK 1.4.0中测试也通过�?

Import java.io. *; //Java基础包，包含各种IO操作
Import java.util. *; //Java基础包，包含各种标准数据�l�构操作
Import javax.xml.parsers. *; //XML解析器接�?
Import org.w3c.dom. *; //XML的DOM实现
import org.apache.crimson.tree.XmlDocument;//写XML文�g要用�?br />Import javax.xml.transform. *;
Import javax.xml.transform.dom. *;
Import javax.xml.transform.stream. *;

　　下面介绍合�ƈXML文档的过�E�。先说明一下各个方法的作用。方�?a class="bluekey" target="_blank">is Merging()有两�?a class="bluekey" target="_blank">参数�Q�分别是目标XML文�g�?/a>和被合�ƈ的XML文�g名）�Q�调用JAVA的解析器�Q�获得两个要合�ƈ的XML文档的Document�l�构和根元素�Q��ƈ调用�Ҏ(gu��)��duplicate�Q�）和方法write To()。当�Ӟ��在XML文档的合�q�过�E�中�Q�可以加入另外的一些判断条�Ӟ��比如�Q�当被合�q�XML文档不存在时�Q�将如何处理�Q�等�{��?br />
Private Boolean is Merging (String mainFileName, String sub Filename) throws Exception {
　Boolean isOver = false;
　DocumentBuilderFactory dbf = DocumentBuilderFactory.newInstance();
　Document Builder db = null;
　Try {
　　Db = dbf.newDocumentBuilder ();
　} Catch (ParserConfigurationException pce) {
　　System.err.println(pce); //出现异常�Ӟ��输出异常信息
　}
　Document doc_main = null,doc_vice = null;
　//获取两个XML文�g的Document�?br />　Try {
　　Doc_main = db.parse (mainFileName);
　　Doc_vice = db.parse (sub Filename);
　} Catch (DOM Exception dom) {
　　System.err.println (dom.getMessage ());
　} Catch (Exception ioe) {
　　System.err.println (ioe);
　}
　//获取两个文�g的根元素�?br />　Element root_main = doc_main.getDocumentElement ();
　Element root_vice = doc_vice.getDocumentElement ();
　//下面��d��被合�q�文件根节点下的每个元素
　Novelist message Items = root_vice.getChildNodes ();
　Int item_number = messageItems.getLength ();
　//如果��L��根节点下的第一个元素，比如<所属管理系�l?gt; �Q�那么i�?开始。否则i�?开始�?br />　For (int i=1; i < item_number; i=i+2 ) {
　　//调用dupliate()�Q�依�ơ复制被合�ƈXML文档中根节点下的元素�?
　　Element messageItem = (Element) messageItems.item (i);
　　IsOver = dupliate (doc_main, root_main, messageItem);
　}
　//调用 write To()�Q�将合�ƈ得到的Document写入目标XML文档�?br />　Boolean isWritten = write To (doc_main, mainFileName);
　Return isOver && isWritten;
}

　　�Ҏ(gu��)��dupliate ()有三个参敎ͼ�分别是目标XML文档的Document�Q�目标XML文档中要��d��节点的父节点和被合�ƈXML文档的复制节点）�Q�采用递归的�Ş式，��一个XML文档中的元素复制到另一个XML文档中�?br />
Private Boolean dupliate (Document doc_dup, Element father, Element son) throws Exception {
　Boolean is done = false;
　String son_name = son.getNodeName ();
　Element sub ITEM = doc_dup.createElement (son_name);
　//复制节点的属�?br />　If (son.hasAttributes ()){
　　NamedNodeMap attributes = son.getAttributes ();
　　For (int i=0; i < attributes.getLength () ; i ++){
　　　String attribute_name = attributes. Item (i). GetNodeName ();
　　　String attribute_value = attributes. Item (i). GetNodeValue ();
　　　SubITEM.setAttribute (attribute_name, attribute_value);
　　}
　}
　Father.appendChild (sub ITEM);
　//复制节点的�?br />　Text value son = (Text) son.getFirstChild ();
　String nodevalue_root = "";
　If (value_son! = null && value_son.getLength () > 0) nodevalue_root = (String) value_son.getNodeValue ();
　Text valuenode_root = null;
　If ((nodevalue_root! = null)&&(nodevalue_root.length () > 0)) valuenode_root = doc_dup.createTextNode (nodevalue_root);
　If (valuenode_root! = null && valuenode_root.getLength () > 0) subITEM.appendChild (valuenode_root);
　//复制子结�?br />　Novelist sub_messageItems = son.getChildNodes ();
　int sub_item_number = sub_messageItems.getLength();
　if (sub_item_number < 2){
　　//如果没有子节�?则返�?br />　　Is done = true;
　}
　Else {
　　For (int j = 1; j < sub_item_number; j=j+2) {
　　　//如果有子节点,则递归调用本方�?
　　　Element sub_messageItem = (Element) sub_messageItems.item (j);
　　　Is done = dupliate (doc_dup, subITEM, sub_messageItem);
　　}
　}
　Return is done;
}

　　�Ҏ(gu��)��writeTo()有两个参敎ͼ�分别是目标XML文档的Document和文件名�Q�，��所得目标XML文档写入文�g�?br />
Private Boolean write To (Document doc, String fileName) throws Exception {
　Boolean isOver = false;
　DOM Source doms = new DOM Source (doc);
　File f = new File (fileName);
　Stream Result sr = new Stream Result (f);
　Try
　{
　　Transformer Factory tf=TransformerFactory.newInstance ();
　　Transformer t=tf.newTransformer ();
　　Properties properties = t.getOutputProperties ();
　　Properties.setProperty (OutputKeys.ENCODING,"GB2312");
　　T.setOutputProperties (properties);
　　T.transform (doms, sr);
　　IsOver = true;
　}
　Catch (TransformerConfigurationException tce)
　{
　　Tce.printStackTrace ();
　}
　Catch (Transformer Exception te)
　{
　　Te.printStackTrace ();
　}
　Return isOver;
}

　　最后��用测试函数进行测试。对于两个已�l�存在的XML文�g�Q�比如，存在文�gD:/a.xml和D:/b.xml�Q�要��b.xml合�ƈ到a.xml中）�Q�可以测试如下：

Public static void main (String [] args) throws Exception {
　Boolean is done = is Merging ("D:/a.xml","D:/b.xml");
　If (is Done) System.out.println ("XML files have been merged.");
　Else System.out.println ("XML files have NOT been merged.");
}

　　�ȝ��

　　本文介绍了如何利用JAVA中的XML解析器，合�ƈ两个XML文档。当�Ӟ��在合�q�的�q�程中，�q�可以加入其他的�U�束条�g�Q�比如要求过滤掉特定的元素等。另外，复制元素的插入位�|�也可以加以限制�?br />

boddi 2006-09-07 15:25 发表评论

boddi — Wed, 06 Sep 2006 05:34:00 GMT

在应用中加入全文��索功�?br />    ——基于Java的全文烦引引擎Lucene��?

作者：车东 Email: chedongATbigfoot.com/chedongATchedong.com

写于�Q?002/08 最后更斎ͼ� 02/22/2006 14:42:55
Feed Back >> (Read this before you ask question)

版权声明�Q�可以�Q意�{载，转蝲时请务必以超链接形式标明文章原始出处和作者信息及本声�?br />http://www.chedong.com/tech/lucene.html

关键词：Lucene java full-text search engine Chinese word segment

内容摘要�Q?/p>
Lucene是一个基于Java的全文烦引工具包�?/p>

��Z��Java的全文烦引引擎Lucene��介：关于作者和Lucene的历�?/a>

全文��索的实现�Q�Luene全文索引和数据库索引的比�?/a>

中文切分词机制简介：��Z��词库和自动切分词��法的比�?/a>

具体的安装和使用��介：�pȝ��l�构介绍和演�C?/a>

Hacking Lucene�Q�简化的查询分析器，删除的实玎ͼ�定制的排序，应用接口的扩�?/a>

从Lucene我们�q�可以学��C��?/a>

��Z��Java的全文烦�?��索引擎——Lucene

Lucene不是一个完整的全文索引应用�Q�而是是一个用Java写的全文索引引擎工具包，它可以方便的嵌入到各�U�应用中实现针对应用的全文烦�?��索功能�?/p>
Lucene的作者：Lucene的�A(ch��)献�?a >Doug Cutting是一位资深全文烦�?��索专�Ӟ��曄��是V-Twin搜烦引擎(Apple的Copland操作�pȝ��的成��׃��一)的主要开发者，后在Excite担�Q高��pȝ��架构设计师，目前从事于一些INTERNET底层架构的研�I�。他贡献出的Lucene的目标是为各�U�中��型应用�E�序加入全文��索功能�?/p>
Lucene的发展历�E�：早先发布在作者自��q��www.lucene.com�Q�后来发布在SourceForge�Q?001�q�年底成为APACHE基金会jakarta的一个子��目�Q?a >http://jakarta.apache.org/lucene/

已经有很多Java��目都��用了Lucene作�ؓ其后台的全文索引引擎�Q�比较著名的有：

J ive�Q�WEB论坛�pȝ��Q?

Eyebrows�Q�邮件列表HTML归档/��览/查询�pȝ��Q�本文的主要参考文档�?a >TheLucene search engine: Powerful, flexible, and free”作者就是EyeBrows�pȝ��的主要开发者之一�Q�而EyeBrows已经成�ؓ目前APACHE��目的主要邮件列表归档系�l��?

Cocoon:��Z��XML的web发布框架�Q�全文检索部分��用了Lucene

Eclipse:��Z��Java的开攑ּ�发��^収ͼ�帮助部分的全文烦引��用了Lucene

对于中文用户来说�Q�最兛_��的问题是其是否支持中文的全文��索。但通过后面对于Lucene的结构的介绍�Q�你会了解到�׃��Lucene良好架构设计�Q�对中文的支持只需对其语言词法分析接口�q�行扩展��p��实现对中文检索的支持�?/p>
全文��索的实现机制

Lucene的API接口设计的比较通用�Q�输入输出结构都很像数据库的�?=>记录==>字段�Q�所以很多传�l�的应用的文件、数据库�{�都可以比较方便的映��到Lucene的存储结�?接口中。��M��上看�Q�可以先�?b>Lucene当成一个支持全文烦引的数据库系�l?/b>�?/p>
比较一下Lucene和数据库�Q?/p>

Lucene 数据�?/td>

索引数据源：doc(field1,field2...) doc(field1,field2...)
\ indexer /
_____________
| Lucene Index|
--------------
/ searcher \
�l�果输出�Q�Hits(doc(field1,field2) doc(field1...))

索引数据源：record(field1,field2...) record(field1..)
\ SQL: insert/
_____________
| DB Index |
-------------
/ SQL: select \
�l�果输出�Q�results(record(field1,field2..) record(field1...))

Document�Q�一个需要进行烦引的“单元�?br />一个Document由多个字�D늻��?/td> Record�Q�记录，包含多个字段

Field�Q�字�D?/td> Field�Q�字�D?/td>

Hits�Q�查询结果集�Q�由匚w��的Document�l�成 RecordSet�Q�查询结果集�Q�由多个Record�l�成

全文��?�?like "%keyword%"

通常比较厚的书籍后面常常附关键词索引表（比如�Q�北京：12, 34��，上�v�Q?,77��……）�Q�它能够帮助读者比较快地找到相兛_��容的��늠�。而数据库索引能够大大提高查询的速度原理也是一��P��惛_��一下通过书后面的索引查找的速度要比一��一��地��d��定w��多少倍……而烦引之所以效率高�Q�另外一个原因是它是排好序的�?b>对于��索系�l�来说核心是一个排序问�?/b>�?/p>
�׃��数据库烦引不是�ؓ全文索引设计的，因此�Q?b>使用like "%keyword%"�Ӟ��数据库烦引是不�v作用�?/b>�Q�在使用like查询�Ӟ��搜烦�q�程又变成类��g��一��页��M��的遍历过�E�了�Q�所以对于含有模�p�查询的数据库服务来��_��LIKE�Ҏ(gu��)��能的危��x��极大的。如果是需要对多个关键词进行模�p�匹配：like"%keyword1%" and like "%keyword2%" ...其效率也��可惌��知了�?/p>
所以徏立一个高效检索系�l�的关键是徏立一个类��g��U�技索引一��L(f��ng)��反向索引机制�Q�将数据源（比如多篇文章�Q�排序顺序存储的同时�Q�有另外一个排好序的关键词列表�Q�用于存储关键词==>文章映射关系�Q�利用这��L(f��ng)��映射关系索引�Q�[关键�?=>出现关键词的文章�~�号�Q�出现次敎ͼ�甚至包括位置�Q��v始偏�U�量�Q�结束偏�U�量�Q�，出现频率]�Q�检索过�E�就是把模糊查询变成多个可以利用索引的精��查询的逻辑�l�合的过�E?/b>。从而大大提高了多关键词查询的效率，所以，全文��索问题归�l�到最后是一个排序问题�?/p>
由此可以看出模糊查询相对数据库的�_��查询是一个非�怸��定的问题，�q�也是大部分数据库对全文��索支持有限的原因。Lucene最核心的特征是通过�Ҏ(gu��)��的烦引结构实��C��传统数据库不擅长的全文烦引机�Ӟ��q�提供了扩展接口�Q�以方便针对不同应用的定制�?/p>
可以通过一下表格对比一下数据库的模�p�查询：

　 Lucene全文索引引擎数据�?/td>

索引 ��数据源中的数据都通过全文索引一一建立反向索引对于LIKE查询来说�Q�数据传�l�的索引是根本用不上的。数据需要逐个便利记录�q�行GREP式的模糊匚w��Q�比有烦引的搜烦速度要有多个数量�U�的下降�?/td>

匚w��效果通过词元(term)�q�行匚w��Q�通过语言分析接口的实玎ͼ�可以实现对中文等非英语的支持�?/td> 使用�Q�like "%net%" 会把netherlands也匹配出来，
多个关键词的模糊匚w��Q��用like "%com%net%"�Q�就不能匚w��词序颠倒的xxx.net..xxx.com

匚w��?/td> 有匹配度��法�Q�将匚w��E�度�Q�相似度�Q�比较高的结果排在前面�?/td> 没有匚w��E�度的控�Ӟ��比如有记录中net出现5词和出现1�ơ的�Q�结果是一��L(f��ng)��?/td>

�l�果输出通过特别的算法，��最匚w��度最高的�?00条结果输出，�l�果集是�~�冲式的��批量读取的�?/td> �q�回所有的�l�果集，在匹配条目非常多的时候（比如上万条）需要大量的内存存放�q�些临时�l�果集�?/td>

可定制�?/td> 通过不同的语�a�分析接口实现�Q�可以方便的定制出符合应用需要的索引规则�Q�包括对中文的支持）没有接口或接口复杂，无法定制

�l�论高负载的模糊查询应用�Q�需要负责的模糊查询的规则，索引的资料量比较�?/td> 使用率低�Q�模�p�匹配规则简单或者需要模�p�查询的资料量少

全文��索和数据库应用最大的不同在于�Q�让最相关�?/span> �?00条结果满��?8%以上用户的需�?br />
Lucene的创��C��处：

大部分的搜烦�Q�数据库�Q�引擎都是用B�?w��i)结构来�l�护索引�Q�烦引的更新会导致大量的IO操作�Q�Lucene在实��C��Q�对此稍微有所改进�Q�不是维护一个烦引文�Ӟ��而是在扩展烦引的时候不断创建新的烦引文�Ӟ��然后定期的把�q�些新的��烦引文件合�q�到原先的大索引中（针对不同的更新策略，�Ҏ(gu��)��的大��可以调��_��Q�这样在不媄响检索的效率的前提下�Q�提高了索引的效率�?/p>
Lucene和其他一些全文检索系�l?应用的比较：

　 Lucene 其他开源全文检索系�l?/td>

增量索引和批量烦�?/td> 可以�q�行增量的烦�?Append)�Q�可以对于大量数据进行批量烦引，�q�且接口设计用于优化扚w��索引和小扚w��的增量烦引�?/td> 很多�pȝ��只支持批量的索引�Q�有时数据源有一点增加也需要重建烦引�?/td>

数据�?/td> Lucene没有定义具体的数据源�Q�而是一个文档的�l�构�Q�因此可以非常灵�zȝ��适应各种应用�Q�只要前端有合适的转换器把数据源�{换成相应�l�构�Q�，很多�pȝ��只针对网��，�~�Z��其他格式文档的灵�z�L��?/td>

索引内容抓取 Lucene的文档是由多个字�D늻�成的�Q�甚臛_��以控刉��些字�D�需要进行烦引，那些字段不需要烦引，�q�一步烦引的字段也分为需要分词和不需要分词的�c�d��Q?br />   需要进行分词的索引�Q�比如：标题�Q�文章内容字�D?br />   不需要进行分词的索引�Q�比如：作�?日期字段 �~�Z��通用性，往往��文档整个烦引了

语言分析通过语言分析器的不同扩展实现�Q?br />可以�q��o掉不需要的词：an the of �{�，
西文语法分析�Q�将jumps jumped jumper都归�l�成jump�q�行索引/��?br />非英文支持：对亚�z�语�a��Q�阿拉伯语言的烦引支�?/td> �~�Z��通用接口实现

查询分析通过查询分析接口的实玎ͼ�可以定制自己的查询语法规则：
比如�Q?多个关键词之间的 + - and or关系�{?/td> 　

�q�发讉K�� 能够支持多用��L(f��ng)��使用　

　

关于亚洲语言的的切分词问�?Word Segment)

对于中文来说�Q�全文烦引首先还要解决一个语�a�分析的问题，对于英文来说�Q�语句中单词之间是天焉��过�I�格分开的，但亚�z�语�a�的中日韩文语句中的字是一个字挨一个，所有，首先要把语句中按“词”进行烦引的话，�q�个词如何切分出来就是一个很大的问题�?/p>
首先�Q�肯定不能用单个字符�?si-gram)为烦引单元，否则查“上��”时�Q�不能让含有“�v上”也匚w��?/p>
但一句话�Q�“北京天安门”，计算机如何按照中文的语言�?f��n)惯�q�行切分呢？
“北�?天安门�?�q�是“北 �?天安门”？让计��机能够按照语言�?f��n)惯�q�行切分�Q�往往需要机器有一个比较丰富的词库才能够比较准��的识别��句中的单词�?/p>
另外一个解决的办法是采用自动切分算法：��单词按�?元语�?bigram)方式切分出来�Q�比如：
"北京天安�? ==> "北京京天天安安门"�?/p>
�q�样�Q�在查询的时候，无论是查�?北京" �q�是查询"天安�?�Q�将查询词组按同��L(f��ng)��规则�q�行切分�Q?北京"�Q?天安安门"�Q�多个关键词之间按与"and"的关�pȝ��合，同样能够正确地映��到相应的烦引中。这�U�方式对于其他亚�z�语�a��Q�韩文，日文都是通用的�?/p>
��Z��自动切分的最大优�Ҏ(gu��)��没有词表�l�护成本�Q�实现简单，�~�点是烦引效率低�Q�但对于中小型应用来��_��Z��2元语法的切分�q�是够用的。基�?元切分后的烦引一般大��和源文件差不多�Q�而对于英文，索引文�g一般只有原文�g�?0%-40%不同�Q?/p>

自动切分词表切分

实现实现非常��?/td> 实现复杂

查询增加了查询分析的复杂�E�度�Q?/td> 适于实现比较复杂的查询语法规�?/td>

存储效率索引冗余大，索引几乎和原文一样大索引效率高，为原文大��的30�Q�左�?/td>

�l�护成本无词表维护成�?/td> 词表�l�护成本非常高：中日韩等语言需要分别维护�?br />�q�需要包括词频统计等内容

适用领域嵌入式系�l�：�q�行环境资源有限
分布式系�l�：无词表同步问�?br />多语�a�环境�Q�无词表�l�护成本 �Ҏ(gu��)��询和存储效率要求高的专业搜烦引擎

目前比较大的搜烦引擎的语�a�分析��法一般是��Z��以上2个机制的�l�合。关于中文的语言分析��法�Q�大家可以在Google查关键词"wordsegment search"能找到更多相关的资料�?/p>
安装和��?/b>

下蝲�Q?a >http://jakarta.apache.org/lucene/

注意�Q�Lucene中的一些比较复杂的词法分析是用JavaCC生成的（JavaCC�Q�JavaCompilerCompiler�Q�纯Java的词法分析生成器�Q�，所以如果从源代码编译或需要修改其中的QueryParser、定制自��q��词法分析器，�q�需要从https://javacc.dev.java.net/下蝲javacc�?/p>
lucene的组成结构：对于外部应用来说索引模块(index)和检索模�?search)是主要的外部应用入口

org.apache.Lucene.search/ 搜烦入口

org.apache.Lucene.index/ 索引入口

org.apache.Lucene.analysis/ 语言分析�?/td>

org.apache.Lucene.queryParser/ 查询分析�?/td>

org.apache.Lucene.document/ 存储�l�构

org.apache.Lucene.store/ 底层IO/存储�l�构

org.apache.Lucene.util/ 一些公用的数据�l�构

��单的例子演示一下Lucene的��用方法：
索引�q�程�Q�从命��o行读取文件名�Q�多个）�Q�将文�g分�\�?path字段)和内�?body字段)2个字�D�进行存储，�q�对内容�q�行全文索引�Q�烦引的单位是Document对象�Q�每个Document对象包含多个字段Field对象�Q�针对不同的字段属性和数据输出的需求，对字�D�还可以选择不同的烦�?存储字段规则�Q�列表如下：
�Ҏ(gu��)�� 切词索引存储用�?/th>
Field.Text(String name, String value) Yes Yes Yes 切分词烦引�ƈ存储�Q�比如：标题�Q�内容字�D?/td>
Field.Text(String name, Reader value) Yes Yes No 切分词烦引不存储�Q�比如：META信息�Q?br />不用于返回显�C�，但需要进行检索内�?/td>
Field.Keyword(String name, String value) No Yes Yes 不切分烦引�ƈ存储�Q�比如：日期字段
Field.UnIndexed(String name, String value) No No Yes 不烦引，只存储，比如�Q�文件�\�?/td>
Field.UnStored(String name, String value) Yes Yes No 只全文烦引，不存�?/td>
public class IndexFiles {
//使用�Ҏ(gu��)��Q? IndexFiles [索引输出目录] [索引的文件列表] ...
public static void main(String[] args) throws Exception {
String indexPath = args[0];
IndexWriter writer;
//用指定的语言分析器构造一个新的写索引器（�W?个参数表�C�是否�ؓ�q�加索引�Q?br /> writer = new IndexWriter(indexPath, new SimpleAnalyzer(), false);

for (int i=1; i System.out.println("Indexing file " + args[i]);
InputStream is = new FileInputStream(args[i]);

//构造包�?个字�D�Field的Document对象
//一个是路径path字段�Q�不索引�Q�只存储
//一个是内容body字段�Q�进行全文烦引，�q�存�?br /> Document doc = new Document();
doc.add(Field.UnIndexed("path", args[i]));
doc.add(Field.Text("body", (Reader) new InputStreamReader(is)));
//��文档写入烦�?br /> writer.addDocument(doc);
is.close();
};
//关闭写烦引器
writer.close();
}
}
　
索引�q�程中可以看刎ͼ�
语言分析器提供了抽象的接口，因此语言分析(Analyser)是可以定制的�Q�虽然lucene�~�省提供�?个比较通用的分析器SimpleAnalyser和StandardAnalyser�Q�这2个分析器�~�省都不支持中文�Q�所以要加入对中文语�a�的切分规则，需要修改这2个分析器�?
Lucene�q�没有规定数据源的格式，而只提供了一个通用的结构（Document对象�Q�来接受索引的输入，因此输入的数据源可以是：数据库，W(xu��)ORD文档�Q�PDF文档�Q�HTML文档……只要能够设计相应的解析转换器将数据源构造成成Docuement对象卛_��q�行索引�?
对于大批量的数据索引�Q�还可以通过调整IndexerWrite的文件合�q��率属性（mergeFactor�Q�来提高扚w��索引的效率�?
��索过�E�和�l�果昄��Q?/p>
搜烦�l�果�q�回的是Hits对象�Q�可以通过它再讉K��Document==>Field中的内容�?/p>
假设�Ҏ(gu��)��body字段�q�行全文��索，可以��查询结果的path字段和相应查询的匚w��?score)打印出来�Q?/p>
public class Search {
public static void main(String[] args) throws Exception {
String indexPath = args[0], queryString = args[1];
//指向索引目录的搜索器
Searcher searcher = new IndexSearcher(indexPath);
//查询解析器：使用和烦引同��L(f��ng)��语言分析�?br /> Query query = QueryParser.parse(queryString, "body",
new SimpleAnalyzer());
//搜烦�l�果使用Hits存储
Hits hits = searcher.search(query);
//通过hits可以讉K��到相应字�D늚�数据和查询的匚w��?br /> for (int i=0; i System.out.println(hits.doc(i).get("path") + "; Score: " +
hits.score(i));
};
}
}
在整个检索过�E�中�Q�语�a�分析器，查询分析器，甚至搜烦器（Searcher�Q�都是提供了抽象的接口，可以�Ҏ(gu��)��需要进行定制�?
Hacking Lucene
��化的查询分析�?/b>
个�h感觉lucene成�ؓJAKARTA��目后，��d��了太多的旉��用于调试日趋复杂QueryParser�Q�而其中大部分是大多数用户�q�不很熟�(zh��n)�的�Q�目前LUCENE支持的语法：
Query ::= ( Clause )*
Clause ::= ["+", "-"] [ ":"] ( | "(" Query ")")
中间的逻辑包括�Q�and or + - &&||�{�符��P��而且�q�有"短语查询"和针对西文的前缀/模糊查询�{�，个�h感觉对于一般应用来��_��q�些功能有一些华而不实，其实能够实现目前�c�M��于Google的查询语句分析功能其实对于大多数用户来说已经够了。所以，Lucene早期版本的QueryParser仍是比较好的选择�?/p>
��d��修改删除指定记录�Q�Document�Q?/b>
Lucene提供了烦引的扩展机制�Q�因此烦引的动态扩展应该是没有问题的，而指定记录的修改也似乎只能通过记录的删除，然后重新加入实现。如何删除指定的记录呢？删除的方法也很简单，只是需要在索引时根据数据源中的记录ID专门另徏索引�Q�然后利用IndexReader.delete(Termterm)�Ҏ(gu��)��通过�q�个记录ID删除相应的Document�?/p>
�Ҏ(gu��)��某个字段值的排序功能
lucene�~�省是按照自��q��相关度算法（score�Q�进行结果排序的�Q�但能够�Ҏ(gu��)��其他字段�q�行�l�果排序是一个在LUCENE的开发邮件列表中�l�常提到的问题，很多原先��Z��数据库应用都需要除了基于匹配度�Q�score�Q�以外的排序功能。而从全文��索的原理我们可以了解刎ͼ��M��不基于烦引的搜烦�q�程效率都会��D��效率非常的低�Q�如果基于其他字�D늚�排序需要在搜烦�q�程中访问存储字�D�，速度回大大降低，因此非常是不可取的�?/p>
但这里也有一个折中的解决�Ҏ(gu��)��Q�在搜烦�q�程中能够媄响排序结果的只有索引中已�l�存储的docID和score�q?个参敎ͼ�所以，��Z��score以外的排序，其实可以通过��数据源预先排好序，然后�Ҏ(gu��)��docID�q�行排序来实现。这样就避免了在LUCENE搜烦�l�果外对�l�果再次�q�行排序和在搜烦�q�程中访问不在烦引中的某个字�D�倹{�?/p>
�q�里需要修改的是IndexSearcher中的HitCollector�q�程�Q?/p>
...
　scorer.score(new HitCollector() {
private float minScore = 0.0f;
public final void collect(int doc, float score) {
if (score > 0.0f && // ignore zeroed buckets
(bits==null || bits.get(doc))) { // skip docs not in bits
totalHits[0]++;
if (score >= minScore) {
/* 原先�Q�Lucene��docID和相应的匚w��度score例入�l�果命中列表中：
* hq.put(new ScoreDoc(doc, score)); // update hit queue
* 如果用doc �?1/doc 代替 score�Q�就实现了根据docID��排或逆排
* 假设数据源烦引时已经按照某个字段排好了序�Q�而结果根据docID排序也就实现�?br /> * 针对某个字段的排序，甚至可以实现更复杂的score和docID的拟合�?br /> */
hq.put(new ScoreDoc(doc, (float) 1/doc ));
if (hq.size() > nDocs) { // if hit queue overfull
hq.pop(); // remove lowest in hit queue
minScore = ((ScoreDoc)hq.top()).score; // reset minScore
}
}
}
}
}, reader.maxDoc());
更通用的输入输出接�?/b>
虽然lucene没有定义一个确定的输入文档格式�Q�但��来��多的�h惛_��使用一个标准的中间格式作�ؓLucene的数据导入接口，然后其他数据�Q�比如PDF只需要通过解析器�{换成标准的中间格式就可以�q�行数据索引了。这个中间格式主要以XML��Z��Q�类似实现已�l�不�?�Q?个：
数据�? WORD PDF HTML DB other
\ | | | /
XML中间格式
|
Lucene INDEX
目前�q�没有针对MSWord文档的解析器�Q�因为Word文档和基于ASCII的RTF文档不同�Q�需要��用COM对象机制解析。这个是我在Google上查的相兌��料：http://www.intrinsyc.com/products/enterprise_applications.asp
另外一个办法就是把Word文档转换成text�Q?a >http://www.winfield.demon.nl/index.html

索引�q�程优化
索引一般分2�U�情况，一�U�是��批量的索引扩展�Q�一�U�是大批量的索引重徏。在索引�q�程中，�q�不是每�ơ新的DOC加入�q�去索引都重新进行一�ơ烦引文件的写入操作�Q�文件I/O是一仉��常消耗资源的事情�Q��?/p>
Lucene先在内存中进行烦引操作，�q�根据一定的扚w��q�行文�g的写入。这个批�ơ的间隔��大�Q�文件的写入�ơ数��少�Q�但占用内存会很多。反之占用内存少�Q�但文�gIO操作频繁�Q�烦引速度会很慢。在IndexWriter中有一个MERGE_FACTOR参数可以帮助你在构造烦引器后根据应用环境的情况充分利用内存减少文�g的操作。根据我的��用经验：�~�省Indexer是每20条记录烦引后写入一�ơ，每将MERGE_FACTOR增加50倍，索引速度可以提高1倍左叟�?br />
搜烦�q�程优化
lucene支持内存索引�Q�这��L(f��ng)��搜烦比基于文件的I/O有数量��的速度提升�?br />http://www.onjava.com/lpt/a/3273
而尽可能减少IndexSearcher的创建和�Ҏ(gu��)��索结果的前台的缓存也是必要的�?br />
Lucene面向全文��索的优化在于首次索引��索后�Q��ƈ不把所有的记录�Q�Document�Q�具体内容读取出来，而�v只将所有结果中匚w��度最高的�?00条结果（TopDocs�Q�的ID攑ֈ��l�果集缓存中�q�返回，�q�里可以比较一下数据库��索：如果是一�?0,000条的数据库检索结果集�Q�数据库是一定要把所有记录内定w��取得以后再开始返回给应用�l�果集的。所以即使检索匹配��L��很多�Q�Lucene的结果集占用的内存空间也不会很多。对于一般的模糊��索应用是用不到这么多的结果的�Q�头100条已�l�可以满��?0%以上的检索需求�?br />
如果首批�~�存�l�果数用完后�q�要��d��更后面的�l�果时Searcher会再�ơ检索�ƈ生成一个上�ơ的搜烦�~�存数大1倍的�~�存�Q��ƈ再重新向后抓取。所以如果构造一个Searcher��L��1�Q?20条结果，Searcher其实是进行了2�ơ搜索过�E�：�?00条取完后�Q�缓存结果用完，Searcher重新��索再构造一�?00条的�l�果�~�存�Q�依此类推，400条缓存，800条缓存。由于每�ơSearcher对象消失后，�q�些�~�存也访问那不到了，你有可能惛_��l�果记录�~�存下来�Q�缓存数��量保证�?00以下以充分利用首�ơ的�l�果�~�存�Q�不让Lucene��费多次��索，而且可以分��q�行�l�果�~�存�?br />
Lucene的另外一个特�Ҏ(gu��)��在收集结果的�q�程中将匚w��度低的结果自动过滤掉了。这也是和数据库应用需要将搜烦的结果全部返回不同之处�?/p>
我的一些尝�?/a>�Q?/p>
支持中文的Tokenizer�Q�这里有2个版本，一个是通过JavaCC生成的，对CJK部分按一个字�W�一个TOKEN索引�Q�另外一个是从SimpleTokenizer改写的，对英文支持数字和字母TOKEN�Q�对中文按�P代烦引�?
��Z��XML数据源的索引器：XMLIndexer�Q�因此所有数据源只要能够按照DTD转换成指定的XML�Q�就可以用XMLIndxer�q�行索引了�?
�Ҏ(gu��)��某个字段排序�Q�按记录索引��序排序�l�果的搜索器�Q�IndexOrderSearcher�Q�因此如果需要让搜烦�l�果�Ҏ(gu��)��某个字段排序�Q�可以让数据源先按某个字�D�|��好序�Q�比如：PriceField�Q�，�q�样索引后，然后在利用这个按记录的ID��序��索的搜烦器，�l�果��是相当于是那个字段排序的结果了�?
从Lucene学到更多
Luene的确是一个面对对象设计的典范
所有的问题都通过一个额外抽象层来方便以后的扩展和重用：你可以通过重新实现来达到自��q��目的�Q�而对其他模块而不需要；
��单的应用入口Searcher, Indexer�Q��ƈ调用底层一�p�d��l��g协同的完成搜索�Q务；
所有的对象的�Q务都非常专一�Q�比如搜索过�E�：QueryParser分析��查询语句�{换成一�p�d��的精��查询的�l�合(Query),通过底层的烦引读取结构IndexReader�q�行索引的读取，�q�用相应的打分器�l�搜索结果进行打�?排序�{�。所有的功能模块原子化程度非帔R��Q�因此可以通过重新实现而不需要修改其他模块。�?
除了灉|��的应用接口设计，Lucene�q�提供了一些适合大多数应用的语言分析器实玎ͼ�SimpleAnalyser,StandardAnalyser�Q�，�q�也是新用户能够很快上手的重要原因之一�?
�q�些优点都是非常值得在以后的开发中学习(f��n)借鉴的。作��Z��个通用工具包，Lunece的确�l�予了需要将全文��索功能嵌入到应用中的开发者很多的便利�?/p>
此外�Q�通过对Lucene的学�?f��n)和使用�Q�我也更深刻地理解了��Z��么很多数据库优化设计中要求，比如�Q?/p>
��可能对字段�q�行索引来提高查询速度�Q�但�q�多的烦引会�Ҏ(gu��)��据库表的更新操作变慢�Q�而对�l�果�q�多的排序条�Ӟ��实际上往往也是性能的杀手之一�?
很多商业数据库对大批量的数据插入操作会提供一些优化参敎ͼ��q�个作用和烦引器的merge_factor的作用是�c�M��的，
20%/80%原则�Q�查的结果多�q�不�{�于质量好，��其对于�q�回�l�果集很大，如何优化�q�头几十条结果的质量往往才是最重要的�?
��可能让应用从数据库中获得比较小的结果集�Q�因为即使对于大型数据库�Q�对�l�果集的随机讉K��也是一个非常消耗资源的操作�?br />
参考资料：
Apache: Lucene Project
http://jakarta.apache.org/lucene/
Lucene开�?用户邮�g列表归档
Lucene-dev@jakarta.apache.org
Lucene-user@jakarta.apache.org
The Lucene search engine: Powerful, flexible, and free
http://www.javaworld.com/javaworld/jw-09-2000/jw-0915-Lucene_p.html
Lucene Tutorial
http://www.darksleep.com/puff/lucene/lucene.html
Notes on distributed searching with Lucene
http://home.clara.net/markharwood/lucene/
中文语言的切分词
http://www.google.com/search?sourceid=navclient&hl=zh-CN&q=chinese+word+segment
搜烦引擎工具介绍
http://searchtools.com/
Lucene作者Cutting的几��论文和专利
http://lucene.sourceforge.net/publications.html
Lucene�?NET实现�Q�dotLucene
http://sourceforge.net/projects/dotlucene/
Lucene作者Cutting的另外一个项目：��Z��Java的搜索引擎Nutch
http://www.nutch.org/ http://sourceforge.net/projects/nutch/
关于��Z��词表和N-Gram的切分词比较
http://china.nikkeibp.co.jp/cgi-bin/china/news/int/int200302100112.html

2005-01-08 Cutting在Pisa大学做的关于Lucene的讲座：非常详细的Lucene架构解说

boddi 2006-09-06 13:34 发表评论

boddi — Mon, 04 Sep 2006 06:17:00 GMT
使用Windows操作�pȝ��的朋友对Excel(�?sh��)子表�?一定不会陌生，但是要��用Java语言来操�U�Excel文�g�q�不是一件容易的事。在Web应用日益盛行的今天，通过Web来操作Excel文�g的需求越来越强烈�Q�目前较为流行的操作是在JSP或Servlet 中创��Z��个CSV (comma separated values)文�g�Q��ƈ��这个文件以MIME�Q�text/csv�c�d��q�回�l�浏览器�Q�接着��览器调用Excel�q�且昄��CSV文�g。这样只是说可以讉K��刊W�Excel文�g�Q�但是还不能真正的操�U�Excel文�g�Q�本文将�l�大家一个惊喜，向大家介�l�一个开放源码项目，Java Excel API�Q��用它大家��可


以方便地操纵Excel文�g了�?br />
　　Java Excel API��?br />
　　Java Excel是一开放源码项目，通过它Java开发�h员可以读取Excel文�g的内宏V��创建新的Excel文�g、更新已�l�存在的Excel文�g。��用该 API非Windows操作�pȝ��也可以通过�U�Java应用来处理Excel数据表。因为是使用Java�~�写的，所以我们在Web应用中可以通过JSP、 Servlet来调用API实现对Excel数据表的讉K��?br />
　　现在发布的稳定版本是V2.0�Q�提供以下功能：

　　　从Excel 95�?7�?000�{�格式的文�g中读取数据；

　　　��d��Excel公式(可以��d��Excel 97以后的公�?�Q?br />
　　　生成Excel数据�?格式为Excel 97)�Q?br />
　　　支持字体、数字、日期的格式化；

　　　支持单元格的阴媄操作�Q�以及颜色操作；

　　　修改已经存在的数据表�Q?br />
　　现在�q�不支持以下功能�Q�但不久��׃��提供了：

　　　不能够读取图表信息；

　　　可以读，但是不能生成公式�Q��Q何类型公式最后的计算值都可以��d��Q?br />
　　　

　　　应用�C�Z��

　　1、从Excel文�g��d��数据�?br />
　　Java Excel API既可以从本地文�g�pȝ��的一个文�?.xls)�Q�也可以从输入流中读取Excel数据表。读取Excel数据表的�W�一步是创徏Workbook(术语�Q�工作薄)�Q�下面的代码片段举例说明了应该如何操作：(完整代码见ExcelReading.java)

　　import java.io.*;

　　import jxl.*;

　　… … … �?br />
　　try

　　{

　　//构徏Workbook对象, 只读Workbook对象

　　//直接从本地文件创建Workbook

　　//从输入流创徏Workbook

　　InputStream is = new FileInputStream(sourcefile);

　　jxl.Workbook rwb = Workbook.getWorkbook(is);

　　}

　　catch (Exception e)

　　{

　　e.printStackTrace();

　　}

　　一旦创��Z��Workbook�Q�我们就可以通过它来讉K��Excel Sheet(术语�Q�工作表)。参考下面的代码片段�Q?br />
　　//获取�W�一张Sheet�?br />
　　Sheet rs = rwb.getSheet(0);

　　我们既可能通过Sheet的名�U�来讉K��它，也可以通过下标来访问它。如果通过下标来访问的话，要注意的一�Ҏ(gu��)��下标�?开始，��像数组一栗��?br />
　　一旦得��C��Sheet�Q�我们就可以通过它来讉K��Excel Cell(术语�Q�单元格)。参考下面的代码片段�Q?br />
　　//获取�W�一行，�W�一列的�?br />
　　Cell c00 = rs.getCell(0, 0);

　　String strc00 = c00.getContents();

　　//获取�W�一行，�W�二列的�?br />
　　Cell c10 = rs.getCell(1, 0);

　　String strc10 = c10.getContents();

　　//获取�W�二行，�W�二列的�?br />
　　Cell c11 = rs.getCell(1, 1);

　　String strc11 = c11.getContents();

　　System.out.println("Cell(0, 0)" + " value : " + strc00 + "; type : " + c00.getType());

　　System.out.println("Cell(1, 0)" + " value : " + strc10 + "; type : " + c10.getType());

　　System.out.println("Cell(1, 1)" + " value : " + strc11 + "; type : " + c11.getType()); 如果仅仅是取得Cell的��|��我们可以方便地通过getContents()�Ҏ(gu��)��Q�它可以��Q何类型的Cell值都作�ؓ一个字�W�串�q�回。示例代码中Cell(0, 0)是文本型�Q�Cell(1, 0)是数字型�Q�Cell(1,1)是日期型�Q�通过getContents()�Q�三�U�类型的�q�回值都是字�W�型�?br />


　　如果有需要知道Cell内容的确切类型，API也提供了一�p�d��的方法。参考下面的代码片段�Q?br />
　　String strc00 = null;

　　double strc10 = 0.00;

　　Date strc11 = null;

　　Cell c00 = rs.getCell(0, 0);

　　Cell c10 = rs.getCell(1, 0);

　　Cell c11 = rs.getCell(1, 1);

　　if(c00.getType() == CellType.LABEL)

　　{

　　LabelCell labelc00 = (LabelCell)c00;

　　strc00 = labelc00.getString();

　　}

　　if(c10.getType() == CellType.NUMBER)

　　{

　　NmberCell numc10 = (NumberCell)c10;

　　strc10 = numc10.getvalue();

　　}

　　if(c11.getType() == CellType.DATE)

　　{

　　DateCell datec11 = (DateCell)c11;

　　strc11 = datec11.getDate();

　　}

　　System.out.println("Cell(0, 0)" + " value : " + strc00 + "; type : " + c00.getType());

　　System.out.println("Cell(1, 0)" + " value : " + strc10 + "; type : " + c10.getType());

　　System.out.println("Cell(1, 1)" + " value : " + strc11 + "; type : " + c11.getType());

　　在得到Cell对象后，通过getType()�Ҏ(gu��)��可以获得该单元格的类型，然后与 API提供的基本类型相匚w��Q�强制�{换成相应的类型，最后调用相应的取值方法getXXX()�Q�就可以得到��定�c�d��的倹{��API提供了以下基本类型，与 Excel的数据格式相对应�Q�如下图所�C�：

　　每种�c�d��的具体意义，请参见Java Excel API document.

　　当你完成对Excel�?sh��)子表格数据的处理后�Q�一定要使用close()�Ҏ(gu��)��来关闭先前创建的对象�Q�以释放��d��数据表的�q�程中所占用的内存空��_��在读取大量数据时昑־��ؓ重要。参考如下代码片�D�：

　　//操作完成�Ӟ��关闭对象�Q�释攑֍�用的内存�I�间

　　rwb.close();

　　Java Excel API提供了许多访问Excel数据表的�Ҏ(gu��)��Q�在�q�里我只��要地介绍几个常用的方法，其它的方法请参考附录中的Java Excel API document.

　　Workbook�c�L��供的�Ҏ(gu��)��

　　1. int getNumberOfSheets()

　　获得工作�?Workbook)中工作表(Sheet)的个敎ͼ��C�Z��Q?br />
　　jxl.Workbook rwb = jxl.Workbook.getWorkbook(new File(sourcefile));

　　int sheets = rwb.getNumberOfSheets();

　　2. Sheet[] getSheets()

　　�q�回工作�?Workbook)中工作表(Sheet)对象数组�Q�示例：

　　jxl.Workbook rwb = jxl.Workbook.getWorkbook(new File(sourcefile));

　　Sheet[] sheets = rwb.getSheets();

　　3. String getVersion()

　　�q�回正在使用的API的版本号�Q�好像是没什么太大的作用�?br />
　　jxl.Workbook rwb = jxl.Workbook.getWorkbook(new File(sourcefile));

　　String apiVersion = rwb.getVersion();

　　Sheet接口提供的方�?br />
　　1) String getName()

　　获取Sheet的名�U�ͼ��C�Z��Q?br />
　　jxl.Workbook rwb = jxl.Workbook.getWorkbook(new File(sourcefile));

　　jxl.Sheet rs = rwb.getSheet(0);

　　String sheetName = rs.getName();

　　2) int getColumns()

　　获取Sheet表中所包含的��d��敎ͼ��C�Z��Q?br />
　　jxl.Workbook rwb = jxl.Workbook.getWorkbook(new File(sourcefile));

　　jxl.Sheet rs = rwb.getSheet(0);

　　int rsColumns = rs.getColumns();

　　3) Cell[] getColumn(int column)

　　获取某一列的所有单元格�Q�返回的是单元格对象数组�Q�示例：

　　jxl.Workbook rwb = jxl.Workbook.getWorkbook(new File(sourcefile));

　　jxl.Sheet rs = rwb.getSheet(0);

　　Cell[] cell = rs.getColumn(0);

　　4) int getRows()

　　获取Sheet表中所包含的总行敎ͼ��C�Z��Q?br />
　　jxl.Workbook rwb = jxl.Workbook.getWorkbook(new File(sourcefile));

　　jxl.Sheet rs = rwb.getSheet(0);

　　int rsRows = rs.getRows();

　　5) Cell[] getRow(int row)

　　获取某一行的所有单元格�Q�返回的是单元格对象数组�Q�示例子�Q?br />
　　jxl.Workbook rwb = jxl.Workbook.getWorkbook(new File(sourcefile));

　　jxl.Sheet rs = rwb.getSheet(0);

　　Cell[] cell = rs.getRow(0);

　　6) Cell getCell(int column, int row)

　　获取指定单元格的对象引用�Q�需要注意的是它的两个参敎ͼ��W�一个是列数�Q�第二个是行敎ͼ��q�与通常的行、列�l�合有些不同�?br />
　　jxl.Workbook rwb = jxl.Workbook.getWorkbook(new File(sourcefile));

　　jxl.Sheet rs = rwb.getSheet(0);

　　Cell cell = rs.getCell(0, 0); 2、生成新的Excel工作�?br />
　　下面的代码主要是向大家介�l�如何生成简单的Excel工作表，在这里单元格的内�Ҏ(gu��)��不带��M��修饰�?如：字体�Q�颜色等�{?�Q�所有的内容都作为字�W�串写入�?完整代码见ExcelW


riting.java)

　　与读取Excel工作表相��|��首先要��用Workbook�cȝ��工厂�Ҏ(gu��)��创徏一个可写入的工作薄(Workbook)对象�Q�这里要注意的是�Q�只能通过API提供的工厂方法来创徏Workbook�Q�而不能��用 WritableWorkbook的构造函敎ͼ�因�ؓ�c�WritableWorkbook的构造函��Cؓprotected�c�d��。示例代码片�D�如下：

　　import java.io.*;

　　import jxl.*;

　　import jxl.write.*;

　　… … … �?br />
　　try

　　{

　　//构徏Workbook对象, 只读Workbook对象

　　//Method 1�Q�创建可写入的Excel工作�?br />
　　jxl.write.WritableWorkbook wwb = Workbook.createWorkbook(new File(targetfile));

　　//Method 2�Q�将WritableWorkbook直接写入到输出流

　　/*

　　OutputStream os = new FileOutputStream(targetfile);

　　jxl.write.WritableWorkbook wwb = Workbook.createWorkbook(os);

　　*/

　　}

　　catch (Exception e)

　　{

　　e.printStackTrace();

　　}

　　API提供了两�U�方式来处理可写入的输出��，一�U�是直接生成本地文�g�Q�如果文件名不带全�\径的话，�~�省的文件会定位在当前目录，如果文�g名带有全路径的话�Q�则生成的Excel文�g则会定位在相应的目录�Q�另外一�U�是��Excel对象直接写入到输出流�Q�例如：用户通过��览器来讉K��Web服务器，如果HTTP头设�|�正��的话，��览器自动调用客��L(f��ng)��的Excel应用�E�序�Q�来昄��动态生成的 Excel�?sh��)子表格�?br />
　　接下来就是要创徏工作表，创徏工作表的�Ҏ(gu��)��与创建工作薄的方法几乎一��P��同样是通过工厂模式�Ҏ(gu��)��获得相应的对象，该方法需要两个参敎ͼ�一个是工作表的名称�Q�另一个是工作表在工作薄中的位�|�，参考下面的代码片段�Q?br />
　　//创徏Excel工作�?br />
　　jxl.write.WritableSheet ws = wwb.createSheet("Test Sheet 1", 0);

　　"�q�锅也支好了�Q�材料也准备齐全了，可以开始下锅了�Q?�Q�现在要做的只是实例化API所提供的Excel基本数据�c�d��Q��ƈ��它们添加到工作表中��可以了�Q�参考下面的代码片段�Q?br />
　　//1.��d��Label对象

　　jxl.write.Label labelC = new jxl.write.Label(0, 0, "This is a Label cell");

　　ws.addCell(labelC);

　　//��d��带有字型Formatting的对�?br />
　　jxl.write.WritableFont wf = new jxl.write.WritableFont(WritableFont.TIMES, 18, WritableFont.BOLD, true);

　　jxl.write.WritableCellFormat wcfF = new jxl.write.WritableCellFormat(wf);

　　jxl.write.Label labelCF = new jxl.write.Label(1, 0, "This is a Label Cell", wcfF);

　　ws.addCell(labelCF);

　　//��d��带有字体颜色Formatting的对�?br />
　　jxl.write.WritableFont wfc = new jxl.write.WritableFont(WritableFont.ARIAL, 10, WritableFont.NO_BOLD, false,

　　Underlinestyle.NO_UNDERLINE, jxl.format.Colour.RED);

　　jxl.write.WritableCellFormat wcfFC = new jxl.write.WritableCellFormat(wfc);

　　jxl.write.Label labelCFC = new jxl.write.Label(1, 0, "This is a Label Cell", wcfFC);

　　ws.addCell(labelCF);

　　//2.��d��Number对象

　　jxl.write.Number labelN = new jxl.write.Number(0, 1, 3.1415926);

　　ws.addCell(labelN);

　　//��d��带有formatting的Number对象

　　jxl.write.NumberFormat nf = new jxl.write.NumberFormat("#.##");

　　jxl.write.WritableCellFormat wcfN = new jxl.write.WritableCellFormat(nf);

　　jxl.write.Number labelNF = new jxl.write.Number(1, 1, 3.1415926, wcfN);

　　ws.addCell(labelNF);

　　//3.��d��Boolean对象

　　jxl.write.Boolean labelB = new jxl.write.Boolean(0, 2, false);

　　ws.addCell(labelB);

　　//4.��d��DateTime对象

　　jxl.write.DateTime labelDT = new jxl.write.DateTime(0, 3, new java.util.Date());

　　ws.addCell(labelDT);

　　//��d��带有formatting的DateFormat对象

　　jxl.write.DateFormat df = new jxl.write.DateFormat("dd MM yyyy hh:mm:ss");

　　jxl.write.WritableCellFormat wcfDF = new jxl.write.WritableCellFormat(df);

　　jxl.write.DateTime labelDTF = new jxl.write.DateTime(1, 3, new java.util.Date(), wcfDF);

　　ws.addCell(labelDTF); �q�里有两点大家要引�v大家的注意。第一点，在构造单元格�Ӟ��单元格在工作表中的位�|�就已经��定了。一旦创建后�Q�单元格的位�|�是不能够变更的�Q�尽��单元格的内�Ҏ(gu��)��可以改变的。第二点�Q�单元格的定位是按照下面�q�样的规�?column, row)�Q�而且下标都是�?开始，例如�Q�A1被存储在(0, 0)�Q�B1被存储在(1, 0)�?br />


　　最后，不要忘记关闭打开的Excel工作薄对象，以释攑֍�用的内存�Q�参见下面的代码片段�Q?br />
　　//写入Exel工作�?br />
　　wwb.write();

　　//关闭Excel工作薄对�?br />
　　wwb.close();

　　�q�可能与��d��Excel文�g的操作有��少不同�Q�在关闭Excel对象之前�Q�你必须要先调用write()�Ҏ(gu��)��Q�因为先前的操作都是存储在缓存中的，所以要通过该方法将操作的内容保存在文�g中。如果你先关闭了Excel对象�Q�那么只能得��C��张空的工作薄了�?br />
　　3、拷贝、更新Excel工作�?br />
　　接下来简要介�l�一下如何更��C��个已�l�存在的工作薄，主要是下面二步操作，�W�一步是构造只�ȝ��Excel工作薄，�W�二步是利用已经创徏的Excel工作薄创建新的可写入的Excel工作薄，参考下面的代码片段�Q?完整代码见ExcelModifying.java)

　　//创徏只读的Excel工作薄的对象

　　jxl.Workbook rw = jxl.Workbook.getWorkbook(new File(sourcefile));

　　//创徏可写入的Excel工作薄对�?br />
　　jxl.write.WritableWorkbook wwb = Workbook.createWorkbook(new File(targetfile), rw);

　　//��d��W�一张工作表

　　jxl.write.WritableSheet ws = wwb.getSheet(0);

　　//获得�W�一个单元格对象

　　jxl.write.WritableCell wc = ws.getWritableCell(0, 0);

　　//判断单元格的�c�d��, 做出相应的�{�?br />
　　if(wc.getType() == CellType.LABEL)

　　{

　　Label l = (Label)wc;

　　l.setString("The value has been modified.");

　　}

　　//写入Excel对象

　　wwb.write();

　　//关闭可写入的Excel对象

　　wwb.close();

　　//关闭只读的Excel对象

　　rw.close(); 之所以��用这�U�方式构建Excel对象�Q�完全是因�ؓ效率的原因，因�ؓ上面的示例才是 API的主要应用。�ؓ了提高性能�Q�在��d��工作表时�Q�与数据相关的一些输��Z��息，所有的格式信息�Q�如�Q�字体、颜色等�{�，是不被处理的�Q�因为我们的目的是获得行数据的��|��既��没有了修饎ͼ�也不会对行数据的��g�生什么媄响。唯一的不利之处就是，在内存中会同时保存两

个同��L(f��ng)��工作表，�q�样当工作表体积比较大时�Q�会占用相当大的内存�Q�但现在好像内存的大��ƈ不是什么关键因素了�?br />
　　一旦获得了可写入的工作表对象，我们��可以对单元格对象进行更新的操作了，在这里我们不必调用API提供的add()�Ҏ(gu��)��Q�因为单元格已经于工作表当中�Q�所以我们只需要调用相应的setXXX()�Ҏ(gu��)��Q�就可以完成更新的操作了�?br />
　　��单元格原有的格式化修饰是不能去掉的�Q�我们还是可以将新的单元��g��饰加上去�Q�以使单元格的内容以不同的�Ş式表现�?br />
　　新生成的工作表对象是可写入的�Q�我们除了更新原有的单元格外�Q�还可以��d��新的单元格到工作表中�Q�这与示�?的操作是完全一��L(f��ng)��?br />
　　最后，不要忘记调用write()�Ҏ(gu��)��Q�将更新的内容写入到文�g中，然后关闭工作薄对象，�q�里有两个工作薄对象要关闭，一个是只读的，另外一个是可写入的�?img src ="http://m.tkk7.com/boddi/aggbug/67576.html" width = "1" height = "1" />

boddi 2006-09-04 14:17 发表评论

Lucene	数据�?/td>
索引数据源：doc(field1,field2...) doc(field1,field2...) \ indexer / _____________ \| Lucene Index\| -------------- / searcher \ �l�果输出�Q�Hits(doc(field1,field2) doc(field1...))	索引数据源：record(field1,field2...) record(field1..) \ SQL: insert/ _____________ \| DB Index \| ------------- / SQL: select \ �l�果输出�Q�results(record(field1,field2..) record(field1...))
Document�Q�一个需要进行烦引的“单元�?br />一个Document由多个字�D늻��?/td>	Record�Q�记录，包含多个字段
Field�Q�字�D?/td>	Field�Q�字�D?/td>
Hits�Q�查询结果集�Q�由匚w��的Document�l�成	RecordSet�Q�查询结果集�Q�由多个Record�l�成

	Lucene全文索引引擎	数据�?/td>
索引	��数据源中的数据都通过全文索引一一建立反向索引	对于LIKE查询来说�Q�数据传�l�的索引是根本用不上的。数据需要逐个便利记录�q�行GREP式的模糊匚w��Q�比有烦引的搜烦速度要有多个数量�U�的下降�?/td>
匚w��效果	通过词元(term)�q�行匚w��Q�通过语言分析接口的实玎ͼ�可以实现对中文等非英语的支持�?/td>	使用�Q�like "%net%" 会把netherlands也匹配出来，多个关键词的模糊匚w��Q��用like "%com%net%"�Q�就不能匚w��词序颠倒的xxx.net..xxx.com
匚w��?/td>	有匹配度��法�Q�将匚w��E�度�Q�相似度�Q�比较高的结果排在前面�?/td>	没有匚w��E�度的控�Ӟ��比如有记录中net出现5词和出现1�ơ的�Q�结果是一��L(f��ng)��?/td>
�l�果输出	通过特别的算法，��最匚w��度最高的�?00条结果输出，�l�果集是�~�冲式的��批量读取的�?/td>	�q�回所有的�l�果集，在匹配条目非常多的时候（比如上万条）需要大量的内存存放�q�些临时�l�果集�?/td>
可定制�?/td>	通过不同的语�a�分析接口实现�Q�可以方便的定制出符合应用需要的索引规则�Q�包括对中文的支持）	没有接口或接口复杂，无法定制
�l�论	高负载的模糊查询应用�Q�需要负责的模糊查询的规则，索引的资料量比较�?/td>	使用率低�Q�模�p�匹配规则简单或者需要模�p�查询的资料量少

	Lucene	其他开源全文检索系�l?/td>
增量索引和批量烦�?/td>	可以�q�行增量的烦�?Append)�Q�可以对于大量数据进行批量烦引，�q�且接口设计用于优化扚w��索引和小扚w��的增量烦引�?/td>	很多�pȝ��只支持批量的索引�Q�有时数据源有一点增加也需要重建烦引�?/td>
数据�?/td>	Lucene没有定义具体的数据源�Q�而是一个文档的�l�构�Q�因此可以非常灵�zȝ��适应各种应用�Q�只要前端有合适的转换器把数据源�{换成相应�l�构�Q�，	很多�pȝ��只针对网��，�~�Z��其他格式文档的灵�z�L��?/td>
索引内容抓取	Lucene的文档是由多个字�D늻�成的�Q�甚臛_��以控刉��些字�D�需要进行烦引，那些字段不需要烦引，�q�一步烦引的字段也分为需要分词和不需要分词的�c�d��Q?br /> 需要进行分词的索引�Q�比如：标题�Q�文章内容字�D?br /> 不需要进行分词的索引�Q�比如：作�?日期字段	�~�Z��通用性，往往��文档整个烦引了
语言分析	通过语言分析器的不同扩展实现�Q?br />可以�q��o掉不需要的词：an the of �{�，西文语法分析�Q�将jumps jumped jumper都归�l�成jump�q�行索引/��?br />非英文支持：对亚�z�语�a��Q�阿拉伯语言的烦引支�?/td>	�~�Z��通用接口实现
查询分析	通过查询分析接口的实玎ͼ�可以定制自己的查询语法规则：比如�Q?多个关键词之间的 + - and or关系�{?/td>
�q�发讉K��	能够支持多用��L(f��ng)��使用

	自动切分	词表切分
实现	实现非常��?/td>	实现复杂
查询	增加了查询分析的复杂�E�度�Q?/td>	适于实现比较复杂的查询语法规�?/td>
存储效率	索引冗余大，索引几乎和原文一样大	索引效率高，为原文大��的30�Q�左�?/td>
�l�护成本	无词表维护成�?/td>	词表�l�护成本非常高：中日韩等语言需要分别维护�?br />�q�需要包括词频统计等内容
适用领域	嵌入式系�l�：�q�行环境资源有限分布式系�l�：无词表同步问�?br />多语�a�环境�Q�无词表�l�护成本	�Ҏ(gu��)��询和存储效率要求高的专业搜烦引擎

org.apache.Lucene.search/	搜烦入口
org.apache.Lucene.index/	索引入口
org.apache.Lucene.analysis/	语言分析�?/td>
org.apache.Lucene.queryParser/	查询分析�?/td>
org.apache.Lucene.document/	存储�l�构
org.apache.Lucene.store/	底层IO/存储�l�构
org.apache.Lucene.util/	一些公用的数据�l�构

�Ҏ(gu��)��	切词	索引	存储	用�?/th>
Field.Text(String name, String value)	Yes	Yes	Yes	切分词烦引�ƈ存储�Q�比如：标题�Q�内容字�D?/td>
Field.Text(String name, Reader value)	Yes	Yes	No	切分词烦引不存储�Q�比如：META信息�Q?br />不用于返回显�C�，但需要进行检索内�?/td>
Field.Keyword(String name, String value)	No	Yes	Yes	不切分烦引�ƈ存储�Q�比如：日期字段
Field.UnIndexed(String name, String value)	No	No	Yes	不烦引，只存储，比如�Q�文件�\�?/td>
Field.UnStored(String name, String value)	Yes	Yes	No	只全文烦引，不存�?/td>

久久久精品国产亚洲成人满18免费网站,亚洲成a人片77777kkkk,亚洲精品又粗又大又爽A片

�l�我���d��的勇气！�Q�！

Java RMI Tutorial

Java R MI Tutorial

�q�程�Ҏ(gu��)��调用入门指南

正则表达�?转蝲)

正则表达�?转蝲)

javascript���技�?���强js�ȝ��)

javaexcelapplication

jxl实例

Java中合�q�XML文档的合�q?

在应用中加入全文���索功�?br /> ——基于Java的全文烦引引擎Lucene����?

�l�我��d��的勇气！�Q�！

javascript��技�?��强js�ȝ��)

在应用中加入全文��索功�?br /> ——基于Java的全文烦引引擎Lucene��?