亚洲av无码一区二区三区在线播放 ,亚洲成AV人片在WWW,亚洲成熟xxxxx电影

使用sitemesh建立复合视图

Fri, 08 Dec 2006 08:10:00 GMT

http://www.huihoo.com/java/sitemesh/index.html

保尔�?/a> 2006-12-08 16:10 发表评论

Mon, 09 Oct 2006 03:02:00 GMT

commons分�ؓ3部分Commons Proper、Commons Sandbox和Commons Dormant
Commons Proper�Q�提供了设计良好可重用的java�l��g�Q��ƈ都经�q�了�q�泛、严格的��试�?br />Commons Sandbox�Q�处于实验、测试阶�D늚��l��g�?br />Commons Dormant�Q�处于停滞状态，从Sandbox退出的�Q�不�z�跃的组�Ӟ��谨慎使用�?
Commons Proper�l��g�Q?/p>
Attributes—�?支持源代码��的元数据�?
BeanUtils——提供对 Java 反射和自省API的包装，处理javabean的工兗��?
Betwixt——将JavaBeans与XML�怺�转换。�?
Chain——对Chain of Responsibility�Q�责任链�Q�设计模式的实现。��多个对象都有��Z��处理��h��Q� 从而避免请求的发送者和接收者之间的耦合关系。将�q�些对象�q�成一条链�Q��ƈ沿着�q�条链传递请求，直到有一个对象处理它为止�?
CLI——处理命令行的命令的解析�?
Codec——包含一些通用的编码解码算法。包括一些语音编码器�Q?Hex, Base64, 以及URL encoder�?
Collections——扩展和增加标准�?Java Collection框架�?
Configuration——操作各�U�格式的配置文�g。Properties文�g /XML文�g /JNDI /JDBC 数据�?/System properties /Applet parameters / Servlet parameters
Daemon——创建类似unix守护�U�程的java代码�Q�可以安全地执行一些后台操作，�U�程不被某个应用�E�序控制�Q�而是由操作系�l�控制类似windows的service�Q�可以设�|�一个服务依赖于另一个服务，一个服务关闭前必须先执行另一个服务�?
DBCP——一个数据库�q�接�?
DbUtils——一个JDBC的工��L��Q�比如可以将ResultSets生成javabean�?
Digester——基于规则的XML文档解析,主要用于XML到Java对象的映��?
Discovery——提供工��h��定位资源 (包括�c? �Q�通过使用各种模式来映��服�?引用名称和资源名�U��?
EL——JSP 2.0引入的表辑ּ�
Email——处理e-mail
FileUpload——web应用中的文�g上传�l��g
HttpClient——��用HTTP协议的客��L��开发框�?
IO——帮助进行IO功能开�?
Jelly——Jelly能够把XML转换成可执行代码,所以Jelly是一个基于XML与Java的脚本和处理引擎�?Jelly借鉴了JSP定指标签�Q�Velocity, Cocoon和Xdoclet中的脚本引擎的许多优炏V��Jelly可以用在命��o行，Ant或者Servlet之中�?
Jexl——Jexl是一个表辑ּ�语言�Q�通过借鉴来自于Velocity的经验扩展了JSTL定义的表辑ּ�语言�?
JXPath——��用XPath语法操作javabean的工兗��?
Lang——提供对java.lang包的扩展。�?
Launcher——跨�q�_��的java�E�序的启�?
Logging——提供的是一个日�?Log)接口(interface)�Q�同时兼��轻量��和不依赖于具体的日志实现工具�?它提供给中间�?日志工具开发者一个简单的日志操作抽象�Q�允许程序开发�h员��用不同的具体日志实现工具。用戯��假定已熟悉某�U�日志实现工��L��更高�U�别的细节。JCL提供的接口，对其它一些日志工��P��包括Log4J, Avalon LogKit, and JDK 1.4�{�，�q�行了简单的包装�Q�此接口更接�q�于Log4J和LogKit的实�?
Math——Math 是一个轻量的�Q�自包含的数学和�l�计�l��g�Q�解决了许多非常通用但没有及时出现在Java标准语言中的实践问题.
Modeler—�?支持兼容JMX规范的MBeans开发�?
Net——集合了�|�络工具和协议工��L��实现
Pool——Commons-Pool 提供了通用对象池接口，一个用于创建模块化对象池的工具包，以及通常的对象池实现�?
Primitives——对java原始�c�d��的支持�?
SCXML——处理SCXML
Transaction——事务处理，实现了多层次锁、事务集合、事务文件的讉K��。�?
Validator——提供了一个简单的�Q�可扩展的框架来在一个XML文�g中定义校验器 (校验�Ҏ��)和校验规则。支持校验规则的和错误消息的国际化�?
VFS——访问各�U�文件系�l�，可以是本地文件、HTTP服务器上的文件、zip中的文�g�?
Commons Sandbox�l��g�Q?/p>
Compress——处理压�~�文件如tar, zip �?bzip2 格式�?
CSV——处理CSV文�g
Exec——安全地处理外部�q�程
Finder——实现类似UNIX find命��o的功�?
I18n——处理��Y件的I18n功能
Id——生成id号功�?
Javaflow——捕捉程序运行状�?
JCI——java�~�译接口
OpenPGP——处理加密方法OpenPGP.
Pipeline——处理类似工作队列的��道工具
Proxy——生成动态代�?/li>

�Q�－�Q�－�Q�－�Q�－�Q�－�Q�－�Q�－�Q�－�Q�－�Q�－�Q�－�Q�－�Q�－�Q�－�Q�－�Q�－org.apache.commons.beanutils.PropertyUtils;
copyProperties(a,b);//把相同类型b的属性赋值给a
�Q�－�Q�－�Q�－�Q�－�Q�－�Q�－�Q�－�Q�－�Q�－�Q�－�Q�－�Q�－�Q�－�Q�－�Q�－�Q�－

转蝲�Q�org.apache.commons�?/h4>

原文误��Q?a >http://junglesong.yculblog.com/post.976376.html

在org.apache.commons包中提供了的一�p�d��能简化一些编�E�过�E�中常见问题的共通函数和�c�，使程序员能把主要�_�֊�集中�?br />构架�Q�业务实现和优化而不是具体实现及验证上，一�a�以蔽之，它能使我们避免重复的发明车轮�?br />
org.apache.commons包的下蝲��面�?
http://jakarta.apache.org/site/downloads/downloads_commons-lang.cgi
其中源码大家可以借鉴一下，我觉得很有参考�h��|��其是有些函数在不用正则表达式下取得的效果�?br />
取得commons-lang-2.1.jar后加入自己工�E�的lib目录��可以了.如果用户不允�怋�用commons�Q�那末打开其源码把具体函数加入自己的代码也可以�Q�当焉��要尊重�h家的知识产权�?br />
以下代码�l�过��试,��试环境(WinXp+Eclipse3.1+JDK1.5+commons-lang-2.1)�Q�我在有些地方修改了一下�?br />

Jakarta Commons Cookbook�?1—Manipulating Text
Commons之字�W�串操作
要利用Jakarta Commons来进行字�W�串操作,首先需要加载需要用到的�?
import org.apache.commons.lang.StringUtils;
import org.apache.commons.lang.WordUtils;
以下是StringUtils的各��用�?br />1.�I�字�W�串��?/strong>
使用函数: StringUtils.isBlank(testString)
函数介绍: 当testString为空,长度为零或者仅��q��白字�W?whitespace)�l�成�?�q�回True;否则�q�回False
例程:
    String test = "";
    String test2 = "\n\n\t";
    String test3 = null;
    String test4 = "Test";
    System.out.println( "test blank? " + StringUtils.isBlank( test ) );
    System.out.println( "test2 blank? " + StringUtils.isBlank( test2 ) );
    System.out.println( "test3 blank? " + StringUtils.isBlank( test3 ) );
    System.out.println( "test4 blank? " + StringUtils.isBlank( test4 ) );
输出如下:
test blank? true
test2 blank? true
test3 blank? true
test4 blank? False
函数StringUtils.isNotBlank(testString)的功能与StringUtils.isBlank(testString)相反.

2.清除�I�白字符
使用函数: StringUtils.trimToNull(testString)
函数介绍:清除掉testString首尾的空白字�W?如果仅testString全由�I�白字符
(whitespace)�l�成则返回null
例程:
    String test1 = "\t";
    String test2 = " A Test ";
    String test3 = null;
    System.out.println( "test1 trimToNull: " + StringUtils.trimToNull( test1 ) );
    System.out.println( "test2 trimToNull: " + StringUtils.trimToNull( test2 ) );
    System.out.println( "test3 trimToNull: " + StringUtils.trimToNull( test3 ) );
输出如下:
test1 trimToNull: null
test2 trimToNull: A Test
test3 trimToNull: null
注意�Q�函数StringUtils.trim(testString)�?br />StringUtils.trimToNull(testString)功能�c�M��Q�但testString��q��白字�W?br />(whitespace)�l�成时返回零长度字符丌Ӏ?/p>

3.取得字符串的�~�写
使用函数: StringUtils.abbreviate(testString,width)和StringUtils.abbreviate(testString,offset�Q�width)
函数介绍:在给定的width内取得testString的羃�?当testString的长度小于width则返回原字符�?
例程:
    String test = "This is a test of the abbreviation.";
    String test2 = "Test";
    System.out.println( StringUtils.abbreviate( test, 15 ) );
    System.out.println( StringUtils.abbreviate( test, 5,15 ) );
    System.out.println( StringUtils.abbreviate( test2, 10 ) );
输出如下:
This is a te...
...is a test...
Test
4.劈分字符�?/strong>
使用函数: StringUtils.split(testString,splitChars,arrayLength)
函数介绍:splitChars中可以包含一�p�d��的字�W�串来劈分testString,�q�可以设定得
到数�l�的长度.注意讑֮�长度arrayLength和劈分字�W�串间有抵触关系,��一般情况下
不要讑֮�长度.
例程:
    String input = "A b,c.d|e";
    String input2 = "Pharmacy, basketball funky";

    String[] array1 = StringUtils.split( input, " ,.|");
    String[] array2 = StringUtils.split( input2, " ,", 2 );

    System.out.println( ArrayUtils.toString( array1 ) );
    System.out.println( ArrayUtils.toString( array2 ) );
输出如下:
{A,b,c,d,e}
{Pharmacy,basketball funky}
5.查找嵌套字符�?/strong>
使用函数:StringUtils.substringBetween(testString,header,tail)
函数介绍�Q�在testString中取得header和tail之间的字�W�串。不存在则返回空
例程�Q?br />    String htmlContent = "ABC1234ABC4567";
    System.out.println(StringUtils.substringBetween(htmlContent, "1234", "4567"));
    System.out.println(StringUtils.substringBetween(htmlContent, "12345", "4567"));
输出如下�Q?br />    ABC
    null

6.去除��N��换行�W?/strong>
使用函数:StringUtils.chomp(testString)
函数介绍:去除testString��N��的换行符
例程:
    String input = "Hello\n";
    System.out.println( StringUtils.chomp( input ));
    String input2 = "Another test\r\n";
    System.out.println( StringUtils.chomp( input2 ));
输出如下:
    Hello
    Another test

7.重复字符�?/strong>
使用函数:StringUtils.repeat(repeatString,count)
函数介绍:得到��repeatString重复count�ơ后的字�W�串
例程:
    System.out.println( StringUtils.repeat( "*", 10));
    System.out.println( StringUtils.repeat( "China ", 5));
输出如下:
    **********
    China China China China China
其他函数:StringUtils.center( testString, count,repeatString );
函数介绍:把testString插入��repeatString重复多次后的字符串中�?得到字符�?br />的总长为count
例程:
    System.out.println( StringUtils.center( "China", 11,""));
输出如下:
    China*

8.颠倒字�W�串
使用函数:StringUtils.reverse(testString)
函数介绍:得到testString中字�W�颠倒后的字�W�串
例程:
    System.out.println( StringUtils.reverse("ABCDE"));
输出如下:
    EDCBA
9.判断字符串内容的�c�d��
函数介绍:
StringUtils.isNumeric( testString ) :如果testString全由数字�l�成�q�回True
StringUtils.isAlpha( testString ) :如果testString全由字母�l�成�q�回True
StringUtils.isAlphanumeric( testString ) :如果testString全由数字或数字组
成返回True
StringUtils.isAlphaspace( testString ) :如果testString全由字母或空格组
成返回True
例程:
    String state = "Virginia";
    System.out.println( "Is state number? " + StringUtils.isNumeric(
state ) );
    System.out.println( "Is state alpha? " + StringUtils.isAlpha( state )
);
    System.out.println( "Is state alphanumeric? " +StringUtils.isAlphanumeric( state ) );
    System.out.println( "Is state alphaspace? " + StringUtils.isAlphaSpace( state ) );
输出如下:
    Is state number? false
    Is state alpha? true
    Is state alphanumeric? true
    Is state alphaspace? true
10.取得某字�W�串在另一字符串中出现的次�?br />使用函数:StringUtils.countMatches(testString,seqString)
函数介绍:取得seqString在testString中出现的�ơ数,未发现则�q�回�?br />例程:
    System.out.println(StringUtils.countMatches( "Chinese People", "e"
));
输出:
    4
11.部分截取字符�?/strong>
使用函数:
StringUtils.substringBetween(testString,fromString,toString ):取得两字�W?br />之间的字�W�串
StringUtils.substringAfter( ):取得指定字符串后的字�W�串
StringUtils.substringBefore( )�Q�取得指定字�W�串之前的字�W�串
StringUtils.substringBeforeLast( )�Q�取得最后一个指定字�W�串之前的字�W�串
StringUtils.substringAfterLast( )�Q�取得最后一个指定字�W�串之后的字�W�串
函数介绍�Q�上面应该都讲明白了吧�?br />例程�Q?br />    String formatted = " 25 * (30,40) [50,60] | 30";
    System.out.print("N0: " + StringUtils.substringBeforeLast( formatted, "*" ) );
    System.out.print(", N1: " + StringUtils.substringBetween( formatted, "(", "," ) );
    System.out.print(", N2: " + StringUtils.substringBetween( formatted, ",", ")" ) );
    System.out.print(", N3: " + StringUtils.substringBetween( formatted, "[", "," ) );
    System.out.print(", N4: " + StringUtils.substringBetween( formatted, ",", "]" ) );
    System.out.print(", N5: " + StringUtils.substringAfterLast( formatted, "|" ) );
输出如下�Q?br />    N0: 25 , N1: 30, N2: 40, N3: 50, N4: 40) [50,60, N5: 30

保尔�?/a> 2006-10-09 11:02 发表评论

JfreeChart学习�ȝ��

Wed, 16 Aug 2006 08:53:00 GMT

http://m.tkk7.com/ltc603/archive/2006/08/16/63834.html

保尔�?/a> 2006-08-16 16:53 发表评论

Wed, 16 Aug 2006 05:52:00 GMT

一�Q?span lang="EN-US">POI��?span lang="EN-US">

Jakarta POI �?span lang="EN-US">apache的子��目�Q�目标是处理ole2对象。它提供了一�l�操�U?span lang="EN-US">Windows文档�?span lang="EN-US">Java API

目前比较成熟的是HSSF接口�Q�处�?span lang="EN-US">MS Excel�Q?span lang="EN-US">97-2002�Q�对象。它不象我们仅仅是用csv生成的没有格式的可以�?span lang="EN-US">Excel转换的东西，而是真正�?span lang="EN-US">Excel对象�Q�你可以控制一些属性如sheet,cell�{�等�?span lang="EN-US">

二．HSSF概况

HSSF �?span lang="EN-US">Horrible SpreadSheet Format的羃写，也即“讨厌的电子表格格式”�?也许HSSF的名字有�Ҏ��E�，��本质而言它是一个非�怸�肃、正规的API。通过HSSF�Q�你可以用纯Java代码来读取、写入、修�?span lang="EN-US">Excel文�g�?span lang="EN-US">

HSSF ��取操作提供了两类API�Q?span lang="EN-US">usermodel�?span lang="EN-US">eventusermodel�Q�即“用��h��型”和“事�?span lang="EN-US">-用户模型”。前者很好理解，后者比较抽象，但操作效率要高得多�?/span>

三．开始编�?span lang="EN-US">

1 �Q?/span> 准备工作

要求:JDK 1.4+POI开发包

可以�?/span> http://www.apache.org/dyn/closer.cgi/jakarta/poi/ 最新的POI工具�?span lang="EN-US">

2 �Q?/span> EXCEL �l�构

HSSFWorkbook excell 文档对象介绍
HSSFSheet excell的表�?span lang="EN-US">
HSSFRow excell的行
HSSFCell excell的格子单�?span lang="EN-US">
HSSFFont excell字体
HSSFName 名称
HSSFDataFormat 日期格式
�?span lang="EN-US">poi1.7中才有以�?span lang="EN-US">2��：
HSSFHeader sheet�?span lang="EN-US">
HSSFFooter sheet��?span lang="EN-US">
和这个样�?span lang="EN-US">
HSSFCellStyle cell样式
辅助操作包括
HSSFDateUtil 日期
HSSFPrintSetup 打印
HSSFErrorConstants 错误信息�?/span>

3 �Q�具体用法实�?/span> �Q�采�?/span> usermodel �Q?/span>

如何�?span lang="EN-US">Excel

��d��Excel文�g�Ӟ��首先生成一�?span lang="EN-US">POIFSFileSystem对象�Q�由POIFSFileSystem对象构造一�?span lang="EN-US">HSSFWorkbook�Q�该HSSFWorkbook对象��׃��表了Excel文档。下面代码读取上面生成的Excel文�g写入的消息字�Ԍ��
try{
   POIFSFileSystem fs=new POIFSFileSystem(new FileInputStream("d:/workbook.xls"));
   HSSFWorkbook wb = new HSSFWorkbook(fs);
   HSSFSheet sheet = wb.getSheetAt(0);
   HSSFRow row = sheet.getRow(0);
   HSSFCell cell = row.getCell((short) 0);
   String msg = cell.getStringCellValue();
   System.out.println(msg);
  }catch(Exception e){
   e.printStackTrace();
  }

如何�?span lang="EN-US">excel�Q?span lang="EN-US">

��?span lang="EN-US">excel的第一个表单第一行的�W�一个单元格的值写成�?span lang="EN-US">a test”�?span lang="EN-US">

POIFSFileSystem fs =new POIFSFileSystem(new FileInputStream("workbook.xls"));

    HSSFWorkbook wb = new HSSFWorkbook(fs);

    HSSFSheet sheet = wb.getSheetAt(0);

    HSSFRow row = sheet.getRow(0);

    HSSFCell cell = row.getCell((short)0);

    cell.setCellValue("a test");

    // Write the output to a file

    FileOutputStream fileOut = new FileOutputStream("workbook.xls");

    wb.write(fileOut);

fileOut.close();

4 �Q?/span> 可参考文�?/span>

POI 主页�Q?span lang="EN-US">http://jakarta.apache.org/poi/�Q?span lang="EN-US">

初学者如何快速上手��?span lang="EN-US">POI HSSF

http://jakarta.apache.org/poi/hssf/quick-guide.html �?span lang="EN-US">

里面有很多例子代码，可以很方便上手�?span lang="EN-US">

5、中文�ؕ码问�?br />
//把List expItems,写到EXCEL文�g�?br />  FileOutputStream fileOut = new FileOutputStream(filePath);
  HSSFWorkbook wb = new HSSFWorkbook();// HSSFWorkbook
  HSSFSheet sheet = wb.createSheet();//
  wb.setSheetName(0,“实验项目列表－�Q�中文测试�?HSSFWorkbook.ENCODING_UTF_16);
  HSSFRow row = sheet.createRow((short) 0);
  HSSFCell cell;
  Iterator iter = expItems.iterator();
  int i = 0;
  while (iter.hasNext()) {
   cell = row.createCell((short) i);
   cell.setEncoding(HSSFCell.ENCODING_UTF_16);
   cell.setCellValue(iter.next().toString());
   i++;
  }
  wb.write(fileOut);
  fileOut.close();
}

四．使用心得

POI HSSF �?span lang="EN-US">usermodel包把Excel文�g映射成我们熟悉的�l�构�Q�诸�?span lang="EN-US">Workbook�?span lang="EN-US">Sheet�?span lang="EN-US">Row�?span lang="EN-US">Cell�{�，它把整个�l�构以一�l�对象的形式保存在内存之中，便于理解�Q�操作方便，基本上能够满��x��们的要求�Q�所以说�q�个一个不错的选择�?/span>
�Q�－�Q�－�Q�－�Q�－�Q�－�Q�－�Q�－�Q�－�Q�－�Q�－�Q�－�Q�－�Q�－�Q�－�Q�－�Q?br />前面已经讲过利用POI��d��Excel�Q�下面是一个用POI向Excel中插入图片的例子�?br />
官方文档�Q?
Images are part of the drawing support. To add an image just call createPicture() on the drawing patriarch. At the time of writing the following types are supported:
PNG
JPG
DIB
It is not currently possible to read existing images and it should be noted that any existing drawings may be erased once you add a image to a sheet.

// Create the drawing patriarch. This is the top level container for
// all shapes. This will clear out any existing shapes for that sheet.

通过HSSFPatriarch�c�createPicture�Ҏ��的在指定的wb中的sheet创徏囄��,它接受二个参敎ͼ��W�一个是HSSFClientAnchor�Q�设定图片的大小�?br />
package com.poi.hssf.test;

import java.io.FileOutputStream;
import java.io.File;
import java.io.ByteArrayOutputStream;
import java.io.IOException;

import java.awt.image.BufferedImage;
import javax.imageio.*;

import org.apache.poi.hssf.usermodel.HSSFWorkbook;
import org.apache.poi.hssf.usermodel.HSSFSheet;
import org.apache.poi.hssf.usermodel.HSSFPatriarch;
import org.apache.poi.hssf.usermodel.HSSFClientAnchor;;

public class TestPOI {

    public static void main(String[] args) {
            FileOutputStream fileOut = null;
            BufferedImage bufferImg =null;
            BufferedImage bufferImg1 = null;
            try{

          //先把读进来的囄��攑ֈ�一个ByteArrayOutputStream中，以便产生ByteArray
          ByteArrayOutputStream byteArrayOut = new ByteArrayOutputStream();
          ByteArrayOutputStream byteArrayOut1 = new ByteArrayOutputStream();
          bufferImg = ImageIO.read(new File("d:/PieChart.jpg"));
          bufferImg1 = ImageIO.read(new File("d:/fruitBarChart.jpg"));
          ImageIO.write(bufferImg,"jpg",byteArrayOut);
          ImageIO.write(bufferImg1,"jpg",byteArrayOut1);

        //创徏一个工作薄
       HSSFWorkbook wb = new HSSFWorkbook();
       HSSFSheet sheet1 = wb.createSheet("new sheet");
       //HSSFRow row = sheet1.createRow(2);
       HSSFPatriarch patriarch = sheet1.createDrawingPatriarch();
       HSSFClientAnchor anchor = new HSSFClientAnchor(0,0,512,255,(short) 1,1,(short)10,20);
       HSSFClientAnchor anchor1 = new HSSFClientAnchor(0,0,512,255,(short) 2,30,(short)10,60);
       anchor1.setAnchorType(2);
       //插入囄��
       patriarch.createPicture(anchor , wb.addPicture(byteArrayOut.toByteArray(),HSSFWorkbook.PICTURE_TYPE_JPEG));
       patriarch.createPicture(anchor1 , wb.addPicture(byteArrayOut1.toByteArray(),HSSFWorkbook.PICTURE_TYPE_JPEG));

           fileOut = new FileOutputStream("d:/workbook.xls");
           //写入excel文�g
           wb.write(fileOut);
           fileOut.close();

            }catch(IOException io){
                    io.printStackTrace();
                    System.out.println("io erorr : "+ io.getMessage());
            } finally
            {
               if (fileOut != null)
               {

                   try {
                              fileOut.close();
                         }
                   catch (IOException e)
                   {
                            // TODO Auto-generated catch block
                            e.printStackTrace();
                     }
               }
            }
    }
}

保尔�?/a> 2006-08-16 13:52 发表评论

Log4J 最佛_��践之全能配置文�g

Wed, 16 Aug 2006 03:38:00 GMT
下面�l�出得Log4J配置文�g实现了输出到控制収ͼ�文�g�Q�回滚文�Ӟ��发送日志邮�Ӟ��输出到数据库日志表，自定义标�{��全套功能�?br />
log4j.rootLogger=DEBUG,CONSOLE,A1,im
#DEBUG,CONSOLE,FILE,ROLLING_FILE,MAIL,DATABASE

log4j.addivity.org.apache=true

###################
# Console Appender
###################
log4j.appender.CONSOLE=org.apache.log4j.ConsoleAppender
log4j.appender.Threshold=DEBUG
log4j.appender.CONSOLE.Target=System.out
log4j.appender.CONSOLE.layout=org.apache.log4j.PatternLayout
log4j.appender.CONSOLE.layout.ConversionPattern=[framework] %d - %c -%-4r [%t] %-5p %c %x - %m%n
#log4j.appender.CONSOLE.layout.ConversionPattern=[start]%d{DATE}[DATE]%n%p[PRIORITY]%n%x[NDC]%n%t[THREAD] n%c[CATEGORY]%n%m[MESSAGE]%n%n

#####################
# File Appender
#####################
log4j.appender.FILE=org.apache.log4j.FileAppender
log4j.appender.FILE.File=file.log
log4j.appender.FILE.Append=false
log4j.appender.FILE.layout=org.apache.log4j.PatternLayout
log4j.appender.FILE.layout.ConversionPattern=[framework] %d - %c -%-4r [%t] %-5p %c %x - %m%n
# Use this layout for LogFactor 5 analysis

########################
# Rolling File
########################
log4j.appender.ROLLING_FILE=org.apache.log4j.RollingFileAppender
log4j.appender.ROLLING_FILE.Threshold=ERROR
log4j.appender.ROLLING_FILE.File=rolling.log
log4j.appender.ROLLING_FILE.Append=true
log4j.appender.ROLLING_FILE.MaxFileSize=10KB
log4j.appender.ROLLING_FILE.MaxBackupIndex=1
log4j.appender.ROLLING_FILE.layout=org.apache.log4j.PatternLayout
log4j.appender.ROLLING_FILE.layout.ConversionPattern=[framework] %d - %c -%-4r [%t] %-5p %c %x - %m%n

####################
# Socket Appender
####################
log4j.appender.SOCKET=org.apache.log4j.RollingFileAppender
log4j.appender.SOCKET.RemoteHost=localhost
log4j.appender.SOCKET.Port=5001
log4j.appender.SOCKET.LocationInfo=true
# Set up for Log Facter 5
log4j.appender.SOCKET.layout=org.apache.log4j.PatternLayout
log4j.appender.SOCET.layout.ConversionPattern=[start]%d{DATE}[DATE]%n%p[PRIORITY]%n%x[NDC]%n%t[THREAD]%n%c[CATEGORY]%n%m[MESSAGE]%n%n

########################
# Log Factor 5 Appender
########################
log4j.appender.LF5_APPENDER=org.apache.log4j.lf5.LF5Appender
log4j.appender.LF5_APPENDER.MaxNumberOfRecords=2000

########################
# SMTP Appender
#######################
log4j.appender.MAIL=org.apache.log4j.net.SMTPAppender
log4j.appender.MAIL.Threshold=FATAL
log4j.appender.MAIL.BufferSize=10
log4j.appender.MAIL.From=chenyl@hollycrm.com
log4j.appender.MAIL.SMTPHost=mail.hollycrm.com
log4j.appender.MAIL.Subject=Log4J Message
log4j.appender.MAIL.To=chenyl@hollycrm.com
log4j.appender.MAIL.layout=org.apache.log4j.PatternLayout
log4j.appender.MAIL.layout.ConversionPattern=[framework] %d - %c -%-4r [%t] %-5p %c %x - %m%n

########################
# JDBC Appender
#######################
log4j.appender.DATABASE=org.apache.log4j.jdbc.JDBCAppender
log4j.appender.DATABASE.URL=jdbc:mysql://localhost:3306/test
log4j.appender.DATABASE.driver=com.mysql.jdbc.Driver
log4j.appender.DATABASE.user=root
log4j.appender.DATABASE.password=
log4j.appender.DATABASE.sql=INSERT INTO LOG4J (Message) VALUES ('[framework] %d - %c -%-4r [%t] %-5p %c %x - %m%n')
log4j.appender.DATABASE.layout=org.apache.log4j.PatternLayout
log4j.appender.DATABASE.layout.ConversionPattern=[framework] %d - %c -%-4r [%t] %-5p %c %x - %m%n

log4j.appender.A1=org.apache.log4j.DailyRollingFileAppender
log4j.appender.A1.File=SampleMessages.log4j
log4j.appender.A1.DatePattern=yyyyMMdd-HH'.log4j'
log4j.appender.A1.layout=org.apache.log4j.xml.XMLLayout

###################
#自定义Appender
###################
log4j.appender.im = net.cybercorlin.util.logger.appender.IMAppender

log4j.appender.im.host = mail.cybercorlin.net
log4j.appender.im.username = username
log4j.appender.im.password = password
log4j.appender.im.recipient = corlin@cybercorlin.net

log4j.appender.im.layout=org.apache.log4j.PatternLayout
log4j.appender.im.layout.ConversionPattern =[framework] %d - %c -%-4r [%t] %-5p %c %x - %m%n

保尔�?/a> 2006-08-16 11:38 发表评论

��Z��java使用FCKeditor

Mon, 17 Jul 2006 07:20:00 GMT

1.下蝲
FCKeditor.java 2.3 (FCKeditot for java)
FCKeditor 2.2 (FCKeditor基本文�g)

2.建立��目:tomcat/webapps/FCKeditor

3.FCKeditor.java 2.3解压后，把其中的web目录下的WEB-INF目录copy到FCKeditor�?里面有commons-fileupload.jar, FCKeditor-2.3.jar,web.xml�{�几个文�?, 把其中的src目录下的FCKeditor.tld文�gcopy到FCKeitor/WEB-INF/�?

4.修改web.xml:
把SimpleUploader中的配置属性enabled定义为true(开启文件上传功能）
��d��标签定义:

/FCKeditor
/WEB-INF/FCKeditor.tld

5.解压FCKeditor2.2后，把目�?editor和fckconfig.js, fckeditor.js, fckstyles.xml, fcktemplates.xml四个文�gcopy�?FCKeditor�?
删除目录/editor/_source,
删除/editor/filemanager/browser/default/connectors/下的所有文�?
删除/editor/filemanager/upload/下的所有文�?
删除/editor/lang/下的除了fcklanguagemanager.js, en.js, zh.js, zh-cn.js四个文�g的所有文�?

6.打开/FCKeditor/fckconfig.js
修改 FCKConfig.DefaultLanguage = 'zh-cn' ;
把FCKConfig.LinkBrowserURL�{�的值替换成以下内容�Q?
FCKConfig.LinkBrowserURL =
    FCKConfig.BasePath + "filemanager/browser/default/browser.html?Connector=connectors/jsp/connector" ;

FCKConfig.ImageBrowserURL =
    FCKConfig.BasePath + "filemanager/browser/default/browser.html?Type=Image&Connector=connectors/jsp/connector" ;

FCKConfig.FlashBrowserURL =
    FCKConfig.BasePath + "filemanager/browser/default/browser.html?Type=Flash&Connector=connectors/jsp/connector" ;

FCKConfig.LinkUploadURL = FCKConfig.BasePath + 'filemanager/upload/simpleuploader?Type=File' ;
FCKConfig.FlashUploadURL = FCKConfig.BasePath + 'filemanager/upload/simpleuploader?Type=Flash' ;
FCKConfig.ImageUploadURL = FCKConfig.BasePath + 'filemanager/upload/simpleuploader?Type=Image' ;

7.��d��文�g /FCKeditor/test.jsp:
<%@ page language="java" import="com.fredck.FCKeditor.*" %>
<%@ taglib uri="/FCKeditor" prefix="FCK" %>

<%--
三种�Ҏ��调用FCKeditor
1.FCKeditor自定义标�{?(必须加头文�g <%@ taglib uri="/FCKeditor" prefix="FCK" %> )
2.script脚本语言调用 (必须引用脚本文�g )
3.FCKeditor API 调用 (必须加头文�g <%@ page language="java" import="com.fredck.FCKeditor.*" %> )
--%>
<%--

   toolbarSet = "Default" >
input

--%>

input

<%--

<%
FCKeditor oFCKeditor ;
oFCKeditor = new FCKeditor( request, "content" ) ;
oFCKeditor.setBasePath( "/FCKeditor/" ) ;
oFCKeditor.setValue( "input" );
out.println( oFCKeditor.create() ) ;
%>

--%>

��d��文�g/FCKeditor/show.jsp:
<%
String content = request.getParameter("content");
out.print(content);
%>

8.��览 http://localhost:8080/FCKeditor/test.jsp
ok!

9.上传遇到错误: internal server error 500,
直接引用servlet(com.fredck.FCKeditor.connector.ConnectorServlet)也遇到错�? "Provider org.apache.xalan.processor.TransformerFactoryImpl not found",
拯��xalan.jar到lib目录��可以了

保尔�?/a> 2006-07-17 15:20 发表评论

Fri, 14 Jul 2006 00:47:00 GMT

做一个好的社��坛一直是我的理想�Q�BBS-CS�?.0到现在的5.0用了2�q�时��_��5.0在技术上、性能上都已经基本�E�_��Q�届此想对BBS-CS的开发思想、技术做一个说明�?

�?000�q�的时候，我的个�h�|�站“爱情工作室”就是��用我自己的写的论坛，当时是用PHP�Q�功能上比较��单，主要是�ؓ了网站��用，后来我想把社��坛单独拿出来�Q��ƈ且爱情工作室�|�站也只剩下了社��一部分�Q�所以就开始用PHP按照�|�易�C�֌��l�构写了BBS-CS PHP 1.0的版本，后来�q�个版本一直没有更斎ͼ�但JSP版BBS-CS 1.0�?.0的数据结构都是从PHP版本发展来的�Q?000�q�底我开始用JAVA�Q?001�q�就写了BBS-CS1.0�Q�后来出�?.0�Q?.0�?.0的安装都不是很方便，�q�且SQL都是在JSP中，�l�构不好�Q?002�q�我写了BBS-CS3.0�Q�此时数据库操作已经用JavaBean来封装，但是3.0的性能非常不好�Q?003�q�初我写�?.0�Q?.0的结构已�l�发生了完全的变化，主要是适应多种数据库和数据库访问均衡处理，性能大大增强�Q��ƈ且BBS-CS定名为“天乙社区”，今年下半�q�我写了5.0�Q?.0采用了Struts的框�Ӟ��国际化内核，同时支持集群�q�行�Q�全文检索等�{��?

有�h可能会拿BBS-CS和Jive来比较，觉得BBS-CS是小儿科�Q�但我想BBS-CS的设计模式虽然没有Jive那么复杂�Q�但是在国际化、实用性、性能�{�方面�ƈ不差�?

一、数据库设计
BBS-CS�?.0开始，数据库结构发生了�Ҏ��的变化，主要是对数据表作了负载均衡的处理�Q�即一个功能不是��用一张表�Q�而是使用多张同样�l�构的表�Q�比如存攑ָ�子的表有20张，�q�样做的目的是�ؓ了将数据库的查询压力分散��C��同表中，其实道理很简单，如果一张表中存�?00万条记录�Q�和100张表�Q�每个表存放1万条记录�Q�查询效率是完全不一��L��。具体程序中�Q�比如一个版区的帖子往那个表中插，是由��法来实现的�Q�算法会保证某个版区的帖子只会往某一个表中插入�?

二、分��处�?
BBS-CS4.0�?.0都是支持多数据库的，现在支持的数据库有Mysql、Oracle和SQL Server�Q�在分页处理上确实要�׃��些功夫，以前我看�q�很多关于分��늚�技术资料，处理分页的方法主要是有几个：1、用JDBC的本�w�特性，��数据全部取出，然后�Ҏ��늠��Q�每��记录数�Q�对查询出的数据集的数据滚动�Q�这个方法比较简单、通用�Q�但是性能极差�Q�如果一个百万��的数据表�Q�将耗费巨大的系�l�资源，甚至宕机�Q?、和�W�一�U�比较类��|��但不是查出所有数据，只查出数据的主键�Q�对主键滚动�Q�然后根据主键再�ơ查扄��对应的数据，产生集合�Q�这�U�方法也是EJB中实体Bean查询数据的方法，但依然存在性能问题�Q�因为数据过多的时候主键数据集也很大，而来用主键插找数据的是后又进行了多次数据库的执行操作�Q�性能降低。在多种分页�Ҏ��比较之后�Q�BBS-CS�q�是军_��采用数据自��n�Ҏ��的SQL语句来进行分��，比如Mysql使用limit�Q�Oracle使用rownum�Q�SQL Server使用Top�Q�分��늱�是一个抽象类�Q�每�U�数据库的分��实现方法都�ȝ��承这个抽象类�Q�然后用一个工厂方法根据系�l�配�|�文件来产生分页�cȝ��实例�Q�采用这��L��分页�Ҏ��Q�能都达到最佳的分页查询效率�?

三、系�l�配�|�文�?
BBS-CS5.0的系�l�配�|�文件用了一个XML文�g�Q�在4.0的时候，�pȝ��的配�|�文件是采用properties文�g来解冻I��后来我觉得properties的文件还是有很大的局限性，比如�Q�不方便�q�行有数据库�l�构的数据进行配�|�，后来觉得XML文�g是一个绝佳的�Ҏ��Q�难怪现在很多��品的配置文�g都是XML�?)�Q�对于XML文�g的解析，BBS-CS采用了jdom�Q�jdom��是java+dom�Q�详�l�资�?a >http://www.jdom.org�Q�，一个很方便的处理XML的��Y件包�Q�在BBS-CS�U�对jdom的运用也不复杂，主要是用来解析bbscs.xml�q�个配置文�g。系�l�解析bbscs.xml文�g后，��这些系�l�信息保存在静态变量中�Q�以供系�l�其他程序随时调用�?

四、国际化与资源文�?
JAVA本��n��是国际化的内部采用了Unicode的编码格式，而Struts的框�Ӟ��更方便了国际化的应用�Q�Struts会根据浏览器的Locale�Q�自动调取相应的properties资源文�g�Q�在BBS-CS��是定义的app.peoperties文�g�Q�BBS-CS只定义了中文的资源包�Q�即app_zh_CN.properties文�g�Q�当然只要将�q�个文�g��译成日文、韩文等�{�其他国家文字，卛_��实现BBS-CS多语�a��览。当然只有浏览多语言是不行，数据的保存也必须是通用的格式，BBS-CS采用了UTF-8的编码格式的保存数据�Q�以解决多语�a�的问题，关于Unicode、UTF-8�~�码格式的资料、原理大家可以在�|�上查找资料�Q�我在这里不多做讲解了�?

五、编码问�?
在（四）中讲了国际化问题�Q�但是如果不作处理，对中文显�C�处理都会有问题�Q�要对app_zh_CN.propertie�q�行native2ascii的�{换，�q�个命��o是在jdk/bin下的�Q�之后我们要做一个Servlet的过滤器�Q�对所有的request对象�q�行�~�码的�{换，com.laoer.bbscs.servlet.EncodingFilter��是BBS-CS的过滤器�Q�它对request的编码格式进行了处理�Q�定义�ؓ了UTF-8的编码格式。以前网上在看到�q�的一些文章上��_��采用Servlet�q��o器会有性能的下降，在我使用的感觉上来说�Q�问题倒不是很大�?

六、集��与Session处理
BBS-CS5.0设计的时候考虑��C��集群的应用，因�ؓ随着�pȝ��讉K��量和数据的不断增长，单台服务器是很难支撑的，所以要求系�l�能够用多台服务器来�q�行�Q�跨服务器的Session��是一个很大的问题�Q�大安��知道Session是生存与一个应用中的，跨应用，Session必然不能�׃�n�Q�现在JSP容器�Q�包括Weblogic、Resin、Tomcat都可以进行集��应用，但是配制��h��可能比较复杂�Q�所以BBS-CS实现了自��q��集群�q�用�Ҏ��。实现的原理比较��单，主要是涉及了�|�络�~�程�Q�在JAVA中，对象只要implements了java.io.Serializable�q�个接口�Q�即可实��C��行化�Q�便可以在网�l�中传输�Q�BBS-CS��是把需要在�|�络中传输的Session对象�q�行串行化，在多个服务器之间�q�行通讯�Q�以辑ֈ�服务器之间的Session同步�Q�同时对于几台服务器的访问是负蝲均衡的�?
Session实现�Q�BBS-CS在单服务器配制下是采用了应用的Session�Q�而在机群方式下，是徏立了自己的Session列表�Q�Session是一个静态的HashTable�Q�每个用户在登陆的时候会产生一个随机的sid�Q�这个sid��是HashTable的key�Q�而value则是一个HasMap�Q�保存需要的对象。系�l�在�q�行期间会根据配�|�文件的Session��时旉��定时对超时的Session�q�行清理�?

七、静态变量与�U�程�q�用
��Z��减少�Ҏ��据库的访问，�pȝ��很多地方使用了静态变量来储存数据�Q�比如，版区列表和信息是�pȝ��需要频�J�访问的�Q�如果每�ơ都从数据库中读取，消耗是很大的，BBS-CS采用的方法是�Q�一�ơ性将数据库读出，攑֜�一个静态的列表里（HashTable�Q�，以后再访问则从静态列表中取，而不是从数据库中取，如果版区信息发生变化�Q�只要刷新这个静态变量就行了�?
通常在B/S�l�构下，�pȝ��的定时操作是比较困难的，因�ؓB/S�l�构的��Y件是��览器事仉��动的模型�Q�而不是服务器事�g驱动�Q�在Unix/Linux下，通常是写一个脚本，然后用Crontab来跑�Q�在win下可能就要用VB/VC/Delphi来写一个定时程序了。BBS-CS必须要做到跨品台和通用性，而线�E�和Sevlet提供很好的方法，一个web应用�Q�可以在启动的时候按��序的执行Servlet�E�序�Q�在web.xml文�g中定义）�Q�在Servlet中就可以启动一个线�E�，�q�个�U�程定时执行、休眠，便可以达到定时运行程序的目的�Q�在BBS-CS中，清除��时Session、游客等�{�都是采用了�U�程定时执行的方式�?/p>

保尔�?/a> 2006-07-14 08:47 发表评论

Fri, 14 Jul 2006 00:45:00 GMT

假设我们的电脑的目录中含有很多文本文档，我们需要查扑֓�些文档含有某个关键词。�ؓ了实现这�U�功能，我们首先利用 Lucene 对这个目录中的文档徏立烦引，然后在徏立好的烦引中搜烦我们所要查扄��文档。通过�q�个例子读者会对如何利�?Lucene 构徏自己的搜索应用程序有个比较清楚的认识�?

建立索引

��Z��Ҏ��档进行烦引，Lucene 提供了五个基��的类�Q�他们分别是 Document, Field, IndexWriter, Analyzer, Directory。下面我们分别介�l�一下这五个�cȝ��用途：

Document

Document 是用来描�q�文档的�Q�这里的文档可以指一�?HTML ��面�Q�一��电子邮�Ӟ��或者是一个文本文件。一�?Document 对象由多�?Field 对象�l�成的。可以把一�?Document 对象惌��成数据库中的一个记录，而每�?Field 对象��是记录的一个字�D�c�?

Field

Field 对象是用来描�q�C��个文档的某个属性的�Q�比如一��电子邮件的标题和内容可以用两个 Field 对象分别描述�?

Analyzer

�? 一个文档被索引之前�Q�首先需要对文档内容�q�行分词处理�Q�这部分工作��是�?Analyzer 来做的。Analyzer �c�L��一个抽象类�Q�它有多个实现。针对不同的语言和应用需要选择适合�?Analyzer。Analyzer 把分词后的内容交�l? IndexWriter 来徏立烦引�?

IndexWriter

IndexWriter �?Lucene 用来创徏索引的一个核心的�c�，他的作用是把一个个�?Document 对象加到索引中来�?

Directory

�q�个�c�M��表了 Lucene 的烦引的存储的位�|�，�q�是一个抽象类�Q�它目前有两个实玎ͼ��W�一个是 FSDirectory�Q�它表示一个存储在文�g�pȝ��中的索引的位�|�。第二个�?RAMDirectory�Q�它表示一个存储在内存当中的烦引的位置�?

熟悉了徏立烦引所需要的�q�些�c�d��Q�我们就开始对某个目录下面的文本文件徏立烦引了�Q�清�?�l�出了对某个目录下的文本文�g建立索引的源代码�?

清单 1. �Ҏ��本文件徏立烦�?

package TestLucene;

import java.io.File;
import java.io.FileReader;
import java.io.Reader;
import java.util.Date;

import org.apache.lucene.analysis.Analyzer;
import org.apache.lucene.analysis.standard.StandardAnalyzer;
import org.apache.lucene.document.Document;
import org.apache.lucene.document.Field;
import org.apache.lucene.index.IndexWriter;

/**
* This class demonstrate the process of creating index with Lucene
* for text files
*/
public class TxtFileIndexer {
public static void main(String[] args) throws Exception{
//indexDir is the directory that hosts Lucene's index files
File indexDir = new File("D:\\luceneIndex");
//dataDir is the directory that hosts the text files that to be indexed
File dataDir = new File("D:\\luceneData");
Analyzer luceneAnalyzer = new StandardAnalyzer();
File[] dataFiles = dataDir.listFiles();
IndexWriter indexWriter = new IndexWriter(indexDir,luceneAnalyzer,true);
long startTime = new Date().getTime();
for(int i = 0; i < dataFiles.length; i++){
if(dataFiles[i].isFile() && dataFiles[i].getName().endsWith(".txt")){
System.out.println(
"Indexing file " + dataFiles[i].getCanonicalPath());
Document document = new Document();
Reader txtReader = new FileReader(dataFiles[i]);
document.add(
Field.Text("path",dataFiles[i].getCanonicalPath()));
document.add(Field.Text("contents",txtReader));
indexWriter.addDocument(document);
}
}
indexWriter.optimize();
indexWriter.close();
long endTime = new Date().getTime();

System.out.println("It takes " + (endTime - startTime)
+ " milliseconds to create index for
the files in directory "
+ dataDir.getPath());
}
}

�? 清单1中，我们注意到类 IndexWriter 的构造函数需要三个参敎ͼ��W�一个参数指定了所创徏的烦引要存放的位�|�，他可以是一�?File 对象�Q�也可以是一�?FSDirectory 对象或�?RAMDirectory 对象。第二个参数指定�?Analyzer �cȝ��一个实玎ͼ�也就是指定这个烦引是用哪个分词器�Ҏ��挡内容进行分词。第三个参数是一个布��型的变量，如果�?true 的话��׃��表创��Z��个新的烦引，�?false 的话��׃��表在原来索引的基��上进行操作。接着�E�序遍历了目录下面的所有文本文档，�q��ؓ每一个文本文档创��Z��一�?Document 对象。然后把文本文档的两个属性：路径和内容加入到了两�?Field 对象中，接着在把�q�两�?Field 对象加入�?Document 对象中，最后把�q�个文档�?IndexWriter �cȝ�� add �Ҏ��加入到烦引中厅R��这��h��们便完成了烦引的创徏。接下来我们�q�入在徏立好的烦引上�q�行搜烦的部分�?

搜烦文档

�? 用Lucene�q�行搜烦��像建立索引一样也是非常方便的。在上面一部分中，我们已经��Z��个目录下的文本文档徏立好了烦引，现在我们��p��在这个烦引上�q�行�? 索以扑ֈ�包含某个关键词或短语的文档。Lucene提供了几个基��的类来完成这个过�E�，它们分别是呢IndexSearcher, Term, Query, TermQuery, Hits. 下面我们分别介绍�q�几个类的功能�?

Query

�q�是一个抽象类�Q�他有多个实玎ͼ�比如TermQuery, BooleanQuery, PrefixQuery. �q�个�cȝ��目的是把用户输入的查询字�W�串��装成Lucene能够识别的Query�?

Term

Term 是搜索的基本单位�Q�一个Term对象有两个String�c�d��的域�l�成。生成一个Term对象可以有如下一条语句来完成�Q�Term term = new Term(“fieldName�?”queryWord�?; 其中�W�一个参��C��表了要在文档的哪一个Field上进行查找，�W�二个参��C��表了要查询的关键词�?

TermQuery

TermQuery 是抽象类Query的一个子�c�，它同时也是Lucene支持的最为基本的一个查询类。生成一个TermQuery对象由如下语句完成： TermQuery termQuery = new TermQuery(new Term(“fieldName�?”queryWord�?); 它的构造函数只接受一个参敎ͼ�那就是一个Term对象�?

IndexSearcher

IndexSearcher是用来在建立好的索引上进行搜索的。它只能以只�ȝ��方式打开一个烦引，所以可以有多个IndexSearcher的实例在一个烦引上�q�行操作�?

Hits

Hits是用来保存搜索的�l�果的�?

介绍完这些搜索所必须的类之后�Q�我们就开始在之前所建立的烦引上�q�行搜烦了，清单2�l�出了完成搜索功能所需要的代码�?

清单2 �Q�在建立好的索引上进行搜�?

package TestLucene;

import java.io.File;

import org.apache.lucene.document.Document;
import org.apache.lucene.index.Term;
import org.apache.lucene.search.Hits;
import org.apache.lucene.search.IndexSearcher;
import org.apache.lucene.search.TermQuery;
import org.apache.lucene.store.FSDirectory;

/**
* This class is used to demonstrate the
* process of searching on an existing
* Lucene index
*
*/
public class TxtFileSearcher {
public static void main(String[] args) throws Exception{
String queryStr = "lucene";
//This is the directory that hosts the Lucene index
File indexDir = new File("D:\\luceneIndex");
FSDirectory directory = FSDirectory.getDirectory(indexDir,false);
IndexSearcher searcher = new IndexSearcher(directory);
if(!indexDir.exists()){
System.out.println("The Lucene index is not exist");
return;
}
Term term = new Term("contents",queryStr.toLowerCase());
TermQuery luceneQuery = new TermQuery(term);
Hits hits = searcher.search(luceneQuery);
for(int i = 0; i < hits.length(); i++){
Document document = hits.doc(i);
System.out.println("File: " + document.get("path"));
}
}
}

�? 清单2中，�c�IndexSearcher的构造函数接受一个类型�ؓDirectory的对象，Directory是一个抽象类�Q�它目前有两个子�c�： FSDirctory和RAMDirectory. 我们的程序中传入了一个FSDirctory对象作�ؓ其参敎ͼ�代表了一个存储在��盘上的索引的位�|�。构造函数执行完成后�Q�代表了�q�个 IndexSearcher以只�ȝ��方式打开了一个烦引。然后我们程序构造了一个Term对象�Q�通过�q�个Term对象�Q�我们指定了要在文档的内容中搜烦�? 含关键词”lucene”的文档。接着利用�q�个Term对象构造出TermQuery对象�q�把�q�个TermQuery对象传入�? IndexSearcher的search�Ҏ��中进行查询，�q�回的结果保存在Hits对象中。最后我们用了一个��@环语句把搜烦到的文档的�\径都打印了出来。好了，我们的搜索应用程序已�l�开发完毕，怎么��P��利用Lucene开发搜索应用程序是不是很简单�?

保尔�?/a> 2006-07-14 08:45 发表评论

��Z��Java的全文烦引引擎Lucene�Q�未读）

Wed, 21 Jun 2006 12:22:00 GMT

参考�R东的《在应用中加入全文检索功�?——基于Java的全文烦引引擎Lucene��介�?

�Ҏ�� 切词索引存储用�?
Field.Text(String name, String value) Yes Yes Yes 切分词烦引�ƈ存储�Q�比如：标题�Q�内容字�D?
Field.Text(String name, Reader value) Yes Yes No 切分词烦引不存储�Q�比如：META信息�Q?
不用于返回显�C�，但需要进行检索内�?
Field.Keyword(String name, String value) No Yes Yes 不切分烦引�ƈ存储�Q�比如：日期字段
Field.UnIndexed(String name, String value) No No Yes 不烦引，只存储，比如�Q�文件�\�?
Field.UnStored(String name, String value) Yes Yes No 只全文烦引，不存�?

好好看看�q�篇文章�Q�很不错�?

----------------------------------------------------------------------------------------
�Q�李宇翻译，来自Lucene的帮助文档）

�l�论

Lucene提供了方便您创徏自徏查询的API�Q�也通过QueryParser提供了强大的查询语言�?

本文讲述Lucene的查询语句解析器支持的语法，Lucene的查询语句解析器是��用JavaCC工具生成的词法解析器�Q�它��查询字串解析�ؓLucene Query对象�?

��（Term�Q?

一条搜索语句被拆分��Z��些项�Q�term�Q�和操作�W�（operator�Q�。项有两�U�类型：单独��和短语�?

单独��就是一个单独的单词�Q�例�?test" �Q?"hello"�?

短语是一�l�被双引号包围的单词�Q�例�?hello dolly"�?

多个��可以用布尔操作�W�连接�v来�Ş成复杂的查询语句�Q�接下来您就会看刎ͼ��?

注意�Q�Analyzer建立索引时��用的解析器和解析单独��和短语时的解析器相同，因此选择一个不会受查询语句�q�扰的Analyzer非常重要�?

域（Field�Q?

Lucene支持域。您可以指定在某一个域中搜索，或者就使用默认域。域名及默认域是具体索引器实现决定的�?

您可以这��h��索域�Q�域�?":"+搜烦的项名�?

举个例子�Q�假设某一个Lucene索引包含两个域，title和text�Q�text是默认域。如果您��x��找标题�ؓ"The Right Way"且含�?don't go this way"的文章，您可以输入：

title:"The Right Way" AND text:go

或�?

title:"Do it right" AND right

因�ؓtext是默认域�Q�所以这个域名可以不行�?

注意�Q�域名只对紧接于其后的项生效�Q�所�?

title:Do it right

只有"Do"属于title域�?it"�?right"仍将在默认域中搜索（�q�里是text域）�?

��修饰符�Q�Term Modifiers�Q?

Lucene支持��修饰符以支持更宽范围的搜烦选项�?

用通配�W�搜�?

Lucene支持单个与多个字�W�的通配搜烦�?

使用�W�号"?"表示单个��L��字符的通配�?

使用�W�号"*"表示多个��L��字符的通配�?

单个��L��字符匚w��的是所有可能单个字�W�。例如，搜烦"text或�?test"�Q�可以这��P��

te?t

多个��L��字符匚w��的是0个及更多个可能字�W�。例如，搜烦test, tests 或�?tester�Q�可以这��P��

test*

您也可以在字�W�窜中间使用多个��L��字符通配�W��?

te*t

注意�Q�您不能在搜索的��开始��?或�?�W�号�?

模糊查询

Lucene支持��Z��Levenshtein Distance与Edit Distance��法的模�p�搜索。要使用模糊搜烦只需要在单独��的最后加上符�?~"。例如搜索拼写类��g��"roam"的项�q�样写：

roam~

�q�次搜烦��找到�Ş如foam和roams的单词�?

注意�Q��用模�p�查询将自动得到增量因子�Q�boost factor�Q��ؓ0.2的搜索结�?

邻近搜烦(Proximity Searches)

Lucene�q�支持查扄��隔一定距��ȝ��单词。邻�q�搜索是在短语最后加上符�?~"。例如在文档中搜索相�?0个单词的"apache"�?jakarta"�Q�这样写�Q?

"jakarta apache"~10

Boosting a Term

Lucene provides the relevance level of matching documents based on the terms found. To boost a term use the caret, "^", symbol with a boost factor (a number) at the end of the term you are searching. The higher the boost factor, the more relevant the term will be.

Lucene可以讄��在搜索时匚w��的�怼�度。在��的最后加上符�?^"紧接一个数字（增量��|��Q�表�C�搜索时的相似度。增量��D��高，搜烦到的��相兛_��好�?

Boosting allows you to control the relevance of a document by boosting its term. For example, if you are searching for jakarta apache and you want the term "jakarta" to be more relevant boost it using the ^ symbol along with the boost factor next to the term. You would type:

通过增量一个项可以控制搜烦文档时的相关度。例如如果您要搜索jakarta apache�Q�同时您惌��"jakarta"的相兛_��更加好，那么在其后加�?^"�W�号和增量��|��也就是您输入�Q?

jakarta^4 apache

This will make documents with the term jakarta appear more relevant. You can also boost Phrase Terms as in the example:

�q�将使得生成的doucment��可能与jakarta相关度高。您也可以增量短语，象以下这个例子一��P��

"jakarta apache"^4 "jakarta lucene"

By default, the boost factor is 1. Although, the boost factor must be positive, it can be less than 1 (i.e. .2)

默认情况下，增量值是1。增量��g��可以��于1�Q�例�?.2�Q�，但必��L��有效的�?

布尔操作�W?

布尔操作�W�可��项通过逻辑操作�q�接��h��。Lucene支持AND, "+", OR, NOT �?"-"�q�些操作�W�。（注意�Q�布��操作符必须全部大写�Q?

OR

OR操作�W�是默认的连接操作符。这意味着如果两个��之间没有布��操作符�Q�就是��用OR操作�W�。OR操作�W�连接两个项�Q�意味着查找含有��L��的文档。这与集合�ƈ�q�算相同。符号||可以代替�W�号OR�?

搜烦含有"jakarta apache" 或�?"jakarta"的文档，可以使用�q�样的查询：

"jakarta apache" jakarta

或�?

"jakarta apache" OR jakarta

AND

AND操作�W�匹配的是两��同时出现的文档。这个与集合交操作相�{�。符�?amp;&可以代替�W�号AND�?

搜烦同时含有"jakarta apache" �?"jakarta lucene"的文档，使用查询�Q?

"jakarta apache" AND "jakarta lucene"

+

"+"操作�W�或者称为存在操作符�Q�要求符�?+"后的��必��d��文档相应的域中存在�?

搜烦必须含有"jakarta"�Q�可能含�?lucene"的文档，使用查询�Q?

+jakarta apache

NOT

NOT操作�W�排除那些含有NOT�W�号后面��的文档。这和集合的差运��相同。符��P��可以代替�W�号NOT�?

搜烦含有"jakarta apache"�Q�但是不含有"jakarta lucene"的文档，使用查询�Q?

"jakarta apache" NOT "jakarta lucene"

注意�Q�NOT操作�W�不能单独与��用构成查询。例如，以下的查询查不到��M��l�果�Q?

NOT "jakarta apache"

-

"-"操作�W�或者禁止操作符排除含有"-"后面的相似项的文档�?

搜烦含有"jakarta apache"�Q�但不是"jakarta lucene"�Q��用查询：

"jakarta apache" -"jakarta lucene"

分组�Q�Grouping�Q?

Lucene支持使用圆括��h��l�合字句形成子查询。这对于��x��制查询布��逻辑的�h十分有用�?

搜烦含有"jakarta"或�?apache"�Q�同时含�?website"的文档，使用查询�Q?

(jakarta OR apache) AND website

�q�样��消除了歧义�Q�保证website必须存在�Q�jakarta和apache中之一也存在�?

转义�Ҏ��字符�Q�Escaping Special Characters�Q?

Lucene支持转义�Ҏ��字符�Q�因为特�D�字�W�是查询语法用到的。现在，�Ҏ��字符包括

+ - && || ! ( ) { } [ ] ^ " ~ * ? : \

转义�Ҏ��字符只需在字�W�前加上�W�号\,例如搜烦(1+1):2�Q��用查�?

\(1\+1\)\:2

---------------------------------------
索引文�g格式

本文定义了Lucene�Q�版�?.3�Q�用到的索引文�g的格式�?

Jakarta Lucene是用Java写成的，同时有很多团体正在默默的用其他的�E�序语言来改写它。如果这些新的版本想和Jakarta Lucene兼容�Q�就需要一个与具体语言无关的Lucene索引文�g格式。本文正是试图提供一个完整的与语�a�无关的Jakarta Lucene 1.3索引文�g格式的规格定义�?

随着Lucene不断发展�Q�本文也应该更新。不同语�a�写成的Lucene实现版本应当��力遵守文�g格式�Q�也必须产生本文的新版本�?

本文同时提供兼容性批注，描述文�g格式上与前一版本不同的地斏V�?

定义

Lucene中最基础的概忉|��索引�Q�index�Q�，文档�Q�document�Q�，域（field�Q�和��（term�Q��?

索引包含了一个文档的序列�?

· 文档是一些域的序列�?

· 域是一些项的序列�?

· ��就是一个字丌Ӏ?

存在于不同域中的同一个字串被认�ؓ是不同的��V��因此项实际是用一对字串表�C�的�Q�第一个字串是域名�Q�第二个是域中的字串�?

倒排索引

��Z��使得��Z��的搜烦更有效率�Q�烦引中��Ҏ��静态存储的。Lucene的烦引属于烦引方式中的倒排索引�Q�因为对于一个项�q�种索引可以列出包含它的文档。这刚好是文档与��自然联�pȝ��倒置�?

域的�c�d��

Lucene中，域的文本可能以逐字的非倒排的方式存储在索引中。而倒排�q�的域称��索引�q�了。域也可能同时被存储和被索引�?

域的文本可能被分解许多项目而被索引�Q�或者就被用作一个项目而被索引。大多数的域是被分解�q�的�Q�但是有些时候某些标识符域被当做一个项目烦引是很有用的�?

�D�（Segment�Q?

Lucene索引可能由多个子索引�l�成�Q�这些子索引成�ؓ�D�c��每一�D�都是完整独立的索引�Q�能被搜索。烦引是�q�样作成的：

1. 为新加入的文档创建新�D�c�?

2. 合�ƈ已经存在的段�?

搜烦旉��要涉及到多个�D�和/或者多个烦引，每一个烦引又可能�׃��些段�l�成�?

文档��P��Document Number�Q?

内部的来��_��Lucene用一个整形（interger�Q�的文档��h��指示文档。第一个被加入到烦引中的文档就�?��P��序加入的文档将得到一个由前一个号码递增而来的号码�?

注意文档��h��可能改变的，所以在Lucene外部存储�q�些��L��时必��d��心。特别的�Q�号码的改变的情况如下：

· 只有�D�内的号码是相同的，不同�D�之间不同，因而在一个比�D�广泛的上下文环境中使用�q�些��L��Ӟ��必��L��变它们。标准的技术是�Ҏ��每一�D�号码多��ؓ每一�D�分配一个段受��将�D�内文档可��{换到�D�外�Ӟ��加上�D�号。将某段外的文档可��{换到�D�内�Ӟ��Ҏ��每段中可能的转换后号码范围来判断文档属于那一�D�，�q�减调这一�D늚� �D�号。例如有两个�?个文档的�D�合�qӞ��那么�W�一�D늚��D�号��是0�Q�第二段�D�号5。第二段中的�W�三个文档，在段外的��L��是8�?

· 文档删除后，�q�箋的号码就出现了间断。这可以通过合�ƈ索引来解冻I��D�合�q�时删除的文档相应也删掉了，新合�q�而成的段�q�没有号码间断�?

�l�论

索引�D늻�护着以下的信息：

· 域集合。包含了索引中用到的所有的域�?

· 域值存储表。每一个文档都含有一个“属性－值”对的列表，属性即为域名。这个列表用来存储文档的一些附加信息，如标题，url或者访问数据库的一个ID。在搜烦时存储域的集合可以被�q�回。这个表以文档号标识�?

· ��字典。这个字典含有所有文档的所有域中��用过的的��，同时含有使用�q�它的文档的文档��P��以及指向使用频数信息和位�|�信息的指针�?

· ��w��C��息。对于项字典中的每个��，�q�些信息包含含有�q�个��的文档的��L��Q�以及每个文档中使用的次数�?

· ��位�|�信息。对于项字典中的每个��，都存有在每个文档中出现的各个位置�?

· Normalization factors. For each field in each document, a value is stored that is multiplied into the score for hits on that field. 标准化因子。对于文档中的每一个域�Q�存有一个��|��用来以后乘以�q�个�q�个域的命中敎ͼ�hits�Q��?

· 被删除的文档信息。这是一个可选文�Ӟ��用来表明那些文档已经删除了�?

接下来的各部分部分详�l�描�q�这些信息�?

文�g的命名（File Naming�Q?

同属于一个段的文件拥有相同的文�g名，不同的扩展名。扩展名�׃��下讨论的各种文�g格式��定�?

一般来��_��一个烦引存放一个目录，其所有段都存攑֜��q�个目录里，��管我们不要求您�q�样做�?

基本数据�c�d��Q�Primitive Types�Q?

Byte

最基本的数据类型就是字节（byte�Q?位）。文件就是按字节��序讉K��的。其它的一些数据类型也定义为字节的序列�Q�文件的格式��h��字节意义上的独立性�?

UInt32

32位无�W�号整数�Q�由四个字节�l�成�Q�高位优先�?

UInt32 --> 4

Uint64

64位无�W�号整数�Q�由八字节组成，高位优先�?

UInt64 --> 8

VInt

可变长的正整数类型，每字节的最高位表明�q�剩多少字节。每字节的低七位表明整数的倹{��因此单字节的��g��0�?27�Q�两字节��g��128�?6,383�Q�等�{��?

VInt �~�码�C�Z��

Value
First byte
Second byte
Third byte

0
00000000

1
00000001

2
00000010

...

127
01111111

128
10000000
00000001

129
10000001
00000001

130
10000010
00000001

...

16,383
11111111
01111111

16,384
10000000
10000000
00000001

16,385
10000001
10000000
00000001

...

�q�种�~�码提供了一�U�在高效率解码时压羃数据的方法�?

Chars

Lucene输出UNICODE字符序列�Q��用标准UTF-8�~�码�?

String

Lucene输出由VINT和字�W�串�l�成的字�Ԍ��VINT表示字串长，字符串紧接其后�?

String --> VInt, Chars

索引包含的文�Ӟ��Per-Index Files�Q?

�q�部分介�l�每个烦引包含的文�g�?

Segments文�g

索引中活动的�D�存储在Segments文�g中。每个烦引只能含有一个这��L��文�g�Q�名�?segments".�q�个文�g依次列出每个�D늚�名字和每个段的大��?

Segments --> SegCount, SegCount

SegCount, SegSize --> UInt32

SegName --> String

SegName表示该segment的名字，同时作�ؓ索引其他文�g的前�~��?

SegSize是段索引中含有的文档数�?

Lock文�g

有一些文件用来表�C�另一个进�E�在使用索引�?

· 如果存在"commit.lock"文�g�Q�表�C�有�q�程在写"segments"文�g和删除无用的�D늃�引文�Ӟ��或者表�C�有�q�程在读"segments"文�g 和打开某些�D늚�文�g。在一个进�E�在��d��"segments"文�g�D�信息后�Q�还没来得及打开所有该�D늚�文�g前，�q�个Lock文�g可以防止另一个进�E�删除这�? 文�g�?

· 如果存在"index.lock"文�g�Q�表�C�有�q�程在向索引中加入文档，或者是从烦引中删除文档。这个文仉��止很多文件同时修改一个烦引�?

Deleteable文�g

名�ؓ"deletetable"的文件包含了索引不再使用的文件的名字�Q�这些文件可能�ƈ没有被实际的删除。这�U�情况只存在与Win32�q�_��下，因�ؓWin32下文件仍打开时�ƈ不能删除�?

Deleteable --> DelableCount, DelableCount

DelableCount --> UInt32

DelableName --> String

�D�包含的文�g�Q�Per-Segment Files�Q?

剩下的文件是每段中包含的文�g�Q�因此由后缀来区分�?

域（Field�Q?

域集合信息（Field Info�Q?

所有域名都存储在这个文件的域集合信息中�Q�这个文件以后缀.fnm�l�尾�?

FieldInfos (.fnm) --> FieldsCount, FieldsCount

FieldsCount --> VInt

FieldName --> String

FieldBits --> Byte

目前情况下，FieldBits只有使用低位�Q�对于已索引的域��gؓ1�Q�对未烦引的域��gؓ0�?

文�g中的域根据它们的�ơ序�~�号。因此域0是文件中的第一个域�Q�域1是接下来的，�{�等。这个和文档��L��~�号方式相同�?

域值存储表�Q�Stored Fields�Q?

域值存储表使用两个文�g表示�Q?

1. 域烦引（.fdx文�g�Q��?

如下�Q�对于每个文档这个文件包含指向域值的指针�Q?

FieldIndex (.fdx) --> SegSize

FieldValuesPosition --> Uint64

FieldValuesPosition 指示的是某一文档的某域的域值在域值文件中的位�|�。因为域值文件含有定长的数据信息�Q�因而很�Ҏ��随机讉K��。在域值文件中�Q�文档n的域��g��息就存在n*8�? �|�处�Q�The position of document n's field data is the Uint64 at n*8 in this file.�Q��?

2. 域��|��.fdt文�g�Q��?

如下�Q�每个文档的域��g��息包含：

FieldData (.fdt) --> SegSize

DocFieldData --> FieldCount, FieldCount

FieldCount --> VInt

FieldNum --> VInt

Bits --> Byte

Value --> String

目前情况下，Bits只有低位被��用，��gؓ1表示域名被分解过�Q��gؓ0表示未分解过�?

��字典（Term Dictionary�Q?

��字典用以下两个文�g表示�Q?

1. ��信息（.tis文�g�Q��?

TermInfoFile (.tis)--> TermCount, TermInfos

TermCount --> UInt32

TermInfos --> TermCount

TermInfo -->

Term -->

Suffix --> String

PrefixLength, DocFreq, FreqDelta, ProxDelta
--> VInt

��信息按��Ҏ��序。项信息排序时先按项所属的域的文字��序排序�Q�然后按照项的字串的文字��序排序�?

��的字前�~�往往是共同的�Q�与字的后缀�l�成字。PrefixLength变量��是表示与前一��相同的前缀的字数。因此，如果前一个项的字�?bone"�Q�后一个是"boy"的话�Q�PrefixLength��gؓ2�Q�Suffix��gؓ"y"�?

FieldNum指明了项属于的域��P��而域名存储在.fdt文�g中�?

DocFreg表示的是含有该项的文档的数量�?

FreqDelta指明了项所属TermFreq变量�?frq文�g中的位置。详�l�的��_��是指相对于前一个项的数据的位置偏移量（或者是0�Q�表�C�文件中�W�一个项�Q��?

ProxDelta指明了项所属的TermPosition变量�?prx文�g中的位置。详�l�的��_��是指相对于前一个项的数据的位置偏移量（或者是0�Q�表�C�文件中�W�一个项�Q��?

2. ��信息烦引（.tii文�g�Q��?

每个��信息烦引文件包�?tis文�g中的128个条目，依照条目�?tis文�g中的��序。这栯��计是��Z��一�ơ将索引信息��d��内存能，然后使用它来随机的访�?tis文�g�?

�q�个文�g的结构和.tis文�g非常�c�M��Q�只在每个条目记录上增加了一个变量IndexDelta�?

TermInfoIndex (.tii)--> IndexTermCount, TermIndices

IndexTermCount --> UInt32

TermIndices --> IndexTermCount

IndexDelta --> VInt

IndexDelta表示该项的TermInfo变量值在.tis文�g中的位置。详�l�的�Ԍ��是指相对于前一个条目的偏移量（或者是0�Q�对于文件中�W�一个项�Q��?

��w��敎ͼ�Frequencies�Q?

.frq文�g包含每一��的文档的列表，�q�有该项在对应文档中出现的频数�?

FreqFile (.frq) --> TermCount

TermFreqs --> DocFreq

TermFreq --> DocDelta, Freq?

DocDelta,Freq --> VInt

TermFreqs序列按照��Ҏ��排序�Q�依据于.tis文�g中的��，即项是隐含存在的�Q��?

TermFreq元组按照文档号升序排列�?

DocDelta 军_��了文档号和频数。详�l�的��_��DocDelta/2表示相对于前一文档��L��偏移量（或者是0�Q�表�C��是TermFreqs里面的第一��）。当 DocDelta是奇数时表示在该文档中频��Cؓ1�Q�当DocDelta是偶数时�Q�另一个VInt�Q�Freq�Q�就表示在该文档中出现的频数�?

例如�Q�假设某一��在文档7中出��C��ơ，在文�?1中出��C��3�ơ，在TermFreqs中就存在如下的VInts序列�Q?

15, 22, 3

��位�|�（Position�Q?

.prx文�g包含了某文档中某��出现的位置信息的列表�?

ProxFile (.prx) --> TermCount

TermPositions --> DocFreq

Positions --> Freq

PositionDelta --> VInt

TermPositions按照��Ҏ��排序�Q�依据于.tis文�g中的��，即项是隐含存在的�Q��?

Positions元组按照文档号升序排列�?

PositionDelta是相对于前一个出��C��|�的偏移位置�Q�或者�ؓ0�Q�表�C��是第一�ơ在�q�个文档中出玎ͼ��?

例如�Q�假设某一��在某文档第4��出玎ͼ�在另一个文档中�W?��和�W?��出玎ͼ��存在如下的VInt序列�Q?

4, 5, 4

标准化因子（Normalization Factor�Q?

.nrm文�g包含了每个文档的标准化因子，标准化因子用来以后乘以这个这个域的命中数�?

Norms (.nrm) --> SegSize

每个字节记录一个��Q�Ҏ��。位0-2包含�?位的��数部分�Q�位3-8包含�?位的指数部分�?

按如下规则可��这些字节�{换�ؓIEEE标准单精度��Q�Ҏ��Q?

1. 如果该字节是0�Q�就是��Q�?�Q?

2. 否则�Q�设�|�新��点数的标志位�ؓ0�Q?

3. ��字节中的指数加�?8后作为新的��Q�Ҏ��的指敎ͼ�

4. ��字节中的尾数映��到新��Q�Ҏ��数的高3位；�q�且

5. 讄��新��Q�Ҏ��数的低21位�ؓ0�?

被删除的文档�Q�Deleted Document�Q?

.del文�g是可选的�Q�只有在某段中存在删除操作后才存在：

Deletions (.del) --> ByteCount,BitCount,Bits

ByteSize,BitCount --> Uint32

Bits --> ByteCount

ByteCount表示的是Bits列表中Byte的数量。典型的�Q�它�{�于�Q�SegSize/8�Q?1�?

BitCount表示Bits列表中多��个已经被设�|�过了�?

Bits列表包含了一些位�Q�bit�Q�，��序表示一个文档。当对应于文档号的位被设�|�了�Q�就标志着�q�个文档已经被删除了。位的顺序是从低到高。因此，如果Bits包含两个字节�Q?x00�?x02�Q�那么表�C�文�?已经删除了�?

局限性（Limitations�Q?

在以上的文�g格式中，好几处都有限刉��和文档的最大个��Cؓ32位数的极限，��x��q�于40�ѝ��今天看来，�q�不会造成问题�Q�但是，长远的看�Q�可能造成问题。因此，�q�些极限应该或者换为UInt64�c�d��的��|��或者更好的�Q�换为VInt�c�d��的��|��VInt值没有上限）�?

有两处地方的代码要求必须是定长的��|��他们是：

1. FieldValuesPosition变量�Q�存储于域烦引文件中�Q?fdx文�g�Q�。它已经是一个UInt64型，所以不会有问题�?

2. TermCount变量�Q�存储于��信息文件中�Q?tis文�g�Q�。这是最后输出到文�g中的�Q�但是最先被��d��Q�因此是存储于文件的最前端。烦引代码先在这里写入一�?��|��然后在其他文件输出完毕后覆盖�q�个倹{��所以无论它存储在什么地方，它都必须是一个定长的��|��它应该被变成UInt64 型�?

除此之外�Q�所有的UInt值都可以换成VInt型以��L��限制�?/p>

保尔�?/a> 2006-06-21 20:22 发表评论

Thu, 08 Jun 2006 07:17:00 GMT

�Q�共两篇文章�Q�以�Q�－�Q�分隔）
一、安装篇

　　jspSmartUpload是由www.jspsmart.com�|�站开发的一个可免费使用的全功能的文件上传下载组�Ӟ��适于嵌入执行上传下蝲操作的JSP文�g中。该�l��g有以下几个特点：

1、��用简单。在JSP文�g中仅仅书写三五行JAVA代码��可以搞定文件的上传或下载，方便�?

2、能全程控制上传。利用jspSmartUpload�l��g提供的对象及其操作方法，可以获得全部上传文�g的信息（包括文�g名，大小�Q�类型，扩展名，文�g数据�{�）�Q�方便存取�?

3、能对上传的文�g在大��、类型等斚w��做出限制。如此可以��o掉不�W�合要求的文件�?

4、下载灵�z�R��仅写两行代码，��p��把Web服务器变成文件服务器。不��文件在Web服务器的目录下或在其它�Q何目录下�Q�都可以利用jspSmartUpload�q�行下蝲�?

5、能��文件上传到数据库中�Q�也能将数据库中的数据下载下来。这�U�功能针对的是MYSQL数据库，因�ؓ不具有通用性，所以本文不准备举例介绍�q�种用法�?

　　jspSmartUpload�l��g可以�?a >www.jspsmart.com�|�站上自�׃��载，压羃包的名字是jspSmartUpload.zip。下载后�Q�用WinZip或WinRAR��其解压到Tomcat的webapps目录下（本文以Tomcat服务器�ؓ例进行介�l�）。解压后�Q�将webapps/jspsmartupload目录下的子目录Web-inf名字改�ؓ全大写的WEB-INF�Q�这样一改jspSmartUpload�c�L��能��用。因为Tomcat�Ҏ��件名大小写敏感，它要求Web应用�E�序相关的类所在目录�ؓWEB-INF�Q�且必须是大写。接着重新启动Tomcat�Q�这样就可以在JSP文�g中��用jspSmartUpload�l��g了�?

　　注意�Q�按上述�Ҏ��安装后，只有webapps/jspsmartupload目录下的�E�序可以使用jspSmartUpload�l��g�Q�如果想让Tomcat服务器的所有Web应用�E�序都能用它�Q�必��d��如下工作�Q?

1�Q�进入命令行状态，��目录切换到Tomcat的webapps/jspsmartupload/WEB-INF目录下�?

2�Q�运行JAR打包命��o�Q�jar cvf jspSmartUpload.jar com

�Q�也可以打开资源��理器，切换到当前目录，用WinZip��com目录下的所有文件压�~�成jspSmartUpload.zip�Q�然后将jspSmartUpload.zip换名为jspSmartUpload.jar文�g卛_��。）

3�Q�将jspSmartUpload.jar拯��到Tomcat的shared/lib目录下�?

二、相关类说明��?

�?File�c?

　　�q�个�c�d��装了一个上传文件的所有信息。通过它，可以得到上传文�g的文件名、文件大��、扩展名、文件数据等信息�?

　　File�c�M��要提供以下方法：

1、saveAs作用�Q�将文�g换名另存�?

原型�Q?

public void saveAs(java.lang.String destFilePathName)

�?

public void saveAs(java.lang.String destFilePathName, int optionSaveAs)

其中�Q�destFilePathName是另存的文�g名，optionSaveAs是另存的选项�Q�该选项有三个��|��分别是SAVEAS_PHYSICAL,SAVEAS_VIRTUAL�Q�SAVEAS_AUTO。SAVEAS_PHYSICAL表明以操作系�l�的根目录�ؓ文�g根目录另存文�Ӟ��SAVEAS_VIRTUAL表明以Web应用�E�序的根目录为文件根目录另存文�g�Q�SAVEAS_AUTO则表�C��l��g军_��Q�当Web应用�E�序的根目录存在另存文�g的目录时�Q�它会选择SAVEAS_VIRTUAL�Q�否则会选择SAVEAS_PHYSICAL�?

例如�Q�saveAs("/upload/sample.zip",SAVEAS_PHYSICAL)执行后若Web服务器安装在C盘，则另存的文�g名实际是c:\upload\sample.zip。而saveAs("/upload/sample.zip",SAVEAS_VIRTUAL)执行后若Web应用�E�序的根目录是webapps/jspsmartupload�Q�则另存的文件名实际是webapps/jspsmartupload/upload/sample.zip。saveAs("/upload/sample.zip",SAVEAS_AUTO)执行时若Web应用�E�序根目录下存在upload目录�Q�则其效果同saveAs("/upload/sample.zip",SAVEAS_VIRTUAL)�Q�否则同saveAs("/upload/sample.zip",SAVEAS_PHYSICAL)�?

��Q�对于Web�E�序的开发来��_��最好��用SAVEAS_VIRTUAL�Q�以便移植�?

2、isMissing

作用�Q�这个方法用于判断用��h��否选择了文�Ӟ��也即对应的表单项是否有倹{��选择了文件时�Q�它�q�回false。未选文件时�Q�它�q�回true�?

原型�Q�public boolean isMissing()

3、getFieldName

作用�Q�取HTML表单中对应于此上传文件的表单��的名字�?

原型�Q�public String getFieldName()

4、getFileName

作用�Q�取文�g名（不含目录信息�Q?

原型�Q�public String getFileName()

5、getFilePathName

作用�Q�取文�g全名�Q�带目录�Q?

原型�Q�public String getFilePathName

6、getFileExt

作用�Q�取文�g扩展名（后缀�Q?

原型�Q�public String getFileExt()

7、getSize

作用�Q�取文�g长度�Q�以字节计）

原型�Q�public int getSize()

8、getBinaryData

作用�Q�取文�g数据中指定位�U�d��的一个字节，用于��文件等处理�?

原型�Q�public byte getBinaryData(int index)。其中，index表示位移�Q�其值在0到getSize()-1之间�?

�?Files�c?

　　�q�个�c�表�C�所有上传文件的集合�Q�通过它可以得��C��传文件的数目、大��等信息。有以下�Ҏ��Q?

1、getCount

作用�Q�取得上传文件的数目�?

原型�Q�public int getCount()

2、getFile

作用�Q�取得指定位�U�d��的文件对象File�Q�这是com.jspsmart.upload.File�Q�不是java.io.File�Q�注意区分）�?

原型�Q�public File getFile(int index)。其中，index为指定位�U�，其值在0到getCount()-1之间�?

3、getSize

作用�Q�取得上传文件的总长度，可用于限制一�ơ性上传的数据量大��?

原型�Q�public long getSize()

4、getCollection

作用�Q�将所有上传文件对象以Collection的�Ş式返回，以便其它应用�E�序引用�Q�浏览上传文件信息�?

原型�Q�public Collection getCollection()

5、getEnumeration

作用�Q�将所有上传文件对象以Enumeration�Q�枚举）的�Ş式返回，以便其它应用�E�序��览上传文�g信息�?

原型�Q�public Enumeration getEnumeration()

�?Request�c?

　　�q�个�cȝ��功能�{�同于JSP内置的对象request。只所以提供这个类�Q�是因�ؓ对于文�g上传表单�Q�通过request对象无法获得表单��的��|��必须通过jspSmartUpload�l��g提供的Request对象来获取。该�c�L��供如下方法：

1、getParameter

作用�Q�获取指定参��C��倹{��当参数不存在时�Q�返回��gؓnull�?

原型�Q�public String getParameter(String name)。其中，name为参数的名字�?

2、getParameterValues

作用�Q�当一个参数可以有多个值时�Q�用此方法来取其倹{��它�q�回的是一个字�W�串数组。当参数不存在时�Q�返回��gؓnull�?

原型�Q�public String[] getParameterValues(String name)。其中，name为参数的名字�?

3、getParameterNames

作用�Q�取得Request对象中所有参数的名字�Q�用于遍历所有参数。它�q�回的是一个枚丑֞�的对象�?

原型�Q�public Enumeration getParameterNames()

�?SmartUpload�c�这个类完成上传下蝲工作�?

A�Q�上传与下蝲��q��的方法：

只有一个：initialize�?

作用�Q�执行上传下载的初始化工作，必须�W�一个执行�?

原型�Q�有多个�Q�主要��用下面这个：

public final void initialize(javax.servlet.jsp.PageContext pageContext)

其中�Q�pageContext为JSP��面内置对象�Q�页面上下文�Q��?

B�Q�上传文件��用的�Ҏ��Q?

1、upload

作用�Q�上传文件数据。对于上传操作，�W�一步执行initialize�Ҏ��Q�第二步��p��执行�q�个�Ҏ��?

原型�Q�public void upload()

2、save

作用�Q�将全部上传文�g保存到指定目录下�Q��ƈ�q�回保存的文件个数�?

原型�Q�public int save(String destPathName)

和public int save(String destPathName,int option)

其中�Q�destPathName为文件保存目录，option��Z��存选项�Q�它有三个��|��分别是SAVE_PHYSICAL,SAVE_VIRTUAL和SAVE_AUTO。（同File�cȝ��saveAs�Ҏ��的选项之值类��|��SAVE_PHYSICAL指示�l��g��文件保存到以操作系�l�根目录为文件根目录的目录下�Q�SAVE_VIRTUAL指示�l��g��文件保存到以Web应用�E�序根目录�ؓ文�g根目录的目录下，而SAVE_AUTO则表�C�由�l��g自动选择�?

注：save(destPathName)作用�{�同于save(destPathName,SAVE_AUTO)�?

3、getSize

作用�Q�取上传文�g数据的总长�?

原型�Q�public int getSize()

4、getFiles

作用�Q�取全部上传文�g�Q�以Files对象形式�q�回�Q�可以利用Files�cȝ��操作�Ҏ��来获得上传文件的数目�{�信息�?

原型�Q�public Files getFiles()

5、getRequest

作用�Q�取得Request对象�Q�以便由此对象获得上传表单参��C��倹{�?

原型�Q�public Request getRequest()

6、setAllowedFilesList

作用�Q�设定允�怸�传带有指定扩展名的文�Ӟ��当上传过�E�中有文件名不允许时�Q�组件将抛出异常�?

原型�Q�public void setAllowedFilesList(String allowedFilesList)

其中�Q�allowedFilesList为允�怸�传的文�g扩展名列表，各个扩展名之间以逗号分隔。如果想允许上传那些没有扩展名的文�g�Q�可以用两个逗号表示。例如：setAllowedFilesList("doc,txt,,")��允�怸�传带doc和txt扩展名的文�g以及没有扩展名的文�g�?

7、setDeniedFilesList

作用�Q�用于限制上传那些带有指定扩展名的文件。若有文件扩展名被限�Ӟ��则上传时�l��g��抛出异常�?

原型�Q�public void setDeniedFilesList(String deniedFilesList)

其中�Q�deniedFilesList为禁止上传的文�g扩展名列表，各个扩展名之间以逗号分隔。如果想��止上传那些没有扩展名的文�g�Q�可以用两个逗号来表�C�。例如：setDeniedFilesList("exe,bat,,")��禁止上传带exe和bat扩展名的文�g以及没有扩展名的文�g�?

8、setMaxFileSize

作用�Q�设定每个文件允�怸�传的最大长度�?

原型�Q�public void setMaxFileSize(long maxFileSize)

其中�Q�maxFileSize��Zؓ每个文�g允许上传的最大长度，当文件超出此长度�Ӟ��不被上传�?

9、setTotalMaxFileSize

作用�Q�设定允�怸�传的文�g的总长度，用于限制一�ơ性上传的数据量大��?

原型�Q�public void setTotalMaxFileSize(long totalMaxFileSize)

其中�Q�totalMaxFileSize为允�怸�传的文�g的总长度�?

C�Q�下载文件常用的�Ҏ��

1、setContentDisposition

作用�Q�将数据�q�加到MIME文�g头的CONTENT-DISPOSITION域。jspSmartUpload�l��g会在�q�回下蝲的信息时自动填写MIME文�g头的CONTENT-DISPOSITION域，如果用户需要添加额外信息，��L��此方法�?

原型�Q�public void setContentDisposition(String contentDisposition)

其中�Q�contentDisposition��d��的数据。如果contentDisposition为null�Q�则�l��g��自动添�?attachment;"�Q�以表明��下载的文�g作�ؓ附�g�Q�结果是IE��览器将会提�C�另存文�Ӟ��而不是自动打开�q�个文�g�Q�IE��览器一般根据下载的文�g扩展名决定执行什么操作，扩展名�ؓdoc的将用word�E�序打开�Q�扩展名为pdf的将用acrobat�E�序打开�Q�等�{�）�?

2、downloadFile

作用�Q�下载文件�?

原型�Q�共有以下三个原型可用，�W�一个最常用�Q�后两个用于�Ҏ��情况下的文�g下蝲�Q�如更改内容�c�d��Q�更改另存的文�g名）�?

�?public void downloadFile(String sourceFilePathName)

其中�Q�sourceFilePathName��下蝲的文件名�Q�带目录的文件全名）

�?public void downloadFile(String sourceFilePathName,String contentType)

其中�Q�sourceFilePathName��下蝲的文件名�Q�带目录的文件全名）,contentType为内容类型（MIME格式的文件类型信息，可被��览器识别）�?

�?public void downloadFile(String sourceFilePathName,String contentType,String destFileName)

其中�Q�sourceFilePathName��下蝲的文件名�Q�带目录的文件全名）,contentType为内容类型（MIME格式的文件类型信息，可被��览器识别）,destFileName��Z��载后默认的另存文件名�?

三、文件上传篇

�?表单要求

对于上传文�g的FORM表单�Q�有两个要求�Q?

1、METHOD应用POST�Q�即METHOD="POST"�?

2、增加属性：ENCTYPE="multipart/form-data"

下面是一个用于上传文件的FORM表单的例子：

ACTION="/jspSmartUpload/upload.jsp">

�?上传的例�?

1、上传页面upload.html

本页面提供表单，让用户选择要上传的文�g�Q�点�?上传"按钮执行上传操作�?

��面源码如下�Q?

文�g上传

上传文�g选择

ENCTYPE="multipart/form-data">

















1�?



2�?



3�?



4�?






2、上传处理页面do_upload.jsp

本页面执行文件上传操作。页面源码中详细介绍了上传方法的用法�Q�在此不赘述了�?

��面源码如下�Q?

<%--
文�g名：do_upload.jsp
作�?者：�U�|��软�g制作中心雨亦�?zhsoft88@sohu.com)
--%>
<%@ page contentType="text/html; charset=gb2312" language="java"
import="java.util.*,com.jspsmart.upload.*" errorPage="" %>

文�g上传处理��面

<%
// 新徏一个SmartUpload对象
SmartUpload su = new SmartUpload();
// 上传初始�?br /> su.initialize(pageContext);
// 讑֮�上传限制
// 1.限制每个上传文�g的最大长度�?br /> // su.setMaxFileSize(10000);
// 2.限制��M��传数据的长度�?br /> // su.setTotalMaxFileSize(20000);
// 3.讑֮�允许上传的文�Ӟ��通过扩展名限�Ӟ��,仅允许doc,txt文�g�?br /> // su.setAllowedFilesList("doc,txt");
// 4.讑֮��止上传的文�Ӟ��通过扩展名限�Ӟ��,��止上传带有exe,bat,
jsp,htm,html扩展名的文�g和没有扩展名的文件�?br /> // su.setDeniedFilesList("exe,bat,jsp,htm,html,,");
// 上传文�g
su.upload();
// ��上传文件全部保存到指定目录
int count = su.save("/upload");
out.println(count+"个文件上传成功！
");

// 利用Request对象获取参数之�?br /> out.println("TEST="+su.getRequest().getParameter("TEST")
+"

");

// 逐一提取上传文�g信息�Q�同时可保存文�g�?br /> for (int i=0;i {
  com.jspsmart.upload.File file = su.getFiles().getFile(i);

  // 若文件不存在则��l?br />  if (file.isMissing()) continue;

  // 昄��当前文�g信息
  out.println("
");
  out.println("");
  out.println("");
  out.println("");
  out.println("");
  out.println("");
  out.println("
表单��名�Q�FieldName�Q?lt;/TD> "
  + file.getFieldName() + "
文�g长度�Q�Size�Q?lt;/TD> " +
  file.getSize() + "
文�g名（FileName�Q?lt;/TD> "
  + file.getFileName() + "
文�g扩展名（FileExt�Q?lt;/TD> "
  + file.getFileExt() + "
文�g全名�Q�FilePathName�Q?lt;/TD> "
  + file.getFilePathName() + "

");

  // ��文件另�?br />  // file.saveAs("/upload/" + myFile.getFileName());
  // 另存��C��WEB应用�E�序的根目录为文件根目录的目录下
  // file.saveAs("/upload/" + myFile.getFileName(),
  su.SAVE_VIRTUAL);
  // 另存到操作系�l�的根目录�ؓ文�g根目录的目录�?br />  // file.saveAs("c:\\temp\\" + myFile.getFileName(),
  su.SAVE_PHYSICAL);

}
%>

四、文件下载篇

1、下载链接页面download.html

��面源码如下�Q?

下蝲

点击下蝲

2、下载处理页面do_download.jsp do_download.jsp展示了如何利用jspSmartUpload�l��g来下载文�Ӟ��从下面的源码中就可以看到�Q�下载何其简单�?

源码如下�Q?

<%@ page contentType="text/html;charset=gb2312"
import="com.jspsmart.upload.*" %><%
  // 新徏一个SmartUpload对象
SmartUpload su = new SmartUpload();
  // 初始�?br /> su.initialize(pageContext);
  // 讑֮�contentDisposition为null以禁止浏览器自动打开文�g�Q?br />  //保证点击链接后是下蝲文�g。若不设定，则下载的文�g扩展名�ؓ
  //doc�Ӟ��览器将自动用word打开它。扩展名为pdf�Ӟ��
  //��览器将用acrobat打开�?br /> su.setContentDisposition(null);
  // 下蝲文�g
su.downloadFile("/upload/如何赚取我的�W�一桉��.doc");
%>

注意�Q�执行下载的��面�Q�在Java脚本范围外（�?lt;% ... %>之外�Q�，不要包含HTML代码、空根{��回车或换行�{�字�W�，有的话将不能正确下蝲。不信的话，可以在上�q�源码中%><%之间加入一个换行符�Q�再下蝲一下，保证出错。因为它影响了返回给��览器的数据��，��D��解析出错�?

3、如何下载中文文�?

jspSmartUpload虽然能下载文�Ӟ��但对中文支持不��。若下蝲的文件名中有汉字�Q�则��览器在提示另存的文件名�Ӟ��昄��的是一堆�ؕ码，很扫人兴。上面的例子��是�q�样。（�q�个问题也是众多下蝲�l��g所存在的问题，很少有�h解决�Q�搜索不到相兌��料，可叹�Q�）

��Z��l�jspSmartUpload�l��g增加下蝲中文文�g的支持，我对该组件进行了研究�Q�发现对�q�回�l�浏览器的另存文件名�q�行UTF-8�~�码后，��览器便能正��显�C�Z��文名字了。这是一个��o人高兴的发现。于是我对jspSmartUpload�l��g的SmartUpload�c�d��了升�U�处理，增加了toUtf8String�q�个�Ҏ��Q�改动部分源码如下：

public void downloadFile(String s, String s1, String s2, int i)
throws ServletException, IOException, SmartUploadException
    {
if(s == null)
     throw new IllegalArgumentException("File '" + s +
     "' not found (1040).");
if(s.equals(""))
     throw new IllegalArgumentException("File '" + s +
     "' not found (1040).");
if(!isVirtual(s) && m_denyPhysicalPath)
     throw new SecurityException("Physical path is
     denied (1035).");
if(isVirtual(s))
     s = m_application.getRealPath(s);
java.io.File file = new java.io.File(s);
FileInputStream fileinputstream = new FileInputStream(file);
long l = file.length();
boolean flag = false;
int k = 0;
byte abyte0[] = new byte[i];
if(s1 == null)
     m_response.setContentType("application/x-msdownload");
else
if(s1.length() == 0)
     m_response.setContentType("application/x-msdownload");
else
     m_response.setContentType(s1);
m_response.setContentLength((int)l);
m_contentDisposition = m_contentDisposition != null ?
m_contentDisposition : "attachment;";
if(s2 == null)
     m_response.setHeader("Content-Disposition",
     m_contentDisposition + " filename=" +
     toUtf8String(getFileName(s)));
else
if(s2.length() == 0)
     m_response.setHeader("Content-Disposition",
     m_contentDisposition);
else
     m_response.setHeader("Content-Disposition",
     m_contentDisposition + " filename=" + toUtf8String(s2));
while((long)k < l)
{
     int j = fileinputstream.read(abyte0, 0, i);
     k += j;
     m_response.getOutputStream().write(abyte0, 0, j);
}
fileinputstream.close();
    }

    /**
     * ��文件名中的汉字转�ؓUTF8�~�码的串,以便下蝲时能正确昄��另存的文件名.
     * �U�|��软�g制作中心雨亦�?003.08.01
     * @param s 原文件名
     * @return 重新�~�码后的文�g�?br />     */
    public static String toUtf8String(String s) {
StringBuffer sb = new StringBuffer();
for (int i=0;i     char c = s.charAt(i);
     if (c >= 0 && c <= 255) {
  sb.append(c);
     } else {
  byte[] b;
  try {
      b = Character.toString(c).getBytes("utf-8");
  } catch (Exception ex) {
      System.out.println(ex);
      b = new byte[0];
  }
  for (int j = 0; j < b.length; j++) {
      int k = b[j];
      if (k < 0) k += 256;
      sb.append("%" + Integer.toHexString(k).
      toUpperCase());
  }
     }
}
return sb.toString();
    }

注意源码中粗体部分，原jspSmartUpload�l��g对返回的文�g未作��M��处理�Q�现在做了编码的转换工作�Q�将文�g名�{换�ؓUTF-8形式的编码�Ş式。UTF-8�~�码对英文未作�Q何处理，对中文则需要�{换�ؓ%XX的�Ş式。toUtf8String�Ҏ��中，直接利用Java语言提供的编码�{换方法获得汉字字�W�的UTF-8�~�码�Q�之后将其�{换�ؓ%XX的�Ş式�?

��源码编译后打包成jspSmartUpload.jar�Q�拷贝到Tomcat的shared/lib目录下（可�ؓ所有WEB应用�E�序所�׃�n�Q�，然后重启Tomcat服务器就可以正常下蝲含有中文名字的文件了。另�Q�toUtf8String�Ҏ��也可用于转换含有中文的超�U�链接，以保证链接的有效�Q�因为有的WEB服务器不支持中文链接�?

��结�Q�jspSmartUpload�l��g是应用JSP�q�行B/S�E�序开发过�E�中�l�常使用的上传下载组�Ӟ��它��用简单，方便。现在我又�ؓ其加上了下蝲中文名字的文件的支持�Q�真个是如虎�ȝ��Q�必��赢得更多开发者的青睐�?

---------------------------------------------------------------------------------------------------------------------------

题目�Q�彻底解决中文名文�g下蝲和下载文件内容�ؕ码问�?/p>
之前,写过一个Download.jsp文�g,可以解决下蝲文�g��q��问题(诸如:DOC,XSL文�g�{�等).
后来发现,遇到中文名的文�g的时�?文�g下蝲��会报错~~~~
今天,通过改写原Download.jsp文�g已经��d��解决了这个问题~
现在,把一整套的文件上传下载的�Ҏ��l�脓出来~~~以便大家借鉴!~!~!~!~!
作�?古埃及法�?br />-----------------------------------------------------
��试环境:WEBLOGIC 8.1,WIN XP SP4,IE 6.0
-----------------------------------------------------
文�g上传:
-----------------------------------------
准备工作:导入著名的SmartUpload.jar�l��g�?br />upload.jsp文�g
-----------------------------------------------------
<%@ page contentType="text/html; charset=gb2312" %>
<%
request.setCharacterEncoding("gb2312"); // �q�句话很重要�Q�否则遇��C��文就出错~
%>
上传







        误��入附件文件的所在�\�?lt;FONT color=red> * 为必填项�?lt;br>












附�g路径�Q?lt;/TD>
              *





-----------------------------------------------------
upload_ok.jsp文�g
-----------------------------------------------------
<%@ page contentType="text/html;charset=gb2312" %>
<%@ page import="com.jspsmart.upload.*" %>
上传成功!



<%
int count=0;
String fileName = null;
mySmartUpload.initialize(pageContext);
mySmartUpload.upload();
com.jspsmart.upload.File myFile = mySmartUpload.getFiles().getFile(0);
if (!myFile.isMissing()) {
//String ext=myFile.getFileExt();//得到后缀
fileName = myFile.getFileName();
            myFile.saveAs("/files/" + fileName);//你要存放文�g所在文件夹的相对�\�?br />     out.println("文�g:"+fileName+"上传成功!
文�g大小:" + myFile.getSize() + "kb
");
     }
%>

---------------------------------------------------

文�g下蝲:
-----------------------------------------
文�g的超�q�接写法范例:
<% String fname ="中文��试.xsl"; //假设你的文�g名是:中文��试.xsl
%>
�?�?lt;/A>
文�g的超�q�接写法范例-2 重新用utf-8�Ҏ��件名�~�码:
<%@ page contentType="text/html;charset=gb2312" session="true"%>
<% String name=java.net.URLEncoder.encode("世界文化.doc","UTF-8"));%> 世界文化.doc

Download.jsp文�g
---------------------------------------------------
<%
java.io.BufferedInputStream bis=null;
java.io.BufferedOutputStream bos=null;
try{
String filename=request.getParameter("filename");
             filename=new String(filename.getBytes("iso8859-1"),"gb2312");
response.setContentType("application/x-msdownload");
response.setHeader("Content-disposition","attachment; filename="+new String(filename.getBytes("gb2312"),"iso8859-1"));
bis =new java.io.BufferedInputStream(new java.io.FileInputStream(config.getServletContext().getRealPath("files/" + filename)));
bos=new java.io.BufferedOutputStream(response.getOutputStream());
byte[] buff = new byte[2048];
int bytesRead;
while(-1 != (bytesRead = bis.read(buff, 0, buff.length))) {
bos.write(buff,0,bytesRead);
}
}
catch(Exception e){
e.printStackTrace();
}
finally {
if (bis != null)bis.close();
if (bos != null)bos.close();
}
%>

保尔�?/a> 2006-06-08 15:17 发表评论

表单��名�Q�FieldName�Q?lt;/TD>	" + file.getFieldName() + "
文�g长度�Q�Size�Q?lt;/TD>	" + file.getSize() + "
文�g名（FileName�Q?lt;/TD>	" + file.getFileName() + "
文�g扩展名（FileExt�Q?lt;/TD>	" + file.getFileExt() + "
文�g全名�Q�FilePathName�Q?lt;/TD>	" + file.getFilePathName() + "