2008年5月30日
#
1 . 用Executors構(gòu)造一個(gè)新的線程池
ExecutorService executor = Executors.newCachedThreadPool();
方法 newCachedThreadPool();
創(chuàng)建一個(gè)可根據(jù)需要?jiǎng)?chuàng)建新線程的線程池,但是在以前構(gòu)造的線程可用時(shí)將重用它們,并在需要時(shí)使用提供的 ThreadFactory 創(chuàng)建新線程。
2. 用構(gòu)造的線程池創(chuàng)建ExecutorFilter
ExecutorFilter es= new ExecutorFilter(executor));

在ExecutorFilter內(nèi)部:
只需要將相應(yīng)的事件分發(fā)到到線程池的相應(yīng)線程即可,但是SessionCreated事件只能在主線程中,不能分發(fā)
觸發(fā)方法
1 .
首先構(gòu)造一個(gè)IoFilterEvent,這個(gè)IoFilterEvent包含1、事件的類(lèi)型,2、下一個(gè)過(guò)濾器
然后觸發(fā)該時(shí)間的處理方法。

if (eventTypes.contains(IoEventType.SESSION_OPENED))
{
fireEvent(new IoFilterEvent(nextFilter, IoEventType.SESSION_OPENED,
session, null));
}
2 .
從線程池中取出一個(gè)線程執(zhí)行事件處理

protected void fireEvent(IoFilterEvent event)
{
getExecutor().execute(event);
}
在構(gòu)造ExecutorFilter 時(shí)如果沒(méi)有傳入IoEventType則默認(rèn)只對(duì)如下幾種幾件感興趣
EXCEPTION_CAUGHT
MESSAGE_RECEIVED
MESSAGE_SENT
SESSION_CLOSED
SESSION_IDLE
SESSION_OPENED
當(dāng)然還需要覆蓋相應(yīng)的事件處理方法 如上所示
參數(shù)db_block_size;
這個(gè)參數(shù)只能設(shè)置成底層操作系統(tǒng)物理塊大小的整數(shù)倍,最好是2的n次方倍。
如WINDOWS下4KB,8KB,16KB
且該參數(shù)需要在建庫(kù)的時(shí)候指定,一旦指定不能更改。
雖然在ORACLE9I以上可以指定表空間的數(shù)據(jù)庫(kù)大小,允許同時(shí)使用包括非默認(rèn)大小在內(nèi)的數(shù)據(jù)庫(kù)塊大小。不過(guò)需要設(shè)置指定大小數(shù)據(jù)塊的buffer_cache.
小的塊:
小的塊降低塊競(jìng)爭(zhēng),因?yàn)槊總€(gè)塊中的行較少.
小的塊對(duì)于小的行有益.
小的塊對(duì)于隨意的訪問(wèn)較好.如果一個(gè)塊不太可能在讀入內(nèi)存后被修改,那么塊的大小越小使用buffer cache越有效率。當(dāng)內(nèi)存資源很珍貴時(shí)尤為重要,因?yàn)閿?shù)據(jù)庫(kù)的buffer cache是被限制大小的。
劣勢(shì):
小塊的管理消費(fèi)相對(duì)大.
因?yàn)樾械拇笮∧憧赡苤辉趬K中存儲(chǔ)很小數(shù)目的行,這可能導(dǎo)致額外的I/O。
小塊可能導(dǎo)致更多的索引塊被讀取
大的塊
好處:
更少的管理消費(fèi)和更多存儲(chǔ)數(shù)據(jù)的空間.
大塊對(duì)于有順序的讀取較好. 譬如說(shuō)全表掃描
大塊對(duì)很大的行較好
大塊改進(jìn)了索引讀取的性能.大的塊可以在一個(gè)塊中容納更多的索引條目,降低了大的索引級(jí)的數(shù)量.越少的index level意味著在遍歷索引分支的時(shí)候越少的I/O。
劣勢(shì):
大塊不適合在OLTP中用作索引塊,因?yàn)樗鼈冊(cè)黾恿嗽谒饕~塊上的塊競(jìng)爭(zhēng)。
如果你是隨意的訪問(wèn)小的行并有大的塊,buffer cache就被浪費(fèi)了。例如,8 KB的block size 和50 byte row size,你浪費(fèi)了7,950
將進(jìn)酒 杯莫停 -------> 亭名: 悲默亭
全球通史
《詩(shī)經(jīng)·采薇》
昔我往矣,楊柳依依 今我來(lái)思,雨雪霏霏
摘要: <?xml version="1.0" encoding="UTF-8"?>
<beans xmlns="http://www.springframework.org/schema/beans"
xmlns:xsi="http://www.w3.org/2001/XMLSchema-instance...
閱讀全文
在搜索引擎中,切詞語(yǔ)是一個(gè)重要的部分,其中包括專有名詞的提取、詞的分割、詞的格式化等等。
TokenStream 類(lèi)幾乎是所有這些類(lèi)的基類(lèi)
有兩個(gè)需要被子類(lèi)實(shí)現(xiàn)的方法Token next() 和 close()
首先來(lái)看analysis包,這個(gè)包主要是提供一些簡(jiǎn)單的詞匯化處理
以Tokenizer結(jié)尾的類(lèi)是將要處理的字符串進(jìn)行分割成Token流,而根據(jù)分割的依據(jù)的又產(chǎn)生了以下幾個(gè)Tokenizer類(lèi)
首先Tokenizer類(lèi)是所有以Tokenizer結(jié)尾的類(lèi)的基類(lèi)
然后是CharTokenizer,所有的以Tokenizer結(jié)尾的類(lèi)都是從這個(gè)類(lèi)繼承的
這個(gè)類(lèi)中有一個(gè)抽象方法
protected abstract boolean isTokenChar(char c);
另外一個(gè)需要被子類(lèi)覆寫(xiě)的方法
protected char normalize(char c) {};
是對(duì)單個(gè)字符進(jìn)行處理的方法譬如說(shuō)將英文字母全部轉(zhuǎn)化為小寫(xiě)
還有一個(gè)變量
protected Reader input;
這個(gè)讀取器是這些類(lèi)所處理的數(shù)據(jù)的 數(shù)據(jù)源
輸入一個(gè)Reader ,產(chǎn)生一個(gè)Token流
這個(gè)方法是是否進(jìn)行切分的依據(jù),依次讀取char流,然后用這個(gè)方法對(duì)每個(gè)char進(jìn)行檢測(cè),如果返回false則將預(yù)先存儲(chǔ)在
詞匯緩沖區(qū)中的char數(shù)組作為一個(gè)Token返回
LetterTokenizer :
protected boolean isTokenChar(char c) {
return Character.isLetter(c);
}
WhitespaceTokenizer:
protected boolean isTokenChar(char c) {
return !Character.isWhitespace(c);
}
LowerCaseTokenizer extends LetterTokenizer:
protected char normalize(char c) {
return Character.toLowerCase(c);
}
在構(gòu)造函數(shù)中調(diào)用super(in);進(jìn)行和 LetterTokenizer同樣的操作,但是在詞匯化之前所有的詞都轉(zhuǎn)化為小寫(xiě)了
然后是以Filter結(jié)尾的類(lèi),這個(gè)類(lèi)簇主要是對(duì)已經(jīng)詞匯化的Token流進(jìn)行進(jìn)一步的處理
輸入是Token流 , 輸出仍然是Token流。
TokenFilter extends TokenStream 是所有這些類(lèi)的父類(lèi)
protected TokenStream input;
在TokenFilter 中有一個(gè)TokenStream 變量,是Filter類(lèi)簇處理的數(shù)據(jù)源,而Filter類(lèi)簇又是繼承了TokenStream 類(lèi)的
有一個(gè)public final Token next()方法,這個(gè)方法以TokenStream.next()產(chǎn)生的Token流 為處理源,產(chǎn)生的仍然是Token流
只不過(guò)中間有一些處理的過(guò)程
LowerCaseFilter:將所有的Token流的轉(zhuǎn)化為小寫(xiě)
t.termText = t.termText.toLowerCase();
StopFilter:過(guò)濾掉一些停止詞,這些停止詞由構(gòu)造函數(shù)指定
for (Token token = input.next(); token != null; token = input.next())
if (!stopWords.contains(token.termText))
return token;
比較一下Tokenizer類(lèi)簇和Filter類(lèi)簇,可以知道
Tokenizer類(lèi)簇主要是對(duì)輸入的Reader流,實(shí)際上是字符流按照一定的規(guī)則進(jìn)行分割,產(chǎn)生出Token流
其輸入是字符串的Reader流形式,輸出是Token流
Filter類(lèi)簇主要是對(duì)輸入的Token流進(jìn)行更進(jìn)一步的處理,如去除停止詞,轉(zhuǎn)化為小寫(xiě)
主要為一些格式化操作。
由于Filter類(lèi)簇的輸入輸出相同,所以可以嵌套幾個(gè)不同的Filter類(lèi),以達(dá)到預(yù)期的處理目的。
前一個(gè)Filter類(lèi)的輸出作為后一個(gè)Filter類(lèi)的輸入
而Tokenizer類(lèi)簇由于輸入輸出不同,所以不能嵌套