摘要: 最近一直想寫個和搜索相關(guān)的東東,所以簡單了解搜索引擎方面的知識,個人總結(jié)一個垂直搜索引擎 包含以下幾個部分:
1 web 爬蟲,抓取目標(biāo)頁面的內(nèi)容。
2 數(shù)據(jù)預(yù)處理,把抓取下來的數(shù)據(jù)進(jìn)行去噪,例如使用htmlparser等工具對去掉無用的標(biāo)簽數(shù)據(jù)等等,把
數(shù)據(jù)結(jié)構(gòu)化DB或者其他存儲系統(tǒng)已被后面使用。
3. 建立索引。
4. 分詞,開發(fā)檢索因子, 對索引數(shù)據(jù)進(jìn)行檢索。
5. 把檢索到的數(shù)據(jù),在web段展現(xiàn)。
下面就結(jié)合heritrix1.14.3 和lucence2.2.0,介紹下,整個搜索引擎的開發(fā)過程。
閱讀全文
posted @
2009-06-26 02:35 鄧兵野 閱讀(3886) |
評論 (2) |
編輯 收藏
摘要: Keytool是一個Java數(shù)據(jù)證書的管理工具。
keystore
Keytool將密鑰(key)和證書(certificates)存在一個稱為keystore的文件中
在keystore里,包含兩種數(shù)據(jù):
密鑰實體(Key entity)——密鑰(secret key)又或者是私鑰和配對公鑰(采用非對稱加密)
可信任的證書實體(trusted certificate entries)——只包含公鑰
閱讀全文
posted @
2008-06-28 16:53 鄧兵野 閱讀(513) |
評論 (0) |
編輯 收藏
摘要: 目前,我們使用的CAS Server 3.1.1的是基于Spring Framework編寫的,因此在CAS服務(wù)器端的配置管理中,絕大多數(shù)是Spring式的Java Bean XML配置。CAS 的服務(wù)器提供了一套易于定制的用戶認(rèn)證器接口,用戶可以根據(jù)自身企業(yè)的在線系統(tǒng)的認(rèn)證方式,來定制自己的認(rèn)證邏輯。不論是傳統(tǒng)的用戶名/密碼方式,還是基于安全證書的方式;是基于關(guān)系數(shù)據(jù)庫的存儲,還是采用LDAP服務(wù)器,CAS Server給我們提供了這些常用的驗證器模板代碼,只要稍作修改,便可靈活使用了。
閱讀全文
posted @
2008-06-28 16:51 鄧兵野 閱讀(636) |
評論 (0) |
編輯 收藏
摘要: 簡單的說,CAS(Central Authentication Service – 中心認(rèn)證服務(wù))的目的就是使分布在一個企業(yè)內(nèi)部各個不同異構(gòu)系統(tǒng)的認(rèn)證工作集中在一起,通過一個公用的認(rèn)證系統(tǒng)統(tǒng)一管理和驗證用戶的身份。在CAS上認(rèn)證的用戶將獲得CAS頒發(fā)的一個證書,使用這個證書,用戶可以在承認(rèn)CAS證書的各個系統(tǒng)上自由穿梭訪問,不需要再次的登錄認(rèn)證。打個比方:對于加入歐盟的國家而言,在他們國家中的公民可以憑借著自己的身份證,在整個歐洲旅行,不用簽證。對于企業(yè)內(nèi)部系統(tǒng)而言,CAS就是這個頒發(fā)歐盟認(rèn)證的系統(tǒng),其它系統(tǒng)都是加入歐盟的國家,它們要共同遵守和承認(rèn)CAS的認(rèn)證規(guī)則。
閱讀全文
posted @
2008-06-28 16:49 鄧兵野 閱讀(614) |
評論 (0) |
編輯 收藏
摘要: STEP 1,搭建Java Web服務(wù)器環(huán)境
安裝 JDK + Tomcat 6.0.14 , HTTP端口8080 , HTTPS端口8443
JAVA_HOME = D:\Java\jdk1.6.0_04
CATALINA_HOME = D:\Java\apache-tomcat-6.0.14
安裝完畢,啟動Tomcat ,在瀏覽器上 測試 http://Linly:8080/
閱讀全文
posted @
2008-06-28 16:47 鄧兵野 閱讀(1722) |
評論 (2) |
編輯 收藏
摘要: 一個事件其實在頁面上 有多個元素相應(yīng)事件處理,點擊頁面上的一個button,會發(fā)生什么?其實 是相當(dāng)于先后點擊了按鈕,它的容器,及這個頁面.也就是說沒一個元素都按照特定的順序響應(yīng)那個事件.事件的發(fā)生順序在IE和mozilla在事件支持上的主要差別.
閱讀全文
posted @
2006-11-30 17:59 鄧兵野 閱讀(1738) |
評論 (1) |
編輯 收藏
摘要: javascript是基于對象的語言,但是如何構(gòu)造對象一直困擾著我,現(xiàn)在有了一點體會,分享一點經(jīng)驗給大家
本文介紹javascript構(gòu)造對象的幾種方法:工廠方法,prototype方法,構(gòu)造函數(shù)方法.
閱讀全文
posted @
2006-11-27 17:26 鄧兵野 閱讀(10870) |
評論 (3) |
編輯 收藏
摘要: javascript的繼承機制并不是明確規(guī)定的,而是通過模仿實現(xiàn)的,意味著繼承不是由解釋程序處理,開發(fā)者有權(quán)決定最適合的繼承方式. 下面我給出幾種常用的方法
閱讀全文
posted @
2006-11-27 15:09 鄧兵野 閱讀(1911) |
評論 (1) |
編輯 收藏
摘要: axis2 有三種配置文件 用來配置系統(tǒng).第一個是用來配置整個系統(tǒng)(全局配置)--axis2.xml.第二個是配置一個服務(wù)(服務(wù)配置),第三個是配置一個module .
閱讀全文
posted @
2006-08-23 18:04 鄧兵野 閱讀(5510) |
評論 (0) |
編輯 收藏