終于有時(shí)間讓我們冷靜下來(lái)好好談?wù)凣oogle。好在現(xiàn)在是凌晨,我打開(kāi)了窗戶,這樣很冷,但是可以讓我的腦子更清醒一點(diǎn),看看這個(gè)我們的生活已經(jīng)離之不得的工具——盡管幾年前我們還沒(méi)有——看看它到底有什么可談?wù)摰脑掝}。
在我們談?wù)撍笆紫任乙兄x它,愚人節(jié)那天Google將我的郵箱升級(jí)到了2G,感謝它給我的這個(gè)節(jié)日禮物,盡管我半年內(nèi)只用了5M。
1。Google以前做什么在Google出現(xiàn)之前人們只有一種搜索引擎,那就是分類引擎,這個(gè)想法來(lái)源于Yahoo,或者可以說(shuō)來(lái)源于圖書(shū)館。后來(lái)人們?cè)谙肴绻W(wǎng)頁(yè)不是由“人類” 添加上去的,而是“機(jī)器”自己找到的那該有多好,實(shí)現(xiàn)這個(gè)理想就意味要用大量的Spider搜尋整個(gè)互聯(lián)網(wǎng)。
“嘿,等等,機(jī)器怎么知道雞肉的味道?我是說(shuō)它們很可能搞錯(cuò)了,這有可能是三文魚(yú)的味道!”就像<<黑客帝國(guó)>>所擔(dān)心的一樣,Spider怎么才能知道我們需要什么能?于是有了動(dòng)態(tài)的給每個(gè)網(wǎng)頁(yè)評(píng)分的辦法,這個(gè)辦法就像小朋友們做游戲,別人對(duì)你的評(píng)價(jià)要遠(yuǎn)遠(yuǎn)重要于他們對(duì)你的拜訪,PageRank就是這么來(lái)的,在結(jié)合了幾種天才的想法和可行的技術(shù)細(xì)節(jié)之后,人類智慧的結(jié)晶,人工智能的當(dāng)代經(jīng)典,Google誕生了。
Google用大量的服務(wù)器(數(shù)以萬(wàn)計(jì))做著每日的網(wǎng)頁(yè)查找,每個(gè)線程就是一個(gè)Spider,每個(gè)Spider的工作就是從一個(gè)網(wǎng)頁(yè)去另一個(gè)網(wǎng)頁(yè),檢查他們是否已更新,是否廢棄,是否存在新創(chuàng)建的頁(yè)面,評(píng)價(jià)他們之間的關(guān)系,生成快照,并將數(shù)據(jù)存入數(shù)據(jù)庫(kù)。Spider需要很好的協(xié)調(diào)以避免重復(fù)的勞動(dòng),同時(shí)他們需要確定工作范圍的優(yōu)先級(jí),否則就會(huì)“跟不上時(shí)代的變化”或者干脆淹死在某些每秒種更新數(shù)千次的網(wǎng)頁(yè)中。在確定了兩張網(wǎng)頁(yè)的關(guān)系之后,Google分別更新他們的PageRank得分,這個(gè)得分顯然已經(jīng)不是一個(gè)公式能夠說(shuō)清楚的了,它總是處在動(dòng)態(tài)更新之中,但PageRank的大意就是,別人對(duì)你的連接數(shù)量越高你就越有價(jià)值,Google就越讓你的位置靠前。
Google的出現(xiàn)使互聯(lián)網(wǎng)的應(yīng)用向前大大邁出了一步,大量可用性很強(qiáng)的信息資源立即出現(xiàn)在它的需求者面前。為此,權(quán)威的PC Magazine將Google和同一年出現(xiàn)的<<The Sims>>同時(shí)稱為人工智能的經(jīng)典作品。但也正是Google的這種優(yōu)秀表現(xiàn)使人們開(kāi)始了先知式的擔(dān)憂,著名評(píng)論家Dvorak認(rèn)為 Google的存在改變了以往“小公司大喇叭”的商業(yè)格局(借用了Chuck Martin的說(shuō)法),它再次使互聯(lián)網(wǎng)變成庸俗的經(jīng)過(guò)資本市場(chǎng)洗禮的溫順綿羊,人們真正需要的東西可能會(huì)被排在后面或者根本找不到(比如我的Blog,

),而商業(yè)化的東西往往占據(jù)重要的位置(比如MSN的Blog!

),最麻煩的是一旦人們依賴了Google,它就會(huì)不自然的扼殺人們對(duì)通過(guò)其它途徑找尋信息的興趣和勇氣。從個(gè)人感情角度來(lái)講,我認(rèn)為這個(gè)論調(diào)是很有道理的,可這個(gè)問(wèn)題的提出方式已經(jīng)超出了本文討論的范圍,就像是一個(gè)生活態(tài)度問(wèn)題:即使麥當(dāng)勞再提供100倍的溫馨服務(wù),它也無(wú)法擊敗我家樓下買(mǎi)鍋貼的;也不能指望USR公司自己維護(hù)NS-5機(jī)器人的安全,v這些都只能靠別人。同樣,假如Google真的謀殺了互聯(lián)網(wǎng)的本質(zhì),那么我相信拯救我們星球的會(huì)是一個(gè)更體現(xiàn)互聯(lián)網(wǎng)本質(zhì)的Hero,而不是Google自己。
2。Google后來(lái)做了什么正如我們所期望的,Google迅速成長(zhǎng)為互聯(lián)網(wǎng)企業(yè)的新興代表,不斷優(yōu)化的引擎使我們獲得了快速獲取免費(fèi)信息的途徑,在一片叫好聲中,Google開(kāi)始向其它網(wǎng)絡(luò)產(chǎn)品擴(kuò)展。比如
Google新聞,就是對(duì)Google這個(gè)巨大資源庫(kù)的一種非結(jié)構(gòu)化應(yīng)用。現(xiàn)在Google新聞不僅有了搜索能力,還有了自動(dòng)選擇能力,這是在公開(kāi)的搶報(bào)紙編輯的飯碗。再比如Google圖像搜索,也為我們解決了不少難解決的問(wèn)題,還有
Google Group,這些服務(wù)使Google看起來(lái)更像Yahoo,或者M(jìn)SN這樣的門(mén)戶網(wǎng)站,而事實(shí)上Google用來(lái)實(shí)現(xiàn)這些功能的成本比其競(jìng)爭(zhēng)者要小的多,原因很簡(jiǎn)單,他們用的是人,Google用的是Spider!Google就像互聯(lián)網(wǎng)領(lǐng)域里的Matrix,隨處可見(jiàn)。
在提供了這些網(wǎng)絡(luò)產(chǎn)品的同時(shí),Google還在客戶端與競(jìng)爭(zhēng)者們一決高下,首先是瀏覽器的工具條
Google Toolbar,起初我覺(jué)得很有用,后來(lái)覺(jué)得沒(méi)什么用占地方還損失性能,但是現(xiàn)在看到Firefox和Google結(jié)合的這么好,又開(kāi)始使用了。然后Google推出了用于推廣它自己的極好工具,這就是著名的
Google API,在付出少許費(fèi)用之后,你就可以在自己的程序里使用Google了(通常是Java),我曾經(jīng)還一度想做一個(gè)Flash版的Google呢。此外還有用于處理“科學(xué)難題”的網(wǎng)格計(jì)算:
Google Compute,模仿捐獻(xiàn)家用計(jì)算能力以分析外星人電波的
SETI@home,后者由Stanford提供。
Froogle也是一個(gè)偉大的設(shè)想,雖然它還沒(méi)有中文版,但我已經(jīng)領(lǐng)略到了它的能力。它提供一個(gè)商品的搜索引擎,讓你可以在需要時(shí)瀏覽商品的價(jià)目和圖片。這使得Froogle有時(shí)看起來(lái)很想
ebay,況且Froogle還有它的WAP版,也就是移動(dòng)版。
Google Local又是一個(gè)有價(jià)值的作品,它使得Google可以作為旅游指南或者地圖使用。即使是Google的web搜索也有了很多衍生用法,比如瞧天氣啦,找手機(jī)歸屬地啦,當(dāng)計(jì)算器用啦,當(dāng)詞典用啦,反向搜索啦什么的。
3。Google現(xiàn)在做什么在客戶端的競(jìng)爭(zhēng)中Google并沒(méi)有占到什么優(yōu)勢(shì),MSN反而成了受益者,你想啊,搞軟件設(shè)計(jì)誰(shuí)能搞得過(guò)“買(mǎi)塊肉SOFT”,Netscape、 Apple、IBM都嘗試過(guò),也不怕Google多嘗試一次。但是Google卻在這種內(nèi)憂外患的情況下上了市,而且市場(chǎng)反映一片叫好!為了推陳出新,保持股價(jià)的攀升,Google采用了上市公司最喜歡華爾街最欣賞股民們最容易被欺騙的手法——虛偽擴(kuò)張!一方面,Google大量投資研究操作系統(tǒng)、數(shù)據(jù)庫(kù)和應(yīng)用服務(wù)器這些網(wǎng)絡(luò)商最賴以生存的技術(shù);另一方面則投入大筆資金擴(kuò)展業(yè)務(wù)領(lǐng)域,這種手段的優(yōu)點(diǎn)是可以轉(zhuǎn)嫁主營(yíng)業(yè)務(wù)的成本和風(fēng)險(xiǎn),做出更漂亮的財(cái)務(wù)報(bào)表,缺點(diǎn)是片面注重表面上的資源優(yōu)化,往往錯(cuò)過(guò)改革技術(shù)和商業(yè)策略的最佳時(shí)機(jī)。
在Google陷入尋找新的擴(kuò)展點(diǎn)而不能自拔時(shí),一個(gè)新新人類的話題擺在了Google前進(jìn)的道路上,這群人就是Blogger,他們要玩的就是Blog。說(shuō)時(shí)遲,那時(shí)快!只見(jiàn)烏云密布,雷鳴電閃,咔喳一聲晴天霹靂,Google站在
Blogger.com面前,笑里藏刀的說(shuō):“天下英雄,唯使君與操爾!”在收購(gòu)了Blogger之后,Google基本放棄了它建造
blog.google.com的計(jì)劃。
2004年愚人節(jié),對(duì)于網(wǎng)絡(luò)郵箱供應(yīng)商來(lái)說(shuō)簡(jiǎn)直就是一個(gè)鬼節(jié),這一天Google推出了它的
Gmail服務(wù)BETA版,它采用了非常具有神秘色彩并借助六度分隔和150法則而更具有神秘色彩的邀請(qǐng)發(fā)放方式。最令人頭疼的是它提供1G的空間和壓縮郵件(壓縮意味著物理空間1G,而很多郵件供應(yīng)商公布的空間是壓縮之前的占用空間)。2005年的愚人節(jié),Google更“喪心病狂”(開(kāi)玩笑

)的將這個(gè)數(shù)字增加到2G!跟進(jìn)還是賣(mài)出?!這是其它郵箱供應(yīng)商必須面對(duì)的一個(gè)抉擇!
GDS(Google Desktop Search)是Google的另一個(gè)重磅炸彈,這個(gè)是用來(lái)對(duì)付微軟的。是的,你沒(méi)聽(tīng)錯(cuò)!當(dāng)微軟在它下一版Windows(長(zhǎng)角)的計(jì)劃中露出新版文件搜索引擎的設(shè)想時(shí),Google已經(jīng)把成型的產(chǎn)品送到了客戶面前。但是在試用了幾次之后我有點(diǎn)納悶,為什么這個(gè)備受好評(píng)的GDS在我的機(jī)器上跟Lucene 一樣難用(對(duì)不起一次罵了兩位

),它幾乎搜不到什么有價(jià)值的文件——難道因?yàn)槲矣玫氖怯⑽陌妫恳只蚴俏覜](méi)有掌握使用技巧?
4。Google遇到了什么困難多少年來(lái)一個(gè)問(wèn)題一直困擾著我,“一個(gè)以高科技著稱于世的企業(yè)不會(huì)不在正面戰(zhàn)場(chǎng)上勝過(guò)一個(gè)商業(yè)成熟的企業(yè)呢?”幾乎每個(gè)受到工業(yè)革命和文藝復(fù)興影響的人都會(huì)相信這句話。可恰恰是這句話導(dǎo)致了很多企業(yè)的失敗。Google并未在正面擊敗Yahoo,相反,在與Yahoo的競(jìng)爭(zhēng)中Google已經(jīng)漸漸顯出劣勢(shì)的一面,這是由于“機(jī)器不能理解雞肉的味道”的緣故嗎?我們不得而知,但是有一點(diǎn)可以肯定,促使巴別塔停止建造的原因也在困擾著Google,簡(jiǎn)單的說(shuō)就是全球化和本地化。在中文搜索引擎市場(chǎng)上,簡(jiǎn)體中文的第一是百度,其次是Yahoo,繁體中文的第一是Yahoo,其次是Google,日文版市場(chǎng)排名第一的還是Yahoo,第二名是MSN,俄文搜索引擎的老大也是俄羅斯的本地化引擎。面對(duì)這個(gè)局面,Google只能說(shuō)OMG!(Oh!My God!)。下面這段文字摘自<<Google中文的三大軟肋>>:
……據(jù)iResearch(艾瑞市場(chǎng)咨詢)研究報(bào)告分析,百度僅用4年時(shí)間,遠(yuǎn)遠(yuǎn)領(lǐng)先于Google,百度擁有目前世界上最大的中文信息庫(kù),比Google中文更準(zhǔn)確,更全面,快照功能也占優(yōu)勢(shì)……
……雅虎一直很重視本地化,收購(gòu)3721則是最好的一例。在國(guó)內(nèi)市場(chǎng)上,3721的本地化購(gòu)物搜索非常好,再上本地化的商業(yè)搜索,更具競(jìng)爭(zhēng)優(yōu)勢(shì)。從某種意義上來(lái)說(shuō),3721網(wǎng)絡(luò)實(shí)名的目錄,就是一個(gè)典型的中國(guó)本地化企業(yè)產(chǎn)品的目錄。所以說(shuō),擁有3721之后,雅虎如虎添翼,對(duì)Google構(gòu)成了更大威脅……
……在中文語(yǔ)言處理能力上,本地搜索公司的優(yōu)勢(shì)更讓Google難堪。比如,《功夫》公映之前很久,在百度上檢索“功夫”就能直接指向周星馳的電影,可是 Google搜索相同的“功夫”,則大失所望。因?yàn)檫@些時(shí)令性的關(guān)鍵詞都需要專業(yè)團(tuán)隊(duì)去隨時(shí)添加,由于Google缺乏專門(mén)針對(duì)中國(guó)市場(chǎng)的開(kāi)發(fā)力量,尤其是對(duì)中國(guó)互聯(lián)網(wǎng)信息檢索存在的問(wèn)題了解不透,所以,Google對(duì)于國(guó)內(nèi)市場(chǎng)需求的反應(yīng)速度很慢,本地化技術(shù)服務(wù)力量也跟不上,無(wú)法解決國(guó)內(nèi)網(wǎng)民遇到的一些實(shí)際問(wèn)題……
Google的新聞搜索也引來(lái)很大的爭(zhēng)議,我們都知道如果一家媒體要摘錄別人的新聞作為自己的新聞,那么他必須付費(fèi),可是如果這條新聞是搜索引擎搜出來(lái)的怎么辦?如果這條新聞是和它的提供商幾乎同時(shí)登出又怎么辦?Google當(dāng)然不會(huì)為他搜出來(lái)的每條新聞付費(fèi),而且,就像前面說(shuō)的那樣,Dvorak這樣的同志又要大罵Google了,因?yàn)樗髿⒘讼M(fèi)者沖浪的樂(lè)趣和獲取別人沒(méi)能及時(shí)獲取的信息的喜悅感,以及Google的意志代替了互聯(lián)網(wǎng)的意志等等。
5。Google以后會(huì)做什么目前還不知道Google下一步想做什么,但是我們都知道了資本的魔力和技術(shù)的信仰在控制著它,這使它成為人類有史以來(lái)最有想象力的公司之一。
我們猜想Google不久就會(huì)開(kāi)放它的Gmail供人們隨意申請(qǐng),但申請(qǐng)時(shí)仍需要提供一個(gè)唯一的其它郵箱的帳號(hào),(就像非Logitech的老鼠標(biāo)加錢(qián)換新羅技,隨意一款老洗衣機(jī)加錢(qián)換新榮事達(dá)一樣),現(xiàn)在Gmail的策略是每個(gè)用戶可以邀請(qǐng)50個(gè)新用戶參加,此外每20人次的Google Web Search使用就會(huì)放出一個(gè)新的邀請(qǐng)。
Picasa也將是Google發(fā)展的重頭戲之一。前者是一個(gè)圖片文件客戶端,看起來(lái)好像很簡(jiǎn)單,肯定沒(méi)有ACDSee做的好,但是在圖片共享方面 Google可是從來(lái)沒(méi)有放棄過(guò)啊。現(xiàn)在,Picasa又和Gmail結(jié)合到了一起,每個(gè)Gmail用戶都可以用Picasa將圖片上傳到Gmail,這項(xiàng)功能大大加強(qiáng)了Picasa圖片共享的能力。
此外,人工智能和大型計(jì)算技術(shù)也是Google發(fā)展的重要方向。不久之前Google發(fā)布了它的企業(yè)搜索服務(wù)器,雖然引來(lái)一路臭罵,但還是有一些專家認(rèn)為這是個(gè)利好消息,說(shuō)明Google正在別的盈利點(diǎn)上發(fā)覺(jué)自己的價(jià)值。概念已經(jīng)有了,天價(jià)只是技術(shù)之不成熟性使然。這一趨勢(shì)不僅可以從Google的產(chǎn)品上看出來(lái),從Google的挖人策略也一樣可見(jiàn)一斑。前不久,Google正式宣布它挖到了Java世界一只下金蛋的鵝——Joshua Bloch,這個(gè)人經(jīng)常在我的夢(mèng)中出現(xiàn),要賣(mài)一本<<如來(lái)神掌>>給我!

對(duì)不起,記錯(cuò)了,是一本<< Effective Java>>。說(shuō)說(shuō)J.Bloch的歷史,可能很多人都會(huì)感到驚訝不已。他首先創(chuàng)造了曾在危難時(shí)期令整個(gè)Java世界恢復(fù)自信的Collection Framework,并獲得了當(dāng)年的Jolt大獎(jiǎng);后來(lái)為了讓更多的Java程序員從Collection Framework的設(shè)計(jì)模式中收益(當(dāng)時(shí)設(shè)計(jì)模式還不是很流行),他又以此為題寫(xiě)了<<Effective Java>>,并再次獲得了Jolt大獎(jiǎng);為了在Java世界引入元模型的魔力,他繼而提出了JSR175(A Metadata Facility for the JavaTM Programming Language),并成為其首席專家;在Sun最危難的時(shí)刻挺身而出接掌Tiger(JDK 5.0)的大旗;在這之后,關(guān)于他的唯一新聞就是被Google挖走了。此外,Google還高薪挖走了無(wú)數(shù)把名字倒過(guò)來(lái)寫(xiě)我們都能認(rèn)識(shí)的科學(xué)家, CSDN這樣報(bào)道:
……接著,Google又把BEA的首席架構(gòu)師Adam Bosworth攏入自己旗下。Bosworth在軟件行業(yè)作為技術(shù)主管受到廣泛的尊敬。在為新創(chuàng)企業(yè)Crossgain(2001年被BEA收購(gòu))工作之前,Bosworth曾在微軟任職數(shù)年,并成功地從事于一些項(xiàng)目的開(kāi)發(fā),如微軟的Access數(shù)據(jù)庫(kù)。
他的跳槽來(lái)得太突然了,兩個(gè)月以前,他還在供應(yīng)商的“年度eWorld秀”中擔(dān)任重要角色,并他的主題演講中介紹Alchemy項(xiàng)目----一個(gè)建立下一代移動(dòng)瀏覽器的計(jì)劃。
Google的招兵買(mǎi)馬計(jì)劃一直在有條不紊的進(jìn)行著,曾在SUN微系統(tǒng)工作的David Stoutamire,現(xiàn)在在Google工作。就在上星期,Neal Gafter,SUN公司的javac主管,也離開(kāi)SUN轉(zhuǎn)向Google。
不僅是Java方面,Greg Stein,曾是CollabNet項(xiàng)目經(jīng)理,管理Subversion 項(xiàng)目并且發(fā)布了他們的SourceCast產(chǎn)品,現(xiàn)在在Google的博客軟件組工作;Rob Pike,曾是貝爾實(shí)驗(yàn)室最初Unix團(tuán)隊(duì)成員之一,參與過(guò)Plan 9 和Inferno操作系統(tǒng)的開(kāi)發(fā),如今也投奔Google。
Google一直渴求人才,對(duì)于開(kāi)發(fā)者來(lái)說(shuō),Google也是一個(gè)充滿吸引力的地方。他只雇傭最棒的、最聰明的、近乎于天才的那些家伙,在籠絡(luò)人才這方面,也只有微軟可與之媲美。最近Java人才不斷涌入Google究竟是巧合,或是Google準(zhǔn)備嘗試基于Java做一些事情,我們拭目以待……
如果我沒(méi)記錯(cuò)的話,Google前不久還從微軟挖走了一位足可以稱為WindowsNT之父的人,Google之野心路人皆知。看看下面這則招聘啟事也許你就會(huì)更了解這一點(diǎn)了:
Passionate about these topics? You should work at Google.
|
? algorithms ? artificial intelligence ? compiler optimization ? computer architecture ? computer graphics |
|
? data compression ? data mining ? file system design ? genetic algorithms ? information retrieval |
|
? machine learning ? natural language processing ? operating systems ? profiling ? robotics
|
|
? text processing ? user interface design ? web information retrieval ? and more! |
Send your resume and a brief cover letter to great-engineers@google.com. | | |
6。Google應(yīng)該做什么這一節(jié)我們將拋棄所有商業(yè)的想法,認(rèn)認(rèn)真真的坐下來(lái)考慮一下技術(shù)問(wèn)題,當(dāng)然,這會(huì)使得我們對(duì)Google的要求過(guò)高,我們會(huì)把很多未能被實(shí)現(xiàn)的我們?cè)?jīng)的夢(mèng)想都交給未來(lái)的Google,就像我們把Sun沒(méi)有做到的強(qiáng)加給IBM,把IBM沒(méi)有做到的強(qiáng)加給微軟,把微軟沒(méi)有做到的強(qiáng)加給Netscape,把Netscapge沒(méi)有做到的強(qiáng)加給Yahoo一樣。
首先,Google應(yīng)該認(rèn)真考慮考慮語(yǔ)義網(wǎng)的問(wèn)題了,我個(gè)人仍然認(rèn)為這是互聯(lián)網(wǎng)發(fā)展的正道。雖然
RDF標(biāo)準(zhǔn)的發(fā)展雷聲大雨點(diǎn)小,可是現(xiàn)在RSS已經(jīng)如火如荼,這還只是語(yǔ)義網(wǎng)技術(shù)的一小部分,(就像WAP沒(méi)什么用,但短信卻發(fā)展起來(lái)一樣),XSL和XSLT也是語(yǔ)義網(wǎng)的一小部分,它們將作為語(yǔ)義網(wǎng)與其展現(xiàn)之間的接口。我為什么要提語(yǔ)義網(wǎng)這個(gè)東西呢?舉個(gè)例子你就能明白,比如我的Blog每篇文章每一頁(yè)上都有菜單,都有最新評(píng)論、閱讀排行榜和自定義列表,這些加速了訪問(wèn)者的效率,是富有親和力的展現(xiàn)形式,但是對(duì)于Google來(lái)說(shuō)這些都是垃圾,因?yàn)樗鼈冨e(cuò)誤的表達(dá)了網(wǎng)頁(yè)的含義,如果我要搜一篇閱讀率極高的文章,可能搜出一堆沒(méi)用的東西,而這些東西又不可能從頁(yè)面上拿掉,所以Google必須自己去認(rèn)。
反向快照可能是解決這個(gè)問(wèn)題的臨時(shí)方案。它的主要思想是Google首先發(fā)現(xiàn)別人是如何“描述”該網(wǎng)頁(yè)的(通過(guò)鏈接的文字表達(dá)),再在該網(wǎng)頁(yè)中找到與這個(gè) “描述”相關(guān)的內(nèi)容,把這部分內(nèi)容作為該網(wǎng)頁(yè)的高優(yōu)先級(jí)內(nèi)容,再把該網(wǎng)頁(yè)與相同目錄下的其它文件比較,將相同的部分列為低優(yōu)先級(jí)的內(nèi)容。(這是我個(gè)人想出來(lái)的方法,不知道可否奏效,估計(jì)可能會(huì)遇到性能問(wèn)題

)
其次,Google將面臨語(yǔ)義搜索的問(wèn)題。這是MSN正在開(kāi)發(fā)的技術(shù),我相信Google也一定在做。這項(xiàng)技術(shù)的目的是讓使用者同計(jì)算機(jī)之間的交互變得更人性化,看起來(lái)好像是用戶像計(jì)算機(jī)提出了一個(gè)問(wèn)題,計(jì)算機(jī)利用Google這顆大腦找到答案然后告知。哈哈,這個(gè)鏡頭是不是有點(diǎn)眼熟,它多次在好萊塢的電影中出現(xiàn),比如<<AI>>中的Dr.Know(無(wú)所不知博士)和<<時(shí)間機(jī)器>>中的圖書(shū)館管理員,他們都是語(yǔ)義Google的愿景和Use Case。其中最有趣的是Dr.Know,他首先讓用戶選擇類別,然后提問(wèn),問(wèn)題按個(gè)數(shù)記費(fèi),答案往往只給出一個(gè)——當(dāng)然是人工智能覺(jué)得最符合問(wèn)題的一個(gè)。這提示了我們帶類別的語(yǔ)義識(shí)別可能將成為語(yǔ)義識(shí)別技術(shù)邁出的第一步。再看看Google英文版目前提供的收費(fèi)服務(wù)
Google Answer~~~有點(diǎn)意思吧?
第三是模式學(xué)習(xí)。不客氣的講,Google一直在以自己的想法在搜索。不是嗎?Google把Spider找到的所有頁(yè)面都認(rèn)為是資源,所以對(duì)其涵蓋的內(nèi)容一視同仁,對(duì)其表達(dá)的形式漠不關(guān)心,而正確的方式應(yīng)該是將頁(yè)面和搜索用戶都看成用戶,把頁(yè)面人性化,從頁(yè)面中吸取人類思維的模式,進(jìn)行模式學(xué)習(xí)。這種技術(shù)給Google帶來(lái)的好處是巨大的,其實(shí)現(xiàn)技術(shù)也簡(jiǎn)單于語(yǔ)義理解。打個(gè)比方,對(duì)于Sina被盛大收購(gòu),很多新聞網(wǎng)站都作為專題加以報(bào)道,而對(duì)于Google來(lái)說(shuō),要等很久才能把新浪和盛大這兩個(gè)單詞聯(lián)系起來(lái),這中間的時(shí)間包括其它由人來(lái)更新的網(wǎng)站的更新時(shí)滯,其它網(wǎng)站對(duì)這些網(wǎng)站的連接的更新時(shí)滯,這些更新被Spider發(fā)現(xiàn)的時(shí)滯,發(fā)現(xiàn)后PageRank更新到合理數(shù)值(中間可能經(jīng)過(guò)多次迭代)的時(shí)滯等等。這使得Google明顯慢于人的反映速度,這也就直接的造成了上面所提到的<<功夫>>不能及時(shí)搜到的原因。靠人工智能實(shí)現(xiàn)本地化,這是一條路。
第四是信息源的深層發(fā)掘。這使得Google能觸及互聯(lián)網(wǎng)的死角,就像洗衣粉盡量觸及衣物的死角一樣,(“有汰漬,沒(méi)污漬”

),例子很簡(jiǎn)單,如果我在網(wǎng)頁(yè)中加入一段Javascript,就可以很容易把網(wǎng)頁(yè)引到另一個(gè)地址,而這個(gè)地址很有可能是Google沒(méi)有涉及到的,瀏覽器卻可以訪問(wèn)。
第五就是不得不提到的網(wǎng)格計(jì)算。因?yàn)镚oogle的客戶來(lái)自世界各地,一個(gè)日本人拜訪Google和一個(gè)印第安人拜訪Google在99.99%的概率上是不會(huì)訪問(wèn)相同內(nèi)容的,因此將這兩個(gè)人所要訪問(wèn)的內(nèi)容放在一起實(shí)在是一種性能上的損失。最近聽(tīng)說(shuō)Yahoo已經(jīng)將中文搜索服務(wù)器遷到國(guó)內(nèi),這正是為了性能考慮的啊。當(dāng)然,分布式服務(wù)器已經(jīng)可以做到這一點(diǎn)了,那為什么還要網(wǎng)格呢?解釋這個(gè)問(wèn)題首先要從解釋BT的原理開(kāi)始,BT之所以讓人們下載的那么快就是因?yàn)锽T讓Downloader成為其它Downloader的服務(wù)器,這種P2P的方式充分利用了Downloader的機(jī)器的計(jì)算能力和上行帶寬。Google也可以做到這一點(diǎn),例如我、我的鄰居、李彥宏(百度總裁)和楊志遠(yuǎn)(Yahoo創(chuàng)始人之一)四人同時(shí)搜索了同一個(gè)關(guān)鍵字,假定服務(wù)器在中國(guó),李彥宏首先獲得了響應(yīng)頁(yè)面,我再訪問(wèn)時(shí),Google通知我找李商量一下,李毫不猶豫的給了我頁(yè)面,楊志遠(yuǎn)的請(qǐng)求收到處理,因?yàn)樗槐阌谠L問(wèn)李彥宏或者我的機(jī)器,所以Google又給他開(kāi)了一個(gè)響應(yīng)頁(yè)面,最后處理的是我的鄰居,他的請(qǐng)求被推給了我,因?yàn)槲覀兲幵谙嗤淖泳W(wǎng)內(nèi)所以交流更為方便。原本四次的檢索變成兩次,即使加上兩次簡(jiǎn)單的響應(yīng),總時(shí)間也大大縮短,假若我們四個(gè)人拜訪Google的機(jī)會(huì)分別是10:10:2:1,結(jié)果就更不言自明了。如果Google在網(wǎng)格方面多追加一些研發(fā)資金,自然會(huì)比Yahoo做的好,這是由Google軟件的架構(gòu)決定的。
寫(xiě)這篇文章花了我整整一天的時(shí)間,我寫(xiě)這篇文章的開(kāi)始時(shí)間是4日凌晨0點(diǎn)04分,現(xiàn)在已經(jīng)快到5日的0點(diǎn)04分了,可是我還意猶未盡,為了不影響手頭上的工作我決定就此打住,如果您有什么想法,請(qǐng)回帖指教,謝謝。
累死了的泡泡
posted on 2005-04-04 00:04
Brian Sun 閱讀(9461)
評(píng)論(49) 編輯 收藏 所屬分類:
軟件 、
管理 、
隨心