《關(guān)于信息系統(tǒng)組織方式的一個(gè)提案》的評(píng)論與反評(píng)
網(wǎng)友Plusy的評(píng)論
re: 關(guān)于信息系統(tǒng)組織方式的一個(gè)提案 2008-05-20 02:04 plusy
首先感謝你分享你的想法。
這里我想補(bǔ)充一些我個(gè)人對(duì)gmail標(biāo)簽系統(tǒng)的理解。
gmail
的標(biāo)簽系統(tǒng),個(gè)人感覺(jué)像一個(gè)列表(List),如果不考慮thread和時(shí)間排序的因素,更像一個(gè)字典,標(biāo)簽是key,而郵件是values. 如果引入權(quán)重,則更像隊(duì)列(Queue),
如果引入樹(shù)狀層級(jí),則相當(dāng)于重新構(gòu)建了一個(gè)文件系統(tǒng)結(jié)構(gòu),如果引入圖結(jié)構(gòu),則可以構(gòu)成復(fù)雜連接。從思維的角度來(lái)說(shuō),標(biāo)簽是給原始的信息標(biāo)上了索引,即加上了語(yǔ)義,標(biāo)簽鏈接關(guān)系是另一層的語(yǔ)義。權(quán)重、父子和多維關(guān)聯(lián)是隊(duì)列、樹(shù)和圖所表達(dá)的基本語(yǔ)義。這里的關(guān)鍵是要讓語(yǔ)義來(lái)組織信息。
訪問(wèn)頻率作為權(quán)重、“主標(biāo)簽”作為“相關(guān)度”和線信作為聚合引擎,這三種方法都是基于對(duì)用戶行為的跟蹤得來(lái)的,可以自動(dòng)執(zhí)行,例如gmail的filter。但標(biāo)簽之間的有向關(guān)聯(lián),別名和文件夾命名則需要用戶的干預(yù),機(jī)器無(wú)法精確理解。比較好的可能是集成人工干預(yù),例如標(biāo)簽的導(dǎo)航系統(tǒng),內(nèi)容分析系統(tǒng),甚至搜索系統(tǒng),這些都需持續(xù)的行為觀察和記憶。以上是我對(duì)樓主proposal從語(yǔ)義和語(yǔ)法角度的理解。
另外,如果單純使用語(yǔ)法層面的標(biāo)簽系統(tǒng),對(duì)郵件系統(tǒng)而言,可能有一些困難,以下是我自己遇到的一些問(wèn)題,供你在設(shè)計(jì)的時(shí)候參考:
(1)標(biāo)簽可能會(huì)出現(xiàn)錯(cuò)別字,會(huì)導(dǎo)致基于文本比較的關(guān)聯(lián)失敗。例如會(huì)出現(xiàn)多個(gè)別名,”經(jīng)管“,”盡管“等其實(shí)都是想表達(dá)“經(jīng)濟(jì)與管理”,但用戶的疏忽會(huì)導(dǎo)致需要一個(gè)容錯(cuò)機(jī)制,或一個(gè)異常的解決方式
(2)維護(hù)大量的標(biāo)簽所帶來(lái)的麻煩是否會(huì)抵消它所帶來(lái)的好處。我們使用文件系統(tǒng)屏蔽了直接維護(hù)inode的不便,現(xiàn)在我們用標(biāo)簽來(lái)屏蔽文件樹(shù)的不便。標(biāo)簽所帶來(lái)的扁平化的好處,可能會(huì)圖、樹(shù)的復(fù)雜性所消耗,從而帶來(lái)新的維護(hù)負(fù)擔(dān)。例如我自己在gmail中使用了有前綴的標(biāo)簽(使用字母順表達(dá)優(yōu)先級(jí),共同前綴表達(dá)樹(shù)狀關(guān)聯(lián)),但如果標(biāo)簽太多,標(biāo)簽列表就會(huì)太長(zhǎng)而沒(méi)辦法在一屏顯示。
(3)別名機(jī)制的沖突問(wèn)題。這個(gè)你在proposal中已經(jīng)提到了,如果關(guān)注度是通過(guò)文本方式(搜索和排序)來(lái)提取的,則可能會(huì)導(dǎo)致自遞歸循環(huán),實(shí)現(xiàn)上比較麻煩。我猜想gmail的filter中無(wú)法使用另一個(gè)filter大概是為了避免這個(gè)問(wèn)題。
不管我的理解是否貼切,以及幾個(gè)特例是否有價(jià)值,都希望能早日用到你所設(shè)想的標(biāo)簽系統(tǒng)。
最后感謝你的proposal再次激發(fā)了我自己對(duì)gmail標(biāo)簽系統(tǒng)的思考。
我的反評(píng)
非常高興能得到您極為專業(yè)的評(píng)論!由于成文匆忙,有些細(xì)節(jié)未能充分展開(kāi),旨在拋磚引玉。這不,您這塊玉就給引出來(lái)了。下面請(qǐng)?jiān)试S我對(duì)您的評(píng)論作一個(gè)反評(píng)論:-)
>>標(biāo)簽是給原始的信息標(biāo)上了索引,即加上了語(yǔ)義,標(biāo)簽鏈接關(guān)系是另一層的語(yǔ)義。權(quán)重、父子和多維關(guān)聯(lián)是隊(duì)列、樹(shù)和圖所表達(dá)的基本語(yǔ)義。這里的關(guān)鍵是要讓語(yǔ)義來(lái)組織信息。
說(shuō)得對(duì)極了!
>>訪問(wèn)頻率作為權(quán)重、“主標(biāo)簽”作為“相關(guān)度”和線信作為聚合引擎,這三種方法都是基于對(duì)用戶行為的跟蹤得來(lái)的,可以自動(dòng)執(zhí)行。
1.訪問(wèn)頻率基于用戶行為,但用戶可預(yù)先賦予不同的標(biāo)簽以不同的初始值;
2.相關(guān)度大多需用戶定義,機(jī)器難以識(shí)別,基于內(nèi)容并不可靠,何況有些是binary;
3.gmail提供的thread是基于subject的,如果郵件改換subject,則屬于不同的conversation。我們需要用戶有自定義thread的權(quán)力。此外,對(duì)非郵件的信息系統(tǒng)(如文件系統(tǒng)),thread是難以由機(jī)器生成的。
>>比較好的可能是集成人工干預(yù),例如標(biāo)簽的導(dǎo)航系統(tǒng),內(nèi)容分析系統(tǒng),甚至搜索系統(tǒng),這些都需持續(xù)的行為觀察和記憶。
非常正確!一個(gè)智能的系統(tǒng)應(yīng)該對(duì)用戶行為有一定的預(yù)判力,這離不開(kāi)平時(shí)對(duì)用戶行為的觀察和記憶。
>>標(biāo)簽可能會(huì)出現(xiàn)錯(cuò)別字,會(huì)導(dǎo)致基于文本比較的關(guān)聯(lián)失敗。用戶的疏忽會(huì)導(dǎo)致需要一個(gè)容錯(cuò)機(jī)制,或一個(gè)異常的解決方式
說(shuō)得沒(méi)錯(cuò)。不妨與傳統(tǒng)的樹(shù)型結(jié)構(gòu)比較:若用戶通過(guò)鼠標(biāo)點(diǎn)擊,二者均無(wú)錯(cuò)別字問(wèn)題;若通過(guò)文本,二者都可能出錯(cuò)。標(biāo)簽查詢可類似文件路徑支持通配符,此外若用戶輸入不存在的標(biāo)簽,可由機(jī)器生成一些可能的標(biāo)簽供用戶選擇。正如用戶在google中搜索時(shí)鍵入錯(cuò)別字,google系統(tǒng)會(huì)提供一些可能的選擇。
>>維護(hù)大量的標(biāo)簽所帶來(lái)的麻煩是否會(huì)抵消它所帶來(lái)的好處。標(biāo)簽所帶來(lái)的扁平化的好處,可能會(huì)被圖、樹(shù)的復(fù)雜性所消耗,從而帶來(lái)新的維護(hù)負(fù)擔(dān)。
這正是我想解決的問(wèn)題。隨著文檔增多,標(biāo)簽不可避免地增加。如果只是控制標(biāo)簽數(shù)量,每個(gè)標(biāo)簽下的文檔過(guò)多也達(dá)不到快速檢索的目的。請(qǐng)注意該提案主要針對(duì)海量文檔,如果引入少量的麻煩能解決大量的麻煩,那么這個(gè)努力是值得的。此外,該提案是向下兼容的,如果用戶的文檔不足夠多,大可不必引入標(biāo)簽之間的有向關(guān)聯(lián)以及標(biāo)簽的權(quán)重等,這就退化為Gmail的標(biāo)簽系統(tǒng)了。就我個(gè)人經(jīng)驗(yàn)而言,雖然Gmail郵件并不太多,仍常常借助搜索內(nèi)容而不是標(biāo)簽來(lái)檢索。這是顧忌到Gmail的標(biāo)簽只是一維列表,不愿引入過(guò)多標(biāo)簽致使列表過(guò)長(zhǎng)。搜索內(nèi)容并沒(méi)有什么不好,但即使不考慮非文本內(nèi)容的問(wèn)題,仍有效率問(wèn)題。比如,在文件系統(tǒng)中搜索含有某關(guān)鍵詞的文件通常費(fèi)時(shí)超過(guò)用戶的容忍度。
>>例如我自己在gmail中使用了有前綴的標(biāo)簽(使用字母順表達(dá)優(yōu)先級(jí),共同前綴表達(dá)樹(shù)狀關(guān)聯(lián)),但如果標(biāo)簽太多,標(biāo)簽列表就會(huì)太長(zhǎng)而沒(méi)辦法在一屏顯示。
如果標(biāo)簽不以列表而是層級(jí)結(jié)構(gòu)來(lái)排列的話,正好可解決您的問(wèn)題——具有相同前綴的標(biāo)簽可以有共同的父標(biāo)簽,可以同時(shí)展開(kāi)或收攏從而節(jié)省標(biāo)簽結(jié)構(gòu)的整體高度。
>>別名機(jī)制的沖突問(wèn)題。這個(gè)你在proposal中已經(jīng)提到了,如果關(guān)注度是通過(guò)文本方式(搜索和排序)來(lái)提取的,則可能會(huì)導(dǎo)致自遞歸循環(huán),實(shí)現(xiàn)上比較麻煩。我猜想gmail的filter中無(wú)法使用另一個(gè)filter大概是為了避免這個(gè)問(wèn)題。
沒(méi)有很明白您的意思。您指的是標(biāo)簽名(而不是別名)的沖突問(wèn)題吧?其實(shí)標(biāo)簽名沖突不是真正的問(wèn)題,如果沖突正說(shuō)明它們應(yīng)該合并,而這在傳統(tǒng)的層級(jí)結(jié)構(gòu)中是不可能的。如果想進(jìn)一步區(qū)分,再貼另外的標(biāo)簽就是。
關(guān)于自遞歸循環(huán)的問(wèn)題,我不能肯定您的意思。不過(guò)防止標(biāo)簽圖出現(xiàn)單向回環(huán)是必要的。正如前述,本提案中關(guān)注度除訪問(wèn)頻率外均由用戶定義。另外,Gmail的filter雖不能組合使用,但標(biāo)簽可組合過(guò)濾。
系統(tǒng)界面設(shè)想
最后,簡(jiǎn)單設(shè)想一下提案中的系統(tǒng)界面。它類似windows文件瀏覽器(explorer),左邊(只要靠邊即可)是樹(shù)狀標(biāo)簽結(jié)構(gòu),點(diǎn)擊任何標(biāo)簽右邊將顯示所有包含該標(biāo)簽的信息條。這與explorer有些不同:點(diǎn)擊explorer的文件夾右邊只顯示子文件夾和一級(jí)子文件。右邊的信息條可進(jìn)一步按各種準(zhǔn)則排序、過(guò)濾和搜索。這里暫時(shí)沒(méi)有考慮一個(gè)標(biāo)簽有多個(gè)父標(biāo)簽的情形。此外,左邊的標(biāo)簽除了tree
view外,還有list view,正如Gmail的標(biāo)簽列表,但可按重要性、緊急性、常用性等排序。至于別名和thread,可以分別理解為標(biāo)簽和信息條的聚合,用戶可點(diǎn)擊展開(kāi)或收攏。
參考鏈接
關(guān)于信息系統(tǒng)組織方式的一個(gè)提案
A Proposal on Organization of Information System