GIS數(shù)據(jù)建庫基本思想(上)
3.?????
數(shù)據(jù)規(guī)范
這里說的數(shù)據(jù)規(guī)范,指的是可以被系統(tǒng)所正確識別的數(shù)據(jù)。這依賴于上述數(shù)據(jù)庫建庫的第一個過程,即數(shù)據(jù)庫標(biāo)準(zhǔn)的制定和數(shù)據(jù)規(guī)范。這里的主要矛盾在于,因為
GIS?
平臺的不一致,各個平臺對空間數(shù)據(jù)描述的模型不同,而導(dǎo)致了在一個平臺上生成的數(shù)據(jù)在另一個平臺不能正確讀出,從而導(dǎo)致轉(zhuǎn)換前后矢量或?qū)傩詳?shù)據(jù)的丟失,甚至無法轉(zhuǎn)換的結(jié)果。
例如,
AutoCAD
存在擬合曲線
Spline
對象,圖形塊
Block
對象,區(qū)域
Region?
對象,代理對象等許多特殊的圖形對象,在
GIS
系統(tǒng)中沒有相應(yīng)的圖形對象與之相對應(yīng)。因此要想將這些數(shù)據(jù)入庫,必須先將以上對象轉(zhuǎn)化,使之變成
GIS
可以識別的圖形對象。
??AutoCAD?
的擴展數(shù)據(jù)由于為
AutoCAD?
所特有,因此也必須尋找解決辦法
(
例如數(shù)據(jù)格式轉(zhuǎn)換
)
,使之能被
GIS
所正確讀取。
此外還包括數(shù)據(jù)規(guī)范中規(guī)定的各個圖層之間相互的空間拓?fù)潢P(guān)系及屬性數(shù)據(jù)等,這些都要求有相應(yīng)的檢測和修正工具予以保證。
4.?????
數(shù)據(jù)生產(chǎn)
數(shù)據(jù)生產(chǎn)過程主要包括準(zhǔn)備階段和數(shù)據(jù)輸入階段。以下為
AutoCAD
平臺下數(shù)據(jù)的生產(chǎn)過程為例。
準(zhǔn)備階段
此過程包括定義圖層名稱,配置圖層的各種屬性(顏色,線性,線寬,圖形符號等)。這一過程是數(shù)據(jù)生產(chǎn)的準(zhǔn)備階段,工作邏輯上非常簡單,在認(rèn)真設(shè)置和檢查后,產(chǎn)生錯誤的可能性會很小。
數(shù)據(jù)生產(chǎn)階段
包括柵格數(shù)據(jù)自動矢量化和人工輸入兩個比較大的方面,有時候全為人工輸入。
柵格數(shù)據(jù)自動矢量化是通過掃描儀器輸入柵格數(shù)據(jù),然后通過圖像識別算法,進行矢量跟蹤,從而確定實體的空間位置。在目前的技術(shù)發(fā)展中,程序的算法往往不能完全識別出所需要的對象并進行正確的矢量化,若柵格數(shù)據(jù)是經(jīng)過底圖掃描而非遙感影像,可能還會出現(xiàn)掃面不清晰,因此會產(chǎn)成各種各樣的問題。常見的錯誤主要有以下幾種:
(1)????
房屋等面狀閉合物體留有缺口,即不封閉。
(2)????
掃描后的線段存在很多重復(fù)點的現(xiàn)象。
(3)????
掃描后的線段存在自相交的情況。
(4)????
在圖像邊緣上的線段,掃描后出現(xiàn)畸變現(xiàn)象。
(5)????
在圖像的邊緣存在數(shù)據(jù)丟失的現(xiàn)象。
(6)????
由于圖像定位不準(zhǔn),導(dǎo)致掃描后圖像部分基準(zhǔn)點偏移,從而導(dǎo)致相鄰的地區(qū)存在圖形重疊或交叉的現(xiàn)象。
其中基準(zhǔn)點偏差的影響尤為顯著,嚴(yán)重影響數(shù)據(jù)建庫。一般情況下,我們需要封閉檢查,重復(fù)點檢查,自相交檢查,基準(zhǔn)點檢查和校正等檢查工具去發(fā)現(xiàn)和排除這些錯誤。在這些錯誤中,錯誤
1
、
2
、
3
、
6?
在邏輯上比較簡單,相對比較好解決。錯誤
4
、
5?
則比較難于檢查和解決。
人工輸入是指數(shù)據(jù)錄入人員按照要求用鼠標(biāo)或繪圖議等手工在圖紙上進行繪圖,并設(shè)置和添加各種屬性的過程。這一過程十分繁重的,并且工作具有重復(fù)性和枯燥性等特點,因此容易造成各種錯誤,從而影響數(shù)據(jù)質(zhì)量。產(chǎn)成的錯誤的原因主要有兩個:
精度問題造成的錯誤,這種原因往往造成圖形拓?fù)潢P(guān)系錯誤。例如,應(yīng)該閉合的面狀物體沒有閉合,應(yīng)該端點相連的直線沒有連接,不應(yīng)該重疊的線段存在重疊的部分,不應(yīng)該交叉的圖形存在交叉,面與面之間存在縫隙,面與面之間發(fā)生重疊,基準(zhǔn)點和控制點定位不準(zhǔn)確等等。
人為疏忽造成的原因。例如,有屬性的圖形物體忘記給屬性賦值,導(dǎo)致屬性丟失;有屬性的圖形物體錯誤賦值,導(dǎo)致屬性錯誤;圖幅邊框被刪除或者移動位置;圖幅邊界上的圖形沒有很好的完成接邊處理,造成相鄰圖形不匹配等等。這些錯誤都經(jīng)常的會在數(shù)據(jù)生產(chǎn)過程中發(fā)生,如果不加以檢測和修正,將直接影響建庫的正確性和準(zhǔn)確性,應(yīng)予以注意。
5.?????
小結(jié)
????????
從以上分析可以看出,數(shù)據(jù)建模、數(shù)據(jù)規(guī)范、數(shù)據(jù)生產(chǎn)都是
GIS
數(shù)據(jù)順利、準(zhǔn)確入庫的關(guān)鍵,在整個過程中,數(shù)據(jù)校驗起到了非常重要的作用,在實際操作中,需要系統(tǒng)理論知識和經(jīng)驗知識來作為建立
GIS
數(shù)據(jù)庫的架構(gòu)支撐。根據(jù)個人有限的系統(tǒng)工程方面的理論知識,只能對數(shù)據(jù)校驗做出如下概述:
(1)????
首先,需要對準(zhǔn)備入庫的各種源數(shù)據(jù)進行研究和分析,從中發(fā)現(xiàn)數(shù)據(jù)中存在的明顯的錯誤,并估計潛在的錯誤。
(2)????
根據(jù)數(shù)據(jù)建庫標(biāo)準(zhǔn)和數(shù)據(jù)規(guī)范,分析這些錯誤可能對建庫造成的影響,按照嚴(yán)重程度、優(yōu)先級別、邏輯關(guān)系等將錯誤分類,并制定處解決問題的方案。
(3)????
按照制定的解決方案有計劃、有步驟的糾正這些錯誤,使之符合建庫的規(guī)范。
(4)????
這樣循環(huán)檢查幾次,盡量消除數(shù)據(jù)中的錯誤,一般情況下,總會有少量錯誤存在。
(5)????
當(dāng)已經(jīng)很難找出錯誤時,可以開始進行抽樣檢測,并小規(guī)模進行試驗性入庫。
(6)????
在試驗性入庫成功后,進行大批量的實際入庫。
(7)????
入庫完畢,對入庫成果進行抽樣檢查,查找不正確的地方,并進行修正。
(8)????
GIS
數(shù)據(jù)入庫正式完成,交付使用。
經(jīng)過上述過程,整個建庫工作就已經(jīng)完成。上文所述,只是個人在
GIS
數(shù)據(jù)建庫方面的一點個人經(jīng)驗和系統(tǒng)知識,在今后的實際工作中仍需不斷完善、深入。
原文鏈接:http://www.gissky.net/blog/blog.asp?name=bluewood