<rt id="bn8ez"></rt>
<label id="bn8ez"></label>

  • <span id="bn8ez"></span>

    <label id="bn8ez"><meter id="bn8ez"></meter></label>

    我的一畝三分地

      BlogJava :: 首頁 :: 新隨筆 :: 聯系 :: 聚合  :: 管理 ::
      7 隨筆 :: 0 文章 :: 17 評論 :: 0 Trackbacks

    2010年9月12日 #

    不少朋友抱怨我的博客晦澀難懂,實際元數據、主數據、數據質量、數據分析已經非常小眾了,小眾的以至于在ITPUB發博都找不到分類,實際這也是我看好它的原因。隨著未來智慧地球、物聯網的建設,信息化進程大大加快,需要虛擬化云計算)、IT資源監管(數據資產、軟硬件資產)、移動應用。我們的小眾是屬于數據資產監管中的一部分。

    上周挖了不少坑,本周先填一個坑,填元數據模型的坑。元數據模型簡稱元模型。元數據有哪幾類元數據模型就有幾類,粗分下分為數據移動(ETL)元數據、數據分析(BI)元數據、數據存儲元數據,數據質量元數據、數據管控元數據等。下面逐一介紹下這幾類元數據:

    數據存儲元數據模型:要分結構化和非結構化兩種介紹,先說大家常見的結構化數據的元數據模型。我們知道描述數據庫信息需要Catalog、Schema、Table、View、Trigger和storage process,當然一般把Trigger和SP理解為數據移動,這些元數據都有哪些屬性你可以看看power designer。對于非結構化數據解決方案不多,因為對于非結構化數據與查詢息息相關,一般針對索引條件建立元數據模型。

    數據移動元數據模型:這一直是我思考的問題,參照主流ETL工具我們可以定義Workflow、Task、mapping、source、target等,記得source與target與數據存儲元數據模型可以互聯。Mapping要記錄source至target間的轉換過程。

    數據應用元數據模型:主要考慮帶OLAP引擎的CUBE模型,主要有:Cube、Dimension、member Of、Hierarchy、Fact等。

    講到這里,基本解決了的元數據管理中元數據存儲和展示的問題。但這并是問題的本質,實質是元數據模型與CWM之間的關系,但為了避免文章晦澀難懂,我跳過這些。

    posted @ 2010-09-12 23:15 西北狼 閱讀(197) | 評論 (0)編輯 收藏

    2010年9月11日 #

    元數據的定義就五字-數據的數據,這種極度抽象的定義直接導致我們對元數據的認知是極度抽象的,這種極度抽象就造成了元數據的神化,我想接下來要做的就是將元數據拉下神壇。
        元數據是數據的數據,我們一般采用數據模型對抽象定義數據及數據的關系,那么元數據一定也能被數據模型表述。那元數據的數據模型是什么樣的?它與數據的數據模型有哪些異同。目前元數據建模標準體系,我們一般采用OMG(請記住這個國際知名的標準化組織,因為除了元數據模型標準外,它們還制定了MDA、UML、XMI等)的CWM標準。那么一個標準的元數據模型體系由什么組成呢,除了包外,每個元模型由管理、分析、資源、基礎和對象。管理是指數據倉庫操作和過程;分析是指OLAP、數據挖掘、信息可視化、ETL;資源是指對象、關系、記錄、多維、XML;基礎是指業務信息、數據類型、表達式、鍵和索引、軟件部署、類型映射。介紹了這么如果你搞過業務智能你會明白CWM描述了整個數據倉庫的全部,如果你參與過我們的項目會知道,這是我們數據管控平臺的理論依據。那么數據倉儲的元數據如何定義?數據移動的元數據如何定義?數據分析的元數據如何定義?先挖坑以后慢慢填。
         下面說說元數據如何管理如何應用:首先是元數據獲取,元數據獲取的內容包括分析元數據、數據倉儲元數據、數據轉換元數據等等,元數據獲取方式方式包括自動獲取或手工獲取,當然元數據獲取最難的是非結構化元數據的獲取,但是也有解決的辦法只是這里存在獲取準確度的問題,為了保證文檔的純潔性,我再次挖坑。其次是元數據倉儲,簡單的說包括數據庫表結構如何存儲,CUBE的結構如何存儲,ETL過程如何存儲等等,實際這是個模型的問題,但這純粹存儲模型的問題。同上,我再次挖坑。最后是元數據應用,包括血緣分析、重要度分析、相似度分析等等。
         最后說下元數據管理的衍生業務:一是元數據的質量管理,這是個雞和蛋的問題,為了保證數據質量我們引入元數據定義數據的質量,但引入元數據后又要保證元數據的質量;二是基于元數據的數據倉庫開發,同志們baidu都有,我不說了;三是基于元數據的安全管理,引入元數據除解決質量問題外,就是密級問題;四是基于元數據的指標體系管理。
          挖了很多坑,終于理出元數據的脈絡,當然元數據管理系統也初見輪廓。
    posted @ 2010-09-11 21:09 西北狼 閱讀(248) | 評論 (0)編輯 收藏

    2007年7月29日 #

         摘要: 亂彈數據倉庫的第二彈,ODS的功能和作用。希望對大家有用  閱讀全文
    posted @ 2007-07-29 14:01 西北狼 閱讀(2194) | 評論 (2)編輯 收藏

    2007年7月2日 #

         摘要: 關于客戶方面對軟件項目影響,最近也是遇到了幾個類似的項目,有感而發寫下來,希望對大家有用。  閱讀全文
    posted @ 2007-07-02 22:12 西北狼 閱讀(1032) | 評論 (1)編輯 收藏

    2007年6月27日 #

         摘要: 亂彈數據倉庫,用通俗易懂的方式講清楚數據倉庫。讓老鳥見笑了。  閱讀全文
    posted @ 2007-06-27 23:11 西北狼 閱讀(1409) | 評論 (4)編輯 收藏

    2007年6月26日 #

         摘要: 總結前一階段項目成功與失敗的地方,有些方法和想法與各位share下。  閱讀全文
    posted @ 2007-06-26 17:50 西北狼 閱讀(1635) | 評論 (6)編輯 收藏

    僅列出標題  
    主站蜘蛛池模板: 国产极品粉嫩泬免费观看| 免费观看美女裸体网站| 浮力影院亚洲国产第一页| 免费无码一区二区| 亚洲无码黄色网址| 中国在线观看免费高清完整版| 久久精品国产亚洲香蕉| 国产自国产自愉自愉免费24区| 亚洲av无码精品网站| 1000部啪啪未满十八勿入免费| 久久久久亚洲精品天堂| 美女被免费网站视频在线| 免费a级毛片18以上观看精品| 黄网站在线播放视频免费观看| 亚洲精品第一国产综合精品99| caoporm碰最新免费公开视频| 国产偷v国产偷v亚洲高清| 黄色免费在线网站| 亚洲另类春色国产精品| 卡一卡二卡三在线入口免费| 国产AV日韩A∨亚洲AV电影| 自拍偷自拍亚洲精品被多人伦好爽| 无码人妻精品中文字幕免费| 亚洲欧洲另类春色校园网站| 国产乱人免费视频| a级在线免费观看| 亚洲综合中文字幕无线码| 婷婷综合缴情亚洲狠狠尤物| 久久久久久亚洲精品成人| 国产免费av片在线看| 免费国产va在线观看| 亚洲an天堂an在线观看| 成年私人影院免费视频网站| 亚洲1区1区3区4区产品乱码芒果 | 久久久久无码专区亚洲av| 久久青草免费91观看| 亚洲日韩精品国产一区二区三区| 亚洲?V无码成人精品区日韩| 99在线视频免费| 免费国产a理论片| 亚洲中字慕日产2020|