<rt id="bn8ez"></rt>
<label id="bn8ez"></label>

  • <span id="bn8ez"></span>

    <label id="bn8ez"><meter id="bn8ez"></meter></label>

    馬可波羅的夢鄉

    BlogJava 首頁 新隨筆 聯系 聚合 管理
      4 Posts :: 50 Stories :: 2 Comments :: 0 Trackbacks
    1、把零散的信息集成到數據倉庫中,對決策有巨大的好處。
    2、數據清理應該是一個繁瑣的過程。即使是數據倉庫,也不可能包含所有的數據,如果沒有解決問題的全部數據,就需要到外部獲取數據,并對這些數據進行清理,同時把這些數據集成到數據倉庫中去
    3、經常需要對數據進行規格化操作,如使某個屬性的值在0-1區間。規格化操作的方法很多,如除以發現的最大數,或求統計均值,方差等。
    4、通過使用距離函數,名詞值也可以轉成成數字。如兩個名字相同,則值為0,兩個名字不同,則值為1。
    5、有時數據本身具備一些源自自身的映射關系,如電話號碼前的區號,郵編。學號前幾位數字可能代表該學生的入學時間等。
    6、現實生活中遇到的大部分數據集,都會包含缺失值,即missing value
    7、數據有缺失是很正常的情形。如醫學實驗,如果動物在實驗完成之前就死掉了,有些數據就不能采集到了數據缺失并不一定使用問號表示,也可以用超出正常值的一些特定值來表示,如使用負數和零等。即使同樣是缺失值,也可以有多種原因,可以使用不同的負值表示。。。
    8、
    posted on 2009-10-19 13:44 夢回唐朝 閱讀(115) 評論(0)  編輯  收藏 所屬分類: weka

    只有注冊用戶登錄后才能發表評論。


    網站導航:
     
    主站蜘蛛池模板: 免费在线人人电影网| 亚洲人成欧美中文字幕| 中文字幕av免费专区| 日本中文一区二区三区亚洲| 91禁漫免费进入| 亚洲avav天堂av在线不卡| 美女在线视频观看影院免费天天看| 亚洲第一网站免费视频| 色噜噜综合亚洲av中文无码| 午夜免费福利小电影| 久久精品亚洲一区二区三区浴池| 99精品视频在线观看免费播放| 亚洲美女aⅴ久久久91| 毛片免费观看网址| 亚洲AV性色在线观看| 国产一区二区三区在线免费| 一区二区在线免费视频| 国产成人亚洲综合色影视| 99久9在线|免费| 亚洲色偷偷色噜噜狠狠99| 日本成人在线免费观看| 无遮挡免费一区二区三区| 亚洲不卡中文字幕无码| 免费H网站在线观看的| 亚洲日韩精品国产一区二区三区| 国产又粗又猛又爽又黄的免费视频| 一日本道a高清免费播放 | 国内免费高清在线观看| 国产午夜亚洲精品不卡| 亚洲综合色婷婷七月丁香| 最近免费中文字幕大全免费版视频| 亚洲成年网站在线观看| 亚洲?V乱码久久精品蜜桃 | 一级成人a免费视频| 亚洲av色福利天堂| 免费人成在线视频| 久久99精品免费一区二区| 亚洲videos| 亚洲人成网77777色在线播放| 噼里啪啦电影在线观看免费高清 | 国内精品久久久久影院免费|