量化項目管理案例:缺陷趨勢預測利器(7)
在之前的文章里,已經介紹了幾種不同的成長曲線的形式,知道了幾種曲線的趨勢情況。比如,指數曲線就是呈指數的不斷增長;S型曲線就是先增后趨于平穩。然而,再進一步,怎么擬合出適合給定樣本數據的模型曲線呢?這回,我們介紹曲線的幾種擬合算法。
曲線擬合主要有3種算法:三點法、三和法和高斯-牛頓法。下面簡單介紹3種算法的原理。
1、三和法:
三和法是利用三個和值來進行計算。將數據平均分成三段,分別求這三段數據的和;隨后將三個和值依次做減法;通過求減法得出要預測的參數。也就是求解三元一次方程組,得到最終參數的值。
2、三點法:
三點法亦如它的名字,是利用三個點的值來進行計算。選擇數據的起點、中點和終點,得到三元一次方程組;解出方程組,得到參數值。
3、高斯-牛頓法:
高斯-牛頓法是用逐次逼近的方式來得到最佳參數值。高斯-牛頓法的計算過程是一個不斷迭代的過程。由于高斯-牛頓法的計算原理為尋找最優值,因此得到的結果應該最接近實際情況,擬合度最高。然而,高斯-牛頓法對數據要求較高,會出現由于數據原因無法計算的情況。
由于算法公式較為復雜,暫時沒有發表在網站上,但我們會盡快整理。
三和法 | 三點法 | 高斯-牛頓法 | |
原理 | 將大量數據分為3段 | 3點確定一條曲線 | 迭代尋找最優值 |
對數據個數的要求 | 最少9個 | 3個 | 無要求 |
易用性 | 較為易用 | 易用 | 對數據要求嚴格,易用性較低 |
準確度 | 較為準確 | 準確性較差 | 準確 |
可能不適用的情況 | 樣本連續出現多個0 | 樣本連續出現多個0 | 無法簡單判斷,只能通過計算得出 |
使用場景 | 已有一定數據量,可用于評斷一個模型合適與否,或用于跟蹤、更新模型 | 數據量不夠,用于策劃得到初始模型 | 數據量要求無太大限制,可用于評價模型的使用情況 |
注意事項 | 時間從0開始和從1開始計算公式不同 | 選取的三點距離應相等 | 最優值的選取標準是R2 |
posted on 2011-11-10 11:28 順其自然EVO 閱讀(241) 評論(0) 編輯 收藏 所屬分類: 測試學習專欄