且构网

分享程序员开发的那些事...
且构网 - 分享程序员编程开发的那些事

量化项目管理案例:缺陷趋势预测利器(7)

更新时间:2022-09-20 08:49:43

在之前的文章里,已经介绍了几种不同的成长曲线的形式,知道了几种曲线的趋势情况。比如,指数曲线就是呈指数的不断增长;S型曲线就是先增后趋于平稳。然而,再进一步,怎么拟合出适合给定样本数据的模型曲线呢?这回,我们介绍曲线的几种拟合算法。

  曲线拟合主要有3种算法:三点法、三和法和高斯-牛顿法。下面简单介绍3种算法的原理。

  1、三和法:

  三和法是利用三个和值来进行计算。将数据平均分成三段,分别求这三段数据的和;随后将三个和值依次做减法;通过求减法得出要预测的参数。也就是求解三元一次方程组,得到最终参数的值。

  2、三点法:

  三点法亦如它的名字,是利用三个点的值来进行计算。选择数据的起点、中点和终点,得到三元一次方程组;解出方程组,得到参数值。

  3、高斯-牛顿法:

  高斯-牛顿法是用逐次逼近的方式来得到***参数值。高斯-牛顿法的计算过程是一个不断迭代的过程。由于高斯-牛顿法的计算原理为寻找最优值,因此得到的结果应该最接近实际情况,拟合度最高。然而,高斯-牛顿法对数据要求较高,会出现由于数据原因无法计算的情况。

  由于算法公式较为复杂,暂时没有发表在网站上,但我们会尽快整理。

 三和法

三点法

高斯-牛顿法

原理 将大量数据分为3段 3点确定一条曲线 迭代寻找最优值
对数据个数的要求 最少9个 3个 无要求
易用性 较为易用  易用 对数据要求严格,易用性较低
准确度 较为准确 准确性较差 准确
可能不适用的情况 样本连续出现多个0 样本连续出现多个0 无法简单判断,只能通过计算得出
使用场景 已有一定数据量,可用于评断一个模型合适与否,或用于跟踪、更新模型 数据量不够,用于策划得到初始模型 数据量要求无太大限制,可用于评价模型的使用情况
注意事项 时间从0开始和从1开始计算公式不同 选取的三点距离应相等 

最优值的选取标准是R2



 


本文出自seven的测试人生公众号最新内容请见作者的GitHub页:http://qaseven.github.io/