详细说明
适应度函数个体的误差程度GP算法通过适应度值反映个体解决问题的能力。判别函数分类性能的好坏表现在训练样本经过判别函数映射后的函数值落入正确区间的多少以及映射后落入错误区间的函数值与分类边界的距离。因此,本文采用训练样本中被错误分类样本映射后的函数值与分类边界之间的距离总和来衡量个体的误差程度。为了避免映射后的函数值分布在零值的分类边界附近,引入松弛参数d(d0)计算类C0、C1中的训练样本在由判别函数分类过程中的误差程度:E0=0fGP(X)-d,XC02fGP(X)>-d,XC0(2)E1=0fGP(X)d,XC12fGP(X)惩罚项过拟合和过学习现象的发生一般与解的复杂度相关。为了避免GP算法在进化过程中产生过于复杂的判别函数表达式,减少过拟合和过学习的发生,根据最小描述原理,本文将判别函数表达式中结点的数量作为衡量个体复杂度的惩罚指标之一。同时,特征向量经过判别函数映射后函数值的方差分布也反映了判别函数表达式的复杂程度,复杂程度较低的结构形式具有较小的类内方差。因此,本文中采用如下的综合惩罚项PGP用于折衷判别函数表达式的复杂程度和分类的准确程度,PGP=CS(20+21)N0+N1(5)式中:C为指定的惩罚系数;S为GP函数表达式中函数结点和终结点的个数总和;20和21分别为属于类C0、C1的样本经过判别函数表达式计算后的均方差。
适应度函数基于以上对GP中个体的误差程度和惩罚项的分析,本文采用广东西屋电气有限公司