Underfitting and Overfitting (2) 拟合不足与过拟合(2)
上一节
下一节
主要知识点:
1.金融场景中泛化误差的计算方法
乐观方法,认为模型的泛化误差等于模型在训练集上的误差,这是一种最为乐观的估计。
悲观方法,由于模型越复杂,发生过拟合的可能性越大,因此在考虑模型泛化性能时需要同时考虑模型复杂度,当模型的复杂度较高时,训练错误率会低估模型的泛化错误率。
运用验证集,即通过“样本外”估计来计算模型的泛化误差,可以运用未被用于模型训练的验证集来进行计算。
2.金融场景中决策树模型中过拟合的处理方法
先剪枝方法,在这种方法中,在生成一个完美适配整个训练集的决策树之前,相应的决策树增长算法就会停止。
后剪枝方法,在这种方法中,决策树首先增长到最大规模,之后再对决策树进行修剪,采取的是自下而上的方式对完整的决策树进行修剪。

