如何评估机器学习模型的性能
通过使用以下公式计算 残差平方 和,即所有误差(e_i)平方的总和, 其中fi是第i个数据点的模型的预测目标值。 取所有实际目标值的平均值: 然后计算与测试集目标值的方差成正比的 总平方和 : 如果同时观察两个平方和的公式,则可以看到唯一的区别是第二项,即y_bar和fi。平方总和在某种程度上给我们一种直觉,即它仅与残差平方和相同,但预测值为[,,,…….,n次]。是的,您的直觉是正确的。假设有一个非常简单的均值模型,无论输入数据如何,均能每次预测目标值的平均值。 现在我们将R²表示为: 正如您现在所看到的,R²是一种度量,用于将模型与非常简单的均值模型进行比较,该均值模型每次均返回目标值的平均值,而与输入数据无关。比较有4种情况: 情况1:SS_R = 0 (R²= 1)完美的模型,完全没有错误。 情况2:SS_R> SS_T (R²<0)模型甚至比简单的均值模型差。 情况3:SS_R = SS_T (R²= 0)模型与简单均值模型相同。 情况4:SS_R <SS_T (0 <R²<1)模型还可以。 因此,简而言之,您应该非常了解您的数据集和问题,然后您始终可以创建一个混淆矩阵,并检查其准确性,精度,召回率,并绘制ROC曲线,并根据需要找出AUC。但是,如果您的数据集不平衡,请不要使用准确性作为度量。如果您想对模型进行更深入的评估,以使概率分数也得到权重,请选择对数损失。 请记住,请务必评估您的训练!
(编辑:西安站长网) 【声明】本站内容均来自网络,其相关言论仅代表作者个人观点,不代表本站立场。若无意侵犯到您的权利,请及时与联系站长删除相关内容! |