根据放射性图片来判断患者的病例,普通人类的错误率是3%,普通医生的错误率是1%,而经验丰富的医生错误率只有0.7%,对于一个优秀的医生团队而言,当他们打成共识时错误率只有0.5%。那么此时我们应该如何定义人类水平误差呢?在定义人类水平误差的时候,我们应该考虑的是,我们是想利用人类水平误差来估计贝叶斯误差。因为我们不知道,在这个行业中是否还存在经验更丰富的医生或者团队,也许他们的误差比0.5%还要低,所以贝叶斯最优误差不会高于0.5%。所以在这里,我们可以选择0.5%的误差作为贝叶斯最优误差,也就是人类水平误差。有时候也许我们根本不需要把目标定的这么高,对于商用水平可能达到普通医生的水平就可以了,对于不同的场景可以选择不同的人类误差水平。 建议
最后提供一些常用减少可避免偏差和方差的方法。 减少可避免偏差:使用规模更大的模型、使用更好的算法(RMSprop、Momentum、adam)、训练的更久、寻找更好的架构、寻找更好的参数、改变激活函数、改变隐藏层数等。 减少方差:增加更多的数据、正则化(L2、dropout)、数据增强、尝试不同的网络架构等。
ROSoft YaHei, Source Han Sans SC, Noto Sans CJK SC, WenQuanYi Micro Hei, sans-serif">了解更多干货文章,可以关注小程序八斗问答