如何降低训练loss——如何降低训练伤

晓查发自凹非寺
量子位报道 | 公众号 QbitAI

训练数据集里的标签通常不会都是正确的，比如图像分类，如果有人错误地把猫标记成狗，将会对训练结果造成不良的影响。

如何在不改变训练样本的情况下，尽可能降低这类噪声数据对机器学习模型的影响呢？

最近，谷歌提出了一个新的损失函数，解决了机器学习算法受噪声困扰的一大问题。

逻辑损失函数的问题

机器学习模型处理带噪声训练数据的能力，在很大程度上取决于训练过程中使用的损失函数。

通常我们用来训练图像分类的是逻辑损失函数（Logistic loss），但是它存在两大缺点，导致在处理带噪声的数据时存在以下不足：

1、远离的异常值会支配总体的损失

逻辑损失函数对异常值非常敏感。这是因为损失函数的没有上界，而错误的标记数据往往远离决策边界。

这就导致异常大的错误数值会拉伸决策边界，对训练的结果造成不良影响，并且可能会牺牲其他的正确样本。

2、错误的标签的影响会扩展到分类的边界上

神经网络的输出是一个矢量激活值，一般对于分类问题，我们使用的是softmax，将激活值表示为分别属于每个分类的概率。

由于逻辑损失的这种传递函数的尾部以指数方式快速衰减，因此训练过程将倾向于使边界更接近于错误标记的示例，以保证不属于该分类的函数值更接近于0。

如此一来，即使标签噪声水平较低，网络的泛化性能也会立即恶化。

△ 二元分类的可视化结果，噪声会导致决策边界外扩，造成分类错误

双参数可调的损失函数

谷歌通过引入两个可调参数的双稳态逻辑损失函数（Bi-Tempered Logistic Loss）来解决上述两个问题。这两个参数分别是“温度”（temperature）t₁和尾部重量（tail-heaviness）t₂。尾部重量其实就是指传递函数尾部下降的速率。

当t₁和t₂都等于1的时候，这个双稳态函数就退化为普通的逻辑损失函数。

温度参数t₁是一个介于0到1之间的参数，它的数值越小，对逻辑损失函数界限的约束就越厉害。

尾部重量t₂定义为一个大于等于1的参数，其数值越大，尾部就越“厚”，相比指数函数来说衰减也就越慢。

△ 温度（左）和尾部重量（右）对损失函数结果的影响

你也可以通过谷歌的在线Demo观察损失函数随t₁和t₂两个参数的变化情况。

对噪声数据集的效果

为了证明不同温度t₁的影响，谷歌在合成数据集上训练一个双层神经网络的二元分类问题。蓝点和红点表示数据实际分属的类别，两个不同颜色的区域表示神经网络的训练结果，白色为决策边界。

谷歌使用标准的逻辑损失函数和不同温度参数的损失函数，对比了在这四种条件下的实验结果：无噪声数据集、小边距噪声数据集、大边距噪声数据集和随机噪声的数据集。

在无噪声情况下，两种损失都能产生良好的决策边界，从而成功地将这两种类别分开。

小边距噪声，即噪声数据接近于决策边界。可以看出，由于softmax尾部快速衰减的原因，逻辑损失会将边界拉伸到更接近噪声点，以补偿它们的低概率。而双稳态损失函数有较重的尾部，保持边界远离噪声样本。

大边距噪声，即噪声数据远离决策边界。由于双稳态损失函数的有界性，可以防止这些远离边界的噪声点将决策边界拉开。

最后一个实验是随机噪声，噪声点随机分布在矢量空间中。逻辑损失受到噪声样本的高度干扰，无法收敛到一个良好的决策边界。而双稳态损失可以收敛到与无噪声情况几乎相同的结果上。

传送门

在线Demo：

博客地址：

论文链接：

— 完 —

诚挚招聘

量子位正在招募编辑/记者，工作地点在北京中关村。期待有才气、有热情的同学加入我们！相关细节，请在量子位公众号(QbitAI)对话界面，回复“招聘”两个字。

量子位 QbitAI · 头条号签约作者

վ'ᴗ' ի 追踪AI技术和产品新动态

“如何降低训练loss,如何降低训练伤,如何降低训练营复训率,如何训练降低龟敏,如何训练成m”边界阅读

「如何设置王者荣耀照相功能」王者荣耀如何设置女…

如何设置王者荣耀照相功能,王者荣耀如何设置女,如何设置王者荣耀阅读相关介绍,自从麒麟810芯片正式发布后，7nm工艺、强悍的性能等引起了不少关注度。麒麟810芯片的出现对于荣耀来说非常重要，上个月发布的荣耀9X也用上了这款最新旗舰级芯片，拥有旗舰级性能的同时还把价格拉到139

模型如何切片、模型切片什么意思!

模型如何切片,模型切片什么意思,模型切片软件相关介绍,随着3D打印逐渐向主流靠拢，越来越多的人认识到了这项技术的价值。他们不但购买了设备，而且正在不断尝试自行打印更多新奇、有趣、实用的3D打印项目。由于并非人人都具备3D建模能力，同时也是为了推动3D打印

「小米9手机如何关闭键盘灯」小米手机怎么关闭游戏键盘…

小米9手机如何关闭键盘灯,小米手机怎么关闭游戏键盘,小米手机关闭键盘声音相关介绍,分享生活小妙招，享受科技新生活！大家好，欢迎来到今天的知识分享！我是你们的好朋友小俊！这一期我们来分享一下小米手机按键中隐藏的3个功能，这3个功能可以说都非常的实用，在红米手机中也能使用，那么具体是

小世界app如何小世界app如何设置抢红包提醒…

小世界app如何,小世界app如何设置抢红包提醒,如何关掉小世界相关介绍,位于西湖区西溪街道辖区内的浙江青创学院里有这样一个创业团队，他们致力“让宝宝变得更美”而努力着，他们就是“小世界”。 “小世界”是一款童装导购APP，定位明确，界面精致清新。“小世界”不仅有最新最潮流

如何在app上购物记录、如何推广购物app!

如何在app上购物记录,如何推广购物app,如何投诉购物app相关介绍,本文编辑今日头条作者维权骑士签约用户：小俊技术分享独家原创制作未经授权严禁转载，发现抄袭者将进行全网维权投诉分享生活小妙招，享受科技新生活！大家好，欢迎来到今天的知识分享！我是你们的好朋友小俊！

招行app如何做地铁

招行app如何做地铁相关介绍,王先生是一名上班族，以前遇到交通卡余额不足的情况，他通常选择到附近的地铁自助充值机充值，可是遇到人流量大的上班时间，总是要排很长的队才得以充值，这让他有些苦恼。现在，随着移动支付功能逐渐应用在交通领域

如何在线更新客户端的程序

如何在线更新客户端的程序相关介绍,今天是2022年9月21日，微软正式开始推送22H2，最简单的方法就是去设置里找到windows更新，然后检查更新，但是很大概率是你啥都没搜到……那么你可以试试下边的方法。更新方法如果你不着急，可

在强烈阳光下如何进行拍摄

在强烈阳光下如何进行拍摄相关介绍,一.正确使用曝光补偿拍摄雪景的难点之一在于把握住准确的曝光量。雪地的反光，亮度通常是没有雪覆盖地面的几倍。拍摄时天气的阴晴、时间的早晚、阳光下或阴影中、光的方向角度、雪地表面状况、构图中雪地的面积等

责任编辑: 鲁达

“如何降低训练loss,如何降低训练伤,如何降低训练营复训率,如何训练降低龟敏,如何训练成m”边界阅读