【debug怎么用】超详细深度学习debug指南，国外小哥手把手教你如何调试模型--无忧经验

小汽车从凹比萨出发了。

量子比特生产|公众号QbitAI

已经学了深度学习，你做的模型为什么还跑不动，到底哪里出问题了？

读教材，编程调试就跪下。你有没有为了找到虫子而惊慌失措？

网络上深入学习的教材很多，但用手教调试的技巧并不常见。

最近有人雪中送炭啦！一位来自伯克利的小哥Josh Robin分享了他的深度学习debug心得，从最简单模型开始一步步深入到复杂模型，希望能给刚上手的你一点帮助。

Josh在读博期间曾被debug折磨得很痛苦，他说自己花了大部分时间调试而不是在“有趣”的事情上。有一次，仅仅因为标签错误，Josh就整整花了一天才排查出来。

构思和写代码可能只花费10%~20%的时间，而debug和调试要消耗掉80%~90%的时间！所以这份秘籍可能比教材更常伴随着你。

为什么你的模型效果这么差？

由于深度学习模型的复杂性，按照书本知识来搭建模型，往往“理想很丰满，现实很骨感”。别人的模型都能快速达到较低的错误率，而你的模型错误率却居高不下。

△ 别人的曲线vs你的曲线

造出这种现象的原因可以分为4大类：

1、模型实现中的bug：比如前面说过的标签错误的问题。

2、超参数选择不合适：模型对超参数很敏感，学习率太高或太低都不行。

△ 合适的学习率才能保证较低的错误率

3、数据模型不适配：比如你要训练一个自动驾驶图像识别的模型，用ImageNet数据集来训练就不合适。

△ ImageNet中的图片vs自动驾驶汽车拍摄的图片

4、数据集的构造问题：没有足够数据、分类不均衡、有噪声的标签、训练集合测试集分布不同。

深度学习debug的流程策略

针对上面的问题，小哥总结出调试深度学习模型的第一要义——悲观主义。

既然消除模型中的错误很难，我们不如先从简单模型入手，然后逐渐增加模型的复杂度。

他把这个过程分为5个步骤：

从最简单模型入手；
成功搭建模型，重现结果；
分解偏差各项，逐步拟合数据；
用由粗到细随机搜索优化超参数；
如果欠拟合，就增大模型；如果过拟合，就添加数据或调整。

从简单模型开始

在这一步之前，Josh假定你已经有了初始的测试集、需要改进的单一指标、基于某种标准的模型目标性能。

首先，选择一个简单的架构。比如，你的输入是图片就选择类似LeNet的架构，输入是语言序列就选择有一个隐藏层的LSTM。

△ 多输入模型

为了简化问题，我们从一个只有1万样本的数据集开始训练，数据的特点包括：固定数量的目标、分类、更小的图片尺寸。由此创建一个简单的合成训练集。

开始搭建深度学习模型

在搭建模型之前，Josh总结了实现（Implement）的5种最常见的bug：

错误的张量形状；预处理输入错误；损失函数错误输入；忘记设置正确的训练模型；错误的数据类型。

为了防止这些错误发生，Josh给出的建议是：尽可能减少代码的行数，使用现成的组件，然后再构建复杂的数据pipeline。

运行模型后，你可能会遇到形状不匹配、数据类型错误、内存不足等等问题。

对于第一个问题，可以在调试器中逐步完成模型创建和推理。数据类型错误是由于没有把其他类型数据转化成float32，内存不足是因为张量或者数据集太大。

评估

下面我们开始用错误率评估模型的性能。

测试集错误率 = 错误率下限 + 偏移 + 方差 + 分布偏差 + 验证集过拟合

为了处理训练集和测试集分布的偏差，我们使用两个验证数据集，一个样本来自训练集，一个样本来自测试集。

改进模型和数据

上一步中粗略搭建的模型错误率仍然相当高，我们应该如何改进？

让我们先用以下方法解决欠拟合的问题：

让模型更大（比如加入更多的层，每层中使用更多的单元）；减少正规化；错误分析；选择另一种性能更好的模型架构；调节超参数；加入更多特征。

△ 解决欠拟合问题

首先，我们给模型加入更多的层，转换到ResNet-101，调节学习率，使训练集错误率降低到0.8%。

△ 把训练集错误率降低到目标值以内

在出现过拟合后，我们可以增加训练集的样本量解决这个问题，把图片数量扩大到25万张。

△ 解决过拟合问题

经历过优化参数、权重衰减、数据增强等一系列操作后，我们终于把测试错误率降低到目标值。

△ 目标错误率

接下来我们着手解决训练集和测试集的分布偏差问题。

分析测试验证集错误率，收集或者合成更多训练数据弥补二者的偏差。比如下面的自动驾驶目标识别模型，训练完成后，让它判断图片里有没有人，常常发生错误。

△ 分析自动驾驶数据集的分布偏差

经过分析得出，训练集缺乏夜晚场景、反光等情况。后续将在训练集中加入此类数据纠正偏差。

另一种修正错误率的方法称为领域适配，这是一种使用未标记或有限标记数据进行训练的技术。它能在源分布上进行训练，并将其推广到另一个“目标”。

超参数优化

这是调试的最后一步，我们需要选取那些更敏感的超参数，下图是模型对不同超参数的敏感性：

△ 模型对不同超参数的敏感性

常用的超参数优化方法有：手动优化、网格搜索、随机搜索、由粗到细、贝叶斯优化。

△ 由粗到细的随机搜索

你可以手动优化超参数，但是耗时而且需要理解算法的细节。Josh推荐的方法是由粗到细的随机搜索、贝叶斯优化。

由粗到细的随机搜索可以缩小超高性能参数的范围，缺点是由一些手动的操作。贝叶斯优化是优化超参数最有效一种无需手动干涉的方式，具体操作请参考：

最后附上本文提到的所有资源。

资源汇总

下载地址（需科学前往）：

或者在我们的公众号中回复debug获取。

Josh在教程最后推荐了吴恩达的《Machine Learning Yearning》，这本书能帮你诊断机器学习系统中的错误：

另外杨百翰大学也有一篇搭建和调试深度学习模型的博客：

— 完 —

诚挚招聘

量子位正在招募编辑/记者，工作地点在北京中关村。期待有才气、有热情的同学加入我们！相关细节，请在量子位公众号(QbitAI)对话界面，回复“招聘”两个字。

量子位 QbitAI · 头条号签约作者

վ'ᴗ' ի 追踪AI技术和产品新动态

关于作者: admin

热门推荐

1怎么聊不显得主动，又能拨动对方的心？

2【amd核显性能排行】全球显卡排名：AMD第一、英特尔第二、NV第三

3【重玩放大缩小最佳全屏】windows小技巧，系统玩游戏不能全屏解决办法！

4[手机ip地址是固定的吗]手机ip地址可以改吗

5【lol官方解说名单】2019LPL全明星：Cat获奖2019最佳新晋解说，国号最佳新秀。

6【6700显卡】AMD 6700 XT显卡首发评测：性能炸裂，2K游戏无压力