在误差分析时并行评估多个想法
上述的想法都可以以并行的形式进行评估。通常我会创建一个电子表格,一边查看被误分类的 100 个开发集样本一边完善表格内容,同时我也会留下一些能够帮助我记住特定样本的备注。为了说明这一过程,如下所示是一个仅含四个样本的小型开发集的电子表格:
虽然你可能事先规定了一些类别(狗,大猫,模糊)并进行了手动的分类,但在浏览图像时你可能会受到启发并发现一些新的类别。比如你在浏览一些图片时发现,经过 Instagram 滤镜处理过的图片在识别时对结果造成了误差,你就可以在电子表格中加入一个新的 “Instagram” 列。手动查看误分类样本,并思考人类如何/是否能正确地分类这些样本,这将帮助你发现新的类别以及解决方案。
假设你已检查了 100 个开发集的误分类样本,并得到了下面的表格:
图像 | 狗 | 大猫 | 模糊 | 备注 |
---|---|---|---|---|
1 | √ | 不常见的美国比特犬 | ||
2 | √ | |||
3 | √ | √ | 狮子;雨天在动物园拍摄的图片 | |
4 | √ | 树木后的美洲豹 | ||
… | … | … | … | |
占全体比例 | 8% | 43% | 61% |
误差分析并不会产生一个明确的数学公式来告诉你什么任务的优先级最高。你还需要考虑在不同类别上的预期进展以及解决每个类别所需的工作量。