- 在解决的是什么问题?加快检测速度,提高检测精度
- 为何成功,标志/准是什么?训练更容易了
- 在前人基础上的关键创新是什么?使用一个网络来训练 R-CNN,而不是之前的三个阶段,不同的网络
- 关键结果有哪些?
- 有哪些局限性?如何优化?
- 这个工作可能有什么深远的影响?
- 比 R-CNN 和 SPPnet 更好的精度(mAP)
- 单个 stage,使用多任务的 loss => 即包含分类,也包含矩形?
- 训练可以更新网络的所有层。R-CNN 里是分开三段训练的
- 不需要额外的硬盘存储来做未来的 feature 缓存
从 pretrained 网络开始,然后为目标检测 Fine-tune
- RoI pooling layer
- 还有在论文里写的问号