也就是说,将Loss对输出的梯度,传回到max pooling对应的那个feature unit上,再往回传
这就比较厉害了,谁不喜欢end to end,之前RCNN是需要分开微调SVM分类层和bounding box regressor的