ssd_loss

    该OP用于SSD物体检测算法的多窗口损失层

    该层用于计算SSD的损失,给定位置偏移预测,置信度预测,候选框和真实框标签,以及难样本挖掘的类型。通过执行以下步骤,返回的损失是本地化损失(或回归损失)和置信度损失(或分类损失)的加权和:

    1、通过二分匹配算法查找匹配的边界框。

    2、计算难分样本的置信度

    3、应用难样本挖掘算法来获取负样本索引并更新匹配的索引。

    4、分配分类和回归目标

    5、计算总体的物体损失。

    参数:

    • location (Variable)- 位置预测,具有形状[N,Np,4]的3D-Tensor,N是batch大小,Np是每个实例的预测总数。 4是坐标的维数,布局是[xmin,ymin,xmax,ymax],xmin,ymin代表box左上坐标,xmax,ymax代表box右下坐标,数据类型为float32或float64。

    • confidence (Variable) - 置信度(分类)预测,具有形状[N,Np,C]的3D-Tensor,N是batch大小,Np是每个实例的预测总数,C是类别数量,数据类型为float32或float64。

    • gt_box (Variable)- 真实框(bbox),具有形状[Ng,4]的2D LoDTensor,Ng是mini-batch输入的真实框(bbox)的总数,4是坐标的维数,布局是[xmin,ymin,xmax,ymax],xmin,ymin代表box左上坐标,xmax,ymax代表box右下坐标,数据类型为float32或float64。

    • gt_label (Variable)- ground-truth标签, 具有形状[Ng,1]的2D LoDTensor,Ng是mini-batch输入的真实框(bbox)的总数,1表示类别号,数据类型为float32或float64。

    • background_label (int)- background标签的索引,默认为0。

    • overlap_threshold (float)- 额外匹配的bbox阈值,当找到匹配的框,如果 match_type 为’per_prediction’,使用 确定额外匹配的bbox。默认为0.5。

    • neg_pos_ratio (float)- 负框与正框的比率,仅在 mining_type 为’max_negative’时使用,默认为3.0。

    • loc_loss_weight (float)- 回归损失的权重,默认为1.0。

    • conf_loss_weight (float)- 置信度损失的权重,默认为1.0。

    • match_type (str)- 训练期间匹配方法的类型应为’bipartite’或’per_prediction’,默认为’per_prediction’。

    • mining_type (str)- 难样本挖掘类型,分为’hard_example’或’max_negative’,目前只支持’max_negative’。

    • sample_size (int)- 负样本框的最大样本大小,仅在 为’hard_example’时使用。

    返回: Variable(Tensor) 定位损失和置信度损失的加权和, 具有形状[N * Np,1], N是batch大小,Np是每个实例的预测总数,数据类型为float32或float64。

    代码示例