图像检测

    图像检测中的一些通用操作,是对检测框的一系列操作,其中包括:

    • 对检测框的编码,解码(box_coder):实现两种框之间编码和解码的转换。例如训练阶段对先验框和真实框进行编码得到训练目标值。API Reference 请参考 box_coder
    • 比较两个检测框并进行匹配:
      • bipartite_match:通过贪心二分匹配算法得到每一列中距离最大的一行。API Reference 请参考
    • 根据检测框和标签得到分类和回归目标值(target_assign):通过匹配索引和非匹配索引得到目标值和对应权重。API Reference 请参考 target_assign
    • rpn_target_assign:通过anchor和真实框为anchor分配RPN网络的分类和回归目标值。API Reference 请参考
    • anchor_generator:为每个位置生成一系列anchor。API Reference 请参考 anchor_generator
    • generate_proposal_labels: 通过generate_proposals得到的候选框和真实框得到RCNN部分的分类和回归的目标值。API Reference 请参考
    • generate_proposals: 对RPN网络输出box解码并筛选得到新的候选框。API Reference 请参考 generate_proposals

    全称Single Shot MultiBox Detector,是目标检测领域较新且效果较好的检测算法之一,具有检测速度快且检测精度高的特点。与两阶段的检测方法不同,单阶段目标检测并不进行区域推荐,而是直接从特征图回归出目标的边界框和分类概率。SSD网络对六个尺度特>征图计算损失,进行预测,需要如下五种特有api:

    • multi_box_head :得到不同prior box的位置和置信度。API Reference 请参考 multi_box_head
    • detection_output:对prioir box解码,通过多分类NMS得到检测结果。API Reference 请参考
    • ssd_loss:通过位置偏移预测值,置信度,检测框位置和真实框位置和标签计算损失。API Reference 请参考 ssd_loss
    • detection map: 利用mAP评估SSD网络模型。API Reference 请参考
    • roi_perspective_transform:对输入roi做透视变换。API Reference 请参考 roi_perspective_transform
    • polygon_box_transform:对不规则检测框进行坐标变换。API Reference 请参考