美文网首页
MSCOCO目标尺度分布的统计工具

MSCOCO目标尺度分布的统计工具

作者: Yah_da | 来源:发表于2022-03-15 21:50 被阅读0次

取对数可缓解左峰、右峰等偏移现象。优化:对x轴取log2(scale).

统计MSCOCO数据集中所有images的尺度分布(每张图的尺度:图里所有目标尺度的中位数),并等分为4个区间。



$log2(scale).$

步骤

1、json标注文件的加载

import json
import os
import numpy as np

data_root='coco/'
ann_file=data_root + "resize/annotations/instances_train2017_100x167.json"
jd=json.load(open(ann_file))

2、尺度的计算

def distribution_main(jd, num_part, mode="instance", func=np.mean, times=4):
    def get_instance_scales(jd):
        bbox_list=[]
        for ann in jd['annotations']:
            bbox_list.append(ann['bbox'])  # [x1,y1,w,h]

        bboxes=np.array(bbox_list)
        scales=np.sqrt(bboxes[:,2]*bboxes[:,3])
        scales.sort()
        return scales
    
    def get_image_scales(jd, num_part, func):
        image_scales_list =[[] for i in jd['images']]
        iid_ind, cnt={}, 0
        for ann in jd['annotations']:
            iid=ann['image_id']
            if iid not in iid_ind:
                iid_ind[iid]=cnt
                cnt+=1
            area=np.sqrt(ann['bbox'][2]*ann['bbox'][3])
            image_scales_list[iid_ind[iid]].append(area)
        scales=np.array([func(np.array(scas)) for scas in image_scales_list if scas])
        scales.sort()
        return scales
    
    def separate_vals(scales: np.array, num_part: int) -> (np.array,np.array):
        num_bbox=scales.shape[0]
        intervals=round(num_bbox/num_part)
        separate_inds=[i for i in range(0,num_bbox,intervals)]
        if scales[separate_inds[-1]]!=scales[-1]:
            separate_inds.append(-1)
        return separate_inds, scales[separate_inds]

    assert mode in ["instance", "image"]
    scales=get_image_scales(jd, num_part, func) if mode=="image" else get_instance_scales(jd)
    separate_inds, separate_scale=separate_vals(scales, num_part) #3
    print(f"划分{num_part}的实例大小为{separate_scale*times}")
    return scales, separate_scale

scales, sca = distribution_main(jd, num_part=4, mode="image", func=np.max)
  • API样例:
    统计所有annotations的分布,并等分为4个区间:
    distribution_main(jd, num_part=4)
    统计所有images的分布(图的尺度:图里目标尺度的中位数),并等分为3个区间:
    distribution_main(jd, num_part=3, mode="image", func=np.max)

3、直方图可视化

import matplotlib.pyplot as plt

def show_distribution(bbox_scales, separate_scale, times=4):
    plt.figure(dpi=200)
    plt.hist(bbox_scales*times, bins=50,alpha = 0.6, label='scales')
    parts=len(separate_scale)-1
    for i in range(0, parts+1): ### edit here
        plt.axvline(x=separate_scale[i]*times, color='orange',)

    plt.savefig(f"coco_scale_max_{parts}.png",dpi=200, bbox_inches='tight')

show_distribution(scales, sca)

相关文章

  • MSCOCO目标尺度分布的统计工具

    取对数可缓解左峰、右峰等偏移现象。优化:对x轴取 统计MSCOCO数据集中所有images的尺度分布(每张图的尺度...

  • 快速下载coco数据集

    MSCOCO数据集较大,可以使用Google gsutil工具搭配命令行下载 train2017:http://i...

  • 统计学基本知识笔记一

    基本术语 总体,样本,变量,参数,统计量,变量尺度,误差(随机误差,系统误差,过失误差),精确度 分布 随机变量

  • 统计学

    伯努利分布 伯努利分布,即是0,1分布,最简单的二项分布 z统计量和t统计量 使用z统计量的数据符合正态分布,当样...

  • 数据探索之统计分布

    本文用Python统计模拟的方法,介绍四种常用的统计分布,包括离散分布:二项分布和泊松分布,以及连续分布:指数分布...

  • 刘嘉《概率论》15

    4.4幂律分布 幂律分布的数学特征是:无标度——在任何观测尺度下,幂律分布都呈现同样的分布特征。 幂律分布的含义—...

  • 统计学学习-1

    看了几篇统计学资料:恍然间不知道概率分布[二项分布] 与抽样分布[t 分布] 差别。 大家知道,统计学分为描...

  • 2018-10-15

    第一节 分布 统计表 统计图 # 一、分布 ## 分布(频次分布)概念:一个概念或变量,它的各个情况出现的次数或频...

  • iOS App使用分析

    1. 分析点 版本分布 启动频次 活跃用户、用户留存 用户行为统计 Crash收集 2. 可使用的工具 App a...

  • WGCNA 挑选软阈值

    我们今天就搞清楚这两个问题:1.什么是无尺度分布2.手工计算软阈值 无尺度分布 假如我问大家,如果你想认识世界上的...

网友评论

      本文标题:MSCOCO目标尺度分布的统计工具

      本文链接:https://www.haomeiwen.com/subject/wntudrtx.html