美文网首页
Task 1赛题理解

Task 1赛题理解

作者: 专注挖坑的汪 | 来源:发表于2020-05-18 19:56 被阅读0次

来源Task1

首先是目标

  • 理解赛题背景
    很好理解,就是在一张图中找数字,虽然网站上说找字符,但是从007569.png 对应的label为7和5看出应该是找数字
  • 理解赛题数据
    mchar_train.json 对应mchar_train 文件夹中的图片
    代码中 train_json = json.load(open('C:\mydata\mchar_train.json'))
    读出来的train_json是一个字典,键值为height, label, left, top, width


    json和图片的关系

    label就是表示这张图片中有哪些数字
    需要用矩形来截出图片中的数字
    height width 所需要的矩形的高和宽
    left和top 是矩形的左上角相对于图片左上角的位置


    这个图已经解释的很清楚了
  • 数据下载
    在这个网站里面下载csv文件
    csv文件里面有数据的链接地址 直接用迅雷下就可以了
  • 理解赛题的思路
    题目是要识别图片里面的数字,数字的个数不是固定的,主办方提供的三种思路,1是将所有数字个数看成是定长的,不足的用X来填充, 2是用特定的方法来识别 比如CRNN字符识别模型, 3是先对数字的位置进行识别 然后利用物体检测来进行检测

示例代码分析

代码
parse_json 就是将train_json这个dict中的值 转变成整型的np.array 其shape是5*n, n为图片中数字的个数
plt.subplot(1, arr.shape[1] + 1, 1) 是画1行n + 1的图, 第一列是原图片,剩下的是每个数字的截取图
关于plt.xticks([]) 和 plt.yticks([]) 作用在于把下图周围的数字的消灭掉
不使用plt.xticks
底下的for循环就是根据train_json中的left top height width来截取图片中的每个数字
arr[0, idx]:arr[0, idx] + arr[1, idx]就是top 到 top + height
arr[2, idx]:arr[2, idx] + arr[3, idx]就是left 到 left + width
plt.title就是显示的label

相关文章

  • NLP之新闻文本分类-Task1

    Task1 赛题理解 本章将会对新闻文本分类进行赛题讲解,对赛题数据进行说明,并给出解题思路。 赛题理解 赛题名称...

  • cv街景门牌字符的赛题理解

    Datawhale 零基础入门CV赛事-Task1 赛题理解 1 赛题理解 赛题名称:零基础入门CV之街道字符识别...

  • Task 1赛题理解

    来源Task1 首先是目标 理解赛题背景很好理解,就是在一张图中找数字,虽然网站上说找字符,但是从007569.p...

  • DataWhale金融风控入门 Task 1 赛题理解

    Task 1 赛题理解 比赛地址:https://tianchi.aliyun.com/competition/e...

  • DataWhale金融风控打卡记录

    Task01 1.学习目标 1.1理解赛题数据和目标,清楚评分体系。 1.1.1赛题介绍 该赛题以金融风控中的个人...

  • Task1-赛题理解

    参加datawhale 的活动,算是一种督促,也欢迎大家一起加入进行学习。比赛链接如下[https://tianc...

  • Task1 赛题理解

    1. 理解赛题背景 零基础入门系列赛事第二场 :零基础入门CV赛事之街景字符识别 典型计算机视觉识别:预测真实场景...

  • task1-赛题理解

    目标:利用公开数据集SVHN,训练模型,来预测街道字符编码,这是个分类问题。 数据集描述:训练集包括3W张图片,验...

  • nlp学习笔记-task1

    Task1 赛题理解 目的: 对新闻内容进行分类, 共有14个文本标签, 分别是财经、彩票、房产、股票、家居、教育...

  • 贷款违约预测-Task1 赛题理解

    Task1 赛题理解 Tip:本次新人赛是Datawhale与天池联合发起的0基础入门系列赛事第四场 —— 零基础...

网友评论

      本文标题:Task 1赛题理解

      本文链接:https://www.haomeiwen.com/subject/zbfpohtx.html