我要投搞

标签云

收藏小站

爱尚经典语录、名言、句子、散文、日志、唯美图片

当前位置:彩63彩票注册 > 多对象 >

Google图片数据集发布最新 V3 版涵盖600个对象类的标记边框

归档日期:05-25       文本归类:多对象      文章编辑:爱尚语录

  AI科技评论消息,日前,谷歌发布 Open Images Dataset (开发图片数据集)的 V3 版,比起今年7月份发布的 V2 版,这一最新版本的边框(bounding box)数和图像层级标签(image-level label)数都大大增加。

  Open Images Dataset 包含900万张图片 URL,里面的图片都已经被标记,带有标签和边框,横跨成千上万个类。大家现在可以点击进行下载。

  该数据集包括一个训练集(9,011,219张图像)、一个验证集(41,620张图像)和一个测试集(125,436张图像)。在 V2 版本中, V1 版本的验证集被分割成验证集和测试集,这是为了更易于评估。图像的标签和边框描述如下:

  下表是不同数据集中图像层级标签的概况,可以通过类似于 Google Cloud Vision API 的计算机视觉模型自动生成所有图片的图像层级标签。

  验证集和测试集中的所有图像,以及训练集中的一部分图像都带有经过人工验证的图像层级标签。大部分的人工验证都已经在谷歌内部手工完成了,另外一小部分是通过在Image Labeler(imagelabeler)上进行众包验证来完成的。这种人工验证虽然可以消除掉错误信息,但却不能发现漏报情况,所以图像中可能会缺失某些标签。产生样本的模型不只是上面提到的自动生成标签的模型,还覆盖其他很多计算机视觉模型,所以类的数量大大增加了。

  在数据集中,共有19,995个带有图像层级标签的不同的类,其中19,693个类中至少有一个经过人类验证的标签,7870个类中带有机器生成的标签。

  下表是在所有数据集中边框标记的概况,其中包括600个对象类。这个数量远远大于在 ILSVRC 和 COCO 挑战赛中涵盖的类,另外还增加了诸如 fedora 帽和雪人等新的对象。

  Google 为验证集和测试集中的所有对象实例提供完整的边界框注释,这些都是在公司内部通过手工标记的。此外,他们还尽可能地尝试在语义层次(semantic hierarchy)上将边框标记得足够具体。

  例如,汽车有两辆,一辆是儿童豪华轿车,一辆是货车。豪华轿车(limousine)和货车(van)被标记为limousine和van,而所有其他类型的汽车(car)被标记为汽车(car)。

  此外,注解者还为每个边框标记了一组属性,例如指示对象是否被遮挡。验证集和测试集中的每个图像平均大约有5个边框。

  在训练集、验证集和测试集中的每个子集中都会有这样的文件。这里面包含图片URL、OpenImage ID、标题、作者和许可信息:

  每个图片中都有一个惟一的64位指定 ID,在 CSV 文件中,它们显示成十六进制整数(用零填充),例如000060e3121c7305。

本文链接:http://art-olivier.com/duoduixiang/345.html