AI科技大本营出品(ID:rgznai)
作者
费棋
近日,ApolloScape宣布开放了大规模自动驾驶数据集。
它是Apollo自动驾驶项目的一个研究型项目,旨在促进自动驾驶的各方面创新,号称是世界上最大自主驾驶技术开源数据集。
根据ApolloScape官方介绍,它开放了对像素级标注的场景解析数据集和仿真工具的访问,并将定期添加新的数据集和新功能。
▌场景解析数据集
场景解析是自动驾驶的核心能力,他们通过高精度车载传感器采集并标注了大量道路场景。ApolloScape发布的整个数据集包含数十万帧逐像素语义分割标注的高分辨率图像数据和与其对应的逐像素语义标注、稠密点云、立体图像、立体全景图像。为便于研究人员更好利用数据集的价值,他们在数据集中定义了共26个不同语义项的数据实例(例如汽车、自行车、行人、建筑、路灯等),而且并将进一步涵盖更复杂的环境、天气和交通状况等。截止目前,他们的数据集公开可以下载的数据量有4个。
在传感器与数据采集方面,他们采用的装备有RIEGLVMX-1HA移动测绘系统的中尺寸多功能越野车进行数据采集。该系统包括两个LiDAR传感器(每秒条扫描线,覆盖米内的度视角),一部分INS/GNSS单元以及两个前向相机(VMX-CS6,x)。数据的采集频率为每米一张图像。
车载传感器采集车
数据概括
预计「场景解析」数据集将提供20万张附有对应的语义标注与深度信息的图像数据(截止到年3月8日,提供了+张图像),将分为训练集,验证集和测试集三部分,并提供文件列表。训练集和验证集用于设计算法和训练模型,包括图像和相对应的语义标注与深度信息。测试集的语义标注图像将用于内部测试,不提供下载。
RGB图像总数:
深度图像总数:
类别标注总数:25
车道线标注总数:28
图像分辨率:x
GPS轨迹:有
相机内部和外部参数:有
两帧图像之间的距离:1米
数据集示例
点云示例
深度图
数据集结构
数据集文件夹结构如下:
{root}/{type}/{roadid}_{level}/{recordid}/{cameraid}/{timestamp}_{cameraid}{ext}
root:用户定义的根文件夹type:当前版本中有三种数据类型,即ColorImage,Label和Pose。roadid:道路ID,例如road,road。level:seg表示标签仅包含像素级别标签,ins表示标签包含像素级别和实例级别标签。recordid:记录是例如Record,Record。每个记录包含多达几千个图像。cameraid:采集系统所使用的两个前置相机,即相机5和相机6。timestamp:图像名称的第一部分。cameraid:图像名称的第二部分。ext:文件的扩展名。彩色图像为.jpg,标签图像为_bin.png,实例级标签的多边形列表为.json,实例级标签为_instanceIds.png。每个相机和每个记录只有一个姿态文件(即pose.txt)。该姿态文件包含相应摄像机和记录的所有图像的所有外部参数。姿势文件中每行的格式如下所示:
r00r01r02t0r10r11r12t1r20r21r22t20image_name
相机已经很好地经过了校准。相机的内在参数是:
Camera5:
fx=.
fy=.
Cx=.
Cy=.
Camera6:
fx=.
fy=.
Cx=.
Cy=.91799715
▌智能仿真工具
环境模拟用于自动驾驶在汽车和计算机行业引起了很多