[高速导航原声视频]250,000辆汽车–用于机器学习的十大免费车辆图像和视频数据集
译者 | Limarc Ambalina
作者 | lionbridge.ai
撰稿 | 标识符医师工程项目组
随著Tesla自动驾车电动汽车的蓬勃发展以及GoogleWaymo等工程项目的蓬勃发展,自动驾车电动汽车业或许每月都在增长。超高速路电动汽车是计算机系统听觉的一个重要应用领域,具备为数众多插件,因此具备非常大的买进发展潜力。
与大部份计算机系统听觉演算法一样,自动驾车电动汽车需要装备精良的影像统计数据。一般来说极难赢得大批的高工作效率影像或找出信誉度较好的影像注解服务工程项目。全自动注解数以千计张影像更为十分困难,有时候工作效率低落。
在这儿可以找出完全免费影像和音频统计数据集为进行自动驾车电动汽车合作开发?
下列是10个对外开放影像和音频统计数据集的条目,那些统计数据集适于在自动驾车电动汽车研究和合作开发中采用。上面的统计数据集包涵超过250,000张影像和恒定音频帧,其中一些已经被注解。
1. BIT工程车统计数据集 –源自上海智能化科技生物医学的统计数据集包涵9,850幅工程车影像。那些影像按工程车类别分成下列五类:公共电动汽车,较大型铁路车辆,维奈县,小车,SUV和摩托车。
http://iitlab.bit.edu.cn/mcislab/vehicledb/
2. 卫星城自然景观影像对-采用从瑞典驾车的工程车摄制的城市交通音频,该统计数据集包括2,975个影像对。每一原则上的影像文件的右侧都有原初的恒定帧,而右侧在语法结构已拆分了完全相同的帧。
http://www.kaggle.com/dansbecker/cityscapes-image-pairs
源自卫星城自然景观影像对统计数据集的样品影像
3. GTI工程车影像统计数据库 –此统计数据集包括3,425个道路上工程车的后角影像,以及3,900个没有工程车的道路影像。
http://www.gti.ssr.upm.es/data/Vehicle_database.html
4. 带边界框的KITTI对象检测 –取自卡尔斯鲁厄技术学院的基准套件,该统计数据集由该套件的对象检测部分中的影像组成。该影像统计数据集包括超过14,000张影像,那些影像由7,518张测试影像和7,481张训练影像组成,并在原则上的文件中带有边界框标签。
http://www.kaggle.com/twaldo/kitti-object-detection
源自KITTI对象检测统计数据集的样品影像
5. LISA红绿灯统计数据集 –尽管此统计数据集不专注于工程车,但它仍然是用作训练自动工程车演算法的非常有用的影像统计数据集。LISA城市交通信号灯统计数据集包括夜间和白天的音频,总计43,0007帧,其中包括带注解的113,888个城市交通信号灯。该统计数据集的重点是城市交通信号灯。但是,几乎大部份车架中都装有城市交通信号灯和工程车。
http://www.kaggle.com/mbornoe/lisa-traffic-light-dataset
6. 尼泊尔工程车-由加德满都街头摄制的总共30部城市交通音频组成,该统计数据集包涵从那些音频中裁剪的4,800辆工程车的影像。在4800张影像中,有1811张为两轮车,而2989张为四轮车。
http://github.com/sdevkota007/vehicles-nepal-dataset
7. 雨雪城市交通监控 –该统计数据集由22个音频组成,每一音频约5分钟。采用RGB彩色相机和红外热像仪捕获音频。因此,统计数据包括超过130,000个RGB热影像对。
http://www.kaggle.com/aalborguniversity/aau-rainsnow
8. 斯坦福电动汽车统计数据集 –源自斯坦福大学AI生物医学的统计数据集包涵196种不同类别电动汽车的16,185张影像。
http://ai.stanford.edu/~jkrause/cars/car_dataset.html
9. 自动驾车电动汽车的语义拆分 –作为Lyft Udacity Challenge的一部分创建,此统计数据集包涵5,000张影像和相应的语义拆分标签。
http://www.kaggle.com/kumaresanmanickavelu/lyft-udacity-challengedataB.tar.gz
10. TME高速路公路统计数据集 –由28个音频片段组成,总计27分钟的音频,该统计数据集包括30,000多个带有工程车注解的帧。
http://cmp.felk.cvut.cz/data/motorway/