近日,在全球权威的自动驾驶nuScenes竞赛最新评测中,浪潮信息算法团队所提交的“IEI-BEVFusion++”算法模型在关键性指标nuScenes Detection Score(NDS)得到77.6%的高分,创造了3D目标检测全赛道迄今最高成绩。继去年以“DABNet4D”登顶纯视觉3D目标检测榜单后,该算法团队在面向融合感知自动驾驶领域再一次实现突破。
nuScenes数据集是目前自动驾驶领域中最流行的公开数据集之一,数据采集自波士顿和新加坡的实际自动驾驶场景,是第一个集成摄像头、激光雷达和毫米波雷达等多种传感器,实现360度全传感器覆盖的数据集。nuScenes数据集提供了二维、三维物体标注、点云分割、高精地图等丰富的标注信息,包含1000个场景,拥有140万帧图像、39万帧激光雷达点云数据、23个物体类别、140万个三维标注框,其数据标注量比KITTI数据集高出7倍以上。
(资料图片仅供参考)
犹如人类的眼睛为大脑提供了70%以上的信息,在自动驾驶领域,作为感知系统的主流模式架构,Lidar与Camera融合的3D多模态架构则为实现高鲁棒、高精度的3D目标检测提供了至关重要的信息输入,为业内提供更具通识性的解决方案。此次创nuScenes榜单成绩新高的“IEI-BEVFusion++”算法模型正是应用了3D多模态融合架构的思路,将Lidar与Camera形成有效的交互融合。
●Lidar与Camera的多模态交互融合,面临巨大挑战
3D目标检测作为自动驾驶至关重要的核心任务,面向强大的环境感知,自动驾驶车辆通过广泛车载传感器的信息输入,实现精准的目标检测。以Lidar为例,它可以有效精准地捕捉空间信息,点云数据所具备的天然3D优势,最大程度地提升了检测目标的测距精度、速度及方向;而Camera的优势则在于,它具备丰富的纹理信息,强大的语义及图像上下文理解能力使得它可以有效地识别行人、交通指示牌等具象化的路面信息。因此,Lidar与Camera融合的3D多模态架构将深度信息与纹理信息形成有效的交互融合,为更精准的3D目标检测提供了一种全新思路。
然而,将两种截然不同的模态几何和语义特征在一个表示空间内相结合,这是一个巨大的挑战。 一方面,预估检测目标的深度信息是提升3D目标检测精度的关键,现有模态的融合通常关注于点云雷达及Camera虚拟点间的交互,但由于点云雷达远比Camera数据稀疏得多,传统的融合方式无法解决固有模态间的深度信息差距。另一方面,在跨模态的融合交互中,点云雷达涉及体素的精细划分及大量的3D卷积计算,图像则由于多摄像头、高分辨率,复杂的特征提取网络,两者计算复杂且耗时长。因此,不同形态的数据整合也为多模态融合模型的训练速度和检测精度带来了新一层算力压力。
●NDS 77.6%,多模态融合模型“IEI-BEVFusion++”刷新全赛道记录
IEI-BEVFusion++多模态融合模型,通过更有效的多模态训练架构、更精细的特征提取网络、更强大的数据预处理能力,实现Lidar与Camera的高效特征提取与融合优化。激光雷达点云特征为Camera数据提供检测目标的精确3D信息,Camera发挥其纹理轮廓及语义理解优势,进一步精细化点云区域特征,形成Liar与Camera的数据最大化互补,大幅优化了模型的检测精度。
基于Lidar与Camera的多模态融合模型架构,实现了三大核心技术突破:
-IEI-BEVFusion++多模态融合模型架构图-
a)首先,基于更有效的多模态训练架构,使得mAP(全类平均正确率,mean Average Precision)平均提升2%+
Transformer的多模态数据融合架构,通过引入基于Camera数据的BEV检测头,辅助融合模型训练,在不增加过多计算量的同时,进一步增强语义信息特征,使得mAP(全类平均正确率,mean Average Precision)平均提升2%+。
b)其次,精细的特征提取网络,大幅提升目标的3D检测能力
一方面,采用多尺度Lidar的特征融合技术,进一步增强其特征提取的感受野,提升其对于检测目标,尤其是大目标的表征能力;另一方面,Lidar信息可直接辅助优化Camera的深度预测,采取级联深度辅助策略,大幅提升图像的3D检测能力。
c)同时,强大的数据预处理能力,实现模型精度与训练速度双突破
创新设计Lidar与Camera同步贴图,替代了业内传统的cbgs(类平衡分组和采样)技术。一方面增强了样本的均衡性与多样性,另一方面保证了不同模态间的数据协调、同步,在提升目标定位检测精度的同时,保障目标速度、方位、缩放等相关指标的提升,训练速度更是较业内基准提升了4.5倍。
基于BEV融合算法的创新,“IEI-BEVFusion++”算法模型成功登顶3D目标检测任务(nuScenes detection task)全赛道榜单,将关键性指标NDS提升至77.6%。未来,浪潮信息算法团队将践行多角度切入,发挥算法、算力融合的全栈解决方案能力,推动自动驾驶领域的技术创新发展。
备注:文内所涉术语解释如下
1)BEV:Bird’s Eye View,是指将特征信息转化至鸟瞰视角
2)多模态融合:也称多源信息融合或多传感器融合,是指综合两个或多个模态的信息进行预测的过程
3)鲁棒(Robust):是指系统在一定的参数摄动下,维持其它某些性能的特性
标签:
精彩推荐
近日,在全球权威的自动驾驶nuScenes竞赛最新评测中,浪潮信息算法团队所提交的“IEI-BEVFusion++”算法模型
今年,佢再度回归,“金句永动机”功力,不减从前。不过在最新一期节目中,比起金句更引人注意嘅,係王...
人民网北京4月26日电(记者王连香)记者从中国铁路北京局集团有限公司(以下简称中国铁路北京局)获悉,...
云铝股份4月25日公布2023年一季度报告,报告期营业收入94 43亿元,同比下降13 35%;归属于上市公司股东的净
为了架起家校沟通桥梁,培养学生良好品德、优良习惯、过硬本领和健康人格,提高学生综合素养,4月20日—21
4月以来,一股极端热浪席卷了东南亚,多个国家气温突破40℃,接连刷新了历史同期最高气温纪录。以泰国为例
近日,位于成都成华区的两兄弟住宅项目,信和御龙山一二期(以下视为一个整体,简称“御龙山”)与华侨...
1、因为他在家排行老小又因为他和我们比年龄算长辈了所以叫小哥噻刘德华叫华仔周润发叫发哥周杰伦叫周董周
易瑞生物公布2023年一季度报告报告期营业收入607076万元同比下降7935归属于上市公司股东的净利润为280611万
中国石油网消息(记者许萍萍)4月22日,记者获悉,辽河石化公司西蒸馏装置所有机泵冷却水实现零排放。经测
原标题:美元指数25日显著上涨美元指数25日显著上升。衡量美元对六种主要货币的美元指数当天上涨0 51%,在
1、首先要打开手机设置,然后再点击通知管理。2、2、然后再点击通知显示设置。3、3、然后再点击控制中心与
写作猫ai写作免费字数多少1、60万字。据知乎查询秘塔写作猫免费ai每月60万字。秘塔写作猫是一款简约,操作
特一药业集团股份有限公司2022年度独立董事述职报告(曹艳铭)各位股东及股东代表:本人作为特一药业集团股
在高并发的情况下,数据库的并发控制是非常重要的。如果多个线程同时对同一数据进行读写操作,就可能出现数
1、上海维情网络科技有限公司是维情国际连锁集团全资子公司,成立于2009年12月,是继上海维情商务咨询有限
1、谜底:棚。2、解释:取楼的“木”,加上两个“月”字,即“棚”字。3、一、棚的释义遮蔽太阳或风雨的...
今天来聊聊关于黑羊计划2,黑羊计划的文章,现在就为大家来简单介绍下黑羊计划2,黑羊计划,希望对各位小伙
就在他们爱得浓烈的时候,路飞掰开了他们,留下一脸懵逼的两人。这瞬间很霸气有木有,敢这么推开索隆和香吉
财联社4月25日讯(记者黎旅嘉)蔡嵩松以其极致的投资风格,要么几乎垫底,要么领跑市场。一季报显示,
资讯News
08-07
07-08
11-03
11-03
11-03
11-03
11-03
11-03
11-03
11-03
11-03
11-03
聚焦Policy
当好农民工的“护薪人” 近日,罗某等7名农民工在收到被拖欠的工资后,纷纷打电话向江西省南昌市...
“通讯录里所有人都知道我欠钱了” □ 本报记者 韩丹东 □ 本报见习记者 张守坤 ...
大连宝马车撞人案肇事司机被判死刑 本报讯 记者韩宇 10月29日,辽宁省大连市中级人民法院一审...
医院财务迷上网络赌博输光5000万元公款 □ 本报记者 马维博 □ 本报通讯员 汪宇堂 曹...
辊环车削 雕琢毫厘(工匠绝活) 【绝活看点】 23年来,雷虎始终扎根一线,改进钢材轧制工艺...
交警严查超标电动自行车挪用“白牌” 截至昨晚6时,处罚电动自行车违法行为共计6585笔;下一步将...
明起寒潮来袭 北方气温普降10℃以上 中央气象台预计,本周日北京平原地区最低气温降至-4℃左右...
多种蔬菜价格降幅达五成 包括菠菜、蒿子秆等 预计本月中旬蔬菜恢复供需平衡 本报讯(记者...
北京周日最低气温或达-4℃ 本报讯(记者 赵婷婷)北京青年报记者昨天从中央气象台获悉,新一股...
昌平一家四口确诊新冠肺炎 天通北苑第二社区升级为中风险地区 朝阳两涉疫校区及16所学校停课 ...