碾压谷歌、斯坦福大学!CVPR最佳论文颁给中国自动驾驶大模型:近10年首例! 当前独家
时间:2023-06-22 11:11:43来源:快科技

这个高光时刻,属于自动驾驶,属于大模型,更是属于中国团队


(资料图片)

就在刚刚,CVPR 2023最佳论文新鲜出炉,2篇论文从总量高达9155篇的投稿中脱颖而出。

对于这2篇最佳论文中的任何一个,可以说用“万里挑一”来形容都不足为过了。

第一篇名为Planning-oriented Autonomous Driving(以路径规划为导向的自动驾驶),由上海人工智能实验室、武汉大学及商汤科技联合完成。

据了解,这是近十年来,计算机视觉三大顶级国际会议(CVPR、ICCV、ECCV)上,第一篇以中国学术机构作为第一单位的最佳论文。

第二篇名为Visual Programming: Compositional visual reasoning without training(视觉编程:未经训练的组合视觉推理),由艾伦人工智能研究所发表。

而在最佳论文的“候选名单”中,不乏谷歌、斯坦福大学、康奈尔大学等在内的顶尖企业和高校。

竞争之激烈,可见一斑。

那么这两篇为何能在众多论文中成为佼佼者,我们继续往下看。

首次提出感知决策一体的自动驾驶通用大模型

自动驾驶历来被人们称为集AI技术之大成者。

一般在自动驾驶任务中,通常包含三大模块,分别是感知、预测和规划,不过主流方案通常是分开来处理具体任务。

由此导致的缺陷也是比较明显,要么是任务之间协调不足,要么是影响到了整体性能的提升。

基于这样的一个背景,这篇论文便首次提出了感知决策一体化的自动驾驶通用大模型——UniAD

UniAD是一个综合框架,将全栈驾驶任务整合到一个基于Transformer的端到端网络中。

除了我们刚才提到的三个主任务之外,还包括六个子任务,包括目标检测、目标跟踪、场景建图、轨迹预测、栅格预测和路径规划。

那么如此“大一统”的方式之下,结果又如何?

根据论文显示,在nuScenes真实场景数据集中,UniAD的所有任务均达到SOTA!

具体“实战”效果如下:

在面对采访时,上海人工智能实验室青年科学家李弘扬介绍:

凭借其充分的可解释性、安全性、与多模块的可持续迭代性,UniAD是目前为止最具希望实际部署的端到端模型。

值得一提的是,除了这篇最佳论文之外,上海人工智能实验室和商汤科技在本届CVPR中均取得了不凡的表现。

两个单位还联合斩获了一篇最佳论文候选,共计54篇论文被接收。

通过编写代码解决计算机视觉任务的AI

在第二篇论文中,研究人员提出了VISPROG,是一种神经符号结合(Neuro-Symbolic)的方法,用于在给定自然语言指令的情况下解决复杂和组合的视觉任务。

VISPROG无需对任何特定任务进行专门训练。

相反,它利用大语言模型的上下文学习能力,生成类似Python代码的模块化程序,然后执行这些程序来获得解决方案和全面且可解释的理由。

生成的程序的每一行可能会调用多个现成的计算机视觉模型、图像处理程序或Python函数,来生成可能被程序的后续部分使用的中间输出。

研究人员在四个不同的任务上展示了VISPROG的灵活性,包括组合视觉问答、对图像对进行零样本推理、事实知识对象标签和以语言引导的图像编辑。

研究人员表示:

像VISPROG这样的神经符号方法是令人兴奋的,它可以轻松有效地对AI系统做扩展,满足人们可能希望执行的复杂任务需求。

CVPR 2023其它奖项一览

除了2篇最佳论文之外,其它奖项也在刚刚的开幕式中逐一浮出水面。

最佳学生论文——

3D Registration with Maximal Cliques。

这篇论文的作者来自西北工业大学,提出了一种新的3D点云配准方法,能够获得最优的姿态假设。

最佳学生论文荣誉奖——

DreamBooth: Fine Tuning Text-to-lmage Diffusion Models for Subject-Driven Generation。

来自谷歌,可以基于少量的图片,利用text-to-image模型将其转换到不同场景中,并且保持高分辨率。

这篇论文的方法已在AI绘画社区被广泛使用。

除此之外,大会还颁发了PAMITC奖,包括Longuet-Higgins奖、年轻研究者奖以及Thomas Huang纪念奖。

Longuet-Higgins奖——

年轻研究者奖——

Thomas Huang纪念奖——

关于本届最佳论文更细致的内容,可戳下方链接查看详情:

两篇最佳论文地址:[1]https://arxiv.org/abs/2212.10156[2]https://arxiv.org/abs/2211.11559

参考链接:

[1]https://twitter.com/cvpr/status/1671545306838626306?s=46&t=iTysI4vQLQqCNJjSmBODPw

[2]https://mp.weixin.qq.com/s/8svV4yxRi6TikcRivgHr_A

[3]https://finance.eastmoney.com/a/202306212759316444.html

[4]https://github.com/OpenDriveLab/UniAD

[5]https://blog.allenai.org/visual-programming-ca58c7af51cd

标签:

  • 上一篇文章: 李斌食言,降价搏未来
  • 下一篇文章: 最后一页
  • 生活指南
  • 商洛市商州区北宽坪镇端午节前夕慰问镇敬老院真情温暖老人心 世界微速讯

    艾叶飘香,粽香传情。为弘扬中华民族传统文化,进一步营造敬老、亲老、

  • 宝宝树:2023年年轻家庭『理想生活家』洞察报告

    随着新生代用户消费水平的日益提升,其对于家庭生活品质的追求也越来越

  • [快讯]姚记科技:关于公司董事减持股份计划的预披露-天天热推荐

    CFi CN讯:二、本次减持计划的主要内容1.减持目的:个人资金需求。2.

  • 天天微动态丨最美端午节来了!汉服爱好者用Vidda投影玩了一场梦幻光影秀

    端午是最具特色的传统节日之一,赛龙舟、吃粽子早就不新鲜了,怎么过一个

  • 焦点热讯:孙颖莎劲敌出炉!19岁韩国天才连夺2冠,国乒女单巴黎爆冷丢金?

    现在,孙颖莎将目标瞄准了巴黎奥运会,大家也希望孙颖莎在巴黎奥运会上

  • 养老金调整公布,钱数下降?_当前热议

    马上端午节即将来临了,一般来说端午节假期不会有调整方案公布的,如果

  • 全球快看点丨万泰生物股东李莎燕本次减持计划时间届满,仍持有0.7651%的公司股份

    2023年6月21日,万泰生物(603392 SH)公告,公司于2023年6月21日收到李

  • 郑商所发布关于发布花生、苹果业务细则修订案的公告

    每经AI快讯,6月21日,郑商所发布关于发布花生、苹果业务细则修订案的

  • 个人社保制卡进度查询官网_个人社保制卡进度查询

    1、登录南宁社保官方网站查询。2、在百度搜索输入“南宁社保”一定要确

  • 成都国色天乡水陆乐园端午节活动汇总2023-世界热消息

    成都国色天乡水陆乐园端午节活动汇总2023陆地乐园超多端午限定互动游戏

  • 斯泰兰蒂斯召回部分进口全新大切诺基4xe汽车

    据市场监管总局网站消息,日前,斯泰兰蒂斯(上海)汽车有限公司根据《

  • 今日精选:“不带孩子去迪士尼孩子会自卑”?明星夫妇直播带货言论引争议!媒体:槽点密集,傲慢无礼

    明星带货在近几年越来越常见。公众人物用自己的影响力为观众推荐优质商

  • 湖北汽车工业学院怎么样?湖北汽车工业学院在全国排名第几?

    湖北汽车工业学院怎么样?湖北汽车工业学院坐落于世界著名道教文化圣

  • 光大证券:美图公司(01357)发布7款视觉AIGC工具 应用端产品落地加速_每日信息

    智通财经APP获悉,光大证券发布研究报告称,6月19日,美图公司(01357)

  • 腾讯课堂怎么看回放? 腾讯课堂上课怎么录屏?

    腾讯课堂怎么看回放?首先打开手机腾讯课堂,进入后点击界面底部的课

  • 房产备案需要多久?房产备案需要交费吗?

    房产备案需要多久?1、如果是网签合同,就是签合同即时提交备案,一

  • 民生
    • 每日速看!活动预告 | 2023郑州非遗市集主场活动将在芝麻街举办

    • 云意电气(300304)6月21日主力资金净买入1136.45万元

    • 河南省4个区块链发展先导区和45个创新应用试点项目公布 | 名单

    • 视频|渌口区蓬源仙“雨中夕阳”似仙境_环球观天下