业务合作发布作品

    魔视智能CEO虞正华:L3是个伪命题

    首席智行官头像首席智行官头像
    首席智行官2023-11-03

    作者 / 曹锦

    在首席智行官与魔视智能科技(以下简称「魔视」)创始人兼CEO虞正华对话时,他刚从慕尼黑车展归来。和许多中国初创科技公司的的感受一样,在与德系车企洽谈的过程中,他发现海外品牌电动化、智能化的步调已经趋于一致,而且也同样将AI视作必要能力。

    这不仅令虞正华看到了更多空间与机遇,还再次确认了自己对发展路线的预判。

    从通用AI看自动驾驶

    在创立魔视之前,虞正华创业的方向是城市交通管理系统的AI应用。例如路侧的交通监管,电子警察等等。

    「这与车载算法有很多接近的地方,因为它也是以AI为基础,并用摄像头、雷达等传感器,识别路上的各种目标。」在当时的公司借壳上市后,也就是2015年,正值AI技术展示出以深度学习为代表的重要进展。此时,虞正华结合他对交通层面的认知,创办了魔视智能。

    「过去,我从交通管理的角度,看到了很多交通系统的问题,其中大多与人工介入的因素高度相关。所以自动驾驶技术的引入,我们认为可以极大地改变这种现状。」

    在他看来,无论是技术路径,还是商业模式,当时的自动驾驶都还存在很多选择空间。在这种种可能性中,虞正华认为「渐进式」的商业闭环更易走通,也更容易在量产过程中积累数据。

    但这不代表魔视完全放弃了L4级自动驾驶,因为除了对商业模式的考虑,虞正华还在持续观察AI技术的发展形势。

    「从2012年到2023年,AI技术每过几年就会有个惊喜。从最早的深度学习到新型网络架构,从Transformer的引入,继而到今年年初的大模型……如今,我们从通用AI的脉络,也看到了L4技术的良好基础。」

    虞正华表示,基于过去这几年的自动驾驶实践探索,以及通用AI的技术成果,自动驾驶技术路线已经趋于清晰。因此魔视也正在持续在相应路线上做深入研发,逐步向L4布局。

    海量数据带来更多可能

    「大模型不是随着GPT突然出现的东西,而是有所传承、持续演化的技术。」虞正华表示,以Transformer为基础的架构,已经证明了海量的数据确实能够「大力出奇迹」。

    虞正华认为,如今,在自然语言的命题下,大模型已经取得显著成果。而当多模态大模型进一步融入视觉、声音等元素后,自动驾驶也多了许多可能性。

    在过往经历中,虞正华在交通与人工智能相交叉的领域中,曾取得一些突破,他认为这也是有可能在自动驾驶界获得复制的。「虽然任务不一样,网络设计也有较大差别,但是原理上还是有很多共通的地方。」

    他表示,在感知相关的功能上,工业界也都在引入类似Transformer的架构,因为各类大模型的基础网络架构,在原理上是一致的。

    而在自动驾驶界,随着越来越多的智能车辆实现量产,产生的数据越来越多,也会形成更多的数据闭环。

    「过去,我们只是做了感知算法这部分。但现在业界普遍认为,AI算法已成为自动驾驶算法的核心基础。现在,已经完全可以有一个模型来覆盖从感知到融合的所有部分,未来可能还会涵盖路径规划,也就是大家所说的端到端自动驾驶。」

    完全的「端到端」并不现实

    在今年上海车展上,魔视展出了「从感知到融合」的BEV架构。虞正华表示,魔视正在运用此类端到端能力,分布到现有的一些任务中。至于再进一步与规控的结合,目前在预研的状态。

    「其实,端到端是AI技术的一个典型标志。自动驾驶系统从感知融合、定位,到规划、决策控制等,整个算法的链条是很长的。理想化的结果是将全链条实现端到端,而目前来看,还是只能让其中前半段实现端到端。」

    虞正华表示,目前,其实在一定程度上,感知环节已经形成了端到端——即感知能够通过一个网络进行数据训练,然后得出结果。

    而从感知到融合的端到端,是指将多个传感器通过一个BEV架构,直接输出融合之后的目标,并给予目标一些辅助信息。

    「如果是涵盖规划的端到端,我认为也不会是直接得出控制决策,因为这难度很大。」虞正华表示,由于传感器采集的数据与车型的尺寸、高度相关,数据分布不同,因此端到端的开发过程会面临适应性问题,使得研发非常复杂。「从现实角度来看,完全的端到端未必合适。但可以实现让感知、认知与规划模块相结合,因为规划与车型其实关系不大。」

    L3是个伪命题

    虞正华认为,从量产乘用车的角度来说,L3应该是个伪命题,因为它还是意味着需要人类随时准备接管,但接管逻辑、预留时间是否充分都是现实问题。而如果L3的应用场景因此受限的话,那体验也不会太好。

    而且更加关键的,还是L3的责任划分:由于其事故责任将由车企承担,所以车企也会特别谨慎。「即便L2的主要责任是由消费者承担的,车企都已经很谨慎了,更何况L3。」

    虞正华认为,车企对于L3上车的顾虑很多,即便能有保险能应对经济责任,但事故对于舆论和品牌形象的影响显然是更大的。

    因此,虽然魔视也在研发L3+的技术,但还是要按照L2+来量产应用。「这不是因为技术上无法实现,而是因为受到场景限制,另外当然还有法律法规的限制。」

    虞正华表示,综合各种因素来看,乘用车的L3商业化应用实际是个伪命题,很可能会被跳过,因为L4的责任划分更加清晰,对驾驶员的要求也低很多。

    为何要强调边缘计算?

    在魔视智能科技的官网上,标出的定位是「嵌入式人工智能自动驾驶赋能者」。

    对此,虞正华解释称,嵌入式AI,意味着其部署环境不是在数据中心或者云端,而是在边缘侧,也就是部署在嵌入式芯片中。

    其实自动驾驶,本质上都是边缘计算,但为什么我们还要强调边缘计算?因为它需要稳固的算法基础和积累,也需要与芯片公司形成相辅相成、深入合作的关系。

    虞正华介绍称,多数芯片都需要有算法公司对其进行部署,而同时后者也需要有相应的芯片来承载算法,二者需要密切配合。

    他表示,如今做ADAS的算法公司貌似很多,但是能有全栈自研感知算法、又能经过量产检验的非常少;而边缘计算更是对感知算法能力有较高的要求:「芯片的算力,无论是8 TOPS还是200 TOPS,绝大部分都用在了感知算法上,所以原创的感知算法是一种核心能力的体现。」

    同时,随着芯片的迭代,快速的部署能力对于算法公司来说也是考验之一,毕竟不同的芯片所支持的算子、提供的算力都不一样。

    对于魔视来说,其解决方案是通过自研的算法框架——UniVisity,将不同芯片的算子、算力等差异封装屏蔽,从而更加快速地进行部署,提高适应性。

    「高配车型与中低配的功能要求不一样,这导致传感器配置也不统一,所以灵活性和快速部署能力就是竞争的关键。」

    「软硬一体」与「平台化」

    与芯片密切相关的,还有「软硬一体」的研发形式。一直以来,魔视都交付的方式都是将算法植到嵌入式芯片,然后把芯片做成整机,以硬件形式交付给主机厂。

    在这种形式下,能够直观让客户感到能力差异的,除了功能体验,就是成本控制。

    「在实现同等功能的基础上,我们的芯片成本可比行业普遍水平降低40%。」虞正华举了个例子:魔视的APA(自动泊车)和RPA(遥控泊车)系统用的赛灵思Zu2芯片来实现的,这比友商使用的Zu3算力低了一半,但效果却不会打折。「要实现这种成本控制,就是需要结合硬件能力、算法原创能力,以及深度优化能力。」

    目前,与魔视合作的主机厂约有20家,再加上每家都有不同的车型,对功能的需求也有较多差异,这令每次量产交付的过程都充满了挑战。

    为了应对这种挑战,虞正华一再强调了「平台化」的重要性。「芯片的选择其实并不多,因此我们非常注重算法和软件的平台化,也就是以统一的核心算法与设计,应对不同车型和不同需求,适配各类功能开发。」

    中算力产品仍是性价比「爆款」

    在今年4月,魔视智能发布了新一代集成式行泊一体域控制器——Magic Pilot,该平台在单颗SOC芯片上即可实现行泊一体功能。

    虞正华介绍称,行泊一体的特点,是用一颗芯片来实现行车和泊车两套系统的功能,并将所有传感器的信息在一个域控里统一处理,并生成决策。

    「目前,中算力的芯片还是需要行和泊有一定的区分,也就是通过分时复用的方式来实现。算力更高的就是行和泊同时在跑,至少对传感器的处理是同时在进行的。」

    魔视的单芯片行泊一体域控制器,可用中算力实现L2+行车主流功能,以及泊车的APA、RPA乃至HPA(记忆泊车辅助);而至于AVP泊车,虞正华称,虽然该功能在技术上能够实现,但是其落地需要停车场管理等多个环节的配合,所以商业化还需要时间。

    在虞正华看来,目前需求量最大的产品还是集中在中算力平台上。「主要还是因为性价比很高,成本对主机厂来说更有吸引力。」

    次阅读
    评论
    赞同
    收藏
    分享
    评论
    赞同
    收藏
    分享

    评论·0

    头像头像
    提交评论
      加载中…

      热门资讯