当前位置:QNX > QNX评价

辅助驾驶卷进新赛道,行泊一体大有可为

最近自动驾驶行业有两件比较有意思的事,一个是搭载大疆车载灵犀智驾系统的首款量产车KiWi正式上市;另一个则是自动驾驶公司MAXIEYE(智驾科技)的MAXIPILOT平台下基于单TDA4的行泊一体系统也要量产了。

为什么比较有意思呢?

因为这两套系统有两个共同的特点,一个是目前的量产版都是兼顾性价比满足大众消费市场的产品;第二个是都叫「行泊一体」辅助驾驶方案。

第一点比较好理解,年智能驾驶行业是两种现象并行的状态,以特斯拉、蔚小理、华为为主的自研派,在努力实现高阶辅助驾驶的「进城」;大众价位汽车在加快L2级别的方案上车,而这类车型又占据着汽车市场80%的比例,因此,L2到支持高速领航级别的辅助驾驶正在形成规模化。

这就在中低端车型市场产生了一个巨大的需求,而中低端车型对于辅助驾驶有两个核心关键词:「低成本」、「高可靠」。

在此基础上进阶的高性价比「行泊一体」方案的到来似乎也给主机厂带来了一缕春风。

而如何低成本、高效率地获取车辆大规模上路行驶过程中的高质量、高价值数据,用以迭代技术,开始成为各玩家之间实力比拼的焦点,我们发现MAXIEYE这家公司确实值得多聊聊。

因此,我们梳理了几个问题,展开聊聊:

什么是「行泊一体」方案?

MAXIEYE在乘用车里能够提供什么独特的方案?

基于TDA4去做行泊一体方案的难点在哪?

方案走向前装量产,MAXIEYE在技术上有什么特点?

一、「行泊一体」的战争已经打响

在讲「行泊一体」方案之前,要先来聊聊智能驾驶行业的一些现状。

先看一组数据:

年1-6月,中国高级别辅助驾驶的前装搭载率是26.64%(L2/2.5功能具备向上升级的);

年1-7月,中国市场乘用车全品类车型,功能达到基础L2的辅助驾驶普及率为22%;

年1-7月,L2级智能辅助驾驶标配搭载上险.89万辆,同比增长接近70%,同时车型的价格区间平均在15-20万之间。

这组数据说明了一个问题:市场对L2/2.5级别的辅助驾驶需求更加迫切。

但在智能化的行车部分,除特斯拉、理想、小鹏三家为系统自研,硬件来自第三方供应商外(特斯拉硬件也自研),其余排在前十的供应商仍为传统外资Tier1,其中,电装、博世、采埃孚排名前三位。

目前由Tier1提供的主流单目ADAS方案中,Mobileye依托其高性能产品方案主攻中高端市场,博世则以低成本抢占市场,在国内市场表现不错,但有下降趋势。

原因在于,Mobileye和博世虽然都有很强的工程化能力,但Mobileye在一直是黑盒交付的封闭方案,并且不开放视觉感知算法,车企对产品可以定义的部分很少,所以逐渐被放弃了使用。博世的方案优势是「标准化」,可以最大节省开发成本,装载就用;劣势其实也是「标准化」,智能驾驶系统是一套需要更新的系统,博世很难和众多客户一起去迭代系统能力。

这是辅助驾驶第一个痛点:一套具有「开放性」,且可以「持续迭代」的系统。

而市场的另一个极端则是,以华为、百度、小马智行等为核心研究L4的企业,虽然系统能够覆盖的场景多,系统的应用更加高阶,但常规十几颗摄像头、5颗毫米波雷达、12颗超声波,外加多颗激光雷达,再加上一块数百到数千TOPS算力芯片,整个系统的硬件成本最低都要达到2-3万元,且最终实现的还是驾驶辅助,并不能完全符合行业的L4标准。

显然,这对于大众消费市场来说很难接受,这就有了第二个痛点:一套极具「性价比」的系统。

为什么要说上面这些?

简单说就是,在巨大的市场需求下,谁能够提供一套「低成本」、「性能强」、「高开放性」的系统,谁将有机会吃下更多的市场份额。

这和「行泊一体」方案有什么关系?

我们都知道自动驾驶在技术上,有一个行业共识的目标:用一套系统架构驱动整个车辆的自动化。

所以技术架构上要向基于中央计算的集成化架构升级。但问题在于,这需要一个过程,它需要基础产业技术的协同进步,比如大模型的神经网络算法、精度更高的感知传感器、大算力计算平台等。而这个逐渐升级技术的过程行业里有一个叫法——「渐进式」自动驾驶路线。

简单理解就是,用现有的技术解决当前的问题,同时快速迭代实现对高阶功能的量产。

现在的自动驾驶系统,从技术层去看还是大有不同,这里面还是多套系统以及多套硬件并行的状态。

比如,硬件上虽然已经向域控架构集成,但现在多数车企还是拥有3-4个域控器,而且行车和泊车都需要不同的芯片去驱动;软件上还是高阶领航辅助驾驶一套,高精地图断点后降级到L2又是一套,同时泊车系统还是一套,而且多数方案还都是不同供应商来做。

结果就是,车辆在功能层实现了统一,同时具备行车、泊车的能力,但技术架构依然不是最优解,供应商以及主机厂的硬件成本和开发成本依然不低。

怎么解决呢?

一句话就是:再集成。

这就说到了「行泊一体」方案,行业第一阶段的做法是,不同芯片处理行车和泊车;第二阶段的做法是硬件上将行车和泊车的芯片集成到一个控制器,里面跑两套算法。

目前普遍处于第二阶段,这种形式上的行泊一体并不能真正实现硬件性能的极致挖掘,对于车厂而言硬件成本也并没有降低,目前行业中更多的是多芯片拼盘的方案,比如EyeQ4+TDA4、J3+TDA4、双TDA4(大疆灵犀智驾)、EyeQ4+S32V(蔚来)等。

而第三阶段则是,用一颗芯片写入行车和泊车算法。并在底层软件、传感器复用性等维度上不断升级,实现高性价比、高集成度的行泊一体解决方案。

行泊一体方案的核心是:「降低成本」和「简化技术架构」。

这样做的方式有几个优点:

硬件数量减少,降低硬件成本,降低开发成本。

统一适配一个芯片,可以提高系统的运行效率,达到性能优化的目的。

因为简化了技术架构,涉及到的供应商少了后,可以提高标准化能力。

这就是为什么,地平线、大疆、智行者等都有行泊一体方案规划,而且接下来这个领域的竞争只会越来越激烈。

还有一个问题是,两套算法对于芯片算力的要求会更高,如果需要用一颗Orin这样的大算力芯片其实成本并没有降低,如果想基于单J3、S32V、TDA4去做那就需要在算法上极致压榨。

我们了解到MAXIEYE的做法是,在嵌入式软件层面下功夫将算法与芯片的运行效率提高,并且比较快的做到量产状态。

二、MAXIEYE凭什么?

在聊这个技术之前,依旧介绍一下这家公司,MAXIEYE(中文名:智驾科技),是智能驾驶和智慧出行领域的全栈创新及系统方案服务商。

它们的主要产品则是,辅助驾驶(ADAS)和自动驾驶(ADS)系统产品及解决方案,可以覆盖L0-L4技术和服务闭环。

根据MAXIEYE的产品规划可以看到,按系统版本可分为三个:

一,MAXIPILOT1.0以及MAXIPILOT1.0PLUS

这套系统采用的是安霸的CV2系列芯片,感知硬件上可以从1R1V-5R1V根据车型需求自由裁切,可实现NOM高速场景领航辅助驾驶。

二,MAXIPILOT2.0以及MAXIPILOT2.0PLUS

这个版本MAXIEYE就已经对系统进行了集成设计,其中MAXIPILOT2.0采用一颗TDA4就可实现行泊一体,功能上可以达到NOA,感知硬件可以做到5R5V1D,预计量产时间会在年。

而MAXIPILOT2.0PLUS基于50TOPS级别的芯片,同时会部署BEV大模型的算法,可实现AEB/FCW/LDW/LKA/TSR/IHBC/ACC/ICA/TJA/ALC/NOM/AVP等一系列智能驾驶功能和行泊一体方案。

三,MAXIPILOT3.0

这个版本会基于+Tops算力平台开发,支持5R11V3L融合感知硬件,可以实现含城市领航辅助驾驶的行泊一体方案。

MAXIEYE马上要量产的基础版行泊一体将搭载MAXIPILOT2.0系统,这套系统的特点是基于一颗TDA4VM而设计。目前,TDA4芯片有几个版本(来自TI官方资料):

TDA4VL:算力4TOPS

TDA4VM:算力8TOPS

TDA4VH:算力32TOPS

MAXIEYE用的是TDA4VM。

行业中也知道,虽然这款芯片的算力已经达到了8TOPS,但因为TDA4芯片原来是给座舱用的芯片,所以即使这款芯片是个成熟的方案,但实际在行车开发应用的过程中,可用的算力会有所受限,就会出现对数据流处理和任务分配拥堵的情况。

简单说就是,会消耗大量算力在一些边缘化的数据处理任务上,这就会影响系统核心功能的检测性能,比如对视觉感知信息的漏检。所以虽然众多的自动驾驶解决方案公司,都基于TDA4芯片开发行泊一体方案,但最终能量产的始终停留在泊车方案,行车上能用好的不多。

因此,想用可以,但你必须拥有一套更为独特的算法能力,这就要说说MAXIEYE提到的嵌入式软件技术,为此我们还专门请教了MAXIEYE的软件专家。

三、MAXIEYE嵌入式软件解决什么?

要知道MAXIEYE嵌入式软件解决什么,就要先知道有什么问题需要解决。

因为成本,体积,能耗等方面的原因,一般很难把深度学习训练时候使用的GPU或者集群式训练中心搬到一辆汽车上。所以只能把这些算法、软件部署到一些成本、体积、功耗都大幅降低的,带深度学习推理加速的,嵌入式SOC芯片中。

也正因为成本,体积,功耗等原因,也决定了这些嵌入式芯片的算力,内存带宽,内存大小等资源方面都非常的有限。尤其是在1R1V和5R5V之间的一些L2或者L2+的辅助驾驶产品上这种资源的紧缺显得尤为突出。

两个原因:

深度学习算法工程师在训练的时候为了达到优秀的效果,一开始是很难顾及到训练端到部署端这么大算力悬殊差距的限制。这给嵌入式芯片的深度学习网络部署工程师保留深度学习网络的优秀效果提出了很大的挑战。

辅助驾驶关系到车控,这就要求辅助驾驶产品中的嵌入式软件具有非常强的稳定性和快速响应能力。

稳定性有两个方面的表现:一,产品中的软件在达到产品宣称的功能和功能指标的情况下不能死机,哪怕车辆连续开几天也不能死机;二,产品的功能指标不能时好时坏,表现要始终如一。

所以,保留优秀的算法效果,保持产品的高度稳定性和快速的响应,是辅助驾驶产品中嵌入式能力的重要挑战和体现。

主机厂之所以选择TDA4VM这颗芯片,

TI在车规级芯片供应的传统供应商里,有绝对的研发经验,用起来比较容易上手。

车厂的项目评估周期都比较长,而在早期评估时车规级小算力芯片中带GPU的很少,而环视泊车功能中的图像拼接、渲染都需要GPU效果才能做的比较好,TI满足。

TDA4VM是多核异构的,本身自带ISP和片内物理隔离还能双核锁步的MCU,这样不但可以在系统硬件上减少外置ISP和一块车规级ASILDMCU的成本,还可以应对这几年车规MCU的保供问题。

TDA4VM优点明显,缺点依然明显,除了前面提到的实际算力较小以外,还有一些其它方面劣势,为次我们请教了某新造车品牌的自动驾驶负责人,得到一些信息。

在深度学习算法部署方面

某车企算法负责人对我说:

TI其官方提供的深度学习推理加速工具链TIDL的深度学习算子支持不足,仅支持20多种较为基本的算子,就这些基本算子很多使用限制也较大,如softmax、sigmoid、InnerProduct等,只支持一维输入输出。

另外如reshape、scale等算子,不支持在网络中独立使用,这些都限制了网络结构和模型设计。对我们的深度学习算法工程师设计的一些效果很好的私有算子就更加不友好了。

因为我们评估过国内外很多款带深度学习推理加速的ADAS嵌入式芯片。

我们发现TDA4VM在嵌入式端深度学习推理加速的一些主流特性支持做得不是很完善,其没有对深度学习稀疏化的加速支持,全靠硬算。

而那些对随机或者结构化稀疏支持的比较好的芯片,其推理效率在网络稀疏化做的比较好的情况下相比硬算能提高好几倍。

其对批处理、混合精度定点化做的也很不好用,还经常出错。

软件SDK方面

TDA4VM采用的是基于OpenVX的一套软件架构,而OpenVX采用的是一种基于节点的有向无环图处理方式(DAG)。

这种方式在现在很多辅助驾驶软件中都有采用,特别是TDA4VM这种多核异构,有很多协处理器的大型芯片,每个核上都有自己的操作系统,有的核运行RTOS,有的核运行Linux或者QNX,有的MCU上还运行了AUTOSAR系统,OpenVX这种架构本身能够起到屏蔽硬件操作细节,从而让软件工程师更加


转载请注明:http://www.wodkn.com/hlff/13402.html

  • 上一篇文章:
  • 下一篇文章: 没有了