完全自动驾驶?特斯拉的芯片究竟多强

近日,马斯克在推特上透露,由于特斯拉V10.0系统和Smart Summon(智能召唤)功能已发布,特斯拉全自动驾驶系统(Full Self-Driving,FSD)的价格将于11月1日起上调1000美元。

特斯拉的这颗芯片,是一种特殊类型的 AI 处理器,可以支持人工神经网络(ANN),也就是我们常听到的机器学习(ML)或深度学习(DL)。

需要指出的是,特斯拉定制开发的这颗 AI 芯片并不意味着特斯拉在 AI 领域取得了反转一切的能力。至于全自动驾驶在现实世界的解决方案,特斯拉也只是刚刚入门。

AI 芯片的背景

传统的计算机需要 CPU(中央处理器)来执行系统工作,比如加载应用程序。除此之外,大部分现代计算机还要有 GPU(图形芯片)来支撑,它的工作是协助核心处理器完成图形和动画的渲染,让用户能在屏幕上获取有效信息。

在机器学习或深度学习上,除了 CPU,GPU 的角色也突然重要了起来。总得来说,GPU 从配角变主角,主要还是因为 ANN(人工神经网络) 是个庞大的数值和线性代数问题,而它就是为这样的数字混合而生的。

对开发者来说,GPU 简直是上天的恩赐,谁也没想到它能在 ML/DL 领域发挥如此巨大的功效。GPU 的隐藏属性「暴露」后,芯片开发者们开始为潜在的市场扩军备战,就连 GPU 的设计都开始为 ML/DL 任务倾斜。

在 FSD 芯片诞生前,特斯拉一直是拿来主义者,它最早与 Mobileye 合作,后又转向英伟达。现在,特斯拉则希望将命运攥在自己手中,用自研的这颗芯片为 Autopilot 撑起一片天地。

在今年 4 月份的 Autonomy Day 大会上,特斯拉祭出了大杀器——FSD 芯片。这背后传达的信息很清晰:就是要用自行研发的技术替代现有的英伟达芯片。

四个多月后,特斯拉工程师们又在 Hot Chips 大会(IEEE 主办,专注于高性能处理器)上对芯片的一些关键组件提供了更多的解析。这次深度解析也让外界对特斯拉的 FSD 芯片重燃兴趣。

需要注意的是,在大多数人眼里,这种处理器可统称为 AI 芯片。这样叫也不为过,但也别对它有太高的期待——AI 芯片目前还无法在预期领域实现全知全能的人工智能。

简单来理解的话,这些芯片根本没有任何类人的推理或常识能力,它只是能力暴增的数值计算设备罢了。

3.0 硬件的秘密

特斯拉官方表示,图像数据处理的流程首先从摄像头的高速数据传输开始——高速指的是25 亿像素/秒,大概是往 21 块 1080P 的全高清屏幕塞 60 帧画面的程度。这个数据传输速度比特斯拉车型现有的8颗摄像头可以产生的数据量多了不止一个维度。

如此高的传输速度现在还用不上——因为 FSD 芯片内置的图像处理器ISP最高「只能」处理 10 亿像素的数据量,也就是 8 块 1080P 屏幕每秒 60 帧的程度——这已经追上现在世界上最快的消费级图像传输标准 DisplayPort 1.4 了,而车载芯片「传统上」是要落后消费级起码一个时代的。

图像处理器 ISP 的作用主要是将摄像头产生的原始 RGB 三原色数据转化成复杂的图像信息,这些信息的下一站是神经处理单元 NPU,NPU 会根据深度学习模型对图像数据作出处理——但在此之前,这些数据将会存储在 SRAM 内。

那什么是 SRAM?

SRAM 一般被应用在处理芯片的 1-3 级缓存上,你可以简单地将它理解为比运行内存速度快很多,同时成本也高很多的存储芯片。有多快?特斯拉芯片总工程师 Pete Bannon 表示,处理全自动驾驶的缓存带宽至少要达到 1TB/秒,而 FSD 芯片的 SRAM 实际上能提供 2TB/秒的带宽。

那32MB 的缓存又是什么概念?做一个不是十分准确但足够形象的比较,零售价 16999 元的英特尔酷睿 i9-9980XE,SRAM 缓存总量也仅为33.75MB。另一个细节是,2010 年英特尔CPU的最大 SRAM 仅为16MB,2014 年也只是增长到了 24MB。

SRAM 的价格之高,特斯拉 SRAM 规格之激进,相信大家也能管中窥豹——而 Pete Bannon 在发布会上也将巨大的 SRAM 容量总结为 FSD 芯片对比市场上同类芯片的最大的优势。

芯片内部的所有数据都在浅蓝色标注的主通道上传输,或者叫NOC(Network on Chip),然后才会经过总带宽为 68GB/s的LPDDR4 运行内存——所以特斯拉目前的传感器数据产生量大概率不会超过 68GB/s,甚至不会超过 34GB/s,当然这也已经是一个很吓人的数字了——但内存带宽可能还是自动驾驶的瓶颈。

NPU 是 FSD 芯片里面的真正大杀器。但总有一些其他方面的数据处理是NPU 无法完成的,这时候就需要 CPU 和 GPU 共同参与。

FSD 芯片内置了主频为 1GHZ 的 GPU,拥有 600TOPS 的运算能力。特斯拉的表述是 GPU 主要负责一些后处理的任务,比如说描绘人类能看得懂的界面和图形——也就是说 2.X 时代特斯拉自动驾驶硬件的 AB 面设计将会大概率被取消。总的来说,按照特斯拉在发布会上对 GPU 的描述,以后的 FSD 芯片里面,GPU 的地位将会被继续削弱。

除此之外,一些通用数据只能交给 CPU 处理,特斯拉采用的是 12 个 64 位 ARM Cortex A72 内核,运行频率为 2.2GHZ——准确点说应该是三个四核 CPU 的并联架构。

特斯拉对于 CPU 架构的选择有点让人摸不着头脑,因为 A72 是 ARM 在 2015 年推出的架构(虽然 2016 年才正式商用),往后可用的架构包括 A73 和 A75(A76 和 A77 是 2018/2019 年发布的)。

不过考虑到 FSD 芯片的研发是从 2016 年开始的,采用再前一年的架构也很正常。因为老架构更便宜,而多个核心叠加的方式也保证了多线程总性能不比如今顶级的 4 核心移动端 CPU 弱,甚至尤有胜之——硬件 3.0 的 CPU 性能是硬件 2.5 的 2.5 倍。

马斯克的勇气

许多人对马斯克的勇气大加赞赏,认为特斯拉敢走出这样一条路确实值得尊敬。

不过,从商业角度来看,这样的选择明智吗?对于车主而言,花大价钱选装真的有那么多的实际意义吗?

这是马斯克的赌注,也是完全自动驾驶的赌注。

版权声明:本文系腾讯汽车独家稿件,版权为腾讯汽车所有。欢迎转载,请务必注明出处(腾讯汽车)及作者,否则必将追究法律责任。

正文已结束,您可以按alt+4进行评论

热门推荐

看过本文的人还看了

微信扫一扫,爱车轻松购
扫描左侧二维码即可下载【购车通APP】;
看车选车找优惠,金牌顾问帮买车。
[责任编辑:xiaolongshi]

热门搜索: