完全自动驾驶？特斯拉的芯片究竟多强_汽车

近日，马斯克在推特上透露，由于特斯拉V10.0系统和Smart Summon(智能召唤)功能已发布，特斯拉全自动驾驶系统(Full Self-Driving，FSD)的价格将于11月1日起上调1000美元。

特斯拉的这颗芯片，是一种特殊类型的 AI 处理器，可以支持人工神经网络（ANN），也就是我们常听到的机器学习（ML）或深度学习（DL）。

需要指出的是，特斯拉定制开发的这颗 AI 芯片并不意味着特斯拉在 AI 领域取得了反转一切的能力。至于全自动驾驶在现实世界的解决方案，特斯拉也只是刚刚入门。

AI 芯片的背景

传统的计算机需要 CPU（中央处理器）来执行系统工作，比如加载应用程序。除此之外，大部分现代计算机还要有 GPU（图形芯片）来支撑，它的工作是协助核心处理器完成图形和动画的渲染，让用户能在屏幕上获取有效信息。

在机器学习或深度学习上，除了 CPU，GPU 的角色也突然重要了起来。总得来说，GPU 从配角变主角，主要还是因为 ANN（人工神经网络）是个庞大的数值和线性代数问题，而它就是为这样的数字混合而生的。

对开发者来说，GPU 简直是上天的恩赐，谁也没想到它能在 ML/DL 领域发挥如此巨大的功效。GPU 的隐藏属性「暴露」后，芯片开发者们开始为潜在的市场扩军备战，就连 GPU 的设计都开始为 ML/DL 任务倾斜。

在 FSD 芯片诞生前，特斯拉一直是拿来主义者，它最早与 Mobileye 合作，后又转向英伟达。现在，特斯拉则希望将命运攥在自己手中，用自研的这颗芯片为 Autopilot 撑起一片天地。

在今年 4 月份的 Autonomy Day 大会上，特斯拉祭出了大杀器——FSD 芯片。这背后传达的信息很清晰：就是要用自行研发的技术替代现有的英伟达芯片。

四个多月后，特斯拉工程师们又在 Hot Chips 大会（IEEE 主办，专注于高性能处理器）上对芯片的一些关键组件提供了更多的解析。这次深度解析也让外界对特斯拉的 FSD 芯片重燃兴趣。

需要注意的是，在大多数人眼里，这种处理器可统称为 AI 芯片。这样叫也不为过，但也别对它有太高的期待——AI 芯片目前还无法在预期领域实现全知全能的人工智能。

简单来理解的话，这些芯片根本没有任何类人的推理或常识能力，它只是能力暴增的数值计算设备罢了。

3.0 硬件的秘密

特斯拉官方表示，图像数据处理的流程首先从摄像头的高速数据传输开始——高速指的是25 亿像素/秒，大概是往 21 块 1080P 的全高清屏幕塞 60 帧画面的程度。这个数据传输速度比特斯拉车型现有的8颗摄像头可以产生的数据量多了不止一个维度。

如此高的传输速度现在还用不上——因为 FSD 芯片内置的图像处理器ISP最高「只能」处理 10 亿像素的数据量，也就是 8 块 1080P 屏幕每秒 60 帧的程度——这已经追上现在世界上最快的消费级图像传输标准 DisplayPort 1.4 了，而车载芯片「传统上」是要落后消费级起码一个时代的。

图像处理器 ISP 的作用主要是将摄像头产生的原始 RGB 三原色数据转化成复杂的图像信息，这些信息的下一站是神经处理单元 NPU，NPU 会根据深度学习模型对图像数据作出处理——但在此之前，这些数据将会存储在 SRAM 内。

那什么是 SRAM？

SRAM 一般被应用在处理芯片的 1-3 级缓存上，你可以简单地将它理解为比运行内存速度快很多，同时成本也高很多的存储芯片。有多快？特斯拉芯片总工程师 Pete Bannon 表示，处理全自动驾驶的缓存带宽至少要达到 1TB/秒，而 FSD 芯片的 SRAM 实际上能提供 2TB/秒的带宽。

那32MB 的缓存又是什么概念？做一个不是十分准确但足够形象的比较，零售价 16999 元的英特尔酷睿 i9-9980XE，SRAM 缓存总量也仅为33.75MB。另一个细节是，2010 年英特尔CPU的最大 SRAM 仅为16MB，2014 年也只是增长到了 24MB。

SRAM 的价格之高，特斯拉 SRAM 规格之激进，相信大家也能管中窥豹——而 Pete Bannon 在发布会上也将巨大的 SRAM 容量总结为 FSD 芯片对比市场上同类芯片的最大的优势。

芯片内部的所有数据都在浅蓝色标注的主通道上传输，或者叫NOC（Network on Chip），然后才会经过总带宽为 68GB/s的LPDDR4 运行内存——所以特斯拉目前的传感器数据产生量大概率不会超过 68GB/s，甚至不会超过 34GB/s，当然这也已经是一个很吓人的数字了——但内存带宽可能还是自动驾驶的瓶颈。

NPU 是 FSD 芯片里面的真正大杀器。但总有一些其他方面的数据处理是NPU 无法完成的，这时候就需要 CPU 和 GPU 共同参与。

FSD 芯片内置了主频为 1GHZ 的 GPU，拥有 600TOPS 的运算能力。特斯拉的表述是 GPU 主要负责一些后处理的任务，比如说描绘人类能看得懂的界面和图形——也就是说 2.X 时代特斯拉自动驾驶硬件的 AB 面设计将会大概率被取消。总的来说，按照特斯拉在发布会上对 GPU 的描述，以后的 FSD 芯片里面，GPU 的地位将会被继续削弱。