一颗大脑还是一个大脑，特斯拉未来面临的主要问题

yingzi 2023年01月07日 17:18 432 0

一颗大脑还是一个大脑，特斯拉未来面临的主要问题-第1张图片

文｜卢滢西、周文斌

“特斯拉也是有四个轮子的机器人，而Optimus其实是有两条腿的机器人。”

中国北京时间10月1日，特斯拉CEO埃隆马斯克在2022年AI Day上，正式公布人型机器人擎天柱Optimus空天飞机，展现了人型机器人在汽车生产厂家运送小箱子、浇绿色植物、挪动金属杆的小视频。

一颗大脑还是一个大脑，特斯拉未来面临的主要问题-第2张图片

“擎天柱”在运送小箱子

埃隆马斯克一直在注重“我们都是想早点制作出有价值的批量生产机器人”，市场价需在2万美金上下，3～5年之内完成批量生产。这取决于机器人的总体规划路线，走的不是如波士顿动力一样“高端大气”的试验室路经。

除开人型机器人的华丽以外，做为机器人和智能驾驶一同运用的那一部分，自动驾驶都是本次AI DAY不可或缺的一部分。

此次AI DAY上，特斯拉从基本功训练、Occupancy系统、行车道和物件、整体规划、人工智能技术编译程序和逻辑推理、自动贴标、仿真模拟、数据引擎这八个一部分，总体阐述了自己家自动驾驶从环境感知、数据采集、练习、解决、到运用的全套步骤。

但从此次详细介绍中也发现了，特斯拉的自动驾驶技术规范于8月底毫末在AI DAY上明确提出方向都颇有很多一致性。

例如彼此都是对的云空间锻炼的高度重视，并资金投入了很多的网络资源在超算中心和云空间训练算法上。例如在车端逻辑推理上根据Attention的 transformer做前结合，例如模拟仿真练习，及其自然语言理解这些。

这其实都在表明，不管是海外或是中国，自动驾驶在产品化里的探寻，总算走到彼此联系时。下面一起来看看主要内容。

一、3年批量生产、市场价2万美金，人型机器人有哪些技术小细节？

1、“擎天柱”的总体情况

去年AI Day上详细介绍特斯拉机器人这个概念之后，“擎天柱”一共迭代更新了三个游戏版本。最新一代的“擎天柱”个子170cm，重量73kg，用电功率在静座中为100W，快离开时500W，全身上下有200好几个可玩性，手臂27个可玩性。

一颗大脑还是一个大脑，特斯拉未来面临的主要问题-第3张图片

“擎天柱”的内部结构

设计方案“擎天柱”的过程当中，为减少功能损耗，特斯拉将配电设备和测算集中在躯体核心，在躯体里放了一个2.3kwh的锂电池组，而且还配备着特斯拉自主研发的SoC处理芯片，配置Wi-Fi和LTE连网。特斯拉官方网称，这一锂电池组可以维持机器人一整天的工作中，但是新闻媒体依据已知数据信息计算，假如不间断的工作中，“擎天柱”的待机时间大约在1.5-2h中间。

在身体一部分，特斯拉全自动驾驶系统软件FSD被运用在擎天柱的身上，但是由于人型机器人的需求与方式与车辆依然有所差异，因而，也做了三方面的变化。

最先，根据好几个感观传感器键入，让机器人可以解决视觉效果数据信息并作出决策；次之，有许多无线网络连接和声频适用通讯。此外，在硬件设备上，“擎天柱”也要保证安全，包含维护机器人自身和机器人身边的人，这便牵涉到机器人的四肢操纵。

机器人的结构基础上，人型机器人重复使用了特斯拉车辆根据物理生产量及其模拟能力，让用以汽车撞击试验的手机软件也做机器人的碰撞试验，开展危害毁坏控制，避免昂贵“人的大脑”过多损害。与此同时，“擎天柱”的身上还有很多执行器，通过这个执行器能让人型机器人进行例如上楼梯、下蹲、取东西等各种每日任务。

2、“擎天柱”通过什么运动起来？

完成这些动作那就需要设置相对应指标，但这些设计方案也是来自于一些生物学离散系统基本原理。根据展现出机器人在开展爬楼梯、下蹲等动作，骨关节会出现怎么样的压力曲线，去满足安全系数的相关规定。此外，姿势的实行还对执行器的扭距明确提出有关要求。

那样“擎天柱 ”的执行器是怎样设计、制作出来的呢？

在机器人的身上，执行器所实施的工作和骨关节所需承受压力有关，在具体前需要先通过认证，将主要参数放进优化模型中融入不一样的画面，依据每日任务需要能源消耗与时间的方式对执行器成本开展总体设计。因而，特斯拉先向“擎天柱”的28个构造执行器开展关联性剖析，检测怎么让执行器能够满足超过一个关节规定，然后再进行点云解析。

一颗大脑还是一个大脑，特斯拉未来面临的主要问题-第4张图片

点云解析

在发布会上表露，执行器一共有6种不同设计方案，它们扭距、输出力和品质都完全不一样。机器人人体不一样部分骨关节可玩性不尽相同，所以需要在终极状况对执行器进行测试。AI DAY在现场进行，根据一段提到一架接近半吨的电子琴的小视频，对执行器的承受压力展开了演试。

一颗大脑还是一个大脑，特斯拉未来面临的主要问题-第5张图片

6种不同定制的执行器

在手指的获取上，特斯拉的人型机器人精英团队为“擎天柱”制定了金属基件，根据金属基件推动机器人的小手，可以爬取不大、非常薄的东西了。除此之外，“擎天柱”手指中还配有手指头控制器，离合器体制让机器人即便不打开手也可以开展活动。

一颗大脑还是一个大脑，特斯拉未来面临的主要问题-第6张图片

“擎天柱”的手部关节展现

3、“擎天柱”如何做到看得清、走着稳？

“擎天柱”机器人使用了和汽车一样的认知计划方案——用监控摄像头录入数据，以神经元网络来计算。与此同时，在、计划和分区规划上，特斯拉早已在车辆情景上掌握了许多工作经验，构成了一套FSD系统软件，而运动规划的沉积又能够重复使用到机器人上，形成机器人运动学模型进行一定的最短路径算法。

为了能让人型机器人对时间与空间产生一定的记忆力，特斯拉对“擎天柱”开展了一系列的练习，优化了占有互联网操作方法，促使机器人可以最准确、迅速地鉴别行车地区。除此之外，还应用了很多的3D渲染，让人型机器人可以和现实自然环境能够更好地互动交流。

一颗大脑还是一个大脑，特斯拉未来面临的主要问题-第7张图片

机器人见到世界

在人型机器人关键性的运动控制系统层面，尽管“擎天柱”现阶段可以实现总体平衡，但在现实生活中，机器人不但要有对自身物理学存有的认知以及对于周边环境的一体化认知，还要让轨迹和机器人能够提供支撑能量能够更好地融合，避免磕磕绊绊的情况出现，扭距就是其中至关重要的一个要素。

仅有应用感应器和机器视觉对周边这个世界的认知开展动态评价，才能保障机器人保持良好姿势和体态。

因此，特斯拉根据对姿势开展捕获后，做数据可视化解决，产生“关键帧”。躯体、手、腿位置都要做详尽的关键帧剖析，再把这些数据映射到机器人的身上，能够更好地完成运动轨迹提升。

现阶段，特斯拉早已收集了许多数据信息并设立了可利用的数据库系统，根据运动轨迹提升程序流程让机器人可以更好的了解自己物理位置及其物理学运动轨迹。

一颗大脑还是一个大脑，特斯拉未来面临的主要问题-第8张图片

轨迹

这一被网友们誉为，跟小米手机的“铁大”居住在同一个养老院“擎天柱”尽管现在作用并不健全，乃至走着都算不上稳定，但埃隆马斯克对人型机器人未来的发展仍然满怀信心：“擎天柱预估生产量很高，未来将达数百万台。价钱将比车辆低的多，很有可能不上2万美金。”

一颗大脑还是一个大脑，特斯拉未来面临的主要问题-第9张图片

二、16万顾客，年末全世界发布，特斯拉自动驾驶有什么进度？

此次AI DAY 除开人型机器人以外，自动驾驶都是重要构成部分。

大会上，特斯拉Autopilot责任人Ashok Ellaswamy表明，2021年特斯拉FSD Beta仅有2000名顾客，但现在这一数字提高到16万，而这一成效，来自自动驾驶精英团队对75,000好几个神经网络模型进行练习。

但在实践过程层面，自动驾驶遭遇什么样的问题、考验，及其解决方法，此次AI DAY上特斯拉已经从基本功训练、Occupancy系统、行车道和物件，整体规划、人工智能技术编译程序和逻辑推理、自动贴标、仿真模拟、数据引擎这八个一部分各自展开了细腻的介绍。

一颗大脑还是一个大脑，特斯拉未来面临的主要问题-第10张图片

特斯拉自动驾驶实践活动实体模型

1、路线导航与测算

关键在于路线导航层面，特斯拉向人们展现了一个十字路口行人过马路情景，自动驾驶车辆要绕开路人完成左拐，把握好比较好的转为机会、是以路人的上方根据，还是对于后才绕道、及其如何避免和周边车辆相撞，全是路线导航相关的问题。

一颗大脑还是一个大脑，特斯拉未来面临的主要问题-第11张图片

在这样的场景中，特斯拉自动驾驶能通过大量测算完成路线导航和阻碍物的避开。

简单的说，便是自动驾驶最先根据感知系统鉴别觉察到阻碍物，例如照片中已经横穿马路路人，再通过对它行驶运动轨迹、行驶速度计算得到如果它的路线规划。

就像这样，特斯拉必须把这个街口周边每一个路障的运动轨迹都计算出来，然后根据自身行为速率开展路线导航，看是以它的正前方根据，还是对于后边绕道。

这一过程听上去简易，但实际上决策涉及到很多布局的难题，例如后才忽然车辆，就需要使用防碰撞系统。所以整体系统软件实际能够包含运动轨迹得分、撞击测算、平顺性剖析、进到性可行性研究四个一部分。

一颗大脑还是一个大脑，特斯拉未来面临的主要问题-第12张图片

2、Occupancy网络视频练习库

在路线导航系统软件身后，那就需要运用到大量运算强悍的环境感知，其实就是后边所提到的Occupancy，即占有互联网。根据占有互联网，特斯拉能让实体模型得到预测分析物件所占有区域的水平，并且在线性空间里形成由一个个正方体构成的生活环境。

有这样的环境作为支撑，特斯拉自动驾驶在行驶中，路线导航便会能够绕开这种“正方体”，车子还可以在无须辨别出指的是什么阻碍物的情形下作出躲避姿势。此外，FSD还可以利用该数据环境识别道路坡度/折射率，让车子按照实际道路情况提早预测分析加快/降速，进一步提高可靠性和舒适感。

因为数据训练都是围绕很多初始视频文件格式，因此特斯拉为此专业设计了一个短视频练习库，它能够存放很多的小视频原始文件并立即发放给服务器使用。

对比普通网络存储器，这视频练习库能让练习效率提高30%，存储文件空间降低11%，读写速度最少每秒钟读写能力频次提高4倍。

3、全自动标明与模拟仿真练习

拥有数据信息，随后而成的问题在于对信息进行标明与处理。

为了实现今天的任务，特斯拉内部结构有一个由1.4万只GPU所组成的高性能计算机。这1.4万GPU，有4百个花在了车辆贴标签检测上，有1万只花在了数据训练。在这里以外，特斯拉还有很多视频缓存层面的应用，毕竟在数据信息练习的时候，需要大量图象与此同时导入导出，而要保证这些图像的流畅，就需要对缓存进行非常好的处理。

当然，即使有4千个GPU用作数据标注，但如果所有的标注都依靠人工，那光特斯拉每天收集的数据就需要人工处理几个月的时间。所以特斯拉为此还开发了一个“数据自动标注”系统。

除了数据自动标注之外，特斯拉还在做的一个事情是仿真模拟的自动生成，这是一个类似数字孪生的的概念。通过模拟仿真，特斯拉可以在系统中对自动驾驶进行训练，按AI DAY上的说法，这可以将自动驾驶的训练效率提高1000倍。

仿真训练是针对有标数据的，然后再把这些数据导入到数据引擎，看看这些仿真训练的数据是否成立，如果不成立，就再返回去再重新计算。

仿真训练的一个好处是，它可以模拟许多现实环境中不存在的情况，这些情况通过实际的路测很难遇到，但我们无法保证这些情况不会出现，如果一旦出现，系统没有准备，那结果可能将是致命的。

而模拟仿真可以将这些现实极难碰到，或者不可能出现的情况模拟出来，用作自动驾驶训练。为此，特斯拉模拟了旧金山的交通数据，这个数据如果人类来做需要一两周甚至几个月的时间，但是用模拟器来做，一夜之间就能完成。

4、DOJO超级计算机

说到这里，其实我们会发现，数据、训练一直是特斯拉自动驾驶的关键词，而要完成这么多的训练，算力就成为了其中的关键。

用特斯拉工程师的话说，算力是训练的基本粮食，没有算力，训练会很难执行，或者效率会非常低。所以在这次AI DAY上，特斯拉也着重介绍了自家的超级计算机——DOJO。

DOJO来自日语“道场”，也有训练场的意思。而在特斯拉内部，DOJO就是专门用来进行模拟训练的，它往往要面对规模极大的模型，包含数以亿计的数据、参数。

为了解决这些问题，特斯拉的方法是将25个D1芯片集成在一个训练瓦片（Tile）上，让每个训练瓦片都具备54P算力和13.4TB/S对分带宽。6个训练瓦片、20片接口处理器又可以组成一个托盘，两个托盘又可以形成一个机柜，许多个机柜组合在一起，就形成了超算DOJO。

简单理解，其实超算DOJO就是无数个D1芯片的叠加累计。当然这最后的效果是非常明显的，因为每台ExaPOD的训练性能都具备1.1E算力、1.3T高速内存、13TB高带宽内存，4台即相当72个GPU机柜的训练性能。

可以说，DOJO的出现，实现人工智能训练的超高算力，同时扩展带宽、减少延迟、节省成本的需求。

总的来说，在这次AI DAY上，特斯拉整体介绍了自家自动驾驶从环境感知、数据收集、训练、处理、到应用的整套流程。

而这一切的实现，又都是从围绕着特斯拉汽车周围的八个摄像头的视觉识别开始的。

通常，当一辆特斯拉的汽车行驶在路上的时候，自动驾驶首先会对汽车周围的路况进行识别，比如墙、其他汽车、或者建筑等等，然后再导入到神经系统中，通过这个数据的导入导出进行计算，然后对未来这这些汽车行动进行规划，然后再结合地图信息，比如知道的车在什么位置，下一个路口需要往什么方向转弯等等，然后再结合一些其他数据，最终实现车辆障碍物的规避和路线规划。

整套逻辑的理论，都是汽车只专注于开好当前这段路，这就像人类驾驶员的开车逻辑一样。这套逻辑和毫末在8月底刚刚举办的AI DAY上提出的方向颇有许多一致性。

这种一致性，也表现在其他方面，比如对云端训练的重视，投入了大量的资源在超算中心和云端训练算法上。比如在车端推理上基于Attention的 transformer做前融合，比如仿真训练，以及自然语言处理等等。

这其实都在说明，自动驾驶在工程化上的探索，终于走到了相互交集的时候。

本文地址： https://www.yesoar.net/post/13780.html