@karminski3 买特斯拉送MacStudio?特斯拉AI5芯片流片成功!马斯克此前宣布自研AI芯片,刚刚发X庆祝
@karminski3 买特斯拉赠MacStudio? 特斯拉 AI5 芯片流片成功了! 马斯克之前就宣布要搞特斯拉AI芯片, 就在刚刚发x庆祝特斯拉 AI5…
特斯拉AI5芯片流片成功,马斯克在X平台宣布。该芯片集成12颗SK海力士LPDDR5x颗粒,总容量144GB,内存带宽约819.2-921.6 GB/s,接近MacStudio M2 Ultra的800GB/s。运行Qwen3.5-27B或Gemma4-31B的8bit量化模型时,输出速度约30-34 token/s。芯片对SoftMax函数进行原生硬件优化,从AI4的40步执行降至单步;内置混合精度张量加速器,支持INT8、INT4、INT2及FP8运算。INT8算力约2000 TOPS,低于NVIDIA RTX Pro 6000 Blackwell的3341 TOPS,但高于MacStudio的100 TOPS。该芯片原用于FSD、Robotaxi及Optimus人形机器人的端到端大模型推理。
买特斯拉送 MacStudio?特斯拉 AI5 芯片流片成功了!
马斯克之前就宣布要搞特斯拉 AI 芯片,就在刚刚发 X 庆祝特斯拉 AI5 芯片流片成功。这个 AI5 芯片的参数如下:
直接来看最重要的内存带宽:片上集成了 12 个 SK 海力士的 LPDDR5x 颗粒,总容量达到 144GB。如果按 7500 MT/s 到 9600 MT/s 的速率计算,带宽大约在 819.2 GB/s 到 921.6 GB/s 之间,正好差不多是 MacStudio M2 Ultra 的内存带宽(800GB/s)。也就是说,只要买了搭载 AI5 芯片的特斯拉,就相当于送了个 MacStudio!
这个速率如果运行 Qwen3.5-27B 或 Gemma4-31B 的 8bit 量化,输出速度大约是 30-34 token/s,已经可以一用了。想象一下,车到家停进车库,还能远程连上自己用,或者算力并网直接卖算力。
另外,这个芯片针对目前大模型中最核心的 SoftMax 函数进行了原生硬件级优化。在上一代 AI4 中,SoftMax 算法需要在模拟模式下分 40 步执行,而在 AI5 芯片上可以单步(1 step)原生执行,极大地打破了计算瓶颈。此外,芯片内置了混合精度张量加速器,针对 INT8、INT4 甚至 INT2 等低精度整型运算进行了优化,同时也支持 FP8 运算。这意味着跑量化模型还能更快。
至于算力,官方说 INT8 性能大约是 2000 TOPS。作为对比,NVIDIA RTX Pro 6000 Blackwell 大约是 3,341 TOPS,而 Mac Studio 大约只有 100 TOPS(8bit 精度下 simd_dot 指令)。所以性能甚至比 Mac Studio 强很多。当然,这个性能还不足以从零训练大模型,它更适合用来推理,或者进行小范围的微调(训练不到 1B 的电子鹦鹉是可以的)。
当然,这个芯片最初的本意其实是给完全自动驾驶(FSD)、Robotaxi(无人驾驶出租车网络)、Optimus 人形机器人这些设备应用端到端大模型准备的。特斯拉从 FSD v12 版本开始,自动驾驶已经完全转向了端到端神经网络,所以智驾搭配端到端大模型已经是板上钉钉的事了。
现在恐怕唯一的问题是:如果车不能插网线,而且停得比较远连不上,是不是还要单独买流量包才能连自己的车……
#tesla #teslaai5 #musk #马斯克 https://t.co/mY394pzC2l