英伟达直接把服务器级别的算力塞进了机器人体内。
全新的机器人计算平台Jetson Thor正式发售,基于最新的Blackwell GPU架构,AI算力直接飙升到2070 TFLOPS,比上一代Jetson Orin提高至整整7.5倍,同时能效提高至3.5倍。
128GB的超大内存配置,在边缘计算设备里是前所未有。
黄仁勋表示:
Jetson Thor助力全球百万开发者构建可与物理世界交互、甚至改变物理世界的机器人系统。具备无与伦比的性能与能效,还能够在边缘设备上同时运行多个AI模型。
作为一款卓越的超级计算机,Jetson Thor正在推动物理AI与通用机器人时代真正到来。Jetson Thor基于Jetson软件栈优化,支持所有流行的生成式AI框架和AI推理模型,包括主流语言模型Qwen、DeepSeek以及视觉语言动作模型到和视觉语言模型等。
etson AGX THOR开发者套件美国售价3499美元(约25000人民币,但中国售价尚未公布)。
T5000模组也已发售,购买1000片以上单价2999美元。
其中T5000模组是完整版,T4000模组则是为那些想从Orin升级的用户准备的精简版,功耗也从130W降到了75W。
性能爆表背后的技术细节
Thor的强悍不仅体现在AI算力上,人形机器人需要大量实时控制计算,需要CPU与AI算力同样重要,存储与带宽方面也都得到了升级。
具体特性如下:
GPU:Blackwell架构,最高2560个CUDA核/9个第五代Tensor Core,并支持MIG技术(多实例 GPU)将GPU资源按多任务隔离与并行调度,适配并行多代理/多工作流场景。 CPU:14核Arm Neoverse V3AE,面向实时控制与任务管理的确定性执行与更高吞吐,CPU性能相较前代显著提升。 存储与带宽:128GB 256-bit LPDDR5X,273GB/s显存带宽,为大型Transformer推理与高并发视频编解码提供保障。 功耗:40–130W,支持从移动平台到固定式机器人多样热/功耗配置,开发套件集成导热板与风扇便于热设计评估。 视频编解码:多路4K/8K编解码能力显著增强,有利于多摄并发与长时视频代理推理。 网络与传感:最多4×25GbE,搭配高速摄像头卸载引擎与Holoscan Sensor Bridge,将相机、雷达、激光雷达等数据以极低时延直送 GPU 内存,提升多传感器融合与高频闭环控制的稳定性。 I/O:开发套件与量产模组提供 QSFP28、RJ45、USB 3.x、PCIe Gen5等接口,适配机器人传感/执行器与加速外设扩展 在软件优化上,英伟达也下了功夫。
Jetson Thor原生支持NVIDIA Isaac(仿真/开发)、Isaac GR00T(人形机器人基础模型)、Metropolis(视觉 AI)、Holoscan(传感器工作流),支持从云到边缘统一开发/部署路径。
通过FP4量化和推测解码(speculative decoding)技术,在某些模型上能再获得2倍的性能提升。
数据显示,Thor能在200毫秒内给出第一个token响应,每秒能生成超过25个token,这个速度已经能支撑实时人机对话。
原创文章,作者:feiniu,如若转载,请注明出处:https://www.lrblog.cn/401.html