1. 空间智能 (Spatial Intelligence) 到底是什么?
抛开学术定义,理解AI为何从“聊天”走向“干活”。
通俗解释
如果把 ChatGPT 看作是一个被关在黑屋子里、只通过文字和外界交流的“超强大脑”,那么**空间智能就是给这个大脑装上“眼睛(传感器)”和“小脑(空间感知)”**。
它让 AI 不仅能理解文字,还能理解**物理世界的三维结构、物体之间的相对位置、物理定律(比如杯子掉下会碎),并且知道如何在这个空间中移动和操作。**
为什么最近两年突然爆发?
- **大模型突破(大语言模型+视觉):** AI具备了常识逻辑。以前机器人看到椅子只知道是障碍物,现在知道那是给人坐的。
- **算力便宜了:** 边缘端(如Jetson系列)算力提升,让设备在本地就能实时处理复杂的3D点云数据。
- **传感器降价:** 原来几万块的激光雷达,被中国电动车产业链打到了几千甚至几百块。
关键人物与关系图谱
李
李飞飞 (Fei-Fei Li)
World Labs 创始人
**奠基人原因:** 她曾在10年前用 ImageNet 图像集开启了视觉AI时代。现在她创立 World Labs,提出“空间智能”,认为AI的下一步必须从处理2D像素,升级到理解3D物理世界,以此训练具有物理常识的“世界模型”。
与大模型的关系
大模型是“常识库”和“逻辑引擎”。空间智能是大模型在物理世界的延伸(Embodied AI)。
与机器人的关系
机器人是躯壳,空间智能是灵魂。没有空间智能,机器人只是预设程序的自动化机械臂。
真实商业案例:特斯拉FSD V12 / Figure 01
纯视觉端到端自动驾驶(车是最大的具身智能设备);Figure 01机器人能听懂人类指令“给我能吃的东西”,然后在桌面上找到苹果并递给人类(理解语义+理解3D空间+动作执行)。