两人都是OpenAI的联合创始人,但是奥特曼将OpenAI转向商业化运营之后,马斯克指责其背离初心,并起诉他违背创始协议。另外,马斯克还成立xAI,和OpenAI直接竞争。 当然,作为AI应用中最被看好的一个场景,自动驾驶拥有广阔前景,也吸引了巨大关注。OpenAI如果真有绝招,是绝对不会放弃如此巨大的市场的。 Sora生成的视频一下子惊艳了世人,因为这一模型能够理解复杂场景中不同元素之间的物理属性及其关系,掌握物体在物理世界中的存在和运动方式,从而生成足以以假乱真的视频。 几乎在Sora一发布,自动驾驶、智能驾驶业界就讨论说,可将Sora用于自动驾驶的模拟和训练,生成合成视频数据,尤其是一些极限场景Corner Case,以弥补现实数据不足或成本高的问题。 然而,也有专业人士迅速指出,Sora生成的画面,并不完全符合物理原理,也可能难以捕捉驾驶动态,如刹车或转弯的物理行为。因此,并不能用来作为智驾模型训练的视频数据。 不过,后来很多的研究者和从业者认为,符合物理原理的仿真,还是能够为数据训练提供数据的。或者,也可以用于强化训练模型。 近来,自动驾驶业界热衷于搭建“世界模型”来作为自动驾驶模型的基座模型。而OpenAI一开始,就将Sora定义为可以生成视频的世界模型。 像蔚来、小鹏等开发的世界模型,逻辑是让AI系统创建心理上的世界地图,以理解世界的运作方式,就像人类对世界的理解一样,然后在此基础上去驾驶车辆。 另外,当前自动驾驶开发的主流理念,都是“大数据-大模型-大算力”打法。OpenAI没有驾驶数据,要想给出更好的自动驾驶技术,大算力没问题,大模型也可以有,大数据则是无源之水——如果能靠仿真生成,至少逻辑上说得通。但不少专家认为,依赖仿真数据存在巨大风险。 2023 年OpenAI 向Ghost Autonomy投资500万美元。这家自动驾驶公司还同时获得了微软的算力支持,也曾尝试将AI语言模型应用于自动驾驶。但是,它在2024年就倒闭了。 官方通告说,通过将大语言模型驱动的语音助手和智能体引入车内,下一代汽车将成为具备深度个性化体验的生产力工具。 通告还说,合作的核心目标之一是实现移动设备与私人车辆智能系统的无缝连接。此外,Applied Intuition 还将在多个部门部署 ChatGPT,助力员工提升工作效率、优化策略规划,以更高效地实现公司目标。 业界曾有观点认为,依托大语言模型的快速进步,自动驾驶一类的空间智能可能很快实现。但是,如今的AI大牛们,都认为,光靠语言模型,是不够的。 奥特曼也曾经表示,世界模型需具备“理解物理因果关系、预测事件发展” 的能力,这与 LLM 的推理能力结合,可能推动AGI(通用人工智能)突破。 杨立昆就说,当前AI虽在多个领域展现惊人能力,其仍缺乏理解物理世界、持久记忆、逻辑推理与分层规划四大人类智能核心特征。 杨立昆在Meta开源世界模型V-JEPA 2是说,在世界模型的帮助下,AI不再需要数百万次的训练才能掌握一项新的能力,世界模型直接告诉了AI世界是怎样运行的,这可以极大提升效率。 在CES 2025上,英伟达CEO黄仁勋说,“机器人的 ChatGPT 时刻即将到来。与大语言模型类似,世界基础模型(World Model)对推动机器人和自动驾驶汽车的开发至关重要。” 英伟达发布的Cosmos 世界基础模型,就是专为物理交互、工业环境和驾驶环境的高质量生成而构建,具备生成逼真视频、创建合成训练数据等能力,帮助机器人和汽车更好地理解物理世界。 人形机器人的基础模型和自动驾驶非常接近。在探索世界模型的过程中,OpenAI如果有所突破,并将其应用于自动驾驶,是顺理成章的。毕竟,自动驾驶市场是毫无疑问的万亿美元级市场。


