News

从好莱坞到世界模型:Runway 欲在视频生成领域叫板谷歌

从好莱坞到世界模型:Runway 欲在视频生成领域叫板谷歌

人工智能视频生成初创公司 Runway 正在进行一场巨大的豪赌:他们认为视频生成不仅仅是为了拍电影,更是通往“世界模型”(World Models)的终极路径。在主流 AI 实验室纷纷押注大语言模型(LLM)时,Runway 选择了一条截然不同的赛道,试图在理解物理世界的维度上超越谷歌和 OpenAI。

Runway 的联合创始人兼 CEO Cristóbal Valenzuela 认为,语言虽然强大,但在描述物理现实方面存在局限性。而视频数据捕捉到了光影、重力、碰撞以及物体在空间中运动的精细逻辑。通过训练能够预测下一帧视频的模型,Runway 实际上是在教 AI 理解现实世界的运行法则。这种被称为“通用世界模型”(General World Models, GWM)的技术,被认为是实现通用人工智能(AGI)的关键拼图。

从最早在 NYU ITP 实验室诞生的创意工具,到如今发布 Gen-1、Gen-2 以及最新的 Gen-3 Alpha,Runway 的演进路径极其清晰。最初,它只是为电影制作人提供绿幕移除和转描工具,但随着底层模型能力的爆发,它已经能够根据文字或图像生成极具物理质感的视频片段。Valenzuela 表示,Runway 的优势在于其“局外人”身份,这让他们能够专注于视频原生架构,而不是简单地套用处理文本的逻辑。

然而,竞争正在白热化。谷歌推出了 Veo,OpenAI 凭借 Sora 震惊业界,这些巨头拥有近乎无限的算力和数据资源。面对竞争,Runway 并不退缩。他们认为,专注于“创意理解”和“物理模拟”的深度融合是其护城河。Runway 不仅仅是在做一个生成视频的 App,它正在构建一个模拟器,一个能够理解并重塑现实的数字底座。对于科技从业者而言,这意味着 AI 的下一个战场将从对话框转向对三维物理世界的实时模拟。

↗ 阅读原文