最早做文生视频的人，开始构建世界

📌 一句话摘要

本文深度对话智象未来创始人梅涛与 CTO 姚霆，揭示了这家文生视频创业公司从图像生成到世界模型的战略演进、商业模式探索与认知迭代历程。

📝 详细摘要

本文是虎嗅对智象未来创始人梅涛和 CTO 姚霆的深度访谈报道。文章首先介绍了智象未来在文生图榜单上的成绩，以及其从 DiT 架构向 UiT 架构的技术转向，旨在用更少成本实现更优效果。核心内容围绕公司战略展开：梅涛将公司定位为视频领域的 Anthropic，走模型与应用双轮驱动的路线，聚焦跨境电商短视频营销、影视制作和专业级 C 端创作三个场景。文章详细阐述了其从 SaaS 到 RaaS（按结果付费）的商业模式探索，以及如何通过 Agent 战略构建护城河。此外，文章重点探讨了智象未来向世界模型进军的布局，通过与诺亦腾的合作案例，展示了视频生成模型向具身智能世界模型拓展的路径。访谈部分揭示了梅涛对创始人认知迭代的焦虑、创业过程中的试错经验，以及团队对技术理想的坚持。

💡 主要观点

- 智象未来定位为视频领域的 Anthropic，走模型与应用双轮驱动的 ToB 路线。 公司不做通用大模型，而是基于自身场景优化模型，聚焦跨境电商短视频营销、影视制作和专业级 C 端创作三个场景，以企业服务为核心商业模式，追求高复购率和客单价。

公司从 DiT 架构转向 UiT 架构，旨在用更少成本实现更优效果。 面对大厂在数据和算力上的优势，创业公司必须从架构层面创新。UiT 将文本、图像和控制条件统一到同一模型空间，让模型更早完成理解、对齐和生成，为走向世界模型奠定基础。

视频生成模型公司是构建世界模型的最有潜力候选者。 世界模型的核心是预测，这与视频生成模型的核心能力一致。通过与诺亦腾的合作，智象未来展示了将视频生成能力迁移至具身智能领域的可行性，其泛化能力是世界模型价值的体现。

创始人梅涛认为创业的最大挑战是认知迭代，而非资金或人才。 梅涛强调创始人必须成为懂技术、商业化、团队和资本的六边形战士，最担心自己的认知成为公司天花板，并希望团队能提供不同视角的反馈。

💬 文章金句

- 创业只能挣到自己认知范围内的钱，认知范围外是一个巨大的陷阱，把我们这帮青蛙陷在井里。

大模型的能力有点像海平面，一直在往上涨，很多公司就被淹没了。
在 AI 的商业模式里，最长久、最健康的应该一定是企业服务。
做视频生成模型的这波人，是最有可能把世界模型做成。
我最担心的一点，是我自己的认知迭代不够快，赶不上行业的迭代速度。

📊 文章信息

AI 初评：86

来源：虎嗅APP

作者：虎嗅APP

分类：人工智能

语言：中文

阅读时间：32 分钟

字数：7903

标签：智象未来, 文生视频, 世界模型, AI创业, 商业模式

阅读完整文章

最早做文生视频的人，开始构建世界

🤖 問 AI