← 回總覽

最早做文生视频的人,开始构建世界

📅 2026-05-17 11:16 虎嗅APP 人工智能 2 分鐘 1456 字 評分: 86
智象未来 文生视频 世界模型 AI创业 商业模式
📌 一句话摘要 本文深度对话智象未来创始人梅涛与 CTO 姚霆,揭示了这家文生视频创业公司从图像生成到世界模型的战略演进、商业模式探索与认知迭代历程。 📝 详细摘要 本文是虎嗅对智象未来创始人梅涛和 CTO 姚霆的深度访谈报道。文章首先介绍了智象未来在文生图榜单上的成绩,以及其从 DiT 架构向 UiT 架构的技术转向,旨在用更少成本实现更优效果。核心内容围绕公司战略展开:梅涛将公司定位为视频领域的 Anthropic,走模型与应用双轮驱动的路线,聚焦跨境电商短视频营销、影视制作和专业级 C 端创作三个场景。文章详细阐述了其从 SaaS 到 RaaS(按结果付费)的商业模式探索,以及如何通

📌 一句话摘要

本文深度对话智象未来创始人梅涛与 CTO 姚霆,揭示了这家文生视频创业公司从图像生成到世界模型的战略演进、商业模式探索与认知迭代历程。

📝 详细摘要

本文是虎嗅对智象未来创始人梅涛和 CTO 姚霆的深度访谈报道。文章首先介绍了智象未来在文生图榜单上的成绩,以及其从 DiT 架构向 UiT 架构的技术转向,旨在用更少成本实现更优效果。核心内容围绕公司战略展开:梅涛将公司定位为视频领域的 Anthropic,走模型与应用双轮驱动的路线,聚焦跨境电商短视频营销、影视制作和专业级 C 端创作三个场景。文章详细阐述了其从 SaaS 到 RaaS(按结果付费)的商业模式探索,以及如何通过 Agent 战略构建护城河。此外,文章重点探讨了智象未来向世界模型进军的布局,通过与诺亦腾的合作案例,展示了视频生成模型向具身智能世界模型拓展的路径。访谈部分揭示了梅涛对创始人认知迭代的焦虑、创业过程中的试错经验,以及团队对技术理想的坚持。

💡 主要观点

- 智象未来定位为视频领域的 Anthropic,走模型与应用双轮驱动的 ToB 路线。 公司不做通用大模型,而是基于自身场景优化模型,聚焦跨境电商短视频营销、影视制作和专业级 C 端创作三个场景,以企业服务为核心商业模式,追求高复购率和客单价。

公司从 DiT 架构转向 UiT 架构,旨在用更少成本实现更优效果。 面对大厂在数据和算力上的优势,创业公司必须从架构层面创新。UiT 将文本、图像和控制条件统一到同一模型空间,让模型更早完成理解、对齐和生成,为走向世界模型奠定基础。
视频生成模型公司是构建世界模型的最有潜力候选者。 世界模型的核心是预测,这与视频生成模型的核心能力一致。通过与诺亦腾的合作,智象未来展示了将视频生成能力迁移至具身智能领域的可行性,其泛化能力是世界模型价值的体现。
创始人梅涛认为创业的最大挑战是认知迭代,而非资金或人才。 梅涛强调创始人必须成为懂技术、商业化、团队和资本的六边形战士,最担心自己的认知成为公司天花板,并希望团队能提供不同视角的反馈。

💬 文章金句

- 创业只能挣到自己认知范围内的钱,认知范围外是一个巨大的陷阱,把我们这帮青蛙陷在井里。

  • 大模型的能力有点像海平面,一直在往上涨,很多公司就被淹没了。
  • 在 AI 的商业模式里,最长久、最健康的应该一定是企业服务。
  • 做视频生成模型的这波人,是最有可能把世界模型做成。
  • 我最担心的一点,是我自己的认知迭代不够快,赶不上行业的迭代速度。

📊 文章信息

AI 初评:86

来源:虎嗅APP

作者:虎嗅APP

分类:人工智能

语言:中文

阅读时间:32 分钟

字数:7903

标签: 智象未来, 文生视频, 世界模型, AI创业, 商业模式

阅读完整文章

查看原文 → 發佈: 2026-05-17 11:16:00 收錄: 2026-05-17 16:00:50

🤖 問 AI

針對這篇文章提問,AI 會根據文章內容回答。按 Ctrl+Enter 送出。