← 回總覽

趋境 ATaaS 平台发布,打造日均万亿产能的“Token 工厂”

📅 2026-03-28 21:58 十三 人工智能 1 分鐘 1230 字 評分: 86
TaaS Token as a Service AI Infra 趋境科技 KV Cache
📌 一句话摘要 趋境科技发布 ATaaS 平台,提出从模型服务向 Token 服务(TaaS)转型的理念,通过异构协同和大规模 KV Cache 技术打造日均万亿产能的「Token 工厂」。 📝 详细摘要 文章报道了 2026 中关村论坛上趋境科技发布的 ATaaS 高效能 AI Token 生产服务平台。郑纬民院士在会上指出,AI 产业核心已从关注模型参数转向稳定、低成本、高质量的 Token 产能交付,即「Token 即服务」(TaaS)。ATaaS 平台通过「六合」(异构推理)、「月饼」(KV Cache 缓存)、「双仪」(SLO 仿真)和「万象」(极致弹性)四大核心技术,旨在解决硬

📌 一句话摘要

趋境科技发布 ATaaS 平台,提出从模型服务向 Token 服务(TaaS)转型的理念,通过异构协同和大规模 KV Cache 技术打造日均万亿产能的「Token 工厂」。

📝 详细摘要

文章报道了 2026 中关村论坛上趋境科技发布的 ATaaS 高效能 AI Token 生产服务平台。郑纬民院士在会上指出,AI 产业核心已从关注模型参数转向稳定、低成本、高质量的 Token 产能交付,即「Token 即服务」(TaaS)。ATaaS 平台通过「六合」(异构推理)、「月饼」(KV Cache 缓存)、「双仪」(SLO 仿真)和「万象」(极致弹性)四大核心技术,旨在解决硬件闲置与算力配置粗放等行业困境。该平台支持万亿参数模型快速拉起,并实现日均万亿级 Token 整体产能。此外,趋境科技展示了与华为昇腾、京东云等伙伴在国产算力优化及 Mooncake 开源生态方面的深度协同成果。

💡 主要观点

- AI 产业范式转移:从模型服务(MaaS)转向 Token 服务(TaaS)。 随着智能体和 AI Coding 应用爆发,行业关注点已从模型可用性全面转向稳定、低成本、高质量交付的 Token 产能,Token 成为衡量基础设施效能的核心指标。

通过「以存换算」技术大幅降低 GPU 算力开销。 利用超体量 KV Cache 缓存技术(Mooncake),将缓存空间扩展百倍以上,缓存命中率最高可达 90%,从而直接削减 90% 的 GPU 算力需求。
全系统异构协同打破算力瓶颈并降低成本。 通过重构大模型计算逻辑,深度融合 CPU+GPU 以及国产与非国产算力,实现任务智能分流,可将万卡级智算集群的运营成本压降 20% 以上。

💬 文章金句

- 未来的智能基础设施应围绕「Token 即服务(TaaS,Token as a Service)」进行重构。

  • 只有让智能生成像水电一样被稳定地调度与供给,才能真正迎来算力制造 Token 为王的普惠智能时代。
  • AI 产业的核心关注焦点,正从「模型参数规模、模型可用性」全面转向「稳定、低成本、高质量交付的 Token 产能」。

📊 文章信息

AI 评分:86

来源:量子位

作者:十三

分类:人工智能

语言:中文

阅读时间:13 分钟

字数:3156

标签: TaaS, Token as a Service, AI Infra, 趋境科技, KV Cache

阅读完整文章

查看原文 → 發佈: 2026-03-28 21:58:24 收錄: 2026-03-29 00:00:43

🤖 問 AI

針對這篇文章提問,AI 會根據文章內容回答。按 Ctrl+Enter 送出。