DeepSeek 发布 V4 预览版(Pro 与 Flash),标配百万上下文并采用 DSA 稀疏注意力机制,性能直追顶级闭源模型。
📝 详细摘要
DeepSeek 正式推出 V4 系列模型预览版,包含 Pro 和 Flash 两个版本。该系列模型的核心亮点在于标配百万字超长上下文,并通过全新的 DSA 稀疏注意力机制大幅优化了计算与显存需求。Pro 版本在 Agent 能力、世界知识和推理性能上达到开源领先水平;Flash 版本则侧重于经济高效的 API 服务。目前模型权重、技术报告已开源,API 接口已同步上线。
📊 文章信息
AI 初评:88
来源:ginobefun(@hongming731)
作者:
分类:人工智能
语言:中文
阅读时间:4 分钟
字数:821
标签: DeepSeek-V4, 开源模型, 百万上下文, DSA 注意力, AI 资讯