← 回總覽

Redis 之父下场,给 DeepSeek V4 单独造了一台推理引擎

📅 2026-05-08 16:20 henry 人工智能 2 分鐘 1492 字 評分: 87
DeepSeek V4 本地推理 ds4.c antirez Mac
📌 一句话摘要 Redis 之父 antirez 为 DeepSeek V4 Flash 打造了一款名为 ds4.c 的专用本地推理引擎,在 Mac 上实现了 284B 参数模型的高效运行。 📝 详细摘要 本文报道了 Redis 创始人 antirez(Salvatore Sanfilippo)发布的新项目 ds4.c,这是一个专门为 DeepSeek V4 Flash 模型打造的本地推理引擎。项目使用 C + Metal 语言从零编写,仅支持 Apple Silicon 平台,通过非对称量化、KV 缓存硬盘化、内置 OpenAI/Anthropic API 兼容层等三项关键技术,在 12

📌 一句话摘要

Redis 之父 antirez 为 DeepSeek V4 Flash 打造了一款名为 ds4.c 的专用本地推理引擎,在 Mac 上实现了 284B 参数模型的高效运行。

📝 详细摘要

本文报道了 Redis 创始人 antirez(Salvatore Sanfilippo)发布的新项目 ds4.c,这是一个专门为 DeepSeek V4 Flash 模型打造的本地推理引擎。项目使用 C + Metal 语言从零编写,仅支持 Apple Silicon 平台,通过非对称量化、KV 缓存硬盘化、内置 OpenAI/Anthropic API 兼容层等三项关键技术,在 128GB MacBook Pro M3 Max 上实现了 2-bit 量化下 26.68 token/s 的生成速度。文章还探讨了 antirez 选择「一个模型一个引擎」的核心理念,以及由此引发的关于本地推理未来方向的讨论。此外,文章介绍了 antirez 的个人背景和编程哲学,强调 ds4.c 项目体现了其一贯追求「小、精确、自成一体」的风格。

💡 主要观点

- antirez 为 DeepSeek V4 Flash 打造了专用推理引擎 ds4.c。 该项目使用 C + Metal 从零编写,仅支持 Apple Silicon,目标是让 284B 参数的 MoE 模型在 Mac 上达到可用级别的推理速度。

ds4.c 通过三项关键技术实现高效本地推理。 非对称量化(MoE 专家层 2-bit,其他层 Q8)、KV 缓存写入磁盘跳过重复 prefill、内置 OpenAI/Anthropic API 兼容层直接对接 coding agent。
项目体现了「一个模型一个引擎」的专用化思路。 antirez 认为通用引擎因兼容性而妥协性能,专用引擎可针对单一模型做极致优化,但代价是模型过时后需从头构建。
ds4.c 的开发过程大量依赖 AI 辅助。 antirez 公开承认该软件在 GPT 5.5 的强力辅助下开发,人类负责想法、测试和调试,这本身也反映了 AI 辅助编程的实践价值。

💬 文章金句

- 把 DeepSeek V4 Flash,在 Mac 上跑到极致。

  • 这些 2-bit 量化不是开玩笑,它们在 coding agent 下表现良好,能可靠地调用工具。
  • 本地推理应该是三件事一起做好,开箱即用。
  • 如果你不接受 AI 辅助开发的代码,这个软件不适合你。
  • 现代编程正变得复杂、无趣,全是要粘合的层。它正失去大部分美感。

📊 文章信息

AI 初评:87

来源:量子位

作者:henry

分类:人工智能

语言:中文

阅读时间:14 分钟

字数:3266

标签: DeepSeek V4, 本地推理, ds4.c, antirez, Mac

阅读完整文章

查看原文 → 發佈: 2026-05-08 16:20:40 收錄: 2026-05-08 20:00:02

🤖 問 AI

針對這篇文章提問,AI 會根據文章內容回答。按 Ctrl+Enter 送出。