Redis 之父 antirez 为 DeepSeek V4 Flash 打造了一款名为 ds4.c 的专用本地推理引擎,在 Mac 上实现了 284B 参数模型的高效运行。
📝 详细摘要
本文报道了 Redis 创始人 antirez(Salvatore Sanfilippo)发布的新项目 ds4.c,这是一个专门为 DeepSeek V4 Flash 模型打造的本地推理引擎。项目使用 C + Metal 语言从零编写,仅支持 Apple Silicon 平台,通过非对称量化、KV 缓存硬盘化、内置 OpenAI/Anthropic API 兼容层等三项关键技术,在 128GB MacBook Pro M3 Max 上实现了 2-bit 量化下 26.68 token/s 的生成速度。文章还探讨了 antirez 选择「一个模型一个引擎」的核心理念,以及由此引发的关于本地推理未来方向的讨论。此外,文章介绍了 antirez 的个人背景和编程哲学,强调 ds4.c 项目体现了其一贯追求「小、精确、自成一体」的风格。
💡 主要观点
- antirez 为 DeepSeek V4 Flash 打造了专用推理引擎 ds4.c。 该项目使用 C + Metal 从零编写,仅支持 Apple Silicon,目标是让 284B 参数的 MoE 模型在 Mac 上达到可用级别的推理速度。
💬 文章金句
- 把 DeepSeek V4 Flash,在 Mac 上跑到极致。
- 这些 2-bit 量化不是开玩笑,它们在 coding agent 下表现良好,能可靠地调用工具。
- 本地推理应该是三件事一起做好,开箱即用。
- 如果你不接受 AI 辅助开发的代码,这个软件不适合你。
- 现代编程正变得复杂、无趣,全是要粘合的层。它正失去大部分美感。
📊 文章信息
AI 初评:87
来源:量子位
作者:henry
分类:人工智能
语言:中文
阅读时间:14 分钟
字数:3266
标签: DeepSeek V4, 本地推理, ds4.c, antirez, Mac