全部 未讀 (21710) ★ 收藏 (0) 🤖 人工智能 (11206) 📊 商业科技 (4475) 💻 软件编程 (1690) 📁 个人成长 (1607) 📁 生活文化 (866) 📁 媒体资讯 (843) 📁 投资财经 (538) 🎨 产品设计 (410) 📁 AI 产品 (39) 📁 体育运动 (28)
篩選中: 🏷️ 本地推理 共 9 篇 ✕ 清除篩選
21712
全部文章
21710
未讀
74
今日新增
0
收藏
📡 Poller 最後抓取: 43 分鐘前 (06-09 08:00)
BestBlogs 精選 (21677)

🏷️ 熱門標籤

AI Agent 2177 AI 编程 994 Anthropic 981 Claude Code 918 AI 智能体 780 OpenAI 745 LLM 689 开源 574 OpenClaw 557 Claude 557 AI 517 AI 安全 492 开发者工具 434 Codex 416 软件工程 399 具身智能 338 Agent 336 个人成长 334 GitHub 321 生产力 315
Redis 之父下场,给 DeepSeek V4 单独造了一台推理引擎
📌 一句话摘要 Redis 之父 antirez 为 DeepSeek V4 Flash 打造了一款名为 ds4.c 的专用本地推理引擎,在 Mac 上实现了 284B 参数模型的高效运行。 📝 详细摘要 本文报道了 Redis 创始人 antirez(Salvatore Sanfilippo)
📅 2026-05-08 16:20 (05-08 16:20) henry 人工智能 2 分鐘 ★ 87
DeepSeek V4 本地推理 ds4.c antirez
为了省 $25,不值得…
📌 一句话摘要 宝玉引用了一个中国开发者在飞机上用 MacBook 本地运行 Llama 70B 完成客户项目的精彩案例,并评论说为了省 25 美元 WiFi 费不值得这样做。 📝 详细摘要 这条推文引用了一个在技术社区广为流传的案例:一位中国开发者在跨大西洋航班上,拒绝支付 25 美元的机上
📅 2026-05-02 14:30 (05-02 14:30) 宝玉 人工智能 1 分鐘 ★ 87
Llama 70B 本地推理 离线工作流 llama.cpp
DFlash 推测解码为 Apple M 芯片本地 LLM 带来最高 4.13 倍加速
📌 一句话摘要 专为 Apple M 系列芯片优化的 DFlash 推测解码技术,结合 MLX 框架,为 Qwen3.5 等本地大模型带来了惊人的速度提升,最高达 4.13 倍。 📝 详细摘要 这条推文分享了一项针对 Apple M 系列芯片的本地大模型推理优化技术。它提到了“DFlash 推测
📅 2026-04-14 08:34 (04-14 08:34) Berryxia.AI 人工智能 1 分鐘 ★ 82
DFlash MLX Apple M芯片 本地推理
[AI 新闻] 耶稣受难日
📌 一句话摘要 Google 发布 Gemma 4 震撼开源界,行业焦点正转向智能体 harness 工程,以及如何管理多智能体工作流带来的认知负荷。 📝 详细摘要 本期 AINews 重点介绍了 Google 具有里程碑意义的 Gemma 4 发布,这是一个基于 Apache 2.0 许可的多
📅 2026-04-04 06:03 (04-04 06:03) Latent.Space 人工智能 2 分鐘 ★ 89
Gemma 4 开源 AI AI 智能体 本地推理
体验 Gemma 4:Google AI Edge Gallery 应用
📌 一句话摘要 介绍谷歌发布的安卓应用 Google AI Edge Gallery,支持本地运行 Gemma 4 模型及 Skills 工具调用体验。 📝 详细摘要 作为 Gemma 4 发布后的配套体验,谷歌推出了 Google AI Edge Gallery 安卓应用。该应用支持在移动端(
📅 2026-04-03 10:21 (04-03 10:21) 歸藏(guizang.ai) 人工智能 1 分鐘 ★ 81
Gemma 4 Android Google AI Edge AI 应用
在 Mac 上实现高性能的本地 Gemma 4 推理
📌 一句话摘要 Clement Delangue 展示了 Gemma 4 在 Mac 上以惊人的速度本地运行,突显了 llama.cpp 的高效性。 📝 详细摘要 这条推文转发并强调了 Georgi Gerganov 的演示,展示了 Gemma 4 在 Mac Studio 上本地运行的情况。它
📅 2026-04-03 03:48 (04-03 03:48) clem 🤗 人工智能 1 分鐘 ★ 88
Gemma 4 llama.cpp 本地推理 Mac
给 OpenClaw 做硬件没前途,但给上下文系统做,是值得的
📌 一句话摘要 泛灵人工智能推出的 HippoGenius 是一款主打「个人上下文中心」的高性能本地 AI 硬件,旨在通过持续、无感的全模态数据采集与本地大模型推理,降低人机交互摩擦并实现主动式任务自动化。 📝 详细摘要 本文是对泛灵人工智能团队的深度访谈,探讨了其 AI 硬件 HippoGen
📅 2026-04-02 18:41 (04-02 18:41) Founder Park 人工智能 2 分鐘 ★ 90
AI 硬件 上下文系统 本地推理 Agent
关于云端 AI Agent 的隐私警告
📌 一句话摘要 Clement Delangue 对云端 AI Agent 的隐私风险提出警告,并倡导采用本地推理解决方案。 📝 详细摘要 Clement Delangue 批评了云端 AI Agent 的隐私影响,特别提到了像“Paperclip”这样会将用户数据发送给云服务提供商的工具。他强
📅 2026-03-28 05:18 (03-28 05:18) clem 🤗 人工智能 1 分鐘 ★ 82
AI 隐私 本地推理 数据安全 AI Agent
Run Tiny AI Models Locally Using BitNet A Beginner Guide
📌 一句话摘要 本文是一份关于如何在本地 CPU 环境下,利用 bitnet.cpp 框架部署和运行微软 BitNet b1.58 三值权重模型的实战指南。 📝 详细摘要 文章详细介绍了微软研究员开发的 BitNet b1.58 模型,这是一种原生低比特语言模型,通过 -1、0、+1 的三值权重
📅 2026-03-11 00:00 (03-11 00:00) Abid Ali Awan 人工智能 2 分鐘 ★ 78
BitNet bitnet.cpp 本地推理 模型量化