全部 未讀 (11821) ★ 收藏 (0) 🤖 人工智能 (7594) 📊 商业科技 (1791) 💻 软件编程 (1198) 📁 个人成长 (736) 🎨 产品设计 (209) 📁 生活文化 (109) 📁 投资财经 (71) 📁 媒体资讯 (69) 📁 AI 产品 (39) 📁 AI (5)
篩選中: 🏷️ 边缘 AI 共 23 篇 ✕ 清除篩選
11823
全部文章
11821
未讀
140
今日新增
0
收藏
📡 Poller 最後抓取: 1 小時前 (04-16 14:00)
BestBlogs 精選 (11804)

🏷️ 熱門標籤

AI Agent 1324 AI 智能体 734 Claude Code 645 Anthropic 622 LLM 563 AI 编程 501 OpenClaw 498 开源 439 AI 安全 396 AI 396 Claude 384 OpenAI 362 软件工程 354 开发者工具 343 生产力 308 GitHub 251 自动化 238 AI 基础设施 227 AI 开发 225 MCP 223
小模型带来的智能民主化
📌 一句话摘要 Garry Tan 探讨了前沿模型的突破(如 Gemma 4)如何加速更易获取的小型模型的性能提升。 📝 详细摘要 引用谷歌 Gemma 4 在数学基准测试中达到 89.2% 的巨大飞跃,Tan 认为大型前沿模型的进步会向下渗透到小型模型。这一趋势使得高水平智能可以在 MacBo
📅 2026-04-11 00:36 (5 天前) Garry Tan 人工智能 1 分鐘 ★ 89
Gemma 4 小型语言模型 边缘 AI 谷歌 AI
ElevenLabs 宣布支持本地部署与设备端部署
📌 一句话摘要 ElevenLabs 正在扩展其企业级服务,新增本地部署(On-Premise)和设备端(On-Device)部署选项,突破了原有的云端和 VPC 方案限制。 📝 详细摘要 ElevenLabs 宣布对其部署架构进行重大扩展。通过引入本地部署和设备端部署选项,该公司旨在支持更广泛
📅 2026-04-10 00:46 (6 天前) ElevenLabs 人工智能 1 分鐘 ★ 87
ElevenLabs 本地部署 边缘 AI 企业级 AI
Nano Banana 贴纸:实现参考
📌 一句话摘要 Philipp Schmid 提供了“Stickers by Nano”项目的参考,展示了轻量化 AI 模型的集成。 📝 详细摘要 在推文系列的最后部分,作者引用了“Stickers by Nano”项目。通过引用之前的技术帖子,他将现场演示与底层的技术框架联系起来,该框架可能涉
📅 2026-04-08 22:52 (7 天前) Philipp Schmid 人工智能 1 分鐘 ★ 79
Gemini Nano 端侧 AI 边缘 AI Google AI
Gemma 4 大语言模型成功在任天堂 Switch 上本地运行
📌 一句话摘要 一项技术演示展示了 Google 的 Gemma 4 模型在任天堂 Switch 上本地运行,生成速度为每秒 1.5 个 token。 📝 详细摘要 来自 Google DeepMind 的 Philipp Schmid 转发了一项社区成就:Gemma 4 模型被成功移植到任天堂
📅 2026-04-08 17:48 (7 天前) Philipp Schmid 人工智能 1 分鐘 ★ 76
Gemma 4 边缘 AI 任天堂 Switch LLM 可移植性
AI-RAN 正在重新定义企业边缘智能与自主性
📌 一句话摘要 AI-RAN 将无线基础设施从被动传输管道转变为主动计算架构,为工业应用实现实时边缘 AI 和集成感知。 📝 详细摘要 本文探讨了 AI-RAN(人工智能无线接入网)的概念,即将 AI 工作负载直接集成到无线基础设施中。通过将网络演进为计算架构和传感器(ISAC),企业可以实现实
📅 2026-04-07 23:05 (8 天前) VB Staff 人工智能 1 分鐘 ★ 75
AI-RAN 边缘 AI 5G 6G
23 个月的周期:从前沿 AI 到掌上算力
📌 一句话摘要 Tomasz Tunguz 分析了 AI 模型压缩的飞速发展,指出前沿级性能现已能在短短 23 个月内从数据中心迁移到智能手机上。 📝 详细摘要 这条推文强调了 AI 模型压缩的加速步伐,并以 Google 发布 Gemma 4 E4B 为例,展示了前沿级性能如何在移动设备上本地
📅 2026-04-07 01:58 (9 天前) Tomasz Tunguz 人工智能 1 分鐘 ★ 82
AI 压缩 Gemma 4 边缘 AI 模型蒸馏
Gemma 4 E2B 在 AI Edge Gallery 中实现端侧运行
📌 一句话摘要 Philipp Schmid 展示了 Gemma 4 E2B 模型通过 Google AI Edge Gallery 应用在 iPhone 17 Pro Max 上本地运行,展示了其工具调用能力。 📝 详细摘要 这条推文展示了 Gemma 4 E2B 模型在移动硬件上本地运行的实
📅 2026-04-06 23:07 (9 天前) Philipp Schmid 人工智能 3 分鐘 ★ 82
Gemma 4 端侧 AI 边缘 AI Google
Qdrant 将在 HumanX 2026 上探讨端到云视频异常检测
📌 一句话摘要 Qdrant 宣布将在 HumanX 2026 上进行技术分享,涵盖利用 Qdrant Edge 和 Vultr GPU 索引实现的端到云视频异常检测。 📝 详细摘要 这条推文预告了 Qdrant 的 Thierry Damiba 即将在 HumanX 2026 上发表的演讲。演
📅 2026-04-06 19:32 (9 天前) Qdrant 人工智能 1 分鐘 ★ 76
Qdrant 边缘 AI 向量数据库 视频异常检测
端侧 AI 的战略转型
📌 一句话摘要 Greg Isenberg 强调了端侧 AI 的潜力,并引用了 Google Gemma 4 模型在 iPhone 17 Pro 上本地运行的演示案例。 📝 详细摘要 Greg Isenberg 对 Google Gemma 4 模型在 iPhone 17 Pro 上本地运行的技
📅 2026-04-05 05:11 (11 天前) GREG ISENBERG 人工智能 1 分鐘 ★ 80
端侧 AI 边缘 AI Gemma 4 Google
Gemma 4 与混合 AI 模型的未来
📌 一句话摘要 Matthew Berman 探讨了 Gemma 4 模型的潜力,强调了其在消费级硬件上的高效表现,以及向混合 AI 架构发展的趋势。 📝 详细摘要 这条推文重点介绍了 Gemma 4 的发布,指出其在消费级硬件上运行的强大性能令人印象深刻。作者认为,这种能力预示着 AI 领域正
📅 2026-04-03 08:18 (13 天前) Matthew Berman 人工智能 1 分鐘 ★ 82
Gemma 4 边缘 AI 混合 AI 消费级硬件
了解开放模型与 Gemma 生态系统
📌 一句话摘要 对开放模型进行了通俗易懂的解释,强调了隐私、本地运行以及 Gemma 社区的蓬勃发展。 📝 详细摘要 这条跟进推文对“开放模型”的概念进行了科普,强调了在本地运行 AI 以实现隐私保护和离线功能的优势。它还展示了 Gemma 生态系统的规模,指出其下载量已超过 4 亿次,社区创建
📅 2026-04-03 00:03 (13 天前) Google AI 人工智能 1 分鐘 ★ 83
开放模型 Gemma 边缘 AI 微调
Google DeepMind 发布 Gemma 4 开源模型
📌 一句话摘要 Demis Hassabis 宣布推出 Gemma 4,包含四种不同规格的模型,分别针对原始性能、低延迟和边缘设备部署进行了优化。 📝 详细摘要 Google DeepMind 发布了 Gemma 4,这是一套全新的开源模型系列,提供四种规格:用于高性能的 31B 稠密(dens
📅 2026-04-03 00:08 (13 天前) Demis Hassabis 人工智能 1 分鐘 ★ 94
Gemma 4 Google DeepMind LLM MoE
通过 Gemma 4 将 AI 带向边缘与设备端
📌 一句话摘要 NVIDIA 宣布其硬件生态系统全面支持 Google 的 Gemma 4 模型系列,通过 vLLM 和 NeMo 等优化工具,实现从数据中心到边缘机器人的可扩展部署。 📝 详细摘要 本文详细介绍了 NVIDIA 如何将其硬件堆栈(包括 Blackwell、Jetson 和 RT
📅 2026-04-03 00:28 (13 天前) Anu Srivastava 人工智能 1 分鐘 ★ 87
Gemma 4 NVIDIA 边缘 AI LLM
Google 发布 Gemma 4 开源 AI 模型,并切换至 Apache 2.0 许可证
📌 一句话摘要 Google 发布了 Gemma 4,这是一套针对高端本地硬件和边缘设备优化的全新开放权重 AI 模型,同时转向了更宽松的 Apache 2.0 许可证。 📝 详细摘要 Google 最新的 Gemma 4 发布引入了四种针对不同本地部署场景量身定制的模型尺寸。26B 混合专家模
📅 2026-04-03 00:36 (13 天前) Ryan Whitwam 人工智能 1 分鐘 ★ 87
Gemma 4 Google 开放权重 Apache 2.0
对本地大模型进展的认可
📌 一句话摘要 Garry Tan 认可在消费级硬件上运行高性能本地模型的能力及其日益增长的重要性。 📝 详细摘要 Garry Tan 强调了本地 AI 模型的重要性,特别提到了一个新的 Qwen3.5 蒸馏模型,它在消费级硬件上实现了接近 Opus 级别的推理能力。这与行业向本地化、高效且低成
📅 2026-04-02 13:01 (14 天前) Garry Tan 人工智能 1 分鐘 ★ 86
本地大模型 AI Qwen 开源
DreamLite:用于图像生成与编辑的轻量级端侧统一模型
📌 一句话摘要 介绍 DreamLite,这是一款针对端侧图像生成和编辑任务优化的轻量级统一模型。 📝 详细摘要 这条推文分享了“DreamLite”,这是一篇详细介绍了一款专为高效端侧图像生成和编辑而设计的轻量级统一模型的研究论文。这对于专注于边缘 AI 和移动端部署的开发者来说非常重要。 �
📅 2026-04-01 00:08 (15 天前) AK 人工智能 1 分鐘 ★ 82
DreamLite 端侧 AI 图像生成 边缘 AI
为何要在桌面上运行本地大语言模型 (Local LLM)
📌 一句话摘要 Alex Finn 倡导在个人硬件上运行本地大语言模型,并强调了本地超级智能带来的变革性潜力。 📝 详细摘要 这条推文倡导向本地 AI 推理的转变,认为在个人硬件上运行像 Qwen3.5-27b 这样强大的模型具有颠覆性。通过引用一位用户的成功案例——实现了 262k 上下文、工
📅 2026-03-28 09:14 (19 天前) Alex Finn 人工智能 1 分鐘 ★ 82
本地大语言模型 AI 基础设施 Qwen 边缘 AI
NVIDIA IGX Thor 赋能工业、医疗和机器人边缘 AI 应用
📌 一句话摘要 NVIDIA 推出了 IGX Thor 平台,这是一款基于 Blackwell 架构、企业级且通过安全认证的边缘 AI 解决方案,旨在为工业、医疗和机器人应用提供高性能、确定性的计算能力。 📝 详细摘要 本文详细介绍了 NVIDIA IGX Thor 平台的发布,这是一款稳健的工
📅 2026-03-24 04:30 (23 天前) Suhas Hariharapura Sheshadri 人工智能 2 分鐘 ★ 87
NVIDIA IGX Thor 边缘 AI 工业 AI Blackwell 架构
QCon London 2026:在边缘运行 AI —— 在浏览器中直接运行实际工作负载
📌 一句话摘要 James Hall 探讨了向浏览器原生 AI 的转变,详细介绍了 WebGPU、Transformers.js 和 Chrome 的 Prompt API 如何实现私密、低延迟且具有成本效益的本地工作负载。 📝 详细摘要 在 QCon London 2026 大会上,Paral
📅 2026-03-24 00:28 (23 天前) Daniel Curtis 人工智能 2 分鐘 ★ 87
边缘 AI WebGPU Transformers.js 浏览器原生 AI
Nemotron 3 Nano 4B:用于高效本地 AI 的紧凑型混合模型
📌 一句话摘要 英伟达推出 Nemotron 3 Nano 4B,这是一款混合 Mamba-Transformer 模型,通过新颖的弹性剪枝和蒸馏框架针对边缘设备进行了优化。 📝 详细摘要 文章详细介绍了 Nemotron 3 Nano 4B 的发布,这是一款紧凑型语言模型,专为在英伟达 RTX
📅 2026-03-18 07:17 (29 天前) Vinay Raman, Ameya Sunil Mahabaleshwarkar, Hayley Ross, Bilal Kartal, Aditya Malte, Zijia Chen, Ali Taghibakhshi, Sharath Turuvekere Sreenivas, Saurav Muralidharan, Khalil Ben Khaled, Nima Tajbakhsh, Pavlo Molchanov, Oluwatobi Olabiyi, Yoshi Suhara 人工智能 10 分鐘 ★ 85
英伟达 SLM Mamba-Transformer 边缘 AI