在 iPhone 17 Pro 上以 40 tk/s 的速度运行 Gemma 4 E2B

📅 2026-04-08 12:00 Min Choi 人工智能 1 分鐘 526 字評分: 81

📌 一句话摘要通过针对 Apple Silicon 优化的 MLX 框架，Gemma 4 E2B 在 iPhone 17 Pro 上达到了约 40 tokens/s 的运行速度。 📝 详细摘要作为系列推文的一部分，本推文强调了谷歌 Gemma 4 E2B 模型在 iPhone 17 Pro 上原生运行的性能表现。通过利用针对 Apple Silicon 优化的 MLX 框架，该模型实现了约 40 tokens/s 的高吞吐量，展示了端侧大语言模型（LLM）在推理和图像理解能力方面的重大进展。 📊 文章信息 AI 评分：81 来源：Min Choi(@minchoi) 作者：Min C

📌 一句话摘要

通过针对 Apple Silicon 优化的 MLX 框架，Gemma 4 E2B 在 iPhone 17 Pro 上达到了约 40 tokens/s 的运行速度。

📝 详细摘要

作为系列推文的一部分，本推文强调了谷歌 Gemma 4 E2B 模型在 iPhone 17 Pro 上原生运行的性能表现。通过利用针对 Apple Silicon 优化的 MLX 框架，该模型实现了约 40 tokens/s 的高吞吐量，展示了端侧大语言模型（LLM）在推理和图像理解能力方面的重大进展。

📊 文章信息

AI 评分：81

来源：Min Choi(@minchoi)

作者：Min Choi

分类：人工智能

语言：英文

阅读时间：1 分钟

字数：116

标签： Gemma 4, MLX, Apple Silicon, 端侧 AI, iPhone 17 Pro

阅读推文

查看原文 → 發佈: 2026-04-08 12:00:40 收錄: 2026-04-08 14:00:45

在 iPhone 17 Pro 上以 40 tk/s 的速度运行 Gemma 4 E2B

🤖 問 AI