通过针对 Apple Silicon 优化的 MLX 框架,Gemma 4 E2B 在 iPhone 17 Pro 上达到了约 40 tokens/s 的运行速度。
📝 详细摘要
作为系列推文的一部分,本推文强调了谷歌 Gemma 4 E2B 模型在 iPhone 17 Pro 上原生运行的性能表现。通过利用针对 Apple Silicon 优化的 MLX 框架,该模型实现了约 40 tokens/s 的高吞吐量,展示了端侧大语言模型(LLM)在推理和图像理解能力方面的重大进展。
📊 文章信息
AI 评分:81
来源:Min Choi(@minchoi)
作者:Min Choi
分类:人工智能
语言:英文
阅读时间:1 分钟
字数:116
标签: Gemma 4, MLX, Apple Silicon, 端侧 AI, iPhone 17 Pro