Salvatore Sanfilippo 认为推理速度比模型规模更为关键,并指出即便只有 35B 参数的模型,在 Apple Silicon 上对于严肃的生产环境来说也往往太慢了。
📝 详细摘要
作者批评了业界对运行超大规模模型的痴迷,并指出其实际效用在很大程度上受到推理速度的限制。他以在高端 Apple Silicon 上运行 Qwen 3.5 35B 为例,强调无论模型能力如何,只要推理速度“缓慢”,系统对于严肃的实时应用来说就毫无用处。
📊 文章信息
AI 评分:78
来源:antirez(@antirez)
作者:antirez
分类:人工智能
语言:英文
阅读时间:2 分钟
字数:271
标签: LLM, 推理速度, Apple Silicon, AI 性能, antirez