作者分享 DeepSWE 对 Opus 4.8 的评分,认为其强于 4.7 且成本更低,但仍落后 GPT5.5,并表示对 Benchmark 已祛魅。
📝 详细摘要
作者引用了 DeepSWE 对 Opus 4.8 的评分结果,指出该模型强于 4.7,成本更低、效率更高,但相比 GPT5.5 仍有较大差距。作者表示自己尚未深度使用,甚至还在用 4.6,主要是因为便宜。同时,作者表达了对 Benchmark 的祛魅态度,认为不如看推特上的真实评价,并认为 GPT5.5 是大多数人的最强模型。该推文包含个人观点和模型对比信息,有一定参考价值。
📊 文章信息
AI 初评:76
来源:Viking(@vikingmute)
作者:Viking
分类:人工智能
语言:中文
阅读时间:1 分钟
字数:158
标签: Opus 4.8, GPT5.5, DeepSWE, Benchmark, AI 模型评测