DeepSWE 对 Opus 4.8 的评分与个人看法

📅 2026-05-31 21:11 Viking 人工智能 1 分鐘 640 字評分: 76

📌 一句话摘要作者分享 DeepSWE 对 Opus 4.8 的评分，认为其强于 4.7 且成本更低，但仍落后 GPT5.5，并表示对 Benchmark 已祛魅。 📝 详细摘要作者引用了 DeepSWE 对 Opus 4.8 的评分结果，指出该模型强于 4.7，成本更低、效率更高，但相比 GPT5.5 仍有较大差距。作者表示自己尚未深度使用，甚至还在用 4.6，主要是因为便宜。同时，作者表达了对 Benchmark 的祛魅态度，认为不如看推特上的真实评价，并认为 GPT5.5 是大多数人的最强模型。该推文包含个人观点和模型对比信息，有一定参考价值。 📊 文章信息 AI 初评：76

📌 一句话摘要

作者分享 DeepSWE 对 Opus 4.8 的评分，认为其强于 4.7 且成本更低，但仍落后 GPT5.5，并表示对 Benchmark 已祛魅。

📝 详细摘要

作者引用了 DeepSWE 对 Opus 4.8 的评分结果，指出该模型强于 4.7，成本更低、效率更高，但相比 GPT5.5 仍有较大差距。作者表示自己尚未深度使用，甚至还在用 4.6，主要是因为便宜。同时，作者表达了对 Benchmark 的祛魅态度，认为不如看推特上的真实评价，并认为 GPT5.5 是大多数人的最强模型。该推文包含个人观点和模型对比信息，有一定参考价值。

📊 文章信息

AI 初评：76

来源：Viking(@vikingmute)

作者：Viking

分类：人工智能

语言：中文

阅读时间：1 分钟

字数：158

标签： Opus 4.8, GPT5.5, DeepSWE, Benchmark, AI 模型评测

阅读推文

查看原文 → 發佈: 2026-05-31 21:11:58 收錄: 2026-06-01 12:00:44

DeepSWE 对 Opus 4.8 的评分与个人看法

🤖 問 AI