全部 未讀 (12239) ★ 收藏 (0) 🤖 人工智能 (7794) 📊 商业科技 (1919) 💻 软件编程 (1219) 📁 个人成长 (762) 🎨 产品设计 (214) 📁 生活文化 (131) 📁 媒体资讯 (80) 📁 投资财经 (76) 📁 AI 产品 (39) 📁 AI (5)
篩選中: 🏷️ APEX-SWE 共 1 篇 ✕ 清除篩選
12241
全部文章
12239
未讀
111
今日新增
0
收藏
📡 Poller 最後抓取: 47 分鐘前 (04-18 20:00)
BestBlogs 精選 (12220)

🏷️ 熱門標籤

AI Agent 1371 AI 智能体 738 Claude Code 656 Anthropic 651 LLM 564 AI 编程 538 OpenClaw 501 开源 445 AI 安全 410 Claude 400 AI 398 OpenAI 371 软件工程 359 开发者工具 349 生产力 308 GitHub 254 自动化 241 AI 基础设施 229 AI 开发 226 MCP 225
Cognition 与 Mercor 联合发布 APEX-SWE 基准测试
📌 一句话摘要 Cognition 与 Mercor 联合推出了 APEX-SWE,这是一个旨在评估 AI 模型在真实且复杂的软件工程任务中表现的新基准测试。 📝 详细摘要 Cognition 与 Mercor 合作发布了 APEX-SWE,旨在解决传统代码评估方式的局限性。与标准基准测试不同,
📅 2026-03-25 01:52 (24 天前) Cognition 人工智能 1 分鐘 ★ 81
APEX-SWE AI 基准测试 软件工程 Cognition