📡 Poller 最後抓取: 1 小時前 (06-08 22:00)
BestBlogs 精選 (21603)
🏷️ 熱門標籤
● 今年高考,我让 12 个顶级 AI 一起考了语文和数学,结果有点意外。
● 高考前一天,五个 AI 出了同一道作文题
● 刺破成功率幻象,直面具身智能的「真灵巧」,机器人精细操作评测新范式来了!
● 基于顶级 Agent(Claude Code)的 Harness 工程搭建式业务 Agent 评测方案
📅 2026-06-05 08:30 (3 天前) 阿里云开发者 人工智能 2 分鐘 ★ 88
● 李飞飞再出手,空间智能的 ImageNet 来了
● Google 在 I/O 2026 发布 Gemini 3.5 Flash,性能全面超越 3.1 Pro
📅 2026-05-20 08:28 (19 天前) meng shao 人工智能 1 分鐘 ★ 83
● 刚刚,Claude Mythos 打爆 AI 评测天花板!超指数狂飙,2027 奇点加速
📅 2026-05-11 13:05 (28 天前) 新智元 人工智能 2 分鐘 ★ 82
● 「生物信息学」评测,Claude 反超人类专家
📅 2026-04-30 17:11 (04-30 17:11) 赛博禅心 人工智能 2 分鐘 ★ 87
● 一代版本一代神?新神是 GPT-2 还是 Uni-1?
● SWE-bench 满分,0 个 bug 修复:伯克利造了个专门作弊的 AI
● 短短 3 个月,高德已拿下具身智能领域 15 项世界第一
● Agent 记忆赛道大洗牌!LoCoMo-Refined 重磅发布,主流记忆框架迎来核心检验
📅 2026-04-15 16:31 (04-15 16:31) AI科技评论 人工智能 2 分鐘 ★ 87
● ARC Prize 开源 ARC-AGI-3 人类基准数据集
● GLM-5.1 第一印象视频回顾
● 如何定义“人味儿”?——HeartBench 评测体系建设实践
📅 2026-03-16 08:31 (03-16 08:31) 阿里云开发者 人工智能 1 分鐘 ★ 89
● OpenAI 为龙虾紧急收购了一家 23 人公司