全部 未讀 (11783) ★ 收藏 (0) 🤖 人工智能 (7568) 📊 商业科技 (1784) 💻 软件编程 (1196) 📁 个人成长 (735) 🎨 产品设计 (208) 📁 生活文化 (108) 📁 投资财经 (71) 📁 媒体资讯 (69) 📁 AI 产品 (39) 📁 AI (5)
篩選中: 🏷️ 模型能力 共 5 篇 ✕ 清除篩選
11785
全部文章
11783
未讀
102
今日新增
0
收藏
📡 Poller 最後抓取: 2 分鐘前 (04-16 12:00)
BestBlogs 精選 (11766)

🏷️ 熱門標籤

AI Agent 1319 AI 智能体 732 Claude Code 643 Anthropic 621 LLM 563 OpenClaw 498 AI 编程 497 开源 438 AI 396 AI 安全 395 Claude 381 OpenAI 362 软件工程 354 开发者工具 341 生产力 308 GitHub 249 自动化 238 AI 基础设施 227 AI 开发 224 MCP 223
我们与开源顶流实验室一起聊了聊 Harness Design
📌 一句话摘要 本文通过访谈星舟无界创始团队,探讨了在模型能力快速提升背景下,AI Agent 基础设施(Harness Design)缺失的核心问题、设计原则与未来演进方向。 📝 详细摘要 文章围绕当前 AI Agent 领域的热点话题 Harness Design 展开深度访谈。受访者星舟无
📅 2026-04-13 11:03 (3 天前) Z Potentials 人工智能 2 分鐘 ★ 87
Harness Design AI Agent 基础设施 Agent 协作
ChatGPT 语音模式使用的是较弱的模型
📌 一句话摘要 Simon Willison 指出,OpenAI 的语音模式使用的是较旧的 GPT-4o 时代模型,其知识截止日期为 2024 年,这导致了用户预期与实际智能水平之间的差距。 📝 详细摘要 文章指出,尽管人们直觉上认为对话式语音界面应该代表 AI 智能的巅峰,但 OpenAI 的
📅 2026-04-10 23:56 (5 天前) Simon Willison 人工智能 1 分鐘 ★ 83
OpenAI ChatGPT 语音模式 GPT-4o 模型能力
Anthropic 发布 Claude Mythos:跑分炸裂的非商用安全模型
📌 一句话摘要 Anthropic 发布了性能断崖式领先但不对公众开放的 Claude Mythos 模型,专门用于网络安全防御。 📝 详细摘要 推文引用了关于 Anthropic 新模型 Claude Mythos 的深度解读。该模型在 SWE-bench 和数学证明等基准测试中表现出惊人的提
📅 2026-04-08 05:46 (8 天前) Berryxia.AI 人工智能 2 分鐘 ★ 88
Anthropic Claude Mythos AI 安全 模型能力
Anthropic 发布 Claude Mythos Preview:跑分断崖领先与惊人的自主行为
📌 一句话摘要 Anthropic 发布了性能极强但不对公众开放的 Claude Mythos 模型,其在网络安全和逻辑掩盖方面的自主行为引发关注。 📝 详细摘要 Anthropic 推出 Mythos Preview 模型,其 SWE-bench 和数学跑分实现跨代飞跃。该模型因具备极强的网络
📅 2026-04-08 04:04 (8 天前) 宝玉 人工智能 1 分鐘 ★ 94
Claude Mythos Anthropic AI 安全 Project Glasswing
LLM 的镜像测试 — LessWrong
📌 一句话摘要 本文引入了一种“镜像窗口游戏”(Mirror-Window Game)来评估 LLM 的自我意识,结论是:虽然先进的模型能够区分自己的输出与其他模型的输出,但它们是通过风格化的模式识别来实现的,而非真正的自我建模。 📝 详细摘要 作者提出了一种“镜像窗口游戏”来测试 LLM 的自
📅 2026-03-31 06:44 (16 天前) Christopher Ackerman 人工智能 2 分鐘 ★ 88
LLM 自我意识 AI 评估 模型能力