全部 未讀 (25709) ★ 收藏 (0) 🤖 人工智能 (11656) 📊 商业科技 (5089) 📁 媒体资讯 (2065) 💻 软件编程 (1793) 📁 个人成长 (1666) 📁 生活文化 (1404) 📁 投资财经 (1247) 🎨 产品设计 (456) 📁 体育运动 (285) 📁 AI 产品 (39)
篩選中: 🏷️ 测试 共 318 篇 ✕ 清除篩選
25711
全部文章
25709
未讀
93
今日新增
0
收藏
📡 Poller 最後抓取: 35 分鐘前 (06-22 08:00)
BestBlogs 精選 (25657)

🏷️ 熱門標籤

AI Agent 2431 AI 编程 1126 Anthropic 1016 Claude Code 950 LLM 838 政策解读 810 AI 智能体 781 OpenAI 756 产业动态 735 投资与市场 704 宏观经济 625 开源 585 地缘政治 572 Claude 565 OpenClaw 557 科技新闻 546 AI 532 国际新闻 528 AI 安全 516 社会议题 513
《夺轨战》公开 Demo 测试,核心玩法与匹配机制迎来重磅调整
📌 一句话摘要 《夺轨战》公开 Demo 测试,核心玩法与匹配机制迎来重磅调整,包括职业进度重做、匹配机制优化及新手引导完善。 📝 详细摘要 文章报道了多人竞技射击游戏《夺轨战》公开 Demo 版本上线 Steam 的消息。重点介绍了本次更新的三大核心调整:职业进度系统重做,引入「单程」晋升机制
📅 2026-06-17 13:14 (4 天前) Darlin'菈妮 媒体资讯 1 分鐘 ★ 78
游戏资讯 新游测试 多人竞技 射击游戏
Mole Mac 发布一个月数据总结与早鸟价最后一天
📌 一句话摘要 开发者 Tw93 分享其 Mac 应用 Mole 发布一个月的开发数据,包括代码量、测试覆盖、功能迭代,并提醒早鸟价最后一天。 📝 详细摘要 Tw93 发布 Mole Mac 版本一个月后的数据总结:共编写 11 万行 Swift 代码,含 3.6 万行测试代码和 1983 个单
📅 2026-06-14 21:57 (7 天前) Tw93 软件编程 1 分鐘 ★ 78
Mole Mac 开发 Swift 单元测试
《自私的基因》出版 50 周年,作者道金斯近日称人工智能是“有意识”的
📌 一句话摘要 《自私的基因》作者道金斯在与 AI Claude 深度互动后,公开表示认为聊天机器人拥有意识,并引发学界关于图灵测试与机器意识的讨论。 📝 详细摘要 本文编译自多家外媒报道,围绕演化生物学家理查德·道金斯近日公开宣称 AI 聊天机器人 Claude 具有意识这一事件展开。道金斯在
📅 2026-06-14 10:06 (7 天前) 新京报书评周刊 生活文化 2 分鐘 ★ 82
科技人文 人工智能 哲学与思想 意识
Claude 5 Fable 成功制作等时线旅行地图
📌 一句话摘要 测试案例显示,Claude 5 Fable 成功制作了等时线旅行地图,这类地图需要查数千条路线,之前所有模型都做不到。 📝 详细摘要 一条 Thread 中的案例推文。作者继续引用 Ethan Mollick 的测试案例:让 AI 制作等时线旅行地图,这类地图需要查询数千条路线,
📅 2026-06-13 09:30 (8 天前) AI Will 人工智能 1 分鐘 ★ 76
Claude 5 Fable Ethan Mollick 等时线地图 AI能力测试
20 式枪族,极端测试画面公开!
📌 一句话摘要 央视军事公开 20 式枪族在极寒、高温、扬尘、淋雨、浸泡等极端环境下的测试画面,展示国产新一代轻武器量产前的严苛可靠性验证流程。 📝 详细摘要 本文由环球时报转载自央视军事《枪械试验场》节目,公开了我国自主研制的 20 式枪族(以 QBZ191 式步枪和 QBZ192 短步枪为代
📅 2026-06-12 23:55 (9 天前) 环球时报 媒体资讯 1 分鐘 ★ 78
军事新闻 国防科技 武器装备 测试验证
20 式枪族,极端测试画面公开!
📌 一句话摘要 本文通过实地探访中国兵器建设工业检测试验中心,公开了国产 20 式枪族在定型量产前需经历的极寒、高温、扬尘、暴雨和河水浸泡等极端环境测试画面与过程。 📝 详细摘要 文章以图文并茂的形式,详细介绍了我国自主研制的 20 式枪族(包括 QBZ191 式步枪、QBZ192 短步枪等)在
📅 2026-06-12 18:30 (9 天前) 人民网 媒体资讯 1 分鐘 ★ 78
军事科技 国防工业 武器测试 国产装备
Anthropic 新发模型 Claude Fable 5 快速被越狱
📌 一句话摘要 Anthropic 最新发布的 Claude Fable 5 模型在发布仅两天后即被研究人员通过多 Agent 协同攻击成功越狱,并泄露了长达 12 万字符的系统提示词。 📝 详细摘要 文章报道了 Anthropic 于 2026 年 6 月 9 日发布其最强模型 Claude
📅 2026-06-11 18:00 (10 天前) FreeBuf 人工智能 2 分鐘 ★ 76
AI 安全 LLM 模型越狱 AI Agent
在这艘中国的“忒修斯之船”上,我们看到了什么?
📌 一句话摘要 本文以「雪龙号」科考船的国产化改造为引,结合美的空调等案例,论述中国制造通过极限测试实现技术突破与品牌升级的路径。 📝 详细摘要 文章以古希腊「忒修斯之船」悖论为框架,讲述中国科考船「雪龙号」从乌克兰购入后,历经三十年改造,关键设备与零件逐步实现国产替代的故事。作者以此映射中国制
📅 2026-06-10 21:30 (11 天前) 笔记侠 商业科技 1 分鐘 ★ 76
中国制造 国产替代 产业动态 商业洞察
Canary:专为编码代理打造的 QA 测试框架
📌 一句话摘要 Canary 是一个开源的 QA 测试框架,专为编码代理设计,能自动发现 UI 流程变更并在真实浏览器中运行端到端测试。 📝 详细摘要 Geek 分享了一个名为 Canary 的开源 QA 测试框架。该框架专为编码代理(Coding Agents)打造,能够自动检测代码变更所影响
📅 2026-06-09 13:21 (12 天前) Geek 软件编程 1 分鐘 ★ 80
QA测试 编码代理 端到端测试 开源工具
在这艘中国的“忒修斯之船”上,我们看到了什么?
📌 一句话摘要 本文以「雪龙号」科考船三十年间关键零部件从进口到国产替代的历程为线索,结合美的空调等具体案例,阐述中国制造通过极限测试实现技术突破与品牌升级的路径。 📝 详细摘要 文章以古希腊「忒修斯之船」悖论为引,讲述中国科考船「雪龙号」自 1993 年从乌克兰购入后,历经两次重大改造,除船身
📅 2026-06-09 08:20 (13 天前) 吴晓波 商业科技 2 分鐘 ★ 78
中国制造 国产替代 产业动态 制造业升级
AI 模型参加高考:龙虾三万裸考全国一卷
📌 一句话摘要 傅盛让 AI 模型'龙虾三万'裸考高考全国一卷数学和语文,并请高中老师批改作文,展示考试结果。 📝 详细摘要 傅盛在高考季让 AI 模型'龙虾三万'裸考全国一卷的数学选择题、语文阅读理解选择题和作文,作文部分还找了高中老师打分。模型自行挑选和答题,考试结果以视频形式展示。 📊
📅 2026-06-08 22:02 (13 天前) 傅盛 人工智能 1 分鐘 ★ 80
AI高考 AI评测 AI能力测试 高考
测试挂了不用猜!Playwright+MCP 让 AI 分分钟自动修 bug
📌 一句话摘要 本文介绍如何利用 Playwright + MCP + 豆包视觉模型,在测试失败时自动截图、读取页面无障碍树、分析堆栈并生成修复代码,将半小时的排查工作缩短至 45 秒。 📝 详细摘要 文章是「Playwright + MCP」系列第三篇,聚焦测试维护阶段的自动修复。作者先指出传
📅 2026-06-08 07:58 (14 天前) Playwright实战教程 人工智能 2 分鐘 ★ 78
AI 编程 AI Agent MCP 协议 Playwright
别再写 Spec 了,开始写 Facts——整个 SDD 运动已经过时
📌 一句话摘要 本文批判 Spec-Driven Development(SDD)在 AI 时代的根本缺陷,提出用可执行断言(Facts)替代自然语言 Spec,并给出 90 天迁移计划。 📝 详细摘要 作者 Jaroslaw Wasowski 收回此前鼓吹 SDD 的文章,指出核心矛盾:Spe
📅 2026-06-05 00:00 (17 天前) 王俊博客 软件编程 2 分鐘 ★ 88
AI 编程 LLM 工程实践 软件工程
花 1500 美元,让 AI“黑”自己的 App:GPT-5.5 成功率 70%,部分模型 0 分交卷
📌 一句话摘要 安全研究员 Kasra Rahjerdi 花费超 1500 美元,让十余款主流大模型对存在真实 Bug 的移动应用进行自主渗透测试,结果显示 GPT-5.5 以 70% 成功率领先,而部分模型因安全策略或路径依赖得零分。 📝 详细摘要 本文报道了一项由安全研究员 Kasra Ra
📅 2026-06-04 15:16 (17 天前) CSDN 人工智能 2 分鐘 ★ 82
LLM AI 安全 AI Agent 渗透测试
KaliGPT:Linux 命令行中的 AI 安全助手
📌 一句话摘要 KaliGPT 是一个开源项目,在 Linux 命令行中接入 AI 助手,专为网络安全学习设计,支持多种模型和联网搜索。 📝 详细摘要 该推文介绍了 KaliGPT,一个在 Linux 命令行中接入 AI 助手的开源项目,专为网络安全学习设计。用户可以用自然语言描述需求,AI 会
📅 2026-05-31 21:30 (21 天前) GitHubDaily 软件编程 1 分鐘 ★ 81
KaliGPT 网络安全 AI 助手 渗透测试
τ0-WM:最大规模预训练的开源具身世界模型来了
📌 一句话摘要 上海创智学院与智元机器人联合发布全球最大开源预训练具身世界模型 τ0-WM,以 1.78 万小时真机遥操作数据为核心,通过测试时计算实现机器人「三思而后行」的慢思考决策。 📝 详细摘要 本文报道了上海创智学院副教授、智元机器人首席科学家罗剑岚团队发布的开源预训练具身世界模型 τ0
📅 2026-05-31 15:38 (21 天前) 衡宇 人工智能 2 分鐘 ★ 88
具身智能 世界模型 τ0-WM 测试时计算
Opus 4.8 连夜算尽 1170 亿人命运,一句话敲出人类投胎模拟器!
📌 一句话摘要 本文报道了沃顿商学院教授 Ethan Mollick 利用 Claude Opus 4.8 独立开发「The Veil of History」网站,该网站基于人口统计学数据模拟人类投胎概率,同时介绍了 Opus 4.8 在多项基准测试中超越 GPT-5.5 登顶的消息。 📝 详细
📅 2026-05-30 15:00 (22 天前) 新智元 人工智能 2 分鐘 ★ 84
Claude Opus 4.8 AI 编程 AI Agent 基准测试
AiDD 2026·上海站回顾|快手分享 AI 驱动研发效能升级实践
📌 一句话摘要 快手技术团队在 AiDD 大会上分享了 AI 驱动研发效能升级的实践,涵盖 AI DevOps 范式、AI Coding 产品演进和智能测试体系建设三大方向。 📝 详细摘要 本文是快手技术团队在第九届 AI+研发数字峰会(AiDD)上的专场分享回顾。文章围绕「AI×研发效能」主题
📅 2026-05-29 16:57 (23 天前) 快手技术 软件编程 2 分鐘 ★ 86
AI DevOps 研发效能 AI Coding 智能测试
Opus 4.8 刚发布,Redis 之父质疑跑分:DHH 盛赞的 GPT-5.5,正在动摇编码王座
📌 一句话摘要 Anthropic 发布 Opus 4.8,引入 dynamic workflows 和降价 fast mode,但 Redis 之父 antirez 质疑其基准测试与真实体验的错位,引发对模型评价标准的讨论。 📝 详细摘要 文章报道了 Anthropic 于 5 月 28 日发
📅 2026-05-29 10:33 (23 天前) AI前线 人工智能 2 分鐘 ★ 86
Anthropic Opus 4.8 Claude GPT-5.5
腾讯发布 Chronicles-OCR 基准测试,多模态模型在古文字识别上全军覆没
📌 一句话摘要 腾讯 HY 实验室等机构发布 Chronicles-OCR 基准测试,结果显示 28 个前沿多模态模型在识别 3000 年中国古文字上表现极差,最强模型在甲骨文上准确率仅 14%。 📝 详细摘要 这是一条对 AI 研究动态的解读。作者介绍了腾讯等机构发布的新基准测试 Chroni
📅 2026-05-27 20:38 (25 天前) Berryxia.AI 人工智能 1 分鐘 ★ 82
Chronicles-OCR 腾讯 古文字识别 多模态