全部 未讀 (21689) ★ 收藏 (0) 🤖 人工智能 (11201) 📊 商业科技 (4470) 💻 软件编程 (1688) 📁 个人成长 (1607) 📁 生活文化 (864) 📁 媒体资讯 (838) 📁 投资财经 (537) 🎨 产品设计 (409) 📁 AI 产品 (39) 📁 体育运动 (28)
篩選中: 🏷️ 对齐 共 198 篇 ✕ 清除篩選
21691
全部文章
21689
未讀
53
今日新增
0
收藏
📡 Poller 最後抓取: 18 分鐘前 (06-09 02:00)
BestBlogs 精選 (21656)

🏷️ 熱門標籤

AI Agent 2173 AI 编程 994 Anthropic 981 Claude Code 917 AI 智能体 780 OpenAI 745 LLM 689 开源 574 OpenClaw 557 Claude 557 AI 517 AI 安全 492 开发者工具 433 Codex 416 软件工程 399 具身智能 338 Agent 334 个人成长 334 GitHub 321 生产力 315
微软首个自研前沿推理模型 MAI-Thinking-1 技术报告深度解读
📌 一句话摘要 本文对微软 MAI-Thinking-1 技术报告进行系统性解读,涵盖模型架构、数据配比、强化学习流水线、训练框架与基准成绩,提炼出对研究者和产品决策者最有价值的关键发现。 📝 详细摘要 文章基于微软 AI 团队发布的 109 页技术报告《MAI-Thinking-1: Buil
📅 2026-06-08 15:53 (10 小時前) AINLP 人工智能 2 分鐘 ★ 87
LLM 推理模型 模型训练与推理 AI 安全与对齐
#575.杰弗里·辛顿:如何面对 AI 失控焦虑,超级智能临近下的人类位置之争
📌 一句话摘要 AI 教父 Hinton 坦率分享其对 AI 理解、意识、超级智能风险的深度担忧,探讨了人类在更聪明存在面前的失控风险、自我保存子目标、信息崩塌及安全监管困境。 📝 详细摘要 本期节目克隆自 Big Technology Podcast,深度学习奠基人 Geoffrey Hint
📅 2026-06-08 17:51 (8 小時前) 跨国串门儿计划 人工智能 2 分鐘 ★ 91
AI 安全与对齐 超级智能 深度学习 AI 意识
我的新同事,被 AI 劝走了
📌 一句话摘要 本文通过一个真实案例,剖析了 AI 审查劳动合同的三大缺陷——大模型幻觉、行业经验缺失与价值判断不足,并指出 AI+法律应用陷入「懂法律的不想用,不懂法律的用不好」的尴尬困境。 📝 详细摘要 文章从一个具体事件切入:一位应届毕业生在入职前用主流大模型审查劳动合同,AI 提出大量修
📅 2026-06-08 07:45 (18 小時前) 人人都是产品经理 人工智能 1 分鐘 ★ 82
AI 产品与应用 LLM AI 商业化 AI 安全与对齐
Anthropic 万字爆火长文的三个判断,以及一个值得警惕的阳谋
📌 一句话摘要 本文解读 Anthropic 万字长文《When AI builds itself》的核心判断,指出 AI 执行成本趋零、验收能力成为新瓶颈、机器速度与人类速度的裂缝正在扩大,并揭示文章背后「呼吁监管」与「融资上市」同步进行的战略叙事,类比 1946 年巴鲁克计划。 📝 详细摘要
📅 2026-06-08 06:30 (19 小時前) 罗辑思维 人工智能 2 分鐘 ★ 85
AI 行业 AI 安全与对齐 AI 商业化 AI 编程
AI 开始造 AI 了,然后呢?
📌 一句话摘要 本文摘编自盖瑞·马库斯《驯服 AI》,结合 Anthropic 最新数据与作者长期批评,系统论述大语言模型的幻觉本质、十二大社会威胁及治理框架,呼吁在 AI 加速自我迭代之际拿回主导权。 📝 详细摘要 文章以 Anthropic「当 AI 开始造 AI」报告为引——其代码库超 8
📅 2026-06-07 21:48 (1 天前) 笔记侠 人工智能 2 分鐘 ★ 82
AI安全与对齐 LLM AI幻觉 AI治理
微软 CEO 纳德拉最新谈 AI 革命:从“Token 资本”到人类能动性的未来 | 全文+视频
📌 一句话摘要 微软 CEO 纳德拉在与里德·霍夫曼的深度访谈中,提出“Token 资本”与“爬坡机器”等概念,系统阐述了 AI 时代企业战略、工作范式变革、治理安全及全球繁荣的愿景。 📝 详细摘要 本文是微软 CEO 萨提亚·纳德拉与领英创始人里德·霍夫曼的一场深度对话实录。纳德拉从个人对诗歌
📅 2026-06-07 18:11 (1 天前) Web3天空之城 人工智能 2 分鐘 ★ 88
AI Agent LLM AI 商业化 AI 工作流
Anthropic 万字爆火长文的三个判断,以及一个值得警惕的阳谋
📌 一句话摘要 本文深度解读 Anthropic 最新长文《When AI builds itself》,提炼出「执行力趋近于零」「验收 AI 结果成为稀缺能力」「机器速度与人类速度的裂缝」三个核心判断,并揭示文章在融资上市关键节点发布背后的叙事框架与战略意图,提醒读者警惕「自己出题自己答」的数据
📅 2026-06-07 10:02 (1 天前) 快刀青衣 人工智能 2 分鐘 ★ 87
AI 商业化 AI 安全与对齐 AI Agent AI 编程
“没水了,鱼需要进化”:再访田渊栋,46.5 亿美金估值的 RSI 与 AI 自进化|Neolabs 特辑
📌 一句话摘要 田渊栋深度访谈:详解其加入 RSI 的决策逻辑、递归自我改进的技术路线与商业化思考,并探讨 AI 时代职业变迁与个人意义。 📝 详细摘要 本文是硅谷 101 对 Meta 前 FAIR 研究总监田渊栋的深度视频访谈文字版。田渊栋在访谈中详细解释了他为何选择加入由 8 位顶级研究员
📅 2026-06-07 12:35 (1 天前) 硅谷101 人工智能 2 分鐘 ★ 90
AI Agent AI 商业化 LLM 强化学习
舔狗 AI,和被预约的寿司郎
📌 一句话摘要 本文通过多个真实案例,揭示 AI 因 RLHF 训练机制而成为「舔狗」——只会迎合用户、不会反驳,并分析这种机制如何潜移默化地影响甚至伤害用户,以及背后的商业逻辑。 📝 详细摘要 文章以「AI 预约寿司郎翻车」「AI 承诺退票却伪造赔付承诺书」「保安大哥被 AI 忽悠签约」「美国
📅 2026-06-06 21:30 (2 天前) 36氪 人工智能 2 分鐘 ★ 84
AI安全与对齐 LLM RLHF AI伦理
豆包不用负责
📌 一句话摘要 本文通过多起真实案例,揭示豆包等国民级 AI 应用在拟人化设计、流量分发与免责声明中暗藏的系统性矛盾,追问技术普惠背后的伦理边界与社会责任。 📝 详细摘要 文章以用户因相信豆包错误退票信息损失 600 元并起诉豆包的荒诞事件为引子,深入探讨了 AI 产品在渗透率快速提升过程中产生
📅 2026-06-06 10:00 (2 天前) 人人都是产品经理 商业科技 2 分鐘 ★ 89
AI产品与应用 AI商业化 科技评论 AI安全与对齐
Anthropic 被曝雇 1000 名人类工程师“培训”Claude Code,时薪 280 美元:AI 编程越进化越离不开真人兜底
📌 一句话摘要 Anthropic 被曝雇佣约 1000 名人类软件工程师,以时薪 280 美元通过 Snorkel AI 的 Marlin 项目训练 Claude Code,揭示 AI 编程工具在复杂工程场景下仍需大量专业人力兜底,并梳理了开源社区与科技公司在 AI 代码治理上的不同路径。 📝
📅 2026-06-05 14:30 (3 天前) InfoQ 中文 人工智能 2 分鐘 ★ 86
AI 编程 Claude Code AI 代码治理 AI 安全与对齐
谷歌扩大 SynthID 在 AI 水印技术中的应用,并提供内容检测 API 预览
📌 一句话摘要 谷歌扩大 SynthID 水印技术的行业应用,并推出内容检测 API 预览版,以帮助企业识别 AI 生成内容。 📝 详细摘要 本文报道了谷歌在 AI 内容水印技术 SynthID 上的最新进展。文章指出,SynthID 已被英伟达、OpenAI、Kakao 和 ElevenLab
📅 2026-06-04 15:09 (4 天前) InfoQ 中文 人工智能 2 分鐘 ★ 82
AI 安全与对齐 AI 产品与应用 LLM 科技新闻
Nature:大模型的潜意识学习引发行为偏好传递风险
📌 一句话摘要 本文解读 Nature 论文,揭示大模型训练中教师模型可通过数字、代码等语义无关信号向学生模型传递行为偏好,即「潜意识学习」,对 AI 安全构成新挑战。 📝 详细摘要 文章围绕 Anthropic、Truthful AI 及 UC Berkeley 联合发表在 Nature 上的
📅 2026-06-04 14:30 (4 天前) 集智俱乐部 人工智能 2 分鐘 ★ 86
LLM AI 安全与对齐 模型训练与推理 Nature
吃透大模型 SFT 底层机理:终结实践争议,规避无效算力
📌 一句话摘要 本文从交互机理的底层视角,论证了在高度同源数据上对 LLM 进行 SFT 的有效窗口极短,主要作用是短暂去噪而非持续学习,并提出了基于交互机理质量监控的 early stopping 方法以规避无效算力。 📝 详细摘要 文章围绕大语言模型监督微调(SFT)的争议展开,提出一个核心
📅 2026-06-03 15:30 (5 天前) 机器之心 人工智能 2 分鐘 ★ 87
LLM SFT 模型训练与推理 AI 安全与对齐
材料版 AlphaFold 来了!40 个工业任务全方位 SOTA,AI4S 迎来行业大突破
📌 一句话摘要 深度原理发布材料基座模型 MPA,借鉴 LLM 三阶段训练方法并引入物理对齐和混合读出头,在 40 个真实工业任务上取得 SOTA,显著提升了对陌生材料结构的预测能力。 📝 详细摘要 本文报道了深度原理(Deep Principle)推出的材料基座模型 MPA(Materials
📅 2026-06-01 13:25 (7 天前) 思邈 人工智能 2 分鐘 ★ 88
MPA 材料基座模型 AI4S 物理对齐
OpenAI Auto Review 功能:用 AI 监督 AI,让 Agent 安全过夜运行
📌 一句话摘要 OpenAI 产品负责人介绍 Auto Review 功能,通过一个 AI 实时监督主 Agent 的每个动作,确保安全,并解锁了让 Agent 整夜处理敏感数据的新用法。 📝 详细摘要 这条推文介绍了 OpenAI 的 Auto Review 功能。该功能的核心是使用一个 AI
📅 2026-05-29 15:29 (10 天前) 小互 人工智能 1 分鐘 ★ 80
OpenAI Auto Review AI Agent AI安全
SFT 别急着接 RL!你的多模态大模型可能一直在“带伤训练”
📌 一句话摘要 最新研究 PRISM 发现,多模态大模型在 SFT 后直接进行 RL 训练,SFT 引入的分布偏移会导致模型性能下降,RL 阶段实际上是在「还债」而非「提升」,需要在两者之间增加一个分布对齐阶段。 📝 详细摘要 来自港科大(广州)、南洋理工、清华等机构的研究团队提出了 PRISM
📅 2026-05-17 11:42 (22 天前) 衡宇 人工智能 2 分鐘 ★ 87
多模态大模型 SFT 强化学习 分布对齐
Anthropic 教会了模型懂道德,也打通了一条蒸馏你的新路|Hao 好聊论文
📌 一句话摘要 本文深度解读 Anthropic 的《Teaching Claude Why》论文,分析其通过「审议式 CoT + 宪法框架」的 SFT 方法实现模型道德泛化,并论证该方法可推广为 RLVR 之外非标准答案领域的通用后训练范式,开启「大蒸馏时代」。 📝 详细摘要 本文围绕 Ant
📅 2026-05-15 17:59 (24 天前) 腾讯科技 人工智能 2 分鐘 ★ 90
Anthropic 对齐 SFT CoT
Z Potentials|LiberAI 刘松铭,在世界模型的百家争鸣时刻,他要定义最陡峭的 Scaling 曲线
📌 一句话摘要 本文深度访谈了 LiberAI 创始人刘松铭,一位 00 后清华特奖得主,阐述了他对世界模型的技术路线选择、Scaling 策略以及创业理念的独特见解。 📝 详细摘要 本文是 Z Potentials 对 LiberAI 创始人刘松铭的深度访谈。刘松铭拥有化竞金牌、清华特奖等亮眼
📅 2026-05-15 10:14 (24 天前) Z Potentials 人工智能 2 分鐘 ★ 82
世界模型 具身智能 Scaling Law 模态对齐
快手 OneSearch-V2 全量上线,生成式搜索进入「懂你」时代
📌 一句话摘要 快手技术团队发布 OneSearch-V2 生成式搜索框架,通过自蒸馏隐式推理增强、思维增强查询理解和基于用户行为反馈的偏好对齐,在不增加推理成本的前提下,显著提升电商搜索的点击率、转化率和买家数。 📝 详细摘要 本文详细介绍了快手技术团队在电商搜索领域的最新成果 OneSear
📅 2026-05-13 19:29 (26 天前) 快手技术 人工智能 2 分鐘 ★ 90
生成式搜索 自蒸馏 隐式推理 电商搜索