全部 未讀 (11757) ★ 收藏 (0) 🤖 人工智能 (7554) 📊 商业科技 (1778) 💻 软件编程 (1192) 📁 个人成长 (734) 🎨 产品设计 (207) 📁 生活文化 (108) 📁 投资财经 (71) 📁 媒体资讯 (69) 📁 AI 产品 (39) 📁 AI (5)
篩選中: 🏷️ 站点可靠性工程 共 3 篇 ✕ 清除篩選
11759
全部文章
11757
未讀
76
今日新增
0
收藏
📡 Poller 最後抓取: 10 分鐘前 (04-16 10:00)
BestBlogs 精選 (11740)

🏷️ 熱門標籤

AI Agent 1314 AI 智能体 732 Claude Code 641 Anthropic 620 LLM 563 OpenClaw 497 AI 编程 492 开源 438 AI 396 AI 安全 394 Claude 380 OpenAI 360 软件工程 353 开发者工具 340 生产力 308 GitHub 248 自动化 238 AI 基础设施 227 AI 开发 224 MCP 223
GitHub 可用性报告:2026 年 3 月
📌 一句话摘要 GitHub 2026 年 3 月可用性报告详细介绍了影响 Actions、Copilot 和 API 服务的四起重大事故,原因涉及缓存错误、Redis 配置错误及凭据问题。 📝 详细摘要 本报告透明地分析了 2026 年 3 月发生的四起服务中断事件。主要事故包括 3 月 3
📅 2026-04-09 10:21 (6 天前) Jakub Oleksy 软件编程 1 分鐘 ★ 84
GitHub 可用性报告 事后分析 站点可靠性工程
信任但要灰度:大规模配置安全性
📌 一句话摘要 本期来自 Meta 工程团队的播客探讨了在大规模环境下确保配置安全发布的策略与自动化系统,包括灰度发布、渐进式发布以及 AI 驱动的故障响应。 📝 详细摘要 在本期 Meta 技术播客中,Meta 的工程师们讨论了管理大规模配置发布背后的关键基础设施。对话涵盖了如何通过实施灰度部
📅 2026-04-09 02:25 (7 天前) Engineering at Meta 软件编程 1 分鐘 ★ 80
配置管理 灰度部署 站点可靠性工程 SRE
配置即控制平面:大规模系统的安全与可靠性设计
📌 一句话摘要 本文探讨了配置管理向动态控制平面的演变,分析了为何它已成为大规模故障的主要诱因,以及超大规模云厂商如何实施安全模式以确保可靠性。 📝 详细摘要 本文指出,在现代云原生环境中,配置已从静态部署工件转变为实时决定系统行为的动态控制平面。由于配置变更的传播速度和范围通常超过应用程序代码
📅 2026-03-20 17:00 (26 天前) Karthiek Maralla 软件编程 2 分鐘 ★ 89
配置管理 站点可靠性工程(SRE) 云原生 控制平面