SuperPortia Reading
總覽
文章
簡報
🔍 搜尋
全部
未讀 (11821)
★ 收藏 (0)
🤖 人工智能 (7594)
📊 商业科技 (1791)
💻 软件编程 (1198)
📁 个人成长 (736)
🎨 产品设计 (209)
📁 生活文化 (109)
📁 投资财经 (71)
📁 媒体资讯 (69)
📁 AI 产品 (39)
📁 AI (5)
篩選中:
🏷️ 昆仑芯
共 1 篇
✕ 清除篩選
11823
全部文章
11821
未讀
140
今日新增
0
收藏
📡 Poller
最後抓取:
1 小時前
(04-16 14:00)
BestBlogs 精選 (11804)
🏷️ 熱門標籤
AI Agent
1324
AI 智能体
734
Claude Code
645
Anthropic
622
LLM
563
AI 编程
501
OpenClaw
498
开源
439
AI 安全
396
AI
396
Claude
384
OpenAI
362
软件工程
354
开发者工具
343
生产力
308
GitHub
251
自动化
238
AI 基础设施
227
AI 开发
225
MCP
223
●
昆仑芯大规模 LLM 推理优化,实现秒级扩缩容
📌 一句话摘要 本文介绍了昆仑芯针对大规模 LLM 推理冷启动耗时长的痛点,通过权重传输优化、编译缓存复用、Lazy CUDA Graph 及守护实例等技术,实现了超大模型秒级扩缩容的工程实践。 📝 详细摘要 针对大模型推理服务在流量波动时扩容缓慢(动辄数分钟)的问题,昆仑芯团队提出了全链路优化
📅 2026-03-31 18:05
(15 天前)
百度Geek说
人工智能
2 分鐘
★ 88
LLM 推理
昆仑芯
vLLM
弹性扩缩容