全部 未讀 (22038) ★ 收藏 (0) 🤖 人工智能 (11272) 📊 商业科技 (4532) 💻 软件编程 (1711) 📁 个人成长 (1615) 📁 媒体资讯 (933) 📁 生活文化 (903) 📁 投资财经 (572) 🎨 产品设计 (417) 📁 AI 产品 (39) 📁 体育运动 (36)
篩選中: 🏷️ SmoothQuant 共 1 篇 ✕ 清除篩選
22040
全部文章
22038
未讀
3
今日新增
0
收藏
📡 Poller 最後抓取: 1 小時前 (06-11 00:00)
BestBlogs 精選 (22005)

🏷️ 熱門標籤

AI Agent 2215 AI 编程 1008 Anthropic 986 Claude Code 925 AI 智能体 780 OpenAI 749 LLM 711 开源 578 Claude 560 OpenClaw 557 AI 519 AI 安全 495 开发者工具 438 Codex 419 软件工程 400 具身智能 343 个人成长 342 Agent 337 GitHub 321 生产力 315
面向电商直播场景的全模态大模型推理加速方案
📌 一句话摘要 本文以电商直播场景的全模态大模型 TLiveOmni 为例,详细阐述了在 vLLM 框架下解决多模态适配、精度对齐及量化加速的完整实践,并给出了 H20+FP8 与 4090+W4A16 的最优部署方案。 📝 详细摘要 本文由淘天集团直播 AIGC 团队撰写,聚焦其自研的全模态理
📅 2026-04-29 16:17 (04-29 16:17) 大淘宝技术 人工智能 2 分鐘 ★ 88
多模态大模型 推理加速 vLLM 模型量化