全部 未讀 (21917) ★ 收藏 (0) 🤖 人工智能 (11250) 📊 商业科技 (4514) 💻 软件编程 (1705) 📁 个人成长 (1611) 📁 媒体资讯 (899) 📁 生活文化 (887) 📁 投资财经 (558) 🎨 产品设计 (414) 📁 AI 产品 (39) 📁 体育运动 (32)
篩選中: 🏷️ 模型量化 共 11 篇 ✕ 清除篩選
21919
全部文章
21917
未讀
31
今日新增
0
收藏
📡 Poller 最後抓取: 30 分鐘前 (06-10 02:00)
BestBlogs 精選 (21884)

🏷️ 熱門標籤

AI Agent 2201 AI 编程 998 Anthropic 983 Claude Code 924 AI 智能体 780 OpenAI 749 LLM 698 开源 578 OpenClaw 557 Claude 557 AI 519 AI 安全 492 开发者工具 435 Codex 419 软件工程 400 具身智能 342 Agent 336 个人成长 336 GitHub 321 生产力 315
腾讯混元推出轻量翻译大模型,无需联网,手机直接运行
📌 一句话摘要 腾讯混元推出极致量化压缩的翻译模型 Hy-MT1.5-1.8B-1.25bit,将支持 33 种语言的翻译模型压缩至 440MB,可在手机本地离线运行,翻译质量优于谷歌翻译。 📝 详细摘要 本文由腾讯技术工程官方发布,介绍了其最新推出的轻量级翻译大模型 Hy-MT1.5 的极致量
📅 2026-05-15 17:37 (25 天前) 腾讯技术工程 人工智能 2 分鐘 ★ 88
腾讯混元 Hy-MT1.5 翻译模型 模型量化
8G 内存的手机,能跑多大的模型?|MiniCPM-V 4.6 开源
📌 一句话摘要 本文以面壁 MiniCPM-V 4.6 开源为契机,深入浅出地讲解了模型大小与内存占用的关系、量化原理、端侧模型的内存限制,并介绍了该模型的技术架构与性能表现。 📝 详细摘要 文章以面壁智能最新开源的 MiniCPM-V 4.6 多模态模型(1.3B 参数)为引子,面向技术从业者
📅 2026-05-13 12:04 (27 天前) 赛博禅心 人工智能 2 分鐘 ★ 87
MiniCPM-V 端侧模型 模型量化 多模态
出国必备+1!腾讯混元开源手机端离线翻译模型,仅 0.4G,支持 33 种语言
📌 一句话摘要 腾讯混元开源了极致量化的手机端离线翻译模型 Hy-MT1.5-1.8B,通过 2-bit 和 1.25-bit 压缩技术将模型体积降至 440MB,支持 33 种语言离线翻译,翻译质量优于谷歌翻译。 📝 详细摘要 本文介绍了腾讯混元团队于 4 月 29 日开源的手机端离线翻译模型
📅 2026-04-29 16:30 (04-29 16:30) 腾讯混元 人工智能 2 分鐘 ★ 86
腾讯混元 Hy-MT1.5 离线翻译 模型量化
面向电商直播场景的全模态大模型推理加速方案
📌 一句话摘要 本文以电商直播场景的全模态大模型 TLiveOmni 为例,详细阐述了在 vLLM 框架下解决多模态适配、精度对齐及量化加速的完整实践,并给出了 H20+FP8 与 4090+W4A16 的最优部署方案。 📝 详细摘要 本文由淘天集团直播 AIGC 团队撰写,聚焦其自研的全模态理
📅 2026-04-29 16:17 (04-29 16:17) 大淘宝技术 人工智能 2 分鐘 ★ 88
多模态大模型 推理加速 vLLM 模型量化
腾讯开源手机端离线翻译模型,仅 0.4G,支持 33 种语言
📌 一句话摘要 腾讯混元开源 Hy-MT1.5-1.8B-1.25bit 翻译模型,通过极致量化压缩至 440MB,可在手机端离线运行,支持 33 种语言,翻译质量超越谷歌翻译。 📝 详细摘要 腾讯混元于 4 月 29 日开源了 Hy-MT1.5-1.8B-1.25bit 翻译模型,这是其专业翻
📅 2026-04-29 17:00 (04-29 17:00) 允中 人工智能 2 分鐘 ★ 88
腾讯混元 翻译模型 模型量化 开源
阿里 Qwen3.6 正式发布,强化 Agent 编码与上下文思维保留,降低迭代开发开销
📌 一句话摘要 本文汇总了 2026 年 4 月 17 日的开源项目动态,重点介绍了阿里 Qwen3.6 模型、适配苹果生态的 Ternary 量化模型、智能体视频制作系统 OpenMontage、自托管 PaaS 平台 Coolify 等六个项目。 📝 详细摘要 文章是一份每日开源项目精选简报
📅 2026-04-17 18:30 (04-17 18:30) 机器之心SOTA模型 人工智能 2 分鐘 ★ 79
开源项目 大语言模型 AI Agent 模型量化
Nintendo Switch 成功运行 Gemma 2 模型
📌 一句话摘要 开发者通过 L4T Ubuntu 和 llama.cpp,成功在 Nintendo Switch 掌机上本地运行了 Gemma 2 模型。 📝 详细摘要 这是一条关于边缘计算和模型量化实践的趣味技术动态。开发者利用 L4T Ubuntu 系统环境,配合 llama.cpp 框架,
📅 2026-04-08 10:52 (04-08 10:52) Berryxia.AI 人工智能 1 分鐘 ★ 82
Gemma Nintendo Switch llama.cpp 模型量化
绿色 IT:如何减少 AI 对环境的影响
📌 一句话摘要 Ludi Akue 探讨了 AI 面临的环境挑战,主张通过量化(quantization)等技术优化,并结合稳健的推理阶段治理,来缓解因消费增加而产生的“反弹效应”。 📝 详细摘要 本文总结了 Ludi Akue 在 QCon London 的演讲及后续访谈,探讨了 AI 时代的
📅 2026-03-26 19:21 (03-26 19:21) Ben Linders 人工智能 1 分鐘 ★ 88
绿色 IT 可持续 AI 模型量化 GreenOps
一篇论文引发存储芯片股暴跌,Google 的「DeepSeek 时刻」来了?
📌 一句话摘要 Google Research 发布 TurboQuant 算法,通过极坐标变换和 QJL 变换实现 KV Cache 的 6 倍无损压缩,显著提升推理效率并引发存储芯片市场震荡。 📝 详细摘要 本文深入解析了 Google Research 最新的 AI 压缩算法 TurboQ
📅 2026-03-26 21:41 (03-26 21:41) 莫崇宇 人工智能 2 分鐘 ★ 87
TurboQuant KV Cache 模型量化 Google Research
谷歌 TurboQuant 论文:KV cache 压缩 6 倍且精度零损失
📌 一句话摘要 谷歌研究院发布 TurboQuant 算法,通过极坐标量化等技术实现 KV cache 至少 6 倍的无损压缩,显著降低大模型推理内存需求并提升速度。 📝 详细摘要 本文报道了谷歌研究院即将在 ICLR 2026 亮相的突破性论文——TurboQuant 压缩算法。该算法针对 A
📅 2026-03-26 11:03 (03-26 11:03) 梦晨 人工智能 11 分鐘 ★ 90
TurboQuant KV cache 模型量化 Google Research
Run Tiny AI Models Locally Using BitNet A Beginner Guide
📌 一句话摘要 本文是一份关于如何在本地 CPU 环境下,利用 bitnet.cpp 框架部署和运行微软 BitNet b1.58 三值权重模型的实战指南。 📝 详细摘要 文章详细介绍了微软研究员开发的 BitNet b1.58 模型,这是一种原生低比特语言模型,通过 -1、0、+1 的三值权重
📅 2026-03-11 00:00 (03-11 00:00) Abid Ali Awan 人工智能 2 分鐘 ★ 78
BitNet bitnet.cpp 本地推理 模型量化