全部 未讀 (25640) ★ 收藏 (0) 🤖 人工智能 (11650) 📊 商业科技 (5083) 📁 媒体资讯 (2039) 💻 软件编程 (1793) 📁 个人成长 (1665) 📁 生活文化 (1393) 📁 投资财经 (1238) 🎨 产品设计 (456) 📁 体育运动 (275) 📁 AI 产品 (39)
篩選中: 🏷️ V4 共 136 篇 ✕ 清除篩選
25642
全部文章
25640
未讀
24
今日新增
0
收藏
📡 Poller 最後抓取: 58 分鐘前 (06-22 06:00)
BestBlogs 精選 (25588)

🏷️ 熱門標籤

AI Agent 2430 AI 编程 1125 Anthropic 1015 Claude Code 949 LLM 834 政策解读 801 AI 智能体 781 OpenAI 756 产业动态 726 投资与市场 696 宏观经济 621 开源 585 地缘政治 568 Claude 565 OpenClaw 557 科技新闻 541 AI 532 国际新闻 520 AI 安全 515 社会议题 501
30 年了!为什么 IPv6 依旧替代不了 IPv4 ?
📌 一句话摘要 本文深入剖析 IPv6 历经三十年仍未取代 IPv4 的根本原因,指出技术上的不兼容、NAT 的意外成功以及网络架构向以名字为中心的转变,共同导致了这场旷日持久的拉锯战。 📝 详细摘要 文章以「IPv6 为何三十年仍无法取代 IPv4」为核心问题,展开多层次的深度分析。首先回顾了
📅 2026-06-10 07:15 (11 天前) dbaplus社群 软件编程 2 分鐘 ★ 88
网络协议 IPv6 IPv4 NAT
DMIT 疑似因 64 周年纪念日节点全面瘫痪
📌 一句话摘要 DMIT 的 IPv4 节点突然全部挂掉,官方不允许更换节点,作者推测可能与 64 周年纪念日有关。 📝 详细摘要 推文指出 DMIT 的 IPv4 节点突然全部瘫痪,官方不允许用户更换节点。作者结合日期,推测这一情况可能与 64 周年纪念日有关,暗示可能是网络管控或特殊事件导致
📅 2026-06-03 20:46 (18 天前) Ding 媒体资讯 1 分鐘 ★ 78
DMIT 网络故障 IPv4 网络管控
Tair 联手 SGLang 共建 DeepSeekV4 分层缓存架构
📌 一句话摘要 本文详细介绍了阿里云 Tair KVCache 团队与 SGLang 社区为 DeepSeek V4 构建的分层缓存架构,通过 Shadow Radix、HiCache 和 HiSparse 三个核心组件,分别解决长上下文推理中 KV Cache 的逻辑描述、Prefill 阶段前
📅 2026-05-29 08:30 (23 天前) 阿里云开发者 人工智能 2 分鐘 ★ 92
DeepSeek V4 KV Cache SGLang Tair
DeepSeek V4 芯模协同背后,国产算力生态开始飞轮加速
📌 一句话摘要 本文通过 DeepSeek V4 芯模协同和鲲鹏昇腾开发者大会的案例,论证了国产算力生态正从「芯片被动适配模型」转向「芯模协同」,并进入开发者主动贡献、生态自增长的新阶段。 📝 详细摘要 文章以 DeepSeek V4 发布为引,指出国产算力生态正在经历根本性转变:从过去芯片被动
📅 2026-05-28 21:32 (24 天前) henry 商业科技 2 分鐘 ★ 86
国产算力 鲲鹏昇腾 芯模协同 CANN
DeepSeek V4 还能更省!新工具缓存命中率高达 99.82%,2 折稳定到手
📌 一句话摘要 开源项目 Reasonix 专为 DeepSeek V4 打造,通过 append-only 缓存循环设计实现 99.82% 缓存命中率,将 API 调用成本降至 2 折。 📝 详细摘要 文章介绍了开源项目 Reasonix,这是一个专为 DeepSeek V4 系列模型设计的终
📅 2026-05-25 12:40 (27 天前) 鱼羊 人工智能 2 分鐘 ★ 83
DeepSeek V4 Reasonix 缓存优化 AI 编程
DeepSeek V4 来了:Harness 加持的 Agent Plan 上新
📌 一句话摘要 火山引擎在 Coding Plan 和 Agent Plan 中同步上线 DeepSeek V4 系列模型,通过订阅套餐可大幅降低使用成本,并集成 Harness 能力与多模态模型。 📝 详细摘要 本文是火山引擎的官方推广文章,宣布其 AI 编程订阅服务 Coding Plan
📅 2026-05-23 10:57 (29 天前) PaperAgent 人工智能 2 分鐘 ★ 78
DeepSeek V4 火山引擎 Agent Plan Coding Plan
排名第九、国内第二,DeepSeek V4 凭什么让人又爱又恨?
📌 一句话摘要 本文通过一周真实业务流测试和四个中国特色场景评测,深入分析了 DeepSeek V4 在中文理解、代码生成、法律引用等方面的真实能力,认为其虽非全能但性价比极高。 📝 详细摘要 文章针对 DeepSeek V4 发布后市场反应平淡的现象,进行了深度实测。作者认为,V4 在 Val
📅 2026-05-19 18:00 (05-19 18:00) AI科技评论 人工智能 2 分鐘 ★ 86
DeepSeek V4 大模型评测 中文理解 代码生成
LLM 近期重大架构进化一览:从 Gemma 4 到 DeepSeek V4
📌 一句话摘要 本文翻译并整理了 Sebastian Raschka 的技术博客,系统梳理了 Gemma 4、Laguna XS.2、ZAYA1-8B 和 DeepSeek V4 等最新 LLM 在降低长上下文推理成本方面的架构创新,包括跨层 KV 共享、分层注意力预算、压缩卷积注意力和流形约束超
📅 2026-05-19 12:00 (05-19 12:00) 机器之心 人工智能 2 分鐘 ★ 87
LLM 架构 长上下文 KV Cache Gemma 4
「我是个美国佬,求大家帮我弄个微信。」
📌 一句话摘要 本文讲述了美国开发者 Hunter Bown 为 DeepSeek V4 打造专属编程 Agent DeepSeek-TUI,并因真诚求助中国网友而爆火出圈的故事,展现了 AI 时代非科班开发者凭借热情与创意实现梦想的可能性。 📝 详细摘要 文章以美国开发者 Hunter Bow
📅 2026-05-15 08:24 (05-15 08:24) 36氪 人工智能 2 分鐘 ★ 82
DeepSeek-TUI AI 编程 开源项目 Vibe Coding
深度!DeepSeek-V4 中的 MegaMoE,细致的 Overlap 通信和计算延迟方案
📌 一句话摘要 本文深入分析了 DeepSeek-V4 中 MegaMoE 的实现细节,重点阐述了其通过细粒度 Overlap 通信和计算来提升 MoE 模型性能的架构设计与代码实现。 📝 详细摘要 本文是 DeepSeek-V4 技术报告的深度分析系列之一,聚焦于 MegaMoE 这一核心基础
📅 2026-05-15 13:10 (05-15 13:10) 青稞AI 人工智能 2 分鐘 ★ 86
DeepSeek-V4 MegaMoE MoE 专家并行
OPD 深度解析:从数学推导到 DeepSeekV4、SWIFT 与 verl 实践
📌 一句话摘要 本文从数学推导出发,系统性地解析了同策略蒸馏(OPD)的核心原理、关键维度(prefix 来源、teacher 信号粒度、KL 方向、优化方式),并详细对比了 MiniLLM、DeepSeek V4、SWIFT、verl 等主流框架的实现差异与实践选择。 📝 详细摘要 本文是一篇
📅 2026-05-15 00:22 (05-15 00:22) 大模型智能 人工智能 3 分鐘 ★ 88
OPD 同策略蒸馏 知识蒸馏 大语言模型
DeepSeek-V4 详细分析(2): MegaMoE
📌 一句话摘要 本文深入分析了 DeepSeek-V4 中 MegaMoE 的细粒度专家并行方案,详细解读了其通过通信计算重叠和流水线调度实现 1.5~1.9 倍性能提升的底层实现原理。 📝 详细摘要 本文是 DeepSeek-V4 详细分析系列的第二篇,专注于其基础设施中的 MegaMoE 模
📅 2026-05-14 18:57 (05-14 18:57) zartbot 人工智能 2 分鐘 ★ 88
DeepSeek-V4 MegaMoE 专家并行 CUDA
1.3B 参数,2.4 倍推理吞吐:MiniCPM-V 4.6 开源,实现端侧效率新突破
📌 一句话摘要 面壁智能联合清华大学、OpenBMB 开源社区发布 MiniCPM-V 4.6,以 1.3B 参数实现端侧多模态模型性能与效率的双重突破,推理吞吐量达同尺寸竞品 1.5 倍,仅需 6G 内存即可流畅运行。 📝 详细摘要 文章详细介绍了新一代端侧多模态大模型 MiniCPM-V 4
📅 2026-05-13 12:33 (05-13 12:33) PaperWeekly 人工智能 2 分鐘 ★ 86
MiniCPM-V 4.6 端侧多模态 面壁智能 LLaVA-UHD v4
Redis 之父下场,给 DeepSeek V4 单独造了一台推理引擎
📌 一句话摘要 Redis 之父 antirez 为 DeepSeek V4 Flash 打造了一款名为 ds4.c 的专用本地推理引擎,在 Mac 上实现了 284B 参数模型的高效运行。 📝 详细摘要 本文报道了 Redis 创始人 antirez(Salvatore Sanfilippo)
📅 2026-05-08 16:20 (05-08 16:20) henry 人工智能 2 分鐘 ★ 87
DeepSeek V4 本地推理 ds4.c antirez
这款 DeepSeek V4 终端编程神器,在 GitHub 上火了。
📌 一句话摘要 本文介绍了 DeepSeek-TUI,一个用 Rust 编写的终端原生 AI 编程 Agent,专门对接 DeepSeek V4 模型,支持 100 万 token 上下文、思维链推理、三种工作模式和 MCP 协议。 📝 详细摘要 文章主要介绍了一个名为 DeepSeek-TUI
📅 2026-05-08 12:05 (05-08 12:05) 逛逛GitHub 人工智能 2 分鐘 ★ 82
DeepSeek V4 AI 编程 终端工具 Rust
DeepSeek-V4 的并行策略和计算通信遮掩
📌 一句话摘要 本文深入解析了 DeepSeek-V4 训练中采用的 GPU 并行策略,重点阐述了其通过 PP、EP、DP ZeRO-1 的组合以及 DualPipe 和 Waved-EP 等创新技术,在低带宽 IB 网络下实现计算与通信高效遮掩的核心原理。 📝 详细摘要 本文以 DeepSee
📅 2026-05-07 20:16 (05-07 20:16) AINLP 人工智能 2 分鐘 ★ 88
DeepSeek-V4 GPU 并行策略 MoE 通信遮掩
DeepSeek-V4 的并行策略和计算通信遮掩
📌 一句话摘要 本文深入解析了 DeepSeek-V4 的分布式并行策略,重点阐述了其如何通过 PP、EP、ZeRO-1 的组合以及 DualPipe 和 Waved-EP 等创新技术,在低带宽的 IB 网络上实现高效的计算通信遮掩,从而训练大规模 MoE 模型。 📝 详细摘要 文章以 Deep
📅 2026-05-06 00:01 (05-06 00:01) 大模型智能 人工智能 1 分鐘 ★ 88
DeepSeek-V4 分布式训练 并行策略 计算通信遮掩
DeepSeek-V4 的并行策略和计算通信遮掩
📌 一句话摘要 本文深入解析了 DeepSeek-V4 在低配硬件(8 卡节点 + IB 网络)上训练大规模 MoE 模型时采用的并行策略和计算通信遮掩技术,重点介绍了 PP+EP+ZeRO-1 的组合选择、DualPipe 和 Waved-EP 两种通信遮掩方案的设计原理与适用场景。 📝 详细
📅 2026-05-05 00:01 (05-05 00:01) 青稞AI 人工智能 2 分鐘 ★ 87
DeepSeek-V4 并行策略 计算通信遮掩 MoE
DeepSeek TUI:将 DeepSeek V4 搬进终端的编码智能体
📌 一句话摘要 DeepSeek TUI 是一个将 DeepSeek V4 集成到终端的编码智能体,支持文件读写、命令执行、网页搜索、Git 管理,并提供三种工作模式。 📝 详细摘要 该推文介绍了 GitHub 上的 DeepSeek TUI 项目,这是一个将 DeepSeek V4 模型搬进终
📅 2026-05-04 15:30 (05-04 15:30) GitHubDaily 人工智能 1 分鐘 ★ 84
DeepSeek TUI DeepSeek V4 终端工具 编码智能体
DeepSeek-V4 技术报告背后的 TileLang:如何高效实现大模型中的小算子
📌 一句话摘要 本文深入解读了 DeepSeek-V4 技术报告中 TileLang 的设计理念与实践经验,分析了 DSL 编译器在模型 Infra 中处理小算子的定位优势,并探讨了其 Fragment/Parallel 抽象、Host CodeGen、Z3 Prover 集成等关键技术点。 📝
📅 2026-05-04 00:00 (05-04 00:00) 大模型智能 人工智能 2 分鐘 ★ 87
TileLang DeepSeek-V4 DSL 编译器