全部 未讀 (11733) ★ 收藏 (0) 🤖 人工智能 (7543) 📊 商业科技 (1776) 💻 软件编程 (1189) 📁 个人成长 (733) 🎨 产品设计 (207) 📁 生活文化 (103) 📁 投资财经 (71) 📁 媒体资讯 (67) 📁 AI 产品 (39) 📁 AI (5)
篩選中: 🏷️ ASR 共 7 篇 ✕ 清除篩選
11735
全部文章
11733
未讀
52
今日新增
0
收藏
📡 Poller 最後抓取: 16 分鐘前 (04-16 06:00)
BestBlogs 精選 (11716)

🏷️ 熱門標籤

AI Agent 1311 AI 智能体 732 Claude Code 640 Anthropic 620 LLM 563 OpenClaw 497 AI 编程 491 开源 438 AI 396 AI 安全 394 Claude 380 OpenAI 360 软件工程 353 开发者工具 339 生产力 308 GitHub 248 自动化 238 AI 基础设施 227 AI 开发 224 MCP 222
Antirez 谈 Gemma 4 取代专用 ASR 的潜力
📌 一句话摘要 Antirez 预测,小型 Gemma 4 模型很可能会超越并取代专用的自动语音识别(ASR)模型。 📝 详细摘要 Redis 的创建者 Antirez 推测,最新的小型 Gemma 4 模型已经具备足够的能力,足以让专用的 ASR(自动语音识别)模型在转录任务中变得过时,这凸显
📅 2026-04-03 00:16 (13 天前) antirez 人工智能 1 分鐘 ★ 78
Gemma 4 ASR LLM 语音识别
Cohere 的开放权重 ASR 模型实现 5.4% 的词错误率 —— 足以在生产流水线中替代语音 API
📌 一句话摘要 Cohere 发布了“Transcribe”,这是一个开放权重、生产级别的 ASR 模型,词错误率为 5.42%,旨在提供可与闭源 API 相媲美的企业级准确性和自托管能力。 📝 详细摘要 Cohere 推出的全新开放权重 ASR 模型 Transcribe,解决了企业在选择高准
📅 2026-03-31 01:00 (16 天前) Emilia David 人工智能 10 分鐘 ★ 86
ASR 语音识别 Cohere 开放权重
实时 ASR 交互设计的微妙之处
📌 一句话摘要 作者在开发实时 ASR 交互时发现,不同场景下的交互逻辑存在微妙差异,AI 虽然能执行但难以进行这种人性化的设计。 📝 详细摘要 推文分享了作者在三个不同场景下进行实时 ASR 交互设计的实践心得。作者指出,交互设计在不同场景下具有高度的上下文依赖性和微妙感,这种细腻的「人感」是
📅 2026-03-28 18:33 (18 天前) Orange AI 人工智能 1 分鐘 ★ 80
ASR 交互设计 AI 产品 用户体验
Cohere 发布开源 ASR 模型 Cohere Transcribe,刷新语音转录性能标杆
📌 一句话摘要 Cohere 开源了其高性能 ASR 模型「Cohere Transcribe」,在 Hugging Face 榜单上以 5.42% 的 WER 位居榜首,支持 14 种语言及生产级部署。 📝 详细摘要 该推文详细解读了 Cohere 最新开源的语音转录模型「Cohere Tra
📅 2026-03-26 22:45 (20 天前) meng shao 人工智能 1 分鐘 ★ 86
Cohere ASR 语音识别 开源模型
ListenHub ASR 语音识别 API 正式上线
📌 一句话摘要 ListenHub 推出支持本地离线、无限免费的 ASR 语音识别 API,专为 AI Agent 自动化流设计。 📝 详细摘要 ListenHub 发布了全新的 ASR(语音识别)API,主打本地离线运行和完全免费。该工具采用双模型方案:默认使用 SenseVoice 支持中、
📅 2026-03-13 17:12 (03-13 17:12) Orange AI 人工智能 3 分鐘 ★ 82
ListenHub ASR 语音识别 AI Agent
ListenHub ASR:优于 Whisper 的免费中文语音识别工具
📌 一句话摘要 推荐一款支持中文效果出色且可无限量免费使用的 ASR 工具及其安装方法。 📝 详细摘要 推文推荐了由 Orange AI 团队出品的 ListenHub ASR 工具。作者指出其在中文识别效果上优于 OpenAI 的 Whisper,并提供了在 CC 平台上的具体安装指令。该工具
📅 2026-03-13 17:48 (03-13 17:48) 向阳乔木 人工智能 3 分鐘 ★ 85
ASR 语音识别 ListenHub 中文适配
NLE:通过文本编辑实现的非自回归 ASR
📌 一句话摘要 一种新型非自回归语音识别(ASR)方法,通过使用 LLM 编辑转录文本来工作。 📝 详细摘要 NLE(基于 LLM 文本编辑的非自回归 ASR)提出了自动语音识别领域的一种范式转变。它不再使用传统的自回归解码,而是利用 LLM 通过迭代编辑和优化转录文本,来执行非自回归 ASR,
📅 2026-03-10 23:43 (03-10 23:43) AK 人工智能 1 分鐘 ★ 80
ASR 语音识别 非自回归 LLM