Cohere 开源了其高性能 ASR 模型「Cohere Transcribe」,在 Hugging Face 榜单上以 5.42% 的 WER 位居榜首,支持 14 种语言及生产级部署。
📝 详细摘要
该推文详细解读了 Cohere 最新开源的语音转录模型「Cohere Transcribe」。该模型采用 2B 参数的 Conformer 架构,针对生产环境优化,在 Hugging Face Open ASR Leaderboard 上以 5.42% 的词错误率(WER)超越了 Whisper Large v3 等主流模型。支持 14 种语言,具备长音频处理能力,并支持 vLLM 部署与 Apache 2.0 开源协议,是目前开源领域极具竞争力的语音识别方案。
📊 文章信息
AI 评分:86
来源:meng shao(@shao__meng)
作者:meng shao
分类:人工智能
语言:中文
阅读时间:5 分钟
字数:1150
标签: Cohere, ASR, 语音识别, 开源模型, HuggingFace