Mistral发布Voxtral Transcribe 2,实时延迟<200ms并开源权重
Mistral AI发布新一代语音转文本模型Voxtral Transcribe 2,包含批量转录的Voxtral Mini Transcribe V2与低延迟的Voxtral Realtime。前者支持13种语言、说话人分离、上下文偏置与词级时间戳,词错误率约4%,定价0.003美元/分钟;后者面向语音代理与实时字幕,端到端延迟可低于200毫秒。Realtime模型权重以Apache 2.0许可开源,并支持最长约3小时长音频处理及合规部署。
阅读原文