- +1
阶跃星辰发布最新语音识别模型StepAudio 2.5 ASR
2026-04-24 18:32
来源:澎湃新闻
字号
4月24日,阶跃星辰发布新一代自动语音识别模型StepAudio 2.5 ASR,引入了大语言模型推理加速技术,推理速度与转写精度均显著提升。
基于ASR+MTP-5深度融合架构,StepAudio 2.5 ASR采用多Token预测技术,使模型能够一次预测多个候选Token并完成并行验证,打破了传统自回归机制逐Token输出的效率瓶颈。实测显示,该模型推理速度提升400%、时延降低60%,推理峰值达500 tokens/s,推理成本下降80%,5分钟左右的音视频几乎可实现即时转写。
在覆盖新闻播报、会议访谈及强噪声环境的多个中英文测试集上,StepAudio 2.5 ASR综合转写精度达到业内SOTA(技术领先)水平。针对长音频处理,该模型复用LLM原生的32K上下文窗口,支持单次完整转写最长30分钟的音频,避免了传统“切片-转写-拼接”方案可能导致的上下文断裂与后段精度衰减情况。(澎湃新闻记者 秦盛)
责任编辑:秦盛
澎湃新闻报料:021-962866
澎湃新闻,未经授权不得转载
+1
收藏
我要举报





查看更多
澎湃矩阵
新闻报料
- 报料热线: 021-962866
- 报料邮箱: news@thepaper.cn
互联网新闻信息服务许可证:31120170006
增值电信业务经营许可证:沪B2-2017116
© 2014-2026 上海东方报业有限公司
反馈




