• +1

阶跃星辰发布最新语音识别模型StepAudio 2.5 ASR

2026-04-24 18:32
来源:澎湃新闻
字号

4月24日,阶跃星辰发布新一代自动语音识别模型StepAudio 2.5 ASR,引入了大语言模型推理加速技术,推理速度与转写精度均显著提升。

基于ASR+MTP-5深度融合架构,StepAudio 2.5 ASR采用多Token预测技术,使模型能够一次预测多个候选Token并完成并行验证,打破了传统自回归机制逐Token输出的效率瓶颈。实测显示,该模型推理速度提升400%、时延降低60%,推理峰值达500 tokens/s,推理成本下降80%,5分钟左右的音视频几乎可实现即时转写。

在覆盖新闻播报、会议访谈及强噪声环境的多个中英文测试集上,StepAudio 2.5 ASR综合转写精度达到业内SOTA(技术领先)水平。针对长音频处理,该模型复用LLM原生的32K上下文窗口,支持单次完整转写最长30分钟的音频,避免了传统“切片-转写-拼接”方案可能导致的上下文断裂与后段精度衰减情况。(澎湃新闻记者 秦盛)

    责任编辑:秦盛
    澎湃新闻报料:021-962866
    澎湃新闻,未经授权不得转载
    +1
    收藏
    我要举报
            查看更多

            扫码下载澎湃新闻客户端

            沪ICP备14003370号

            沪公网安备31010602000299号

            互联网新闻信息服务许可证:31120170006

            增值电信业务经营许可证:沪B2-2017116

            © 2014-2026 上海东方报业有限公司